Se l'intelligenza artificiale sta entrando sempre più nelle nostre vite con grandi e piccoli aiuti, magari anche a nostra insaputa, perché non può aiutarci anche nella guida? A questa domanda Xpeng ha già risposto con VLA 2.0, che sta per Visual Language Action, ovvero un sistema di intelligenza artificiale che vede la strada, la interpreta e agisce di conseguenza, un modello evoluto di intelligenza artificiale fisica progettato per la guida autonoma di livello 4, oggi disponibile come sistema di assistenza di livello 2 sulle auto di serie.
Un sistema che non si basa su mappe HD, che non ha bisogno delle indicazioni della infrastruttura stradale e nemmeno del LIDAR. Alla base del sistema c'è un Functional Model, un modello comportamentale, una sorta di memoria esperienziale grazie alla quale il sistema elabora in tempo reale le situazioni e reagisce di conseguenza.
- Come funziona l'architettura di Xpeng VLA 2.0
- Il chip Turing AI: la potenza di calcolo dietro VLA 2.0
- Xpeng P7 Ultra con VLA 2.0: la prova su strada in Cina
- Guida autonoma o guida assistita? Il livello reale di Xpeng VLA 2.0
- Xpeng VLA 2.0, il robotaxi e la sfida a Tesla FSD
- Xpeng VLA 2.0 arriverà in Europa nel 2027
- Domande frequenti su Xpeng VLA 2.0
Come funziona l'architettura di Xpeng VLA 2.0
L'architettura di VLA 2.0 rappresenta una rottura rispetto ai sistemi di guida autonoma precedenti. I vecchi approcci si basavano su moduli separati che si passavano informazioni l'uno con l'altro: uno percepiva la strada, un secondo pianificava il percorso, un terzo azionava i comandi. Questi strati intermedi introducevano latenza ed errori.
VLA 2.0 elimina questa catena: il sistema traduce direttamente ciò che le telecamere vedono in decisioni di guida, in un unico processo end-to-end. Il risultato pratico, sulla strada, è una guida che non reagisce ma prevede, con una fluidità che i numeri confermano: rispetto alla generazione precedente, Xpeng dichiara che le frenate brusche si sono ridotte del 99% e l'efficienza di guida complessiva è migliorata del 23%.
La solidità scientifica dell'approccio è confermata a livello accademico. Xpeng, in collaborazione con l'Università di Pechino, ha sviluppato FastDriveVLA, un framework accettato all'AAAI 2026, la principale conferenza internazionale sull'intelligenza artificiale, con un tasso di selezione del 17,6%. L'approccio insegna al sistema a guidare come un essere umano esperto: concentrarsi solo sulle informazioni visive essenziali, filtrando il resto, con una riduzione del 7,5 volte del carico computazionale. Meno dati da elaborare, risposte più veloci.
La cosa forse più sorprendente è che la stessa intelligenza artificiale che guida la P7 gira anche sul robot umanoide IRON e sull'auto volante Aeroht di Xpeng. Non è una curiosità: è la prova che Xpeng sta costruendo un ecosistema di physical AI attorno a un unico modello fondazionale, condiviso tra auto, robot e veicoli volanti.
Il chip Turing AI: la potenza di calcolo dietro VLA 2.0
Una elaborazione così complessa richiede un hardware in grado di rispondere a ogni evenienza senza tentennamenti. E perché comprare un chip potente ma standard, non ottimizzato per questo scopo? Xpeng ha realizzato Turing, un processore proprietario progettato ad hoc: la Xpeng P7 Ultra ne monta tre per un totale di potenza di calcolo di 2.250 TOPS, necessari poiché l’AI fisica elabora 80 volte i dati dell’AI digitale. Per chi non lo sapesse TOPS sta per Trillion Operations Per Second (ma nel caso vogliate essere sicuri nell’utilizzare questi inglesismi c’è il tool gratuito Grammar Checker di ZERO GPT).
Gli occhi sulla strada sono 11 telecamere e tre radar che consentono alle Xpeng dotate di VLA 2.0 una vista a 360 gradi, come quella di una mosca. Il modello è stato addestrato su 100 milioni di clip di scenari di guida estrema, e si vede.
E sulla vista la battaglia con me è vinta a mani basse, e non soltanto a causa della mia miopia. Io di occhi ne ho soltanto due, se guardo lo specchio destro non riesco a guardare contemporaneamente il sinistro, quello centrale e anche la strada che corre davanti. Siamo abituati a renderci conto delle situazioni con un colpo d'occhio e tenere tutto sotto controllo, ma abbiamo difficoltà con gli angoli ciechi e non possiamo guardare ovunque nello stesso momento.
Xpeng VLA 2.0, invece, riesce benissimo a monitorare tutto intorno a me, e me ne rendo conto guardando lo schermo al centro della plancia, a lato della mappa del navigatore: vedo pedoni, ciclisti, motorini, auto, camion con precisione, e anche se nel momento in cui guardo sono nascosti, con le sagome ben delineate come in un cartoon.
Xpeng P7 Ultra con VLA 2.0: la prova su strada in Cina
Mi metto al volante di una affascinante Xpeng P7 Ultra di ultima generazione dotata di VLA 2.0. È una berlina sportiva non soltanto nelle linee filanti e muscolose, ma anche nei suoi quasi 600 cavalli elettrici. Vorrei provarla in un'altra situazione, invece con due colpetti verso la posizione D della leva sul piantone inserisco il VLA 2.0.

È una guida dolce e rotonda in ogni situazione, che sia un'accelerazione, una frenata o una percorrenza di curva. Anche una frenata intensa per non tamponare chi mi precede è ben dosata. Ed è una guida decisamente attenta, migliore di quella di molti automobilisti che si incontrano ogni giorno e che incontro anche in questo giro. Come quello che si butta a kamikaze tra me e l'auto che mi precede appena si muove la coda quando sto ripartendo: la Xpeng P7 se ne accorge prima di me grazie ai suoi occhi da mosca e si ferma dolcemente. Riconosce anche i bumper, e rallenta per affrontarli con ferma dolcezza.
A volte VLA 2.0 è anche troppo educato, per esempio quando svolto a destra a un semaforo e chi svolta a sinistra in senso contrario se ne frega della mia precedenza. In questi casi Xpeng VLA 2.0 rimane attivo, non alza le braccia e si ferma, avanza pianissimo e ingaggia il confronto. In Cina un'auto che viaggia con guida autonoma accende all'esterno luci azzurre, e credo che gli altri automobilisti lo sappiano e se ne approfittino.
La prova del nove, pensando alle nostre strade, anche le peggiori e quelle cittadine più caotiche, sono strade cinesi caotiche e strette, con motorini elettrici che viaggiano più o meno come i nostri rider con le bici a (non) pedalata (molto) assistita e camion che attraversano strade a tre corsie senza farsi troppi problemi.
Il sistema è pronto per affrontare le strade cittadine e sarei curioso di metterlo alla prova sulle strade appenniniche e su strade carraie di campagna, strade che, dai video mostrati da Xpeng, sembra non creino alcun problema al sistema. Il Functional Model ha una sufficiente potenza in memoria per reagire anche a situazioni ambigue e difficili da interpretare. Né più né meno di un automobilista medio. Forse di più.
Anzi, dopo la mia prova sulle strade cinesi, penso che il sistema VLA 2.0 di Xpeng sia molto meglio di molti automobilisti umani. Innanzitutto non si distrae guardando lo smartphone e segue le regole del Codice della Strada, utilizzando, per esempio, le frecce a ogni svolta. I suoi 11 occhi aiutati da tre radar vedono anche ciò che chi sta seduto al posto di guida non vede e, nel mio giro di prova di quasi 45 minuti mi sono sempre sentito tranquillo grazie alla capacità di VLA 2.0 di intuire e prevedere le situazioni e di reagire per tempo senza inutili manovre all'ultimo momento. Se la reazione è più secca e brusca, è perché è necessario che sia così, come quella di un buon pilota.

La Xpeng P7 Ultra che ho provato, va detto, non è un'auto laboratorio, un'auto di test, e non è soltanto un'auto di serie, non è nemmeno un'auto di parco stampa. L'ingegnere Xpeng che mi accompagna nel mio giro di prova mi confida che la P7 che sto guidando è un'auto che Xpeng ha chiesto in prestito ai suoi clienti. Non so perché, ma è così. È un sistema pronto al 99%, ogni tanto ha qualche sbavatura, come quando è arrivata quasi a toccare un autobus che prima la P7 ha tentato di superare, poi si è accodata proprio quando il bus stava frenando per la fermata: il tecnico Xpeng a bordo è intervenuto sterzando, ma io penso che la P7 si sarebbe fermata per tempo, forse a un capello di distanza dall'autobus, ma ce l'avrebbe fatta.
È un sistema che apprende e che chilometro dopo chilometro continua ad aumentare la sua esperienza, per raggiungere il 100% di affidabilità. E già al 99% è molto meglio di molti automobilisti. E, non avendo bisogno di una infrastruttura stradale dedicata, è pronto ad affrontare le strade del mondo.
Guida autonoma o guida assistita? Il livello reale di Xpeng VLA 2.0
Sulle auto di serie, VLA 2.0 è classificato come sistema di assistenza alla guida di livello 2 e mi richiama all'ordine ogni tanto per ricordarmi di tenere le mani sul volante. La guida sembra autonoma, ma la responsabilità resta sul guidatore.
La scelta di Xpeng è però precisa e dichiarata: saltare il livello 3, che impone ambiguità normative difficili da gestire sulla responsabilità in caso di incidente, per puntare direttamente al livello 4, quello della guida completamente autonoma senza supervisione umana. Un salto che, sulle auto di serie, richiede autorizzazioni che oggi non esistono ancora.
Xpeng VLA 2.0, il robotaxi e la sfida a Tesla FSD
Il livello 4 è operativo, al momento, solo sul robotaxi che Xpeng ha appena presentato: il primo interamente sviluppato in casa da un costruttore cinese, con test su strada pubblica già in corso e operazioni commerciali pilota previste nella seconda metà del 2026. Il cuore del robotaxi è lo stesso VLA 2.0, potenziato con quattro chip Turing per una potenza di calcolo complessiva di 3.000 TOPS, il livello più alto attualmente disponibile al mondo per un veicolo autonomo. L'obiettivo è arrivare a operazioni completamente autonome, senza safety driver a bordo, entro l'inizio del 2027. E il modello fondazionale è lo stesso che anima il robot umanoide IRON e l'auto volante Aeroht: tre prodotti diversissimi, un'unica intelligenza artificiale condivisa.
La tecnologia non è rimasta un prodotto interno. Volkswagen ha adottato VLA 2.0 per il suo ID. UNYX 08, un SUV elettrico di grandi dimensioni sviluppato in soli 24 mesi insieme a Xpeng e lanciato in Cina ad aprile 2026 a partire da circa 33.700 dollari. Il veicolo monta due chip Turing per 1.500 TOPS di potenza di calcolo ed è il primo modello al mondo a commercializzare il chip Turing di Xpeng. Volkswagen diventa così il primo costruttore automobilistico occidentale ad adottare un software di guida autonoma sviluppato in Cina. Per He Xiaopeng, fondatore e CEO di Xpeng, la scelta del gruppo tedesco segna il momento in cui la tecnologia AI cinese per la mobilità viene riconosciuta a livello globale.
Sul fronte della competizione con Tesla, He Xiaopeng ha fissato un obiettivo preciso: VLA 2.0 dovrà eguagliare le prestazioni del sistema FSD v14.2 di Tesla in Cina entro il 30 agosto 2026. Tesla, dal canto suo, non ha ancora ottenuto l'approvazione cinese per le versioni più recenti di FSD, e i proprietari cinesi restano fermi alla versione 13. Chi sia avanti, in questo momento, è una questione aperta.
Xpeng VLA 2.0 arriverà in Europa nel 2027
Il piano di distribuzione globale di Xpeng VLA 2.0 prevede le prime consegne a partire dal 2027, con l'attivazione delle funzionalità mercato per mercato al ricevimento delle approvazioni regolamentari locali. Per l'Europa, dove il quadro normativo richiede tempi più lunghi rispetto alla Cina, il percorso sarà graduale. Nel frattempo, a marzo 2026 Xpeng ha già distribuito un aggiornamento OTA ai veicoli presenti sul mercato europeo. Il prossimo road test in Europa è previsto a breve, e sono curioso di vedere come VLA 2.0 se la cava sulle nostre strade.
Domande frequenti su Xpeng VLA 2.0
Cos'è Xpeng VLA 2.0?
Xpeng VLA 2.0 (Visual Language Action 2.0) è il sistema di guida autonoma di seconda generazione sviluppato da Xpeng. Utilizza un modello end-to-end che traduce direttamente le immagini delle telecamere in azioni di guida, senza strati intermedi di elaborazione. È disponibile sulle versioni Ultra di Xpeng P7, G7 e X9, ed è lo stesso modello fondazionale che anima il robot umanoide IRON e l'auto volante Aeroht.
Xpeng VLA 2.0 è guida autonoma di livello 4?
Sulle auto di serie no. VLA 2.0 è oggi un sistema di assistenza alla guida di livello 2: il conducente deve mantenere le mani sul volante. Xpeng ha scelto di saltare il livello 3 per puntare direttamente al livello 4, che è già operativo sul robotaxi con autorizzazioni dedicate, e che arriverà sulle auto di serie con le omologazioni previste a partire dal 2027.
Qual è la differenza tra Xpeng VLA 2.0 e Tesla FSD?
Entrambi i sistemi usano un approccio end-to-end basato sulla visione delle telecamere, senza LIDAR. Tesla FSD è più maturo sul mercato nordamericano ma non è ancora approvato in Cina nelle versioni più recenti. Xpeng ha dichiarato l'obiettivo di eguagliare FSD v14.2 in Cina entro agosto 2026.
Quando arriva Xpeng VLA 2.0 in Europa?
Xpeng prevede la distribuzione globale di VLA 2.0 a partire dal 2027, subordinata alle approvazioni regolamentari di ciascun mercato. I road test internazionali sono previsti a breve.
Che chip usa Xpeng VLA 2.0?
Il sistema è alimentato dal chip proprietario Turing AI, sviluppato internamente da Xpeng. Nelle versioni consumer Ultra eroga 2.250 TOPS di potenza di calcolo. Il robotaxi monta quattro chip Turing per un totale di 3.000 TOPS. Il Volkswagen ID. UNYX 08 monta due chip Turing per 1.500 TOPS ed è il primo veicolo al mondo a commercializzare questa tecnologia.
Volkswagen usa VLA 2.0?
Sì. Volkswagen ha integrato VLA 2.0 nel suo ID. UNYX 08, SUV elettrico sviluppato in collaborazione con Xpeng e lanciato in Cina ad aprile 2026. È il primo costruttore automobilistico occidentale ad adottare un software di guida autonoma sviluppato in Cina, e il primo a commercializzare il chip Turing AI di Xpeng.
Fondatore, editore, direttore. Dalla finanza al giornalismo, prima nei mensili classici specializzati, poi nel digitale: MotorBox è una creatura tutta sua ed esiste dal ’97, la preistoria di ogni magazine online. Mario è il leader nel lavoro, ma anche quando è tempo di scherzare: un matrimonio e due bambini da allevare non gli hanno fatto perdere lo spirito del ragazzino. Poco tempo per scrivere in prima persona, ma quando serve la sua penna è ancora tra le più eleganti e competenti della scena auto-moto. Creativo ed eclettico, le sue mani passano dalla tastiera del PC alle viscere della sua Jeep Wagoneer o delle sue moto storiche, fino agli strumenti con cui realizza gli oggetti e i mobili che disegna.







