
XPeng and Li Auto fiercely debate VLA, who is running naked, and who is taking a big gamble?

小鵬汽車和理想汽車圍繞自動駕駛 VLA 模型展開激烈辯論。理想汽車自動駕駛負責人郎鹹朋稱 VLA 是最佳方案,而小鵬汽車創始人何小鵬則為 VLA 下重注,賭約涉及未來技術效果。兩家公司均堅定支持 VLA 路線,華為和蔚來則選擇世界模型。此次辯論引發智能駕駛領域的廣泛關注。
12 月的中國智能駕駛圈,從一場「裸跑」和「反駁」中走向輿論頂峯。
昨天,理想汽車自動駕駛負責人郎鹹朋發表一篇長微博,回應了宇樹科技創始人王興興此前稱「VLA 模型是相對傻瓜的架構」的論點。
長微博裏面,郎鹹朋提到兩個核心觀點:「VLA 就是自動駕駛最好的模型方案」、「具身智能最終拼的是系統能力」。
郎鹹朋的回應斬釘截鐵,也成為了當天智能駕駛輿論場的絕對熱點。
無獨有偶,僅僅 24 小時後,小鵬汽車創始人何小鵬也發了一條長微博,主題也是 VLA。甚至於,何小鵬將他對 VLA 的態度升級到新高峰,為此不惜下重注。
他在微博中表示,他和自動駕駛團隊打了一個賭。
賭約的內容是如果到了 2026 年 8 月 30 日,小鵬的 VLA 在國內可以達到 FSD V14.2 在硅谷的整體效果,何小鵬就會在硅谷參考小鵬當前的總部餐廳,籌建一個非常特色的中國風味食堂。
而反之無法實現的話,小鵬汽車自動駕駛中心負責人劉先明,就要承諾在金門大橋裸跑。
24 小時內兩條長微博,先後引爆新造車智能駕駛話題。
小鵬汽車和理想汽車,目前都是堅定的 VLA 路線佈道者。小鵬剛剛在 AI Day 發佈的 VLA 2.0,將於 12 月正式開啓先鋒內測;理想則將在 OTA 8.1 裏面進一步升級了強化學習驅動的 VLA 大模型體驗。
而另一邊,華為和蔚來們則在世界模型的路上狂奔。
華為靳玉志曾經提到「我們不走 VLA 路線,WA(世界模型)才是最終解決方案」;蔚來李斌則承諾,「蔚來世界模型會在行業裏回到數一數二的位置」。
高階輔助駕駛還在質變前夕不斷醖釀,但車企仍需證明自身的技術先進性。
這一次 VLA 激辯,背後究竟是創新、突破,還是內卷、廝殺?
給大家提供點思考彈藥。
VLA 的高呼
兩條長微博的共同點有很多,都是為 VLA 鼓與呼,都給出了擲地有聲的結論。
回顧下前情,宇樹科技王興興對 VLA 和世界模型的發言,來自於今年 8 月 9 日北京世界機器人大會上。
彼時這句話相當於引爆了大模型輿論場——不過不是機器人大模型,反而是智能駕駛大模型。
經過新一輪 AI 洗禮,智能駕駛是具身智能的子集已經成為業界共識,這是背景。
也正因如此,王興興的觀點馬上就被反對 VLA 的網友作為論據,反駁 VLA 陣營的車企和智能駕駛公司。
雖然郎鹹朋的長微博回應距離 8 月份已經有些日子,但這並不影響他寫下理想汽車的決心,比如那句「VLA 就是自動駕駛最好的模型方案 」。
事實上,VLA 的最核心技術亮點,就在於 VLA 路線定鼎論文的標題裏面。
VLA,vision-language-action 視覺語言動作大模型,最早在 2023 年 7 月谷歌 DeepMind 團隊的《RT-2: Vision-Language-Action Models》中提及。
論文的副標題是:「Vision-Language-Action Models Transfer Web Knowledge to Robotic Control」,VLA 大模型將網絡知識轉化為機器人控制。
兩年半前 VLA 開山之作,對應着兩年半之後郎鹹朋那句「我們是在用 GPT 的方式做自動駕駛」。
這裏指的並不是理想 VLA 大模型已經對標 GPT 5,而是 VLA 的本質,乃至於自動駕駛大模型的發展方向,都在於用現實世界的通用知識,不斷圓滿「長尾場景」的解決方案。
或者換個更簡單的説法,VLA 讓智能駕駛擁有更接近人類的社會經驗。
比如下半年各家 VLA 都在卷的新功能——「手勢識別」,就是「社會經驗」的體現,讓智能駕駛正確判斷到底是有人要搭便車,還是交警指揮你通行。
第一個在發佈會上演示此功能的車企,正是小鵬汽車。
今天下午何小鵬的長微博雖然沒郎鹹朋那麼長,但他的決心是更明顯的,畢竟下了個「裸跑」的賭約。
至於為什麼不是何小鵬本人裸跑,因為 7 年前 G3 上市的時候,他就已經對賭過裸跑了,最終 G3 確實賣得不錯,不然...
回到 1 個月前的小鵬汽車 AI Day,何小鵬官宣小鵬汽車 VLA 2.0 將在四季度正式開啓先鋒用户內測。
在小鵬的 PPT 裏,VLA 2.0 的核心進化在於,去掉了傳統意義上的「L」,直接用隱式邏輯生成動作指令。
何小鵬認為這樣將極大程度上降低 VLA 大模型的延遲,並且將城中村等毛細道路的接管里程提高了 13 倍。
不過,伴隨着小鵬 VLA 2.0 而來的,是另一個提問:VLA 去掉 L,是不是更像世界模型了?
這要回到大模型進化的本質:儘可能減少信息傳遞的損耗,提升信息傳遞的效率。
VLA 去 L 化,和世界模型的底層優化方向確實是一致的——減少對思維鏈的依賴,提升圖像 token 化的信息利用效率,進而實現更強的智能駕駛性能。
但這絕對不意味着 VLA 和世界模型,現在、馬上、立刻,就已經分出了勝負,更不意味着 VLA 陣營正在向世界模型靠攏。
甚至於,VLA 和世界模型,互相都在呈現出「合流」的趨勢。
譬如 VLA 這邊,小鵬正在讓模型直接從視頻流中學習時空規律培養直覺,而理想也用世界模型在雲端做數據生成、做仿真測試和強化訓練。
甚至世界模型的絕對推崇者,稱 VLA 是在「死記硬背」的 Yann LeCun,他最新提出的 AGI 概念「JEPA Joint Embedding Predictive Architecture(聯合嵌入預測架構)」,也大量吸取了 VLA 技術路線的成果。
比如他也認為 VLA 對現實世界的交互非常高效,比如他也認為真正的 JEPA 世界模型需要擁有類似於 VLA 邏輯的、負責感知和評估的部分。
至於有沒有 L,對於 Yann LeCun 和谷歌,以及現在的何小鵬們來説,從來就不重要。
還記得前面提到谷歌開創 VLA 賽道論文的標題嗎?知識轉化為控制,哪裏有語言?
但是讓 VLA 佔據更高的輿論陣地,對於理想和小鵬來説很重要。
絕不鬆手的話語權
從技術創新迷人的泥沼中掙出,最後我們聊聊智能駕駛營銷燥熱的空氣。
時間是最好的試金石,2021 年 AI Day 上馬斯克那句「想要實現 FSD,特斯拉必須解決現實世界的 AI」,現在看來似乎很直白淺顯,卻是早已被馬斯克佔據的絕對營銷頂峯。
因為第一個擲地有聲的,才有資格被溯源。
無論是郎鹹朋的長微博、三季度財報會議上李想本人長達 20 分鐘的演講,還是今天何小鵬的賭約,都是中國新造車對智能駕駛話語權絕不放手的緊迫性。
技術進步有質變之後的璀璨,但更多的是量變期間的平淡。2025 年智駕營銷踩剎車之後,造詞運動暫告一段落,口號大賽也偃旗息鼓。
但向消費者傳遞車企領先性的任務依然沉重,一邊是 FSD V14 正準備捲土重來,另一邊則是機器人公司迅速站在了 AI 舞台中央。
甚至何小鵬都直言,「我們的第一個版本還達不到 FSD V14.2 的水準」——也許這就是裸跑賭約的直接原因。
理想和小鵬表現出了緊迫感,但它們絕對不是唯二感受到緊迫的。
最後站在媒體角度,我們希望這種緊迫感,可以儘快轉化為用户的驚喜,也必須轉化為用户的驚喜。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
