
Meta is in trouble! LeCun criticizes his 28-year-old boss for lacking expertise, solid evidence of the Llama 4 ranking scandal

Meta 前首席科學家 LeCun 離職後,指責公司 Llama 4 刷榜,並批評 28 歲上司 Alexandr Wang 缺乏研究經驗,預言 Meta AI 將面臨員工離職潮。LeCun 認為 Wang 不理解科研人員的需求,且 Meta 在應對 AI 競爭中手忙腳亂,扎克伯格對 Llama 4 的失利感到沮喪,導致 GenAI 組織被邊緣化。
剛剛,這位圖靈獎得主、Meta 前首席科學家一離職,便回頭投下了重磅炸彈!
先是曝出 Meta 的 Llama 4 刷榜黑料:
Llama 4 測試「被做了點手腳」,團隊在不同基準上用不同模型,只為了拿到更好成績。
緊接着,他又把矛頭對準自己原上司:28 歲的 Alexandr Wang。
他是扎克伯格 140 億美元重點押注超級智能的核心人物。
Meta 曾向 Scale AI 投資 140 億美元,並將其創始人 Alexandr Wang 挖來領導「超級智能實驗室」。
但 LeCun 對他的評價,幾乎相當於當眾拆台:「他沒有研究經驗,也不知道如何進行研究。」
他認為 Alexandr Wang 並不真正理解科研,不知道科研人員「喜歡什麼、不喜歡什麼」,因此預言 Meta AI 將會有更多員工離職。
炮轟 28 歲上司 ,預言新一輪離職潮
扎克伯格之所以重金引入 Alexandr Wang 等人組建「超級智能實驗室」,是因為被逼急了。
ChatGPT 引爆浪潮後,也讓 Meta 陷入了一場手忙腳亂的應對。
扎克伯格決定把籌碼押在 Llama 大模型上,並重組組織架構,成立生成式 AI(GenAI)部門,要求加速把研究變為產品。
在這個過程中 LeCun 堅持開源,讓 Llama 2 以「開放權重」成為開源大模型的標杆,甚至被他稱為「分水嶺」。
扎克伯格決定給 GenAI 更大壓力,認為要加速 AI 的開發與部署,如果按照原有的方法搞,很可能就會落後。
特別是在去年 4 月,當 Llama 4 翻車,公司還被指控「刷榜」,扎克伯格的情緒徹底炸裂。
LeCun 稱「馬克非常沮喪,基本上對所有參與此事的人都失去了信心……所以基本上把整個 GenAI 組織邊緣化了。」
於是,Alexandr Wang 被推到台前,成了 Meta 新 AI 賭注的領軍者。
可 LeCun 對這位年輕上司的不足卻直言不諱:認為他年輕、缺乏經驗。
他學得很快,知道自己不知道什麼……但他沒有科研經驗,不知道如何進行科研,也不知道科研人員會喜歡什麼或不喜歡什麼。
當被問起怎麼會接受自己的上級突然變成一個 28 歲的人時,LeCun 表示他習慣和年輕人共事。
當時 Facebook 的工程師平均年齡 27 歲,他的年齡是他們的兩倍。
但他同時也提到 Alexandr Wang 並沒有指揮自己做事:
你不能告訴研究人員該怎麼做。你當然不能告訴像我這樣的研究人員該怎麼做。
意思很明顯:研究這件事,不是組織架構圖上的任命所能夠命令和約束的,而且外行不能指導內行。
Llama 4 風波 一次基準測試引爆組織內鬥
2025 年 4 月發佈的 Llama 4 翻車後,Meta 被指控操縱基準測試成績。
這次是 LeCun 首次站出來實錘外界以往的猜測,他指出團隊為了美化數據,對基準測試結果進行了「捏造(Fudged)」,「篡改」了部分測試結果。
他還特意指出,在不同基準上用了不同模型,以獲得更好成績。
對扎克伯格來説,這比一次技術失敗更難接受。
這一醜聞也直接導致他對原 AI 團隊失去信心,轉而重金挖角,開始組建超級智能實驗室團隊。
Meta 開始在人才爭奪戰裏下重注,甚至還因為試圖用 1 億美元簽約獎金挖人上過頭條。
激進的人才戰略,也導致了整個 GenAI 組織被邊緣化,以及新舊團隊、研究與產品、開源與商業之間的結構性摩擦。
由此,也帶來了 Meta 內部一波波的離職潮和裁員潮。
路線之爭 LeCun 堅持 LLM 是條「死路」
真正讓 LeCun 最難忍受的,並不是他口中「不懂管理的上級」,或者是刷榜事件,而是他認為 Meta 正在集體沉迷於一條錯誤的方向!
LeCun 直言,那批公司為了衝刺新一輪「超級智能」而招來的人「完全被大語言模型洗腦了(completely LLM-pilled)」。
雖然,扎克伯格仍然支持他對 AI 未來的看法,但公司的大規模招聘主要集中在 LLM 開發上。
但 LeCun 的立場是:LLM 雖然有用,但從根源上受限,語言本身就是束縛。
要實現人類水平智能,必須理解物理世界的運作方式。
因此,他才會拋出那個讓所有大模型路線的追隨者們感到「刺耳」的觀點:
我確信 Meta 公司裏很多人,包括 Alex 在內,都不希望我告訴世人,LLM 在超級智能領域基本上是一條死路。
然後他拒絕為此妥協:
我不會因為某些人認為我錯了就改變我的想法。我沒錯。作為一名科學家,我的職業操守不允許我這樣做。
在一家公司裏,你可以跟同事、上司甚至老闆爭論。
但如果公開挑戰組織方向,站出來説「這條路基本是死路」,你就會變成一個天然的異類。
這正像 LeCun 自己所承認的那樣:留下來在「政治上」變得很難。
他在 Meta 的位置,已經不再適合繼續做他想做的研究。
離開是不可避免的結局。
世界模型下一代新範式
LeCun 的新公司叫 Advanced Machine Intelligence Labs(AMI Labs),專注於用世界模型實現 ASI。
LeCun 想做的 V-JEPA 世界模型,可以理解為:讓 AI 不是隻會「説得像」,而是能在腦子裏搭一個粗粒度的世界模擬器——看見一段視頻後,知道哪些東西是物體、它們怎麼動、接下來可能發生什麼,甚至為行動做準備。
傳統生成式訓練常逼模型還原每個像素/詞。
JEPA 的思路更「務實」:把世界壓縮成一串表示(embedding),訓練目標是從可見的上下文去預測被遮住部分的表示,而不是把遮住的區域逐像素畫回去。
I-JEPA 論文把這稱為 non-generative 的自監督學習路徑。
V-JEPA 就是視頻版 JEPA:把視頻切成時空塊,遮住一部分,讓模型用剩下的內容去預測「被遮住那塊在表示空間裏應該長什麼樣」。
直覺上,它更容易學到「誰在動、怎麼動、動的規則」,而不是糾結紋理噪點。
V-JEPA 2 的路線很明確:
先用超過 100 萬小時互聯網視頻做大規模自監督預訓練;
再用少量機器人交互軌跡,讓模型學會「如果我這麼做(動作),世界會怎麼變」,從而更接近可用於預測與規劃的世界模型。
想做好世界模型,有三大難點:
其一是長時程預測,越往後未來分叉越多。
其二是不確定性,同一個場景可能有多種合理下一步。
其三是從表徵到行動,學到「狀態」還要能服務決策與控制。
而 AMI Labs,正是 LeCun 為了攻克世界模型的難題而成立。
LeCun 的新計劃
去年 11 月,當媒體曝出 LeCun 即將離職 Meta,開啓新創業計劃的消息後,他的日程表就一直處在瘋狂狀態。
他直言,這個決定使自己的日程表被迫加速了,居於日程表核心位置的,就是去做他口中更接近下一代 AI 的東西:世界模型(world model)。
LeCun 的新創公司 AMI Labs 總部位於巴黎。
據 LeCun 稱,馬克龍還向他發了一條 WhatsApp,暗示對他的新創業計劃會與法國保持緊密聯繫感到高興。
AMI Labs 將由法國醫療 AI 初創公司 Nabla 的聯合創始人兼 CEO Alex LeBrun 領導,LeCun 擔任執行主席。
提到這樣的安排,LeCun 坦誠表示自己當不了 CEO:
我是科學家,我挺擅長判斷什麼技術行得通、什麼行不通。但我當不了 CEO,一方面我太不擅長組織管理了,另一方面我也太老了!
這種安排可以讓他像在 Meta 時那樣,保有做研究的自由。
在 LeCun 對技術的描述中,有一個特別的觀點:
他認為模型依賴「情緒」,也就是過往經歷與評價來引導預測,這非常像是把「人的本能」裝進機器:
如果我掐你一下,你會感覺到疼……下一次當我把胳膊靠近你時,你會往後縮。這就是你的預測,而它喚起的情緒是恐懼,或者説對疼痛的迴避。
LeCun 還給出了他所計劃打造的「世界模型」的時間表:
預計 12 個月內將推出具備初步物理直覺的「嬰兒級」模型。幾年內會在更大規模上出現。
LeCun 認為它還不是超級智能,也許還存在沒看到的障礙,但它至少還有希望是一條通往超級智能的路徑。
提到對未來的願景,LeCun 直言希望為世界留下更多智能。
「這才是我們應該擁有更多的東西……我們飽受愚蠢之苦。」
LeCun 的智能之路
生於 1960 的 LeCun 自幼在巴黎郊區長大。
從小的他就着迷於一個問題:人類智能到底是怎麼出現的。
在他八歲的時候,看了電影《2001:太空漫遊》,整個人被深深震撼,這促使他走上了探索人工智能之路。
LeCun 的「頓悟時刻」發生在 1980 年代。
他在一本書中讀到了語言學家 Noam Chomsky 與心理學家 Jean Piaget 之間關於「先天與後天」的爭論。
其中,Chomsky 認為人類有天生的語言能力,而 Piaget 則認為確實存在某種結構,但大部分是後天學來的。
LeCun 並不認同 Chomsky 的説法,在他看來,我們什麼都是學來的,而且他認為所謂智能主要就是關於學習。
當時關於 AI 和神經網絡(neural networks)的研究幾乎是一片空白,但 LeCun 還是去找同樣在研究神經網絡的人,並與當時擔任卡內基梅隆大學的教員 Geoffrey Hinton 成為智識上的「靈魂伴侶」。
後來,LeCun 去多倫多大學加入 Hinton 的團隊做博士後研究。
兩人再加上 Yoshua Bengio,共同為深度學習和現代 AI 奠定了基礎,並於 2018 年獲得計算機科學界最負盛名的圖靈獎。

LeCun 是許多重要早期 AI 技術背後的大腦。
20 世紀 80 年代末到 90 年代,他在新澤西的 AT&T 貝爾實驗室(Bell Labs)做研究,並在那裏開發了卷積神經網絡(convolutional neural networks),這種架構用於圖像識別技術。
他還把它做進一個系統裏,銀行曾廣泛用它來識別支票。
這項研究的想法他在多倫多時就已經有了,但之所以能在現實世界落地,是因為貝爾實驗室有近乎無限的資金,以及最前沿的技術條件。
LeCun 講起他剛加入時老闆 Larry Jackel 對他説過的話:
在貝爾實驗室,你不會因為省錢而出名。
結束了貝爾實驗室的狂歡後,LeCun 回到學界,在紐約大學(NYU)啓動了一個研究神經網絡的新項目。
到 2013 年,深度學習已經明顯會成功,谷歌剛剛啓動 Google Brain,一年後又收購了英國 AI 實驗室 DeepMind。
正是那個時候,扎克伯格打來電話,他想在 Facebook 建一個 AI 團隊,為了挖 LeCun,甚至邀請他去加州家裏吃晚飯。
LeCun 同意加入,但提出了三個條件:他不必辭掉 NYU 的工作,不搬去加州,新實驗室的研究成果必須對外公開發布。
扎克伯格都答應了,於是 LeCun 加入了 Facebook,建立一個專注基礎研究的全新 AI 研究實驗室 Facebook Artificial Intelligence Research(FAIR)。
本文來源:新智元
