Xiaomi suddenly launched a new model, focusing on "extreme cost performance," Luo Fuli: "This is just our second step on the AGI roadmap."

華爾街見聞
2025.12.17 02:49
portai
I'm PortAI, I can summarize articles.

0.1 美元/百萬 token,速度 150 tokens/秒! 小米突發新模型 MiMo-V2-Flash,以 73.4% 的編程高分媲美 DeepSeek-V3.2。羅福莉直言:“這只是我們 AGI 路線圖上的第二步。” 大摩分析,小米意圖通過這一高性能模型,深度重塑其龐大的 “人車家” 全生態。

11 個小時前,小米深夜 “突襲式” 發佈並開源了其最新的專家混合架構(MoE)大語言模型 MiMo-V2-Flash。該模型總參數量達 3090 億,活躍參數為 150 億,採用對開發者友好的 MIT 開源協議,基礎版權重也已經在 Hugging Face 上發佈。

小米 MiMo 團隊負責人羅福莉(Fuli Luo)在社交平台上明確表示:“MiMo-V2-Flash 已經上線。這只是我們 AGI 路線圖上的第二步。”這一表態凸顯了小米在 AI 領域的長遠規劃和技術雄心。

從市場影響來看,MiMo-V2-Flash 的入局可能攪動現有開源 AI 模型的競爭格局。其官方公佈的每百萬輸入 token 0.1 美元、輸出 token 0.3 美元的極低成本,結合高達 150 tokens/秒的推理速度,為開發者和企業提供了極具吸引力的選擇,或將加速高性能 AI 技術在更廣泛場景的應用和普及,尤其是對其龐大的 “手機 x AIoT” 生態系統形成強大賦能。

性能媲美 DeepSeek-V3.2,並且 “極具性價比”

MiMo-V2-Flash 在多個權威基準測試中展現了強大的實力,其性能表現足以和部分頂尖的開源及閉源模型同台競技。

根據小米官方公佈的數據,在衡量編程能力的 SWE-bench Verified 測試中,MiMo-V2-Flash 取得了 73.4% 的得分,超越了所有已知的開源模型,並接近頂級閉源模型的水平。

在 AIME 2025 數學競賽和 GPQA-Diamond 科學知識測試等考驗推理能力的項目中,該模型也位列開源模型前兩名。摩根士丹利的研報圖表亦顯示,MiMo-V2-Flash 在綜合性能上與 DeepSeek-V3.2 等主流大模型相比具有競爭力。

在愈發重要的智能體(Agent)任務上,MiMo-V2-Flash 同樣表現出色。數據顯示,其在τ²-Bench 分類得分中,通信、零售、航空等多個類別均獲得高分,證明其具備理解複雜任務邏輯和執行多輪交互的能力。

小米方面表態顯示,該模型的高性能與 150 tokens/秒的推理速度,加上極低的運營成本,使其成為現有最高性價比的高性能模型之一。目前,該模型已在 API 平台限時免費開放,並以 MIT 開源協議在 Hugging Face 上發佈了基礎版權重。

“極致性價比” 背後的技術創新:解鎖效率與長文本能力

MiMo-V2-Flash 之所以能在保持高性能的同時實現低成本和高效率,得益於其在模型架構和訓練方法上的多項關鍵技術創新。

首先,是“混合滑動窗口注意力機制”(Hybrid Sliding Window Attention)。小米採用了一種 5:1 的混合比例,即每 5 層滑動窗口注意力(SWA)搭配 1 層全局注意力,將 KV 緩存(一種用於存儲中間結果的內存)的存儲量減少了近 6 倍,同時依然支持高達 256k 的超長上下文窗口。

羅福莉(Fuli Luo)在其 X 帖子中分享了工程細節:“我們最終選擇了混合 SWA。它簡單、優雅,並且在我們的內部基準測試中,其長上下文推理能力優於其他線性注意力變體。” 她特別指出一個反直覺的發現,即 128 個 token 的窗口大小是 “最佳選擇”,盲目擴大到 512 反而會導致性能下降,並強調 “sink values 是不可或缺的”。

其次,是輕量級多 Token 預測(Lightweight Multi-Token Prediction, MTP)。該技術使模型能一次並行預測多個 token,而非傳統的逐字生成,從而將推理速度提升 2 至 2.6 倍。

羅福莉透露:“通過 3 層 MTP,我們觀察到平均接受 token 數超過 3 個,編碼任務速度提升約 2.5 倍。” 她補充説,這項技術有效解決了 GPU 的空閒時間問題,儘管因項目週期緊張此次未能完全整合進強化學習(RL)循環,但小米已將 3 層 MTP 開源,供開發者使用。

今年 11 月,曾效力 DeepSeek 的羅福莉在 X 上高調宣佈正式加入小米,出任 MiMo 團隊負責人。小米 MiMo 是小米推進大模型研發的核心招牌,隨着羅福莉的官宣,小米 MiMo 也被一併明確,劍指最前沿——空間智能。

訓練 “黑科技”:1/50 算力實現性能對齊

在訓練階段,小米採用了業界領先的技術以最大化效率。模型在預訓練階段使用了 FP8 混合精度技術,在 27 萬億 token 的數據上完成訓練。

更具突破性的是在後訓練階段引入的多教師在線策略蒸餾(Multi-teacher Online Policy Distillation, MOPD)框架。據小米介紹,該方法借鑑了 Thinking Machine 的 On-Policy Distillation 思路,讓學生模型在訓練時能從多個專家教師模型處獲得密集的獎勵信號。其最顯著的優勢在於效率,僅需傳統 SFT(監督微調)與強化學習相結合方法的 1/50 算力,就能讓學生模型達到教師模型的性能峯值。

羅福莉指出,這一框架為構建一個 “自我強化循環系統” 奠定了基礎,即今天的學生模型在進化後可以成為明天更強的教師模型,從而實現模型的持續、高效迭代。

小米的 AI 版圖:從手機到 AGI

MiMo-V2-Flash 的發佈,並非一次孤立的技術展示,而是小米 AI 戰略的重要組成部分。正如羅福莉所言,這只是其 AGI 路線圖的 “第二步”,暗示了後續將有更深入的佈局。

此舉清晰地表明瞭小米正全力將 AI 打造為其核心競爭力之一。據摩根士丹利發佈的研報觀點稱,此舉 “展示了小米對 AI 研發的承諾”,並預計該公司未來將在雲端 AI 和邊緣 AI 兩方面取得更多實質性進展。而強大的自研 AI 底層能力,將為其手機、IoT 設備乃至新能源汽車等硬件產品帶來獨特的智能化體驗,構築更深的生態護城河。

摩根士丹利認為,MiMo-V2-Flash 的推出,不僅可能重塑開源 AI 模型市場格局,更揭示了小米意圖通過自研 AI 技術深度賦能其 “人車家” 全生態的戰略野心。

十四年前,小米手機以 1999 元的價格重新定義了旗艦智能手機市場。如今,小米似乎希望通過 MiMo-V2-Flash,以其卓越的性能和顛覆性的成本,為開源 AI 領域帶來一個新的 “小米時刻”。

體驗模型可戳:https://aistudio.xiaomimimo.com/#/