
Goldman Sachs: What Does DeepSeek V4 Mean for China's AI?
高盛認為 DeepSeek V4 通過混合注意力等架構創新,大幅壓縮長上下文推理成本,核心意義在於以更低成本支撐複雜智能體應用落地。V4 明確押注華為昇騰 950,預計 2026 年下半年量產後 API 定價將顯著下降。國內 AI 模型競爭加劇,編程能力與多模態成差異化關鍵。高盛維持雲計算與數據中心首選評級。
高盛認為,DeepSeek V4 的核心意義在於以更低成本支持更復雜的智能體應用落地,從而打開 AI 應用規模化的新空間。
追風交易台消息,4 月 24 日,高盛 Ronald Keung 團隊發表研報,全新開源的 V4 模型是 DeepSeek 效率優先、開源路線的延續。
在技術層面,V4 通過架構升級實現長上下文窗口的大幅降本,並明確押注華為國產芯片。在市場層面,這一發布加速了中國 AI 模型競爭的白熱化,編程能力、任務完成率與多模態將成為定價權的核心分水嶺。
高盛維持對雲計算與數據中心板塊的推薦評級,算力成本效率的持續改善將推動 AI 應用加速滲透,企業端 AI 代理增長與消費端 AI 助手的雙輪驅動,將支撐雲服務定價能力持續提升。
V4 架構升級,以更少內存撐起更長上下文
DeepSeek V4 以 Pro 和 Flash 兩個版本發佈。
Pro 版本為旗艦規模,參數量達 1.6 萬億(激活參數 490 億);Flash 版本相對輕量,參數量 2840 億(激活參數 130 億)。兩款模型均支持 100 萬詞元 token 的超長上下文窗口,與美國頂尖模型(SOTA)持平,但所需內存與 KV 緩存大幅壓縮。
根據高盛報告,V4 Pro 在 100 萬上下文場景下,單詞元 token 推理所需浮點運算量(FLOPs)僅為 DeepSeek V3.2 的 27%,KV 緩存佔用僅為 10%;V4 Flash 則更為激進,FLOPs 降至 10%,KV 緩存壓縮至 7%。
這一效率躍升依託三項關鍵架構創新實現:
- 混合注意力機制方面,V4 引入壓縮稀疏注意力(CSA)與重度壓縮注意力(HCA)的混合架構。CSA 先對 KV 緩存進行序列維度壓縮再執行稀疏注意力計算,HCA 則採用更激進的壓縮但保留稠密注意力,兩者協同大幅降低長輸入所需的臨時內存。
- 訓練穩定性方面,V4 引入 mHC 機制,增強信息在多層網絡中傳遞的穩定性;
- 同時採用 Muon 作為主訓練優化器(部分模塊保留 AdamW),以適應比 V3 更復雜的網絡架構,提升訓練過程的收斂質量。
高盛指出,上述效率增益對長時任務場景意義更為顯著,典型用例是需要處理大量上下文的長週期代理任務。
值得注意的是,DeepSeek 當前仍專注於基礎文本模型,而阿里巴巴、字節跳動、MiniMax 等互聯網巨頭與獨立模型玩家則更傾向於多模態/全模態路線,在 AGI 探索路徑上存在明顯分化。
國產芯片加速落地,華為昇騰 950 鋪路降價空間
此次 V4 發佈的另一重要信號,是 DeepSeek 明確將華為昇騰 950 超級節點的量產納入其商業路徑。
DeepSeek 預計隨着華為 Ascend 950 超級節點在 2026 年下半年實現大規模供貨,V4 Pro 版本的 API 定價將迎來顯著下降。
高盛報告顯示,這一表態具有雙重意涵:
- 其一,DeepSeek 的成本競爭力將進一步強化,為更廣泛的應用落地創造條件;
- 其二,在芯片持續收緊的背景下,中國頂尖 AI 模型向國產算力遷移的趨勢得到頭部玩家的明確背書。
從目前定價來看,高盛數據顯示 V4 Pro 在主流 API 平台上的定價已具備競爭力,而隨着國內算力供給擴容,這一優勢預計將在 2026 年下半年進一步擴大。
國內 AI 模型競爭進入差異化階段
DeepSeek V4 的開源發佈,迅速觸發中國 AI 模型陣營新一輪密集跟進。
據高盛梳理,近期競相推出新模型的玩家包括:Kimi K2.6、阿里巴巴 Qwen3.6-Max、騰訊 Hy3 預覽版、小米 V2.5,以及預計將於 5 月推出的 MiniMax M3/Hailuo。
在高盛看來,未來決定各模型定價權的關鍵差異化因素將集中在兩個維度:
- 編程/任務完成成功率,智譜的 GLM 模型在代碼能力排名中名列前茅;
- 多模態能力,字節跳動、阿里巴巴和 MiniMax 在這一方向投入最為深入。
研報指出,兩類玩家優劣勢清晰:
- 獨立 AI 玩家比如 MiniMax,組織效率高、決策鏈路短,即使基礎文本 API 定價極低,仍能實現 40% 的毛利率,這是高盛的預測數據。
- 互聯網大廠比如字節、騰訊、阿里,核心業務現金流充沛,更適合佈局 AI 基礎設施與雲賽道,需要設置獨立的 AI 團隊激勵方案留存人才,比如字節豆包團隊已有獨立激勵。
值得關注的是,高盛報告援引新聞報道稱,騰訊和阿里巴巴正在洽談以逾 200 億美元估值投資 DeepSeek,而智譜和 MiniMax 的最新市值分別約為 530 億美元和 310 億美元,這一潛在交易折射出巨頭對稀缺頂層 AI 能力的爭奪邏輯。
首選賽道邏輯不變:雲計算與數據中心
高盛維持雲計算與數據中心為中國互聯網首選子賽道的判斷,邏輯在於:
- AI 詞元 Token 需求的持續增長將驅動雲服務採購量上升;
- 企業客户與 AI 代理的增長正推動雲/詞元 Token 定價能力改善;
- 消費級 AI 助手的持續滲透貢獻增量需求。
在 To-B 企業雲市場,阿里巴巴以最大外部 AI 雲營收規模領跑;在 To-C 消費市場,字節跳動目前是 AI 聊天機器人日均 Token 用量最大的平台,中國 AIGC 應用的 DAU 整體保持強勁增長,2026 年 3 月環比增速高達 36%。
重點推薦標的方面,高盛持續強調萬國數據、世紀互聯、阿里巴巴和金山雲四隻核心標的,作為把握中國 AI 基礎設施擴張紅利的核心配置方向。
此外,第二梯隊是電商與出行賽道,第三梯隊是 AI 模型相關標的,第四梯隊是遊戲與娛樂賽道。
