Goldman Sachs: What Does DeepSeek V4 Mean for China's AI?

高盛認為 DeepSeek V4 通過混合注意力等架構創新，大幅壓縮長上下文推理成本，核心意義在於以更低成本支撐複雜智能體應用落地。V4 明確押注華為昇騰 950，預計 2026 年下半年量產後 API 定價將顯著下降。國內 AI 模型競爭加劇，編程能力與多模態成差異化關鍵。高盛維持雲計算與數據中心首選評級。

高盛認為，DeepSeek V4 的核心意義在於以更低成本支持更復雜的智能體應用落地，從而打開 AI 應用規模化的新空間。

追風交易台消息，4 月 24 日，高盛 Ronald Keung 團隊發表研報，全新開源的 V4 模型是 DeepSeek 效率優先、開源路線的延續。

在技術層面，V4 通過架構升級實現長上下文窗口的大幅降本，並明確押注華為國產芯片。在市場層面，這一發布加速了中國 AI 模型競爭的白熱化，編程能力、任務完成率與多模態將成為定價權的核心分水嶺。

高盛維持對雲計算與數據中心板塊的推薦評級，算力成本效率的持續改善將推動 AI 應用加速滲透，企業端 AI 代理增長與消費端 AI 助手的雙輪驅動，將支撐雲服務定價能力持續提升。

V4 架構升級，以更少內存撐起更長上下文

DeepSeek V4 以 Pro 和 Flash 兩個版本發佈。

Pro 版本為旗艦規模，參數量達 1.6 萬億（激活參數 490 億）；Flash 版本相對輕量，參數量 2840 億（激活參數 130 億）。兩款模型均支持 100 萬詞元 token 的超長上下文窗口，與美國頂尖模型（SOTA）持平，但所需內存與 KV 緩存大幅壓縮。

根據高盛報告，V4 Pro 在 100 萬上下文場景下，單詞元 token 推理所需浮點運算量（FLOPs）僅為 DeepSeek V3.2 的 27%，KV 緩存佔用僅為 10%；V4 Flash 則更為激進，FLOPs 降至 10%，KV 緩存壓縮至 7%。

這一效率躍升依託三項關鍵架構創新實現：

混合注意力機制方面，V4 引入壓縮稀疏注意力（CSA）與重度壓縮注意力（HCA）的混合架構。CSA 先對 KV 緩存進行序列維度壓縮再執行稀疏注意力計算，HCA 則採用更激進的壓縮但保留稠密注意力，兩者協同大幅降低長輸入所需的臨時內存。

訓練穩定性方面，V4 引入 mHC 機制，增強信息在多層網絡中傳遞的穩定性；

同時採用 Muon 作為主訓練優化器（部分模塊保留 AdamW），以適應比 V3 更復雜的網絡架構，提升訓練過程的收斂質量。

高盛指出，上述效率增益對長時任務場景意義更為顯著，典型用例是需要處理大量上下文的長週期代理任務。

值得注意的是，DeepSeek 當前仍專注於基礎文本模型，而阿里巴巴、字節跳動、MiniMax 等互聯網巨頭與獨立模型玩家則更傾向於多模態/全模態路線，在 AGI 探索路徑上存在明顯分化。

國產芯片加速落地，華為昇騰 950 鋪路降價空間

此次 V4 發佈的另一重要信號，是 DeepSeek 明確將華為昇騰 950 超級節點的量產納入其商業路徑。

DeepSeek 預計隨着華為 Ascend 950 超級節點在 2026 年下半年實現大規模供貨，V4 Pro 版本的 API 定價將迎來顯著下降。

高盛報告顯示，這一表態具有雙重意涵：

其一，DeepSeek 的成本競爭力將進一步強化，為更廣泛的應用落地創造條件；

其二，在芯片持續收緊的背景下，中國頂尖 AI 模型向國產算力遷移的趨勢得到頭部玩家的明確背書。

從目前定價來看，高盛數據顯示 V4 Pro 在主流 API 平台上的定價已具備競爭力，而隨着國內算力供給擴容，這一優勢預計將在 2026 年下半年進一步擴大。

國內 AI 模型競爭進入差異化階段

DeepSeek V4 的開源發佈，迅速觸發中國 AI 模型陣營新一輪密集跟進。

據高盛梳理，近期競相推出新模型的玩家包括：Kimi K2.6、阿里巴巴 Qwen3.6-Max、騰訊 Hy3 預覽版、小米 V2.5，以及預計將於 5 月推出的 MiniMax M3/Hailuo。

在高盛看來，未來決定各模型定價權的關鍵差異化因素將集中在兩個維度：

編程/任務完成成功率，智譜的 GLM 模型在代碼能力排名中名列前茅；

多模態能力，字節跳動、阿里巴巴和 MiniMax 在這一方向投入最為深入。

研報指出，兩類玩家優劣勢清晰：

獨立 AI 玩家比如 MiniMax，組織效率高、決策鏈路短，即使基礎文本 API 定價極低，仍能實現 40% 的毛利率，這是高盛的預測數據。

互聯網大廠比如字節、騰訊、阿里，核心業務現金流充沛，更適合佈局 AI 基礎設施與雲賽道，需要設置獨立的 AI 團隊激勵方案留存人才，比如字節豆包團隊已有獨立激勵。

值得關注的是，高盛報告援引新聞報道稱，騰訊和阿里巴巴正在洽談以逾 200 億美元估值投資 DeepSeek，而智譜和 MiniMax 的最新市值分別約為 530 億美元和 310 億美元，這一潛在交易折射出巨頭對稀缺頂層 AI 能力的爭奪邏輯。

首選賽道邏輯不變：雲計算與數據中心

高盛維持雲計算與數據中心為中國互聯網首選子賽道的判斷，邏輯在於：

AI 詞元 Token 需求的持續增長將驅動雲服務採購量上升；

企業客户與 AI 代理的增長正推動雲/詞元 Token 定價能力改善；

消費級 AI 助手的持續滲透貢獻增量需求。

在 To-B 企業雲市場，阿里巴巴以最大外部 AI 雲營收規模領跑；在 To-C 消費市場，字節跳動目前是 AI 聊天機器人日均 Token 用量最大的平台，中國 AIGC 應用的 DAU 整體保持強勁增長，2026 年 3 月環比增速高達 36%。

重點推薦標的方面，高盛持續強調萬國數據、世紀互聯、阿里巴巴和金山雲四隻核心標的，作為把握中國 AI 基礎設施擴張紅利的核心配置方向。

此外，第二梯隊是電商與出行賽道，第三梯隊是 AI 模型相關標的，第四梯隊是遊戲與娛樂賽道。