Breakthrough in NVIDIA's computing power monopoly! Amazon's AI ASIC welcomes a structural turning point: starting to gain industry favor

智通財經
2026.05.20 07:18

亞馬遜的 Trainium 人工智能加速器開始受到開發者青睞,逐漸打破英偉達的市場壟斷。隨着英偉達 GPU 供應緊張,開發者對 Trainium 的興趣上升,部分用户已將工作負載轉移至 Trainium 第二代芯片,成本降低可達 35%。亞馬遜 CEO Andy Jassy 表示,若獨立運營,芯片業務年收入可達 500 億美元。

智通財經 APP 獲悉,據報道,亞馬遜 (AMZN.US) 的 Trainium 人工智能加速器開始贏得一些人工智能開發人員的青睞,這些開發人員歷來依賴英偉達 (NVDA.US) 的產品。

英偉達的 GPU 被廣泛認為在 AI 加速器市場佔據主導地位,由於超大規模數據中心、AI 前沿模型實驗室和其他買家的旺盛需求,其供應一直處於短缺狀態。雖然市場上存在英偉達產品的替代方案,包括 AMD、亞馬遜、谷歌以及其他定製專用集成電路 (ASIC) 產品,但據報道,越來越多的開發者開始意識到亞馬遜 Trainium 產品的吸引力。媒體 The Information 援引了六位使用該芯片或與該芯片合作的人士的訪談。

Superlinked 首席執行官 Daniel Svonava 告訴 The Information:“我們一直以來都認為軟件支持不足是一個障礙。但這種情況在過去幾個月裏發生了改變,這個障礙已經消除。”

另一位開發者,Loka 的機器學習負責人 Bojan Jakimovski 也表示,過去幾個月人們對 Trainium 的興趣有所上升,部分原因是英偉達 GPU 的供應緊張。他還補充説,一位客户在測試表明 Trainium 第二代芯片的成本比英偉達 H100 系列芯片最多可降低 35% 後,將其推理工作負載切換到了 Trainium 的第二代芯片上。不過,Jakimovski 補充説,他仍然建議在英偉達的產品上進行大型語言模型訓練。

亞馬遜首席執行官 Andy Jassy 近日表示,該公司芯片業務如果獨立運營,每年可創造 500 億美元的收入。傑西在最近致股東的信中寫道: “我們的定製芯片業務現在是全球三大數據中心芯片業務之一。”

開發者為何從"別無選擇"走向"主動擁抱"?

英偉達的 GPU 被廣泛認為是 AI 加速器市場的王者,其 CUDA 軟件生態更是構建了一道令競爭對手難以逾越的護城河。然而,正是因為英偉達的地位太過強勢,其產品供應長期處於緊繃狀態——超大規模雲服務商、AI 前沿模型實驗室和其他買家如飢似渴的需求,使英偉達 GPU 長期處於結構性短缺之中。

這種供不應求的局面,催生了市場對替代方案的剛性需求。雖然市場上存在 AMD、谷歌 TPU 及其他定製 ASIC 等替代選項,但 Trainium 正以超出市場預期的速度獲得開發者的實際採用。

軟件生態:從"障礙"到"消除"的質變

Superlinked 首席執行官 Daniel Svonava 對 The Information 的一番話精準概括了這一轉折:"我們一直以來都認為軟件支持不足是一個障礙。但這種情況在過去幾個月裏發生了改變,這個障礙已經消除。"這句話的分量在於:在 AI 芯片的競爭中,硬件參數往往只決定產品的下限,而軟件生態決定了產品的上限。Trainium 在軟件層面實現從"障礙"到"消除"的蜕變,意味着其不再是一個僅供小範圍測試的替代選項,而是具備了規模化商用條件的生產力工具。

成本優勢:新一代"降本增效"武器

Loka 機器學習負責人 Bojan Jakimovski 同樣觀察到 Trainium 的吸引力正在顯著上升,且背後有堅實的經濟邏輯支撐。部分客户之所以轉向 Trainium,直接原因在於英偉達 GPU 的獲取難度;但更重要的是,一位客户在測試發現 Trainium 第二代芯片的成本比英偉達 H100 系列最多可降低 35% 後,果斷將其推理工作負載切換到了 Trainium 上。

在 AI 推理工作負載日益成為算力消耗主力 (目前約佔全部 AI 計算量的三分之二) 的趨勢下,35% 的成本優勢意味着對於一家中等規模的 AI 公司而言,每年可能節省數百萬至數千萬美元的算力支出。這並非零和博弈中的輕微偏移,而是足以改變採購決策的結構性優勢。

技術架構的先發優勢:MoE 推理的獨特護城河

Gavin Baker 的判斷尤為尖鋭且具技術洞察力。他指出,當前主流的前沿 AI 模型均採用混合專家模型 (Mixture of Experts,MoE) 架構,而運行此類模型的推理任務,需要交換式擴展網絡 (Switched Scale-up Network) 的基礎設施。全球目前僅有兩家公司擁有運行中的交換式擴展網絡:一家支撐着英偉達的 GPU 集羣,另一家則驅動着亞馬遜的 Trainium。

這意味着,在 MoE 模型推理這一快速增長的關鍵賽道上,Trainium 並非簡單的追趕者,而是擁有獨特技術壁壘的先發者。Baker 進一步指出,谷歌 TPU 在同一領域並不具備同等能力,並透露谷歌雖然發明了 MLPerf 基準測試,卻從未提交過 TPU 的測試成績。這一細節的透露,無疑強化了市場對 Trainium 技術獨特性的重新評估。Baker 預計,Trainium 3 在今年下半年大規模量產後,Trainium 在 2026 年的市場地位將相當於 TPU 在 2025 年的地位。

客户生態:從"萬級"到"十萬級"的臨界點躍遷

Trainium 的突破不僅體現在技術層面,更體現在客户基礎的規模化驗證上。據亞馬遜在 4 月與 Anthropic 深化戰略合作時的披露,Trainium 與 Graviton 各自均有超過 10 萬家客户,Amazon Bedrock 目前的大部分推理任務均基於 Trainium 運行。10 萬家客户這一數字,標誌着 Trainium 的客户基礎在 2025 年下半年以來發生了從量變到質變的躍遷——它已不再是一個只在少數實驗室中進行測試的小眾產品,而是具備了大規模商用驗證的系統性替代方案。

Anthropic 與 OpenAI:最大的"質量證明"

在關鍵客户層面,Trainium 獲得了兩家全球最重要 AI 模型公司的深度綁定。4 月 20 日,亞馬遜與 Anthropic 宣佈深化戰略合作:亞馬遜在原有基礎上再向 Anthropic 追加投資最高 250 億美元,而 Anthropic 則承諾未來 10 年內將在 AWS 相關技術上投入超過 1000 億美元,並採購最高 5 吉瓦的 AWS 當前及未來幾代 Trainium 芯片算力。Anthropic 的旗艦模型 Claude 運行在超過 100 萬個 Trainium2 芯片上。

OpenAI 的加盟同樣意義深遠。今年 2 月,OpenAI 與亞馬遜建立多年期戰略合作伙伴關係,亞馬遜向其投資 500 億美元,並向 OpenAI 提供 2 吉瓦的 Trainium 算力容量。OpenAI 承諾使用 Trainium 3 及下一代 Trainium 4 芯片,用於支撐其廣泛的先進人工智能工作負載。

對於芯片產品而言,客户質量往往比客户數量更具信號意義。當全球最具技術鑑別能力的 AI 前沿實驗室選擇將核心工作負載運行在 Trainium 上時,這本身就是對芯片性能和生態成熟度最有力的背書。

從"租借算力"到"直銷芯片":500 億美元帝國的藍圖

更值得關注的是 Trainium 商業模式的戰略升維。今年 4 月,亞馬遜 CEO 安迪·賈西在一封致股東的信中披露,公司正在考慮改變以往僅供內部使用的策略,轉而向第三方直接銷售其自研芯片及整機架——若該部門獨立運營並全面對外開放,年化營收規模有望達到 500 億美元。

賈西進一步指出,這一數字已超過 AMD 和英特爾的同期水平,並直言"我們的定製芯片業務現在已是全球三大數據中心芯片業務之一"。這並非紙上談兵。截至披露時,亞馬遜已手握 2250 億美元的 Trainium 芯片收入承諾,涵蓋 Anthropic、OpenAI 等戰略客户。Trainium2 的性價比已高出同類 GPU 產品 30%,且已基本售罄;Trainium3 剛剛在 2026 年開始發貨,性價比較 Trainium2 再提升 30% 至 40%,已幾乎全部被預訂;就連距離大規模供貨還有約 18 個月的 Trainium4,其絕大部分產能也已被鎖定。

兩代產品全部售罄、連尚未大規模量產的下一代芯片也已被大量預訂——這種需求信號在半導體行業歷史上極為罕見。它表明 Trainium 的吸引力並非短期炒作,而是客户在充分評估後做出的長期戰略鎖定。

ASIC 結構性拐點

Trainium 的崛起,正在重塑 AI 芯片領域最深層的產業關係——亞馬遜與英偉達之間長期的"供應商與客户"模式。這一關係原本清晰:英偉達負責設計和製造最強大的 AI 芯片,亞馬遜作為最大的雲服務商之一大規模採購。然而,當亞馬遜開始設計並部署自己的 AI 加速器時,雙方的角色發生了微妙變化。最新數據顯示,亞馬遜目前部署的 Trainium 服務器數量已超過英偉達服務器,且公司估算自研芯片相較採用外購 GPU 可節省數十億美元的資本支出。

但這一關係並非簡單的替代。亞馬遜既沒有放棄採購英偉達芯片——最新簽署的採購承諾仍在擴大——也沒有停止對 Trainium 的重注。兩者目前呈現出一種複雜的"競爭共存"格局:Trainium 在推理工作負載中快速擴大份額,而英偉達 GPU 在訓練大規模基礎模型方面仍佔據主導。

從更宏觀的行業視角來看,定製 ASIC 正在經歷一個結構性拐點。數據顯示,2026 年,來自谷歌、微軟、亞馬遜和 Meta 的定製 AI 芯片正以 44.6% 的複合年增長率高速擴張,而通用 GPU 的複合年增長率僅為 16.1%。定製 ASIC 的增長主要瞄準推理市場——目前推理已佔全部 AI 計算量的約三分之二。雖然英偉達當前仍佔據 AI 加速器市場超過 90% 的份額,但分析師預計到 2028 年,其在推理領域的份額可能從 90% 以上降至 20% 至 30%。

Trainium 是這股定製 ASIC 浪潮中最重要的變量之一。正如行業報告所論斷的:2026 年標誌着"定製 ASIC 不再只是實驗項目,而是成為英偉達 GPU 壟斷的生產力規模替代方案"的時刻。

現實邊界:Trainium 距離"全面替代"還有多遠?

儘管 Trainium 正在經歷顯著的用户增長和性能升級,但在全面評估其市場定位時,必須保持客觀與冷靜。最需要澄清的一點是:對多數前沿 AI 實驗室而言,Trainium 當前更適合推理而非訓練。

Bojan Jakimovski 雖然證實了 Trainium 在推理環節的成本優勢,但他仍表示會建議客户在大型語言模型訓練上繼續使用英偉達的產品。這反映了一個現實:在大規模模型訓練的靈活性、算子生態的完整性以及社區支持的深度方面,英偉達 CUDA 生態建立起的優勢仍然十分顯著。

此外,值得注意的是,Trainium 的火熱需求與亞馬遜股價近期的表現存在一定脱節。儘管 Trainium AI 芯片正吸引越來越多的開發者興趣,但亞馬遜股價表現近期仍然不如其他科技巨頭。市場對於 AI 芯片領域的競爭加劇——英偉達、AMD、谷歌 TPU、微軟 Maia 和 Meta MTIA 同台競技——存在整體性的估值重新定價過程。Gavin Baker 雖然在 Trainium 上持積極立場,但同時也強調 “我永遠不會做空谷歌,也不會做空博通”,表明這是一個多贏市場,而非零和博弈。

此外,所有主流 AI 芯片——無論是定製 ASIC 還是英偉達 GPU——均採用台積電 3nm 工藝製造。這意味着谷歌、微軟、亞馬遜、Meta、英偉達全都在爭奪同一家代工廠的有限產能。產能約束對所有玩家一視同仁,任何一家芯片設計商的快速擴張都可能遭遇物理交付上限的制約。