
Computing Power Crisis! SemiAnalysis In-depth Analysis: From GPUs to Memory to Fiber Optics, the AI Supply Chain is Strained Across the Board with Prices Rising in Tandem
SemiAnalysis 指出,需求爆發推動算力告急,內存、GPU 到 AI 服務器價格飆升且有價無市,H100 GPU 年租價五個月內飆升 40%。該機構認為,GPU 租賃價格短期內大概率繼續上漲。Neocloud 開始掌握議價主動權,但 CoreWeave、IREN 等相關公司股價卻尚未反映這一變化。
AI 算力需求的爆炸式增長正將整個供應鏈推向極限。從 GPU 租賃到 DRAM 內存,從光纖電纜到數據中心託管,價格在短短數月內全線飆升,而供給卻幾乎無處可尋。
據研究機構 SemiAnalysis 最新報告,H100 GPU 一年期租約合同價格已從 2025 年 10 月的低點每小時每 GPU 1.70 美元急升至 2026 年 3 月的 2.35 美元,漲幅接近 40%。與此同時,按需算力已在所有 GPU 型號上全線售罄。

此輪算力短缺的核心驅動力來自需求端的結構性躍升。Anthropic 的年度經常性收入(ARR)在單季度內從 90 億美元飆升至超過 250 億美元,Claude Code 等多智能體工作負載正在推動算力消耗呈拋物線式增長。
SemiAnalysis 認為,GPU 租賃價格短期內大概率繼續上漲。Neocloud 開始掌握議價主動權,但 CoreWeave、Nebius、IREN 等相關公司股價卻沒有反映出這一變化。
需求端:多點爆發,算力消耗呈拋物線式增長
本輪算力短缺的需求側動能來自多個相互疊加的方向。
Claude Code 的爆發是最顯著的拐點。Anthropic 的 ARR 在一個季度內從 90 億美元暴漲至超過 250 億美元,三倍於前。GLM、Kimi K2.5 等開源模型的走紅進一步拉動了推理工作負載的規模。

與此同時,Anthropic、OpenAI 等 AI 實驗室的大規模融資本身也直接創造了 GPU 需求。
AI 代理是另一重要推手。這類工作負載以高併發方式執行多步驟工作流、持續迭代,導致算力消耗呈拋物線式上升。
原生媒體生成平台 Seedance 和 Nano Banana 推動了圖像與視頻生成場景下的海量算力需求。
從經濟學角度看,這一需求具備相當的價格不彈性。SemiAnalysis 指出,如果 AI 工具的投資回報率達到 5 至 10 倍,GPU 租賃價格還有相當大的上升空間才會抑制需求。
"需求曲線向右上方移動,提供了一種強勁且相對缺乏彈性的力量,推動 GPU 租賃價格上漲。"
供給端:內存價格暴漲,服務器採購陷入混亂
需求爆發只是算力短缺的一面,供給端價格暴漲是另外一面。
2026 年 1 月成為另一個關鍵拐點。彼時 DRAM 和 NAND 內存價格上漲加速。據 SemiAnalysis 內存模型估算,LPDDR5 和 DDR5 合同價格在 2026 年第一季度的同比漲幅分別趨向約 4 倍和 5 倍。
內存價格的暴漲迅速傳導至服務器整機端。原始設備製造商(OEM)對 AI 服務器重新定價,但其漲幅顯著超出元器件成本的實際上升幅度。
更高的服務器採購成本壓縮了項目預期回報,迫使部分運營商放緩甚至擱置新部署計劃。換言之,原本將進入市場的供給被迫滯後,進一步收緊了租賃市場。
Blackwell 新一代 GPU 的供給狀況同樣不容樂觀。據 SemiAnalysis 瞭解,Blackwell 新集羣的部署交期目前已延伸至 2026 年 6 至 7 月,開源權重模型的強勁需求和持續的推理算力短缺是主因。
市場結構:Neocloud 掌握議價主動權,合約條款全面收緊
GPU 租賃市場的權力格局在六個月內發生了根本性轉變。
在 2025 年下半年之前,市場競爭激烈,多家 Neocloud 爭相壓價,以確保資產利用率。
而如今,Neocloud 和超大規模雲廠商(Hyperscaler)已完全掌握主動——他們不僅可以爭取更高的預付款比例、更優的定價和更長的合約期限,還可以根據自身庫存情況靈活安排合約起止時間。
GPU 租賃市場可分為三個主要層級:
短期租賃(按需、現貨及 3 個月以下合約):通常為剩餘產能,當前此類容量已全線售罄,持有者即便面臨價格大幅上漲也不願將容量歸還市場。
中期合約(3 個月至 3 年以上):市場成交最為活躍的區間。其中一年期合約能夠捕捉非 AI 實驗室客户的邊際需求,是反映市場緊張程度的最敏感指標。
長期大宗協議(4 至 5 年):主要由大型 AI 實驗室主導,單筆交易規模通常達到 50 至 100 兆瓦甚至更大,相當於約 24,000 至 48,000 塊 GB300 NVL72 GPU。
這類交易對 Neocloud 而言極具吸引力——憑藉長期合約可安排有利的債務融資,鎖定兩位數的項目內部收益率(IRR),同時規避 GPU 價格風險。超大規模雲廠商有時會在此類交易中充當擔保方,進一步降低融資成本。
價格展望:自我強化的螺旋,Neocloud 估值卻遭低估
SemiAnalysis 認為,GPU 租賃價格短期內繼續上漲的可能性遠大於下跌。
當前動態具有明顯的自我強化特徵:供給收緊推動價格上漲,價格上漲促使 Neocloud 加速鎖定硬件,進一步收緊供給,價格隨之再次上漲。
SemiAnalysis 將此與 2023 至 2024 年的 GPU 短缺週期相提並論,但認為此次服務器市場已足夠成熟,OEM 獲取超額利潤的空間可能受限。
租價上漲對 Neocloud 的財務影響是雙重的:一方面,已部署資本的利潤率得以擴張,改善投資資本回報率(ROIC);另一方面,更高的租賃價格延長了現有 GPU 的經濟使用壽命,使既有資產在需要再投資之前能夠產生更長時間的現金流。
在當前環境下,SemiAnalysis 認為受益最為明顯的 Neocloud 具備以下特徵:合約期限較短(可更快重新定價)、擁有大規模 H100 存量、以及近期有新增產能上線。
然而,這一基本面改善與公開市場情緒之間存在顯著背離。CoreWeave、Nebius、IREN 等 Neocloud 上市公司的股價目前仍處於過去 6 至 12 個月交易區間的低位。
SemiAnalysis 指出,市場仍受"最終供給過剩與商品化"敍事主導,尚未充分反映地面上清晰可見的持續稀缺與定價能力。
三大觀察指標:決定價格趨勢的關鍵變量
SemiAnalysis 列出了判斷 GPU 租賃價格能否持續高位的三項核心觀察指標。
其一,GB300 集羣的放量節奏。新增算力容量能否緩解當前的算力短缺,還是算力消耗增速將繼續超越新增供給——這將決定 AI 實驗室參與 4 年以下合約市場的程度,進而左右該區間的定價走勢。
其二,硅片短缺的惡化程度。SemiAnalysis 在此前報告中已指出台積電 N3 製程邏輯晶圓產能以及 HBM、DRAM、NAND 存儲器的供應緊張狀況,複雜的製造流程意味着執行風險隨時存在。
其三,AI 實驗室 ARR 的增長軌跡。用户採納速度的快慢以及 token 消耗的持續增長,是決定整體需求曲線斜率的根本變量。
綜合來看,SemiAnalysis 的結論清晰:在上述三項指標出現明顯轉向之前,算力價格的方向只有一個——向上。
