Does "lobster" significantly extend the "memory" lifespan?

華爾街見聞
2026.03.19 09:02

摩根士丹利報告認為,以 OpenClaw 為代表的智能體 AI 將需求從 “生成答案” 轉向 “完成任務”,工作流中頻繁的工具調用與多步編排使 CPU 計算量猛增,貢獻了主要延遲。同時,由於需頻繁共享上下文與卸載 KV 緩存,DRAM 取代 HBM 成為硬約束瓶頸。這移觸發 2026 年 Q2 內存價格暴漲,大摩上調 SK 海力士與三星的盈利預期。

以 OpenClaw 為代表的智能體 AI(Agentic AI)工具,正在將內存市場的需求邏輯推向一個全新範式。據追風交易台消息,摩根士丹利 3 月 18 日發佈的最新報告指出:AI 從"思考"跨入"執行",將令 DRAM 取代 HBM 成為 AI 基礎設施中最難突破的芯片瓶頸,內存週期由此迎來遠超預期的生命延續。

渠道調查顯示,2026 年第二季度服務器 DRAM DDR5 價格預計環比上漲逾 50%,部分中國超大規模雲廠商出價更高;DDR4 合同價格漲幅預計達 40%-50%,NAND 企業級 SSD 報價漲幅料不低於 40%-50%。摩根士丹利認為,當前處於內存上行週期中段,且供應收緊程度超出此前判斷——"華爾街的盈利預測將不得不追趕現實"。

上述判斷已直接體現在目標價調整中:SK 海力士 2026-2027 年 EPS 預測分別上調 24% 及 32%,目標價從 110 萬韓元升至 130 萬韓元,較當前價格隱含 43% 上行空間;三星電子普通股目標價升至 25.1 萬韓元,兩隻股票均維持"增持"評級。

摩根士丹利的核心判斷是:市場習慣於線性思維,而 AI 智能層的能力擴張正以指數級速度推進——當 AI 從"生成答案"轉型為"完成任務",內存需求的量級將隨之躍變,而這場轉變,才剛剛開始提速。

"做事"比"想事"更耗內存

摩根士丹利報告的邏輯起點,是一句看似簡單卻藴含深意的判斷:"做事比想事需要更多 DRAM。"

傳統大語言模型(LLM)的工作模式是 GPU 主導的線性流程:接收提問、批量處理所有輸入 Token(預填充階段),再逐 Token 生成答覆(解碼階段),CPU 負責將結果轉換為文本輸出。在這一流程中,GPU 算力是決定性瓶頸,DRAM 只需配合完成緩存讀寫即可。

智能體 AI 的出現徹底改變了這一邏輯。以 OpenClaw 為例,這款開源自託管 AI 助手可同時接入 WhatsApp、Telegram、Slack、Signal 等逾 50 個消息平台,並擁有瀏覽器自動化、文件操作、命令行執行、API 調用等系統級權限。它不是"回答問題",而是"完成任務"——搜索網絡、讀取文檔、調用外部工具、執行代碼,最終輸出一套經多步驟協作生成的行動結果。

這一範式轉變的核心技術含義在於:工作流從單次 GPU 推理擴展為多步驟的協調、工具調用與編排流程,CPU 的計算時間對整體延遲的貢獻往往超過 GPU。與此同時,多智能體之間須持續共享上下文、卸載 KV 緩存(Key-Value Cache)、存儲和檢索每個中間步驟的結果——內存從算力鏈條的後端,躍升至核心瓶頸位置。

OpenClaw:內存需求的極端放大鏡

摩根士丹利對 OpenClaw 的內存需求進行了詳細量化分析,結論是:在這類智能體工具中,DRAM 壓倒一切,其他硬件約束均退居次位。

該工具有兩種截然不同的運行模式:

輕量網關模式(遠程調用 Claude 或 GPT-4 等外部 API):即便如此,瓶頸已不在 GPU 或 CPU,而在於 Node.js 運行時對 DRAM 的佔用。實際使用最低需要 2GB DRAM,生產級穩定運行建議配置 4GB。

本地模型模式(直接在設備上加載運行 AI 模型):DRAM 與圖形 HBM 成為雙重約束。摩根士丹利建議配置 32GB 系統 DRAM;運行 70 億至 80 億參數模型需額外 8GB 圖形 DRAM,130 億至 700 億參數模型需 16-24GB,Llama 3 70B、Qwen 72B 等超大模型則需 80GB 以上。

報告特別指出:內存不足的後果並非性能下降,而是直接崩潰——JavaScript 將拋出"heap out of memory"(堆內存溢出)錯誤,導致安裝失敗和運行中斷。這一細節深刻揭示了內存在智能體場景下的硬約束屬性:內存不足不是慢,而是 “死”。

算力瓶頸遷移:從 HBM 到系統內存

OpenClaw 的內存需求特徵,是更大範圍結構性轉變的縮影。

摩根士丹利指出,AI 算力瓶頸正在發生系統性遷移:從算力本身轉向數據移動,從 HBM 轉向系統內存(DRAM),整個內存層級架構正從以 HBM 為中心演變為 HBM、DRAM 與 NVMe NAND SSD 相結合的多層結構。

這一轉變的技術推手之一,是長上下文(long context)需求的快速膨脹。KV 緩存以線性方式隨 Token 數量增長,且在分散式推理(prefill-decode disaggregation)場景下須通過網絡傳輸,大幅增加了 CPU 的 I/O 管理負擔。RAG 檢索、上下文管理等智能體核心操作,均涉及密集內存 I/O。

市場層面的印證同樣清晰。據摩根士丹利,Intel 與 AMD 近期均確認,高核心數服務器處理器已出現實質性供不應求;AMD EPYC CPU 營收佔服務器 CPU 總收入的比例首次超過 40%,搭載 EPYC 的雲實例部署 YoY 增長逾 50%。英偉達推出獨立銷售的 Vera CPU,並與 Meta 達成多年期協議,首次在大規模場景下部署獨立 CPU 以支持個人智能體運營。

價格加速:週期中段,空間猶存

上述結構性轉變在價格層面已出現實質性體現。

DRAM 方面,2026 年二季度服務器 DDR5 價格已有限量現貨交易以環比 +50% 成交,超大規模雲廠商已接受該價格,部分中國雲廠商出價更高。2 月底,64GB RDIMM 合同價已升至 910-920 美元,較一季度均價 800 美元高出約 20%。LPDDR 及消費電子相關 DRAM 二季度報價漲幅預計至少 40%-50%;DDR4 合同價預計上漲 40%-50%。此前預期降價 20%-25% 的 HBM3E,在 ASIC 客户續約中已轉為上漲中個位數百分比。

NAND 方面,企業級 SSD 二季度定價預計環比漲 40%-50%,消費端產品漲幅預計不低於 60%,部分情景下 eSSD 價格可能在二季度再度翻倍。

摩根士丹利認為,YoY 價格加速態勢持續,當前仍處上行週期中段。一旦市場將盈利預測調整至反映當前空前產能約束的水平,相關標的存在顯著修復空間;資本回報的潛在上調,可能進一步支撐超額表現。