AMD 公佈 AI 路線圖:MI325X 將比 H200 快 1.3 倍!還有全新 AI PC 芯片!

華爾街見聞
2024.06.03 05:14
portai
I'm PortAI, I can summarize articles.

AMD 在 Computex 2024 展會上公佈了全新的 AI 路線圖,將推出 MI325X 和 Strix Point 系列芯片。MI325X 的 AI 性能將比英偉達 H200 提升 1.3 倍,將於今年第四季度開始供貨。另外,AMD 還計劃在 2025 年推出 MI350 系列,該系列芯片將具有更快的推理運算速度。這些新芯片將帶來更高的性能和更好的性價比。

6 月 3 日,AMD 董事長兼 CEO 蘇姿豐在 Computex 2024 展會的開幕主題演講中,公佈了全新雲端 AI 加速芯片路線圖,今年將會推出全新 Instinct MI325X。同時,AMD 還發布了代號為 “Strix Point” 的第三代 AI PC 芯片 “鋭龍 AI 300 系列”,以及 AMD Ryzen 9000 系列桌面處理器(Granite Ridge)。

今年將推出 MI325X,性能相比英偉達 H200 提升 1.3 倍

根據 AMD 公佈的全新雲端 AI 加速芯片路線圖顯示,AMD 今年將會推出全新的 AI 加速芯片 Instinct MI325X,2025 年推出 MI350,2026 年推出 MI400。

據介紹,MI325X 將延續 CDNA3 構架,採用第四代高帶寬內存 (HBM) HBM3E,容量大幅提升至 288GB,內存帶寬也將提升至 6TB/s,整體的性能將進一步提升,其他方面的規格則基本保持與 MI300X 一致,便於客户的產品升級過渡。

蘇姿豐指出,MI325X 的 AI 性能提升幅度為 AMD 史上最大,相較競品英偉達 H200 將有 1.3 倍以上的提升,同時更有性價比優勢,MI325X 將於今年第四季度開始供貨。

另外,AMD 還將在 2025 年推出新一代的 MI350 系列,該系列芯片將採用 3nm 製程,基於全新的構架,集成 288GB HBM3E 內存,並支持 FP4/FP6 數據格式,推理運算速度較現有 MI300 系列芯片快 35 倍。

據供應鏈信息透露,MI350 將進入液冷世代,為 AI 服務器運算提供更強的算力、更佳的能源效率。

2026 年,AMD 還將會推出新一代的 MI400 系列,保持一年一更新的節奏。

AMD 鋭龍 AI 300 系列發佈:AI 算力高達 50TOPS!

早在 2023 年初,AMD 就發佈了鋭龍 7040 系列 (代號 Pheonix) 的全球首款集成獨立 NPU AI 引擎的 x86 處理器,基於全新設計的 XDNA 架構,算力約 10TOPS(每秒 10 萬億次浮點運算),加上 CPU、GPU 整體算力約 33TOPS,開創了 AI PC 的新時代。

2023 年底,AMD 又推出了鋭龍 8040 系列 (代號 Hawk Point),NPU AI 算力一舉提升了 60%,達到約 16TOPS,整體算力也提升至 39TOPS。

而最新的代號為 Strix Point 的 “鋭龍 AI 300 系列”,則採用了全新的 Zen5 PU 架構,GPU 內核也升級為了 RDNA3.5 架構,NPU 也是全新的 XDNA2 架構,號稱是 “面向下代 AI PC/Copilot+ PC 的世界一流處理器”。

鋭龍 AI 300 系列首發只有兩款型號,“鋭龍 AI 9 HX 370” 和 “鋭龍 AI 9 HX 365” 都定位高端市場。

其中,“鋭龍 AI 9 HX 370” 是頂級旗艦,CPU 部分擁有 12 核心 24 線程,多年來首次在這一定位上提供更多核心,相比鋭龍 8040 系列增加了多達 1/3。二級緩存還是每核心 1MB,總容量自然增加到 12MB。三級緩存終於打破了 16MB 的 “禁錮”,增加了足足一半來到 24MB。最高主頻 5.1GHz。GPU 部分不但升級架構,CU 單元數量也從 12 個增至 16 個,命名為 “Radeon 890M”。NPU 算力則提升到了 50TOPS,增加了 2 倍有餘。

“鋭龍 AI 9 365” 也是高端型號,10 核心 20 線程,二級緩存 10MB,三級緩存仍為 24MB,最高頻率達 5.0GHz,NPU 算力也是 50TOPS,GPU 部分也是 Radeon 890M。

從 AMD 第一和第二代 XDNA NPU 架構的對比圖中,可以看到整體佈局基本一致,但規模大大擴充。

AI Tile(初代叫 AIE Tile) 也就是核心的 AI 計算引擎模塊,從之前的 20 個增加到 32 個,再加上本身的增強。

Mem Tile 也就是本地內存模塊,從原來的 5 個增加到 8 個,可以更好地配合更大規模的本地調度、運算。

另外,用於互連的交叉總線也從普通的 Data Fabric,升級為 Zen/RDNA 家族上無處不在的 Infinity Fabric,傳輸帶寬和效率更高。

AMD 聲稱,XDNA2 NPU 的計算能力提升了多達 5 倍,多任務並行能力翻了一番,能效也提升了最多 2 倍。

需要指出的是,這裏説的 AI 算力提升 5 倍,是指的 Llama 2 70 億參數大模型的響應速度,從啓動到獲得第一個 token,鋭龍 AI 9 HX 370 達到了鋭龍 9 8940HS 的多達 5 倍。

另外非常關鍵的一點,XDNA2 首發引入了全新的 Block FP16 浮點精度,也就是 BFloat16、BF16。它在 CPU、GPU 上已經很常見,而在 NPU 上還是第一次。

傳統的 FP8 浮點格式性能高而精度不足,FP16 浮點格式精度高而性能略遜,而將二者融合起來的 BF16 可以在精度、性能上達到較好的平衡,靈活性也更高。

同時,大多數 AI 應用都採用了 16 位精度,因此有了 BF16,不再需要量化為 8 位精度,減少了轉換步驟,提高了執行效率。

高通驍龍 X Elite NPU 的算力為 45TOPS,Intel 即將推出的下一代酷睿 Ultra Lunar Lake NPU 算力同樣是 45TOPS,鋭龍 AI 300 系列則一舉超越二者,成為當今最強 NPU。

至於蘋果 M4,其 NPU 的算力只有區區 38TOPS,還不到 Windows 陣營這邊 Copilot+ PC 的最低算力需求門檻 40TOPS。

隨着算力的大幅提升,NPU 的應用也將不再侷限於一些持續性低負載場景 (比如視頻會議),而是有了更多可能,一方面可以在更多場景中部分取代 CPU、GPU,以更高的能效執行 AI 運算,大大提升筆記本的續航能力。

另一方面,更強力的 NPU 配合更強力的 CPU、GPU,可以在更多場景中部署端側 AI,進一步擺脱對雲側的依賴,最大好處就是可以避免隱私泄露和安全威脅。

當然,硬件算力再強,也需要生態應用的落地配合。作為 AI PC 的先行者,AMD 2024 年內的 ISV 合作廠商將超過 150 家,既有 Adobe、微軟、Topaz Labs 這樣的世界級大廠,也有百川智能、釘釘、、無問芯穹、有道這樣的國內名企,前途不可限量。

新一代 AI PC 的最大亮點就是配合最新的 Windows 系統,可以打造全新的 Copilot+ 體驗,比如歷史回憶、視頻會議實時錄製與翻譯、協同創作等。

官方提供的數據顯示,鋭龍 AI 9 HX 370 對比高通驍龍 X Elite,日常辦公、生產力創作、多任務、圖形等各方面都遙遙領先,尤其是圖形計算性能高出了 73%。

對比英特爾目前最強的酷睿 Ultra 9 185H,無論是日常應用還是遊戲,都有着大幅的提升,平均性能提升 36%。就看英特爾下一代 Lunar Lake 的表現了。

對比蘋果 M3,鋭龍 AI 9 HX 370 在各方面也都有着很大的性能優勢,特別是在 3D 性能上,超出了 98%。

鋭龍 AI 300 系列的筆記本將從 7 月份起陸續上市,目前已有 100 多款設計,涵蓋宏碁、華碩、戴爾、惠普、聯想、微星等各大主要 OEM 品牌。

華碩會在台北電腦展上宣佈一系列配備鋭龍 AI 300 系列處理器的筆記本,其中輕薄本有 16 英寸的靈耀 (Zenbook S)、14/15/16 英寸的無畏 (Vivobook S),創作本有 16 和 13 英寸的 ProArt P16/X13,遊戲本有 16 英寸的 ROG 幻系列、14/16 英寸的天選系列 (TUF GAMING A14/A16)。

微星首批三款,都是 16 寸大屏機型,包括面向高端商務辦公的 Summit A16 AI+,輕薄全能遊戲型的絕影 A16 AI+、主打超薄商務與創作的尊爵 A16 AI+。

AMD Zen5 Ryzen 9000 系列發佈:性能比 i9-14900K 快 56%

全新發布的 AMD Ryzen 9000 系列桌面處理器(Granite Ridge),基於 Zen5 構架,第一批產品將於 2024 年 7 月推出。

蘇姿豐強調,Ryzen 9000 系列是繼 Ryzen 7000“Raphael” 和 Ryzen 8000“Hawk Point” 系列之後,AM5 插槽的第三個系列,將配備兩個 Zen5 小芯片,每個小芯片最多有 8 個核心,最高 16 個內核和 32 線程,與 Ryzen 7000 系列類似。AMD 還繼續支持 SMT(同時多線程功能)。

AMD 首批推出了四款 CPU 產品,都配有 2CU RDNA2 集顯:

Ryzen 9 9950X 配備 16 核心 32 線程,170W TDP,最高主頻 5.7 GHz;

Ryzen 9 9900X 配備 12 核心 24 線程,120W TDP,最高主頻 5.6 GHz;

Ryzen 7 9700X 配備 8 核心 16 線程,65W TDP,最高主頻 5.5 GHz;

Ryzen 5 9600X 配備 6 核心 12 線程,65W TDP,最高主頻 5.4 GHz。

根據 AMD 官方測試,其 Zen 5 內核面向 PC 平台的 IPC 性能相比 Zen 4 平均提升了約 16%。

與英特爾 Core i9-14900K 相比,AMD 旗艦 16 核心 Ryzen 9 9950X 在遊戲性能測試中的速度快 4% 到 23%。在生產力性能測試中,9950X 顯示出更大的優勢,比英特爾 Core i9-14900K 快 7% 至 56%。

AMD 宣佈 Ryzen 9000 系列將於 7 月 31 日推出,具體定價細節將很快將會公佈。