
AMD reaches a milestone moment! Oracle collaborates with MI300X to build a supercomputing cluster

甲骨文選擇 AMD 的 MI300X AI 加速器為其最新的 OCI 超級計算集羣提供核心人工智能算力支持。這一合作標誌着 AMD 在數據中心 AI GPU 市場的里程碑時刻,可能幫助其逐步擴大市場份額,挑戰英偉達的主導地位。儘管英偉達在 AI 基礎設施領域仍佔據絕對優勢,AMD 通過與甲骨文的合作,正積極參與 AI 基礎設施競爭。
智通財經 APP 獲悉,以雲計算服務和數據庫軟件聞名全球的科技巨頭甲骨文 (ORCL.US) 在近日選擇配備 ROCm 開放軟件生態的 AMD Instinct MI300X AI 加速器——被視為英偉達 H100 以及 H200 AI GPU 的最強大競品,為甲骨文最新的 OCI 計算超級集羣實例提供最核心的人工智能算力硬件支持。攜手甲骨文,對於目前在數據中心 AI GPU 市場份額不到 10% 的 AMD(AMD.US) 來説,堪稱 “里程碑時刻”,意味着 AMD 逐漸融入全球雲計算巨頭圈層,有望不斷搶佔英偉達在 AI GPU 市場的份額。
雲巨頭甲骨文選擇 AMD Instinct MI300X AI 加速器用於其最新的 OCI(Oracle Cloud Infrastructure) 超級計算集羣,這表明 AMD 正在不斷增強其在 AI GPU 市場的影響力,能夠獲得雲巨頭甲骨文的真金白銀認可對於 AMD 而言至關重要,AMD 有機會利用甲骨文在全球雲計算服務市場中的強大影響力,擴大 Instinct MI300X 在數據中心 AI GPU 領域的市場份額。
儘管英偉達憑藉無比強大的 CUDA 軟件生態體系以及高性能 AI GPU 共同鑄造的 “AI 基礎設施領域護城河”, 目前仍在全球數據中心 AI GPU 市場中佔據絕對的主導地位,尤其在 AI 大模型訓練和推理硬件體系中扮演關鍵角色,但這一舉措表明 AMD 正積極參與這場 AI 基礎設施競爭,並通過其 Instinct MI300X AI 加速器 +ROCm 軟件加速生態系統來挑戰英偉達在 AI GPU 領域的霸主地位。
據瞭解,Oracle Cloud Infrastructure (OCI) Supercluster 是甲骨文所打造出的雲計算超級算力集羣,提供高性能的 AI 基礎設施,所提供的強大 AI 算力資源用於一站式訓練、調整和部署生成式 AI 大模型以及高效率部署與運作類似 ChatGPT 的生成式 AI 應用程序。
根據最新消息,甲骨文最新的 OCI 超級算力集羣配備 AMD MI300X AI 加速器作為最核心的 AI 算力硬件,通過結合 OCI 上其他加速器設備共同使用的甲骨文極速網絡結構技術,在單個集羣系統中最多支持 16,384 個高性能 GPU。
甲骨文的這些 OCI 裸機實例旨在運行性能要求極度苛刻的人工智能工作負載,包括需要高吞吐量、領先行業的內存容量和帶寬的大型語言模型推理和訓練並行化繁重計算工作負載。據瞭解,Fireworks AI 等眾多知名科技公司已經實際採用了這些 OCI 裸機實例。
通過與甲骨文合作,AMD 在 AI 數據中心的份額有望迅速提升
隨着大型雲計算服務商開始尋找英偉達昂貴且供不應求的 H100/H200 替代品,以及 AMD 通過提供更好的軟硬件協同體系支持開始在 AI GPU 取得一些進展,AMD MI300X 現在也成為 AI 領域的熱門基礎硬件。
AMD 重磅打造的 MI300X 這一款 AI 加速器在內存帶寬和容量方面相比於英偉達 Hopper 架構 AI GPU 具有強大優勢,尤其適用於對於 AI 並行化算力負載要求較高的生成式 AI 模型訓練和推理任務。甲骨文的最新選擇表明,AMD 在硬件設計和 AI 相關的軟件生態支持上,特別是高性能計算和 AI 工作負載所需的軟硬件協同體系方面,已經具備強大的競爭力。
毫無疑問,與甲骨文之間的合作有助於全面擴大 AMD 旗下 MI300X AI 加速器在數據中心 GPU 市場的份額,大幅提高其客户在並行化計算密集型企業計算工作負載中的效率。
英偉達在硬件架構、並行計算、和 AI 訓練/推理所需的軟件加速生態方面的深厚積累,使其至少在近幾年仍然牢牢佔據數據中心 AI GPU 主導地位。企業們在大規模 AI 基礎設施搭建過程中,往往高度依賴紮根於全球 AI 開發多年的 CUDA 加速軟件生態以及與 CUDA 配套協同使用的英偉達高性能 AI GPU。但是近期不少分析師認為,如果 AMD 能夠繼續改進其 ROCm 軟件生態,並加快其對主流 AI 開發者環境的支持,可能會進一步侵蝕英偉達在數據中心 AI GPU 市場的份額。
通過 AMD 前段時間對於 AI GPU 的宏偉藍圖,足以看出 AMD 對於未來佔據數據中心 AI GPU 市場更多份額可謂非常具有信心。根據首席執行官蘇姿豐 (Lisa Su) 在台灣 Computex 會議所展示的 AI 藍圖,AMD 應用於 AI 數據中心服務器的 AMD M300X AI 芯片升級版本——MI325X 將於第四季度開始上市銷售,AMD 更加先進的 MI350 系列則將在 2025 年推出,而 MI400 系列將在一年後推出。AMD 大約每年一次的發佈週期與英偉達首席執行官黃仁勳所提出的一年一次 AI GPU 新品發佈的計劃全面對標。
蘇姿豐指出,MI325X AI 性能提升幅度為 AMD 史上最大幅度,相較競品英偉達 H200 將有 1.3 倍以上提升。具體來看,AMD MI325X 峯值理論 FP16 是 H200 的 1.3 倍左右,1.3 倍於 H200 的內存帶寬,基於每台服務器的模型大小是 H200 的 2 倍。
全球知名戰略諮詢公司貝恩預測,隨着人工智能 (AI) 技術的迅速普及顛覆了企業和經濟,人工智能相關的所有市場規模正在膨脹,到 2027 年將達到 9900 億美元。這家諮詢公司在週三發佈的第五份年度《全球技術報告》中指出,包括人工智能相關服務和基礎硬件在內的整體市場將在去年 1850 億美元的基礎上,每年增長 40% 至 55%。這意味着,到 2027 年將帶來 7800 億至 9900 億美元的收入。
