
Dojo 超算排名第 4!意味着什麼?

新能源鯰魚會把 GPU 價格打下來麼?看看大摩如何給特斯拉的雲服務做市場定位
近日,有外媒報道特斯拉在奧斯汀總部旁正在新建一處建築,未來將容納其部分 Dojo 超級計算機。 根據 State of AI 統計,特斯拉的超級計算機擁有的 A100 GPU 數量在今年一季度排名第 4,實際上特斯拉已經運營着世界上最大的 GPU 集羣之一。
今年 4 月,馬斯克就曾表示:“ Dojo 還有潛力成為一項可出售的服務,我們將以與亞馬遜雲服務類似的方式向其他公司提供,儘管它最初是一家書店。所以我真的認為, Dojo 的潛力非常巨大”。

值得參考的對象是英偉達 DGX Cloud。英偉達自 2023 年 3 月發佈的 DGX Cloud,月租 3.69 萬美元起,包括 8 個 H100 或 A100,該服務也是微軟 Azure 的兩倍,後者包括 96 個 CPU,每月 2 萬美元。
摩根士丹利指出 Dojo 的雲服務能力是特斯拉的長期賭注和潛力,當前優先級最高的自然還是自動駕駛,特斯拉也很難錯過這波 AI 計算浪潮的紅利。在芯片領域,英偉達統治了 GPU,而高通主導了移動芯片,而特斯拉更有可能成為最好的視覺訓練領域參與者之一。

在 7 月,馬斯克告訴投資者,特斯拉計劃在 2024 年底之前投資遠超 10 億美元來開發 Dojo ,這台超級計算機首次在今年夏天在特斯拉 Palo Alto 數據中心中使用,它基於特斯拉內部設計的芯片,以減輕特斯拉對英偉達的依賴。

Forrester 的半導體研究員 Glenn O’Donnell 表示:“所有試圖做這件事的人都抱怨他們無法獲得足夠多的這些芯片。” 這也是特斯拉受到激勵設計自己的 AI 芯片 D1 的一個重要原因。
根據外媒 9 月報道,特斯拉已經將其向中國台灣半導體制造公司台積電訂購的 D1 芯片數量翻了一番,這些芯片是為特斯拉制造的,成本節約也是特斯拉決定設計自己的芯片的另一個重要因素。
摩根士丹利預計,通過設計自己的芯片而不依賴英偉達,特斯拉未來幾年可以節省 65 億美元。
像特斯拉一樣開發自家芯片以擺脱英偉達供應短缺以及成本問題的公司不止一家。根據摩根士丹利亞洲半導體團隊估計,到 2027 年,AI 芯片有望佔到市場份額的 30%,這取決於 AI 計算需求的規模,以及對供應商多樣化的需求,鑑於英偉達的議價能力。

定製 AI 芯片在 2024 年將達到 62 億美元市場,特斯拉的 Dojo 和 FSD 組合將佔據其中的 12 億美元,以下是摩根士丹利盤點的各家定製 AI 芯片情況:
谷歌:自 2016 年首次宣佈其第一代 TPU 以來,現在已經推出了第四代,谷歌正在通過 Broadcom 設計服務進行開發,Google TPU 聲稱與當代 ML DSA 相比,能效提高了 2~3 倍,相對性能也比上一代提高了 3 倍以上。
亞馬遜:AWS 早在 2018 年就開始了其芯片戰略,AWS 表示第一代 Inferentia 芯片的吞吐量高達 2.3 倍,每個推斷的成本降低了 70%,與可比較的 Amazon EC2 相比,其第二代使用台積電 7nm 工藝製造的芯片,吞吐量是第一代 Inferentia 芯片的 4 倍,延遲降低了 10 倍。
微軟:自 2019 年以來,微軟一直在開發自己的 AI 芯片叫做為 Athena,該芯片基於台積電 5nm 工藝,預計在明年某個時候發佈。
Meta:Meta 在今年宣佈了第一代 AI 推理加速器 MTIA v1,這款 AI 芯片基於台積電 7nm 工藝,每瓦特性能提高 2 倍,計劃明年推出。
根據摩根士丹利中國台灣半導體分析師 Charlie Chan 説法,半導體設計公司 Alchip 預計今年 Dojo 芯片產量將達到 4~5 萬,而相比之下英偉達今年出貨量在 20~25 萬個 H100 芯片。
成本方面,摩根士丹利分析師 Jonas 也提到 D1 芯片將使特斯拉更多地控制其用於運行 AI 軟件的能源消耗,且能夠比使用英偉達芯片更快地處理視頻數據。根據特斯拉預計,Dojo 將使特斯拉能夠在 1 周內訓練完全自動駕駛的工作負載,而以前需要 1 個月。

與當前的替代方案相比,特斯拉預計 Dojo 在性能方面將提供 4 倍提升,在性能/瓦特方面將提供 1.3 倍的提升,並且在佔地面積方面將縮小 5.0 倍;換句話説,特斯拉可以在 4 個 Dojo 機櫃上實現與使用 4000 個 GPU 相同的吞吐量。此外,通過使用較少的系統,而不是當前的 A100 集羣,超級計算機可以更有效地冷卻。
根據 2023 年 6 月馬斯克的推文,Dojo V1 已經針對大量的視頻訓練進行了高度優化,而 Dojo V2 將整合 V1 目前面臨的任何通用 AI 限制;特斯拉認為,下一代 V2 的開發和實施可以實現高達 10 倍的性能提升,從而使公司能夠在 2024 年第四季度達到 100 exaFLOP。
摩根士丹利還表示,特斯拉可以使用 Dojo 來運行其正在開發的 Optimus 人形機器人背後的軟件,他推測其他馬斯克的公司,如 X 和 SpaceX ,也可以從 Dojo 購買服務。

風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
