馬斯克自曝加倍投入超級電腦Dojo 持續研發挑戰輝達

2024-08-07

特斯拉 (TSLA-US) 執行長馬斯克近來表示，為配合即將在 10 月揭曉的 Robotaxi 計畫，該公司將對超級電腦 Dojo「加倍投入」。儘管專為訓練全自動駕駛 (FSD) 的 Dojo 未來仍充滿挑戰，但它的成功將大幅推動特斯拉在自駕跟 AI 領域的進步。

xAI 耗時 19 天打造由 10 萬顆輝達 (NVDA-US) H100 晶片集群來訓練 Grok-3，而在訓練 FSD、Optimus 機器人方面，馬斯克同樣不惜重金，投入大量的運算資源。

摩根士丹利去年 9 月曾出具研究報告預測，Dojo 可透過 Robotaxi 和軟體服務等形式釋放新的收入來源，為特斯拉的市值增加 5000 億美元。

馬斯克周日 (4 日) 在前往德州超級工廠參觀特斯拉超級電腦集群後表示，這將是一個擁有約 10 萬個 H100/H200 GPU 晶片，並配備大規模記憶體的系統，用於 FSD 和 Optimus 機器人的影片訓練。

不僅如此，除了輝達 GPU，這個超級電腦集群還配備特斯拉 HW4、AI5、Dojo 系統。它們將由一個高達 500 兆瓦的大型系統提供電力和冷卻。

上月中旬左右，有網友稱今年底特斯拉將擁有 AI 訓練算力，等價於 9 萬塊 H100 的性能。馬斯克當時回應稱，到今年底，Dojo 1 將擁有大約 8000 個相當於 H100 算力。規模不算大，但也不算小。

事實上，馬斯克去年 6 月曾透露 Dojo 已經上線並運作幾個月，此話也暗示 Dojo 已投入到一些任務的訓練中。

特斯拉之所以需要 Dojo，是因為特斯拉電動車採取的是「全視覺」路徑，僅依靠相機捕捉視覺數據，輔以高清地圖進行定位，再使用神經網路處理數據以進行自動駕駛的快速決策。

曾在特斯拉擔任 AI 負責人的 Andrej Karpathy 表示，實現 FSD 基本是在「從頭開始構建一種人造動物」。

幸運的是，特斯拉幾乎不太需要擔心數據不夠的問題。目前約有 180 萬人為 FSD 訂閱用戶，這意味著特斯拉能收集到數百萬英里的駕駛影像用於訓練。

然而，一些產業專家表示，將更多數據輸入模型並期望其變得更加智慧的蠻力方法恐有侷限性。

普渡大學矽谷電氣與計算機工程教授 Anand Raghunathan 指出，首先，存在經濟約束且很快這樣做的成本會變得太高。此外，更多數據不一定意味著更多的資訊，因此取決於這些數據是否包含可用於創建更好模型的資訊，以及訓練過程是否能夠真正將這些資訊提煉成更好的模型。

但 Raghunathan 說，儘管有這些疑慮存在，但至少在短期內，數據增加的趨勢似乎會持續下去。數據量增加意味著需要更多的計算能力來儲存和處理所有數據，以訓練特斯拉的 AI 模型。這就是為何需要 Dojo 的原因。

目前，特斯拉似乎依賴輝達為 Dojo 訓練提供動力，但它不想孤注一擲，尤其因為輝達晶片價格昂貴。特斯拉還希望製造出更好的產品，以增加頻寬並減少延遲。這也是為什麼這家汽車製造商的 AI 部門決定推出自己的客製硬體程式，旨在比傳統系統更有效地訓練 AI 模型。

在硬體與軟體協同這方面，特斯拉與蘋果的觀點類似，即應該實現兩者的高度協同，尤其是 FSD 這種高度專門化的系統，更應該擺脫高度標準化的 GPU，使用客製化硬體。這一願景的核心是特斯拉專有的 D1 晶片，於 2021 年發佈，今年 5 月開始由台積電量產。

特斯拉還在研發下一代 D2 晶片，旨在解決資訊流瓶頸問題。D2 不會將各個晶片連接起來，而是將整個 Dojo 晶片放在一塊矽片上。

控制自己的晶片生產意味著特斯拉未來能以低成本為 AI 訓練程式快速增加大量算力，尤其是在特斯拉和台積電擴大晶片生產規模的情況下。這也代表特斯拉未來可能不需要依賴輝達的晶片，因為輝達的晶片價格越來越高，而且難以保證安全。

（本文已獲鉅亨網同意授權刊出）

瀏覽 331 次

覺得不錯的話就分享出去吧！

標籤

2024-08-07

推薦工作