馬斯克xAI計畫擴展超級電腦Colossus 目標超過百萬GPU

編譯/莊閔棻

傳億萬富翁馬斯克的人工智慧(AI)公司xAI,計畫將其超級電腦「Colossus」,擴展至超過一百萬顆GPU,使其成為世界上最強大的超級電腦之一。馬斯克曾在X上表示,從硬體安裝到啟動訓練,xAI僅用了19天,總計耗時122天,就讓這台超級電腦完全上線,速度之快讓業界驚嘆,也獲得黃仁勳的讚賞。

傳億萬富翁馬斯克的人工智慧(AI)公司xAI,計畫將其超級電腦「Colossus」,擴展至超過一百萬顆GPU。
傳億萬富翁馬斯克的人工智慧(AI)公司xAI,計畫將其超級電腦「Colossus」,擴展至超過一百萬顆GPU。(圖/123RF)

xAI的GPU擴增計畫

據報導,目前Colossus已配備超過10萬顆輝達的H100處理器,並預計在短期內翻倍至20萬顆,成為單一建築內規模最大的超級電腦。為實現這一目標,xAI與輝達、Dell及Supermicro等科技巨頭合作,並在位於田納西州孟菲斯的Colossus所在地設立專屬團隊,全力推進此計畫。

更多新聞:黃仁勳盛讚馬斯克xAI 用「超人」速度打造超級電腦

新一代GPU成擴展關鍵

目前尚不清楚xAI是否會使用現有的Hopper架構GPU,還是採用即將推出的下一代Blackwell架構。Blackwell的擴展能力優於Hopper,可能更適合此次大規模擴建,然而,不論選擇哪一代產品,取得80至90萬顆AI GPU面臨極大的供應壓力。此外,要讓百萬顆GPU協同運作,實現最高效能,也是一大挑戰。

xAI龐大的財務需求

此次擴展計畫所需的資金數額驚人,需要巨大的資金投入以及供應鏈與基礎設施的支持,光是購買每顆數萬美元的GPU,加上電力與冷卻基礎設施,就可能使總投資達數百億美元,xAI今年已籌集了110億美元,最近又獲得50億美元,並將公司估值推至450億美元。

自主建設超級運算

與依賴微軟的OpenAI及獲得亞馬遜支持的Anthropic不同,xAI選擇獨立建設其超算能力。這一策略讓xAI在高階AI硬體的競賽中占據先機,並因大規模投資而顯現出領先優勢,但儘管進展迅速,xAI也因疑似繞過規劃許可及對區域電網造成壓力而受到批評。為應對外界關切,xAI已採取穩定電網的措施,包括部署特斯拉的Megapack技術以管理電力需求。

技術先進但產品仍待提升

雖然硬體方面的進展令人讚賞,但xAI的商業產品仍相對有限。據報導,其語言模型Grok在功能與用戶數量上落後於ChatGPT與Google的Gemini,然而,投資者也認為,Colossus是xAI的基石成果,展現了公司快速部署尖端技術的能力。

參考資料:Tom’s Hardware

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 1,014 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button