Blackwell有多厲害 輝達預告絕不只是GPU
編譯/莊閔棻
儘管有報導指出,輝達備受期待的「Blackwell」GPU,可能因設計缺陷而延遲長達三個月,對一向領跑人工智慧(AI)領域的輝達來說,可以說是一個少見的壞消息,然而,輝達發言人卻表示,產品進展一切如常,一些供應商表示沒有任何變化,而另一些供應商則表示出現了一些正常的下滑,同時輝達負責人也出面進一步解釋了該「平台」。
輝達重磅預告Blackwell
據報導,輝達預計將在公布2025財年第二季財報時,進一步釐清「Blackwell」的進展狀況,據悉,輝達計畫在下週於加州史丹福大學舉行的「Hot Chips」研討會上,重點介紹「Blackwell」晶片架構,包括新技術創新、AI在晶片設計中的應用,及為應對不斷增長的AI工作負載,資料中心液冷技術的研究等,此外,輝達加速計算產品總監Dave Salvator表示,屆時還將展示,已經在輝達資料中心運行的「Blackwell」晶片。
更多新聞:CoWoS 產能大幅提升 台積電封裝領導地位更鞏固
Blackwell 不僅是晶片更是平台
目前,關於「Blackwell」的諸多細節已經為人熟知,例如計畫將於明年推出的Blackwell Ultra GPU,以及預計在2026年問世的下一代Rubin GPU和Vera CPU,然而,Salvator強調,討論「Blackwell」時應將其視為一個「平台」,而非單一晶片,他在一場媒體簡報會中表示,「當你想到輝達建構的平台時,GPU、網路、CPU只是開始,我們還進行了系統級和資料中心級的工程設計,以建構能夠應對這些複雜生成式AI挑戰的平台。」
Blackwell 面向生成式 AI
輝達於今年三月的GTC 2024活動中,首次推出了備受期待的Blackwell架構,並迅速吸引了超大規模運營商和OEM廠商的合作。該公司目標指向不斷擴張的生成式AI市場,尤其是像Meta在六月推出的、擁有4050億參數的Llama 3.1這類大規模語言模型(LLM)。Salvator表示,隨著模型規模的增長和實時推理需求的提升,需要一個更具平台性的方法來應對。
NVSwitch提升 Blackwell 平台性能
為支持這些需求,輝達引入了NVSwitch這一高速互連技術,使每個伺服器內的GPU能夠即時通訊,「這非常重要,因為這意味著不再需要多次跳轉,如從GPU 1到GPU 8只需經過NVSwitch即可即時通訊,達到每秒900 GB的傳輸速率,」Salvator表示,該技術使Llama 3.1的70B參數模型,在H200 GPU系統中的推理性能提升了50%。
Blackwell 平台全景:不止於 GPU
此外,隨著生成式AI模型的規模不斷擴大,以及即時推理需求增加,輝達的解決方案將不僅僅局限於Blackwell GPU和Grace CPU,還包括NVLink Switch晶片、Bluefield-3 DPU、ConnextX-7和ConnectX-8 NICs、Spectrum-4乙太網路交換器,及Quantum-3 InfiniBand交換器。
參考資料:The Next Platform
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 313 次