中國AI 類比晶片 傳比Nvidia A100 GPU快3.7倍
編譯/高晟鈞
我們曾經在前篇文章中簡單介紹了來自中國清華大學的最新研究──光電運算相結合的全類比晶片(ACCEL)。這篇文章帶你更深入認識ACCEL的驚人之處。
驚人的效能
ACCEL在視覺影響處理的任務中,達到了每秒4,600萬億次運算,與Nvidia的A100相比,快了3.7倍之多,後者在INT8的峰值為1,248 TOPS。該晶片的內部測試顯示,每幀的計算延遲只有72奈秒,每秒生成13,000幀,足以讓每個遊戲玩家瘋狂。
更多新聞:下一代微晶片關鍵 人造鑽石與玻璃合成物
速度雖然對於任何處理系統都是至關重要的,然而,準確性對於電腦視覺任務更是不可或缺的。根據論文內容所述,ACCEL在Fashion-MNIST、ImageNet分類任務、和延時影像識別任務中進行了測試,其準確度分別到達了85%、82%與93%之高,更驚人的是,其在低光源條件下也能保持優異的系統穩健性。
光學為主、電子為輔
ACCEL的架構是以衍射光學模擬計算(OAC)為主,輔以電子模擬計算(EAC)來運作,其99%的操作都是在光學系統內實現的。這將有助於其克服其他視覺架構的限制,例如馬赫-曾德爾干涉儀和衍射深度神經網路(DNN)等。
舉個例子,Nvidia的GPU是100%數位化的,因此它的運作是基於電子的連續流動,結果就是產生大量的廢熱。而ACCEL利用特定波長的雷射脈衝來進行數據的傳輸、操作與編碼。這種光學處理系統,對於能量需求更少,熱散失中被浪費的電子也更少,並徹底擺脫類比數位轉換器的需求。這也是為什麼光子系統被用於量子運算和高效能運算的主因之一。
中國頑強抵抗美國制裁
ACCEL很難讓人不想到IBM最新發布的另一款模擬AI加速晶片Hermes。有趣的是,儘管對中國實施了制裁,該國研發的勢頭更加銳不可擋,甚至在某些方面的成果更是令人驚豔。
ACCEL中的電子模擬計算單元(EAC)採用標準的180nm CMOS技術製造,儘管製造相對容易,但目前的製造水準仍然偏低(Nvidia的H100採用4nm工藝製造),無法滿足研究工作以外的需求。
儘管如此,成功的研究成果永遠是所有科技進步的第一步。相信等待技術成熟並大規模生產的那刻到來,晶片市場將無條件擁抱ACCEL。
資料來源:Tomshardware
瀏覽 544 次