字節跳動找華為晶片助陣 訓練全新AI大型語言模型

編譯/黃竣凱

為因應美國自2022年開始限制出口先進人工智慧(AI)晶片,如市場領導者輝達的產品,TikTok母公司節跳動不得不尋求國內晶片供應商以推動其AI發展,而三位知情人士透露,該公司已經計畫使用華為的Ascend 910B晶片來訓練其新的AI模型。

字節跳動利用華為晶片訓練全新AI大型語言模型。
字節跳動利用華為晶片訓練全新AI大型語言模型。(圖/取自字節跳動官網)

AI成為科技行業核心

據報導,字節跳動的下一步計畫,是利用華為的Ascend 910B晶片來訓練一個大型語言模型,AI技術已經成為科技行業的核心,涵蓋了從遊戲到電子商務等各個領域,企業紛紛透過定製的AI模型來提升產品差異化,而這些模型主要依靠模式識別來進行決策。

更多新聞:陸企尋求輝達替代品 華為力推新 AI 晶片

華為晶片的應用與挑戰

目前,字節跳動已經將華為Ascend 910B用於計算需求較低的推論任務,這些任務涉及預先訓練的AI模型進行預測,然而,訓練AI模型需要更大的計算能力和數據,這需要如輝達高端圖形處理器般的超高性能晶片支援,知情人士透露,字節跳動的新AI模型的計算能力將低於現有的豆包(Doubao)模型。儘管字節跳動已經訂購了超過10萬片Ascend 910B晶片,但截至7月,僅收到不到3萬片,晶片供應緊張與計算能力的限制,影響了字節跳動設定新模型的開發時間表。

字節跳動AI應用不斷擴展

字節跳動於2023年8月,推出大型語言模型豆包,並在多個應用中使用,包括文本轉影片工具「集夢」,隨著AI應用的普及,字節跳動的聊天機器人已經成為中國最受歡迎的應用之一,每月活躍用戶超過千萬,使字節跳動成為華為AI晶片的最大買家之一。除了與華為的合作外,字節跳動還是輝達H20 AI晶片的最大買家,為應對貿易限制,該晶片專為中國市場定製,對於是否正在開發新AI模型,字節跳動發言人Michael Hughes表示,「沒有開發新模型」的說法是錯誤的,而、華為和輝達均未對此事發表評論。

參考資料:reuters

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 257 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button