聯發科再推BreeXe大型語言模型 搭配「達哥」AI平台
記者/竹二
聯發科繼釋出對應70億組參數規模的大型自然語言模型Breeze-7B後,近日再推出名為BreeXe的大型語言模型,以及生成式AI服務平台MediaTek DaVinci,更以「聯發科技達哥」作為暱稱。
可理解台灣在地語言
DaVinci平台除了有API庫、擴充外掛庫及AI模型庫等之外,今年還新添智慧助理架構和4大商店,供使用者打造客製化的智能助理。而BreeXe以Mistral 8x7B模型為基礎,以大量的繁體中文資料訓練而成,甚至加入諸多在地化微調訓練,像是可以理解「母湯」是台語「不行」意思,具有450億個參數,在繁中基準測試的表現超越GPT-3.5。
更多新聞:Google發布LLM Inference API 手機和網頁都可執行大型語言模型
聯發創新基地負責人許大山表示,BreeXe是由聯發科位於英國劍橋、倫敦,以及台大創新基地三方合作,共同打造的大型自然語言模型,是當前繁體中文能力表現最好的模型,單次可處理超過4萬字的文字內容,更比Mistral AI提出的客製化模型Mistral對應10倍以上執行能力。據了解,BreeXe是透過NVIDIA所提供的Taipei-1超級電腦DGX GH200進行訓練,接下來還計畫把BreeXe的處理能力提升到GPT-4的等級。
可結合應用不同場景
至於MediaTek DaVinci,聯發科則是用瑞士刀來比喻,透過這個平台結合不同外掛資源,可以對應不同應用場景,讓更多結合人工智慧的服務可以更快藉此服務平台建構。
目前MediaTek DaVinci除了收錄BreeXe之外,先前也已經收錄包含微軟旗下人工智慧模型,以及OpenAI的GPT、DALL.E3,還有Anthropic日前推出的Claude 3,聯發科期望能透過此平台協助更多開發者和企業導入自動生成式人工智慧應用資源。
瀏覽 773 次