最好的開放式模型之一 Meta 強勢發布 Llama 3

2024-04-19

編譯／黃竣凱

人工智慧（AI）巨頭Meta近日推出了Llama系列最新力作Llama 3，為該公司在開放式生成AI模型領域又立下一里程碑，雖然Llama 3全系列尚未完整問世，但Meta也已率先發布兩款新模型，性能相較前代有顯著進步。

最強生成式AI 模型

Meta表示，新發布的Llama 3 8B（80億參數）和Llama 3 70B（700億參數）模型，在各項基準測試上呈現「重大飛躍」，從對應參數規模而言，都已名列當今最頂尖的生成AI模型之列。這款模型是在兩個在定制的 24,000 個 GPU 集群上進行了訓練，是當今表現最佳的生成式AI 模型。

更多新聞：不讓Google和英特爾專美於前 Meta推新款AI晶片

基準測試

為證實這說詞，Meta也引用了Llama 3系列在眾多知名AI基準測試項目上的優異表現，包括測量知識等級的MMLU、測試技能獲取的ARC，及檢測推理能力的DROP。雖然這些基準測試的實用性和有效性仍待商榷，但仍是Meta等AI公司評估模型實力的標準作法。

超越Google、OpenAI、Claude

Meta稱，80億參數的Llama 3 8B在至少9項測試中，都超越了其他開放模型如Mistral 7B和Google的Gemma 7B，而更大型的700億參數Llama 3 70B，不僅在多項測試上力壓Google最新Gemini 1.5 Pro模型，有些成績甚至優於Anthropic公司的第二強模型Claude 3 Sonnet。在自家測試集評比中，Llama 3 70B也勝過Mistral Medium、OpenAI GPT-3.5和Claude Sonnet等對手。

Llama 3其他優勢

除基準分數優勢，Llama 3系列還展現出更強的「控制力」、較低拒答機率，及在一般常識、歷史、科學工程等題材回答的正確性。此外，Llama 3也有高達15萬億字元（約75億字）的龐大訓練數據集，比前代Llama 2多7倍之多，並包含更多程式碼和非英語數據，賦予新模型更多跨語言、跨領域適用力。

Meta訓練400億參數模型

展望未來，Meta也正在訓練超過400億參數的Llama 3超大型模型，並將引入多語種、多模態功能，讓對話、理解影像等能力與生成文字實力同等超凡，向頂級生成AI模型發起更猛烈的挑戰。

更多新聞：Reuters、Tech Crunch

瀏覽 486 次

覺得不錯的話就分享出去吧！

標籤

2024-04-19

最好的開放式模型之一 Meta 強勢發布 Llama 3

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

延伸閱讀

研替辦公室諮詢輔導服務「2大對象」 4-6月梯次開放申請預約

黃仁勳一句話讓量子股重摔！微軟卻說快成功 量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起 獨立遊戲殺出新藍海

小心「冒牌貨症狀群」上身！解構焦慮「五大招」重拾自信與平衡

繼吉卜力後！ChatGPT再推「Monday」語音功能 超厭世女聲很有感

川普擬課25%關稅 蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

發佈留言 取消回覆

黃仁勳一句話讓量子股重摔！微軟卻說快成功量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起獨立遊戲殺出新藍海

繼吉卜力後！ChatGPT再推「Monday」語音功能超厭世女聲很有感

川普擬課25%關稅蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

發佈留言取消回覆