最好的開放式模型之一 Meta 強勢發布 Llama 3

2024-04-19

編譯／黃竣凱

人工智慧（AI）巨頭Meta近日推出了Llama系列最新力作Llama 3，為該公司在開放式生成AI模型領域又立下一里程碑，雖然Llama 3全系列尚未完整問世，但Meta也已率先發布兩款新模型，性能相較前代有顯著進步。

最強生成式AI 模型

Meta表示，新發布的Llama 3 8B（80億參數）和Llama 3 70B（700億參數）模型，在各項基準測試上呈現「重大飛躍」，從對應參數規模而言，都已名列當今最頂尖的生成AI模型之列。這款模型是在兩個在定制的 24,000 個 GPU 集群上進行了訓練，是當今表現最佳的生成式AI 模型。

更多新聞：不讓Google和英特爾專美於前 Meta推新款AI晶片

基準測試

為證實這說詞，Meta也引用了Llama 3系列在眾多知名AI基準測試項目上的優異表現，包括測量知識等級的MMLU、測試技能獲取的ARC，及檢測推理能力的DROP。雖然這些基準測試的實用性和有效性仍待商榷，但仍是Meta等AI公司評估模型實力的標準作法。

超越Google、OpenAI、Claude

Meta稱，80億參數的Llama 3 8B在至少9項測試中，都超越了其他開放模型如Mistral 7B和Google的Gemma 7B，而更大型的700億參數Llama 3 70B，不僅在多項測試上力壓Google最新Gemini 1.5 Pro模型，有些成績甚至優於Anthropic公司的第二強模型Claude 3 Sonnet。在自家測試集評比中，Llama 3 70B也勝過Mistral Medium、OpenAI GPT-3.5和Claude Sonnet等對手。

Llama 3其他優勢

除基準分數優勢，Llama 3系列還展現出更強的「控制力」、較低拒答機率，及在一般常識、歷史、科學工程等題材回答的正確性。此外，Llama 3也有高達15萬億字元（約75億字）的龐大訓練數據集，比前代Llama 2多7倍之多，並包含更多程式碼和非英語數據，賦予新模型更多跨語言、跨領域適用力。

Meta訓練400億參數模型

展望未來，Meta也正在訓練超過400億參數的Llama 3超大型模型，並將引入多語種、多模態功能，讓對話、理解影像等能力與生成文字實力同等超凡，向頂級生成AI模型發起更猛烈的挑戰。

更多新聞：Reuters、Tech Crunch

瀏覽 490 次

覺得不錯的話就分享出去吧！

標籤

2024-04-19

最好的開放式模型之一 Meta 強勢發布 Llama 3

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

延伸閱讀

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套 發生了什麼事？

台積電居「AI晶片碳排」之冠！綠色和平籲2030年全面用綠電

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片 比超級電腦快24倍

揚智穩健應對美國關稅衝擊 布局新興市場挹注營收動能

因應美國關稅政策搖擺 經濟部提「短中長期」計畫

企業如何因應美國關稅大刀？KPMG會計師給台商建議

發佈留言 取消回覆

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套發生了什麼事？

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片比超級電腦快24倍

揚智穩健應對美國關稅衝擊布局新興市場挹注營收動能

因應美國關稅政策搖擺經濟部提「短中長期」計畫

發佈留言取消回覆