Meta發布超強新Llama模型　超越GPT-4o和Claude

2024-07-24

編譯／莊閔棻

科技巨頭Meta發布了有史以來最大的開源 AI 模型，並聲稱該模型在多項基準測試中，勝過 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。Meta剛剛發布了Llama系列人工智慧（AI）模型的最新版本 Llama 3.1，其中還包含容量高達 820GB、至今為止最大的型號，令人印象深刻，該公司表示，這是整個系列的新升級，包括對小型和中型版本的推理改進，而且這些模型也仍然是開源的，讓任何公司或組織都可以在自己的硬體上下載、微調和運行模型。

Meta發布有史以來最大的開源 AI 模型，聲稱該模型在多項基準測試中，勝過GPT-4o 和 Anthropic 的Claude 3.5 Sonnet。（圖／123RF）

新旗艦模型Llama 3.1 405B

據報導，該版本中最突出的是 Llama 3.1 405B，該模型擁有 4050 億個參數，並使用超過 16,000 個輝達超昂貴的 H100 GPU 進行訓練，旨在媲美和超越 OpenAI、Google 等行業領導者的 Claude 3.5 Sonnet 和 GPT-4o，儘管Meta 並未透露開發 Llama 3.1 的成本，但預計成本已達到數億美元，然而，Meta 也聲稱，Llama 3.1 的生產成本大約是 OpenAI 的 GPT-4o 的一半。

更多新聞：別再猶豫 GPT-4o Mini將全面改變遊戲規則

該模型在推理和程式設計能力方面均表現出色，使其成為高級AI應用的重要工具，Meta 聲稱 Llama 3.1 405B 超越了 Claude 3.5 Sonnet 和 GPT-4o 設定的基準，表明性能和實用性達到了新水準。

改進和功能

其中，Llama 3.1 開發過程中的一個重點是增強其聊天機器人的「有用性」（helpfulness），強調「透過 Llama 3.1 405B，我們努力提高模型的實用性、品質和詳細的指令遵循能力，能準確回應用戶指令，同時確保高水準的安全性。」 Meta 強調提高品質和詳細遵循指令，同時保持高安全標準，新模型具有更大的 128,000 個字元上下文窗口，使其與行業標準保持一致，並實現更全面的上下文感知回應。

Meta 的生成式AI副總裁 Ahmad Al-Dahle表示，Llama 3.1 能夠與搜尋引擎 API 整合，「根據複雜的查詢從網路上檢索資訊，並連續調用多個工具來完成任務，」如若是要求模型繪製過去五年美國出售的房屋數量，「Llama 3.1可以為大家搜尋網路，並產生可執行的 Python 程式碼。」

三種尺寸的Llama 3.1

不只最強的405B版本，Llama 3.1一共有三種尺寸，包括：

8B：一種輕量級、超快的模型，能在智慧型手機上運作。
70B：高效能、高性價比型號，適用於資料中心和高階遊戲PC。
405B：旗艦機型，尖端智慧，品質和功能與 OpenAI、Google 和 Anthropic 等大型私有模型相同。

如何使用Llama 3.1

Llama 3.1 模型，包括 405B 版本，可以透過 MetaAI 聊天機器人使用，但目前仍未擴及到全球，此外，它們也可以在 Groq Cloud 以及微軟、Google、Amazon 和 DataBricks 的其他以開發人員為中心的平台上使用，最後，這些模型還可以從 GitHub 下載並部署在私人資料中心。較小的版本 8B 和 70B 則也可透過專為設備內AI模型設計的安裝工具 Ollama 使用，可以讓用戶在 Windows、Mac 和 Linux 系統上輕鬆安裝和運行 AI 模型。

從本週開始，Llama 3.1 將首先透過美國的 WhatsApp 和 Meta AI 網站開放，並在接下來幾週內擴展到 Instagram 和 Facebook ，此外，它還進行了更新以支援新語言，包括法語、德語、印地語、義大利語和西班牙語，為幫助 Llama 3.1 走向世界，Meta 正在與微軟、亞馬遜、Google、輝達和 Databricks 等二十多家公司合作，幫助開發人員部署自己的版本。

開源幫助Meta省錢

Meta執行長馬克·祖克柏將Meta 對開源AI的投資，與其早期的開放運算專案進行比較，並表示，該專案透過讓惠普等外部公司在Meta 建立自己的能力的同時，幫助改進和標準化Meta 的資料中心設計，為公司節省了「數十億美元」。展望未來，他預計AI也會出現同樣的動態，並指出「我相信 Llama 3.1 版本將成為行業的轉折點，大多數開發人員都開始使用開源模型。」

未來前景

歸功於透過 WhatsApp、Instagram、Ray-Ban 智慧眼鏡和獨立的 MetaAI 聊天機器人，擴大了其AI助理的可用性，Meta執行長馬克·祖克柏預測，到今年年底，MetaAI將成為使用最廣泛的AI助手，有可能超越ChatGPT。

參考資料：tom’s guide、The Verge

標籤

2024-07-24

Meta發布超強新Llama模型　超越GPT-4o和Claude

新旗艦模型Llama 3.1 405B

改進和功能

三種尺寸的Llama 3.1

如何使用Llama 3.1

開源幫助Meta省錢

未來前景

推薦工作

發佈留言取消回覆

搶人大戰！Meta砸重金挖角YouTube網紅入駐FB每月爽領3000美元

輝達H200獲北京點頭可重返中國市場同步調整Groq晶片布局

上銀科技徵才逾百人！長期育才、穩定留才、友善職場三管齊下

三星預計2027年下半年量產特斯拉晶片德州廠成關鍵據點

三星攜手AMD深化AI記憶體合作鎖定HBM4並探討晶圓代工夥伴關係

最新科技新聞快訊不錯過!!

新旗艦模型Llama 3.1 405B

改進和功能

三種尺寸的Llama 3.1

如何使用Llama 3.1

開源幫助Meta省錢

未來前景

推薦工作

延伸閱讀

搶人大戰！Meta砸重金挖角YouTube網紅 入駐FB每月爽領3000美元

起床信用卡竟被刷爆！「養龍蝦」存資安疑慮 林宜敬：監理發展須平衡

全城熱議「養龍蝦」！百度、騰訊大企業助攻 中國從學生到銀髮族都在瘋OpenClaw

沃亞科技力助北科大 領先導入半導體微汙染監測系統

SEMI調查曝近八成業者招募困難 曹世綸：從人口結構看人才荒

神祕AI模型現身！外界瘋猜：Hunter Alpha難道是DeepSeek V4測試版嗎？

發佈留言 取消回覆

搶人大戰！Meta砸重金挖角YouTube網紅入駐FB每月爽領3000美元

起床信用卡竟被刷爆！「養龍蝦」存資安疑慮林宜敬：監理發展須平衡

全城熱議「養龍蝦」！百度、騰訊大企業助攻中國從學生到銀髮族都在瘋OpenClaw

沃亞科技力助北科大領先導入半導體微汙染監測系統

SEMI調查曝近八成業者招募困難曹世綸：從人口結構看人才荒

發佈留言取消回覆