Meta發布超強新Llama模型 超越GPT-4o和Claude
編譯/莊閔棻
科技巨頭Meta發布了有史以來最大的開源 AI 模型,並聲稱該模型在多項基準測試中,勝過 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。Meta剛剛發布了Llama系列人工智慧(AI)模型的最新版本 Llama 3.1,其中還包含容量高達 820GB、至今為止最大的型號,令人印象深刻,該公司表示,這是整個系列的新升級,包括對小型和中型版本的推理改進,而且這些模型也仍然是開源的,讓任何公司或組織都可以在自己的硬體上下載、微調和運行模型。
新旗艦模型Llama 3.1 405B
據報導,該版本中最突出的是 Llama 3.1 405B,該模型擁有 4050 億個參數,並使用超過 16,000 個輝達超昂貴的 H100 GPU 進行訓練,旨在媲美和超越 OpenAI、Google 等行業領導者的 Claude 3.5 Sonnet 和 GPT-4o,儘管Meta 並未透露開發 Llama 3.1 的成本,但預計成本已達到數億美元,然而,Meta 也聲稱,Llama 3.1 的生產成本大約是 OpenAI 的 GPT-4o 的一半。
更多新聞:別再猶豫 GPT-4o Mini將全面改變遊戲規則
該模型在推理和程式設計能力方面均表現出色,使其成為高級AI應用的重要工具,Meta 聲稱 Llama 3.1 405B 超越了 Claude 3.5 Sonnet 和 GPT-4o 設定的基準,表明性能和實用性達到了新水準。
改進和功能
其中,Llama 3.1 開發過程中的一個重點是增強其聊天機器人的「有用性」(helpfulness),強調「透過 Llama 3.1 405B,我們努力提高模型的實用性、品質和詳細的指令遵循能力,能準確回應用戶指令,同時確保高水準的安全性。」 Meta 強調提高品質和詳細遵循指令,同時保持高安全標準,新模型具有更大的 128,000 個字元上下文窗口,使其與行業標準保持一致,並實現更全面的上下文感知回應。
Meta 的生成式AI副總裁 Ahmad Al-Dahle表示,Llama 3.1 能夠與搜尋引擎 API 整合,「根據複雜的查詢從網路上檢索資訊,並連續調用多個工具來完成任務,」如若是要求模型繪製過去五年美國出售的房屋數量,「Llama 3.1可以為大家搜尋網路,並產生可執行的 Python 程式碼。」
三種尺寸的Llama 3.1
不只最強的405B版本,Llama 3.1一共有三種尺寸,包括:
- 8B:一種輕量級、超快的模型,能在智慧型手機上運作。
- 70B:高效能、高性價比型號,適用於資料中心和高階遊戲PC。
- 405B:旗艦機型,尖端智慧,品質和功能與 OpenAI、Google 和 Anthropic 等大型私有模型相同。
如何使用Llama 3.1
Llama 3.1 模型,包括 405B 版本,可以透過 MetaAI 聊天機器人使用,但目前仍未擴及到全球,此外,它們也可以在 Groq Cloud 以及微軟、Google、Amazon 和 DataBricks 的其他以開發人員為中心的平台上使用,最後,這些模型還可以從 GitHub 下載並部署在私人資料中心。較小的版本 8B 和 70B 則也可透過專為設備內AI模型設計的安裝工具 Ollama 使用,可以讓用戶在 Windows、Mac 和 Linux 系統上輕鬆安裝和運行 AI 模型。
從本週開始,Llama 3.1 將首先透過美國的 WhatsApp 和 Meta AI 網站開放,並在接下來幾週內擴展到 Instagram 和 Facebook ,此外,它還進行了更新以支援新語言,包括法語、德語、印地語、義大利語和西班牙語,為幫助 Llama 3.1 走向世界,Meta 正在與微軟、亞馬遜、Google、輝達和 Databricks 等二十多家公司合作,幫助開發人員部署自己的版本。
開源幫助Meta省錢
Meta執行長馬克·祖克柏將Meta 對開源AI的投資,與其早期的開放運算專案進行比較,並表示,該專案透過讓惠普等外部公司在Meta 建立自己的能力的同時,幫助改進和標準化Meta 的資料中心設計,為公司節省了「數十億美元」。展望未來,他預計AI也會出現同樣的動態,並指出「我相信 Llama 3.1 版本將成為行業的轉折點,大多數開發人員都開始使用開源模型。」
未來前景
歸功於透過 WhatsApp、Instagram、Ray-Ban 智慧眼鏡和獨立的 MetaAI 聊天機器人,擴大了其AI助理的可用性,Meta執行長馬克·祖克柏預測,到今年年底,MetaAI將成為使用最廣泛的AI助手,有可能超越ChatGPT。
參考資料:tom’s guide、The Verge
瀏覽 535 次