輝達新AI模型輾壓GPT-4o跟Claude3.5 專家：戰略擴張的開始

2024-10-18

AI 晶片巨擘輝達 (NVDA-US) 日前發表最新 AI 模型 Llama-3.1-Nemotron-70B-Instruct，性能超越業界領先的 OpenAI 的 GPT-4o 跟 Anthropic 的 Claude3.5，此舉意味著 AI 領域競爭格局的重大變化。

AI 晶片巨擘輝達日前發表最新 AI 模型 Llama-3.1-Nemotron-70B-Instruct。（圖／123RF）

這款模型在知名 AI 平台 Hugging Face 上發布，雖然沒有太大的宣傳，但憑藉其在多個基準測試中出色的表現，迅速引起業界關注。

根據輝達的報告，該模型在關鍵評估中取得優異成績，包括在 Arena Hard 基準測試中得 85 分，在 AlpacaEval 2 LC 中得 57.6 分，以及在 GPT-4-Turbo MT-Bench 中得 8.98 分。這些成績超過 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3.5 Sonnet 等備受推崇的模型，使輝達在 AI 語言理解和生成方面迅速崛起，成為業界新領導者。

Llama-3.1-Nemotron-70B-Instruct 的發表，除標誌著輝達的關鍵時刻外，也代表輝達戰略擴張的開始，可能會改變 AI 行業的格局，挑戰傳統的軟體公司在大語言模型 (LLM) 開發中的主導地位。

輝達開發 Llama-3.1-Nemotron-70B-Instruct 的方式是，利用先進的訓練技術，包括「從人類反饋中學習的強化學習」(RLHF)，對 Meta(META-US) 的開源 Llama 3.1 模型進行優化。這種方法使 AI 能 0 從人類的偏好中學習，可能會帶來更加自然和符合語境的回應。

輝達 Llama-3.1-Nemotron-70B-Instruct 不僅性能優異，且能處理複雜查詢，無需額外的提示或特定的標記。在一次演示中，它正確地回答「草莓裡有多少個 r？」，展現自身對語言的深刻理解和提供清晰解釋的能力。

這些結果的特別重要之處在於強調「對齊」(alignment) 的概念，這一 AI 研究術語指的是模型輸出與使用者需求和偏好的匹配程度。對企業來說，這意味著減少錯誤、提供更有幫助的回應，最終提高客戶滿意度。

為了支持企業探索 AI 解決方案，輝達還透過 build.nvidia.com 平台提供免費的託管推理服務，並且兼容 OpenAI 的 API 接口，使先進 AI 技術變得更易於獲取，幫助各行各業的公司進行實驗和實施。

儘管如此，輝達也提醒使用者，這款新模型在數學或法律等特殊領域的應用上可能存在一定的風險，企業需謹慎使用，以防止錯誤或濫用。

隨著開發者對 Llama-3.1-Nemotron-70B-Instruct 的測試，可能很快就會看到該模型在醫療、金融、教育等領域的新應用出現。它的成功將最終取決於是否能將令人印象深刻的基準得分，轉化為實質解決方案。

輝達發表新模型標誌著 AI 系統開發的競爭進入了一個新的階段，輝達的舉動將迫使其他科技公司重新考慮他們的策略，並加速研發進程。這一切發生在輝達推出 NVLM 1.0 系列多模態模型之後，其中包括 72 億參數的 NVLM-D-72B。

這些最新的發佈，尤其是開源的 NVLM 專案，顯示輝達 AI 雄心不僅僅是與競爭對手抗衡，還有具備挑戰市場主導者的能力。

（本文已獲鉅亨網同意授權刊出）

瀏覽 643 次

覺得不錯的話就分享出去吧！

標籤

2024-10-18

輝達新AI模型輾壓GPT-4o跟Claude3.5 專家：戰略擴張的開始

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

長期吃素恐得「可逆性失智」 醫曝缺乏維生素B12與記憶力的驚人連結

繼吉卜力後！ChatGPT再推「Monday」語音功能 超厭世女聲很有感

川普擬課25%關稅 蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維 鼓勵學生保有「好奇心」

聯電新加坡新廠開幕 第1期預計2026年投產、月產能估3萬片

川普「對等關稅」實施倒數 郭智輝：因應辦法會讓大家知道

發佈留言 取消回覆

長期吃素恐得「可逆性失智」醫曝缺乏維生素B12與記憶力的驚人連結

繼吉卜力後！ChatGPT再推「Monday」語音功能超厭世女聲很有感

川普擬課25%關稅蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維鼓勵學生保有「好奇心」

聯電新加坡新廠開幕第1期預計2026年投產、月產能估3萬片

川普「對等關稅」實施倒數郭智輝：因應辦法會讓大家知道

發佈留言取消回覆