輝達開源 AI 模型更勝 GPT-4o 基準測試結果曝光
編譯/黃竣凱
人工智慧(AI)晶片巨頭輝達悄悄推出了一款新的AI模型,其表現甚至優於當前最先進的AI系統,包括GPT-4o和Claude-3。這款名為Llama-3.1-Nemotron-70B-Instruct的模型,引發了業界的廣泛關注。
Llama-3.1-Nemotron-70B-Instruct
根據輝達AI Developer帳號在X平台上的發布內容,Llama-3.1-Nemotron-70B-Instruct被稱為「領先模型」,並且在AI 研究人員間流行知名平台Chatbot Arena中表現突出。這款模型是Meta的開源模型Llama-3.1-70B-Instruct的改進版,其中「Nemotron」部分反映了輝達的貢獻,展現了其在AI技術上的領先地位。
更多新聞:Google 攜手輝達 液冷技術AI伺服器將顛覆雲端運算
輝達試圖設計更有用的AI模型
Llama系列模型是Meta推出的開源模型,旨在提供給開發者作為基礎進行開發,而輝達則基於這個基礎,藉由特別選取的數據集、先進的微調技術,以及自家頂尖的AI硬體,打造出Nemotron。輝達的目標,是使其比OpenAI的ChatGPT和Anthropic的Claude-3更加「有用」,滿足更多使用需求。
輝達稱Nemotron表現超越現有AI
輝達表示,Nemotron的性能在多項測試中明顯領先現有的尖端模型,例如GPT-4o與Claude-3。在Chatbot Arena的自動化「Hard」測試中,輝達宣稱Nemotron取得了85分,這將使其成為該測試中最頂級模型。
Llama-3.1中端模型超越巨型系統
令人驚訝的是,Llama-3.1-70B只是Meta開源AI模型中的中階版本,但它卻已經能夠在某些測試中,超越具備超過1萬億參數的GPT-4o,表明輝達在提高模型效率與表現上取得了顯著突破。輝達此次推出的Nemotron不僅強化了AI技術的競爭格局,也展示了開源AI模型在進一步開發和優化中的巨大潛力。
參考資料:Coin Telegraph
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 324 次