挑戰GPT-4霸主地位   輝達推出NVLM 1.0模型家族

編譯/黃竣凱

輝達宣布推出一款開源大型語言模型(LLM)NVLM 1.0模型家族,號稱性能可以媲美OpenAI、Anthropic、Meta及Google等業界領先的專有模型,基於輝達是建造高需求GPU的領導者,現在進一步擴展其技術領域,對人工智慧(AI)產業來說具有重大意義。

輝達宣布推出一款開源大型語言模型(LLM)NVLM 1.0模型家族。(圖/123RF)

NVLM 1.0強化視覺語言任務表現

據報導,輝達近日發表了白皮書,介紹其最新的NVLM 1.0模型家族,該家族以擁有720億參數的NVLM-D-72B模型為代表,研究人員指出,「我們推出了尖端級的多模態大型語言模型家族NVLM 1.0,其在視覺語言任務上達到最先進的成果,可媲美領先的專有模型(如GPT-4o)和開放性訪問模型(如InternVL 2)。」

更多新聞:字節跳動找華為晶片助陣 訓練全新AI大型語言模型

NVLM 1.0具備生產級多模態能力

NVLM 1.0家族展現了卓越的多模態處理能力,不僅在視覺和語言任務上表現優異,相較於基礎LLM,在文本生成方面也有明顯提升,研究團隊表示,「為實現這一目標,我們將高品質的純文本數據集融入多模態訓練中,並加入大量數學與推理數據,進而提升模型在數學和程式設計上的表現。」

多模態訓練精確度提升4.3個基準點

透過多模態訓練方式,輝達成功將模型的文本生成準確度平均提高了4.3個基準點,達到了行業內常見標準測試中的優異成績,代表NVLM 1.0既能逐步解釋複雜的數學問題,也能幽默地解釋網路迷因的趣味來源。

輝達公開模型訓練權重 強調開源承諾

輝達此次發布的NVLM 1.0家族不僅對外公開其訓練權重,還承諾將在不久的將來公開模型源碼,符合開源定義,與對模型的細節守口如瓶的OpenAI和Google等競爭對手的專有模型形成鮮明對比,透過這一措施,輝達希望NVLM家族不僅能作為一個強大的模型,也能成為第三方開發者打造自有聊天機器人和AI應用的基礎。

參考資料:econotimes

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 304 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button