輝達小型語言模型 讓數位人類更聽話
編譯/莊閔棻
輝達在今年的科隆遊戲展(Gamescom)上宣布,其數位人類技術套件「ACE」現已包含首款由RTX AI 裝置端運行的小型語言模型(SLM),這款名為Nemotron-4 4B Instruct的模型,提供了更好的角色扮演、檢索增強生成和功能調用能力,能使遊戲角色更直接地理解玩家指令、回應玩家並執行更精確相關的動作。
據報導,該模型作為輝達NIM 微服務的一部分,能支援遊戲開發者透過雲端和自己的設備部署,並優化了低記憶體使用量,提供更快的回應速度,讓開發者能更好地利用GeForce RTX 遊戲電腦和筆記型電腦,以及輝達RTX 工作站。
更多新聞:比國家氣象總署還準 輝達推新 AI 模型
小型語言模型的優勢
一般來說,AI 模型的準確性和性能取決於訓練數據集的大小和品質,大型語言模型(LLM)通常涵蓋大量數據,但往往會包含過多的無關資訊,而小型語言模型(SLM)則專注於特定用途,即使數據量較少,也能更快速地提供更準確的回應,這在與數位人類進行自然對話時非常重要。
而Nemotron-4 4B 則是從更大的 Nemotron-4 15B LLM 濃縮而來,這一過程讓較小的模型能模仿較大模型的輸出,同時移除不必要的部分,以縮小模型參數,隨後,該模型再進行量化處理,降低了權重的精度。
藉由更少的參數,Nemotron-4 4B用更小的記憶體,能提供更快的首次回應時間,同時仍保持高度準確度,其小型化特點,使整合了NIM微服務的遊戲和應用程式,能在更多消費者現有的 GeForce RTX AI 電腦和筆記型電腦,及輝達RTX AI 工作站上本地運行。
ACE 的應用前景
ACE允許開發者通過雲端或 RTX AI 電腦和工作站,部署尖端的生成式 AI 模型,為遊戲和應用帶來 AI 技術,借助 ACE,非玩家角色(NPC)可以在遊戲中,與玩家進行動態互動和即時對話。
ACE 包含了關鍵的 AI 模型,如語音轉文字、語言模型、文字轉語音和面部動畫等,其模組化設計,使開發者可以根據需求,選擇所需的 NIM 微服務,輝達Riva自動語音識別(ASR)技術,可將用戶語音轉換為高精確度的即時文本,並支援多語言語音和翻譯微服務。
接著,經過轉錄後的文本可透過 LLM(如 Google 的 Gemma、Meta 的 Llama 3 或 Nemotron-4 4B)生成回應,然後再透過 Riva 的文字轉語音技術,生成音頻回應,最後,輝達的 Audio2Face 技術,則能生成與多語言對話同步的面部表情,實現生動的數位人類互動。
ACE 不僅支援多種 輝達和第三方 AI 模型,還允許開發者根據體驗、工作負載和成本,在雲端或本地設備上進行混合推理,現在ACE NIM 微服務已在多個遊戲和技術展示中應用,包括 Covert Protocol 和 Mecha BREAK 等。
展望未來
此外,數位人類的應用也不僅局限於遊戲角色,在 SIGGRAPH 大會上,輝達就曾展示了一個名為 「James」 的數位互動機器人,可以用情感、幽默等方式與人進行互動,隨著數位人類技術的發展,其應用前景將擴展至客戶服務、醫療保健、零售、遠端呈現和機器人等多個領域。
參考資料:Nvidia Blogs
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 331 次