AWS發布全新Nova模型家族 全面進軍生成式AI領域

編譯/黃竣凱

亞馬遜雲端運算部門(AWS)的re:Invent大會上,該公司宣布推出名為Nova的多模態生成式人工智慧(AI)模型家族。Nova系列包括4款文本生成模型:Micro、Lite、Pro和Premier,其中前3款已於當日向AWS客戶開放,而Premier預計於2025年初推出。此外,AWS還發布了圖像生成模型Nova Canvas和影片生成模型NovaReel,進一步拓展生成式媒體應用。

全面進軍生成式AI領域,AWS發布全新Nova模型家族。
全面進軍生成式AI領域,AWS發布全新Nova模型家族。 (圖/取自YouTube@amazonwebservices

文本生成模型功能各異

據報導,Nova系列文本生成模型針對15種語言(以英語為主)進行優化,並具有不同的處理能力。

  • Micro:專注文本生成,具備最低延遲,適合需要快速回應的場景。
  • Lite:能處理文本、影像與影片輸入,兼顧速度與多模態處理能力。
  • Pro:平衡準確性、速度與成本,適合各類任務。
  • Premier:功能最強大,設計用於處理複雜工作負載,並可協助創建客製化模型。

這些模型支援的字元(token),從Micro的12.8萬到Lite和Pro的30萬不等,未來模型更是將擴展至超過200萬字元,進一步提升處理能力。

更多新聞:輝達新AI模型Fugatto厲害在哪?可創造出「從未聽過的聲音」

生成式媒體的強大工具

而Nova Canvas則提供圖像生成與編輯功能,用戶可透過指令生成圖像,調整背景、色彩與版面設計;而Nova Reel則專注影片生成,可從文字或參考圖像生成最長6秒的影片,並支持鏡頭移動如平移、360度旋轉與縮放等功能。未來,Reel將能生成長達兩分鐘的影片,進一步擴展應用方式。

Nova加入內容安全防護

AWS強調,Nova系列模型內建責任使用控制,包括浮水印與內容審核機制,能減少不良內容的生成,如錯誤資訊、非法圖像或其他有害材料。此外,AWS表示將繼續完善安全措施以應對資訊誤導和違法行為。

語音與多模態模型蓄勢待發

AWS也預計於2025年第一季,推出語音到語音轉換模型,該模型能解讀語調與節奏,生成自然且擬人化的語音。到2025年中,AWS還將發布「任意輸入到任意輸出」(any-to-any)的生成模型,支援文本、語音、圖像與影片的自由轉換,應用於翻譯、內容編輯及AI助手等領域。

AWS執行長Andy Jassy說:「這是尖端模型未來的發展方向,將徹底改變其建構與應用方式。」Nova系列的推出標誌著AWS在生成式AI領域邁出重要一步,也為AI應用的未來增添更多可能性。

參考資料:Tech Crunch

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 297 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button