AWS發布全新Nova模型家族全面進軍生成式AI領域

2024-12-04

編譯／黃竣凱

在亞馬遜雲端運算部門（AWS）的re:Invent大會上，該公司宣布推出名為Nova的多模態生成式人工智慧（AI）模型家族。Nova系列包括4款文本生成模型：Micro、Lite、Pro和Premier，其中前3款已於當日向AWS客戶開放，而Premier預計於2025年初推出。此外，AWS還發布了圖像生成模型Nova Canvas和影片生成模型NovaReel，進一步拓展生成式媒體應用。

全面進軍生成式AI領域，AWS發布全新Nova模型家族。（圖／取自YouTube@amazonwebservices）

文本生成模型功能各異

據報導，Nova系列文本生成模型針對15種語言（以英語為主）進行優化，並具有不同的處理能力。

Micro：專注文本生成，具備最低延遲，適合需要快速回應的場景。
Lite：能處理文本、影像與影片輸入，兼顧速度與多模態處理能力。
Pro：平衡準確性、速度與成本，適合各類任務。
Premier：功能最強大，設計用於處理複雜工作負載，並可協助創建客製化模型。

這些模型支援的字元（token），從Micro的12.8萬到Lite和Pro的30萬不等，未來模型更是將擴展至超過200萬字元，進一步提升處理能力。

生成式媒體的強大工具

而Nova Canvas則提供圖像生成與編輯功能，用戶可透過指令生成圖像，調整背景、色彩與版面設計；而Nova Reel則專注影片生成，可從文字或參考圖像生成最長6秒的影片，並支持鏡頭移動如平移、360度旋轉與縮放等功能。未來，Reel將能生成長達兩分鐘的影片，進一步擴展應用方式。

Nova加入內容安全防護

AWS強調，Nova系列模型內建責任使用控制，包括浮水印與內容審核機制，能減少不良內容的生成，如錯誤資訊、非法圖像或其他有害材料。此外，AWS表示將繼續完善安全措施以應對資訊誤導和違法行為。

語音與多模態模型蓄勢待發

AWS也預計於2025年第一季，推出語音到語音轉換模型，該模型能解讀語調與節奏，生成自然且擬人化的語音。到2025年中，AWS還將發布「任意輸入到任意輸出」（any-to-any）的生成模型，支援文本、語音、圖像與影片的自由轉換，應用於翻譯、內容編輯及AI助手等領域。

AWS執行長Andy Jassy說：「這是尖端模型未來的發展方向，將徹底改變其建構與應用方式。」Nova系列的推出標誌著AWS在生成式AI領域邁出重要一步，也為AI應用的未來增添更多可能性。

參考資料：Tech Crunch

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

瀏覽 963 次

覺得不錯的話就分享出去吧！

標籤

2024-12-04

AWS發布全新Nova模型家族全面進軍生成式AI領域

文本生成模型功能各異

生成式媒體的強大工具

Nova加入內容安全防護

語音與多模態模型蓄勢待發

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

文本生成模型功能各異

生成式媒體的強大工具

Nova加入內容安全防護

語音與多模態模型蓄勢待發

推薦工作

延伸閱讀

川普「對等關稅」實施倒數 郭智輝：因應辦法會讓大家知道

成熟製程聯盟成形？日媒曝：聯電與格羅方德傳合併 官方回應「不予評論」

「請對我們狠一點！」英特爾執行長陳立武想拆掉舊文化 重新贏回工程師

美國關稅戰！台經院示警：復甦恐受阻 「這產業」成海嘯第一排

崇越合作日本奈米壓印設備商SCIVAX！2025 Touch Taiwan亮相最新應用

傳蘋果將推出AI醫生服務 最快將與iOS 19.4一起發布

發佈留言 取消回覆

川普「對等關稅」實施倒數郭智輝：因應辦法會讓大家知道

成熟製程聯盟成形？日媒曝：聯電與格羅方德傳合併官方回應「不予評論」

「請對我們狠一點！」英特爾執行長陳立武想拆掉舊文化重新贏回工程師

美國關稅戰！台經院示警：復甦恐受阻「這產業」成海嘯第一排

傳蘋果將推出AI醫生服務最快將與iOS 19.4一起發布

發佈留言取消回覆