AWS發布全新Nova模型家族全面進軍生成式AI領域

2024-12-04

編譯／黃竣凱

在亞馬遜雲端運算部門（AWS）的re:Invent大會上，該公司宣布推出名為Nova的多模態生成式人工智慧（AI）模型家族。Nova系列包括4款文本生成模型：Micro、Lite、Pro和Premier，其中前3款已於當日向AWS客戶開放，而Premier預計於2025年初推出。此外，AWS還發布了圖像生成模型Nova Canvas和影片生成模型NovaReel，進一步拓展生成式媒體應用。

全面進軍生成式AI領域，AWS發布全新Nova模型家族。（圖／取自YouTube@amazonwebservices）

文本生成模型功能各異

據報導，Nova系列文本生成模型針對15種語言（以英語為主）進行優化，並具有不同的處理能力。

Micro：專注文本生成，具備最低延遲，適合需要快速回應的場景。
Lite：能處理文本、影像與影片輸入，兼顧速度與多模態處理能力。
Pro：平衡準確性、速度與成本，適合各類任務。
Premier：功能最強大，設計用於處理複雜工作負載，並可協助創建客製化模型。

這些模型支援的字元（token），從Micro的12.8萬到Lite和Pro的30萬不等，未來模型更是將擴展至超過200萬字元，進一步提升處理能力。

生成式媒體的強大工具

而Nova Canvas則提供圖像生成與編輯功能，用戶可透過指令生成圖像，調整背景、色彩與版面設計；而Nova Reel則專注影片生成，可從文字或參考圖像生成最長6秒的影片，並支持鏡頭移動如平移、360度旋轉與縮放等功能。未來，Reel將能生成長達兩分鐘的影片，進一步擴展應用方式。

Nova加入內容安全防護

AWS強調，Nova系列模型內建責任使用控制，包括浮水印與內容審核機制，能減少不良內容的生成，如錯誤資訊、非法圖像或其他有害材料。此外，AWS表示將繼續完善安全措施以應對資訊誤導和違法行為。

語音與多模態模型蓄勢待發

AWS也預計於2025年第一季，推出語音到語音轉換模型，該模型能解讀語調與節奏，生成自然且擬人化的語音。到2025年中，AWS還將發布「任意輸入到任意輸出」（any-to-any）的生成模型，支援文本、語音、圖像與影片的自由轉換，應用於翻譯、內容編輯及AI助手等領域。

AWS執行長Andy Jassy說：「這是尖端模型未來的發展方向，將徹底改變其建構與應用方式。」Nova系列的推出標誌著AWS在生成式AI領域邁出重要一步，也為AI應用的未來增添更多可能性。

參考資料：Tech Crunch

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

瀏覽 969 次

覺得不錯的話就分享出去吧！

標籤

2024-12-04

AWS發布全新Nova模型家族全面進軍生成式AI領域

文本生成模型功能各異

生成式媒體的強大工具

Nova加入內容安全防護

語音與多模態模型蓄勢待發

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

文本生成模型功能各異

生成式媒體的強大工具

Nova加入內容安全防護

語音與多模態模型蓄勢待發

推薦工作

延伸閱讀

小心「冒牌貨症狀群」上身！解構焦慮「五大招」重拾自信與平衡

繼吉卜力後！ChatGPT再推「Monday」語音功能 超厭世女聲很有感

川普擬課25%關稅 蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維 鼓勵學生保有「好奇心」

聯電新加坡新廠開幕 第1期預計2026年投產、月產能估3萬片

川普「對等關稅」實施倒數 郭智輝：因應辦法會讓大家知道

發佈留言 取消回覆

繼吉卜力後！ChatGPT再推「Monday」語音功能超厭世女聲很有感

川普擬課25%關稅蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維鼓勵學生保有「好奇心」

聯電新加坡新廠開幕第1期預計2026年投產、月產能估3萬片

川普「對等關稅」實施倒數郭智輝：因應辦法會讓大家知道

發佈留言取消回覆