Meta發表新AI Voicebox 可跨6國語言風格轉換

記者/竹二

除了積極布局元宇宙之外,Meta在人工智慧的發展也漸漸顯露,近日Meta端出了一款文字轉語音技術Voicebox,可以執行語音生成任務,像是編輯、採樣和語音風格塑造等,可以用來幫助創作者輕鬆編輯音軌、讓視障人士能夠用他們的聲音聽到朋友的書面訊息,並讓人們能夠用自己的聲音說任何外語。

Meta發表文字轉語音技術Voicebox,可以執行語音生成任務,像是編輯、採樣和語音風格塑造等。(圖/截取自Meta)

Voicebox對於語音的處理相當多元,號稱是一個All-in-one的語音生成式模型,只要輸入文字便可透過AI唸出,還可以呈現不同的風格並直接翻譯成6種語言,包含英文、法文、德文、西班牙文、波蘭文與葡萄牙文等。

根據Meta官方的說明,Voicebox可以透過採樣語音片段來學習對方語調的功能,進化到只需要2秒的語音樣本,就可以達成目的,還能被用在消除語音內容之中所不小心錄到的雜訊、雜音上,可輕鬆幫忙消除錄製過程中可能不小心出現的狗吠、車聲、音樂、背景說話聲等。

就官方的說法,這就像是語音版的橡皮擦編輯功能一樣好用,Voicebox將可以幫助元宇宙世界中的NPC非實際人物的角色,達到更自然的語音對話能力,至於使用者本身,則是可以透過Voicebox來消弭語言之間的限制。


Meta表示,現階段他們並沒有計劃向公眾發佈Voicebox應用程式和開源程式碼,如同AI換臉技術被濫用在詐騙上,Meta坦言他們有意識到這項工具帶來濫用和意外傷害的可能性,並聲稱為此構建了一個分類器,以區分真實的音頻和Voicebox生成的語音,希望減輕未來可能存在的風險。

瀏覽 13,048 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button