OpenAI再推超真實語音 更有真感情

編譯/黃竣凱

人工智慧(AI)巨頭OpenAI終於再次推出 ChatGPT 的進階語音模式,向用戶展示 GPT-4o 的超現實語音回應功能,該版本將首先向部分 ChatGPT Plus 用戶開放,並預計2024年秋季逐步推廣到所有 Plus 用戶,儘管OpenAI 早在 5 月就曾展示了高級語音模式,但因為該聲音與演員史嘉蕾·喬韓森(Scarlett Johansson)過於相似,且太挑逗,而引起爭議,迫使OpenAI暫時下架該功能。

OpenAI 宣布 ChatGPT 進階語音模式已開放給部分 Plus 用戶使用。
OpenAI 宣布 ChatGPT 進階語音模式已開放給部分 Plus 用戶使用。(圖 / 取自X@OpenAI

感知語音中的情感語調

據報導,與現有的語音模式不同,進階語音模式使用了 GPT-4o 的多模態能力,無需輔助模型即可完成語音轉文字、文字處理和文字轉語音的全過程,大大降低了對話的延遲。OpenAI 還聲稱,GPT-4o 能夠感知語音中的情感語調,包括悲傷、興奮和歌唱。相較之下,ChatGPT 的舊語音解決方案則需要三個模型,包括一個將語音轉換為文本的模型、處理提示的GPT-4 ,和將文本轉換為語音的模型,耗費大量資源和時間。

更多新聞:OpenAI 延後「語音模式」  推出 Mac ChatGPT 桌面App

用戶將收到電子郵件

OpenAI 表示,正在逐步發布 ChatGPT 的新語音,以密切監控其使用情況,一些付費用戶將在 ChatGPT 應用程式中收到提醒,然後收到一封包含有關如何使用該應用程式說明的電子郵件。

OpenAI對安全的努力

自 OpenAI 演示以來,該公司已與來自 45 種不同語言的 100 多名外部測試人員進行了 GPT-4o 語音能力的測試,並計畫在八月初發布一份,關於這些安全措施的報告。新的進階語音模式將限制在 ChatGPT 的四個、與付費配音演員合作製作的預設聲音:Juniper、Breeze、Cove 和 Ember,OpenAI 發言人 Lindsay McCallum 表示,「ChatGPT 無法模仿其他人的聲音,包括個人和公眾人物,並且會阻止與這些預設聲音不同的輸出。」

參考資料:Tech CrunchMac Rumors

瀏覽 6,492 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button