OpenAI再推超真實語音 更有真感情
編譯/黃竣凱
人工智慧(AI)巨頭OpenAI終於再次推出 ChatGPT 的進階語音模式,向用戶展示 GPT-4o 的超現實語音回應功能,該版本將首先向部分 ChatGPT Plus 用戶開放,並預計2024年秋季逐步推廣到所有 Plus 用戶,儘管OpenAI 早在 5 月就曾展示了高級語音模式,但因為該聲音與演員史嘉蕾·喬韓森(Scarlett Johansson)過於相似,且太挑逗,而引起爭議,迫使OpenAI暫時下架該功能。
感知語音中的情感語調
據報導,與現有的語音模式不同,進階語音模式使用了 GPT-4o 的多模態能力,無需輔助模型即可完成語音轉文字、文字處理和文字轉語音的全過程,大大降低了對話的延遲。OpenAI 還聲稱,GPT-4o 能夠感知語音中的情感語調,包括悲傷、興奮和歌唱。相較之下,ChatGPT 的舊語音解決方案則需要三個模型,包括一個將語音轉換為文本的模型、處理提示的GPT-4 ,和將文本轉換為語音的模型,耗費大量資源和時間。
更多新聞:OpenAI 延後「語音模式」 推出 Mac ChatGPT 桌面App
用戶將收到電子郵件
OpenAI 表示,正在逐步發布 ChatGPT 的新語音,以密切監控其使用情況,一些付費用戶將在 ChatGPT 應用程式中收到提醒,然後收到一封包含有關如何使用該應用程式說明的電子郵件。
OpenAI對安全的努力
自 OpenAI 演示以來,該公司已與來自 45 種不同語言的 100 多名外部測試人員進行了 GPT-4o 語音能力的測試,並計畫在八月初發布一份,關於這些安全措施的報告。新的進階語音模式將限制在 ChatGPT 的四個、與付費配音演員合作製作的預設聲音:Juniper、Breeze、Cove 和 Ember,OpenAI 發言人 Lindsay McCallum 表示,「ChatGPT 無法模仿其他人的聲音,包括個人和公眾人物,並且會阻止與這些預設聲音不同的輸出。」
參考資料:Tech Crunch、Mac Rumors
瀏覽 6,492 次