OpenAI再推超真實語音更有真感情

2024-08-01

編譯／黃竣凱

人工智慧（AI）巨頭OpenAI終於再次推出 ChatGPT 的進階語音模式，向用戶展示 GPT-4o 的超現實語音回應功能，該版本將首先向部分 ChatGPT Plus 用戶開放，並預計2024年秋季逐步推廣到所有 Plus 用戶，儘管OpenAI 早在 5 月就曾展示了高級語音模式，但因為該聲音與演員史嘉蕾·喬韓森（Scarlett Johansson）過於相似，且太挑逗，而引起爭議，迫使OpenAI暫時下架該功能。

OpenAI 宣布 ChatGPT 進階語音模式已開放給部分 Plus 用戶使用。（圖 / 取自X@OpenAI）

感知語音中的情感語調

據報導，與現有的語音模式不同，進階語音模式使用了 GPT-4o 的多模態能力，無需輔助模型即可完成語音轉文字、文字處理和文字轉語音的全過程，大大降低了對話的延遲。OpenAI 還聲稱，GPT-4o 能夠感知語音中的情感語調，包括悲傷、興奮和歌唱。相較之下，ChatGPT 的舊語音解決方案則需要三個模型，包括一個將語音轉換為文本的模型、處理提示的GPT-4 ，和將文本轉換為語音的模型，耗費大量資源和時間。

用戶將收到電子郵件

OpenAI 表示，正在逐步發布 ChatGPT 的新語音，以密切監控其使用情況，一些付費用戶將在 ChatGPT 應用程式中收到提醒，然後收到一封包含有關如何使用該應用程式說明的電子郵件。

OpenAI對安全的努力

自 OpenAI 演示以來，該公司已與來自 45 種不同語言的 100 多名外部測試人員進行了 GPT-4o 語音能力的測試，並計畫在八月初發布一份，關於這些安全措施的報告。新的進階語音模式將限制在 ChatGPT 的四個、與付費配音演員合作製作的預設聲音：Juniper、Breeze、Cove 和 Ember，OpenAI 發言人 Lindsay McCallum 表示，「ChatGPT 無法模仿其他人的聲音，包括個人和公眾人物，並且會阻止與這些預設聲音不同的輸出。」

參考資料：Tech Crunch、Mac Rumors

瀏覽 7,536 次

覺得不錯的話就分享出去吧！

標籤

2024-08-01

OpenAI再推超真實語音更有真感情

感知語音中的情感語調

用戶將收到電子郵件

OpenAI對安全的努力

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

感知語音中的情感語調

用戶將收到電子郵件

OpenAI對安全的努力

推薦工作

延伸閱讀

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套 發生了什麼事？

台積電居「AI晶片碳排」之冠！綠色和平籲2030年全面用綠電

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片 比超級電腦快24倍

揚智穩健應對美國關稅衝擊 布局新興市場挹注營收動能

因應美國關稅政策搖擺 經濟部提「短中長期」計畫

企業如何因應美國關稅大刀？KPMG會計師給台商建議

發佈留言 取消回覆

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套發生了什麼事？

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片比超級電腦快24倍

揚智穩健應對美國關稅衝擊布局新興市場挹注營收動能

因應美國關稅政策搖擺經濟部提「短中長期」計畫

發佈留言取消回覆