OpenAI再推超真實語音更有真感情

2024-08-01

編譯／黃竣凱

人工智慧（AI）巨頭OpenAI終於再次推出 ChatGPT 的進階語音模式，向用戶展示 GPT-4o 的超現實語音回應功能，該版本將首先向部分 ChatGPT Plus 用戶開放，並預計2024年秋季逐步推廣到所有 Plus 用戶，儘管OpenAI 早在 5 月就曾展示了高級語音模式，但因為該聲音與演員史嘉蕾·喬韓森（Scarlett Johansson）過於相似，且太挑逗，而引起爭議，迫使OpenAI暫時下架該功能。

OpenAI 宣布 ChatGPT 進階語音模式已開放給部分 Plus 用戶使用。（圖 / 取自X@OpenAI）

感知語音中的情感語調

據報導，與現有的語音模式不同，進階語音模式使用了 GPT-4o 的多模態能力，無需輔助模型即可完成語音轉文字、文字處理和文字轉語音的全過程，大大降低了對話的延遲。OpenAI 還聲稱，GPT-4o 能夠感知語音中的情感語調，包括悲傷、興奮和歌唱。相較之下，ChatGPT 的舊語音解決方案則需要三個模型，包括一個將語音轉換為文本的模型、處理提示的GPT-4 ，和將文本轉換為語音的模型，耗費大量資源和時間。

用戶將收到電子郵件

OpenAI 表示，正在逐步發布 ChatGPT 的新語音，以密切監控其使用情況，一些付費用戶將在 ChatGPT 應用程式中收到提醒，然後收到一封包含有關如何使用該應用程式說明的電子郵件。

OpenAI對安全的努力

自 OpenAI 演示以來，該公司已與來自 45 種不同語言的 100 多名外部測試人員進行了 GPT-4o 語音能力的測試，並計畫在八月初發布一份，關於這些安全措施的報告。新的進階語音模式將限制在 ChatGPT 的四個、與付費配音演員合作製作的預設聲音：Juniper、Breeze、Cove 和 Ember，OpenAI 發言人 Lindsay McCallum 表示，「ChatGPT 無法模仿其他人的聲音，包括個人和公眾人物，並且會阻止與這些預設聲音不同的輸出。」

參考資料：Tech Crunch、Mac Rumors

瀏覽 7,546 次

覺得不錯的話就分享出去吧！

標籤

2024-08-01

OpenAI再推超真實語音更有真感情

感知語音中的情感語調

用戶將收到電子郵件

OpenAI對安全的努力

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

感知語音中的情感語調

用戶將收到電子郵件

OpenAI對安全的努力

推薦工作

延伸閱讀

AIF攜高通推「AI化大調查報告」！曝近7成企業對AI僅有初步認知

川普加徵關稅嚴控晶片出口 黃仁勳西裝現身北京：堅持深耕中國

關稅特別條例規模擴增？ 卓榮泰：880億產業支持再加碼50億元

關稅談判日、墨、義有大進展 川普：跟中國快要達成協議了！

企業憂關稅衝擊存準率 央行釋疑：新台幣資金流動充裕

TrendForce：美國關稅刺激產業拉貨保庫存 記憶體市場價格恐再變動

發佈留言 取消回覆

川普加徵關稅嚴控晶片出口黃仁勳西裝現身北京：堅持深耕中國

關稅特別條例規模擴增？卓榮泰：880億產業支持再加碼50億元

關稅談判日、墨、義有大進展川普：跟中國快要達成協議了！

企業憂關稅衝擊存準率央行釋疑：新台幣資金流動充裕

TrendForce：美國關稅刺激產業拉貨保庫存記憶體市場價格恐再變動

發佈留言取消回覆