只需15秒即可複製聲音?OpenAI 承諾嚴格控管
記者/劉閔
隨著技術不斷突破,美國人工智慧開發公司 OpenAI 除了開發出利用 AI 生成文字、圖片與影片外,現在更打造可以複製語音的工具。然而考量到遭濫用風險,OpenAI 現階段僅提供合作夥伴使用,暫時不打算對外開放。
僅需 15 秒聲音樣本 即可快速複製聲音
日前 OpenAI 披露一款語音複製工具「Voice Engine」,根據公開的初期測試結果得知,這項技術能夠以令人信服的人聲朗讀文字。而與之前生成語音內容不同的是,「Voice Engine」能夠以就像某個人講話的語調和節奏,生成一段談話。OpenAI 聲稱,只需要短短 15 秒的說話聲音樣本,即可快速複製出此人聲音,且生成結果並不受樣本與種限制。例如母語為英語者,也能生成用法語、西班牙語、中文或其他語言講話。
更多新聞:趕快更新!輝達AI大型語言模型Chat RTX發現安全漏洞
AI 生成語音真假難辨 暴露資安風險
然而這樣的技術問世,遭到濫用的嚴重性也隨之浮現。《紐約時報》、《美聯社》等皆報導表示,OpenAI 開始進軍語音技術領域並申請商標,然而經由分享測試結果發現,這項技術可能被拿來破壞線上銀行帳戶等聲紋認證(voice authenticator)。此外,適逢今年是選舉年,若製造出類似某關鍵人物聲音的深偽假資訊恐誤導群眾,因此認為 OpenAI 現階段對於更廣泛的發布應採取謹慎態度。
對此 OpenAI 也意識到這些問題,並指出目前僅與少數組織和開發員測試這項功能,掛保證表示現階段還不會廣泛釋出這項技術。OpenAI 在聲明中提及:「我們了解生成類似某人聲音的談話有嚴重風險,尤其在選舉年更是備受關注」。而 Voice Engine 測試夥伴已經同意規範,即未經當事人同意不會模仿其聲音,而且會揭露以 AI 生成的語音。
瀏覽 405 次