GPT-4o新對手 法國公司推新對話式語言模型Moshi AI
編譯/夏洛特
隨著越來越多的公司投入開發人工智慧(AI)聊天機器人,OpenAI 的GPT-4o 又多了一個新競爭者,法國AI公司Kyutai Labs 推出了Moshi AI,一款能夠即時進行口頭回應的AI聊天機器人,在AI社群中引起了轟動,Moshi 的整個音訊語言模型都是內部開發的,可以調製聲音來表達情感,並以各種說話風格做出反應,與GPT-4o尚未推出的功能非常類似。
主要特性和功能
據報導, Kyutai Labs 透露,Moshi AI 的音訊語言模型,是由八名專家組成的專門團隊,歷時六個月開發而成,與傳統的AI助理不同,Moshi 是多功能原型,可以針對不同的應用客製化,目前大家可以免費使用該AI模型,但有只能對話五分鐘的限制,有趣的是,隨著 GPT-4o 的發布,OpenAI 也宣布了類似的語音功能,但因陷入爭議而尚未發布。
先進的功能和連接性
Moshi AI 的突出功能之一是,它能夠做出情感反應並調整聲音,適應不同的對話風格,此外該AI模型也有上網功能,可以對需要基於網路的回應的查詢,進行即時資訊檢索,值得注意的是,Moshi AI 只支援語音互動,並會完全省略文字提示。
使用者體驗和介面
Moshi AI 的介面專為簡單和高效而設計,讓使用者可以簡單使用,專注於語音輸入並透過文字顯示接收回應,而音訊持續時間、延遲和錯過的音訊通知等技術指標也會顯著顯示,根據使用過的人報告,Moshi AI互動期間的延遲極小,但在伺服器負載過重的情況下偶爾會出現 10到15 秒的延遲。
未來前景和開源計畫
Kyutai Labs 已宣布將開源 Moshi AI,但尚未公開在託管模型權重和程式碼的具體細節,一但可用,用戶將有機會在裝置上下載並安裝AI,在沒有網路的裝置上使用。儘管OpenAI 即將推出的 GPT-4o 也承諾增強語音功能,但仍在等待公開發布,而Moshi AI則為互動式AI技術的未來發展開創了先例,值得關注。
參考資料:latestly、gadgets360
瀏覽 774 次