Meta爆發AI魂 Llama 3.2產品應用一把罩
編譯/莊閔棻
在Meta Connect 2024活動上,執行長馬克·祖克柏展示了公司在虛擬實境(VR)、擴增實境(AR)以及人工智慧(AI)領域的最新進展,尤其強調了這些技術之間的融合應用,此次活動重點不僅在於VR/AR裝置,更聚焦於Meta的AI技術,掀起了一股AI技術浪潮。
Llama 3.2多模態大型語言模型發布
據報導,在Connect 2024大會上,祖克柏宣布了具備多模態能力的大型語言模型(LLM)Llama 3.2的推出,並特別強調了其對圖像的理解能力,他表示,Llama 3.2不僅提供了先進的技術模型,還允許用戶免費使用,並且這些模型已經整合到Meta的各種產品與應用中。
更多新聞:黃仁勳與祖克柏談未來:每家企業和職位都將擁有AI助理
Meta的AI助理Meta AI已經基於Llama 3.2運作,祖克柏聲稱該助理有望成為全球最受歡迎的AI助理,擁有接近5億的月活躍用戶,為展示這項技術,祖克柏還現場演示了如何透過簡單的文字指令,讓Meta AI修改圖像中的物品,例如將一件T恤變成綁染款式或給人物添加頭盔等。
Meta AI實現語音互動
Meta的AI助理現在可以在公司的應用中進行語音對話,使多人同時聆聽回答成為可能,祖克柏強調,語音互動將會超越文字聊天機器人的應用範圍,成為未來的重要趨勢,然而,他也指出語音互動的便捷性很重要,應用必須能夠輕鬆啟動,例如像Alexa那樣只需直接說話,而不是像目前的ChatGPT,需要解鎖設備並打開應用才能進行語音交流。
此外,Meta還提供了名人聲音選擇,像是John Cena、Judi Dench、Kristen Bell、Keegan-Michael Key和Awkwafina等名人的聲音,讓用戶的語音互動更個人化,這項功能已在Instagram、WhatsApp與Messenger中推出。
AI Studio推進聊天機器人創建技術
不只如此,Meta還在其用於創建聊天機器人的工具AI Studio中增加了新的功能,AI Studio允許用戶創建一個基於自己興趣或風格的AI角色,讓聊天機器人更能反映用戶的對話風格,新版本的AI Studio則進一步讓這些AI角色具備更加自然、具體化和互動性。
在現場演示中,祖克柏與一個模仿創作者Don Allen Stevenson III的AI角色進行互動,這個角色可以完全模擬Stevenson的頭部動作和嘴唇動畫,讓對話過程看起來彷彿真人在即時回答。
AI翻譯功能與深度偽造技術
Meta的AI技術已經實現了口型同步與面部動作模擬,並將這一技術應用於自動翻譯,用戶現在可以在Reels中錄製一段西班牙語影片,然後系統會自動生成英語的配音,並且會讓畫面看起來像是用戶原本在說英語,同樣地,用英語錄製的影片也可以生成流利的西班牙語配音,效果非常自然,創作者Ivan Acuña在演示中使用了這項技術,雖然他用西班牙語說話,但影片中的配音讓人感覺他正在說英語,效果幾近完美。
Llama 3.2引領AI領域開源革命
最後,祖克柏也進一步介紹了Llama 3.2模型的技術細節,特別指出其多模態的特性使得參數數量顯著增加,並推出了專為設備上的應用進行優化、參數較小的1B和3B模型,能讓開發者創建更安全且定制化的AI應用,值得注意的是,這些模型均為開源,扎克伯格稱Llama正在成為「AI行業的Linux」,代表著Meta在AI開源領域的重要地位。
參考資料:zdnet
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 1,741 次