Meta新AI項目 輸入文字就能生成影片

透過 DALL-E 2 和 Stable Diffusion 等可用的公開AI影像生成器,人工智慧(AI)在由少數單詞生成的影像方面越來越進步。而現在,Meta 研究人員將更進一步,他們正使用AI將文字描述做成影片。

Meta新AI項目 輸入文字就能生成影片(示意圖:123RF)

Meta的首席執行長馬克·祖克柏,在臉書上發布了一段 20 秒的影片,公開了關於這項名為 Make-A-Video的技術。這影片包含了Meta 研究人員輸入「一隻泰迪熊在畫自畫像」、「一隻戴著針織帽的樹懶寶寶試圖找出一台筆記本電腦」、「一艘登陸火星的宇宙飛船」,以及「機器人在海浪中衝浪」等文字後,由AI所做出的影片。

雖然每個影片解析度低、不精緻,還只有幾秒鐘長,但隨著AI系統越來越擅長從文字生成影像,這個影片展示了AI研究正在採取的新方向。

但是,這技術也令人擔憂。研究人員指出,與從文字生成圖片的人工智慧系統一樣,他們的文字到圖片人工智慧模型是在網路數據上進行訓練的,這代表了AI學會,而且還可能會「誇大社會偏見,包括有害的偏見」。Meta研究人員注意到,雖然AI確實過濾了「工作場所不宜」的內容和有害詞的數據,但由於數據集包含了數百萬張圖片和文字,因此還是無法刪除所有此類內容。

在臉書貼文中,祖克柏也指出從幾個單詞生成影片是多麼棘手。他提到,生成影片要比生成照片困難得多。除了正確生成每個像素之外,系統還必須預測它們會如何隨時間變化。

祖克柏表示,Meta 計劃在未來分享 Make-A-Video 項目作為此領域的示範。(記者/莊閔棻)

參考資料:祖克柏Make-A-Video貼文CNN

瀏覽 748 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button