Google開放測試AI模型Imagen 6國家先行

挑戰OpenAI的 DALL-E 2、Stability AI的Stable Diffusion,以及Meta的Make-A-Video,Google上周在AI大會上正式宣布,可以把文字轉成影片的AI模型Imagen,將透過測試用App AI Test Kitchen開放給特定國家用戶測試。此外,另一AI模型Phenaki產生的影片也首次問世。

Google的執行長Sundar Pichai在Twitter上貼出一段藍色汽球與長頸鹿的影片後說明,這是Google第一次分享以文字提示產生具有條理、並以Imagen Video系統增進品質的超高解析度影片。

所謂的Imagen和Phenaki,是Google在上個月公布的2個文字轉影片的AI模型,Imagen強調具有深刻語言理解能力,可以生成相片等級的影片,而Phenaki則是可以把多段文字提示合成長度較長、包含不同場景的影片。不同於Imagen只能生成數秒的短影片,Phenaki可以生成長數分鐘的影片。

Google的執行長Sundar Pichai貼出一段影片,這是Google第一次分享Imagen影片。(圖/截取自Twitter)

Imagen將透過AI Test Kitchen App開放給美國、英國、加拿大、澳洲、紐西蘭及肯亞的英語用戶進行測試。Google於8月宣布AI Test Kitchen App主要用於測試Google AI技術,Google第一批測試的技術是對話AI模型LaMDA(Language Model for Dialogue Applications)。

根據外國媒體9to5Google的報導指出,最新在AI Test Kitchen App測試的Imagen共有2個主題,一個是City Dreamer,用戶輸入關於對城市想像的一連串文字提示,由Imagen生成影片;另一個是Wobble,也是由用戶輸入文字提示讓Imagen生成影片,只是主題變成了怪物。

Google希望能藉此挑戰OpenAI的 DALL-E 2、Stability AI的Stable Diffusion,或是Meta的Make-A-Video。OpenAI的DALL-E 2在今年9月正式開放所有用戶試用,而Meta的Make-A-Video也已經在9月底開放給社群試用。(記者/竹二)

瀏覽 757 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button