文字到圖像AI模型Imagen Google首次公開亮相

2022-11-03

Google對於發布其「文字到圖像」的人工智慧系統一直都非常謹慎。雖然該公司的 Imagen 模型的質量與 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 不相上下，但Google卻都還沒有向公眾提供該系統。但現在，Google終於宣布將以「非常有限」的形式將 Imagen 添加到其 AI Test Kitchen 應用程式中，以收集一些早期使用反饋。

作為Google 測試各種 AI 系統的一種方式，Google 的AI Test Kitchen 於今年早些時候推出。目前，該應用程式提供了幾種可以與Google的文字AI模型LaMDA 進行交流的方式。而現在，該公司將加入「有限」的Imagen。根據The Verge的報導，將會有兩種方式可以與 Imagen 進行交流，其為「City Dreamer」和「Wobble」。

在「City Dreamer」中，用戶可以要求模型從圍繞他們選擇的主題，如南瓜、牛仔布或顏色格等中，創造出一個「城市」。而Imagen 將創造出建築物模型和地標，如廣場、公寓、機場等，所有設計和SimCity非常相似。

而在「Wobble」中，用戶則可以創造一個「小怪物」。先選擇它的材質，如粘土、毛氈、杏仁糖、橡膠等，接著還可以為它穿上衣服，Imagen就可以生成一個怪物。用戶可以戳它或讓它「跳舞」。然而模型的輸出受限於一種程式設計師的「固定具體美學」。The Verge的記者表示，這個怪物看起來就像介於皮克斯為 Monsters, Inc.的設計和Spore中的角色之間。

然而，與其他文字到圖像AI相比，Imagen仍然受到極大限制。但Google是刻意如此的。Google 產品管理高級總監 Josh Woodward就表示，他們只是要從公眾那裡獲得對AI 系統的反饋，以及了解更多關於人們可能會如何使用或是「破壞」它們的資訊。Woodward表示，人們可能會在上面創造一些「有爭議」的東西，而引發一些問題。

Woodward也提到，人們對AI Test Kitchen的參與度遠遠超出他們的預期，測試這些功能將可以幫助人們了解，最先進的人工智慧模型的局限性和能力。然而，在其競爭對手 OpenAI 和 Stability AI 已經在爭相將文字轉圖像的模型商業化之際，Google會不會將這些模型推向更廣泛的公眾還是一個未知數。（編譯 / 莊閔棻）

延伸閱讀：Google Lamda 超現實的Google聊天技術

參考資料：The Verge

瀏覽 831 次

覺得不錯的話就分享出去吧！

標籤

2022-11-03

文字到圖像AI模型Imagen Google首次公開亮相

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

繼吉卜力後！ChatGPT再推「Monday」語音功能 超厭世女聲很有感

川普擬課25%關稅 蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維 鼓勵學生保有「好奇心」

成熟製程聯盟成形？日媒曝：聯電與格羅方德傳合併 官方回應「不予評論」

「請對我們狠一點！」英特爾執行長陳立武想拆掉舊文化 重新贏回工程師

美國關稅戰！台經院示警：復甦恐受阻 「這產業」成海嘯第一排

發佈留言 取消回覆

繼吉卜力後！ChatGPT再推「Monday」語音功能超厭世女聲很有感

川普擬課25%關稅蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

葉丙成龍華科大演講！分享AI時代新思維鼓勵學生保有「好奇心」

成熟製程聯盟成形？日媒曝：聯電與格羅方德傳合併官方回應「不予評論」

「請對我們狠一點！」英特爾執行長陳立武想拆掉舊文化重新贏回工程師

美國關稅戰！台經院示警：復甦恐受阻「這產業」成海嘯第一排

發佈留言取消回覆