人工智慧「創作」作品 生成式AI在矽谷逐漸抬頭
在當前人工智慧的技術中,存在一項特別的「繪圖技術」,只要給出一段您對於「作品」的描述,無論您的要求多荒唐,該人工智慧技術都會盡力地為您生產出一張與描述相符的圖片。
此類圖像生成的技術,可能看起來很像是玩具或是某種線上遊戲,但它正是所謂「生成式模型」或是「生成式AI」(generative AI)。
《消費者新聞與商業頻道》報導,NextView Ventures 的風險投資家 David Beisel 說:「在過去三個月裡,『生成式AI』這個詞從乏人問津,成為了流行用語。」
目前的人工智慧領域已經發展了約莫五年,其中多數技術與辨識、分析現有數據相關,其中也包含識別手機照片中是否有貓咪或是其他動物,甚至是您的好朋友或家人。相反地,生成式AI能夠產出新事物。換句話說,除了分析之外,更主要的是,它正在「創造」。
生成式AI的圖像生成利用了「深度學習」(deep learning)的技術。這項技術通常用在大數據的訓練模型,並且設法讓程式本身理解數據之間的關係,相關的運用可以從圖片識別或是文本翻譯發現。然而,圖像生成的技術卻是把這個步驟顛倒過來。
生成式AI並非是單純地把英語翻譯成中文,而是將簡單的英語短語轉譯為圖像。由此可知,這項技術可以大略地拆分為兩個部分:「處理初始短語」與「數據轉換為圖像」。
來自矽谷的創新公司 OpenAI 在2021年向大眾揭示了第一個圖像生成器「DALL-E」,並在今年發佈了第二代版本「DALL-E 2」。此外,目前在網路上也有開放使用的版本「DALL-E mini」,使用者可以在瀏覽器中輸數一個短語並在兩分鐘內獲得相關圖片,目前已經改名為「Craiyon」。
在《消費者新聞與商業頻道》報導中顯示,目前透過這項技術已晶有超過10億張「新作品」。此外,在 Twitter 也有一個超過百萬追蹤的帳號,定期提供荒誕或是驚奇的照片,例如:從水龍頭跑出來的義式番茄醬、越南戰爭中的小黃人。
不過受到影響最大的莫過於一款名為「Stable Diffusion」軟體。使用者可以在 GitHub 中使用這款軟體的代碼,並且應用在電腦中,例如:透過插件轉換到 Adobe Photoshop 中,直接把人工智慧產出的圖片變成可以使用的素材。
這項技術已經獲得大量的投資。除了前述所提及的 OpenAI 從微軟和 Khosla Ventures 獲得超過10億美元的資金外,另外一家名為 Hugging Face 的公司在獲得 Lux Capital 與 Sequoia Capital 獲得資金挹注後,估值已經來到20億美元。此外,Stable Fussion 的製造商 Stability AI 也正在籌措10億美元的風險投資。《消費者新聞與商業頻道》報導,鑑於生成式AI的運算量十分強大,亞馬遜、微軟以及 Google 等雲端供應商也能夠從中獲益;馬克・祖克柏(Mark Zuckerberg)的團隊也於今年9月著手了人工智慧生產影片的研發計畫。
不過,生成式AI帶來了諸多便捷性以及話題性,也同時造成許多在倫理道德的隱憂。像是9月初就曾傳出有人使用人工智慧程式繪圖參賽並且奪冠,最後惹怒全場參賽者,更有「藝術已死」的評論隨即出現。除此之外,也有「欺騙消費者」、「圖片造假」、「版權歸屬」等多項問題。(編譯/戴偉丞)
延伸閱讀:科技評論:Midjourney 人工智慧可以打敗藝術家嗎?|專家論點【朱楚文】
資料來源:CNBC
瀏覽 1,432 次