Google釋出「臉部編輯功能」 手機也能即時生成圖片

記者/竹二

Google近日在MediaPipe FaceStylizer平台推出臉部編輯功能,針對生成對抗網路(Generative Adversarial Network,GAN)的高運算複雜度提出解決方案,將原本需要在伺服器執行的臉部編輯模型輕量化,變成可以在手機上運作的少樣本臉部風格模型,提供高品質臉部圖片生成,並且透過平台公開,讓用戶能夠自訂部署到行動裝置上。

Google近日在MediaPipe FaceStylizer平台推出臉部編輯功能,針對生成對抗網路(GAN)的高運算複雜度提出解決方案。(圖/截取自Google Research)

GAN可鑑別生成式圖像是否真實

所謂的「生成對抗網路」是一種深度學習模型,包含生成器和鑑別器2個部分,生成器負責生成圖像,鑑別器的任務則是分辨圖像是不是真實。而MediaPipe FaceStylizer則是針對臉部風格化設計,具有臉部生成器和臉部編碼器2個主要元件,臉部編碼器的主要功能在於生成對抗網路反轉(GAN Inversion),將圖像映射到生成器的潛在碼(Latent Code)中。

更多新聞:Adobe推出生成式AI Firefly 可用點數「快速」生成圖像

而這次Google所釋出的「生成對抗網路反轉」,簡單來說是指「當存在一張圖片,想要知道生成對抗網路的生成器中,是否可以產生該張圖片的潛在碼」的過程。臉部編碼器就是找出潛在碼的元件,以便臉部生成器可以再次使用該潛在碼,生成相同或是類似的臉部圖像。

Google公開MediaPipe FaceStylizer

據了解,研究人員為了最佳化生成器,特別設計了一些損失函式,並結合常用的生成對抗網路損失函式,藉以最小化生成器的錯誤,從一個較為複雜的StyleGAN模型提煉出一個更輕量的生成器BlazeStyleGAN,輕量生成器雖然容量小、執行快,但生成的圖片品質仍然很高。

目前已知Google將會透過MediaPipe平台向用戶公開MediaPipe FaceStylizer,而輕量的BlazeStyleGAN模型經過訓練之後,只需要幾行程式碼,就能透過MediaPipe Tasks FaceStylizer API部署,也已經匯出的TFLite模型到各平台的應用程式。

瀏覽 40,548 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button