OpenAI推出Shap-E模型 可將文字、圖片轉成3D
記者/竹二
自ChatGPT問世以來,生成式AI引爆人工智慧熱潮,應用範圍也越來越廣,除了以文字提示產生更多文字、圖片內容之外,新的AI模型也開始有能力產出3D立體圖形了,而且產出速度更快。
隨著近半年以來AI大爆發,多數人對於ChatGPT、Midjourney / DALL·E 2已經不感到陌生。近日OpenAI又新推出可將文字和圖片轉成3D圖形的Shap-E模型,成果可在Paint 3D中開啟,甚至能夠轉成用於3D列印機輸出的STL檔案。
Shap-E的原理是直接建立物體的輪廓,並採用稱為神經輻射場(Neural Radiance Fields,NeRF)的功能,以克服初期模型的模糊性,NeRF與VR/AR使用的技術相同,可以讓3D場景看起來更逼真。目前Shap-E可在GitHub下載,並在個人電腦上安裝執行,不需要OpenAI API密鑰,能夠免費使用。
雖然可以將文字和圖片轉成3D圖形的技術確實充滿發展潛力,不過,根據外國媒體Tom’s Hardware測試後發現,由於OpenAI並沒有提供Shap-E的詳細說明,只說明要使用Python pip指令來安裝,所以實際安裝到產出3D圖形的過程,讓他們耗費了數個小時的時間摸索,且目前測試的成果普遍仍是低解析度、欠缺細節。
根據Tom’s Hardware的測試,他們指出,以搭載RTX 3080顯卡和Ryzen 9 5900X處理器的桌機跑Shap-E,完成繪製大約需要5分鐘,不過當嘗試在搭載Intel第8代U系列處理器結合內建顯卡的舊款筆電,1個小時只繪製約3%。此外,他們也提醒,由於Shap-E不支援Nvidia以外的顯卡,所以使用者必須先確保擁有Nvidia顯卡,硬體規格也需要達到一定程度,花費時間才會短。
瀏覽 1,206 次