免費ChatGPT圖像生成「太搶手」 OpenAI執行長才宣佈開發又改「暫緩推出」

記者 鄧天心/綜合報導

OpenAI執行長Sam Altman於美國時間3月25日(台灣時間3月26日)直播宣布:ChatGPT的圖像生成功能將全面升級,採用最新的GPT-4o模型,並計畫向所有用戶開放,連免費用戶也在列,但沒想到隔天,他又在X(前Twitter)上發文坦承:「這項功能比我預期的還受歡迎,我們會延後免費層的推出。」這等於為全球數百萬用戶的期待踩了一點煞車。

OpenAI這週正式宣布,ChatGPT圖片生成功能現在升級到最新的GPT-4o模型。圖片來源:Sam Altman on X

更多新聞:任天堂無預警突襲!今晚舉辦Nintendo Direct發表會更新遊戲情報

GPT-4o開始聽得懂、畫得準、還能改圖?

GPT-4o是OpenAI最新的多模態模型,可以處理文字、圖片、聲音、影片,這次在ChatGPT裡實裝圖像生成功能,等於讓AI「直接從文字畫圖」,不再需要透過外掛或呼叫外部模型(DALL·E)。

《The Verge》的專訪中OpenAI團隊提到,GPT-4o使用一種「自回歸方式」畫圖,簡單說就是它會從左到右、從上到下逐步產出畫面,就像你用鉛筆慢慢畫出一幅圖。這讓它在「理解物件關係」這件事上精準很多。

OpenAI研究主管Gabriel Goh指出:「GPT-4o可以同時處理15到20個物件,而且能正確理解每個物件的屬性與關係。」這在以往是幾乎不可能的事,因為多數模型在超過8個物件後就開始亂套。

這次另一個超有感的升級是:圖像中的文字終於能準確渲染。

以前不管你怎麼下提示,AI都會畫出像是火星文的內容,這讓教學、報告、簡報設計基本上不能用。但這次更新後,在OpenAI直播的示範中,GPT-4o成功產出了一整頁清晰的講稿,零錯字、排版正常、看起來像是你自己設計的。

Sam Altman在直播中還笑說:「能畫出正確的文字,本來應該不是一件值得驚嘆的事。但我們等這一天,等太久了。」這也是為什麼很多設計相關媒體,GPT-4o這次不只是在功能上升級,更是象徵AI從「實驗用」走向「可以被專業應用」的重要節點。

沒想到反應太熱情 免費版推出時間又被延後

目前這項圖像生成功能已開放給Plus、Pro、Team用戶使用,而免費版的ChatGPT也會陸續開放,不過Altman也坦言:「我們低估了大家的熱情,免費層推出會稍微慢一些,因為需求量太大。」

也就是說,如果你是免費用戶,現在打不開圖片生成功能,也不需要驚慌,幾週內就會開放,只是得稍微排一下隊,另外,OpenAI也計畫將這項功能整合進企業用的API,預計會開放給開發者做商用測試,未來你可能會在各種平台看到這項技術的應用——包括設計App、遊戲工具、教育網站。

這次愛上ChatGPT的理由:原來我變成吉卜力角色長這樣

這波更新也瞬間引爆社群熱潮,很多人開始用ChatGPT畫出吉卜力風格的自畫像,結果一發不可收拾,《Axios》的觀察,這波風潮不只在X(前Twitter)上洗版,還燒進Reddit和Pinterest。

但也有些設計師認為這些圖「太人工」、「沒情感」,但現在AI圖像正在進入一個新的階段:不是取代藝術家,而是幫助非設計師完成想像。

《WSJ》就提到,GoDaddy等公司已經開始測試用AI生成商品圖片、卡片模版,甚至商業簡報圖片,你只需要一段文字、幾張草圖,GPT-4o就能幫你「畫出一張像樣的圖」,還可以來回調整、換角色、變風格。

過去AI圖像生成總給人一種「試試看」的感覺,真正能用在日常工作上的機會不多。但GPT-4o的這次進化,讓人開始認真思考:我們是不是可以把AI當成真正的創作夥伴?

它不只是畫圖快,還能理解語境、跟你互動、照你的喜好調整圖像,這代表它比過去的模型多了很多「理解你」的能力。

或許未來的圖像設計、插畫創作,會變得不那麼孤單,你可以用話語指揮它創作、細節上修正、風格上微調,它就像是一個美術系出身又很聽話的助理,24小時不休息,GPT-4o不是完美,但它真的讓AI圖片生成,從玩具升級成工具,如果你還沒試過,也許這次可以開始動手玩玩看!

瀏覽 1,977 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button