GPT-4識圖未開放之際已有MiniGPT-4推出同功能AI！

2023-04-21

記者／潘冠霖

OpenAI在上個月推出了GPT-4，最受外界矚目的大概就是識圖功能，只要放上圖片就可以獲得相對應的答覆或分析，不過，可惜的是此一功能目前尚未開放，而似乎已有用戶等不及，打算自己動手建立一個生成式AI模型。

MiniGPT-4目前已開放試用，OpenAI有的功能它都有。圖/MiniGPT-4

來自沙烏地阿拉伯沙特的阿卜杜拉國王科技大學（KAUST），有研究團隊開發了類似GPT-4的AI模型，並將其命名為「MiniGPT-4」。MiniGPT-4展現出諸多和GPT-4相仿的能力，如上傳一道菜的圖，MiniGPT-4就能給出食譜、從草圖創建網站，以及可以解釋一張圖片的笑點。GPT-4日前展現出的功能，MiniGPT-4可說是都能駕馭。

研究團隊表示，能達到這麼好的效果，過程卻不複雜。MiniGPT-4進行了兩個階段的訓練。第一個傳統的預訓練階段使用大約 5 百萬對齊的圖像文本對，在 4 個A100 GPU上使用10小時進行訓練。第一階段後，Vicuna 能夠理解圖像。但是其文字生成能力受到了很大的影響。

為了解決這個問題並提高可用性，研究者提出了一種新穎的方式，通過模型本身和ChatGPT一起創建高質量的圖像文本對。基於此目的，該研究創建了一個小而高質量的數據集（總共 3500 對）。第二個微調階段使用對話模板在此數據集上進行訓練，以顯著提高其生成可靠性和整體可用性。這個階段具有高效的計算能力，只需要一張A100GPU大約7分鐘即可完成。

雖然目前GPT-4還不能使用，但用戶們可以試試看已開放的MiniGPT-4的Demo，可以說效果絕不輸GPT-4。研究團隊也指出，他們正在準備一個更羽量級的版本，部署起來只需要23GB的VRAM。

瀏覽 21,947 次

覺得不錯的話就分享出去吧！

標籤

2023-04-21

GPT-4識圖未開放之際已有MiniGPT-4推出同功能AI！

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

OpenAI推語音文字互轉模型！能指定說話風格、助攻AI語音應用

OpenAI承認了！ChatGPT產品線太過複雜 將進行簡化並整合

ChatGPT能準確評估飲食？與營養師相比 誰更勝一熟？

對戰OpenAI、DeepSeek！Google Gemini 2.0全新升級 哪種模型適合你一次看

成功商業人士都在用！10個ChatGPT祕技公開 產出高價值內容

2025想轉職看過來 《科技島》推薦6款「AI求職信」生成器

發佈留言 取消回覆

OpenAI承認了！ChatGPT產品線太過複雜將進行簡化並整合

ChatGPT能準確評估飲食？與營養師相比誰更勝一熟？

對戰OpenAI、DeepSeek！Google Gemini 2.0全新升級哪種模型適合你一次看

成功商業人士都在用！10個ChatGPT祕技公開產出高價值內容

2025想轉職看過來《科技島》推薦6款「AI求職信」生成器

發佈留言取消回覆