ChatGPT Vision功能誰能用又怎麼用?

編譯/夏洛特

隨著大型語言模型 (LLM) 興起,人工智慧(AI)技術顯著擴展,進入廉價智慧型手機和旗艦設備等領域,而ChatGPT Vision功能推出更帶來AI能力的重大飛躍。最初此功能僅限高級用戶使用,但隨著GPT-4o的到來,所有用戶都可以使用該功能。

要使用ChatGPT Vision,使用者可以登入chat.openai.com或開啟行動App。示意圖。圖 / 123RF

ChatGPT Vision是什麼

ChatGPT Vision功能,允許使用者指示 AI 分析影像輸入,並提供相關的資訊或解答問題,是一個結合AI和圖像辨識技術的功能,該功能自 2022 年 3 月培訓完成以來不斷開發和完善,並經過了廣泛的測試,降低假資訊、刻板印象和毫無根據的推論的風險。

更多新聞:AI怎麼了?ChatGPT、Claude 和 Perplexity 同時大當機

誰可以用ChatGPT Vision

ChatGPT Vision最初是針對 ChatGPT Plus 用戶的高級功能,但透過最新的 GPT-4o,現在所有用戶都可以使用。但要注意的是,免費用戶有使用限制,而Plus 訂閱者則有更多並優先的使用權。

若要使用ChatGPT Vision,使用者可以登入chat.openai.com或開啟行動App,然後在出現提示時選擇「立即嘗試」即可,或是點擊訊息框左側的圖像符號,提供圖像或複製圖像網址給機器人,ChatGPT 就會分析圖像並回應有關圖像的查詢。

實際應用

  • 計算食物成分和卡路里

透過上傳食物圖像,使用者可以要求 ChatGPT 識別圖片中食物的成分,並估計卡路里含量。

  • 轉錄手寫筆記

ChatGPT Vision功能也擅長將手寫筆記轉換為打字文本,甚至可以識別英語以外的符號,使數位筆記保存更加高效。

  • 解決驗證碼

雖然該功能並不完美,但 ChatGPT Vision 也可以嘗試透過辨識扭曲影像中的字元,解決用戶可能看不懂驗證碼的困擾。

  • 解釋圖片

ChatGPT Vision也可以解釋影像,包括一些不完美,或是包含文字和插圖的圖片,大家可以要求ChatGPT 解釋資訊圖表並向其提問,甚至還能要求機器人「重現」該圖片。

  • 解數學問題

ChatGPT Vision不僅限於圖像辨識,還能夠解答數學問題,只要上傳算式或是問題的圖片,ChatGPT Vision就能提供準確的答案。

  • 生成圖像

最後,ChatGPT Vision不僅限於分析影像,更是還可以使用 DALL-E 3 根據使用者描述「生成圖像」。

參考資料:Android Police

瀏覽 478 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button