ChatGPT Vision功能誰能用又怎麼用？

2024-06-06

編譯／夏洛特

隨著大型語言模型（LLM）興起，人工智慧（AI）技術顯著擴展，進入廉價智慧型手機和旗艦設備等領域，而ChatGPT Vision功能推出更帶來AI能力的重大飛躍。最初此功能僅限高級用戶使用，但隨著GPT-4o的到來，所有用戶都可以使用該功能。

ChatGPT Vision是什麼

ChatGPT Vision功能，允許使用者指示 AI 分析影像輸入，並提供相關的資訊或解答問題，是一個結合AI和圖像辨識技術的功能，該功能自 2022 年 3 月培訓完成以來不斷開發和完善，並經過了廣泛的測試，降低假資訊、刻板印象和毫無根據的推論的風險。

ChatGPT Vision最初是針對 ChatGPT Plus 用戶的高級功能，但透過最新的 GPT-4o，現在所有用戶都可以使用。但要注意的是，免費用戶有使用限制，而Plus 訂閱者則有更多並優先的使用權。

若要使用ChatGPT Vision，使用者可以登入chat.openai.com或開啟行動App，然後在出現提示時選擇「立即嘗試」即可，或是點擊訊息框左側的圖像符號，提供圖像或複製圖像網址給機器人，ChatGPT 就會分析圖像並回應有關圖像的查詢。

透過上傳食物圖像，使用者可以要求 ChatGPT 識別圖片中食物的成分，並估計卡路里含量。

ChatGPT Vision功能也擅長將手寫筆記轉換為打字文本，甚至可以識別英語以外的符號，使數位筆記保存更加高效。

雖然該功能並不完美，但 ChatGPT Vision 也可以嘗試透過辨識扭曲影像中的字元，解決用戶可能看不懂驗證碼的困擾。

ChatGPT Vision也可以解釋影像，包括一些不完美，或是包含文字和插圖的圖片，大家可以要求ChatGPT 解釋資訊圖表並向其提問，甚至還能要求機器人「重現」該圖片。

ChatGPT Vision不僅限於圖像辨識，還能夠解答數學問題，只要上傳算式或是問題的圖片，ChatGPT Vision就能提供準確的答案。

最後，ChatGPT Vision不僅限於分析影像，更是還可以使用 DALL-E 3 根據使用者描述「生成圖像」。

參考資料：Android Police

瀏覽 831 次

覺得不錯的話就分享出去吧！

標籤

2024-06-06