青出於藍 GPT-4o VS. GPT-4 更多進化優點
編譯/黃竣凱
OpenAI為其人工智慧(AI)聊天機器人ChatGPT帶來重大進步,推出超強GPT-4o,使 GPT-4顯得過時,差異非常驚人。GPT-4o在速度、效率、多模態處理、自然交互、圖像理解、多語言能力和可用性上都遠超GPT-4,使其成為OpenAI在AI領域的一個重大里程碑,不僅提升了用戶體驗,還擴展了AI技術的應用範圍。
更高效率和速度
雖然對許多人來說GPT-4已經足夠好了,但它卻仍有速度過慢的缺點,甚至還輸給Google 的 Gemini 和Anthropic 的 Claude 3,而GPT-4o則在處理速度和成本上,都有顯著提升,回應時間與人類實時對話的速度相當,而之前的模型則通常需要3到5秒。在實際測試中, GPT-4o 在不到 12 秒的時間內,就產生了 488 個單字的答案,相較之下 GPT-4 有時需要近一分鐘才能完成該任務。此外,GPT-4o的運行成本是GPT-4的一半,使其更具經濟效益。
更多新聞:AI專家不看好GPT-4o 馬斯克:為OpenAI難為情
多模態功能
GPT-4o擁有強大的多模態處理能力,可以同時處理音頻、圖像、影片和文本。GPT-4o使用單一神經網路處理所有模態,這使其在性能和能力上有顯著提升。相比之下,之前的模型則需要分別處理語音轉文本和文本解釋,再轉換回合成語音,速度更慢。此外,GPT-4o還能夠解釋和生成帶有情感的語音回應,甚至能夠唱歌。
即時對話且互動更自然
比起GPT-3.5和GPT-4,GPT-4o在即時語音對話中的表現更為自然,GPT-4o能夠識別語音中的語氣等非語言元素,並做出相應的情感回應,還可以處理更長的對話和更大數量的數據,這對於需要長時間互動的任務(如寫小說)非常有用。
更強的圖像和影片理解能力
GPT-4o不僅可以回答關於照片和桌面截圖的問題,還可以針對影片做出精確的推論,這些都是GPT-3.5和GPT-4無法做到的。
多語言支援
GPT-4o提升了多語言處理能力,能夠更高效地處理50種不同的語言,且API的速度是GPT-4 Turbo的兩倍。
生成帶有可讀文本的圖像
GPT-4o在生成含有可讀文本的圖像方面有了顯著改進,能夠以創意的方式排列文本,如生成電影海報或帶有詩意的排版,甚至還能模仿手寫字。
可用性更高
無論是免費用戶還是付費用戶都可以使用GPT-4o,只是相較於免費用戶,ChatGPT Plus訂閱者則有多5倍的輸入權利,並可以優先體驗新功能。
參考資料:How To Geek、xda-developers
瀏覽 4,304 次