青出於藍   GPT-4o VS. GPT-4 更多進化優點

編譯/黃竣凱

相較前一個版本,GPT-4o則在處理速度和成本上,都有顯著提升。圖 / 123RF

OpenAI為其人工智慧(AI)聊天機器人ChatGPT帶來重大進步,推出超強GPT-4o,使 GPT-4顯得過時,差異非常驚人。GPT-4o在速度、效率、多模態處理、自然交互、圖像理解、多語言能力和可用性上都遠超GPT-4,使其成為OpenAI在AI領域的一個重大里程碑,不僅提升了用戶體驗,還擴展了AI技術的應用範圍。

更高效率和速度

雖然對許多人來說GPT-4已經足夠好了,但它卻仍有速度過慢的缺點,甚至還輸給Google 的 Gemini 和Anthropic 的 Claude 3,而GPT-4o則在處理速度和成本上,都有顯著提升,回應時間與人類實時對話的速度相當,而之前的模型則通常需要3到5秒。在實際測試中, GPT-4o 在不到 12 秒的時間內,就產生了 488 個單字的答案,相較之下 GPT-4 有時需要近一分鐘才能完成該任務。此外,GPT-4o的運行成本是GPT-4的一半,使其更具經濟效益。

更多新聞:AI專家不看好GPT-4o  馬斯克:為OpenAI難為情

多模態功能

GPT-4o擁有強大的多模態處理能力,可以同時處理音頻、圖像、影片和文本。GPT-4o使用單一神經網路處理所有模態,這使其在性能和能力上有顯著提升。相比之下,之前的模型則需要分別處理語音轉文本和文本解釋,再轉換回合成語音,速度更慢。此外,GPT-4o還能夠解釋和生成帶有情感的語音回應,甚至能夠唱歌。

即時對話且互動更自然

比起GPT-3.5和GPT-4,GPT-4o在即時語音對話中的表現更為自然,GPT-4o能夠識別語音中的語氣等非語言元素,並做出相應的情感回應,還可以處理更長的對話和更大數量的數據,這對於需要長時間互動的任務(如寫小說)非常有用。

更強的圖像和影片理解能力

GPT-4o不僅可以回答關於照片和桌面截圖的問題,還可以針對影片做出精確的推論,這些都是GPT-3.5和GPT-4無法做到的。

多語言支援

GPT-4o提升了多語言處理能力,能夠更高效地處理50種不同的語言,且API的速度是GPT-4 Turbo的兩倍。

生成帶有可讀文本的圖像

GPT-4o在生成含有可讀文本的圖像方面有了顯著改進,能夠以創意的方式排列文本,如生成電影海報或帶有詩意的排版,甚至還能模仿手寫字。

可用性更高

無論是免費用戶還是付費用戶都可以使用GPT-4o,只是相較於免費用戶,ChatGPT Plus訂閱者則有多5倍的輸入權利,並可以優先體驗新功能。

參考資料:How To Geekxda-developers

瀏覽 4,308 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button