Claude 3 VS. ChatGPT VS. Gemini 誰更勝一籌?

編譯/黃竣凱

一直以來,ChatGPTGemini都是人工智慧(AI)領域的領先者,然而隨著由 OpenAI前員工創立的AI公司Anthropic,推出至今為止最快、最強大的AI模型 Claude 3,這種局勢似乎正在被打破。Claude 3 在AI各個領域展示了卓越的優勢,引起了專家和愛好者的極大興趣和爭論。

聊天機器人大比拚,Claude 3 VS. ChatGPT VS. Gemini 誰才是最強AI模型。科技島合成圖

Claude 3 VS. ChatGPT VS. Gemini

Claude 3相對於其競爭對手有重大進步,並在光學字元辨識(OCR)、對複雜查詢的細緻理解,及基準測試性能上都打敗ChatGPT 和 Gemini。Claude 3具有卓越的視覺能力和上下文理解能力,包括可以準確地識別圖像中的車牌號碼和理髮店。

更多新聞:比GPT-4和Gemini Ultra更強   Anthropic推出Claude 3

相較之下,雖然ChatGPT(GPT-4)也提供強大的對話功能和廣泛的知識庫,但它在 OCR 任務上,可能不如 Claude 3 ,並特定技術基準上落後。而雖然Gemini 1.0 Ultra和尚未發布的Gemini 1.5,在視覺任務和通用AI能力方面表現強勁,但在與 Claude 3 的高級推理和 OCR 功能競爭時,仍面臨挑戰。

基準測試

雖然在一些比較中,Claude 3 只以微弱優勢獲勝,但總體來說,在所有指標上,Claude 3 的旗艦模型 Opus,都優於 ChatGPT 和 Gemini。此外,即使是較低階的Claude 3 Sonnet 和 Haiku 模型,也都比 GPT-3.5 和 Gemini 1.0 Pro 表現出更優越的性能。

根據 Anthropic 提供的基準測試統計數據,與 Gemini 和 ChatGPT相比,Claude 3在各項標準上都領先。在小學數學中,Claude 3 的 Opus 模型達到 95分的驚人準確率,超過了 OpenAI 的 GPT-4 的92分和 Gemini 1.0 Pro的94.4分;在文本推理方面,Claude 3 則以 83.1分的成績,打敗GPT-4 和Gemini 1.0 Pro的 80.9分及 82.4分;而在常識推理上,Claude 3也取得95.4的高分,勝過GPT-4的95.3分和Gemini 1.0 Pro的87.8分。

處理大量文字

值得注意的是,Claude 3 能夠總結多達 150,000 個單詞,與 ChatGPT 的 3,000 個單詞的限制相比,有顯著飛躍,進而證明 Claude 3 在處理大量文字資料上的熟練程度,使其在同類產品中脫穎而出。

參考資料:geeky-gadgetsThe National News

瀏覽 10,715 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button