GPT-5來了嗎?神秘模型打敗GPT-4 引發討論
編譯/黃竣凱
隨著人工智慧(AI)不斷發展,新的競爭者也不斷出現,而現在一個新的神秘大型語言模型(LLM)出現,正引起大眾關注。近日,名為「gpt2-chatbot」的模型突然出現在用於比較LLM表現的基準平台Chatbot Arena上,但又瞬間消失,引起一陣討論。
gpt2-chatbot打敗GPT-4
據報導,神秘模型「 gpt2-chatbot」突然憑空出現在Chatbot Arena,並超越了市場上許多最受歡迎的 LLM,如 Gemini、Claude甚至 GPT-4,引起不小的轟動,然而,令許多人失望的是,Chatbot Arena 很快就刪除了「gpt2-chatbot」。
更多新聞:新GPT-4 Turbo 來勢洶洶 奪回「最佳AI模型」桂冠
gpt2-chatbot變體的出現
但儘管被刪除,許多人仍能在Chatbot Arena上,看到該gpt2-chatbot的兩個變體,包括「im-a-good-gpt2-chatbot」和「im-also-a-good- gpt2」。雖然這兩個模型的名稱中都帶有「GPT」,但OpenAI並沒有正式承認他們是該模型的幕後推手,不過,OpenAI 執行長 Sam Altman 也在 X 上發文,隱晦地提到了「im-a-good-gpt2-chatbot」一名,使所有人都一頭霧水。
如何測試神秘模型
儘管這些模型在 Chatbot Arena 上,但基於這兩個模型不在 Chatbot Arena 支援的 LLM 清單中,因此用戶無法直接測試它們,若想測試這兩個新模型,用戶則必須不斷啟動模型「戰鬥」比較,使其隨機出現才可以。 一些使用者就已經測試了新的匿名模型,並對其功能印象深刻,包括透過一個提示創建 Flappy Bird 遊戲,創建一個使用 Claude Opus 的程式碼解釋器,甚至透過基本的物理問題進行推理等。
是GPT-4.5 或 GPT-5嗎
這些功能讓人們猜測,該模型可能是OpenAI為測試GPT-4.5 或 GPT-5,而匿名發布的,而當一位用戶透過提示詢問「im-a-good-gpt2-chatbot」具體的 LLM 版本是什麼時,該模型說,「我基於 GPT-4 架構,特別是 GPT-4.5 ,」但目前仍不知道這是否只是模型的幻覺。
參考資料:zdnet
瀏覽 12,038 次