OpenAI新模型o1與GPT-4關鍵差異在哪裡

編譯/莊閔棻

OpenAI再次突破極限,推出了新模型「o1」,包括「o1-preview」和「o1-mini」,這次並非僅僅是語言模型的又一次更新,而是人工智慧(AI)解決問題方式的根本性轉變,雖然o1和GPT-4都屬於OpenAI的語言模型家族,但它們在使用過程中存在一些顯著的差異,這些差異不僅體現在模型的設計目標上,也關乎它們在不同任務中的應用效果,相信大家對於「o1」系列都很好奇,也想知道模型本身的特性,和與GPT-4的不同等問題。

OpenAI公司推出新模型「o1」,包括「o1-preview」和「o1-mini」。
OpenAI公司推出新模型「o1」,包括「o1-preview」和「o1-mini」。(圖/取自OpenAI官網)

o1與GPT-4:關鍵差異

任務專精的優化能力

GPT-4作為一個通用模型,能應對各類任務,具有高度的靈活性,然而正因其廣泛應用,GPT-4在處理某些複雜任務時可能缺乏細緻度,相較之下,o1模型經過特定領域的優化,尤其在法律文本分析、程式碼生成、醫療總結等領域表現卓越,使o1模型在處理專業任務時更加高效,能夠提供更具針對性和相關性的回應。

更多新聞:效能更優 ChatGPT-4o OpenAI推新模型「o1」

資源效率的提升

o1模型的另一個突出特點則是其資源效率的提升,與GPT-4相比,o1在處理大規模任務時,所需的計算資源明顯減少,o1模型能在更短的時間內產生結果,並降低運行成本,對於企業尤其重要,o1的輕量化設計讓它在資源有限的環境中更加適用,如手機App或小規模雲端部署,這都是GPT-4較難應對的情境。

改善的上下文處理能力

o1模型在上下文處理能力上也有所提升,與GPT-4的短上下文窗口相比,o1能夠處理更長的對話或文檔內容,並且不會失去連貫性,讓o1的長期客戶服務對話或長篇文檔分析中更加得心應手,能保持準確輸出,尤其在需要連續回應或細節一致性的任務中表現出色。

不同行業的卓越表現

o1模型在處理特定領域的查詢時表現更加優異,雖然GPT-4在大多數領域都能給出不錯的回應,如金融、醫療和法律分析,o1模型都能針對特定行業進行更精細的調校,使它在執行這些專業任務時更具可靠性,特別是當用戶對準確度要求較高時,o1模型無疑是更好的選擇。

o1模型的幾項特點

仍不是通用人工智慧(AGI

儘管OpenAI、Google DeepMind和其他AI公司,如Anthropic,均致力於實現通用人工智慧(AGI),即一種能夠在各種認知任務上,媲美或超越人類的AI系統,但目前的o1-preview尚未達到這一標準,雖然o1在推理任務中展現了更強大的能力,但其局限性和錯誤仍表明,o1距離人類所展現的智慧還有很大的差距。

o1為競爭對手帶來壓力,但影響有限

o1的推出使得OpenAI暫時在競爭中佔據上風,但這一優勢很可能是短暫的,Google、Meta和Anthropic等公司擁有同樣的技術專長,能迅速推出與o1相當的模型,Google DeepMind已經公開表示,他們正在研發具備高級推理和規劃能力的模型,迫使Google加快其發布計畫。

仍不清楚o1的工作原理

儘管OpenAI發布了許多有關o1性能的資料,但關於o1的具體運作方式和訓練數據的資訊仍然有限,已知的是,o1結合了多種AI技術,並運用了連續的「鏈型思維」(chain-of-thought)推理過程和強化學習,但具體的內部機制以及訓練數據仍未公開。

使用o1- preview的成本不菲

目前,ChatGPT Plus用戶可以免費使用o1-preview,但每日查詢次數有限,而企業客戶則需要支付基於詞元(token)的使用費用,價格遠高於OpenAI的其他模型,o1的推理過程涉及更多的詞元生成,使其實際使用成本可能高於與GPT-4o。

用戶反對o1隱藏「鏈型思維」過程

OpenAI決定隱藏o1的「鏈型思維」推理過程,這一決定引發了爭議,儘管OpenAI表示這是出於安全和競爭考量,避免他人利用這些數據來仿效o1,但企業客戶可能對此表示不滿,因為無法檢查使用情況並優化提示策略。

o1揭示了新的推理擴展規律

o1的研究揭示了一項新的推理擴展規律,表明該模型在回答問題時所花的時間越多,結果的準確性就越高,顛覆了之前只關注模型大小和訓練數據量的觀點,代表企業需要投入更多的計算資源來提升o1的推理效果,這也將帶來更高的運行成本。

o1有助於創建強大的AI助理,但也存在風險

OpenAI展示了o1與AI新創公司Cognition的合作,該公司使用o1來增強其程式設計助理Devin的能力,儘管o1在自動化工作流程和增強AI代理方面展現了潛力,但也需警惕其可能帶來的安全風險。

o1 在許多方面都更安全

OpenAI 公布的大量測試結果表明,在許多方面,o1 比其早期的 GPT 模型更安全,越獄更困難,也不太可能產生有毒、偏見或歧視性的答案,但有趣的是,儘管程式設計能力有所提高,OpenAI 表示,在其評估中,與 GPT-4 相比,o1 和 o1-mini 都沒有顯著增加幫助某人實施複雜網路攻擊的風險。

AI 安全專家對 o1 擔憂的其他原因

然而, OpenAI 認為,o1 在「說服」危險類別中具有「中等風險」,能說服人們改變觀點或採取模型建議的行動,若未來一些強大的AI模型發展出自己的意圖,然後說服人們代表它執行任務和行動,將很危險。

參考資料:Marktech Postfortune

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 4,316 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button