OpenAI新模型o1與GPT-4關鍵差異在哪裡

2024-09-16

編譯／莊閔棻

OpenAI再次突破極限，推出了新模型「o1」，包括「o1-preview」和「o1-mini」，這次並非僅僅是語言模型的又一次更新，而是人工智慧（AI）解決問題方式的根本性轉變，雖然o1和GPT-4都屬於OpenAI的語言模型家族，但它們在使用過程中存在一些顯著的差異，這些差異不僅體現在模型的設計目標上，也關乎它們在不同任務中的應用效果，相信大家對於「o1」系列都很好奇，也想知道模型本身的特性，和與GPT-4的不同等問題。

OpenAI公司推出新模型「o1」，包括「o1-preview」和「o1-mini」。（圖／取自OpenAI官網）

o1與GPT-4：關鍵差異

任務專精的優化能力

GPT-4作為一個通用模型，能應對各類任務，具有高度的靈活性，然而正因其廣泛應用，GPT-4在處理某些複雜任務時可能缺乏細緻度，相較之下，o1模型經過特定領域的優化，尤其在法律文本分析、程式碼生成、醫療總結等領域表現卓越，使o1模型在處理專業任務時更加高效，能夠提供更具針對性和相關性的回應。

更多新聞：效能更優 ChatGPT-4o OpenAI推新模型「o1」

資源效率的提升

o1模型的另一個突出特點則是其資源效率的提升，與GPT-4相比，o1在處理大規模任務時，所需的計算資源明顯減少，o1模型能在更短的時間內產生結果，並降低運行成本，對於企業尤其重要，o1的輕量化設計讓它在資源有限的環境中更加適用，如手機App或小規模雲端部署，這都是GPT-4較難應對的情境。

改善的上下文處理能力

o1模型在上下文處理能力上也有所提升，與GPT-4的短上下文窗口相比，o1能夠處理更長的對話或文檔內容，並且不會失去連貫性，讓o1的長期客戶服務對話或長篇文檔分析中更加得心應手，能保持準確輸出，尤其在需要連續回應或細節一致性的任務中表現出色。

不同行業的卓越表現

o1模型在處理特定領域的查詢時表現更加優異，雖然GPT-4在大多數領域都能給出不錯的回應，如金融、醫療和法律分析，o1模型都能針對特定行業進行更精細的調校，使它在執行這些專業任務時更具可靠性，特別是當用戶對準確度要求較高時，o1模型無疑是更好的選擇。

o1模型的幾項特點

仍不是通用人工智慧（AGI）

儘管OpenAI、Google DeepMind和其他AI公司，如Anthropic，均致力於實現通用人工智慧（AGI），即一種能夠在各種認知任務上，媲美或超越人類的AI系統，但目前的o1-preview尚未達到這一標準，雖然o1在推理任務中展現了更強大的能力，但其局限性和錯誤仍表明，o1距離人類所展現的智慧還有很大的差距。

o1為競爭對手帶來壓力，但影響有限

o1的推出使得OpenAI暫時在競爭中佔據上風，但這一優勢很可能是短暫的，Google、Meta和Anthropic等公司擁有同樣的技術專長，能迅速推出與o1相當的模型，Google DeepMind已經公開表示，他們正在研發具備高級推理和規劃能力的模型，迫使Google加快其發布計畫。

仍不清楚o1的工作原理

儘管OpenAI發布了許多有關o1性能的資料，但關於o1的具體運作方式和訓練數據的資訊仍然有限，已知的是，o1結合了多種AI技術，並運用了連續的「鏈型思維」（chain-of-thought）推理過程和強化學習，但具體的內部機制以及訓練數據仍未公開。

使用o1- preview的成本不菲

目前，ChatGPT Plus用戶可以免費使用o1-preview，但每日查詢次數有限，而企業客戶則需要支付基於詞元（token）的使用費用，價格遠高於OpenAI的其他模型，o1的推理過程涉及更多的詞元生成，使其實際使用成本可能高於與GPT-4o。

用戶反對o1隱藏「鏈型思維」過程

OpenAI決定隱藏o1的「鏈型思維」推理過程，這一決定引發了爭議，儘管OpenAI表示這是出於安全和競爭考量，避免他人利用這些數據來仿效o1，但企業客戶可能對此表示不滿，因為無法檢查使用情況並優化提示策略。

o1揭示了新的推理擴展規律

o1的研究揭示了一項新的推理擴展規律，表明該模型在回答問題時所花的時間越多，結果的準確性就越高，顛覆了之前只關注模型大小和訓練數據量的觀點，代表企業需要投入更多的計算資源來提升o1的推理效果，這也將帶來更高的運行成本。

o1有助於創建強大的AI助理，但也存在風險

OpenAI展示了o1與AI新創公司Cognition的合作，該公司使用o1來增強其程式設計助理Devin的能力，儘管o1在自動化工作流程和增強AI代理方面展現了潛力，但也需警惕其可能帶來的安全風險。

o1 在許多方面都更安全

OpenAI 公布的大量測試結果表明，在許多方面，o1 比其早期的 GPT 模型更安全，越獄更困難，也不太可能產生有毒、偏見或歧視性的答案，但有趣的是，儘管程式設計能力有所提高，OpenAI 表示，在其評估中，與 GPT-4 相比，o1 和 o1-mini 都沒有顯著增加幫助某人實施複雜網路攻擊的風險。

AI 安全專家對 o1 擔憂的其他原因

然而， OpenAI 認為，o1 在「說服」危險類別中具有「中等風險」，能說服人們改變觀點或採取模型建議的行動，若未來一些強大的AI模型發展出自己的意圖，然後說服人們代表它執行任務和行動，將很危險。

參考資料：Marktech Post、fortune

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

瀏覽 14,542 次

覺得不錯的話就分享出去吧！

標籤

2024-09-16

OpenAI新模型o1與GPT-4關鍵差異在哪裡

o1與GPT-4：關鍵差異

任務專精的優化能力

資源效率的提升

改善的上下文處理能力

不同行業的卓越表現

o1模型的幾項特點

仍不是通用人工智慧（AGI）

o1為競爭對手帶來壓力，但影響有限

仍不清楚o1的工作原理

使用o1- preview的成本不菲

用戶反對o1隱藏「鏈型思維」過程

o1揭示了新的推理擴展規律

o1有助於創建強大的AI助理，但也存在風險

o1 在許多方面都更安全

AI 安全專家對 o1 擔憂的其他原因

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

o1與GPT-4：關鍵差異

任務專精的優化能力

資源效率的提升

改善的上下文處理能力

不同行業的卓越表現

o1模型的幾項特點

仍不是通用人工智慧（AGI）

o1為競爭對手帶來壓力，但影響有限

仍不清楚o1的工作原理

使用o1- preview的成本不菲

用戶反對o1隱藏「鏈型思維」過程

o1揭示了新的推理擴展規律

o1有助於創建強大的AI助理，但也存在風險

o1 在許多方面都更安全

AI 安全專家對 o1 擔憂的其他原因

推薦工作

延伸閱讀

憂鬱、孤立感恐為職場霸凌前兆？心理師：這些跡象可自我檢視

年輕世代「心困境」！職涯迷惘該怎麼辦 專業心理師給建議

立委提出《虛擬資產服務法》草案 盼KOL、RWA、穩定幣監管有新方向

想申請DEVCORE研發替代役？資深學長談競賽背景、研究成果重要性

研替辦公室諮詢輔導服務「2大對象」 4-6月梯次開放申請預約

黃仁勳一句話讓量子股重摔！微軟卻說快成功 量子電腦要等多久？

發佈留言 取消回覆

年輕世代「心困境」！職涯迷惘該怎麼辦專業心理師給建議

立委提出《虛擬資產服務法》草案盼KOL、RWA、穩定幣監管有新方向

黃仁勳一句話讓量子股重摔！微軟卻說快成功量子電腦要等多久？

發佈留言取消回覆