O3模型的誕生:人工智慧的進步與挑戰|專家論點【張瑞雄】

作者:張瑞雄 台北商業大學前校長/叡揚資訊顧問

2024年歲末,OpenAI再次震撼全球,發布了最新大型語言模型O3。這個模型以驚人的速度和實力橫掃多項AI基準測試,展現出前所未有的推理與抽象能力。在程式設計比賽、數學競賽乃至於最具挑戰性的ARC-AGI(抽象推理和通用人工智慧)測評中,O3的成績不僅超越了過往所有模型,甚至在某些領域超越了人類表現​。

O3的成績不僅超越了過往所有模型,甚至在某些領域超越了人類表現​。(圖/123RF)

O3模型在多個測試中創下了歷史紀錄,例如在全球程式設計競賽平台Codeforces上,O3取得了2727的高分,躋身全球前200名,超過99.99%的人類程式設計師​。此外在2024年的AIME數學競賽中,O3的準確率高達96.7%,幾乎接近滿分,這是AI首次能夠在如此高難度的數學測評中達到人類頂尖水準。

延伸閱讀:AI生成的政治資訊與民主的挑戰|專家論點【張瑞雄】

更具革命性的是,O3在ARC-AGI測評中獲得87.5%的成績,幾乎達到人類平均水準(約85%)​。這項成就意味著AI在適應新任務和未曾訓練過的領域中,已經展現出類似人類的學習與推理能力。

這項突破不僅使人們對人工智慧能力的認知大幅改變,也讓人開始思考通用人工智慧(AGI)是否已經近在眼前。OpenAI的一位董事會成員甚至表示:「市場仍然低估了O3模型的潛力,AGI的到來可能比預期更快​。」但馬斯克卻對此持不同看法。

儘管O3模型在測試中表現驚人,但仍然存在諸多爭議。部分專家認為OpenAI在訓練O3模型時,針對性地強化其在ARC-AGI測試中的表現,這可能限制了模型在更開放環境下的泛化能力。一位AI專家便指出,O3的高昂運作成本使其在實際應用中面臨經濟可行性的挑戰。

更重要的是,即便O3模型在複雜任務上表現卓越,它仍然在一些簡單的人類常識任務上表現不佳。這反映出AI在模擬人類綜合智力方面,仍然存在明顯差距​。

O3的出現無疑讓人類在邁向AGI的道路上前進了一大步,但這是否意味著AGI已經觸手可及?ARC-AGI的設計者指出,雖然O3的表現令人矚目,但這並不代表AGI已經實現​。他認為,真正的AGI應該能夠在所有人類輕鬆應對的任務上達到相同水準,而O3在這方面仍有不足。

此外O3模型在推理過程中可能採用了大量的計算資源和時間,而這種「以計算換取智慧」的方式,可能並非AGI實現的最佳或最終途徑​。

儘管存在爭議,O3模型無疑標誌著AI發展史上的重要里程碑。正如OpenAI執行長Sam Altman所言:「我們將比多數人預期更快實現AGI,但它的實際影響或許並不如想像中巨大​。」這意味著即便AGI在技術層面實現,其高昂的成本和應用限制,將使其在現實世界中的普及需要更長時間。

未來幾年,我們或許將看到AI逐步滲透到各行各業,從程式設計到醫療診斷,從教育輔助到科學研究。但真正的AGI將不僅是技術的突破,更將改變人類對智慧、工作及社會價值的根本認知。

O3模型的誕生是一場技術革命,也是一場對人類智慧與未來的挑戰。面對這快速發展的AI浪潮,社會各界需要保持開放的態度,積極探索AI的潛力,但同時也應保持警惕,避免過度依賴尚未成熟的技術。

瀏覽 143 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button