阿里巴巴推出新AI模型「通義千問」參數比DeepSeek更少!但效能差不多?

記者 鄧天心/綜合報導

中國新創打造的語言模型DeepSeek發布以來迅速走紅,在中國本土AI市場的佔有率迅速攀升,甚至有專家覺得可能在未來挑戰ChatGPT的市場主導地位,而除了DeepSeek之外,中國推出AI模型的新創與企業持續增加​,截至2025年3月,中國已有超過40個大型語言模型,佔全球總數的25%,僅次於美國,同時還有更多大型語言模型正在打磨,像是由Monica團隊打造的AI助理Manus,還有騰訊開發的元寶。

​阿里巴巴旗下的阿里雲於2025年3月推出了「通義千問QwQ-32B」模型,擁有320億個參數,儘管參數數量遠少於DeepSeek-R1,但在數學推理、編碼和問題解決等任務中表現出色,與DeepSeek-R1相當。圖片來源:123RF

阿里巴巴旗下的阿里雲於2025年3月6日正式發布並開源了全新的推理模型「通義千問QwQ-32B」模型,擁有320億個參數,​參數數量遠少於DeepSeek-R1,但在數學推理、編碼和問題解決等任務中表現出色,號稱在性能上超越了DeepSeek-R1。 

DeepSeek是由中國量化基金公司「幻方量化」開發的AI模型,這家公司原本專注於金融數據分析,後來轉向AI技術研發,旗艦模型DeepSeek-R1擁有6.71兆個參數,與OpenAI的GPT-4及Anthropic的Claude 3等主流模型相當,也展示出強大的計算能力與語言理解能力。

而2025年阿里雲推出的「通義千問QwQ-32B」也是一個全新的AI模型,但只有320億個參數,相較於DeepSeek-R1 的6,710億個參數,它的規模小很多,但阿里巴巴強調,這個模型透過技術優化,效能與DeepSeek-R1差不多,甚至在某些測試中還更強,需要處理的數據量較少還可以在較小的裝置或雲端系統上運行,甚至能夠透過「強化學習」技術自主學習,根據環境調整自己的推理方式。

更多新聞:

AI聊天機器人新勢力Manus登場 DeepSeek與ChatGPT還能穩坐龍頭嗎?

騰訊AI聊天機器人「元寶」打敗DeepSeek 奪下載量排行榜冠軍

通義千問特別在哪裡?

阿里雲的這款AI還整合了「AI代理人(AI Agent)」技術,簡單來說,它不只是單純回答問題,還能根據不同的工具和環境,進行更「聰明」的決策,就像一個具備思考能力的AI助理。

阿里巴巴這幾年大力投資AI和雲端技術,這次推出的「通義千問QwQ-32B」,其實是阿里雲從2023年開始推出的一系列AI產品的一部分,他們之前已經開發過Qwen、Qwen1.5、Qwen2、Qwen2.5。

這次的QwQ-32B是最新的版本,而且,他們這次選擇開源,代表不只是阿里巴巴,任何開發者都能下載這款AI模型,並且自行修改、運用在不同的應用中,阿里巴巴還計劃在未來三年內投資3,800億人民幣(約新台幣1.72兆元),穩固阿里雲在AI領域的地位。

可以想見中國AI產業將繼續成長,阿里巴巴與新創DeepSeek、騰訊等中國科技公司之間的競爭,也帶動整個AI產業的發展,這場中國AI大戰,可能才剛剛開始。

瀏覽 172 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button