Meta反ChatGPT道而行　公布AI模型LLaMA

2023-03-01

記者／竹二

在OpenAI發表了ChatGPT聊天機器人後，全新一波的生成AI科技戰開打，微軟、Google互相較勁之際，身為發展AI模型先驅的Meta也沒有缺席，近日他們公布了能產生文字的最新AI模型。

Meta執行長馬克祖克柏日前透過Facebook公布AI大型語言模型LLaMA（Large Language Model Meta AI），他提到大型語言模型已經顯示產生文字、對話、為文章做摘要，以及其他更複雜任務像是解決數學問題或是預測蛋白質結構的潛力，Meta將把LLaMA模型開放給AI研究社群，提供給研究人員進行不同領域研究。

LLaMA是一種較小型基礎模型，可以用來訓練更大的語言模型，這些模型以大量未標註的資料訓練而成，非常適合微調後使用在多種任務上，減少後續大型模型測試、驗證及探索新使用情境的運算資源需求。

Meta指出，過去數十億參數的大型自然語言處理（NLP）模型發展出產生創意文字、解決數學問題、預測蛋白質結構、回答閱讀理解問題等能力，但是訓練和執行這樣大型模型的資源，不是所有人都有，這也限制了研究方向的進展，並造成語言模型的偏見和產生錯誤資訊，小型模型是以更多token（小段字詞）訓練，較容易為特定使用情境重訓練及微調。

據了解，Meta最小的模型LLaMA 7B以一兆token訓練、LLaMA 65B及33B則以1.4兆token來訓練，他們選擇從20種使用人口最多的語言的文字字詞為訓練輸入。若是以參數而言，Meta的LLaMA有多種規模，分成70億、130億、330億及650億個參數，提供LLaMA模型卡透明度工具，像是標竿測試模型對模型偏差和毒性的評估值，提供研究人員了解模型的限制。

瀏覽 1,003 次

覺得不錯的話就分享出去吧！

標籤

2023-03-01

Meta反ChatGPT道而行　公布AI模型LLaMA

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套 發生了什麼事？

台積電居「AI晶片碳排」之冠！綠色和平籲2030年全面用綠電

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片 比超級電腦快24倍

新關稅的「美國價值」怎認定？TrendForce：定義模糊恐衝擊AI產品出貨

面對美國川普關稅大刀！華碩財務長吳長榮三大策略大公開

曲博彩虹頻道｜人工智慧的困難與發展潛力

發佈留言 取消回覆

輝達H20晶片差點不能賣給中國！靠黃仁勳一場晚宴解套發生了什麼事？

Google Cloud Next 2025 5大亮點一次看！推出新AI晶片比超級電腦快24倍

發佈留言取消回覆