AI初創公司太佛心 免費提供類ChatGPT開源模型
編譯/李寓心
人工智慧晶片初創公司Cerebras於日前表示,該公司將發布類似ChatGPT的開源模型,提供商業組織和研究單位免費使用,以促進更多合作的可能。
根據報導,總部位於美國矽谷(Silicon Valley)的Cerebras公司,其Cerebras為複雜的AI深度學習應用程式,所建構的計算機系統。近期該公司發布的7個模型,都在名為Andromeda的AI超級計算機上,進行一系列的訓練,包括較小的1.11億參數語言模型,至較大的130億參數語言模型。
Cerebras創辦人兼首席執行長Andrew Feldman說:「對於目前朝向關閉AI開源碼項目的趨勢,並不會感到意外,因為現在有巨額的投資湧入該市場,但令人感到興奮的是,我們能取得相當的進步,其實很大程度,正是因為仰賴它的如此開放。」
因此,也製造出具有更多參數的模型,能夠執行更複雜的生成式功能,例如Open AI去年底推出的聊天機器人ChatGPT,就擁有1,750億個參數,可進行歌曲創作和學術研究等,可有助於擴大對AI感興趣的用戶範圍,連帶吸引大量資金投入。
該公司表示,較小的模型可以部署在手機或智慧型喇叭上,而較大的模型可在個人電腦或伺服器上使用,相對的若有更複雜的任務,也就需要更大的模型。然而,寒武紀AI研究公司(Cambrian AI)的晶片顧問Karl Freund認為,模型越大並非都是越好的,準確來說,應該是在大模型和訓練多寡之間做權衡才對。
Feldman提到,目前最大的模型,只花了一個多禮拜的時間來訓練,因為訓練工作通常需要幾個月的時間,才可完成,能縮至這麼短時間的原因,要歸功於Cerebras系統的架構中,包含了一個餐盤大小,可用於AI訓練的晶片。
雖然目前大多數AI模型都是在輝達公司(Nvidia)的晶片上完成訓練,但同時也越來越多像Cerebras這類的初創公司,正試圖在該市場中佔有一席之地。而Feldman也補充道,能在Cerebras機器上訓練的模型,也可在Nvidia系統上使用,以提供進一步的訓練或客製化功能。
資料來源:REUTERS
瀏覽 873 次