Databricks發表AI模型Dolly 比ChatGPT更好訓練

記者/竹二

自從OpenAI所推出的ChatGPT上線後,各種生成式AI的應用越來越廣泛,雲端AI及資料分析平台新創業者Databricks近日就上線了一款開源AI模型Dolly,號稱比ChatGPT底層模型更容易訓練,成本也更低。

Databricks近日就上線了一款開源AI模型Dolly,號稱比ChatGPT底層模型更容易訓練。(圖/123RF)

Databricks是一家美國軟體公司,以Apache Spark技術(開源叢集運算框架)為基礎,提供雲端資料湖邊小屋(data lakehouse)及機器學習分析服務。近日他們將Dolly開源,提供更多企業、開發商客製化,藉此改進其產品。

Databricks表示,雖然史丹佛大學的Alpaca模型團隊是利用大型模型訓練出指令跟從的行為,但是他們發現,使用架構較老、較小的開源模型,若是以小批高品質的資料訓練去做微調,也可以有同樣效果。

而Dolly是以Eleuther AI兩年前的模型為基礎,在單一機器上透過類似ChatGPT的指令訓練30分鐘而成,再以Alpaca模型的資料加以訓練並微調,就可以發揮指令跟從的能力,像是腦力激盪、文字生成及開放性的問答等。Databricks指出,這顯示了像ChatGPT這類模型的強大能力,關鍵是在指令跟從的訓練資料,而不是更大或更好的底層模型。

Facebook母公司Meta今年2月釋出8萬 GPU時的LLaMA模型後,3月史丹佛大學就以LLaMA發展Alpaca模型,以5萬個問答訓練出ChatGPT等級的擬人互動性。由於Databricks最新模型是以Alpaca為基礎,因此開發團隊才會以第一隻複製羊Dolly來命名。

不過,Databricks也提到,和其他生成性AI一樣,Dolly還在開發早期的階段,一樣可能會出現事實錯誤、偏見、冒犯性回應等問題,使用者還是需要自行判斷。

瀏覽 727 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button