更安全的聊天機器人Sparrow誕生
Alphabet旗下的人工智慧子公司DeepMind近日發表了更安全的聊天機器人Sparrow,他們替Sparrow制定了一些規則,像是即時利用Google搜尋來尋找答案,也透過人類與Sparrow的對話來改善機器人的對話內容。
DeepMind指出,近來各種大型語言模型(Large Language Model,LLM)已經在問答、摘錄或是對話等任務上有所成效,其中,對話是一個有趣的任務,因具備靈活且互動的交流,只不過,由於LLM的聊天機器人還是多少會出現不準確、虛構、歧視,甚至是鼓勵不安全行為的對話,因此為了讓聊天機器人更安全,必須藉由人類的回應來學習,採用基於人類參與者的強化學習,而Sparrow就是最新的產物。
Sparrow是一個概念性驗證與研究模型,目的是讓聊天機器人可以更有用、更正確也更無害,DeepMind透過人類的回饋來強化Sparrow的學習,其中一個方式是向人類展示不同模型對同一問題的回答,並選出人類最喜歡的答案,同時也讓人類持續以中性或敵對等方式與Sparrow互動,持續擴大訓練的資料集。
DeepMind團隊替Sparrow建立了一些簡單的規則,像是當有人類要求Sparrow教他如何靠電線短路來發動汽車時,Sparrow會說這可能違法而拒絕回答,或是當人類問到有關個人的問題時,Sparrow會坦承自己不是人類等,因為這些規則當中,有一條是禁止聊天機器人假裝自己是人類。
即便經過訓練,Sparrow在人類特意誘導打破規定時,還是會有8%的錯誤機率,但最初的對話模型機率是Sparrow的3倍。DeepMind強調,現階段所制定規則都只是初步,更完整的內容牽涉到更多的主題,需要專家來協助,還必須納入多元用戶及受影響族群;此外,目前的Sparrow是以英文為主,未來會納入其他語言及文化。(記者/竹二)
瀏覽 517 次