AI也要從小學習?科學家紀錄嬰兒牙牙學語來訓練AI
譯者/Elisa
OpenAI旗下的GPT等大型語言模型,透過接受皆位元組(zettabytes)和佑位元組(yottabytes)資料的訓練,好讓研發出來的聊天機器人能夠與人對話。但話都還說不清的幼兒該怎麼和ChatGPT 對話,恐怕就是個問題,對ChatGPT來說只會辨識成無意義的隨機字詞。因此美國紐約大學研究人員想了解人工智慧,是否能學習小孩子每天遇到的單字和思考模式,並藉此製作一個學習模型。
科學家記錄幼兒說話資料訓練AI
科學家認為最好的方式就是記錄幼兒一整天所說的話和做的事情,他們將頭戴視攝影機裝在一位六個月大幼兒身上,錄下孩子的動作和言語做為研究樣本,而且最好是在遊戲、用餐和閱讀時間記錄,才能進行真正的語言學習。實驗期間持續到孩子滿兩歲,正好是大多數幼兒開始說出第一句話的年齡,科學家累積了長達60個小時的影片,其中錄到小孩說的25萬個單詞中,有多數是重複的。
更多新聞:大型語言模型輸出無法零錯誤 Google提出新訓練方式
實驗顯示AI可透過幼兒說話方式學習
在仔細研究多模態人工智慧(multimodal AI)收集的數據後,研究人員發現透過單一嬰兒輸入子集(subsets)訓練的模型,能夠在日常環境中學習單字。AI能夠將單字和透過孩子身上攝影機看到的視覺參照影像進行對應,或是將單字對照到孩子所處世界中的物體。不過AI模型還是有點瑕疵,例如會將手(Hand)和沙子(Sand)搞混。
科學家表示實驗結果讓人們能深入了解兒童學習新語言時遇到的真正問題,以及讓大型語言模型變得貼近兒童,也有可能改變AI處理資料的方式。
瀏覽 1,254 次