展現攻擊策略 機器人將再次擊敗人類
Google 在 AI 機器人領域又一突破。日前透過「i-Sim2Real」的研發專案,成功訓練機器人與人類進行 340 次桌球推打,讓機器人不僅會下棋,在動態上可能成為桌球高手,實現機器人強化學習的成功案例。
Sim2Real 這項專案是透過虛擬或模擬的環境,製造人與機器人交互循模式,來強化訓練機器人學習的模型。並且讓模型在虛擬時大規模的數據採集後,展現於現實情況中,可以大幅縮短訓練時間。
不過機器人訓練不是僅僅在虛擬環境擷取數據,就能達到實際運用成就。畢竟人類的反應機制要完全百分百模擬是相當困難,這就需要在現實世界的輔助。在這項任務中,目標是透過與人類的互動,利用接獲到的現實回饋力道數據,來判讀球的落點,完成交叉回擊。
由於本身機器人仍屬於學習階段,研究人員先採用簡易的人類行為模型作為出發點。儘管剛開始不夠接近實際行為也無妨,主要是能夠讓機器人與人類盡可能長時間的合作,且雙方都能做出快速反應。
這次 i-Sim2Real 成果,除了完成來回推打達 340 次桌球外,更厲害的是機器人也可將球打至不同區域,雖然對球落下的位置並非來自精確運算,但這樣的模式顯示出擁有可以對打的策略展現。
目前研究團隊經過幾次更新人類行為模型,以及透過現實世界訓練微調,機器人目前已經能夠進行長時間拉力賽了。(記者/劉閔)
瀏覽 531 次