AI機器人「強權外交」擊敗人類 Meta「西塞羅」桌遊獲勝
在過去二十年左右的時間裡,有越來越多令人印象深刻的人工智慧系統在從國際象棋和圍棋到星際爭霸等遊戲上擊敗了人類玩家。雖然內容不同,但這些遊戲都是零和博弈,贏者通吃。然而在戰爭策略桌遊《強權外交(Diplomacy)》上就不一樣了。但根據《Gizmodo》的報導,Meta 的基礎人工智能研究團隊表示,他們的新「西塞羅(Cicero)」AI機器人在這款遊戲中,不但擊敗人類,還達到了「人類水平的表現」。
在《強權外交》中,由七名玩家相互競爭以控制大部分補給中心,玩家之間不斷互動,每一輪都從一系列的輪前談判開始。很重要的是,外交玩家和AI都可能會試圖欺騙他人。研究人員表示,外交特別具有挑戰性,因為它需要「在一個鼓勵玩家不信任任何人的環境中」與他人建立信任。換句話說,要讓 AI 在《強權外交》上「獲勝」,它既需要有效地理解遊戲規則,又要從根本上理解人類的互動、欺騙和合作,並且知道如何將句子串起來,而不會聽起來像一台出故障的機器。
Meta 表示,Cicero在 40 場匿名的在上《強權外交》遊戲中的平均得分比人類玩家高出一倍多,並且在玩過不止一場遊戲的玩家中排名前 10%。Cicero甚至在與有 21 名參與者的八場比賽中排名第一。在遊戲的每個階段,Cicero都會根據其他玩家的遊戲表現和文本對話來模擬其他玩家可能會採取的行動。
研究人進行了總時長為 72 小時的研究實驗,並表示,沒有任何玩家發現他們是在與AI對戰。在研究中強調的一個案例中,Cicero能夠透過提出互惠互利的方式成功改變人類玩家的想法。
在這之前,Cicero也接受了大量外交數據的訓練,以便讓它準備好與其他玩家正確溝通。研究人員表示,Cicero是在 125261 個匿名外交遊戲的數據集上接受訓練的,其中約4萬個有包含對話。並包含超過了 1200 萬條人類玩家之間交換的訊息。
然而,Cicero並不完美。AI的對話侷限於當前回合,Cicero並不擅長模擬其與一個玩家的長遠關係,偶爾也會有一些「基礎錯誤」或是「相矛盾」的行為(但人類也會如此)。儘管如此,研究人員表示,由於其與人類合作的獨特能力,Cicero應該在 AI 桌遊名人堂中佔有一席之地。
雖然這只是對一項在桌遊上的研究,但 Meta 的新發現代表了著一個潛在的、新奇的,令人抱有期望的成功AI。這似乎暗示了,未來人類和AI有可能作為合作夥伴,一起解決問題。(編譯 / 莊閔棻)
參考資料: Gizmodo
瀏覽 1,045 次