英媒報導:人工智能擊敗西洋陸軍棋專家棋手

2022年12月06日16:17

參考消息網12月6日報導 據英國《新科學家》週刊網站12月1日報導,一種人工智能可以在西洋陸軍棋(Stratego)中擊敗人類專家棋手。

相比國際象棋、圍棋或撲克牌,西洋陸軍棋可能形成的棋局更多。

總部設在英國的“深層思維”公司開發的人工智能成為這種棋盤遊戲的頂級在線玩家之一。

這種人工智能程式學會了用較小的棋子虛張聲勢,還學會了為取勝而犧牲掉重要棋子。

“深層思維”公司的科學家朱利恩·佩羅拉特說:“最讓我們感到驚訝的行為是,(這種人工智能)具備為獲取對手佈局和策略信息而犧牲有價值棋子的能力。”

西洋陸軍棋的遊戲規則是,兩個玩家試圖奪取對手的軍旗,而軍旗隱藏在由40個棋子組成的陣列中。大多數棋子為編號1至10的士兵,軍銜較高的士兵和軍銜較低的士兵在棋盤上相遇時,前者會吃掉後者。但玩家看不到對手棋子的身份,除非來自對立兩軍的兩個棋子碰到一起——這種規則不同於可以看清對手棋子的國際象棋。

報導指出,加劇遊戲難度的是,西洋陸軍棋其實是一種極其複雜的遊戲,共有10535種可能的棋局。相比之下,圍棋有10360種可能的棋局。國際象棋和撲克牌就更少了。

佩羅拉特和他在“深層思維”公司的同事們開發了名為“DeepNash”的人工智能。為了能夠徹底征服西洋陸軍棋,這種人工智能自行下了55億盤棋,模擬訓練時間大致相當於幾百年。但這種人工智能並不依賴任何有關人類下棋策略的知識。它進行訓練也不是為了戰勝特定的對手。

“深層思維”公司的卡爾·塔爾斯說,DeepNash下棋並不是靠搜索出所有可能的棋局,因為那從計算的角度講是不可能做到的,這種人工智能擁有一種算法,可持續引導其採取最佳策略。最佳策略旨在確保在與完美對手對局時至少有50%的勝率——即使對手對人工智能打算做什麼瞭如指掌。

其結果是,儘管對手信息被隱藏起來,可能出現的棋局極多,每一步棋都有很多不同的走法,但人工智能還是能作出製勝決策。

紐約大學的朱利安·托格柳斯說:“這是我們以前確實無法做到的新情況。”

不論是人類對手還是人工智能對手,DeepNash在對局中都已佔據支配地位。

DeepNash通過在線遊戲平台與人類專家棋手進行了50場排名賽,勝率高達84%,成為排名前三的棋手——人類棋手並未意識到他們在和人工智能對局。

“深層思維”公司研發的這款人工智能與頂級機器人棋手對局的勝率更是高達97%,其中多個機器人棋手此前還贏得過“計算機西洋陸軍棋國際錦標賽”冠軍。

視頻精選
更多新聞