前幾日,在一場以第一版《毀滅戰(zhàn)士》為藍本的兩輪制對戰(zhàn)游戲中,社交網(wǎng)站Facebook和芯片制造商英特爾沒分出勝負,各自以12場10勝的成績拿下一局。
特殊的是,他們派出的參賽選手是機器人。
《毀滅戰(zhàn)士》是一款第一視角經(jīng)典射擊游戲,采用3D地圖,玩家要用武器擊殺怪物和僵尸,在這場比賽中,他們使用的是1993年最初版本。
根據(jù)這次的比賽設(shè)計,兩輪比賽各自持續(xù)2個小時,主要目標參賽隊伍的機器人運用武器擊殺競爭對方玩家,比拼最后的擊殺數(shù)量。
第一輪是采用已知地圖,唯一武器是火箭筒,可以撿拾彈藥和醫(yī)療包。這輪比賽分為12場10分鐘的比賽;第二輪相對難度加大,采用了3張新地圖,地圖上散布各種武器和物品。第二輪同樣每場比賽10分鐘,比4組,每張地圖比3次。
參賽者有Facebook旗下的人工智能機器人F1,英特爾派出的是IntelAct,還有一些美國大學(xué)也派出了機器人,進入比賽。
在培訓(xùn)機器人方面,這些參賽隊伍使用的是VizDoom平臺,根據(jù)開源的1993年版《毀滅戰(zhàn)士》改造的平臺,專門用來培訓(xùn)機器人打游戲。平臺發(fā)起人WojciechJa.kowski在跟IEEE計算機智能和游戲論壇合作后,才有了這場人工智能打游戲比賽,原本據(jù)說Google也有興趣參賽。
WojciechJa.kowski在波蘭的波茲南大學(xué)計算科學(xué)研究所(ICS)擔(dān)任助理教授,據(jù)說看到《自然》雜志上看到了會下圍棋的DeepMind的文章后,拉來了研究所里的學(xué)生組建了一個團隊,做了這個名為VizDoom的平臺。
這場比賽很大程度上依賴于人工智能在視覺學(xué)習(xí)上的能力。參賽隊伍將他們的人工智能機器人放到VizDoom上進行培訓(xùn),但不能使用游戲的底層代碼,這導(dǎo)致比賽難度加大。
從兩輪比賽的機制看,采用新地圖和新武器的第二輪比賽,看上去要更難一些,機器人需要根據(jù)武器火力不同,路線不同,做合適的判斷。
教人工智能學(xué)習(xí)打游戲已經(jīng)不是什么新鮮事了,維基百科上已經(jīng)有“電子游戲機器人”這個詞條了。機器人在游戲上應(yīng)用也有不少,本質(zhì)上,不少競技類游戲背后或多或少用到了人工智能的算法來模擬真實的玩家。