自2016年3月“人機(jī)大戰(zhàn)”以來(lái),以4:1戰(zhàn)勝韓國(guó)天王級(jí)棋手李世石的AlphaGo始終是公眾關(guān)注的焦點(diǎn),關(guān)于人與機(jī)器“誰(shuí)更厲害”的爭(zhēng)論不絕于耳。一年后,頂尖人工智能與人類棋手再度對(duì)決,一場(chǎng)“升級(jí)版”的人機(jī)大戰(zhàn)即將上演。
(圖片來(lái)自人民視覺(jué))
據(jù)有關(guān)消息稱,4月10日,中國(guó)圍棋協(xié)會(huì)、浙江省體育局及谷歌共同宣布,三方將于5月23日至27日聯(lián)合主辦“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”(以下簡(jiǎn)稱“圍棋峰會(huì)”)。圍棋峰會(huì)首日,柯潔與AlphaGo升級(jí)版(即AlphaGo2.0)的比賽將正式開(kāi)戰(zhàn)。
毋庸置疑,此次對(duì)決將聚集全世界的目光,意義非凡。
Alphago2.0面世,顛覆你的“圍棋觀”
AlphaGo是一款圍棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈薩比斯、大衛(wèi)·席爾瓦、黃士杰與他們的團(tuán)隊(duì)開(kāi)發(fā)。其主要工作原理是“深度學(xué)習(xí)”。
2016年3月,該程序與圍棋世界冠軍、職業(yè)九段選手李世石進(jìn)行激戰(zhàn),并以4:1的總比分獲勝;2016年末2017年初,該程序在中國(guó)棋類網(wǎng)站上以“大師”(Master)為注冊(cè)帳號(hào)與中日韓數(shù)十位圍棋高手進(jìn)行快棋對(duì)決,連續(xù)60局無(wú)一敗績(jī),人們紛紛感嘆:人工智能當(dāng)真無(wú)敵!不少職業(yè)圍棋手認(rèn)為,阿爾法圍棋的棋力已經(jīng)達(dá)到甚至超過(guò)圍棋職業(yè)九段水平,在世界職業(yè)圍棋排名中,其等級(jí)分曾經(jīng)超過(guò)排名人類第一的棋手柯潔。
2017年1月17日,谷歌DeepMind公司CEO哈薩比斯在德國(guó)慕尼黑DLD(數(shù)字、生活、設(shè)計(jì))創(chuàng)新大會(huì)上宣布推出真正2.0版本的阿爾法圍棋(AlphaGo)。哈薩比斯還說(shuō):新的嘗試會(huì)給人類帶來(lái)新的挑戰(zhàn)課題,即“理解AlphaGo的手法,探索‘深度學(xué)習(xí)’方式的極限,臻至‘圍棋之神’的境界”。
1.0版本的AlphaGo是“深度學(xué)習(xí)”人類棋譜得出圍棋手?jǐn)?shù)的估值,但1.0版本的AlphaGo所走招法其實(shí)并不脫離人類理解。如果1.0版本的AlphaGo完善了,就意味著得出了接近完美的圍棋手?jǐn)?shù)估值函數(shù),而2.0版本AlphaGo就利用這個(gè)估值函數(shù)自我對(duì)局和“深度學(xué)習(xí)”,不再受人類棋譜的局限,下出真正屬于“人工智能”的圍棋。
韓國(guó)亞洲大學(xué)電子工程學(xué)教授甘東根(音)說(shuō):“谷歌公司大概認(rèn)為只依據(jù)人類棋譜很難真正超越人類的水準(zhǔn),所以尋找新的思路、新的突破口。但是僅靠自我學(xué)習(xí)能否得出水平更為高超的圍棋AI,還有待觀察?!?/p>
柯潔與阿爾法狗
前有李世石輸給人工智能程序,那么對(duì)于5月份的賽事,作為當(dāng)事人的柯潔又是怎么看呢?
作為當(dāng)今棋壇第一人,柯潔更像是人類獲勝的最后一絲希望。他曾在一年前李世石0:2落后于AlphaGo之際放出豪言:AlphaGo要證明自己天下無(wú)敵,必須先過(guò)自己這一關(guān),并稱自己有信心戰(zhàn)勝對(duì)手,“勝算大概在六七成”。
今年年初,神秘棋手Master在弈城、野狐等對(duì)弈網(wǎng)站以30秒以內(nèi)的快棋出擊,中、韓、日近百位職業(yè)棋手潰不成軍,在創(chuàng)下60∶0的戰(zhàn)績(jī)后,其背后團(tuán)隊(duì)證實(shí)Master就是“阿爾法圍棋”升級(jí)版,并宣布暫時(shí)封盤。當(dāng)時(shí),網(wǎng)名“潛伏”的柯潔曾在第五十盤出戰(zhàn),鎩羽而歸。
“我在半年前得知了與AlphaGo對(duì)決的消息,這次能夠與AlphaGo對(duì)決,是我的榮幸?!痹?0日發(fā)布會(huì)現(xiàn)場(chǎng),柯潔如是坦言。而對(duì)于一個(gè)“只有勝利才是唯一真諦”的棋手而言,柯潔表示“這一次不會(huì)輕易妥協(xié)”,并稱“抱有必勝的心態(tài)和必死的信念”。
柯潔顯得十分謙虛,將AlphaGo描述為來(lái)自未來(lái)的對(duì)手?!艾F(xiàn)在的AlphaGo已經(jīng)超過(guò)我們最強(qiáng)棋手的想象,帶給我們最大的震撼與享受,”柯潔感慨道,“我是站在了歷史變革的節(jié)點(diǎn)之上,很幸運(yùn)能夠見(jiàn)證AlphaGo這樣強(qiáng)大的棋手?!?/p>
誰(shuí)將更勝一籌?
在“阿爾法圍棋”橫空出世之前,人工智能圍棋尚不足以挑戰(zhàn)職業(yè)頂尖高手。但“阿爾法圍棋”的蒙特卡洛樹(shù)搜索、深度學(xué)習(xí)、自我決策等新技術(shù)顛覆了人類的認(rèn)知。
5月份的這場(chǎng)比賽將采用中國(guó)規(guī)則的三番棋賽制,無(wú)論輸贏均下滿3盤,比賽每方3小時(shí),5次1分鐘讀秒。
除此之外,主辦方表示,圍棋峰會(huì)期間還將舉辦配對(duì)賽和團(tuán)隊(duì)賽。在配對(duì)賽中,兩位棋手將分別與AlphaGo組隊(duì),以此挑戰(zhàn)棋手如何理解AlphaGo的獨(dú)特風(fēng)格并與之合作;在團(tuán)隊(duì)賽中,將由五位中國(guó)頂尖棋手合作,建立棋手“神經(jīng)網(wǎng)絡(luò)”與AlphaGo對(duì)決。
作為人工智能代表,全新版本AlphaGo相較一年之前更加強(qiáng)大,這也成為本次賽事的另一大看點(diǎn)。據(jù)介紹,新版AlphaGo采用了新的機(jī)器學(xué)習(xí)技術(shù),能夠通過(guò)訓(xùn)練形成策略網(wǎng)絡(luò),將棋盤上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成概率分布,然后訓(xùn)練出價(jià)值網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),以對(duì)手的絕對(duì)勝利到AlphaGo的絕對(duì)勝利為標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。
而AlphaGo的真正優(yōu)勢(shì)體現(xiàn)在,將策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中,將監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來(lái)。此外,新版AlphaGo還將產(chǎn)生大量自我對(duì)弈棋局,通過(guò)自身為下一版本提供訓(xùn)練數(shù)據(jù)。
知已知彼,百戰(zhàn)不殆。研究強(qiáng)大的對(duì)手,由此成了柯潔訓(xùn)練中的一部分。今年初與Master較量時(shí),柯潔曾在微博上表示,他研究了大半年的棋局,經(jīng)過(guò)了無(wú)數(shù)次的思考與實(shí)踐,就是想知道計(jì)算機(jī)究竟強(qiáng)在哪里。
“我們以前總以為‘阿法爾圍棋’計(jì)算力強(qiáng),但現(xiàn)在發(fā)現(xiàn)是大局觀、規(guī)劃藍(lán)圖的能力更強(qiáng),遠(yuǎn)遠(yuǎn)領(lǐng)先于我們,令我非常震撼?!笨聺崒?duì)阿爾法狗表現(xiàn)出敬佩。
“機(jī)器換人”大潮洶涌,有人看好人工智能的應(yīng)用,有人卻擔(dān)心人工智能將威脅到人類生存,而5月的“人機(jī)再戰(zhàn)”,無(wú)疑承載著社會(huì)公眾的諸多期待??聺嵰裁鞔_表示,他將盡最大努力完成這次比賽。
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道
(本文由中國(guó)傳動(dòng)網(wǎng)整理發(fā)布,部分資料來(lái)源于人民日?qǐng)?bào)、21世紀(jì)經(jīng)濟(jì)報(bào)道、東方網(wǎng)、高工機(jī)器人網(wǎng))