柯潔與AlphaGo2.0五月對決,勝負(fù)難測

時間:2017-04-11

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:作為當(dāng)今棋壇第一人,柯潔更像是人類獲勝的最后一絲希望。他曾在一年前李世石0:2落后于AlphaGo之際放出豪言:AlphaGo要證明自己天下無敵,必須先過自己這一關(guān),并稱自己有信心戰(zhàn)勝對手,“勝算大概在六七成”。

“AlphaGo采用的是蒙特卡羅樹搜索框架,加上深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)。在這樣一個框架下,深度學(xué)習(xí)尤其是深度強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)圍棋上的天花板究竟有多高,還是個未知數(shù)。”中國人工智能學(xué)會副理事長、清華大學(xué)計(jì)算機(jī)系教授馬少平指出。

就仿佛科幻小說《三體》中,人類艦隊(duì)首次迎戰(zhàn)三體艦隊(duì)“水滴”——去年3月,AlphaGo與李世石的圍棋對決,讓原本自信的人類,被不可預(yù)料的強(qiáng)大戰(zhàn)斗力打了個措手不及。而與《三體》中人類艦隊(duì)幾乎全軍覆沒、殘存艦隊(duì)倉皇逃走所不同的是,李世石版人機(jī)大戰(zhàn)還留下了一個懸念:人類圍棋第一人柯潔,與AlphaGo戰(zhàn)果如何?

如今,這個懸念將在今年5月于烏鎮(zhèn)揭曉。

4月10日,中國圍棋協(xié)會、浙江省體育局及谷歌共同宣布,三方將于5月23日至27日聯(lián)合主辦“中國烏鎮(zhèn)·圍棋峰會”(以下簡稱“圍棋峰會”)。圍棋峰會首日,柯潔與AlphaGo升級版的比賽將正式開打。該次比賽將采用中國規(guī)則的三番棋賽制,無論輸贏均下滿3盤,比賽每方3小時,5次1分鐘讀秒。

除此之外,主辦方表示,圍棋峰會期間還將舉辦配對賽和團(tuán)隊(duì)賽。在配對賽中,兩位棋手將分別與AlphaGo組隊(duì),以此挑戰(zhàn)棋手如何理解AlphaGo的獨(dú)特風(fēng)格并與之合作;在團(tuán)隊(duì)賽中,將由五位中國頂尖棋手合作,建立棋手“神經(jīng)網(wǎng)絡(luò)”與AlphaGo對決。

“我在半年前得知了與AlphaGo對決的消息,這次能夠與AlphaGo對決,是我的榮幸。”在10日發(fā)布會現(xiàn)場,柯潔如是坦言。而對于一個“只有勝利才是唯一真諦”的棋手而言,柯潔表示“這一次不會輕易妥協(xié)”,并稱“抱有必勝的心態(tài)和必死的信念”。

來自未來的對手

本次發(fā)布會就如AlphaGo一般神秘。在發(fā)布會前夕,谷歌僅對外通知10日下午將有“重磅消息”,直到10日上午9點(diǎn)之前,發(fā)布會地點(diǎn)仍是一個謎團(tuán)。

即便如此神秘,也難掩內(nèi)容本身的耀眼。早在數(shù)日之前,發(fā)布會的內(nèi)容便不脛而走:業(yè)內(nèi)傳聞AlphaGo將與柯潔有一戰(zhàn),戰(zhàn)期定檔在5月下旬的烏鎮(zhèn)。在10日發(fā)布會現(xiàn)場,主辦方宣布這個巔峰對決的時間為5月23日。

賽事如此吸引眼球,原因在于這次的交戰(zhàn)雙方。

作為當(dāng)今棋壇第一人,柯潔更像是人類獲勝的最后一絲希望。他曾在一年前李世石0:2落后于AlphaGo之際放出豪言:AlphaGo要證明自己天下無敵,必須先過自己這一關(guān),并稱自己有信心戰(zhàn)勝對手,“勝算大概在六七成”。

如今,在圍棋峰會發(fā)布會現(xiàn)場,柯潔則顯得更為謙虛,將AlphaGo描述為來自未來的對手?!艾F(xiàn)在的AlphaGo已經(jīng)超過我們最強(qiáng)棋手的想象,帶給我們最大的震撼與享受,”柯潔感慨道,“我是站在了歷史變革的節(jié)點(diǎn)之上,很幸運(yùn)能夠見證AlphaGo這樣強(qiáng)大的棋手?!?/p>

作為人工智能代表,全新版本AlphaGo相較一年之前更加強(qiáng)大,這也成為本次賽事的另一大看點(diǎn)。據(jù)介紹,新版AlphaGo采用了新的機(jī)器學(xué)習(xí)技術(shù),能夠通過訓(xùn)練形成策略網(wǎng)絡(luò),將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成概率分布,然后訓(xùn)練出價值網(wǎng)絡(luò)進(jìn)行預(yù)測,以對手的絕對勝利到AlphaGo的絕對勝利為標(biāo)準(zhǔn),預(yù)測所有可行落子位置的結(jié)果。

而AlphaGo的真正優(yōu)勢體現(xiàn)在,將策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索(MCTS)中,將監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來。此外,新版AlphaGo還將產(chǎn)生大量自我對弈棋局,通過自身為下一版本提供訓(xùn)練數(shù)據(jù)。

“蒙特卡羅樹搜索的算法是讓AlphaGo不停地自我對弈,”一位業(yè)內(nèi)觀察人士表示,“通過自我對弈,進(jìn)而訓(xùn)練價值網(wǎng)絡(luò)和策略網(wǎng)絡(luò),從而優(yōu)化蒙特卡羅樹搜索?!?/p>

換言之,擊敗李世石的AlphaGo1.0,是通過學(xué)習(xí)大量人類對戰(zhàn)棋譜及與多位人類頂級高手交鋒,不斷積累形成棋力的。本次迎戰(zhàn)的AlphaGo2.0版本,則將完全摒棄人類棋譜,憑借自我對弈成長為頂級高手。

不過,盡管柯潔自己坦言AlphaGo為強(qiáng)勁對手,卻仍表示不會輕易妥協(xié)。“無論它多么強(qiáng)大,我都要一決勝負(fù),并盡力擊敗AlphaGo,”柯潔稱,“現(xiàn)在我的心情很激動,期待五月的大戰(zhàn)?!?/p>

勝負(fù)之外

盡管還未開戰(zhàn),但外界對本次賽事的結(jié)果,已經(jīng)開始有了預(yù)期。

“AlphaGo采用的是蒙特卡羅樹搜索框架,加上深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)。在這樣一個框架下,深度學(xué)習(xí)尤其是深度強(qiáng)化學(xué)習(xí)在計(jì)算機(jī)圍棋上的天花板究竟有多高,還是個未知數(shù)?!敝袊斯ぶ悄軐W(xué)會副理事長、清華大學(xué)計(jì)算機(jī)系教授馬少平指出。

而就是這樣尚看不清天花板的人工智能應(yīng)用,已經(jīng)足以橫掃人類頂級高手。一年以來,由AlphaGo引爆的各色棋牌類人機(jī)大戰(zhàn)的結(jié)果已基本沒有任何懸念:無論是AlphaGo化身Master,在網(wǎng)上實(shí)現(xiàn)對陣各國高手,實(shí)現(xiàn)60連勝(其中亦包括柯潔),還是騰訊絕藝在騰訊野狐平臺率先晉升網(wǎng)絡(luò)十段,此后在第10屆UEC杯中稱王,或是新近落幕的德州撲克人機(jī)對決中,卡內(nèi)基梅隆大學(xué)開發(fā)的“冷撲大師AI”毫無懸念地戰(zhàn)勝中國龍之隊(duì)……在棋牌類人機(jī)大戰(zhàn)中,人類已越來越心平氣和地接受了自己的落敗。

“AlphaGo與人類的對決已持續(xù)了很長時間,機(jī)器人確實(shí)很強(qiáng)大。比賽的勝負(fù)很重要,柯潔也表示將竭盡全力比賽并爭取勝利,”圍繞此次對決,國家體育總局棋牌運(yùn)動管理中心主任羅超毅指出,“柯潔沒有與AlphaGo進(jìn)行慢棋比賽,現(xiàn)在誰輸誰贏還沒有落定。”

事實(shí)上,在年初Master的網(wǎng)絡(luò)對局中,它采用的都是“20秒3次”的超快棋方式,幾乎都是在中盤輕易取勝,然而在去年李世石對陣AlphaGo時采用的是慢棋,最終有一盤取勝。而在本次圍棋峰會中,無論是柯潔與AlphaGo的“單挑”,還是頂級棋手組成“神經(jīng)網(wǎng)絡(luò)”與AlphaGo“車輪戰(zhàn)”,都延長了行棋的時間,無形中對人類或?qū)⒏佑欣?/p>

此外,羅超毅強(qiáng)調(diào),勝負(fù)固然重要,卻并非本次圍棋峰會的全部,也不是峰會的主題?!翱聺嵟cAlphaGo的對決,不僅僅是人機(jī)對戰(zhàn),而是科學(xué)家與棋手的智慧交流?!绷_超毅指出,“柯潔曾提到,AlphaGo的許多招法是過去所沒有想過的,這也恰好證明了圍棋奇妙無窮,提升的空間很大,無論棋手還是深度學(xué)習(xí)團(tuán)隊(duì),都將從中獲益匪淺?!?/p>

更多資訊請關(guān)注工業(yè)機(jī)器人頻道

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0