據(jù)《日本經(jīng)濟(jì)新聞》報(bào)道,美國谷歌旗下的英國子公司沉思科技(DeepMindTechnologies)日前開發(fā)出了新版本圍棋用人工智能(AI)“AlphaGoZero”。
此前的AlphaGo在擊敗全球頂級(jí)棋手時(shí)通過學(xué)習(xí)約3千萬專業(yè)棋手的對(duì)弈數(shù)據(jù)使自身變得強(qiáng)大。但AlphaGoZero無需人類作出示范,也能反復(fù)與自己對(duì)弈,借助自學(xué)創(chuàng)造出勝率最高的下法。
據(jù)報(bào)道,以前的AlphaGo對(duì)人類就已經(jīng)具有壓倒性優(yōu)勢,棋力達(dá)到史上最強(qiáng)。這種實(shí)力有助于將來在產(chǎn)業(yè)方面得到應(yīng)用,例如通過大量數(shù)據(jù)自動(dòng)找到調(diào)整電力供需的時(shí)機(jī)等。
英國科學(xué)雜志《自然》雜志10月19日發(fā)表了相關(guān)文章。谷歌僅向AlphaGoZero教授了圍棋規(guī)則。AlphaGoZero將現(xiàn)有的2種學(xué)習(xí)方法結(jié)合起來,分別通過2種方法思考下一手,還能對(duì)彼此思考出的結(jié)果進(jìn)行參照。
據(jù)悉,AlphaGoZero最初是隨機(jī)落子,但通過反復(fù)與自己對(duì)弈,迅速提高水平。在進(jìn)行實(shí)驗(yàn)3天后,面對(duì)2016年3月?lián)魯№敿?jí)棋手李世石時(shí)的舊版AlphaGo取得了100戰(zhàn)全勝。
據(jù)了解,人類在多年的圍棋歷史中不斷自主完善了被稱為“定式”的慣用下法。在試驗(yàn)40天后,AlphaGoZero已經(jīng)與自己對(duì)弈2900萬局,強(qiáng)大程度超過2016年5月時(shí)面對(duì)全球最強(qiáng)棋手柯潔九段取得3連勝的AlphaGo版本。據(jù)稱,AlphaGoZero還開始掌握人類未知的下法。
美國圍棋協(xié)會(huì)主席安迪·奧肯等在發(fā)給《自然》雜志的稿件中指出,“AlphaGoZero在中盤階段的若干判斷簡直就像迷一樣”。另一方面,隨著人工智能和人類在下棋時(shí)總結(jié)出了相同的定式,證明“人類長達(dá)數(shù)個(gè)世紀(jì)的圍棋活動(dòng)取得的成果并非全部錯(cuò)誤”。
沉思科技的首席執(zhí)行官杰米斯·哈薩比斯在AlphaGo擊敗最強(qiáng)人類棋手時(shí)表示,“這是最后一次和人類對(duì)弈”。為達(dá)成“完全不依賴人類的人工智能”這個(gè)目標(biāo),哈薩比斯在此后繼續(xù)對(duì)AlphaGo進(jìn)行了改進(jìn)。
此前,人工智能曾將人類的對(duì)弈數(shù)據(jù)作為“教師”加以學(xué)習(xí)。因此有觀點(diǎn)指出,人工智能雖然強(qiáng)大,但僅僅處于人類知識(shí)的延長線上。沉思科技通過讓人工智能從零開始自學(xué),采用被稱為“沒有教師的學(xué)習(xí)”方式,創(chuàng)造出了不受人類思維束縛的革新性人工智能。
哈薩比斯表示,“人工智能有可能推動(dòng)人類的智力向前發(fā)展,給全人類帶來積極影響”。
報(bào)道指出,沉思科技與英國國家醫(yī)療服務(wù)體系(NHS)展開合作,除了將人工智能用于早期發(fā)現(xiàn)疑難雜癥外,還將用于調(diào)整電力供需等方面。將來,還期待人工智能在依靠人類力量難以解決的新材料開發(fā)、探究蛋白質(zhì)生成機(jī)制等方面做出貢獻(xiàn)。
報(bào)道還稱,新技術(shù)將來還可能在產(chǎn)業(yè)方面做出貢獻(xiàn)。例如,從大量數(shù)據(jù)中發(fā)現(xiàn)人類難以意識(shí)到的提升效率的方式等。
據(jù)悉,以各種用電數(shù)據(jù)為基礎(chǔ),人工智能將有助于節(jié)省電力。由于像AlphaGoZero一樣的人工智能可以“無師自通”,在宇宙和海洋等觀測數(shù)據(jù)不足的領(lǐng)域也有可能做出貢獻(xiàn)。
更多資訊請關(guān)注工業(yè)機(jī)器人頻道