AI進(jìn)步的核心在于其“社會(huì)性”

時(shí)間:2016-07-25

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):智能體最重要的一點(diǎn)是其“社會(huì)性”。

牛津大學(xué)計(jì)算機(jī)科學(xué)系主任、DeepMind-OxfordPartnership監(jiān)事,著名智能體理論研究學(xué)者M(jìn)ichaelWooldridge博士等在討論智能體時(shí),則提出“弱定義”和“強(qiáng)定義”二種定義方法:弱定義智能體是指具有自主性、社會(huì)性、反應(yīng)性和能動(dòng)性等基本特性的智能體;強(qiáng)定義智能體是指不僅具有弱定義中的基本特性,而且具有移動(dòng)性、通信能力、理性或其它特性的智能體;作為現(xiàn)今著名的智能體理論研究學(xué)者,其著作有《多Agent系統(tǒng)引論》,被稱為當(dāng)今關(guān)于多Agent系統(tǒng)這個(gè)重要論題的第一本教材。

在其二十年的Agent研究生涯里,他幾乎獲得了人工智能領(lǐng)域的所有榮譽(yù):ACM(國(guó)際計(jì)算機(jī)學(xué)會(huì))、AAAI(美國(guó)人工智能學(xué)會(huì))、EURAI(歐洲人工智能學(xué)會(huì))成員,AcademiaEuropaea(歐洲科學(xué)院)成員、ERC(歐洲研究學(xué)會(huì))委員,堪稱人工智能領(lǐng)域的達(dá)人。

作為雷鋒網(wǎng)8月份的CCF—GAIR大會(huì)的學(xué)術(shù)大牛嘉賓之一,近日我們對(duì)其進(jìn)行了專門采訪。

Michael  Wooldridge

問:首先為我們闡述下當(dāng)下多智能體系統(tǒng)的重要性?

MichaelWooldridge:對(duì)我來說,智能體最重要的一點(diǎn)是其“社會(huì)性”。我們知道人和動(dòng)物區(qū)別開來的一個(gè)重要特征就是我們作為智能的,社會(huì)性的動(dòng)物,我們有語(yǔ)言,可以相互合作,協(xié)調(diào),談判來實(shí)現(xiàn)一些遠(yuǎn)超月個(gè)人能力范圍內(nèi)可以實(shí)現(xiàn)的事情。

所以AI如果忽視了“社會(huì)性”這個(gè)屬性,它在接近或者超越我們的路上將會(huì)缺失許多東西。

問:AlphaGo屬于單智能體還是多智能體?

MichaelWooldridge:當(dāng)然是個(gè)單智能體。雖然我不知道其它智能體研究者是否會(huì)稱它為“智能體”,但我很樂意把它定義為單智能體,因?yàn)橹八鼪]有駐留在其它環(huán)境中(事實(shí)上也不曾以任何方式駐留在這個(gè)世界中)。

而通常我們都認(rèn)為智能體是存在于某種環(huán)境中的(注:智能體是指駐留在某一環(huán)境下,能持續(xù)自主地發(fā)揮作用,具備駐留性、反應(yīng)性、社會(huì)性、主動(dòng)性等特征的計(jì)算實(shí)體。)

另外,關(guān)于這個(gè)智能體,現(xiàn)在深度學(xué)習(xí)研究者們遇到了一個(gè)有意思的挑戰(zhàn)——如何讓學(xué)習(xí)系統(tǒng)可以分享他們的經(jīng)驗(yàn)——分享他們學(xué)習(xí)到的經(jīng)驗(yàn),就像人類在學(xué)習(xí)完英語(yǔ)后,又把他們的經(jīng)驗(yàn)用去學(xué)韓語(yǔ),西班牙語(yǔ)等其它語(yǔ)言。

問:除了AlphaGo,還有其它的虛擬智能體代表嗎?

MichaelWooldridge:貿(mào)易機(jī)器人就是個(gè)很典型的例子,這個(gè)程序可以買東西和賣東西,現(xiàn)在國(guó)際貿(mào)易中正大量用到這個(gè)程序,以后AI的應(yīng)用會(huì)更廣,我希望來年這個(gè)數(shù)據(jù)有更大的增長(zhǎng)。

問:智能體系統(tǒng)在接下來的2-3年,如果要列個(gè)Top5領(lǐng)域的話,會(huì)在哪幾個(gè)領(lǐng)域爆發(fā)?

MichaelWooldridge:我覺得是這個(gè)幾個(gè)領(lǐng)域

健康—智能手機(jī)和其它的設(shè)備里的各種傳感器,都在監(jiān)視我們的健康狀態(tài)。

娛樂—看看口袋妖怪里的AI技術(shù)就知道了。

醫(yī)療—人工智能正在為我們尋找新的藥物(和藥物形式)。

自動(dòng)駕駛—美國(guó)有359萬(wàn)卡車司機(jī),我相信20年后,這些都會(huì)被自動(dòng)駕駛代替,這對(duì)社會(huì)是個(gè)巨大的改變。

物流/規(guī)劃—AI在這塊領(lǐng)域會(huì)找到更有效的處理方式。

問:智能體和人工智能的區(qū)別是什么?

MichaelWooldridge:本質(zhì)上區(qū)別還是我上面提的“社會(huì)屬性”,雖然之前的(人工智能)AI一開始沒有對(duì)這點(diǎn)花太多注意力,但智能體(系統(tǒng))一直在聚焦這件事。

問:Mobileye的CTOAmnonShashua在演講中說道:他認(rèn)為深度學(xué)習(xí)的研究繞了遠(yuǎn)路。因?yàn)檎嬲腁I應(yīng)該能幫人類解決人類解決不了的問題,而目前的AI的表現(xiàn)卻僅限于人類已經(jīng)能非常明確的理解和解釋的領(lǐng)域。你如何看這個(gè)說法?

MichaelWooldridge:確實(shí),在一些我們有特定任務(wù)要完成的領(lǐng)域AI非常成功,有時(shí)我們甚至能評(píng)估這項(xiàng)任務(wù)的完成情況;但遷移到有些我們都不太好定義的地方應(yīng)用,目前沒有太多成功的例子可以拿來佐證。

問:怎么看待AlphaGo在網(wǎng)站上排名超過柯潔的事情?

MichaelWooldridge:關(guān)于這點(diǎn),我敢說,誰(shuí)要是覺得除了AlphaGo會(huì)贏后還會(huì)有其它的結(jié)果,那是很荒謬的事情。剩下的,是參賽者在實(shí)際對(duì)決的時(shí)候會(huì)發(fā)現(xiàn)比他想象地驚喜多了,我相信柯潔也會(huì)經(jīng)歷這個(gè)過程的。當(dāng)然,我更感興趣的是AlphaGo能不能教人類下得更好,但現(xiàn)在我們不知道它是如何做到的,這是個(gè)問題。

問:說一下加強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)的關(guān)系?

MichaelWooldridge:它們不是完全不同的兩種東西,因?yàn)閺?qiáng)化學(xué)習(xí)的基本思想是,傾向于加強(qiáng)過去已經(jīng)成功的執(zhí)行操作的概率。

而深度學(xué)習(xí)是在神經(jīng)網(wǎng)絡(luò)的背景下,關(guān)心一個(gè)類似的想法。它們都有著類似的想法,以及需要重復(fù)訓(xùn)練這個(gè)過程。另外在我眼里,這兩個(gè)技術(shù)是互補(bǔ)關(guān)系,而不是競(jìng)爭(zhēng)關(guān)系。

問:實(shí)現(xiàn)AGI的最有效方式是?

MichaelWooldridge:至少目前,我們不知道如何通往AGI,也沒人敢說他知道這個(gè),機(jī)器學(xué)習(xí)近幾年雖然有重大進(jìn)展,但是我們不知道意識(shí)或者自我意識(shí)是如何組織的,如何進(jìn)步的,以及它和大腦的微觀結(jié)構(gòu)有什么關(guān)系,所以AGI還有很長(zhǎng)一段時(shí)間要走。

問:在多智能體系統(tǒng)做決定的時(shí)候,通常子系統(tǒng)要把處理過的數(shù)據(jù)傳輸給母系統(tǒng)再讓其做決定,這中間按理是有個(gè)延遲過程的,怎么處理這個(gè)延遲問題?

MichaelWooldridge:在我的經(jīng)驗(yàn)中,多智能體系統(tǒng)里,有不同的方式組織活動(dòng),避免系統(tǒng)延遲一直是個(gè)問題。一種解決方法是任務(wù)共享——這時(shí)任務(wù)被分解成更小的任務(wù),分享給更小的代理。甚至有時(shí)需要重新組裝這些任務(wù)。

另一種方法就是“結(jié)果分享”——代理所做的就是分享信息,如果我認(rèn)為這個(gè)信息對(duì)你有用的,我跟你一起分享。

最后,這些方法都有優(yōu)點(diǎn)和缺點(diǎn),在多智能體系統(tǒng)研究的關(guān)鍵中,懂得在一個(gè)特定問題中哪個(gè)才是最適合的解決方法很關(guān)鍵。

小結(jié):

智能體是人工智能領(lǐng)域中一個(gè)很重要的概念。通常我們認(rèn)為任何獨(dú)立的能夠思想并可以同環(huán)境交互的實(shí)體都可以抽象為智能體。邁克爾·伍爾德里奇過去花了20多年時(shí)間專注人工智能的這個(gè)前沿領(lǐng)域———智能體(Agent)的研究。

正好這個(gè)Agent(S)系統(tǒng)在博弈,調(diào)度優(yōu)化,金融,游戲,多機(jī)器人控制方面都非常適合,所以AlphaGo這種博弈類高手機(jī)器系統(tǒng)誕生在牛津大學(xué)也說的上“順利成章“,而未來,在人工智能這個(gè)“超級(jí)網(wǎng)絡(luò)”中,我們有理由在各個(gè)場(chǎng)景中都會(huì)充斥著multi-agent的概念。

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0