深化學(xué)習(xí)人工智能領(lǐng)域最熱門(mén)方向

時(shí)間:2018-01-19

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):深度強(qiáng)化學(xué)習(xí)就是用具有感知能力的深度學(xué)習(xí)自動(dòng)提取網(wǎng)絡(luò)動(dòng)態(tài)場(chǎng)景的特征,然后通過(guò)具有決策能力的強(qiáng)化學(xué)習(xí)做出最優(yōu)決策。

先是撂倒人類圍棋界頂尖高手李世石、柯潔的“阿爾法狗”,接著又是零基礎(chǔ)自學(xué)成才、100比0擊敗“阿爾法狗”的“阿爾法元”。隨著“阿爾法狗”和“阿爾法元”的誕生,掀起了深度強(qiáng)化學(xué)習(xí)技術(shù)的一輪熱潮,該方向已成為人工智能領(lǐng)域最熱門(mén)的方向之一。作為2017-2019年度“中國(guó)計(jì)算機(jī)協(xié)會(huì)青年人才托舉工程”和天津市青年千人計(jì)劃專家入選者的天津大學(xué)軟件學(xué)院副教授郝建業(yè),就在深度強(qiáng)化學(xué)習(xí)領(lǐng)域碩果累累,先后主持參與過(guò)多項(xiàng)相關(guān)方面的國(guó)家及省部級(jí)科研項(xiàng)目,并致力于將那些宏偉的人工智能憧憬落實(shí)到實(shí)際的日常生活中去。

深度強(qiáng)化學(xué)習(xí)就是用具有感知能力的深度學(xué)習(xí)自動(dòng)提取網(wǎng)絡(luò)動(dòng)態(tài)場(chǎng)景的特征,然后通過(guò)具有決策能力的強(qiáng)化學(xué)習(xí)做出最優(yōu)決策。郝建業(yè)團(tuán)隊(duì)通過(guò)研究設(shè)計(jì)單個(gè)體及多個(gè)體(深度)強(qiáng)化學(xué)習(xí)及博弈算法和模型,提升智能體在復(fù)雜環(huán)境下學(xué)習(xí)到最優(yōu)決策的性能和效率。其研究成果主要應(yīng)用于自動(dòng)談判、智能電網(wǎng)等領(lǐng)域。

在智能電網(wǎng)領(lǐng)域,郝建業(yè)團(tuán)隊(duì)同帝國(guó)理工大學(xué)合作,針對(duì)倫敦市歷年電量生產(chǎn)和消費(fèi)數(shù)據(jù),設(shè)計(jì)了基于深度強(qiáng)化學(xué)習(xí)的電價(jià)定價(jià)策略,以最優(yōu)化電力市場(chǎng)收益。其研究方向獲得了國(guó)家自然科學(xué)基金、天津市自然科學(xué)基金、香港研究資助局基金、澳大利亞教育部獎(jiǎng)學(xué)金等項(xiàng)目資助支持。其在電子商務(wù)自動(dòng)談判領(lǐng)域的研究成果:《AbiNes:一種自適應(yīng)雙邊談判算法》曾獲得2012年度國(guó)際頂級(jí)自動(dòng)談判比賽冠軍;其研究的“Mercury算法”曾獲得2015年度亞軍。目前其團(tuán)隊(duì)還同網(wǎng)易游戲開(kāi)發(fā)部門(mén)合作,針對(duì)其游戲產(chǎn)品,通過(guò)深度強(qiáng)化學(xué)習(xí)算法共同研發(fā)高效游戲智能體,提升用戶游戲體驗(yàn)。比如,在對(duì)戰(zhàn)游戲中,人工智能體能根據(jù)不同游戲玩家的水平展現(xiàn)不同的技能水平,并隨著用戶游戲水平的提升相應(yīng)提升自己的技能。

隨著“互聯(lián)網(wǎng)+”時(shí)代的到來(lái),網(wǎng)絡(luò)空間安全防御變得尤為重要。天津大學(xué)軟件學(xué)院副教授郝建業(yè)團(tuán)隊(duì)的“大數(shù)據(jù)環(huán)境下移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)攻擊在線檢測(cè)技術(shù)”項(xiàng)目通過(guò)提出安全博弈論模型,結(jié)合多智能體強(qiáng)化學(xué)習(xí)技術(shù),研究設(shè)計(jì)應(yīng)對(duì)不同類型網(wǎng)絡(luò)攻擊的最優(yōu)防御策略。

中間人攻擊是一種常見(jiàn)的網(wǎng)絡(luò)攻擊方法,是指攻擊者通過(guò)使用某種技術(shù)手段與原本正常通訊的雙方分別建立獨(dú)立的連接,這樣就可以作為中間人監(jiān)聽(tīng)整個(gè)通訊過(guò)程,在通信雙方毫不知情的情況下,竊取用戶的敏感信息。由于現(xiàn)有的中間人攻擊防御技術(shù)無(wú)法完全消除該攻擊的存在,之前的防御策略都是通過(guò)切換端口或加密的方式進(jìn)行防御。郝建業(yè)團(tuán)隊(duì)則從一個(gè)全新的角度來(lái)研究中間人攻擊防御問(wèn)題:通過(guò)對(duì)用戶信息進(jìn)行等級(jí)區(qū)分,誘導(dǎo)攻擊者攻擊相對(duì)次要的信息,通過(guò)迷惑攻擊者,降低其獲取用戶敏感核心信息的概率。其相關(guān)研究成果《重復(fù)博弈下中間人攻擊的防御》《針對(duì)中間人攻擊的最優(yōu)個(gè)性化防御策略》分別在人工智能大會(huì)頂級(jí)會(huì)議——第26屆和31屆人工智能大會(huì)上發(fā)表。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0