日本精品人成视频在线观看,在线精品视频一区二区

<kbd id="xmisg"></kbd>

新聞?lì)l道行業(yè)資訊企業(yè)動(dòng)態(tài) 展會(huì)報(bào)道人物專訪產(chǎn)品新聞政策法規(guī) 技術(shù)前沿研究報(bào)告

傳動(dòng)網(wǎng) > 新聞?lì)l道 > 行業(yè)資訊 > 資訊詳情

如果機(jī)器人擁有了好奇心······

時(shí)間：2017-06-15

來(lái)源：網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ)：多年以來(lái)，科學(xué)家一直在開發(fā)針對(duì)好奇心的算法，但復(fù)制人類的求知欲是個(gè)難題。

在一場(chǎng)關(guān)于人工智能的轉(zhuǎn)折中，計(jì)算機(jī)科學(xué)家對(duì)機(jī)器進(jìn)行編程，使其變得具有好奇心——能自己探索周圍環(huán)境并且為了學(xué)習(xí)而學(xué)習(xí)。這種新方法可使機(jī)器人比現(xiàn)在學(xué)習(xí)得更快。有朝一日，它們甚至可能在形成假設(shè)和推動(dòng)已知科學(xué)向前發(fā)展方面超越人類科學(xué)家。

“發(fā)展好奇心是智能的核心問題?！痹诿绹?guó)布朗大學(xué)掌管智能機(jī)器人實(shí)驗(yàn)室的計(jì)算機(jī)科學(xué)家GeorgeKonidaris介紹說(shuō)，“當(dāng)你不確定你的機(jī)器人將來(lái)要做什么時(shí)，使其具有好奇心將會(huì)非常有用?！?/p>

多年以來(lái)，科學(xué)家一直在開發(fā)針對(duì)好奇心的算法，但復(fù)制人類的求知欲是個(gè)難題。比如，大多數(shù)方法不能評(píng)估智能機(jī)器人在看見某個(gè)事物前預(yù)測(cè)其是否有趣方面存在的差距。（人類有時(shí)能通過封面判斷一本書是否有趣）

目前在英國(guó)倫敦谷歌深度思維公司就職的計(jì)算機(jī)科學(xué)家ToddHester希望做得更好?！拔以趯ふ沂褂?jì)算機(jī)更加聰明地學(xué)習(xí)并且像人類一樣進(jìn)行探索的方法?！盚ester表示，“不是探索所有事情，也不是隨意進(jìn)行探索，而是嘗試著更加聰明地做一些事情。”

為此，Hester和得克薩斯大學(xué)計(jì)算機(jī)科學(xué)家PeterStone開發(fā)了一種名為TEXPLORE-VENIR、依賴于強(qiáng)化學(xué)習(xí)技術(shù)的新算法。在強(qiáng)化學(xué)習(xí)中，程序會(huì)嘗試一些事情。如果一個(gè)舉動(dòng)使其離某個(gè)最終目標(biāo)（比如迷宮的盡頭）更近一步，它會(huì)收到一個(gè)小小的獎(jiǎng)勵(lì)并且更有可能在將來(lái)再次嘗試這一操作。深度思維公司利用強(qiáng)化學(xué)習(xí)，使程序通過隨機(jī)試驗(yàn)掌握雅達(dá)利游戲和圍棋游戲的玩法。不過，和其他具有好奇心的算法一樣，TEXPLORE-VENIR同樣設(shè)置了一個(gè)內(nèi)在目標(biāo)。如果它理解了一些新事物，就會(huì)獎(jiǎng)勵(lì)自己，即便這些知識(shí)并未使其離最終目標(biāo)更近一步。

隨著TEXPLORE-VENIR不斷學(xué)習(xí)并且構(gòu)建起關(guān)于世界的模型，它會(huì)因發(fā)現(xiàn)了和此前見到的事物不一樣的信息而獎(jiǎng)勵(lì)自己。比如，在一幅地圖上發(fā)現(xiàn)遙遠(yuǎn)的地方，或者在烹調(diào)用的程序上發(fā)現(xiàn)具有異國(guó)情調(diào)的食譜?！八鼈兪峭耆煌膶W(xué)習(xí)和探索類型?！盞onidaris表示，“對(duì)它們進(jìn)行平衡真的很重要。我喜歡這篇文章的地方在于它同時(shí)做到了兩點(diǎn)?！?/p>

Hester和Stone在兩個(gè)場(chǎng)景中測(cè)試了他們的方法。首先是一個(gè)含有一圈4個(gè)房間的虛擬迷宮，房間則由鎖著的門連接起來(lái)。機(jī)器人（僅是一個(gè)計(jì)算機(jī)程序）不得不找到鑰匙，將其撿起來(lái)，然后利用它打開門上的鎖。每通過一扇門，機(jī)器人會(huì)獲得10分，并且擁有3000步來(lái)獲得更高的得分。如果研究人員先讓機(jī)器人僅在TEXPLORE-VENIR的指導(dǎo)下摸索1000步，它在3000步的測(cè)試階段會(huì)平均獲得約55分。如果機(jī)器人利用其他開發(fā)好奇心的算法進(jìn)行此類探索，它在測(cè)試階段的得分從0到35分不等，除了利用一種被稱為R-Max的算法。后者也能讓機(jī)器人獲得約55分。在另一個(gè)不同的設(shè)定中，機(jī)器人不得不同時(shí)探索和穿過門。TEXPLORE-VENIR獲得了約70分，R-Max獲得了約35分，其他算法獲得的分?jǐn)?shù)則不到5分。研究人員在6月出版的《人工智能》雜志上報(bào)告了這一結(jié)果。

隨后，研究人員利用實(shí)體機(jī)器人測(cè)試了他們的算法。這是一個(gè)被稱為Nao的人形玩具。在3項(xiàng)單獨(dú)的任務(wù)中，半米高的機(jī)器人需要擊打鐃鈸、用手將粉色膠帶舉到眼前或者按下腳上的按鈕，從而獲得分?jǐn)?shù)。在每項(xiàng)任務(wù)中，它有200步來(lái)獲得分?jǐn)?shù)，但在這之前會(huì)有400步來(lái)摸索。這要么是隨機(jī)進(jìn)行的，要么利用TEXPLORE-VENIR。每種方法平均開展了13次試驗(yàn)。相較于隨機(jī)摸索，在利用TEXPLORE-VENIR進(jìn)行探索后，Nao在找到粉色膠帶上做得更好，并且在13次試驗(yàn)中，有7次按下了按鈕。但在隨機(jī)探索后，沒有一次按下。通過自身和周圍環(huán)境開展半結(jié)構(gòu)化的試驗(yàn)，TEXPLORE-VENIR做好了充分準(zhǔn)備執(zhí)行被分配的任務(wù)，就像嬰兒在學(xué)習(xí)爬之前舞動(dòng)自己的四肢一樣。

在做家務(wù)、設(shè)計(jì)高效的生產(chǎn)流程或者為疾病尋求治療方案時(shí)，具有好奇心的機(jī)器人會(huì)表現(xiàn)出靈活的行為。Hester表示，下一步將利用深度神經(jīng)網(wǎng)絡(luò)，即以大腦結(jié)構(gòu)為模型的算法更好地確定要探索的新領(lǐng)域。而這順便也能使Hester的探索更進(jìn)一步：“我們能否制造像孩子一樣學(xué)習(xí)的機(jī)器人呢？”

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明：

凡本網(wǎng)注明[來(lái)源：傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“傳動(dòng)網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件，均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

“機(jī)器換人”大潮也難以緩解日本“用工荒”

受到人手短缺困擾的不止快遞業(yè)。數(shù)據(jù)顯示，七成中小企業(yè)深感“人手不足”，不少超市、餐廳不得不縮短營(yíng)業(yè)時(shí)間甚至閉店，一場(chǎng)用工荒正席卷日本。

返回新聞首頁(yè)

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊