【中國傳動網(wǎng) 技術(shù)前沿】 MIT團隊打造“密集目標(biāo)網(wǎng)絡(luò)”(DON)的機器人系統(tǒng),能夠讓抓取機器人真正“讀懂”目標(biāo),該系統(tǒng)將目標(biāo)處理生成三維“視覺路線圖”的點集合,讓機器人真正在視覺上理解目標(biāo)。利用這一系統(tǒng),科學(xué)家們不必再像過去的計算機視覺研究一樣,繁瑣地對大量數(shù)據(jù)集中的數(shù)據(jù)進行標(biāo)記了。
MIT識物機器人:“秒懂”物體,過目不忘,不用標(biāo)記數(shù)據(jù)!
長期以來,人類一直以靈巧著稱,這種特點在很大程度上要歸功于我們的眼睛。不過現(xiàn)在,機器人也逐步迎頭趕上。經(jīng)過幾十年的發(fā)展,現(xiàn)在用于生產(chǎn)線等受控環(huán)境中的機器人已經(jīng)能夠一次又一次地拾起同一個目標(biāo)了。
最近在計算機視覺方面的突破,讓機器人也能區(qū)分出不同的目標(biāo)。不過即使這樣,機器人還是無法真正理解物體的形狀,因此在拾取目標(biāo)后,幾乎無法再做什么別的事。
近日,麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(CSAIL)的研究人員在一篇新論文中表示,他們已在這個領(lǐng)域取得了一項重要進展:他們打造的機器人系統(tǒng)可以識別出之前未見過的隨機目標(biāo),并能夠在視覺上“理解”這些目標(biāo),以完成更豐富的任務(wù)。
“密集對象網(wǎng)絡(luò)”:讓機器人讀懂抓取目標(biāo)
該系統(tǒng)名為“密集對象網(wǎng)絡(luò)”(DON),該網(wǎng)絡(luò)將對象視為點的集合,當(dāng)作“視覺路線圖”來使用。這種方法可以讓機器人更好地理解和抓取目標(biāo),最重要的是,機器人能夠在大量類似目標(biāo)中挑出特定的目標(biāo)。亞馬遜和沃爾瑪?shù)裙驹谄鋫}庫中使用的機器就具備類似的技能。
比如,有人可能會使用DON系統(tǒng)讓機器人抓住目標(biāo)上的特定位置,比如鞋舌頭。之后,它就能夠看到之前從未見過的鞋子,并成功抓住鞋舌頭。
參與該研究的博士生LucasManuelli說道:“許多控制系統(tǒng)和識別方法都無法識別朝多個方向放置的目標(biāo)的特定部分?!彼c該論文另一作者、博士生PeteFlorence和MIT教授RussTedrake一起撰寫了該論文?!氨热纾F(xiàn)有的算法就無法抓住馬克杯的杯柄,尤其是在馬克杯朝多個方向放置的情況下,比如直立或側(cè)放。”
該團隊認為,該技術(shù)不僅能用于工業(yè)制造,還能走入家庭的日常生活。比如,給系統(tǒng)展示一座整潔的房子的圖像,讓機器人在你工作時打掃房間,或向機器人展示菜肴的圖像,讓機器人在你度假時把你的餐桌上的盤子收拾好。
DON抓取算法:訓(xùn)練無需標(biāo)注數(shù)據(jù)集,省時省力
值得注意的一點是,沒有任何數(shù)據(jù)事先被人類標(biāo)記過。這個系統(tǒng)是“自我監(jiān)督的”,因此不需要任何來自人類的數(shù)據(jù)標(biāo)注。
機器人抓取目標(biāo)的兩種常見方法是,創(chuàng)建特定任務(wù)的機器學(xué)習(xí),創(chuàng)建通用的抓取算法。這兩種技術(shù)都存在障礙:基于特定任務(wù)的方法很難推廣到其他任務(wù),而通用的抓取算法不夠具體,無法顧及處理特定任務(wù)時的細微差別,比如將目標(biāo)放到特定的位置上。
而DON系統(tǒng)基本上是在給定目標(biāo)上創(chuàng)建一系列坐標(biāo),作為基于目標(biāo)的一種“視覺路線圖”,使機器人更好地理解自己需要抓取哪些目標(biāo),目標(biāo)在何處等。
該團隊訓(xùn)練系統(tǒng)將對象視為構(gòu)成較大坐標(biāo)系的一系列點。然后將不同的點映射到一起,顯示出對象的三維形狀,這種方式和使用多張照片拼接全景照片的方式有些類似。在訓(xùn)練之后,如果指定目標(biāo)上的一個點,機器人可以拍攝該物體的照片,并一系列的點進行識別和匹配,然后就可以指定點拾取目標(biāo)。
這個系統(tǒng)與加州大學(xué)伯克利分校的DexNet系統(tǒng)有所不同,伯克利的系統(tǒng)可以抓取許多不同的目標(biāo),但不能滿足抓取特定目標(biāo)的要求。就好比一個一歲半的嬰兒,他不明白你想要他玩哪個玩具,但仍然可以抓起很多不同的玩具,而一個四歲的孩子,就可以準(zhǔn)確地回應(yīng)“去抓住那輛紅色小卡車的車尾”的要求。
在形狀對稱毛絨玩具上進行的一組測試中,由DON驅(qū)動的Kuka機器人手臂可以從一系列不同的目標(biāo)位置抓住玩具的右耳。這表明系統(tǒng)具有在對稱物體上區(qū)分左右的能力。
在利用不同棒球帽進行測試時,DON可以選擇特定的目標(biāo)帽子,盡管所有的帽子的設(shè)計都非常相似,機器人在之前從未在訓(xùn)練數(shù)據(jù)中看到過帽子的照片。
未來,團隊希望將系統(tǒng)進行改進,讓其具備執(zhí)行特定任務(wù)的能力,同時能夠更深入地了解相應(yīng)的目標(biāo),例如學(xué)習(xí)如何抓住目標(biāo),并將其移動到最終位置等。
團隊將于下個月在瑞士蘇黎世舉行的機器人學(xué)習(xí)會議上發(fā)表這一成果。