機(jī)器人如何在復(fù)雜的環(huán)境下進(jìn)行視覺識別?

時(shí)間:2017-09-25

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:我們都知道,人類有學(xué)習(xí)的能力。由于人類不斷的追求學(xué)習(xí)和進(jìn)步,我們今天才處于一個(gè)美好的文明社會(huì)。

我們都知道,人類有學(xué)習(xí)的能力。由于人類不斷的追求學(xué)習(xí)和進(jìn)步,我們今天才處于一個(gè)美好的文明社會(huì)。百科上是這么定義學(xué)習(xí)的:學(xué)習(xí)是通過閱讀、觀察、實(shí)踐等手段獲得知識或技能的過程,是使得個(gè)體得到持續(xù)性變化的行為方式。

在工業(yè)革命過后,關(guān)于機(jī)器學(xué)習(xí)的話題不停被人們提及和研究。

不難想象,具備有學(xué)習(xí)能力的機(jī)器人,由于經(jīng)驗(yàn)可以被無窮無盡的芯片儲(chǔ)存,機(jī)器人做出的判斷將越來越精準(zhǔn),犯錯(cuò)的幾率也將趨于零。正因?yàn)檫@些優(yōu)勢,機(jī)器學(xué)習(xí)被應(yīng)用在了高級的、復(fù)雜條件下的視覺識別、決策判定等領(lǐng)域。

最近,某著名手機(jī)品牌又火了一把,它可以通過攝像頭,識別人臉并完成解鎖手機(jī)等功能。有趣的是,不管主人造型怎么變化,它都能認(rèn)出主人的臉。

人臉識別

人臉視覺識別

實(shí)際上,該手機(jī)搭載有神經(jīng)網(wǎng)絡(luò)芯片,通過機(jī)器學(xué)習(xí),它能不斷的記住主人在每個(gè)造型下的微小區(qū)別(積累經(jīng)驗(yàn))并進(jìn)行橫向?qū)Ρ龋罱K它將基本不會(huì)認(rèn)錯(cuò)人。

同樣的,在RoboMaster2017的賽場上,有著一個(gè)九宮格大能量機(jī)關(guān)。這是當(dāng)前版本的賽場中,唯一需要用到機(jī)器學(xué)習(xí)式視覺識別的人工智能機(jī)關(guān)。

擊打大能量機(jī)關(guān)

激活機(jī)關(guān)的過程有些復(fù)雜。機(jī)器人先要識別上方的LED數(shù)字燈,按照先后順序,依次識別并擊打下方每1.5秒就變換一次位置的手寫體數(shù)字,連續(xù)5次擊打成功即可激活機(jī)關(guān)。

大能量機(jī)關(guān)

我們來看下這個(gè)機(jī)關(guān)的難點(diǎn):上方數(shù)碼管為有序、隨機(jī)變化的固定形態(tài)數(shù)字,下方九宮格為每1.5秒隨機(jī)變化位置和字體的手寫體數(shù)字,1.5秒內(nèi)只要錯(cuò)了一個(gè)就要重頭開始。手寫體數(shù)字舉例如下:

各種形態(tài)的數(shù)字1

面對各種字體的數(shù)字一,若按照上一期的傳統(tǒng)視覺方法來識別,機(jī)器人需要將這五種情況“背下來”。但是,萬一比賽出現(xiàn)了第6種數(shù)字一,機(jī)器人就會(huì)徹底蒙圈了:“這是啥?沒見過,不認(rèn)識。

通過上面兩個(gè)例子,我們可以知道,RoboMaster賽場中的大能量機(jī)關(guān)屬于更高級的、復(fù)雜條件下的視覺識別難題,需要用機(jī)器學(xué)習(xí)來解決。

什么是機(jī)器學(xué)習(xí)?

機(jī)器人具備機(jī)器學(xué)習(xí)的能力,實(shí)際上是在說它的計(jì)算機(jī)程序具備機(jī)器學(xué)習(xí)的能力。

一個(gè)計(jì)算機(jī)程序不斷地實(shí)戰(zhàn),過程中不斷累積經(jīng)驗(yàn),自己提高解決問題的能力,則認(rèn)為該程序具有機(jī)器學(xué)習(xí)能力。簡單說,就是丟給機(jī)器一大堆樣本范例,讓它自己學(xué)習(xí)理解,再舉一反三,解決范例以外的問題如果是經(jīng)過機(jī)器學(xué)習(xí)訓(xùn)練的機(jī)器人呢?只要訓(xùn)練得當(dāng),哪怕蘿卜君變異成白蘿卜,變成炒蘿卜絲,都逃不過它的法眼,一眼看穿!

建系統(tǒng)所用的架構(gòu)

要想讓機(jī)器人能通過程序?qū)W習(xí),首先需要搭建機(jī)器學(xué)習(xí)系統(tǒng)的架構(gòu)。前人栽樹,后人乘涼。對于初學(xué)者來說,大部分常見的架構(gòu)都是搭建好的,有些甚至只需要在軟件中敲入幾行代碼就能完成一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)的搭建。由谷歌開發(fā)的TensorFlow,在機(jī)器學(xué)習(xí)研究領(lǐng)域中較為主流,其代碼質(zhì)量高、成熟度高。

更多資訊請關(guān)注機(jī)器視覺頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號獲取更多資訊

關(guān)注中國傳動(dòng)網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0