五臺山龍泉寺,到峨眉山金頂,再到頤和園石舫,中國科學(xué)院自動化研究所機(jī)器人視覺課題組對這些中國古建筑進(jìn)行了三維重建。
你也許不了解,看起來很清晰的照片在拍照時照片中物體的深度信息也會丟失。三維重建是利用多幅數(shù)碼圖像來恢復(fù)物體深度的過程,機(jī)器人視覺課題組長期以來從事的工作就是如何給圖像的每個像素賦予可靠的深度信息。此外,將三維計算機(jī)視覺推向應(yīng)用,也是機(jī)器人視覺課題組的研究目標(biāo)之一。
給計算機(jī)一雙慧眼
人人都有兩只眼睛,我們無時無刻不在用眼看東西,但看的目的是什么?或者說為什么要看?這些問題簡單到很少有人去思考,但事實上又很少有人能說清楚。機(jī)器人視覺課題組用他們的工作回答了這些問題。
課題組成員、副研究員高偉向記者介紹說:“機(jī)器視覺也稱計算機(jī)視覺,通俗地講,就是使計算機(jī)具有‘看’的功能,用計算機(jī)來模擬人的視覺系統(tǒng),實現(xiàn)人的視覺功能。”計算機(jī)視覺是以圖像為輸入,以模式識別技術(shù)為手段,對圖像進(jìn)行分析和理解的學(xué)科。
美國心理學(xué)家gibson的理論認(rèn)為,人的視覺不管有多少用處,但主要功能可概括為適應(yīng)外界環(huán)境和控制自身的運動——看到汽車沖過來,你會趕快回避;看到前面有激流,你不會冒然蹚過去。
高偉介紹,為了適應(yīng)外界環(huán)境和控制自身的運動,我們的視覺系統(tǒng)需要做到:能識別物體(可想而知,一個人連親戚、同事、朋友都不認(rèn)識,能怎樣生活),能判斷物體的運動以及確定物體的形狀和方位(否則,無法抓取物體)。
因此,物體識別、物體定位、物體三維形狀恢復(fù)和運動分析,就構(gòu)成了計算機(jī)視覺的主要研究內(nèi)容。
機(jī)器人視覺課題組隸屬于自動化所模式識別國家重點實驗室,課題組主要研究方向包括從圖像重建三維場景、運動物體跟蹤和機(jī)器人視覺導(dǎo)航等。