隨著近年來自動化行業(yè)和機(jī)器人的火速升溫和發(fā)展,機(jī)器視覺技術(shù)及其相關(guān)應(yīng)用也在馬不停蹄的快速發(fā)展中,并在工業(yè)檢測與制造領(lǐng)域獲得了廣泛的部署。然而,對于超越傳統(tǒng)應(yīng)用以外的日常生活與其他領(lǐng)域,機(jī)器視覺仍然深藏著無限潛力與商機(jī)。
過去幾年來,這個以知識為導(dǎo)向的產(chǎn)業(yè)經(jīng)歷機(jī)器視覺系統(tǒng)的元件與模組日益復(fù)雜化;另一方面,與機(jī)器視覺系統(tǒng)相關(guān)的市場應(yīng)用也持續(xù)擴(kuò)展到超越工業(yè)制造以外的新應(yīng)用領(lǐng)域,特別是如今當(dāng)硬體尺寸縮減以及嵌入式系統(tǒng)持續(xù)展現(xiàn)動能之際,即將來臨的奈米技術(shù)、先進(jìn)感測器、機(jī)器對機(jī)器(M2M)通訊系統(tǒng)以及物聯(lián)網(wǎng)(IoT)等新興技術(shù)發(fā)展,將進(jìn)一步推動機(jī)器視覺應(yīng)用擴(kuò)展至消費(fèi)性電子、可穿戴式裝置、汽車先進(jìn)駕駛輔助系統(tǒng)(ADAS)以及智能化監(jiān)控等更貼近大眾生活的領(lǐng)域。
根據(jù)市場調(diào)查機(jī)構(gòu)MarketsandMarkets在去年發(fā)布的調(diào)查報告指出,2012年機(jī)器視覺系統(tǒng)與元件的全球市場規(guī)模超過30億美元,預(yù)計在2013-2018年間將以8.2%的年復(fù)合成長率(CAGR)成長,在2018年以前達(dá)到50億美元。全球機(jī)器視覺市場帶來的新商機(jī)已經(jīng)成為業(yè)界廠商關(guān)注的焦點(diǎn)。
CEVA公司投資者關(guān)系與企業(yè)傳播副總裁RichardKingston透露,該公司已經(jīng)將電腦視覺DSP授權(quán)給八家企業(yè),其中包括三家行動領(lǐng)域的OEM廠商。而加拿大CogniVue公司業(yè)務(wù)開發(fā)副總裁TomWilson也看好“可穿戴式裝置和汽車領(lǐng)域?qū)⒋嬖诜浅?qiáng)烈的成長商機(jī)。”
全球機(jī)器視覺市場可望在2018年以前超越50億美元大關(guān)。
視覺處理向3D跨越
隨著Google正式發(fā)布ProjectTango后,3D機(jī)器視覺變得更熱門。Kingston表示,“消費(fèi)領(lǐng)域的3D處理主要瞄準(zhǔn)3D成像、自然使用者界面(NUI)和3D視覺應(yīng)用,如PC、筆記型電腦、平板電腦、智能手機(jī)和其它消費(fèi)性設(shè)備。”
業(yè)界追尋3D視覺的主要原因在于解決2D機(jī)器視覺的固有局限,若能更有效地實現(xiàn)在分割(分離近景和遠(yuǎn)景)、照明(用于人臉辨識)、相對位置(場景中的物體)等方面的功能,就能讓更多應(yīng)用透過3D空間資訊來簡化并提高視覺系統(tǒng)的精密度與可靠性。
但無論是3D感測器(例如TOF相機(jī))或以2個2D影像感測器實現(xiàn)的立體感測器,對于處理能力的要求也更高。Wilson指出,“立體匹配(使用兩個影像感測器的輸入)要求差異映射來產(chǎn)生3D景深圖。這是一個非常困難的電腦視覺問題,學(xué)術(shù)界也積極研究最佳化立體辨識演算法。”由于實現(xiàn)3D感測的每一種方法都存在性能的折衷,CogniVue目前正開發(fā)一種新的演算法,期望針對低成本3D感測器計算其視差圖。
處理大量即時資料需要密集的運(yùn)算能力。若是想實現(xiàn)穩(wěn)定的3D感測映射是非常困難的,特別是對于低功耗的設(shè)備來說。為此,他強(qiáng)調(diào),“CogniVue的APEX影像辨識處理(ICP)技術(shù)能在電量有限的3D視覺應(yīng)用中發(fā)揮關(guān)鍵作用。”
對于系統(tǒng)設(shè)計人員來說,設(shè)計一款能有效執(zhí)行不同視覺演算法的硬體是一項艱巨的挑戰(zhàn)。系統(tǒng)廠商選擇影像/視訊處理解決方案時,可以選擇全部集中在CPU完成,也可以選擇卸載一部份影像處理工作給GPU,或者專為影像處理增加硬體邏輯。在需要3D處理的應(yīng)用中,GPU已經(jīng)讓系統(tǒng)的一部份執(zhí)行多種電腦視覺演算法,從而有助于為通用CPU分擔(dān)工作負(fù)載。
“i.MX6擁有強(qiáng)大的GPU運(yùn)算能力,其3D引擎GC2000內(nèi)含4個渲染核心,可提供高達(dá)30GFLOPS的運(yùn)算能力,支援OpenCL1.1EP,”飛思卡爾(Freescale)微控制器事業(yè)部亞太區(qū)市場行銷和業(yè)務(wù)拓展經(jīng)理李星宇介紹,“此外,i.MX6Q還擁有一個專用的2D引擎(1Gpixel/s)和一個向量繪圖處理引擎。”
針對影像擷取領(lǐng)域,經(jīng)常利用2D相機(jī)感測器或其他光學(xué)感測技術(shù)來分析運(yùn)算3D資料。除了飛行時間法(TOF)3D成像(為目標(biāo)物連續(xù)發(fā)送光線脈沖,根據(jù)光線脈沖與感測器接收反射光線之間的時間,計算出目標(biāo)物距離),在工業(yè)制造檢測方面較廣泛應(yīng)用的是3D雷射三角法,差別在于3D雷射感測器采用逐點(diǎn)掃描,而TOF相機(jī)則同時得到整幅影像的深度資訊。
相較于雷射三角的3D成像方式,美商國家儀器(NI)技術(shù)行銷工程師黃翔鉎介紹,NILabVIEW可為3D視覺應(yīng)用提供雙目立體視覺功能,工程師可將2部相機(jī)安裝在物體的不同角度后,使用校準(zhǔn)技術(shù)調(diào)校兩部相機(jī)之間的畫素資訊以及擷取資料,并透過LabVIEW的3D工具庫進(jìn)行數(shù)學(xué)運(yùn)算分析。透過一個軟硬體無縫整合的繪圖開發(fā)環(huán)境來設(shè)計3D視覺應(yīng)用,更能簡化工程師的工作。
IP與處理器的完美結(jié)合
為了在日益精巧的機(jī)臺或裝置中整合嵌入式視覺系統(tǒng),需要更先進(jìn)的CPU進(jìn)行密集運(yùn)算來處理龐大的資料量,黃翔鉎強(qiáng)調(diào),這將持續(xù)對于CPU效能、功耗與資源是否足以支援強(qiáng)大的視覺分析運(yùn)算帶來了挑戰(zhàn)。
CongmiVue在官網(wǎng)上提到,“為了滿足不斷提高的應(yīng)用需求,過去幾十年來,處理器架構(gòu)持續(xù)因應(yīng)不同階段而進(jìn)展。1980年代的用于桌上型電腦和和伺服器的CPU;1990年代DSP出現(xiàn)加速音訊編解碼和無線/有線語音/資料編解碼的要求;2000年GPU達(dá)到更先進(jìn)的性能與平行性,從而實現(xiàn)2D和3D影像;如今,嵌入式視覺處理需要的是完全不同的處理器架構(gòu):ICP。”
TomWilson也指出,“新一代的視覺應(yīng)用需要100倍以上的嵌入式視覺性能/功耗,為了滿足這些應(yīng)用的性能和功率需求,我們必須在相同功耗下提升較傳統(tǒng)處理架構(gòu)更高100-400倍的性能,”因此,CogniVue強(qiáng)調(diào)其APEXICP技術(shù)可實現(xiàn)這一性能要求。
連同APEXICP核心、APEX程式設(shè)計工具以及一個APEX-CV嵌入式視覺功能庫,可涵蓋多種視覺應(yīng)用。例如特征檢測和搭配適用于可穿戴式(增強(qiáng)實境)和汽車(光流和運(yùn)動追蹤)等。他補(bǔ)充道:“除了常見的電腦視覺功能,CognVue還為特定應(yīng)用提供更先進(jìn)的產(chǎn)品,例如用于人臉辨識的FaceVue、用于監(jiān)控應(yīng)用中運(yùn)動監(jiān)測的MotionVue、用于汽車車道偏離警示的FrontVue,以及用于汽車盲點(diǎn)監(jiān)測的SideVue等。”
針對密集型運(yùn)算需求,CEVA公司包括CEVA-MM3101在內(nèi)的CEVA-MM3000系列使用非常高效且功能強(qiáng)大的向量引擎,從而實現(xiàn)電腦視覺所需的大量平行運(yùn)算。此外,整合的功率調(diào)節(jié)單元(PSU)可在處理器內(nèi)實現(xiàn)動態(tài)電壓調(diào)節(jié),協(xié)助實現(xiàn)‘永不斷線’的應(yīng)用類型。
除了CogniVue和CEVA,致力于機(jī)器視覺IP的廠商還包括Mobileye、Tensilica(現(xiàn)隸屬于CadenceIP部門)與ImaginationTechnologies等。Imagination基于‘Raptor’的可合成ISPIP核心已于2014年第一季上市,使得IP陣營的競爭愈發(fā)激烈。
多家半導(dǎo)體廠商則透過與專業(yè)IP廠商合作/授權(quán)的方式,推出其專用視覺處理器,包括飛思卡爾(Freescale)、德州儀器(TI)以及意法半導(dǎo)體(ST)等。ST與Mobileye共同開發(fā)EyeQ3影像處理器,可實現(xiàn)行人檢測;飛思卡爾基于CogiVue核心推出影像辨識處理器家族SCP2200;以色列Inuitive公司開發(fā)基于雙CEVA-MM3101引擎的3D視覺處理器,實現(xiàn)3D景深圖;賽靈思(Xilinx)利用MVTec公司的HALCON以及SiliconSoftware公司的VisualApplets開發(fā)平臺,為Zynq-7000AllProgrammableSoC打造端對端的SmarterVision開發(fā)環(huán)境。
TI旗下種類繁多的處理器產(chǎn)品中,KeyStone系列多核心處理器具備5.6GHz的ARM及9.6GHz的DSP處理能力,且具備比多晶片方案低功耗的優(yōu)勢,適合機(jī)器視覺領(lǐng)域的攝影機(jī)應(yīng)用;此外該公司的Jacito6系列車用處理器,亦可用于ADAS中的行人辨識、防碰撞警示等機(jī)器視覺功能。
更多資訊請關(guān)注機(jī)器視覺頻道