你可能每天都在使用計算機視覺系統(tǒng),甚至感受不到它的存在。你有沒有使用過Snapchat上提供的最新濾鏡?這就是計算機視覺的產(chǎn)物。你有沒有使用iPhone上的人臉解鎖功能?這也是計算機視覺的體現(xiàn)。你有沒有使用手機將自己的工資轉(zhuǎn)到指定的銀行卡當(dāng)中,并直接從銀行賬戶內(nèi)提取現(xiàn)金?沒錯,這還是計算機視覺的應(yīng)用。
我們所知的計算機視覺技術(shù)正處于發(fā)展的臨界點。由于行業(yè)范圍內(nèi)的開發(fā)工作以及深度學(xué)習(xí)算法與圖形處理器的快速進步,我們正迎來一系列十年前難以想象的成果。
這項技術(shù)的一部分成果早在幾年之前就已經(jīng)存在,但過去一年的幾項重大發(fā)展令計算機視覺達到了新的高度。更強大的傳感器、大量標(biāo)記圖像、易于使用的深度學(xué)習(xí)軟件再加上不斷改進的處理器,共同將此前只能由少數(shù)幾家巨頭級科技企業(yè)掌握的計算機視覺交付給普羅大眾。
亞馬遜公司發(fā)布的Rekognition服務(wù)將計算機視覺功能推廣至每一位開發(fā)人員手中。微軟為其OneDrive以及SharePoint提供新的AI服務(wù)。谷歌照片也借此讓我們的回憶變得可供搜索。
看起來,未來似乎就在當(dāng)下。
充滿無限可能的世界
在2018年,我們看到一系列雄心勃勃的計算機視覺項目先后涌現(xiàn),這意味著該項技術(shù)的應(yīng)用效果終于趕上了開發(fā)人員長久以來的期望。這同時也意味著開發(fā)定制化計算機視覺應(yīng)用將很快變得成本低廉、極具可行性。
舉例來說,ModiFace允許用戶利用智能手機進行化妝。Topology公司則讓用戶能夠通過手機試戴各款眼鏡。MTailor使用類似的技術(shù)為您定制牛仔褲與襯衫。除了時尚行業(yè)之外,PotteryBarin允許用戶查看新家具擺在家中的樣子,Hover則允許用戶將家居照片轉(zhuǎn)換為尺寸準確的3D模型。
這些項目雖然不像自動駕駛汽車或者無人雜貨店那么復(fù)雜,但同樣預(yù)示著現(xiàn)有計算機視覺產(chǎn)品有望在未來幾年中得到大規(guī)模普及:一旦小型企業(yè)有能力開發(fā)出針對大眾群體的計算機視覺產(chǎn)品,此項技術(shù)則將快速滲透至我們生活中的幾乎每個角落。
計算機視覺為何值得關(guān)注?
計算機視覺與其它人工智能技術(shù)有所不同。首先,對于大多數(shù)組織而言,計算機視覺是一項全新的功能,而非像預(yù)測分析那樣只是對原有解決方案的一種漸進式改善。
此外,計算機視覺還能夠以無障礙方式改善人類的感知能力。當(dāng)這些算法從圖像當(dāng)中推斷出信息時,其并不像其它人工智能方案那樣是在對本質(zhì)上充滿不確定性的未來做出預(yù)測;相反,它們只是在判斷關(guān)于圖像或圖像集中當(dāng)前內(nèi)容的分類真相。這意味著計算機視覺將隨著時間推移而變得愈發(fā)準確,直到其達到甚至超越人類的圖像識別能力。
最后,計算機視覺能夠以遠超其它AI工具的速度收集訓(xùn)練數(shù)據(jù)。大數(shù)據(jù)集的主要成本體現(xiàn)在訓(xùn)練數(shù)據(jù)的收集層面,但計算機視覺只需要由人類對圖片及視頻內(nèi)容進行準確標(biāo)記——這項工作的難度明顯很低。正因為如此,近年來計算機視覺技術(shù)的采用率才得到迅猛提升。
2019年之后的計算機視覺前景
雖然我們已經(jīng)開始在消費級產(chǎn)品當(dāng)中看到計算機視覺技術(shù),但其中大部分方案將繼續(xù)面向特定行業(yè)中的特定用途。舉例來說,CCCInformationServices正在幫助汽車保險公司利用熱圖識別車輛損壞情況——該熱圖能夠高亮顯示出損壞程度最高的位置。
這類計算機視覺產(chǎn)品可能不夠驚艷,但最重要的是這些新的應(yīng)用方式意味著開發(fā)人員能夠更輕松地判斷信息是有效還是無效——如此一來,我們才能一步步邁向智慧城市這類規(guī)模極為龐大的項目。
亞馬遜、微軟以及谷歌在2018年展示的最新突破性進展也成為推動計算機視覺迎來發(fā)展轉(zhuǎn)折點的催化劑。產(chǎn)品設(shè)計師與人工智能工程師已經(jīng)開始研究利用計算機視覺與增強現(xiàn)實技術(shù)建立新型解決方案。硬件制造商正在改進組件性能并提高成本效益,從而確保該項技術(shù)在實際表現(xiàn)與使用門檻方面皆有所改善。
在不久的未來,計算機視覺領(lǐng)域最重要的創(chuàng)新成果應(yīng)該體現(xiàn)在訓(xùn)練數(shù)據(jù)層面。目前,人類仍需要以手動方式標(biāo)記圖像內(nèi)容以訓(xùn)練計算機視覺AI。(大家可能填寫過網(wǎng)頁表單,其中要求您從網(wǎng)格當(dāng)中選擇一些圖像來指示像店面或者汽車這類常見的對象。在執(zhí)行這些操作時,您實際上已經(jīng)在為計算機視覺項目創(chuàng)建標(biāo)記數(shù)據(jù)。)
不過隨著技術(shù)的進步,人工智能將最終實現(xiàn)自我訓(xùn)練,這將進一步簡化流程并加快模型的改進速度。
計算機視覺市場規(guī)模的增長速度幾乎與能力提升保持同步:預(yù)計到2025年,市場總量將達到262億美元,即年均復(fù)合增長率超過30%。人工智能代表著未來,而計算機視覺則是人工智能最為有力的表現(xiàn)形式。很快,計算機視覺應(yīng)用將隨處可見——以至于大家甚至不會注意到它的存在。
聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請及時聯(lián)系我們刪除(QQ:2737591964),不便之處,敬請諒解!