自動(dòng)駕駛汽車、交通標(biāo)志檢測、面部識(shí)別和自助結(jié)賬。 將所有這些先進(jìn)解決方案結(jié)合在一起的是計(jì)算機(jī)視覺。 計(jì)算機(jī)視覺允許計(jì)算機(jī)從原始圖像中提取信息,并為更有效的業(yè)務(wù)數(shù)字化開辟了許多機(jī)會(huì)。 讓我們來看看計(jì)算機(jī)視覺如何顛覆各個(gè)行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來了哪些獨(dú)特的好處。
#1:物體檢測
傳統(tǒng)的計(jì)算機(jī)視覺實(shí)現(xiàn)使用對(duì)輸入和輸出的深入分析。老式 CV 的典型流程依賴于邊緣檢測等圖像處理技術(shù)來識(shí)別和標(biāo)記圖像中的對(duì)象。
計(jì)算機(jī)科學(xué)中深度學(xué)習(xí)架構(gòu)的出現(xiàn)導(dǎo)致了從經(jīng)典的 CV 技術(shù)(如基于定義的特征結(jié)構(gòu))到 AI 驅(qū)動(dòng)的圖像神經(jīng)網(wǎng)絡(luò)分析的巨大轉(zhuǎn)變,這使得圖像中數(shù)據(jù)的提取和分類幾乎完全自動(dòng)化。簡單來說,人工智能將編程從畫面中剔除,取而代之的是一種監(jiān)督較少的方法,在這種方法中,計(jì)算機(jī)解釋輸入數(shù)據(jù)并訓(xùn)練自己識(shí)別圖像的內(nèi)容。
用例
當(dāng) AI 進(jìn)入醫(yī)學(xué)成像等領(lǐng)域時(shí),計(jì)算機(jī)會(huì)利用卓越的模式識(shí)別來識(shí)別原始圖像中的細(xì)微元素,例如 X 射線或 MRI 中是否存在微量癌細(xì)胞。盡管仍然需要人工解釋和專業(yè)知識(shí)來檢查機(jī)器的推斷,但額外的閃電般的快速分析層有助于補(bǔ)充人類智能并挽救生命。
隨著自動(dòng)駕駛汽車在美國和其他許多國家上路,CV 領(lǐng)域?qū)⒂瓉肀l(fā)式增長。沒有計(jì)算機(jī)視覺,自動(dòng)駕駛汽車就無法存在。由于車輛的車載計(jì)算機(jī)需要對(duì)道路上的潛在障礙物做出快速?zèng)Q策,因此它依賴于一套高度優(yōu)化的基于 CV 的技術(shù)。
值得注意的是,在醫(yī)學(xué)、安全、制造等領(lǐng)域,人工智能驅(qū)動(dòng)系統(tǒng)如何做出決策的透明度至關(guān)重要。這就是可解釋的人工智能發(fā)揮作用的地方。該技術(shù)允許以人類可以理解的方式解釋系統(tǒng)的發(fā)現(xiàn),并顯示人工智能算法做出的特定決策的可靠性。
使用計(jì)算機(jī)視覺解決以下業(yè)務(wù)挑戰(zhàn):
公安(車輛識(shí)別、武器類型識(shí)別、可疑物體定位等)
銷售自動(dòng)化和庫存管理(識(shí)別貨架上的低庫存或錯(cuò)放物品、檢測空貨架、執(zhí)行質(zhì)量控制、自助結(jié)賬的產(chǎn)品識(shí)別等)
消除人為錯(cuò)誤并防止工作流程中的重復(fù)計(jì)算
#2:光學(xué)字符識(shí)別(OCR)
光學(xué)字符識(shí)別 (OCR) 是計(jì)算機(jī)視覺的獨(dú)特實(shí)現(xiàn),可解決各種特定領(lǐng)域的任務(wù)。 OCR 旨在從輸入圖像中檢測和提取字母、數(shù)字和其他字符。
用例
Google Lens 使用 OCR 讓客戶從照片中翻譯外語,并從圖像或 Google 搜索中提取文本。 OCR 技術(shù)還使傳統(tǒng)媒體的數(shù)字化變得簡單,從報(bào)紙、雜志和書籍的掃描中提取文本。以前,大學(xué)很難將藏傳佛教宗教文本等更晦澀的文件數(shù)字化,但現(xiàn)代 OCR 技術(shù)使得從非標(biāo)準(zhǔn)語言文件中提取文本變得簡單。
金融機(jī)構(gòu)使用 OCR 來改善客戶的生活質(zhì)量,例如讓客戶從文件中提取他們的國際銀行帳號(hào) (IBAN) 或掃描支票圖像,這樣就不必去銀行存款.一些應(yīng)用程序可以掃描借記卡或信用卡以輸入付款詳情,因此您不必在結(jié)帳窗口繁瑣地輸入所有付款信息。
政府通常使用 OCR 來縮短國家邊境的處理時(shí)間或識(shí)別和登記文件?,F(xiàn)代護(hù)照和駕駛執(zhí)照上的機(jī)器可讀區(qū)域與政府和商業(yè)環(huán)境中的 OCR 系統(tǒng)兼容。
#3:面部識(shí)別
與對(duì)象識(shí)別類似,面部識(shí)別旨在使用計(jì)算機(jī)視覺識(shí)別圖像中的人類面部特征。經(jīng)典的計(jì)算機(jī)視覺方法利用“Haar-like features”來計(jì)算面部特征之間的片段,但現(xiàn)代面部識(shí)別實(shí)現(xiàn)依賴于人工智能,就像人工智能用于物體識(shí)別一樣。
用例
面部識(shí)別技術(shù)對(duì)于安全應(yīng)用程序至關(guān)重要,因?yàn)樗兄诜乐挂苿?dòng)和 Web 應(yīng)用程序漏洞。無數(shù) Apple iPhone 用戶依靠 Apple 的 Face ID 技術(shù)進(jìn)行生物識(shí)別來解鎖他們的手機(jī)。
零售商已經(jīng)部署了類似的實(shí)現(xiàn)來識(shí)別已知的商店扒手。實(shí)時(shí)掃描儀從安全攝像頭流中抓取客戶的面部,并交叉引用已知犯罪分子的數(shù)據(jù)庫。同樣的技術(shù)通過從執(zhí)法數(shù)據(jù)庫中提取來幫助尋找失蹤兒童。
面部識(shí)別還可以幫助您完成以下任務(wù):
安全和訪問控制
身份驗(yàn)證
員工跟蹤
醫(yī)療保健中的患者篩查程序
識(shí)別和追蹤犯罪分子
下一代面部識(shí)別軟件甚至可以查看姿勢、手勢和面部表情,以確定客戶是否可能在賭場作弊。與相同的安全軟件捆綁的步態(tài)分析還可以幫助根據(jù)他們獨(dú)特的腳步和步幅模式來檢測犯罪分子,因?yàn)樵S多犯罪分子通過戴口罩來躲避面部識(shí)別。
#4:圖像恢復(fù)和場景重建
計(jì)算機(jī)視覺技術(shù)還可以恢復(fù)嚴(yán)重退化的檔案鏡頭和圖像,這可能是一項(xiàng)關(guān)鍵的業(yè)務(wù)技術(shù)。與從照片中去除噪點(diǎn)就足夠的簡單情況不同,計(jì)算機(jī)視覺可以幫助處理更多損壞的圖像,這些圖像需要進(jìn)行重大更改和詳細(xì)分析。圖像的損壞部分通常使用評(píng)估照片廣播內(nèi)容的生成模型來填充。
用例
除了恢復(fù)圖像和視頻之外,現(xiàn)代神經(jīng)網(wǎng)絡(luò)還可以僅通過掃描照片中的對(duì)象來重建 3D 場景。考古學(xué)家、法醫(yī)專家、環(huán)境科學(xué)家和許多其他專業(yè)人士使用場景重建,這是一種改變游戲規(guī)則的計(jì)算機(jī)視覺范例。 RetrievalFuse 等項(xiàng)目能夠從單個(gè) RGB 圖像構(gòu)建全景 3D 場景。
#5:人體姿勢估計(jì)
姿勢估計(jì)旨在模擬人類視覺能力,特別是識(shí)別圖像和視頻中的姿勢和手勢。一些最早的高級(jí)人體姿勢估計(jì)示例出現(xiàn)在大預(yù)算電影中,例如彼得杰克遜的《指環(huán)王》。隨著計(jì)算資源隨著時(shí)間的推移而擴(kuò)大,姿勢估計(jì)將在許多不同的產(chǎn)品中發(fā)揮作用。
用例
在安全應(yīng)用中,姿勢估計(jì)通過分析面部識(shí)別不可行的步態(tài)來幫助識(shí)別潛在的麻煩制造者。計(jì)算機(jī)視覺可以通過分析身體姿勢來幫助實(shí)時(shí)檢測入店行竊。該系統(tǒng)可以區(qū)分正常的購物行為和可疑行為,例如拿走物品并將其藏在口袋或外套中。當(dāng)檢測到可疑行為時(shí),管理人員會(huì)收到警報(bào),并可以在小偷離開商店之前迅速做出反應(yīng)。
以下是在您的業(yè)務(wù)中使用姿勢估計(jì)的一些方法:
康復(fù)措施分析
開發(fā)基于人工智能的健身教練應(yīng)用程序
識(shí)別人體在空間中的位置以改進(jìn)增強(qiáng)現(xiàn)實(shí)的應(yīng)用
游戲角色動(dòng)畫
人在商店和購物中心的活動(dòng)分析
盡管姿態(tài)估計(jì)曾經(jīng)是一項(xiàng)巨大的計(jì)算挑戰(zhàn),但云計(jì)算和硬件的創(chuàng)新使更多公司能夠接觸到這項(xiàng)技術(shù)。
一切都是可能的
對(duì)象檢測、面部識(shí)別、場景重建、圖像恢復(fù)和人體姿態(tài)估計(jì)只是計(jì)算機(jī)視覺技術(shù)的幾種不同實(shí)現(xiàn)方式。由于下一代 AI 的強(qiáng)大功能,無論您的企業(yè)從事何種行業(yè),計(jì)算機(jī)視覺都可以提供獨(dú)特的優(yōu)勢,使您的公司在競爭中處于領(lǐng)先地位。從重建犯罪現(xiàn)場照片的全深度 3D 模型到識(shí)別工廠線上量產(chǎn)產(chǎn)品的缺陷,計(jì)算機(jī)視覺不斷改變每個(gè)人的業(yè)務(wù)方式。