計(jì)算機(jī)視覺幫助解決業(yè)務(wù)挑戰(zhàn)的 5 種方法

時(shí)間:2022-06-30

來源:千家網(wǎng)

導(dǎo)語:讓我們來看看計(jì)算機(jī)視覺如何顛覆各個(gè)行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來了哪些獨(dú)特的好處。

  自動(dòng)駕駛汽車、交通標(biāo)志檢測、面部識(shí)別和自助結(jié)賬。 將所有這些先進(jìn)解決方案結(jié)合在一起的是計(jì)算機(jī)視覺。 計(jì)算機(jī)視覺允許計(jì)算機(jī)從原始圖像中提取信息,并為更有效的業(yè)務(wù)數(shù)字化開辟了許多機(jī)會(huì)。 讓我們來看看計(jì)算機(jī)視覺如何顛覆各個(gè)行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來了哪些獨(dú)特的好處。

  #1:物體檢測

  傳統(tǒng)的計(jì)算機(jī)視覺實(shí)現(xiàn)使用對(duì)輸入和輸出的深入分析。老式 CV 的典型流程依賴于邊緣檢測等圖像處理技術(shù)來識(shí)別和標(biāo)記圖像中的對(duì)象。

  計(jì)算機(jī)科學(xué)中深度學(xué)習(xí)架構(gòu)的出現(xiàn)導(dǎo)致了從經(jīng)典的 CV 技術(shù)(如基于定義的特征結(jié)構(gòu))到 AI 驅(qū)動(dòng)的圖像神經(jīng)網(wǎng)絡(luò)分析的巨大轉(zhuǎn)變,這使得圖像中數(shù)據(jù)的提取和分類幾乎完全自動(dòng)化。簡單來說,人工智能將編程從畫面中剔除,取而代之的是一種監(jiān)督較少的方法,在這種方法中,計(jì)算機(jī)解釋輸入數(shù)據(jù)并訓(xùn)練自己識(shí)別圖像的內(nèi)容。

  用例

  當(dāng) AI 進(jìn)入醫(yī)學(xué)成像等領(lǐng)域時(shí),計(jì)算機(jī)會(huì)利用卓越的模式識(shí)別來識(shí)別原始圖像中的細(xì)微元素,例如 X 射線或 MRI 中是否存在微量癌細(xì)胞。盡管仍然需要人工解釋和專業(yè)知識(shí)來檢查機(jī)器的推斷,但額外的閃電般的快速分析層有助于補(bǔ)充人類智能并挽救生命。

  隨著自動(dòng)駕駛汽車在美國和其他許多國家上路,CV 領(lǐng)域?qū)⒂瓉肀l(fā)式增長。沒有計(jì)算機(jī)視覺,自動(dòng)駕駛汽車就無法存在。由于車輛的車載計(jì)算機(jī)需要對(duì)道路上的潛在障礙物做出快速?zèng)Q策,因此它依賴于一套高度優(yōu)化的基于 CV 的技術(shù)。

  值得注意的是,在醫(yī)學(xué)、安全、制造等領(lǐng)域,人工智能驅(qū)動(dòng)系統(tǒng)如何做出決策的透明度至關(guān)重要。這就是可解釋的人工智能發(fā)揮作用的地方。該技術(shù)允許以人類可以理解的方式解釋系統(tǒng)的發(fā)現(xiàn),并顯示人工智能算法做出的特定決策的可靠性。

  使用計(jì)算機(jī)視覺解決以下業(yè)務(wù)挑戰(zhàn):

  公安(車輛識(shí)別、武器類型識(shí)別、可疑物體定位等)

  銷售自動(dòng)化和庫存管理(識(shí)別貨架上的低庫存或錯(cuò)放物品、檢測空貨架、執(zhí)行質(zhì)量控制、自助結(jié)賬的產(chǎn)品識(shí)別等)

  消除人為錯(cuò)誤并防止工作流程中的重復(fù)計(jì)算

  #2:光學(xué)字符識(shí)別(OCR)

  光學(xué)字符識(shí)別 (OCR) 是計(jì)算機(jī)視覺的獨(dú)特實(shí)現(xiàn),可解決各種特定領(lǐng)域的任務(wù)。 OCR 旨在從輸入圖像中檢測和提取字母、數(shù)字和其他字符。

  用例

  Google Lens 使用 OCR 讓客戶從照片中翻譯外語,并從圖像或 Google 搜索中提取文本。 OCR 技術(shù)還使傳統(tǒng)媒體的數(shù)字化變得簡單,從報(bào)紙、雜志和書籍的掃描中提取文本。以前,大學(xué)很難將藏傳佛教宗教文本等更晦澀的文件數(shù)字化,但現(xiàn)代 OCR 技術(shù)使得從非標(biāo)準(zhǔn)語言文件中提取文本變得簡單。

  金融機(jī)構(gòu)使用 OCR 來改善客戶的生活質(zhì)量,例如讓客戶從文件中提取他們的國際銀行帳號(hào) (IBAN) 或掃描支票圖像,這樣就不必去銀行存款.一些應(yīng)用程序可以掃描借記卡或信用卡以輸入付款詳情,因此您不必在結(jié)帳窗口繁瑣地輸入所有付款信息。

  政府通常使用 OCR 來縮短國家邊境的處理時(shí)間或識(shí)別和登記文件?,F(xiàn)代護(hù)照和駕駛執(zhí)照上的機(jī)器可讀區(qū)域與政府和商業(yè)環(huán)境中的 OCR 系統(tǒng)兼容。

  #3:面部識(shí)別

  與對(duì)象識(shí)別類似,面部識(shí)別旨在使用計(jì)算機(jī)視覺識(shí)別圖像中的人類面部特征。經(jīng)典的計(jì)算機(jī)視覺方法利用“Haar-like features”來計(jì)算面部特征之間的片段,但現(xiàn)代面部識(shí)別實(shí)現(xiàn)依賴于人工智能,就像人工智能用于物體識(shí)別一樣。

  用例

  面部識(shí)別技術(shù)對(duì)于安全應(yīng)用程序至關(guān)重要,因?yàn)樗兄诜乐挂苿?dòng)和 Web 應(yīng)用程序漏洞。無數(shù) Apple iPhone 用戶依靠 Apple 的 Face ID 技術(shù)進(jìn)行生物識(shí)別來解鎖他們的手機(jī)。

  零售商已經(jīng)部署了類似的實(shí)現(xiàn)來識(shí)別已知的商店扒手。實(shí)時(shí)掃描儀從安全攝像頭流中抓取客戶的面部,并交叉引用已知犯罪分子的數(shù)據(jù)庫。同樣的技術(shù)通過從執(zhí)法數(shù)據(jù)庫中提取來幫助尋找失蹤兒童。

  面部識(shí)別還可以幫助您完成以下任務(wù):

  安全和訪問控制

  身份驗(yàn)證

  員工跟蹤

  醫(yī)療保健中的患者篩查程序

  識(shí)別和追蹤犯罪分子

  下一代面部識(shí)別軟件甚至可以查看姿勢、手勢和面部表情,以確定客戶是否可能在賭場作弊。與相同的安全軟件捆綁的步態(tài)分析還可以幫助根據(jù)他們獨(dú)特的腳步和步幅模式來檢測犯罪分子,因?yàn)樵S多犯罪分子通過戴口罩來躲避面部識(shí)別。

  #4:圖像恢復(fù)和場景重建

  計(jì)算機(jī)視覺技術(shù)還可以恢復(fù)嚴(yán)重退化的檔案鏡頭和圖像,這可能是一項(xiàng)關(guān)鍵的業(yè)務(wù)技術(shù)。與從照片中去除噪點(diǎn)就足夠的簡單情況不同,計(jì)算機(jī)視覺可以幫助處理更多損壞的圖像,這些圖像需要進(jìn)行重大更改和詳細(xì)分析。圖像的損壞部分通常使用評(píng)估照片廣播內(nèi)容的生成模型來填充。

  用例

  除了恢復(fù)圖像和視頻之外,現(xiàn)代神經(jīng)網(wǎng)絡(luò)還可以僅通過掃描照片中的對(duì)象來重建 3D 場景。考古學(xué)家、法醫(yī)專家、環(huán)境科學(xué)家和許多其他專業(yè)人士使用場景重建,這是一種改變游戲規(guī)則的計(jì)算機(jī)視覺范例。 RetrievalFuse 等項(xiàng)目能夠從單個(gè) RGB 圖像構(gòu)建全景 3D 場景。

  #5:人體姿勢估計(jì)

  姿勢估計(jì)旨在模擬人類視覺能力,特別是識(shí)別圖像和視頻中的姿勢和手勢。一些最早的高級(jí)人體姿勢估計(jì)示例出現(xiàn)在大預(yù)算電影中,例如彼得杰克遜的《指環(huán)王》。隨著計(jì)算資源隨著時(shí)間的推移而擴(kuò)大,姿勢估計(jì)將在許多不同的產(chǎn)品中發(fā)揮作用。

  用例

  在安全應(yīng)用中,姿勢估計(jì)通過分析面部識(shí)別不可行的步態(tài)來幫助識(shí)別潛在的麻煩制造者。計(jì)算機(jī)視覺可以通過分析身體姿勢來幫助實(shí)時(shí)檢測入店行竊。該系統(tǒng)可以區(qū)分正常的購物行為和可疑行為,例如拿走物品并將其藏在口袋或外套中。當(dāng)檢測到可疑行為時(shí),管理人員會(huì)收到警報(bào),并可以在小偷離開商店之前迅速做出反應(yīng)。

  以下是在您的業(yè)務(wù)中使用姿勢估計(jì)的一些方法:

  康復(fù)措施分析

  開發(fā)基于人工智能的健身教練應(yīng)用程序

  識(shí)別人體在空間中的位置以改進(jìn)增強(qiáng)現(xiàn)實(shí)的應(yīng)用

  游戲角色動(dòng)畫

  人在商店和購物中心的活動(dòng)分析

  盡管姿態(tài)估計(jì)曾經(jīng)是一項(xiàng)巨大的計(jì)算挑戰(zhàn),但云計(jì)算和硬件的創(chuàng)新使更多公司能夠接觸到這項(xiàng)技術(shù)。

  一切都是可能的

  對(duì)象檢測、面部識(shí)別、場景重建、圖像恢復(fù)和人體姿態(tài)估計(jì)只是計(jì)算機(jī)視覺技術(shù)的幾種不同實(shí)現(xiàn)方式。由于下一代 AI 的強(qiáng)大功能,無論您的企業(yè)從事何種行業(yè),計(jì)算機(jī)視覺都可以提供獨(dú)特的優(yōu)勢,使您的公司在競爭中處于領(lǐng)先地位。從重建犯罪現(xiàn)場照片的全深度 3D 模型到識(shí)別工廠線上量產(chǎn)產(chǎn)品的缺陷,計(jì)算機(jī)視覺不斷改變每個(gè)人的業(yè)務(wù)方式。


中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0