人工智能AI計(jì)算機(jī)視覺
一場(chǎng)地震災(zāi)難發(fā)生后,專業(yè)救援人員組成的隊(duì)伍會(huì)奔赴現(xiàn)場(chǎng),在廢墟中搜尋生命體征、實(shí)行醫(yī)療救護(hù)、呼叫救援。
但在斯坦福大學(xué)首席人工智能科學(xué)家李菲菲(Fei-FeiLi)的想象中,對(duì)事件率先做出響應(yīng)的并不是紅十字會(huì)的志愿者或醫(yī)護(hù)人員,而是那些能洞悉周邊環(huán)境并響應(yīng)人們需求的智能機(jī)器人,它們將竭盡所能拯救盡可能多的人。對(duì)這一場(chǎng)景背后所涉及的技術(shù),李已經(jīng)做了大量思考和研究,她認(rèn)為如果計(jì)算機(jī)能夠掌握最復(fù)雜的人類視覺認(rèn)知能力的時(shí)候,這項(xiàng)技術(shù)就離我們不遠(yuǎn)了。
目前,由李及其帶領(lǐng)的斯坦福大學(xué)人工智能實(shí)驗(yàn)室,在這項(xiàng)技術(shù)上取得了一些進(jìn)展,這多虧了在2009年建立的擁有超過1500萬數(shù)字圖像的數(shù)據(jù)庫。此后的每一年,研究人員利用該數(shù)據(jù)庫組建了大型視覺識(shí)別比賽,目的是開發(fā)出可以教會(huì)計(jì)算機(jī)識(shí)別、理解圖像內(nèi)容的算法。2014年,參與者設(shè)計(jì)的軟件程序識(shí)別對(duì)象和動(dòng)作的準(zhǔn)確率幾乎是往年的兩倍,這得益于更快的計(jì)算能力和更精煉的代碼。2014年末,李和她的學(xué)生研發(fā)出首個(gè)能夠用類似人類語句來描述其所見圖像的計(jì)算機(jī)視覺模型。
她認(rèn)為,計(jì)算機(jī)視覺是所有人工智能的關(guān)鍵。“理解并建立視覺系統(tǒng),才能真正理解智能,對(duì)于‘看’,我的意思是理解,而不是簡(jiǎn)單的像素記錄。”
新型智能
人工智能領(lǐng)域的科學(xué)家們,還有在谷歌、Facebook、微軟等企業(yè)任職的研究人員,他們?cè)谟?jì)算機(jī)視覺技術(shù)中投入大量資源的原因很簡(jiǎn)單:人類利用一半的大腦進(jìn)行視覺處理,這一認(rèn)知能力經(jīng)歷了5.4億年的發(fā)展演變。在李看來,“這里(大腦)比海灣地區(qū)的住房更值錢”。視覺在我們認(rèn)識(shí)世界的過程中扮演了至關(guān)重要的角色,很難想象未來的智能計(jì)算機(jī)會(huì)沒有視覺能力。任何像樣的無人駕駛汽車最終都需要具備分辨的能力,假如路上有一個(gè)大石頭和一個(gè)小的紙袋,它就應(yīng)該用剎車、轉(zhuǎn)向來避開石頭,選擇性地忽略紙袋。
如今,計(jì)算機(jī)可以識(shí)別出照片中的貓或汽車的形狀、年代等,但是要想讓計(jì)算機(jī)像人一樣通過觀察和推理來理解內(nèi)容,還需要進(jìn)行大量的科研工作。比如,同樣的球棒,在球場(chǎng)和犯罪現(xiàn)場(chǎng)就有完全不同的含義。李表示:“我們實(shí)驗(yàn)室下一步的任務(wù)是研發(fā)出滿足基本視覺任務(wù)的認(rèn)知能力,例如對(duì)場(chǎng)景、人類行為、關(guān)系、推理和講故事等的理解。”
照亮人類的“暗物質(zhì)”
教會(huì)計(jì)算機(jī)如何去“看”已經(jīng)遠(yuǎn)遠(yuǎn)高于對(duì)出現(xiàn)在我們物理世界的物質(zhì)的識(shí)別。更好的機(jī)器視覺應(yīng)該可以洞悉和透露我們都不知道的細(xì)節(jié)?;ヂ?lián)網(wǎng)每一天都在產(chǎn)生所謂的數(shù)字時(shí)代的暗物質(zhì)——數(shù)以萬億計(jì)的圖像和視頻。網(wǎng)頁中有超過85%的內(nèi)容是多媒體,這是一大堆混亂的爛攤子。“我們有理由去理解它們,對(duì)我們生活、日常活動(dòng)、社會(huì)關(guān)系(不論是個(gè)人還是社會(huì))的記錄,都在那些內(nèi)容中。”
這些對(duì)人類的視覺描述的增長(zhǎng)速度超出我們的想象。過去30天內(nèi)生成的圖片和視頻總量,比從人類文明初期所有的圖像加起來都大。對(duì)人類來說,記錄下所有的這些數(shù)據(jù)是不可能的,但是對(duì)可以進(jìn)行模式識(shí)別,并用自然語言將視覺內(nèi)容描述出來的智能機(jī)器而言是可行的,這些機(jī)器可能成為未來的歷史學(xué)家。
新興的應(yīng)用
李表示計(jì)算機(jī)視覺最終會(huì)影響所有事情,從監(jiān)測(cè)和應(yīng)對(duì)氣候變化所帶來的影響,到構(gòu)建智能家居,但最令她感到興奮的是在醫(yī)學(xué)領(lǐng)域的應(yīng)用。“當(dāng)日常護(hù)理可以完全依賴人工智能的時(shí)候,也就是降低成本、提高護(hù)理水平的時(shí)候。”
這也難怪李和她斯坦福大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室的學(xué)生會(huì)和斯坦福大學(xué)醫(yī)學(xué)院進(jìn)行合作,利用計(jì)算機(jī)視覺緩解護(hù)士們?nèi)粘5闹茍D任務(wù),在美國(guó)護(hù)士們平均每天要在該項(xiàng)工作中耗費(fèi)45分鐘。在斯坦福大學(xué)醫(yī)院的重癥監(jiān)護(hù)室,臨床醫(yī)生每?jī)蓚€(gè)小時(shí)就會(huì)對(duì)病危患者進(jìn)行檢查,并對(duì)其健康狀況在-4到4的范圍內(nèi)進(jìn)行打分。
李表示,她希望建立一個(gè)可以持續(xù)監(jiān)測(cè)病患的系統(tǒng)(例如對(duì)移動(dòng)性、疼痛程度、靈敏度等進(jìn)行監(jiān)測(cè)),不僅可以有效分擔(dān)護(hù)士和醫(yī)生的任務(wù),還可以為負(fù)責(zé)該病患的臨床醫(yī)生提供更詳細(xì)、準(zhǔn)確、客觀的數(shù)據(jù)。
視覺實(shí)驗(yàn)室還與舊金山護(hù)士之家開展合作,致力于探索如何利用人工智能幫助老年人更好地獨(dú)立生活。
多樣性發(fā)展
和所有的創(chuàng)新技術(shù)一樣,計(jì)算機(jī)視覺很有可能被別有目的的人利用,進(jìn)行高級(jí)別的視覺監(jiān)控。李對(duì)此并不避諱,“每項(xiàng)技術(shù)都有可能成為邪惡的幕后推手,但作為一個(gè)科學(xué)家,你必須具備這樣的社會(huì)意識(shí)并清醒的認(rèn)識(shí)到其潛在的風(fēng)險(xiǎn)。”
這種風(fēng)險(xiǎn)與其職業(yè)生涯息息相關(guān),從法人團(tuán)體到學(xué)術(shù)界都缺乏技術(shù)研究和人工智能的多樣性。長(zhǎng)期解決多樣性問題有助于研究朝著積極的方向發(fā)展,有效的規(guī)避風(fēng)險(xiǎn)。“我們需要在人工智能的教育和研究過程中為其注入包含有生活中各行各業(yè)的人文主義。”借此吸引社會(huì)中不同的群體關(guān)注該領(lǐng)域,并提供必要的制衡。
“從概念誕生之日到技術(shù)建立、實(shí)施和調(diào)整之時(shí),人類的意識(shí)至關(guān)重要”,她說道。但在今天事情并不是這樣的,她是斯坦福大學(xué)人工智能實(shí)驗(yàn)室的帶頭人,也是這15人中唯一的全職女教師。此外,F(xiàn)acebook的39人人工智能研究團(tuán)隊(duì)中也僅有兩名女性。李試圖改變這一現(xiàn)狀,她為同在人工智能領(lǐng)域工作的女性舉辦下午茶集會(huì),并針對(duì)斯坦福大學(xué)9年紀(jì)的女生們組織人工智能夏令營(yíng)。她承認(rèn),她喜歡自己的研究工作,多樣性的進(jìn)展還有很長(zhǎng)的路要走。
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道