現(xiàn)代科技最引人注目的進步之一是機器視覺的興起。在短短的幾年間,新一代的機器學習技術(shù)已經(jīng)改變了計算機對圖像的識別方法?,F(xiàn)在,機器在人臉識別和物體識別方面已超越了人類并且徹底改變了大量的基于視覺的任務(wù),比如駕駛、安全監(jiān)控等等。機器視覺現(xiàn)在已具有超人的能力。
但據(jù)麻省理工《技術(shù)評論》報道,來自谷歌和OpenAI研究所的研究人員發(fā)現(xiàn)了機器視覺算法的一個弱點:機器視覺會被一些經(jīng)過修改的圖像干擾,而人類可以很容易地發(fā)現(xiàn)這些圖像的修改之處。
研究人員指出:“一例子是對人臉圖像打上非常細微的標記,人類依然可以正確地識別出圖像中人物的身份,但機器學習系統(tǒng)會把他們識別成其他人”。研究人員對此進行了系統(tǒng)的研究,揭示了機器視覺系統(tǒng)的弱點。研究團隊一開始使用了ImageNet,該數(shù)據(jù)庫的圖像根據(jù)其顯示的內(nèi)容被分類;研究人員首先使用該數(shù)據(jù)庫的一部分圖像來訓練一個機器算法,然后用另一部分圖像來評估算法是否能良好地進行分類。研究團隊用三種不同的方式修改了5萬張來自ImageNet的圖片,從而創(chuàng)造了一個對比圖像數(shù)據(jù)庫。第一種算法對圖像進行了較小的改變從而最大化這項交叉熵,第二種算法是將這個過程迭代來進一步地改變某張圖像,第三項算法改變了某張圖像從而能控制機器視覺系統(tǒng),并讓其出現(xiàn)某種特定的分類錯誤。研究團隊測試Google的Inceptionv3算法能否正確地對這些圖像進行分類,結(jié)果發(fā)現(xiàn)前兩種算法大幅度地降低了精確度,但是第三種算法將所有圖像的精確度減小至零。
這項研究揭示了機器視覺的阿喀琉斯之踵,未來還有很多值得研究的內(nèi)容。研究人員希望為其他類型的視覺系統(tǒng)開發(fā)比較圖像,從而使這些系統(tǒng)更有效率。