“深度學(xué)習(xí)”瓶頸未解,人工智能離我們還有距離

時(shí)間:2017-04-13

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):在最近在灣區(qū)召開的一次人工智能大會(huì)上,Google的人工智能研究人員FrancoisChollet強(qiáng)調(diào)了深度學(xué)習(xí)的重要性,它比一般的數(shù)據(jù)統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法都要更高級(jí),是一款非常強(qiáng)大的模式辨別工具。

本文讓你了解當(dāng)下火爆的人工智能領(lǐng)域還存在著多少技術(shù)瓶頸。其實(shí),我們離真正的人工智能之間的距離還很遠(yuǎn)。

人工智能現(xiàn)在已經(jīng)火的不能再火了。各種新聞機(jī)構(gòu)都在不斷地放出猛料,有的說現(xiàn)在IBM的Waston人工智能已經(jīng)能夠徹底取代勞動(dòng)者了;還有的說現(xiàn)在的算法在醫(yī)療領(lǐng)域已經(jīng)能夠打敗醫(yī)生了。每一天,都有新的人工智能初創(chuàng)公司出現(xiàn),每一家都聲稱自己在利用機(jī)器學(xué)習(xí),徹底顛覆你個(gè)人的生活,商業(yè)性質(zhì)的活動(dòng)。

還有一些大家平日里司空見慣的產(chǎn)品,比如榨汁機(jī),無線路由器,一夜之間也都換上了全新的廣告語(yǔ):“我們都是由人工智能技術(shù)所支持的!”智能桌子不僅能知道你平日里工作時(shí)所需要的合適高度,甚至還能幫你點(diǎn)午餐!

但事實(shí)是什么呢?那些報(bào)道新聞的記者,其實(shí)從來沒有親自去介入到一個(gè)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程當(dāng)中,而新聞源頭的初創(chuàng)公司以及營(yíng)銷團(tuán)隊(duì)也有自己的盤算:都是想擴(kuò)大自己的名聲,獲取到資本和人才的關(guān)注,哪怕它們壓根沒有解決一個(gè)現(xiàn)實(shí)中存在著的問題。

也正是在這樣的喧囂氣氛中,難怪在人工智能領(lǐng)域會(huì)出現(xiàn)那么多一知半解,其實(shí)大家都搞不清楚什么是AI能做的,什么是AI無法辦到的。

深度學(xué)習(xí)確實(shí)是一個(gè)讓人心馳神往的技術(shù),這無可辯駁。

其實(shí),神經(jīng)網(wǎng)絡(luò)這個(gè)概念自上個(gè)世紀(jì)60年代就已經(jīng)出現(xiàn)了,只是因?yàn)樽罱诖髷?shù)據(jù)、計(jì)算機(jī)性能上面出現(xiàn)的飛躍,使得它真正變得有用起來,由此也衍生出來一門叫做“深度學(xué)習(xí)”的專業(yè),旨在將復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)應(yīng)用在數(shù)據(jù)建模上,最終帶來前所未有的準(zhǔn)確性。

現(xiàn)在的技術(shù)開發(fā)成果也確實(shí)讓人印象深刻。計(jì)算機(jī)現(xiàn)在可以辨識(shí)圖片和視頻里的東西都是什么,可以將語(yǔ)音轉(zhuǎn)化成為文字,其效率已經(jīng)超過了人力范疇。Google也將GoogleTranslate服務(wù)中添加了神經(jīng)網(wǎng)絡(luò),現(xiàn)在的機(jī)器學(xué)習(xí)在翻譯水平上已經(jīng)逐步逼近人工翻譯。

現(xiàn)實(shí)中的一些應(yīng)用也讓人大開眼界,就比如說計(jì)算機(jī)可以預(yù)測(cè)農(nóng)田作物產(chǎn)量,其準(zhǔn)確性比美國(guó)農(nóng)業(yè)部還高;機(jī)器還能更加精準(zhǔn)的診斷癌癥,其準(zhǔn)確度也比從醫(yī)多年的老醫(yī)師還要高。

DARPA(美國(guó)國(guó)防部高級(jí)研究計(jì)劃局)的一名負(fù)責(zé)人JohnLauchbury形容如今人工智能領(lǐng)域內(nèi)存在著三股浪潮:

1、知識(shí)庫(kù),或者是類似于IBM所開發(fā)的“深藍(lán)”和Waston專家系統(tǒng)。

2、數(shù)據(jù)學(xué)習(xí),其中包括了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。

3、情境適應(yīng),其中涉及通過利用少量數(shù)據(jù),在現(xiàn)實(shí)生活中中構(gòu)建出一個(gè)可靠的,解釋型的模型,正如人類能完成的程度一樣

就第二波浪潮而言,目前深度學(xué)習(xí)算法的研究工作進(jìn)展的不錯(cuò),用Launchbury的話來說就是因?yàn)椤傲餍渭僭O(shè)”的出現(xiàn)。

但是深度學(xué)習(xí)也是存在著一些棘手問題的

在最近在灣區(qū)召開的一次人工智能大會(huì)上,Google的人工智能研究人員FrancoisChollet強(qiáng)調(diào)了深度學(xué)習(xí)的重要性,它比一般的數(shù)據(jù)統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法都要更高級(jí),是一款非常強(qiáng)大的模式辨別工具。但是,不可否認(rèn)它是存在著嚴(yán)重局限性的,至少目前來說是這樣。

深度學(xué)習(xí)的成果是建立在極其苛刻的前提條件之上

不管是“監(jiān)督學(xué)習(xí)”(supervisedperception),亦或者是“強(qiáng)化學(xué)習(xí)”(reinforcementlearning),它們都需要大量的數(shù)據(jù)進(jìn)行支撐,而且在提前計(jì)劃上面表現(xiàn)的非常差,只能做某些最簡(jiǎn)單直接的模式辨認(rèn)工作。

相比之下,人就能夠從極少數(shù)的例子上學(xué)到有價(jià)值的信息,并且善于在時(shí)間跨度很長(zhǎng)的計(jì)劃,在針對(duì)某個(gè)情境上有能力自己建造一個(gè)抽象模型,并利用這樣的模型來做站在最高處的歸納總結(jié)。

事實(shí)上,隨便在街邊上走著的一個(gè)路人所能做到的最為稀松平常的事,對(duì)于深度學(xué)習(xí)算法來說都是難如登天。還是舉個(gè)例子好了:現(xiàn)在比如說我們要讓機(jī)器來學(xué)會(huì)如何在路上走的時(shí)候避免被車撞到。

如果你是采用的“監(jiān)督學(xué)習(xí)路徑”,那么你需要從汽車駕駛的情境中提取海量的數(shù)據(jù),而且還要以明確標(biāo)示出來的“動(dòng)作標(biāo)簽”進(jìn)行分類挑揀,比如“停止”、“站住”等等。再接下來,你還需要訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),使得它能夠從眼下的情景和所與之相對(duì)應(yīng)的行動(dòng)之間構(gòu)建因果聯(lián)系;

如果你是采用的“強(qiáng)化學(xué)習(xí)路徑”,那么你應(yīng)該給算法一個(gè)目標(biāo),讓它能夠獨(dú)立地判斷當(dāng)下最優(yōu)解(也就是最理想的行動(dòng))是什么,電腦在不同的情境之下,為了實(shí)現(xiàn)避免撞車的這個(gè)動(dòng)作,它估計(jì)要宕機(jī)上幾千次;

Choliet總結(jié)道:“你不可能就以今時(shí)今日的技術(shù)研發(fā)成果作為基礎(chǔ),就能實(shí)現(xiàn)某種一般意義上的智能?!?/p>

而人則不一樣,你需要告訴他一次:你需要躲避車子走。然后我們的大腦就有能力從少數(shù)的例子中提取經(jīng)驗(yàn),有能力在大腦中想象出來被車碾壓后的凄慘場(chǎng)景(在計(jì)算機(jī)那里被稱之為“建?!保?,為了避免喪生或者缺胳膊少腿,絕大多數(shù)人都能快速地學(xué)習(xí)到不被車撞到的要領(lǐng)。

雖然現(xiàn)在已經(jīng)有了比較大的進(jìn)展,一些神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)層面,在相當(dāng)大的樣本數(shù)量上給出一個(gè)驚人的成果,但是它們?nèi)绻麊为?dú)拿出一個(gè)出來,都是不可靠的,所犯的錯(cuò)誤是人一輩子都不可能犯的,比如說錯(cuò)把牙刷當(dāng)作籃筐。

數(shù)據(jù)質(zhì)量的不穩(wěn)定性帶來的是:不可靠、不準(zhǔn)確,以及不公平。

而且,你的結(jié)果,還得取決于輸入的數(shù)據(jù)質(zhì)量如何。神經(jīng)網(wǎng)絡(luò)中如果輸入的數(shù)據(jù)是不準(zhǔn)確的,不完整的,那么結(jié)果也會(huì)錯(cuò)的離譜,有些時(shí)候不僅造成損失,而且還會(huì)很尷尬。就比如說Google圖片錯(cuò)把非裔美國(guó)人當(dāng)作了猩猩;而微軟曾經(jīng)試著把一個(gè)人工智能放在Twitter上進(jìn)行學(xué)習(xí),幾個(gè)小時(shí)之后,它就變得充滿惡意,滿口臟話,帶有嚴(yán)重種族歧視。

也許推特上的這個(gè)例子有些極端,但不可否認(rèn),我們輸入的數(shù)據(jù)本身就存在著某種程度的偏見和歧視,這種帶有主觀性的,潛移默化的觀念或者暗示,有時(shí)我們甚至自己都無法察覺。就比如說:word2vec是google推出的做詞嵌入(wordembedding)的開源工具,從GoogleNews里提取了300萬(wàn)個(gè)詞。這組數(shù)據(jù)傳遞出來的信息包括了“爸爸是醫(yī)生,媽媽是護(hù)士?!边@明顯就帶有性別上的歧視。

這種歧視不僅僅是被原封不動(dòng)地搬運(yùn)到了數(shù)字世界,而且還會(huì)得到放大。如果“醫(yī)生”這個(gè)詞更多的指向“男人”而非“女人”,那么算法在面對(duì)一份公開的醫(yī)生職位篩選的時(shí)候,它會(huì)將男性放在女性前面優(yōu)先考慮。

除了不準(zhǔn)確、不公平,還存在著最大的風(fēng)險(xiǎn):不安全。

“生成對(duì)抗式網(wǎng)絡(luò)”(GAN)的發(fā)明人IanGoodfellow提醒我們:現(xiàn)在的神經(jīng)網(wǎng)絡(luò)可以很容易被不軌之徒操縱。他們可以以一種人的肉眼無法識(shí)別的方式,篡改圖片,讓機(jī)器錯(cuò)誤地辨識(shí)這個(gè)圖片。

左邊的是熊貓(機(jī)器的確認(rèn)度是57.7%),加上中間的這層圖片之后,機(jī)器的確認(rèn)度上升到了99.3%,認(rèn)為圖片上出現(xiàn)的是長(zhǎng)臂猿。

不要小看這樣的風(fēng)險(xiǎn),這種惡意篡改人工智能系統(tǒng)的做法,會(huì)帶來極大的危害,尤其是被篡改的圖片和最初的圖片在我們看來完全是一回事。比如說無人自駕駛汽車就會(huì)受到威脅。、

以上就是深度學(xué)習(xí)所存在著的種種瓶頸,目前它要發(fā)揮作用所需要的前置條件太過苛刻,輸入的數(shù)據(jù)對(duì)其最終的結(jié)果有著決定性的影響,另外,它存在著很多漏洞,安全性也無法得到保證。如果我們要駛向理想中的人工智能未來,這些瓶頸還有待于人們的進(jìn)一步的突破與挑戰(zhàn)。

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0