決勝人工智能之巔:核心算法缺失背后的中國(guó)“AI”困局

時(shí)間:2019-06-03

來(lái)源:五矩

導(dǎo)語(yǔ):?未來(lái),人工智能會(huì)區(qū)分國(guó)籍嗎?看似這是個(gè)滑稽的問(wèn)題,在華為事件之后,引發(fā)了五矩以及很多技術(shù)從業(yè)者,在和平時(shí)期對(duì)“人工智能”極限生存的思考。

未來(lái),人工智能會(huì)區(qū)分國(guó)籍嗎?

看似這是個(gè)滑稽的問(wèn)題,在華為事件之后,引發(fā)了五矩以及很多技術(shù)從業(yè)者,在和平時(shí)期對(duì)“人工智能”極限生存的思考。

谷歌又一AI項(xiàng)目擊敗6位專家

日前,在《自然》雜志醫(yī)學(xué)版上報(bào)道了一則谷歌AI團(tuán)隊(duì)的最新人工智能研究成果——預(yù)測(cè)肺癌。

通過(guò)一套卷積神經(jīng)網(wǎng)絡(luò)算法,谷歌AI部門建立了一種端到端的分析方法,僅從CT圖像就可以預(yù)測(cè)肺癌的風(fēng)險(xiǎn)。

在6716個(gè)測(cè)試病例中,這套人工智能系統(tǒng)能夠以94%的準(zhǔn)確率發(fā)現(xiàn)極小的惡性肺結(jié)節(jié),打敗了6名放射專家(并非普通醫(yī)生)。

在無(wú)先前CT掃描圖像的情況下,該系統(tǒng)的表現(xiàn)超越所有6位放射醫(yī)學(xué)專家。而在有先前CT掃描圖像的情況下,兩者表現(xiàn)不相上下。

而參與測(cè)試的6位放射專家,有平均8年(4年到20年)的讀片經(jīng)驗(yàn)。

相比“傳統(tǒng)”射科醫(yī)生的行醫(yī)方法,醫(yī)生必須審查數(shù)百個(gè)單獨(dú)的2D掃描切片以發(fā)現(xiàn)問(wèn)題,而腫瘤可能會(huì)很微小導(dǎo)致難以察覺(jué),這種新的機(jī)器學(xué)習(xí)算法則可以分析高通量的3D肺部圖像,不僅可以對(duì)整體腫瘤進(jìn)行預(yù)測(cè),還可以通過(guò)肺結(jié)節(jié)識(shí)別細(xì)微的惡性組織。再加上先前的掃描數(shù)據(jù)對(duì)比,就可以用來(lái)評(píng)估肺結(jié)節(jié)的生長(zhǎng)速度。

相關(guān)論文共同作者,美國(guó)西北大學(xué)醫(yī)學(xué)院MozziyarEtemadi博士表示,3D檢測(cè)早期肺癌的能力比人眼檢測(cè)2D圖像要敏感得多。事實(shí)上,新系統(tǒng)在技術(shù)上可以納入4D范疇,因?yàn)樗粌H僅是一次CT掃描,而是包括了當(dāng)前和先前共計(jì)兩次的掃描,所以可以檢測(cè)出肺結(jié)節(jié)隨時(shí)間的生長(zhǎng)變化。

2019年5月7日,LilyPeng在2019年開(kāi)發(fā)者大會(huì)上稱,他們研發(fā)的人工智能技術(shù)可以比醫(yī)生早一年查出肺癌,使患者存活的概率提升40%。

毫無(wú)疑問(wèn),通過(guò)谷歌的這項(xiàng)技術(shù),可以造福更很多人。在2015年,中國(guó)肺癌的發(fā)病和死亡例數(shù)分別達(dá)73萬(wàn)和61萬(wàn),發(fā)病率和死亡率非常接近,其主要原因是臨床診斷病例多已為晚期,失去了手術(shù)機(jī)會(huì)。

然而,或許有一天我們分享不到這份成果。對(duì)于華為中興事件的反思,面對(duì)美國(guó)接下來(lái)可能在各方面實(shí)施的技術(shù)封鎖,中國(guó)人工智能的發(fā)展還需要再加把勁。

我國(guó)AI進(jìn)展——算法的錯(cuò)位缺失

我們以前討論電腦或者移動(dòng)終端時(shí),離不開(kāi)硬件、軟件和應(yīng)用的范疇。討論人工智能時(shí),同樣離不開(kāi)硬件、算法和數(shù)據(jù)這三個(gè)要素。

簡(jiǎn)單來(lái)說(shuō),中美人工智能發(fā)展在硬件上的差距,遠(yuǎn)沒(méi)有在算法的差距來(lái)得大。

計(jì)算機(jī)硬件技術(shù)的發(fā)展一直伴隨著通用性和專用性的矛盾,通用的設(shè)計(jì)普適性強(qiáng),但對(duì)于某一類特殊計(jì)算,性能就會(huì)打折扣,如果做個(gè)比喻的話,就是瑞士軍刀和菜刀的區(qū)別,也可謂術(shù)業(yè)有專攻。

在這樣的背景下,人們開(kāi)始研發(fā)用于神經(jīng)網(wǎng)絡(luò)算法和機(jī)器學(xué)習(xí)的專用芯片。

如今,以通用圖形處理器(GPGPU)為基礎(chǔ)的NVIDA在深度學(xué)習(xí)市場(chǎng)占有一席之地,谷歌憑借16年發(fā)布的張量處理器(TPU)成為后起之秀。

通過(guò)與自家的人工智能開(kāi)發(fā)系統(tǒng)TensorFlow相結(jié)合,谷歌也形成了一套完整的人工智能開(kāi)發(fā)環(huán)境。

國(guó)內(nèi)人工智能芯片創(chuàng)新同樣非常活躍,在人工智能芯片的競(jìng)賽中與國(guó)外不相上下。其中的明星企業(yè)就是最近兩年來(lái)被反復(fù)提及的獨(dú)角獸公司“寒武紀(jì)”,取名借用地質(zhì)學(xué)“寒武紀(jì)”時(shí)代的概念,比喻即將到來(lái)的人工智能大爆發(fā)時(shí)代。

此外,百度深度學(xué)習(xí)實(shí)驗(yàn)室前主任余凱創(chuàng)立的地平線也同樣值得關(guān)注。一年多時(shí)間就完成了Intel和SK領(lǐng)投的兩輪過(guò)億融資。

但是無(wú)論是寒武紀(jì)還是地平線,都還無(wú)法和美國(guó)企業(yè)完全抗衡,美國(guó)不僅有NVIDIA和谷歌,還有英特爾、微軟和IBM等一批大企業(yè)每年將巨資投向人工智能領(lǐng)域。

至于另一大要素——數(shù)據(jù),鑒于中國(guó)龐大的互聯(lián)網(wǎng)人口,深度學(xué)習(xí)所需要的大數(shù)據(jù)則可以由國(guó)內(nèi)用戶提供。

人工智能發(fā)展所需的三個(gè)要素中,算法是目前我們最薄弱的一環(huán)。不論是前面提到的谷歌AI卷積神經(jīng)網(wǎng)絡(luò)測(cè)癌算法,或是NVIDIA此前大火的GauGAN畫圖,都證明了美國(guó)企業(yè)的領(lǐng)先,而我國(guó)在這方面的發(fā)展屬于相對(duì)滯后的。

在2019年長(zhǎng)江商學(xué)院和清華大學(xué)公布的兩份報(bào)告中,均指出了中國(guó)人工智能發(fā)展基礎(chǔ)薄弱。

長(zhǎng)江商學(xué)院人工智能與制度研究中心主任許成鋼教授對(duì)記者表示,在人工智能領(lǐng)域,中國(guó)發(fā)表的論文總數(shù)雖然超過(guò)了美國(guó),卻在深度學(xué)習(xí)、機(jī)器人流程自動(dòng)化、以及包括推理學(xué)習(xí)等在內(nèi)的其他領(lǐng)域,從發(fā)表總數(shù)和引用率方面,與美國(guó)的差距顯著。

對(duì)有高質(zhì)量、高影響力的千級(jí)論文(是指每一篇論文被引用的數(shù)字超過(guò)了1000次),中國(guó)與美國(guó)差距巨大,中國(guó)只有個(gè)別的論文影響力能達(dá)到這個(gè)水平。

為什么中國(guó)很多論文從來(lái)不被引用?許成剛認(rèn)為的癥結(jié)之一在于我國(guó)科研機(jī)構(gòu)只注重?cái)?shù)量,不注重深度。“我個(gè)人分析,在中國(guó)體制內(nèi)大學(xué)有一個(gè)SCI現(xiàn)象,即就是教授的水平高低,或者職稱評(píng)定,就是看教授發(fā)了多少篇SCI文章(美國(guó)科學(xué)資訊研究所采用的期刊文獻(xiàn)檢索工具),不管你這篇文章到底有多大的影響力。”

知乎一篇相關(guān)問(wèn)答下也不難看到,論文換湯不換藥的做法幾乎已成為除頂級(jí)機(jī)構(gòu)之外相當(dāng)普遍的做法。

這也導(dǎo)致了我國(guó)空有4倍于英國(guó)的論文發(fā)表數(shù)量,然而論文影響力竟反而不如英國(guó)的結(jié)果。

同時(shí),幾乎93%的中國(guó)研究者使用人工智能開(kāi)源軟件包,這也是美國(guó)的機(jī)構(gòu)開(kāi)發(fā)提供的。中美兩國(guó)人工智能研究者使用最多的軟件庫(kù)就是前面提到的GoogleTensorFlow。在2018年初,中美研究人員對(duì)此的關(guān)注人數(shù),分別達(dá)到將近9000人和約7000人。

整體上中、美AI研究者關(guān)注美國(guó)機(jī)構(gòu)開(kāi)發(fā)的開(kāi)源AI軟件包的數(shù)字,相當(dāng)于他們關(guān)注中國(guó)機(jī)構(gòu)開(kāi)放的軟件包數(shù)字的20幾倍。這表明中國(guó)研究者在基本算法方面,對(duì)美國(guó)開(kāi)源軟件包的嚴(yán)重依賴。

新智元?jiǎng)?chuàng)始人楊靜18年曾對(duì)《環(huán)球時(shí)報(bào)》記者表示,人工智能平臺(tái)分硬件和軟件,核心技術(shù)一直掌握在西方手里,比如芯片技術(shù)。此外,中國(guó)沒(méi)有主流開(kāi)源框架也是很可怕的,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法的研究也落后于西方。

在牛津大學(xué)最新完成的一份報(bào)告《解碼中國(guó)AI夢(mèng)》里,作者也得出了相同的結(jié)論。除了數(shù)據(jù),中國(guó)在硬件、人才、算法和產(chǎn)業(yè)等方面,仍然落后于美國(guó)。但編寫這份報(bào)告的JefferyDing仍表示,“我認(rèn)為AI是中國(guó)第一個(gè)真正有機(jī)會(huì)制定游戲規(guī)則的技術(shù)領(lǐng)域?!?/p>

實(shí)際上,正是由于中國(guó)龐大的互聯(lián)網(wǎng)人口,提供了強(qiáng)大的數(shù)據(jù)基礎(chǔ),在市場(chǎng)的導(dǎo)向之下才使得我國(guó)的人工智能更偏重具體應(yīng)用。對(duì)此,IDC公司在一份報(bào)告中稱:“數(shù)據(jù)或許不會(huì)出現(xiàn)在資產(chǎn)負(fù)債表上,但數(shù)據(jù)是一個(gè)公司最寶貴的無(wú)形資產(chǎn)。中國(guó)初創(chuàng)企業(yè)尤其懂得如何利用海量數(shù)據(jù)打造雙贏的商業(yè)生態(tài)?!?/p>

人工智能競(jìng)賽終將走向人才競(jìng)爭(zhēng)

科技競(jìng)爭(zhēng)的本質(zhì)最終還是人才的競(jìng)爭(zhēng),美國(guó)人工智能相關(guān)的從業(yè)人員和公司數(shù)量現(xiàn)在也遙遙領(lǐng)先。

2012年前,中國(guó)活躍的人工智能創(chuàng)業(yè)公司還要多于美國(guó),但是在2012年卻被美國(guó)反超,美國(guó)與人工智能有關(guān)的企業(yè)數(shù)量遠(yuǎn)超中國(guó)。

據(jù)《中國(guó)人工智能指數(shù)2018》分析,美國(guó)的人工智能工程師遠(yuǎn)比中國(guó)多。

據(jù)領(lǐng)英(LinkedIn)人才數(shù)據(jù)庫(kù)顯示,中國(guó)的AI人才總數(shù)為5萬(wàn)人,而美國(guó)的AI人才總數(shù)為83萬(wàn)人。美國(guó)AI人才總數(shù)是中國(guó)的16.5倍之多。并且,中國(guó)人工智能領(lǐng)域工作10年以上的人才不到39%,相比之下,美國(guó)超過(guò)71%的人工智能領(lǐng)域的人工作了10年以上。

人工智能,人工智能核心算法1.jpg 

來(lái)源:長(zhǎng)江商學(xué)院《中國(guó)人工智能指數(shù)報(bào)告》

“在中國(guó),人工智能是更年輕的行業(yè),而在美國(guó)雖然領(lǐng)域是年輕的,但是里面的多數(shù)人并不年輕,是有充分經(jīng)驗(yàn)的?!痹S成剛說(shuō)。

人才分布方面,中國(guó)在智能交通/自動(dòng)駕駛,智能/精準(zhǔn)營(yíng)銷,硬件/GPU/智能芯片需求比例要多于美國(guó),但美國(guó)在算法、機(jī)器學(xué)習(xí)的方面,美國(guó)不但人才的比例比中國(guó)大,人才總數(shù)也是中國(guó)的20多倍。

 人工智能,人工智能核心算法.jpg

來(lái)源:清華大學(xué)中國(guó)人工智能發(fā)展報(bào)告2018

但隨著美國(guó)對(duì)外開(kāi)放的收縮,也給了很多海外的技術(shù)型人才回國(guó)發(fā)展的機(jī)會(huì)。

實(shí)際上,早在2017年12月美國(guó)發(fā)表的“國(guó)家安全戰(zhàn)略”中便公開(kāi)表示:將限制世界上所有去美國(guó)學(xué)習(xí)STEM專業(yè)(科學(xué)、技術(shù)、工程、數(shù)學(xué))的留學(xué)生簽證。

根據(jù)南華早報(bào)的說(shuō)法,在美國(guó)363341名中國(guó)學(xué)生中,約有36%在STEM領(lǐng)域?qū)W習(xí)。

這次美方設(shè)置的障礙,可能將會(huì)給更多在美國(guó)的中國(guó)留學(xué)生,在美尋求工作的中國(guó)人帶來(lái)危機(jī)和恐懼。

站在人工智能角逐的角度來(lái)看,美國(guó)反而在這方面有點(diǎn)自縛手腳的意思。

但五矩認(rèn)為,最為關(guān)鍵的一環(huán)還是在于國(guó)內(nèi)要加強(qiáng)對(duì)于基礎(chǔ)教育的重視和投入。

“我關(guān)心教育不是關(guān)心華為,是關(guān)心我們國(guó)家。如果不重視教育,實(shí)際上我們會(huì)重返貧窮的?!?月26日晚間,華為創(chuàng)始人、CEO任正非在央視《面對(duì)面》節(jié)目中說(shuō)道,因?yàn)檫@個(gè)社會(huì)最終要走向人工智能的。

在任正非看來(lái),能與基礎(chǔ)研究相提并論的是基礎(chǔ)教育。他認(rèn)為,我國(guó)目前基礎(chǔ)研究方面水平不夠,和基礎(chǔ)教育跟不上直接相關(guān)。為此,他曾自費(fèi)請(qǐng)權(quán)威機(jī)構(gòu)的專家進(jìn)行中國(guó)基礎(chǔ)教育狀況的調(diào)查研究。

假設(shè)美國(guó)因?yàn)椤皵?shù)據(jù)隱私保護(hù)”等原因禁止了微軟GitHub或者谷歌TensorFlow,屆時(shí),哪家公司有底氣,成為第二家有“備胎”的公司呢?


中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0