對話英特爾AI事業(yè)部副總裁:與百度戰(zhàn)略合作,布局搶灘AI市場

時間:2018-07-18

來源:網(wǎng)絡轉載

導語:在最近的百度AI開發(fā)者大會(BaiduCreate2018)上,英特爾人工智能事業(yè)部副總裁兼人工智能架構總經(jīng)理GadiSinger發(fā)表演講,披露了和百度的一系列深度合作,包括至強處理器優(yōu)化PaddlePaddle深度學習框架、FPGA賦能百度工作負載加速即服務以及Movidius視覺處理器(VPU)支持百度Xeye智能攝像頭。

【對話英特爾AI事業(yè)部副總裁:與百度戰(zhàn)略合作,布局搶灘AI市場】在最近的百度AI開發(fā)者大會(BaiduCreate2018)上,英特爾人工智能事業(yè)部副總裁兼人工智能架構總經(jīng)理GadiSinger發(fā)表演講,披露了和百度的一系列深度合作,包括至強處理器優(yōu)化PaddlePaddle深度學習框架、FPGA賦能百度工作負載加速即服務以及Movidius視覺處理器(VPU)支持百度Xeye智能攝像頭。

會后,GadiSinger接受了智東西同少數(shù)國內(nèi)媒體的專訪,就英特爾和百度的合作細節(jié)、英特爾在AI領域的前瞻性戰(zhàn)略布局、AI發(fā)展面臨的挑戰(zhàn)以及對如何做好AI芯片進行深入交流。GadiSinger表示,英特爾將聚焦硬件、軟件和生態(tài)系統(tǒng)對AI展開全方位布局。

▲英特爾人工智能事業(yè)部副總裁兼人工智能架構總經(jīng)理GadiSinger

一、和百度長期合作,三個領域推進AI落地

百度和英特爾有超過十年的合作歷史。GadiSinger表示,五年前,他們的合作邁出很一大步,兩家公司建立了面向移動互聯(lián)網(wǎng)的戰(zhàn)略聯(lián)盟,一起打造智能云手機生態(tài)環(huán)境。兩年前,雙方在AI方面有了更強的合作。

GadiSinger重點介紹和百度合作的三款項目:至強處理器優(yōu)化PaddlePaddle深度學習框架、FPGA加速工作負載和Movidius處理器助力Xeye智能攝像頭。最后,GadiSinger特意介紹了英特爾針對神經(jīng)網(wǎng)絡模型的開源nGragh編譯器。

1、至強處理器優(yōu)化百度PaddlePaddle平臺

深度學習平臺PaddlePaddle是百度于2016年8月底開源的并行分布式全功能深度學習框架,能夠讓開發(fā)者和企業(yè)安全高效地滿足圖像識別、圖像分類、機器翻譯和自動駕駛等多領域的AI技術需求。本次百度AI開發(fā)者大會公布了PaddlePaddle3.0版本。

PaddlePaddle在英特爾至強可擴展處理器上性能的優(yōu)化,使得AI應用的運營效率進一步提高,開發(fā)者與數(shù)據(jù)科學家可以使用支持全球數(shù)據(jù)中心和云計算的硬件來不斷改進AI算法。

英特爾對PaddlePaddle的優(yōu)化涵蓋計算、內(nèi)存、架構、通信等不同層面,比如通過AVXIntrinsics函數(shù)、BLAS庫(例如MKL,OpenBLAS)或定制CPU函數(shù)優(yōu)化數(shù)字運算的效率,以及通過MKL-DNN(面向深度神經(jīng)網(wǎng)絡的英特爾數(shù)學核心函數(shù)庫)優(yōu)化卷積神經(jīng)網(wǎng)絡(CNN)。

GadiSinger表示,優(yōu)化AI框架有兩個非常重要的方式:其一,為框架挑選合適的庫和函數(shù);其二,對每個AI工作負載進行分析,從而對它進行適合的培訓,以達到更好的效果。

2、FPGA加速百度工作負載

FPGA是指現(xiàn)場可編程門陣列(FieldProgrammableGateArray)。2015年,英特爾以167億美元收購FPGA巨頭Altera,為未來算力的發(fā)展趨勢奠定基礎。

目前百度在其開發(fā)的異構計算平臺上部署了最新FPGA技術。這一技術的應用在定制化和配置方面更加靈活,對于要求高的工作負載可實現(xiàn)更高的性能和能效,還能開發(fā)低延時的應用。

據(jù)GadiSinger稱,F(xiàn)PGA已經(jīng)被好幾家公司所驗證,既可提供較高帶寬和較低時延,同時又支持大量數(shù)據(jù)傳輸?shù)墓ぷ髫撦d,對AI類應用而言是非常強有力的選擇。FPGA賦能百度云上的工作負載加速即服務,可以為百度的異構計算環(huán)境提供更多元化選擇。

3、MovidiusVPU助力百度Xeye智能攝像頭

2016年,英特爾收購視覺處理初創(chuàng)公司Movidius。2017年7月,英特爾推出以“PC雞血神器”著稱的Movidius神經(jīng)計算棒(MovidiusNeuralComputeStick)U盤產(chǎn)品,為機器的深度學習提供超大“血包”。

▲使用Movidius神經(jīng)計算棒進行車輛識別

Movidius處理器被廣泛應用于安全監(jiān)控攝像頭和無人機,有專門用于計算機視覺引擎,同時兼?zhèn)溆糜谕ㄓ眯屯评硌堇[的引擎,兩者組合在一起,可以更好實現(xiàn)計算機視覺和設備端的演繹推理,為集計算和AI于一身的終端設備提供非常有吸引力的解決方案。Movidius研發(fā)的視覺處理單元(VPU)具備兩大優(yōu)勢:一是直接在本地攝像頭運行神經(jīng)網(wǎng)絡,縮短延遲時間,節(jié)約帶寬和成本;二是用前端算法降低能耗,實現(xiàn)長期續(xù)航。

百度Xeye攝像頭采用英特爾MovidiusMyriad2視覺處理單元(MovidiusMyriad2VPU),為機器學習算法提供更低功耗的推理引擎,讓此款攝像頭能夠分析物體和手勢并識別人體,從而為零售行業(yè)用戶提供個性化的購物體驗。

▲基于Movidius?MyriadXVPU運行GoogleNetV1網(wǎng)絡的推理

▲Movidius芯片組和MovidiusMyriadXVPU(紅色方框標注)

百度機器學習算法通過和英特爾定制化VPU解決方案強強聯(lián)合,能以更低功耗優(yōu)化運營,為零售業(yè)提供高性能、低功耗的視覺智能。

4、nGraph編譯器連接PaddlePaddle平臺

最后GadiSinger還特意介紹了nGragh。nGraph是英特爾在今年3月份開源的一款面向各種設備和框架的深度神經(jīng)網(wǎng)絡(DNN)模型編譯器,能與多種深度學習框架進行連接。nGraph的所有輸出結果,最終都能在CPU、Movidius、FPGA和未來的Neon上運行。

百度和英特爾已將PaddlePaddle與英特爾nGraph編譯器整合。在其支持下,數(shù)據(jù)科學家可專注于數(shù)據(jù)科學研發(fā),而無需擔心如何將DNN模型部署到各種不同的硬件平臺做高效訓練和運行。

二、三分戰(zhàn)略布局,搶灘AI市場

在智能手機時代,英特爾曾遭遇水土不服,晚一步入局移動芯片的英特爾在智能手機應用處理器領域長期舉步為艱。AI是繼移動互聯(lián)網(wǎng)后的下一個時代,英特爾也開始在AI領域布下重陣。

根據(jù)GadiSinger的判斷,在下一波大的技術浪潮前,將有好幾個小的AI技術浪潮。機器學習改變整個計算世界格局,使人們用更短時間處理更多數(shù)據(jù),而這六年只是AI在演進過程中的開頭,在這個階段大部分技術突破都發(fā)生在深度學習領域,持續(xù)學習、增強學習方面的技術也發(fā)展地很快。

他認為,如果把眼光放到宏觀層面來看,機器學習正與新的深度學習技術發(fā)生集成?,F(xiàn)在深度學習可以進行物體識別、分類以及異常檢測,比如說識別一個人體細胞三維圖、判斷惡性細胞,這些工作都需要復雜認知能力。而隨著未來AI的進一步發(fā)展,認知能力更上一層的平臺則是理解人類世界、和人有相同的體驗。因此在智能家居、智能車、照顧老人的機器人方面,機器需要更好地理解人類的對話和請求。想要達到這樣一個目標,深度學習和機器學習能力都很重要。

面對愈發(fā)搶手的AI市場,GadiSinger將英特爾的AI戰(zhàn)略發(fā)展分為三大部分:硬件、軟件和生態(tài)系統(tǒng)。

1、硬件

至強處理器屬于通用型處理器,是AI的基礎。GadiSinger表示,大部分AI的演繹推理都是在至強處理器上運行。英特爾不斷豐富至強的指令集,從而實現(xiàn)AI工作負載的加速,并讓軟件堆棧能夠更好地加以利用。

除了通用型,英特爾還有一些專用型的芯片產(chǎn)品。不僅在功耗方面從幾十毫瓦到400瓦實現(xiàn)全面覆蓋,同時也覆蓋從終端設備邊緣到數(shù)據(jù)中心的不同計算環(huán)境。英特爾認為沒有萬能藥,不可能說用一款產(chǎn)品就能滿足不同的使用場景。因此,英特爾在硬件產(chǎn)品方面提供多元化的產(chǎn)品線。

2、軟件

在軟件戰(zhàn)略部分,針對不同硬件,英特爾提供優(yōu)化的堆棧。不管是數(shù)據(jù)科學家還是編程員,英特爾對每個用戶端都提供一致的數(shù)據(jù)體驗。比如英特爾今年3月開源的nGraph編譯器,不僅能對接英特爾所有的硬件產(chǎn)品,還能和PaddlePaddle、Tensorflow、caffe、MXnet等其他深度學習框架連接。這對用戶來說,是個簡化易用的體驗。

3、生態(tài)系統(tǒng)

英特爾在整個AI生態(tài)系統(tǒng)提供支撐作用。GadiSinger認為,生態(tài)系統(tǒng)對計算涉及的各個領域都很重要。在他所目睹的技術變革歷史中,AI的發(fā)展變革速度史無前例,新技術的出現(xiàn)和廣泛使用可能只需18-24個月的時間。因此,英特爾非常注重和AI領域的學術界以及思想領袖保持密切的聯(lián)系。英特爾在擁有自己的研究院和實驗室的同時,和許多頂級學府開展合作,與他們進行聯(lián)合研究或為他們提供資源支持。此外,為了更好的參與開源社區(qū),英特爾還將包括nGraph在內(nèi)的一些技術開源出來。

據(jù)GadiSinger稱,英特爾也積極參與標準化組織工作。比如在去年,英特爾宣布支持由微軟和Facebook聯(lián)合發(fā)布的開放式神經(jīng)網(wǎng)絡交換(OpenNeuralNetworkExchange,ONNX)格式,這一格式用于表示深度學習模型的標準,方便模型在不同框架間之間進行遷移。這是邁向開放生態(tài)系統(tǒng)的重要一步,對業(yè)界共享好的技術很有幫助。GadiSinger還強調(diào)到,英特爾重視和行業(yè)領先者們進行合作,完成一些概念驗證,共同打造技術解決方案。

▲中間為英特爾人工智能事業(yè)部副總裁兼人工智能架構總經(jīng)理GadiSinger

三、AI從技術到落地到最大挑戰(zhàn)

當被問及從企業(yè)角度看AI落地的最大挑戰(zhàn),GadiSinger談到一個具體實例,即近年來大熱的深度學習模型——生成對抗式網(wǎng)絡(GenerativeAdversarialNets,GANs)。GANs的概念在2014年被提出,到了2016年已經(jīng)廣為使用。2018年,GANs已經(jīng)做到第三代,在機器學習研究方面取得了新的進展,可以直接合成新的動物圖像并從圖像中創(chuàng)建3D圖形。

根據(jù)GadiSinger所言,這個技術的采納主要存在兩大障礙。

其一,找到真正有生命力有價值的新技術,而不是一次性有效的新技術。盡管新的技術想法和實驗層出不窮,真正有價值的技術生存下來的卻并不多。

其二,大量數(shù)據(jù)。很多新的技術需要大量數(shù)據(jù)才能展現(xiàn)價值和通用性。然而對于部分數(shù)據(jù)種類,尤其時牽扯到隱私的數(shù)據(jù),可能會需要較長時間來完成數(shù)據(jù)采集。

四、做好AI芯片的關鍵因素

GadiSinger認為做出好的AI芯片產(chǎn)品,有兩點不可或缺。

其一,弄清楚設計這個處理器究竟是為了解決什么問題。今年已經(jīng)是GadiSinger在英特爾工作的第35年,他曾經(jīng)在多個部門做過不同類型的產(chǎn)品,因為AI領域變化太快,要解決的問題本身也在持續(xù)改變,解決方案本身具有挑戰(zhàn)性。假設不久之前有人開發(fā)出針對AlexNet、GoogleNet的完美解決方案,但這個方案到了2019年、2020年可能就無法稱之為好的解決方案,因為會出現(xiàn)新的它無法解決的問題。因此,GadiSinger認為,如果想要AI芯片解決方案成功,很重要的一點就是做好趨勢判斷,能夠基于這種判斷做出適度合理的猜測。

其二,AI芯片本身由不同部分組成,這些不同功能塊之間要有很好的平衡。如果芯片只是在某一功能塊(比如TensorMultiplication)做得完美,但整體功能沒有做到均衡,并不足以解決實際場景問題。比如MovidiusVPU和NNP主要是加速的作用,但不可能把它們做成只具備加速功能的芯片。所以AI處理器解決方案要注重加入不同元素,可以針對某些場景解決特定問題,但解決問題的范圍不能太過狹窄。

結語:全棧式解決方案,決勝AI時代

萬物互聯(lián)時代,英特爾正在全面進軍AI領域。目前,英特爾已經(jīng)打造了一套完整的全棧式AI解決方案,包括至強處理器、Nervana神經(jīng)網(wǎng)絡處理器等硬件,F(xiàn)PGA、網(wǎng)絡和存儲技術等技術,MKL和DAAL等用于深度學習和機器學習的數(shù)學函數(shù)庫,以及支持和優(yōu)化Caffe、Neon等深度學習框架等。

在推動AI性能升級和技術大眾化的過程中,英特爾不斷和百度等企業(yè)進行深入合作。在十多年的合作史間,從智能化終端設備,基于至強可擴展處理器的大規(guī)模數(shù)據(jù)中心,到利用FPGA加速工作負載,再到優(yōu)化PaddlePaddle開發(fā)平臺,英特爾為百度提供豐富的產(chǎn)品和技術專長,加速AI技術的進步和落地。

至于英特爾全方位AI戰(zhàn)略布局將如何開花結果,市場會給出最終的答案。

中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0