作為AI芯片后入者的三星正提著大刀趕來:據(jù)外媒爆料,三星已經(jīng)接近完成一款AI芯片的研發(fā),其性能已經(jīng)堪比蘋果的A11和華為麒麟970,三星極有可能在2月25日舉行的MWC2018大會上發(fā)布GalaxyS9的同時,展示其新AI技術(shù)的能力。
據(jù)《韓國先驅(qū)報》網(wǎng)站報道,三星電子已經(jīng)基本完成第一款神經(jīng)處理單元(NPU)的開發(fā)工作,準備在今年晚些時候部署到設(shè)備上。NPU被廣泛稱為AI芯片,據(jù)稱三星將在即將發(fā)布的智能手機上搭載這款芯片,此舉有助于其手機趕超競爭對手。
“據(jù)三星內(nèi)部人士爆料,三星已經(jīng)基本完成了服務(wù)器AI芯片的開發(fā)工作,預計該芯片將出售給服務(wù)器廠商?!币幻鸄I專家告訴《韓國先驅(qū)報》。
除了CPU、GPU等之外,智能手機上再加上NPU的話,手機本身就可以在沒有云服務(wù)器幫助的情況下處理、分析和存儲智能手機上產(chǎn)生的數(shù)據(jù)。NPU被廣泛認為是智能手機的大腦。
目前,三星在這個領(lǐng)域落后于蘋果和華為這兩個最大的競爭對手,后兩者都已經(jīng)推出了移動端的AI芯片。蘋果公司去年發(fā)布了iPhoneX,使用NPU實現(xiàn)臉部識別和動畫表情符號等人們熟知的功能。緊接著,華為推出了一款能夠隨時間學習用戶習慣的NPU,部署在Mate10Pro手機上。
盡管三星對于這個市場是后來者,但那位“AI專家”對韓國先驅(qū)報稱,“三星已經(jīng)達到蘋果和華為的技術(shù)水平,而且在今年下半年肯定會推出更好的芯片。”據(jù)報道,三星的芯片每秒運行的速度超過了蘋果的A11和華為的麒麟970。
此外,同一消息人士透露,三星可能將在2月25日舉行的MWC2018大會上發(fā)布GalaxyS9的同時,展示其新AI技術(shù)的能力。
據(jù)稱三星在人工智能相關(guān)項目上投入了大量資金,并與韓國各大學的教授和研究人員合作,以制造出相比競爭對手更安全、更高效的芯片。
該消息人士透露,三星還正在為GalaxyNote9智能手機開發(fā)一款增強的NPU,該款手機預計在今年9月份發(fā)布。就像之前的GalaxyNote7和Note8一樣,Note9可能成為三星的一個轉(zhuǎn)折點。
AI手機進入戰(zhàn)國時代,芯片研發(fā)馬太效應漸顯
正如上文所說,三星的這款AI芯片,主要的競爭對手是蘋果和華為。目前,蘋果的iPhoneX和華為的Mate10(Pro)、V10等系列手機均已經(jīng)使用人工智能芯片,成為AI手機的領(lǐng)導者。
iPhoneX中的“A11生物神經(jīng)網(wǎng)絡(luò)引擎”(A11bionicneuralengine)芯片,每秒運算次數(shù)最高可達6000億次,相當于0.6TFlops(寒武紀NPU則是1.92TFlops,每秒可以進行19200次浮點運算),采用了六核心設(shè)計,由2個高性能核心與4個高能效核心組成。相比A10,其中兩個性能核心的速度提升了25%,四個能效核心的速度提升了70%。工藝方面,A11采用了臺積電10nmFinFET工藝,集成了43億個晶體管。
A11能幫助加速人工智能任務(wù),包括FaceID,Animoji和AR應用程序。A11同時支持CoreML,這是蘋果在WWDC開發(fā)者大會上推出的一款新型機器學習框架。CoreML支持所有主要的神經(jīng)網(wǎng)絡(luò),如DNN、RNN、CNN等,開發(fā)者可以把訓練完成的機器學習模型封裝進App之中。
華為麒麟970芯片,首次采用臺積電10nm工藝,集成55億個晶體管(驍龍835是31億顆,蘋果A10是33億顆),功耗降低20%。采用4個CortexA73核心,4個CortexA53核心,GPU為具有12個核心的Mali-G72MP12,每秒處理速度可達萬億次。麒麟970芯片內(nèi)置全新升級自研相機雙ISP,支持人工智能場景識別、人臉追焦、智能運動場景檢測,同時夜拍效果再次升級。基帶方面,麒麟970采用了更先進的4.5GLTE技術(shù),支持全球最高是LTECat.18規(guī)格,實現(xiàn)目前業(yè)界最高的1.2Gbps峰值下載速率。同時內(nèi)建TEE和inSE安全引擎,擁有更高的安全性。
不過,三星、蘋果、華為“三國殺”的局面不會持續(xù)很久。
由于智能手機的競爭進入到嚴重的同質(zhì)化階段,跟全面屏一樣,人工智能芯片將會是手機廠商下一個“標配”的重點。除了三星、蘋果、華為三巨頭,還有很多廠商涌入智能手機和AI芯片的競爭,例如最近傳聞將于2018年下半年上市的小米——2017年2月,小米自主研發(fā)的手機芯片澎湃S1問世,成為國產(chǎn)手機中第二家擁有自主研發(fā)芯片能力的手機廠商。
人工智能芯片對手機性能提升、人機交互等功能上有巨大的想象空間,AI手機特別是高端旗艦AI手機的研發(fā)能力是能夠拉開與對手差距的重要一步,手機市場格局也會隨著研發(fā)能力逐漸分化,強者更強,弱者更弱的馬太效應將逐漸凸顯。
移動端AI芯片,誰能笑到最后?
由于GPU存在功耗瓶頸,同時用戶越來越關(guān)心個人隱私安全與時效性,終端智能芯片的發(fā)展順應時代所需。
終端的智能芯片則需要同時具備高性能與低功耗的特征。此外,終端也涵蓋了不同的應用場景,都需要針對具體需求,在功耗、延遲、數(shù)據(jù)吞吐量、加速器方案的選擇上做出調(diào)整和優(yōu)化。
新智元對部分移動端能夠支撐AI功能的芯片做了梳理:
谷歌:PixelVisualCore
2017年10月,Google在其官方博客上公開了Pixel2中使用的一顆專用圖像處理協(xié)處理器——PixelVisualCore。這是Google在用于服務(wù)器的TPU之后推出的第二顆芯片,這次針對的是移動端。PixelVisualCore由Google與Intel合作設(shè)計開發(fā),主要用于圖像處理和機器學習。這塊芯片由8個IPU(每個包含512個ALU)+1個Cortex-A53核心組成,最大可提供3TFLOPS浮點運算能力。
高通:驍龍845處理器
說到手機芯片,怎能不提高通。高通在2017年12月初正式發(fā)布了驍龍845移動平臺。驍龍845處理器采用10納米LPP制程工藝,其中GPU采用Adreno630,X20LTE調(diào)制解調(diào)器、WiFi、影像方面使用Spectra280ISP,以及Hexagon685DSP協(xié)處理器、音質(zhì)方面使用高通AqsticAudio、CPU采用四個2.8GHz大核+四個1.8GHz小核+2MB緩存的Kryo385CPU、移動安全芯片,另在845中新增了一塊獨立內(nèi)存。AI方面,驍龍845主要通過Kryo385定制架構(gòu)、Adreno630、Hexagon685在終端異步運算數(shù)據(jù)。相比835,驍龍845在AI上的計算能力是835的三倍,目前已經(jīng)可以支持S845GoogleTensorFlow、FacebookCaffe以及OpenNeuralNetworkExchange在內(nèi)的多款主流深度學習框架。
MovidiusVPUMyriad2
2016年9月,Intel發(fā)表聲明收購了Movidius。Movidius專注于研發(fā)高性能視覺處理芯片?,F(xiàn)任CEO是原來德州儀器OMAP部門的總經(jīng)理,它的技術(shù)指導委員會也是實力強大,擁有半導體和處理器行業(yè)的元老級人物——被蘋果收購的P.A.Semi創(chuàng)始人丹尼爾·多伯普爾(DanielDobberpuhl),卡內(nèi)基梅隆大學計算機科學/計算機視覺專家金出武雄,以及前蘋果iPhone和iPod部門工程副總裁、資深工程師大衛(wèi)·圖普曼(DavidTupman)三人坐鎮(zhèn)。
其最新一代的Myriad2視覺處理器主要由SPARC處理器作為主控制器,加上專門的DSP處理器和硬件加速電路來處理專門的視覺和圖像信號。這是一款以DSP架構(gòu)為基礎(chǔ)的視覺處理器,在視覺相關(guān)的應用領(lǐng)域有極高的能耗比,可以將視覺計算普及到幾乎所有的嵌入式系統(tǒng)中。該芯片已被大量應用在Google3D項目Tango手機、大疆無人機、FLIR智能紅外攝像機、??瞪铐盗袛z像機、華睿智能工業(yè)相機等產(chǎn)品中。
寒武紀1H8和1H16
寒武紀于2016年發(fā)布了全球首款商用深度學習專用處理器IP——寒武紀1A處理器。寒武紀1A的橫空出世打破了多項記錄,受到了業(yè)界廣泛關(guān)注,入選了第三屆世界互聯(lián)網(wǎng)大會評選的十五項“世界互聯(lián)網(wǎng)領(lǐng)先科技成果”。2017年11月,在公司首次發(fā)布會上,CEO陳天石介紹了三款全新的智能處理器IP產(chǎn)品,其中就包括面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16。
陳天石介紹說,與寒武紀1A相比,新品在功耗、能效比、成本開銷等方面進行了優(yōu)化,性能功耗比再次實現(xiàn)飛躍,適用范圍覆蓋了圖像識別、安防監(jiān)控、智能駕駛、無人機、語音識別、自然語言處理等各個重點應用領(lǐng)域。
地平線旭日和征程
2017年12月20日,地平線在北京舉行發(fā)布會,推出的征程(Journey)和旭日(Sunrise)兩款面向計算機視覺的處理器,分別用于無人駕駛和智能攝像頭。旭日和征程都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。地平線首席芯片架構(gòu)師周峰對新智元介紹,這兩款芯片,芯片性能可達到1Tops,實時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。典型功耗做到1.5w。
深鑒聽濤
2017年10月24日,深鑒科技召開發(fā)布會,正式對外宣布完成約4000萬美元A+輪融資,由螞蟻金服與三星風投領(lǐng)投。CEO姚頌還公布了一系列芯片計劃,由深鑒自主研發(fā)的芯片“聽濤”、“觀?!睂⒂?018年第三季度面市。
其中,“聽濤”將于2018年上半年完成產(chǎn)品裝載,該系列芯片采用臺積電28納米制程,核心使用深鑒自己的亞里士多德架構(gòu),峰值性能1.1瓦4.1TOPS。亞里士多德架構(gòu)針對卷積神經(jīng)網(wǎng)絡(luò)而設(shè)計。目前,卷積神經(jīng)網(wǎng)絡(luò)一般用來處理圖像相關(guān)的智能問題,而此架構(gòu)靈活與可擴展的特性使它可被應用于各種不同規(guī)格的終端中。
異構(gòu)智能:NovuTensor
在今年CES上,NovuMind(中文名稱“異構(gòu)智能”)向業(yè)界首次展示其自主研發(fā)的第一款高性能、低功耗的AI芯片NovuTensor,號稱可能是除了TPU之外,世界上跑得最快的單芯片。
NovuMind方面表示,這是截至目前世界上唯一能夠?qū)嶋H運行的、性能達到主流GPU/TPU水平而性能/功耗比卻遠超主流GPU/TPU的芯片——在功耗12w的情況下,NovuTensor每秒可識別300張圖像,每張圖像上,最多可檢測8192個目標,相比目前最先進的桌面服務(wù)器GPU(250W,每秒可識別666張圖像),僅使用1/20電力即可達到其性能的1/2;而相比目前最先進的移動端或嵌入式芯片,相同用電的情況下,性能是其三倍以上。據(jù)了解,本次CES展示的僅僅是FPGA版本,等正在流片的ASIC芯片正式出廠,性能將提高4倍,耗電將減少一半,耗能不超過5瓦、可進行15萬億次運算的超高性能。
GTI光矛處理器
成立于2017年初的GyrfalconTechnologyInc.(簡稱GTI)近期以“光矛處理器Lightspeeur2801S”引發(fā)業(yè)內(nèi)關(guān)注,這也是一家由中國芯片老兵創(chuàng)立的公司,總部位于美國硅谷。其芯片方案基于APiM架構(gòu),有28000個并行神經(jīng)計算核,真正支持片上并行與原位計算,不需要使用外部存儲單元,克服了由存儲器帶寬而導致的性能瓶頸,在效率能耗比方面表現(xiàn)卓越,達到9.3Tops/Watt,無論在訓練模式還是推理模式下均可提供高密度計算性能。
在今年的CES上,GTI推出了內(nèi)置Lightspeeur2801S芯片的Laceli人工智能計算棒,可以在1瓦的功率下提供超過每秒9.3萬億次浮點運算的性能,超越英特爾Movidius的神經(jīng)計算棒,后者每瓦功率范圍的運算力則是0.1萬億次。Laceli人工智能計算棒可以在多種深度學習場景中應用,包括圖像和視頻識別、理解及描述,自然語言理解、自然語言處理等。