智能無處不在:安謀科技“周易”NPU開啟端側(cè)AI新時代

時間:2024-11-08

來源:安謀科技

導語:在科技之光的照耀下,大模型從云端的殿堂飄然而至終端的舞臺。這一歷史性的跨越,不僅賦予了數(shù)據(jù)處理以迅捷之翼,更將智能體驗推向了前所未有的高度。終端上的大模型以靈動的姿態(tài),即時捕捉并回應著每一個細微的需求,將AI的觸角延伸至世界的每一個角落。

  在科技之光的照耀下,大模型從云端的殿堂飄然而至終端的舞臺。這一歷史性的跨越,不僅賦予了數(shù)據(jù)處理以迅捷之翼,更將智能體驗推向了前所未有的高度。終端上的大模型以靈動的姿態(tài),即時捕捉并回應著每一個細微的需求,將AI的觸角延伸至世界的每一個角落。

安謀科技新聞稿配圖-1.jpg

  近日,在EEVIA主辦的第12屆中國硬科技產(chǎn)業(yè)鏈創(chuàng)新趨勢峰會暨百家媒體論壇上,安謀科技產(chǎn)品總監(jiān)鮑敏祺發(fā)表了精彩的主題演講《端側(cè)AI應用芯機遇,NPU加速終端算力升級》。他深入剖析了端側(cè)AI發(fā)展的廣闊前景,并詳細介紹了安謀科技自研NPU的最新進展。

  端側(cè)AI正在崛起

安謀科技新聞稿配圖-2.jpg

  AIGC大模型帶來的算力提升是端側(cè)AI迎來的最大機遇。鮑敏祺表示,從近期頭部大廠的發(fā)布中都可以看出,端側(cè)AI的應用已經(jīng)得到了業(yè)界的一致認可。

安謀科技新聞稿配圖-3.jpg

  當前,國際和國內(nèi)實際部署的主流端側(cè)大模型體量主要集中在100億參數(shù)以下。這一限制主要是由于端側(cè)設備的內(nèi)存帶寬范圍通常在50-100GB/s之間。為了滿足用戶對應用實時性的需求,10-30億參數(shù)的大模型最適合部署在現(xiàn)有的帶寬條件下。這些模型能夠在保持高效性能的同時,提供快速響應和高質(zhì)量的服務。

  頭部終端廠商如OPPO、vivo、小米、榮耀和華為等,都在積極推動端側(cè)AI的發(fā)展。他們不僅自研了適合端側(cè)部署的大模型,還將其與具體業(yè)務場景緊密結(jié)合。芯片廠商也達成了共識,認為AI NPU(神經(jīng)網(wǎng)絡處理單元)將是未來消費類電子產(chǎn)品發(fā)展的重點。NPU通過專門優(yōu)化的硬件架構(gòu),能夠大幅提升端側(cè)設備的AI計算能力,同時降低功耗。

  盡管端側(cè)AI的發(fā)展勢頭強勁,但鮑敏祺強調(diào),這并不意味著要徹底放棄云端AI。相反,他認為兩者應該實現(xiàn)互補,才能產(chǎn)生最大的收益。端側(cè)AI的優(yōu)勢在于其時效性和數(shù)據(jù)本地化帶來的安全性。由于數(shù)據(jù)處理發(fā)生在設備本地,用戶的隱私得到更好的保護,同時也能實現(xiàn)實時響應。而云端AI則具備更強的推理能力和大規(guī)模數(shù)據(jù)處理能力,可以進行更復雜的任務。因此,結(jié)合端側(cè)和云端的優(yōu)勢,將為用戶提供更加全面和高效的AI體驗。

  從人機交互界面的發(fā)展歷史來看,從最初的物理按鍵到觸摸屏和語音交互,再到當前的Agent智能體,每一次變革都極大地提升了用戶體驗。未來的趨勢將是多模態(tài)場景,即結(jié)合圖像、音頻、視頻等多種輸入方式,使設備能夠更全面地理解用戶的需求。通過觀察和學習,未來的AI系統(tǒng)將能夠更好地預測和滿足用戶的期望,從而實現(xiàn)真正的智能化。

  以三重升級應對三重挑戰(zhàn)

  端側(cè)AI的快速發(fā)展給硬件設備帶來了三重挑戰(zhàn):成本、功耗和生態(tài)系統(tǒng)。

  成本的挑戰(zhàn)主要來自于設備的存儲容量、帶寬和芯片計算資源。功耗則源自對數(shù)據(jù)的大量搬運,而且大模型無法像CNN一樣實現(xiàn)高度復用,也會大幅提升功耗。最后,開發(fā)工具的不斷優(yōu)化和支持也是挑戰(zhàn)所在。

安謀科技新聞稿配圖-4.jpg

  針對這些挑戰(zhàn),安謀科技自研的“周易”NPU圍繞微架構(gòu)、能效和并行處理等方面進行了升級。

  l 微架構(gòu):鑒于CNN與Transformer的差異性,“周易”NPU在保留CNN能力的基礎上,又針對Transformer進行了優(yōu)化,克服了實際計算中的瓶頸。

  l 效率:進行混合精度的量化,比如int4和fp16,在算法和工具鏈層面上實現(xiàn)低精度量化。同時,對數(shù)據(jù)進行無損壓縮和改變稀疏度,從而增加有效帶寬。另外,采用In-NPU interconnection技術,實現(xiàn)了對總線帶寬的擴展。

  l 并行處理:采用數(shù)據(jù)并行或模型并行,使用負載均衡和Tiling,減少了數(shù)據(jù)的搬運。

  鮑敏祺還詳細介紹了下一代的周易“NPU”架構(gòu),不僅包含了能夠適應多任務場景的Task Schedule Manager,而且整個架構(gòu)具備可擴展能力,并增加DRAM以實現(xiàn)高帶寬的匹配,還增加了OCM(Optional on Chip SRAM),以支持有特殊要求的算法。

安謀科技新聞稿配圖-5.jpg

  鮑敏祺在演講中特別強調(diào)了“周易”NPU對異構(gòu)計算的支持,并指出無論是從能效還是整個SoC(系統(tǒng)級芯片)的面積角度來看,異構(gòu)計算都是端側(cè)AI芯片的最佳選擇。他解釋道,面對不同的應用場景,異構(gòu)計算能夠?qū)崿F(xiàn)算力的靈活裁剪,并將不必要的功耗降到最低。

  跨領域的應用專家

  周易“NPU”已經(jīng)在多個關鍵領域展示了其強大的性能和靈活性,特別是在汽車應用、AI加速卡以及AIoT場景中。

安謀科技新聞稿配圖-6.jpg

  在汽車應用中,不同的場景會對應不同的算力需求。如果是車載信息娛樂系統(tǒng),對算力的要求不會太高,但是在ADAS應用中,很多情況下要執(zhí)行多任務,對算力的要求就會大幅提升。而“周易”NPU的算力范圍是20~320TOPS,可以根據(jù)需求裁剪出所需的算力。鮑敏祺表示,搭載了“周易”NPU的芯擎科技“龍鷹一號”已累計出貨超過40萬片,并成功定點應用于吉利旗下的領克、銀河系列以及一汽紅旗等20余款主力車型中。

安謀科技新聞稿配圖-7.jpg

  在AI加速卡的應用中,周易“NPU”能夠與智能汽車、PC、機器人等不同類型的主機處理器(Host AP)進行高效交互,處理音頻、圖像、視頻等多種數(shù)據(jù)形式。這種多模態(tài)模型的支持能力使得周易“NPU”能夠在復雜的數(shù)據(jù)環(huán)境中保持高性能和靈活性。在AIoT場景中,設備通常受到面積和功耗的嚴格限制。盡管如此,周易“NPU”仍能提供高效的算力支持,同時保證高度的安全性。這使得它成為多個應用場景的理想選擇。

  鮑敏祺最后表示,下一代周易“NPU”將會繼承并顯著增強前代產(chǎn)品的強算力、易部署以及可編程等特點和優(yōu)勢,并圍繞精度、帶寬、調(diào)度管理、算子支持等多個方面進行持續(xù)優(yōu)化。同時,NPU不僅要考慮適配現(xiàn)在的存儲介質(zhì),還要考慮到對未來各種存儲介質(zhì)的適配,使得NPU能夠更好地滿足當前及未來市場需求。

中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0