與往年偏重模型或芯片的展示不同,今年的展會(huì)呈現(xiàn)出高度系統(tǒng)化的特征,具身智能、人形機(jī)器人、垂直行業(yè)大模型與國(guó)產(chǎn)算力構(gòu)成了完整的從感知、認(rèn)知、執(zhí)行到算力支撐的閉環(huán)。
尤其是在“麒麟”具身智能訓(xùn)練場(chǎng)等新基礎(chǔ)設(shè)施的帶動(dòng)下,具身智能成為新的技術(shù)高地,正在重塑機(jī)器人訓(xùn)練、工業(yè)自動(dòng)化、服務(wù)協(xié)作的核心方式。
我們從訓(xùn)練平臺(tái)、應(yīng)用模型與國(guó)產(chǎn)算力三大層面,梳理2025年WAIC上人工智能體系化發(fā)展的核心脈絡(luò)。
01
具身智能成為新焦點(diǎn):
訓(xùn)練基礎(chǔ)設(shè)施的進(jìn)化
本屆WAIC的一大亮點(diǎn),是具身智能從概念走向工程落地的趨勢(shì)顯現(xiàn)。
在展館內(nèi)模擬的“WAIC里·技能大舞臺(tái)”區(qū)域中,20余款人形與結(jié)構(gòu)機(jī)器人完成了一系列高精度操作,如剝蛋、寫字、舞獅、串煮、搬運(yùn)等,表明動(dòng)作控制與場(chǎng)景泛化能力均已具備實(shí)用性門檻。這些展示背后,是更為底層的訓(xùn)練系統(tǒng)支撐能力的提升。
作為目前全國(guó)首個(gè)異構(gòu)人形機(jī)器人訓(xùn)練平臺(tái),“麒麟”具身智能訓(xùn)練場(chǎng)首次被系統(tǒng)性披露。該訓(xùn)練場(chǎng)位于上海浦東,面積達(dá)4000平方米,可容納超過百臺(tái)機(jī)器人并行進(jìn)行交互訓(xùn)練。
其核心機(jī)制是通過真實(shí)物理交互環(huán)境生成結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)動(dòng)作執(zhí)行、任務(wù)理解、路徑規(guī)劃與人機(jī)交互等行為數(shù)據(jù)的聚合。
每天可生成約5萬條高質(zhì)量交互記錄,計(jì)劃至2025年年底,累計(jì)將達(dá)到1000萬條數(shù)據(jù)規(guī)模。這一量級(jí)的數(shù)據(jù),對(duì)于復(fù)雜控制系統(tǒng)的微調(diào)、模態(tài)遷移能力的檢驗(yàn),以及泛化模型的構(gòu)建具有決定性價(jià)值。
技術(shù)上,訓(xùn)練場(chǎng)并非只是傳感數(shù)據(jù)的收集地,更關(guān)鍵的是其對(duì)異構(gòu)系統(tǒng)的兼容與訓(xùn)練流程的標(biāo)準(zhǔn)化能力。
在同一物理平臺(tái)上,協(xié)同運(yùn)行多家企業(yè)提供的人形機(jī)器人本體、執(zhí)行器、視覺模組與后端大模型,其核心難點(diǎn)在于建立統(tǒng)一的任務(wù)分解標(biāo)準(zhǔn)與動(dòng)作評(píng)價(jià)體系。
目前,“麒麟”平臺(tái)已實(shí)現(xiàn)多型號(hào)、多架構(gòu)機(jī)器人間的協(xié)同訓(xùn)練,初步形成一套低成本、高頻率的“具身學(xué)習(xí)流水線”。
訓(xùn)練場(chǎng)并非孤立設(shè)施,而是嵌套于浦東模力社區(qū)這一城市級(jí)AI資源集群中。依托社區(qū)提供的本地算力、云數(shù)據(jù)調(diào)度與硬件資源支持,訓(xùn)練場(chǎng)實(shí)現(xiàn)了“任務(wù)驅(qū)動(dòng)—數(shù)據(jù)采集—模型訓(xùn)練—反饋迭代”的快速閉環(huán)。
這種多主體協(xié)同的生態(tài)式基礎(chǔ)設(shè)施,為未來具身智能在制造、養(yǎng)老、物流、救援等多場(chǎng)景下的能力驗(yàn)證與迭代提供了新范式。
02
從多模態(tài)模型到算力平臺(tái):
國(guó)產(chǎn)AI生態(tài)加速整合
除了具身智能與人形機(jī)器人基礎(chǔ)設(shè)施的進(jìn)化,WAIC2025的另一個(gè)技術(shù)看點(diǎn)是大模型與國(guó)產(chǎn)算力的深度融合,以及場(chǎng)景化落地能力的系統(tǒng)強(qiáng)化。
在展會(huì)現(xiàn)場(chǎng),可以明顯觀察到模型能力已從單一文本語言處理,拓展至圖像、視頻、音頻、空間感知等多模態(tài)輸入,并與垂直行業(yè)應(yīng)用密切掛鉤。
圍繞3D內(nèi)容生成的模型在本屆展會(huì)中首次批量亮相。
相較于以往需使用專業(yè)建模工具與人工流程構(gòu)建虛擬三維環(huán)境,當(dāng)前模型可通過自然語言或圖片輸入,在數(shù)分鐘內(nèi)生成復(fù)雜場(chǎng)景,極大降低內(nèi)容生產(chǎn)門檻。
這種生成能力,不僅適用于文娛、教育等虛擬現(xiàn)實(shí)應(yīng)用,也可反向嵌入機(jī)器人路徑規(guī)劃、場(chǎng)景理解等物理空間任務(wù)中,成為具身智能的上層感知支持。
在工業(yè)側(cè),模型設(shè)計(jì)正在向端到端架構(gòu)演化,取代以往的模塊式任務(wù)分解與特定邏輯流程。
部分模型直接從采集到的傳感器數(shù)據(jù)中輸出動(dòng)作或控制命令,省去中間的狀態(tài)建模與邏輯結(jié)構(gòu)設(shè)計(jì),提高泛化性能。尤其在高風(fēng)險(xiǎn)環(huán)境(如礦山、災(zāi)后區(qū)域)或弱結(jié)構(gòu)環(huán)境(如家庭服務(wù))中,這種一體化模型顯著提升了部署效率與系統(tǒng)魯棒性。
支撐上述模型訓(xùn)練與實(shí)時(shí)部署的,是國(guó)產(chǎn)算力基礎(chǔ)的快速成長(zhǎng)。WAIC2025期間,多家本土芯片企業(yè)集中展示了新一代AI芯片與平臺(tái)系統(tǒng),涵蓋從TPU、GPU到異構(gòu)計(jì)算節(jié)點(diǎn)的多種架構(gòu)路徑。
在推理和訓(xùn)練合一的場(chǎng)景下,本土研發(fā)的芯片平臺(tái)已具備基礎(chǔ)可用性。
如新一代訓(xùn)推一體GPU系統(tǒng),通過自研架構(gòu)與HBM高帶寬顯存的結(jié)合,提升了數(shù)據(jù)吞吐能力,滿足百億參數(shù)級(jí)模型訓(xùn)練需求。
另一類TPU平臺(tái)則強(qiáng)調(diào)能耗控制與大規(guī)模集群互聯(lián)能力,支持1024片芯片間高速通信,可滿足大模型低延遲、高并發(fā)的計(jì)算場(chǎng)景。
更具系統(tǒng)性的進(jìn)展在于,國(guó)產(chǎn)算力平臺(tái)正從單點(diǎn)芯片能力走向全鏈路生態(tài)構(gòu)建。
從編譯器、驅(qū)動(dòng)協(xié)議、開發(fā)套件,到算力調(diào)度平臺(tái)與服務(wù)端系統(tǒng),多個(gè)展臺(tái)展示了從終端芯片到集群平臺(tái)的完整方案。這不僅是對(duì)“自主可控”的回應(yīng),更意味著中國(guó)AI基礎(chǔ)設(shè)施建設(shè)進(jìn)入以場(chǎng)景適配為導(dǎo)向的成熟階段。
算力基礎(chǔ)的建設(shè)也嵌入到了上海的城市級(jí)資源布局中。以張江機(jī)器人谷為例,上游關(guān)鍵部件(如減速器、傳感器)企業(yè)與下游算法公司、高算力平臺(tái)集聚分布,形成了緊密耦合的產(chǎn)業(yè)閉環(huán)。
而模力社區(qū)、模速空間等區(qū)域,也在提供本地算力、數(shù)據(jù)治理、應(yīng)用調(diào)度等服務(wù),構(gòu)建了覆蓋“模型—芯片—場(chǎng)景—服務(wù)”的AI生態(tài)完整體。
小結(jié)
2025年的WAIC,不僅展示了中國(guó)人工智能領(lǐng)域技術(shù)能力的階段性突破,更首次呈現(xiàn)出一種結(jié)構(gòu)化的體系圖景。
大模型、具身智能、國(guó)產(chǎn)算力的并行發(fā)展,以及它們通過場(chǎng)景、數(shù)據(jù)、平臺(tái)彼此打通的能力,中國(guó)AI正從“單點(diǎn)創(chuàng)新”向“系統(tǒng)融合”轉(zhuǎn)型。