時(shí)間:2023-11-14 14:21:40來(lái)源:機(jī)器人技術(shù)與應(yīng)用
寒潮天氣來(lái)臨前,人形機(jī)器人的專(zhuān)屬新政出爐了。11月2日,工信部印發(fā)了《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》(下稱(chēng)“意見(jiàn)”)。
意見(jiàn)描繪出人形機(jī)器人的可期前景,甚至給出了確切的時(shí)間表。意見(jiàn)提出,到2025年,人形機(jī)器人創(chuàng)新體系初步建立,并實(shí)現(xiàn)批量生產(chǎn);到2027年,綜合實(shí)力達(dá)到世界先進(jìn)水平。
人形機(jī)器人的賽道,如今熱鬧喧囂了很多。但在外界眼中,那群長(zhǎng)期探索中的知名從業(yè)者們,他們浸淫多年的感知和邏輯,卻依然影影綽綽,猶如迷霧一般。
源于此,筆者將兩個(gè)多月前的世界機(jī)器人大會(huì)期間,智創(chuàng)未來(lái)人形機(jī)器人技術(shù)與產(chǎn)業(yè)發(fā)展論壇上,專(zhuān)家、學(xué)者以及企業(yè)家等的演講以及對(duì)話等內(nèi)容進(jìn)行編輯,梳理出賽道內(nèi)權(quán)威人士的所做所思所想,以供參考。
01
未來(lái)最大變量?
黃曉慶締造達(dá)闥科技已有8年之久,他有一個(gè)深切感知——“機(jī)器人為什么必須是人形”,是機(jī)器人行業(yè)一直爭(zhēng)論的問(wèn)題。
黃曉慶是達(dá)闥科技創(chuàng)始人兼CEO、中國(guó)云計(jì)算專(zhuān)委會(huì)副主任。他喜歡從過(guò)往找答案。
一百多年前,福特夢(mèng)想造一輛“不用馬的馬車(chē)”,從model A一直制造到model T,世界汽車(chē)工業(yè)革命也由此開(kāi)始。
人形機(jī)器人誕生至今,也已走過(guò)上百年的漫長(zhǎng)歲月。演變期間,有潮漲潮落,但從未止息。
黃曉慶看到,日本自1973年造出第一臺(tái)人形機(jī)器人后,研究從未中斷,即使在“福島事件”后進(jìn)入低潮期,也并未停止;另一個(gè)“工業(yè)強(qiáng)國(guó)”德國(guó),也同樣對(duì)人形機(jī)器人的研究孜孜以求。
“人形機(jī)器人,將是未來(lái)人機(jī)共存的第一選擇?!秉S曉慶判斷。他認(rèn)為,機(jī)器人的發(fā)展演進(jìn),與AI發(fā)展從專(zhuān)用小模型到通用大模型的轉(zhuǎn)變類(lèi)似,路徑是從專(zhuān)用機(jī)器人到通用機(jī)器人。這一前提下,人形機(jī)器人同時(shí)具備:自動(dòng)適應(yīng)人類(lèi)環(huán)境、使用人類(lèi)工具、進(jìn)行自然語(yǔ)言交互三個(gè)特點(diǎn)。
姚期智是2000年圖靈獎(jiǎng)獲得者、中國(guó)科學(xué)院院士、清華大學(xué)交叉信息研究院院長(zhǎng)。他最近在思考:人工智能的下一步是什么?
“未來(lái)的AGI(通用人工智能),需要有具身的實(shí)體?!币ζ谥撬伎歼^(guò)后得出結(jié)論。
姚期智說(shuō),人類(lèi)本身,是世界上相當(dāng)理想的一個(gè)具身智能體,其基本具備三個(gè)成分,即身體、小腦和大腦。其中身體的部分,應(yīng)該就是人形機(jī)器人。
丹尼斯·洪(Dennis Hong)是美國(guó)加州大學(xué)洛杉磯分校教授、RoMeLa實(shí)驗(yàn)室創(chuàng)始人,他從小就癡迷機(jī)器人,長(zhǎng)大后延續(xù)了小時(shí)候的夢(mèng)想。
丹尼斯·洪還是小孩時(shí),就夢(mèng)想和機(jī)器人一起生活。他發(fā)現(xiàn),家庭環(huán)境是為人設(shè)計(jì)的,比如樓梯、門(mén)把手等都是由人來(lái)使用,因此他認(rèn)為,機(jī)器人最好是人形的?!斑^(guò)去二十年當(dāng)中,我們都專(zhuān)注于人形機(jī)器人的研究。”丹尼斯·洪說(shuō)。
馬克·雷伯特(Marc Raibert)是美國(guó)波士頓動(dòng)力公司創(chuàng)始人兼首席執(zhí)行官,他是有名的長(zhǎng)期主義者。他認(rèn)為,機(jī)器人人工智能,由運(yùn)動(dòng)智能和認(rèn)知智能兩部分組成。認(rèn)知智能是人類(lèi)頭腦思考中的意象。運(yùn)動(dòng)智能涉及如何使用自己的身體。
馬克·雷伯特發(fā)現(xiàn),人類(lèi)擁有非常高超的運(yùn)動(dòng)智能,哪怕僅僅幾歲的孩童,也具備這一智能。于是,他試圖賦予機(jī)器人運(yùn)動(dòng)智能。
宇樹(shù)科技創(chuàng)始人兼首席執(zhí)行官王興興坦言,“前幾年,我個(gè)人有點(diǎn)悲觀,我甚至覺(jué)得世界科技已經(jīng)停滯,紅利殆盡”,然而從去年底開(kāi)始,他重新燃起了斗志。
這源自于通用性AI進(jìn)展,遠(yuǎn)超他個(gè)人預(yù)期,他感受到,目前通用人形機(jī)器人需要的AI,已經(jīng)慢慢趨于成熟。去年底,他們立項(xiàng)做通用人形機(jī)器人。
“未來(lái)五到十年間,新工業(yè)革命、新經(jīng)濟(jì)增長(zhǎng),都會(huì)誕生,”王興興說(shuō)。
王興興認(rèn)為,人形機(jī)器人與通用AI結(jié)合,是未來(lái)整個(gè)人類(lèi)科技和經(jīng)濟(jì)增長(zhǎng)最大的變量。
02
堅(jiān)守者的野望
周劍稱(chēng),很多年前他就提及,人類(lèi)需要人形機(jī)器人來(lái)賦能生活。
周劍是優(yōu)必選科技創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官,優(yōu)必選則是他締造的一家人形機(jī)器人公司,在該領(lǐng)域沉浸已有11個(gè)年頭。
在周劍看來(lái),人形機(jī)器人并不缺應(yīng)用場(chǎng)景。
在工業(yè)場(chǎng)景當(dāng)中,他看到,如今幾乎所有的汽車(chē)生產(chǎn)線,ABB、庫(kù)卡用工業(yè)機(jī)械手臂到最后汽車(chē)組裝線,集體上陣的情況下,現(xiàn)場(chǎng)依然有大量工人。很多頭部企業(yè)擁有幾十萬(wàn)規(guī)模的生產(chǎn)線工人。這個(gè)未來(lái)可以由人形機(jī)器人去替代。
“人形機(jī)器人和傳統(tǒng)智能化的設(shè)備去協(xié)作作業(yè),用來(lái)解決復(fù)雜場(chǎng)景的柔性無(wú)人化的工廠,這才是未來(lái)機(jī)器人或者汽車(chē)智慧的超級(jí)無(wú)人工廠?!敝軇φf(shuō)。
未來(lái)市場(chǎng)空間到底有多大?周劍預(yù)估稱(chēng),目前一個(gè)擁有50萬(wàn)工人的汽車(chē)工廠,如果能節(jié)省10%的工人數(shù)量,就是5萬(wàn)人,按每人節(jié)省6、7萬(wàn)美金來(lái)算,這意味著,一個(gè)To B的工廠可能有幾十億美金的市場(chǎng)。
在生活場(chǎng)景當(dāng)中,這里到處都要符合人體工程學(xué),人形機(jī)器人尤其適合,在這一環(huán)境里陪伴人類(lèi),一起工作、學(xué)習(xí)、生活。
尤其是AI大模型的不斷發(fā)展之下,不同的大學(xué)、科研機(jī)構(gòu)、公司,都用AI大模型,讓夢(mèng)想不斷照進(jìn)現(xiàn)實(shí)。
王興興認(rèn)為,去年開(kāi)始,人形機(jī)器人越來(lái)越火熱,這與馬斯克的身體力行脫不開(kāi)關(guān)系,國(guó)內(nèi)資本層面也與國(guó)外進(jìn)行了對(duì)標(biāo)。過(guò)去該領(lǐng)域高潮與低谷,已循環(huán)了很多個(gè)周期?!昂茈y想象,十年前,AI是個(gè)冷門(mén)行業(yè),如果不是去年生成式AI出現(xiàn)爆發(fā)性增長(zhǎng),可能AI又進(jìn)入一個(gè)新低谷時(shí)期,但是,現(xiàn)在整個(gè)AI迭代速度已越來(lái)越快?!?/span>
馬克·雷伯特和其團(tuán)隊(duì)的研究,可以追溯到15年前,他們開(kāi)發(fā)了各種各樣的機(jī)器人,比如大狗機(jī)器人、野貓機(jī)器人、spot機(jī)器人、物流機(jī)器人stretch、人形機(jī)器人Atlas等等。
馬克·雷伯特將三個(gè)機(jī)器人,代表了波士頓動(dòng)力公司的今天、明天和未來(lái)。其中正在開(kāi)發(fā)的人形機(jī)器人Atlas代表未來(lái)。spot機(jī)器人和物流機(jī)器人stretch則分別代表今天、明天。
“人形機(jī)器人Atlas,我們管它叫未來(lái)機(jī)器人,因?yàn)槟壳八€算不上真正意義的機(jī)器人,”馬克·雷伯特說(shuō)。
Atlas機(jī)器人有一個(gè)機(jī)載的計(jì)算機(jī),還附有電池,四肢上大概有28個(gè)不同的傳感器或者一個(gè)視覺(jué)系統(tǒng),可以幫助它看到前方的地形。馬克·雷伯特透露,最近他們正在研究Atlas的移動(dòng)操控能力。
馬克·雷伯特認(rèn)為,硬件工程,對(duì)于未來(lái)的機(jī)器人技術(shù)非常重要,它和軟件同等重要。“有人認(rèn)為,軟件可以克服硬件上的所有問(wèn)題和限制,但我個(gè)人并不贊同。我認(rèn)為,只有最好的硬件設(shè)計(jì)師和軟件設(shè)計(jì)師傾力合作,才能夠設(shè)計(jì)出世界上最好的機(jī)器人?!?/span>
除了運(yùn)動(dòng)智能,認(rèn)知智能也同等重要。馬克·雷伯特表示,他們創(chuàng)立了一個(gè)新的機(jī)構(gòu)叫人工智能研究院,在現(xiàn)代集團(tuán)的支持下,該院致力于具有運(yùn)動(dòng)智能和認(rèn)知智能的智慧機(jī)器人。
丹尼斯·洪則講述了“ARTEMIS”人形機(jī)器人研發(fā)過(guò)程的波折。它花了團(tuán)隊(duì)6年時(shí)間研發(fā)出來(lái)。2018年,它僅僅是停留在紙面上的一個(gè)簡(jiǎn)單草圖。2019年,眾籌到12萬(wàn)美金開(kāi)始啟動(dòng)。2020年疫情來(lái)襲,項(xiàng)目剛起步,實(shí)驗(yàn)室卻被迫關(guān)閉。“但是我們沒(méi)有就此止步,在家里繼續(xù)研究,在寢室、臥室里,開(kāi)著線上會(huì)議……”丹尼斯·洪回憶稱(chēng)。
丹尼斯·洪進(jìn)一步回憶說(shuō),“2021年1月,動(dòng)態(tài)評(píng)估期;2月,第一次讓它站起來(lái),好像不太成功;3月,第一次開(kāi)始讓它做平衡工作,做推、拉,讓它地面開(kāi)始震顫,進(jìn)行站穩(wěn)、平衡等各種實(shí)驗(yàn)……2022年10月,它第一次穩(wěn)定地走路,這是一個(gè)非常重大的成功;12月,第一次出現(xiàn)嚴(yán)重的故障,這對(duì)于通過(guò)力控制的機(jī)器人,如果有問(wèn)題就會(huì)失去平衡,幾乎是自我摧毀,當(dāng)時(shí)給我們很大的打擊,后續(xù)給樣機(jī)修理,花了很長(zhǎng)時(shí)間?!?/span>
今年3月,“ARTEMIS”人形機(jī)器人正式發(fā)布,其特點(diǎn)就是,在極度的踢打測(cè)試中仍能保持平穩(wěn),奔跑速度達(dá)到2.1米/秒。它可以踢足球,還參加了2023年機(jī)器人世界杯足球賽。丹尼斯·洪說(shuō),比賽結(jié)束后,他發(fā)現(xiàn)比爾·蓋茨關(guān)注了他。
03
突進(jìn)與阻力的較量
近年來(lái),出現(xiàn)眾多知名廠商被迫放棄,或暫停多年研發(fā)成果的現(xiàn)象。比如,去年3月,本田Asimo正式宣布退役,其經(jīng)歷14年的技術(shù)攻關(guān)后才誕生,之后的命運(yùn)卻是,誕生12年、經(jīng)歷七次迭代,最終結(jié)束生命周期。那之前,軟銀Pepper機(jī)器人于2021年已經(jīng)停產(chǎn),只存活了6年。
究其原因,“先烈們”折在了兩點(diǎn)上,一個(gè)是功能未達(dá)客戶(hù)可以買(mǎi)單的要求,二則是成本過(guò)高。
早年間,最基本的一體化關(guān)節(jié),都要成立專(zhuān)門(mén)的公司,但近年來(lái),智能制造以及工業(yè)機(jī)器人的長(zhǎng)足發(fā)展,使得上下游產(chǎn)業(yè)鏈極大拉通,用產(chǎn)量來(lái)降低成本,正在照進(jìn)現(xiàn)實(shí)。
除此之外,ChatGPT引發(fā)的生成式AI熱潮,也為其打開(kāi)了一扇新大門(mén)。
王興興是新進(jìn)者,他看到,現(xiàn)有大模型技術(shù)可以直接拿來(lái)用,或移植,或裁剪,對(duì)于人形機(jī)器人來(lái)說(shuō),只要一個(gè)小模型或中等模型,就足夠了。
日本大阪大學(xué)教授Hiroshi Ishiguro,對(duì)未來(lái)的一個(gè)暢想是,人類(lèi)會(huì)使用各種不同的機(jī)器人以及替身,幫助展開(kāi)各種活動(dòng)。這意味著,人類(lèi)想要發(fā)展人類(lèi)與機(jī)器人共生的社會(huì),而不是發(fā)展僅僅由機(jī)器人支持的社會(huì)。
啟動(dòng)交互式機(jī)器人項(xiàng)目20多年來(lái),Hiroshi Ishiguro制造了許多的機(jī)器人、類(lèi)人機(jī)器人、替身以及計(jì)算機(jī)圖形替身。
Hiroshi Ishiguro的感受是,得益于大語(yǔ)言模型的問(wèn)世,他們可以重點(diǎn)研究機(jī)器人更高層次的語(yǔ)言認(rèn)知的功能。
他進(jìn)一步稱(chēng),通過(guò)融合大型語(yǔ)言模型與面部表情、手勢(shì)等機(jī)器人的技術(shù),他們可以研究許多模態(tài)的集成和多模態(tài)的表達(dá),然后可以將意圖或者欲望,賦予機(jī)器人或類(lèi)人機(jī)器人。
“我認(rèn)為,意識(shí)是未來(lái)10年當(dāng)中,最重要的問(wèn)題之一,”Hiroshi Ishiguro說(shuō)。
黃曉慶認(rèn)為,機(jī)器人是人類(lèi)的第三臺(tái)計(jì)算機(jī),未來(lái)機(jī)器人的編程和安卓手機(jī)、windows PC的編程沒(méi)有本質(zhì)區(qū)別。“ChatGPT的出現(xiàn)、5G的發(fā)展,開(kāi)啟了一個(gè)用人工智能和云端機(jī)器人技術(shù),來(lái)解放生產(chǎn)力的時(shí)代,這是一次非常重要的工業(yè)革命?!?/span>
突進(jìn)之下,阻力也顯而易見(jiàn)。
黃曉慶看到,目前大模型缺乏機(jī)器人數(shù)據(jù),沒(méi)有足夠多的行為數(shù)據(jù),就沒(méi)辦法支持機(jī)器人的控制。需要把更多行為數(shù)據(jù)融進(jìn)去,進(jìn)行二次訓(xùn)練,等機(jī)器人有了行為能力、空間能力,就可以進(jìn)一步加快多模態(tài)大模型,可以叫它robot GPT。
“robot GPT是機(jī)器人的大腦?!秉S曉慶說(shuō)。
英國(guó)曼徹斯特大學(xué)終身教授、吉林大學(xué)唐敖慶講席教授任雷,二十多年來(lái),他同時(shí)在做兩件事,一是仿生機(jī)器人,二是人體科學(xué)。
任雷的深切感受是,目前仿人機(jī)器人跟人類(lèi)相比,在運(yùn)動(dòng)性上相差太遠(yuǎn),包括它的運(yùn)動(dòng)經(jīng)濟(jì)性、運(yùn)動(dòng)機(jī)敏性、運(yùn)動(dòng)多樣性、環(huán)境適應(yīng)性和運(yùn)動(dòng)的可塑性等等。
“現(xiàn)在我們把目光又轉(zhuǎn)向到了人體,人體是怎么設(shè)計(jì)的,能帶來(lái)哪些啟示,能不能有一條新的仿生的技術(shù),帶來(lái)新型的仿人機(jī)器人,這是我們團(tuán)隊(duì)目前在探索的?!比卫渍f(shuō)。
德國(guó)慕尼黑工業(yè)大學(xué)教授Alois C. Knoll認(rèn)為,人形機(jī)器人目前主要的障礙,在形態(tài)上?,F(xiàn)在做一個(gè)數(shù)據(jù)中心的計(jì)算機(jī)比較容易,但做一個(gè)機(jī)械臂,讓其能完全模仿人的手臂,就比較困難,所以讓機(jī)器人像人一樣行走,也比較困難。
另外,Alois C. Knoll說(shuō),能源供應(yīng)等問(wèn)題,也需要新技術(shù)突破。還有一個(gè)較為遙遠(yuǎn)的難題,即如何讓系統(tǒng)開(kāi)發(fā)出一個(gè)自己的智慧,比如有自己的感知或靈魂,這涉及倫理問(wèn)題。
王興興說(shuō),通用大模型本身,不是給通用機(jī)器人用的,其目前已把文本或文字邏輯處理好了,但它是靜態(tài)的,它對(duì)環(huán)境認(rèn)知和感知基本是零。沒(méi)辦法認(rèn)知物理環(huán)境,就沒(méi)法抓取,做一些操作。
王興興看到,谷歌對(duì)此事非常用心。十年來(lái)一直在做機(jī)器人AI相關(guān)的事情?!按蠹椰F(xiàn)在非常希望,給人形機(jī)器人或通用機(jī)器人,做一個(gè)專(zhuān)用的大模型出來(lái)?!?/span>
清華大學(xué)交叉信息研究院助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇認(rèn)為,當(dāng)前機(jī)器人技術(shù)在硬件和軟件等方面都取得了長(zhǎng)足的發(fā)展,但是仍然存在許多技術(shù)瓶頸。比如在硬件方面,機(jī)器人需要兼顧力量、速度、精度和成本等因素,但目前沒(méi)有一種技術(shù)能夠同時(shí)滿(mǎn)足這些要求。例如,液壓技術(shù)力量和速度強(qiáng),但成本高,而高減速比諧波電機(jī)技術(shù)雖然精度高但靈活性有限。因此,目前的解決方案是平衡各種技術(shù),根據(jù)不同的應(yīng)用場(chǎng)景選擇不同的技術(shù)路線。未來(lái),人們希望出現(xiàn)一種新技術(shù),能夠像人一樣兼顧所有因素。
陳建宇發(fā)現(xiàn),軟件也存在很大問(wèn)題,目前還無(wú)法很好兼顧其泛化性和控制的任務(wù)操作的精巧性,比如谷歌Robotic Transformer系列,可以做到很泛化,但是控制的精度比較低,控制頻率就很低,做任務(wù)基本在操作控制層面,做相對(duì)簡(jiǎn)單一些的任務(wù)。
陳建宇還看到,安全性的問(wèn)題。實(shí)驗(yàn)過(guò)程中出現(xiàn)的各種問(wèn)題,具備一定的可解釋性,但如果用大模型、神經(jīng)網(wǎng)絡(luò),很難解釋它會(huì)不會(huì)出現(xiàn)一個(gè)非常危險(xiǎn)的動(dòng)作?!坝肅hatGPT對(duì)話時(shí),它說(shuō)錯(cuò)一些字詞,關(guān)系不大。但是作為一個(gè)機(jī)器人,進(jìn)入我們生活中時(shí),這個(gè)就至關(guān)重要,這些都亟待新技術(shù)去改進(jìn)?!?/span>
Alois C. Knoll也“潑出一瓢冷水”稱(chēng),人形機(jī)器人演變至今,已有百年之久,期間進(jìn)展非常緩慢,如今不能把標(biāo)準(zhǔn)設(shè)得太高,或把市場(chǎng)胃口吊得太高,創(chuàng)造出一個(gè)類(lèi)似于投機(jī)的氛圍來(lái),甚至變成一個(gè)泡沫?!斑@是一個(gè)難而又難的高端頂級(jí)研究,或許比通用性AI要慢,可能不會(huì)快速見(jiàn)到巨變?!?/span>
“人形機(jī)器人,還有許多山峰需要翻越,”Alois C. Knoll強(qiáng)調(diào)。
中國(guó)傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
產(chǎn)品新聞
更多>2025-04-30
性能躍升20%!維宏NK300CX Plus數(shù)控系統(tǒng)...
2025-04-11
rpi-image-gen:樹(shù)莓派軟件鏡像構(gòu)建的終...
2025-04-08
【產(chǎn)品解讀】全面提升精密制造檢測(cè)節(jié)拍...
2025-03-31
激光閃耀 智慧引領(lǐng) | WISE MASER 黑武士...
2025-03-20
推薦專(zhuān)題
更多>