OpenAI大模型上身機(jī)器人,原速演示炸場(chǎng)!

時(shí)間:2024-03-20

來(lái)源:網(wǎng)易科技

導(dǎo)語(yǔ):簡(jiǎn)單動(dòng)作如抓起塑料袋(抓哪里都可以),機(jī)器人基于已學(xué)習(xí)的視覺(jué)-動(dòng)作執(zhí)行策略,可以做出一些“下意識(shí)”的快速反應(yīng)行動(dòng)。

  OpenAI大模型加持的機(jī)器人,深夜來(lái)襲!

  名曰Figure 01,它能聽(tīng)會(huì)說(shuō),動(dòng)作靈活。

  能和人類描述眼前看到的一切:

  我在桌子上看到了一個(gè)紅色的蘋果,瀝水架上面還有幾個(gè)盤子和一個(gè)杯子;然后你站在附近,手放在桌子上。

  聽(tīng)到人類說(shuō)“想吃東西”,就馬上遞過(guò)去蘋果。

  而且對(duì)于自己做的事有清楚認(rèn)知,給蘋果是因?yàn)檫@是桌上唯一能吃的東西。

  還順便把東西整理,能同時(shí)搞定兩種任務(wù)。

  最關(guān)鍵的是,這些展示都沒(méi)有加速,機(jī)器人本來(lái)的動(dòng)作就這么迅速。

  接下來(lái),我們繼續(xù)來(lái)看下Figure 01的細(xì)節(jié)。

  OpenAI視覺(jué)語(yǔ)言大模型加持

  根據(jù)創(chuàng)始人的介紹,F(xiàn)igure 01通過(guò)端到端神經(jīng)網(wǎng)絡(luò),可以和人類自如對(duì)話。

  基于OpenAI提供的視覺(jué)理解和語(yǔ)言理解能力,它能完成快速、簡(jiǎn)單、靈巧的動(dòng)作。

  模型只說(shuō)是一個(gè)視覺(jué)語(yǔ)言大模型,是否為GPT-4V不得而知。

  它還能規(guī)劃動(dòng)作、有短期記憶能力、用語(yǔ)言解釋它的推理過(guò)程。

  如對(duì)話里說(shuō)“你能把它們放在那里嗎?”

  “它們”、“那里”這種模糊表述的理解,就體現(xiàn)了機(jī)器人的短期記憶能力。

  它使用了OpenAI訓(xùn)練的視覺(jué)語(yǔ)言模型,機(jī)器人攝像頭會(huì)以10Hz拍下畫(huà)面,然后神經(jīng)網(wǎng)絡(luò)將以200Hz輸出24自由度動(dòng)作(手腕+手指關(guān)節(jié)角度)。

  具體分工上,機(jī)器人的策略也很像人類。

  復(fù)雜動(dòng)作交給AI大模型,預(yù)訓(xùn)練模型會(huì)對(duì)圖像和文本進(jìn)行常識(shí)推理,給出動(dòng)作計(jì)劃;

  簡(jiǎn)單動(dòng)作如抓起塑料袋(抓哪里都可以),機(jī)器人基于已學(xué)習(xí)的視覺(jué)-動(dòng)作執(zhí)行策略,可以做出一些“下意識(shí)”的快速反應(yīng)行動(dòng)。

  同時(shí)全身控制器會(huì)負(fù)責(zé)保持機(jī)身平衡、運(yùn)動(dòng)穩(wěn)定。

  除了最先進(jìn)的AI模型,F(xiàn)igure 01背后公司——Figure的創(chuàng)始人兼CEO還在推文中提到,F(xiàn)igure方面整合了機(jī)器人的所有關(guān)鍵組成。

  包括電機(jī)、中間件操作系統(tǒng)、傳感器、機(jī)械結(jié)構(gòu)等,均由Figure工程師設(shè)計(jì)。

  據(jù)了解,這家機(jī)器人初創(chuàng)公司在2周前才正式宣布和OpenAI的合作,但才13天后就帶來(lái)如此重磅成果。不少人都開(kāi)始期待后續(xù)合作了。

  由此,具身智能領(lǐng)域又有一顆新星走到了聚光燈下。

  “將人形機(jī)器人帶進(jìn)生活”

  說(shuō)到Figure,這家公司創(chuàng)立于2022年,正如前文所言,再次引爆外界關(guān)注,就在十幾天前——

  官宣在新一輪融資中籌集6.75億美元,估值沖到26億美元,投資方幾乎要集齊半個(gè)硅谷,包括微軟、OpenAI、英偉達(dá)和亞馬遜創(chuàng)始人貝佐斯等等。

  更重要的是,OpenAI同時(shí)公開(kāi)了與Figure更進(jìn)一步合作的計(jì)劃:將多模態(tài)大模型的能力擴(kuò)展到機(jī)器人的感知、推理和交互上,“開(kāi)發(fā)能夠取代人類進(jìn)行體力勞動(dòng)的人形機(jī)器人”。

  用現(xiàn)在最熱的科技詞匯來(lái)說(shuō),就是要一起搞具身智能。


中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0