【ZiDongHua之“動(dòng)感惠民生”收錄關(guān)鍵詞:人形機(jī)器人 機(jī)器視覺(jué) 智能大模型】
 
  上海人民廣播電臺(tái)︱眾“人”拾柴!具身智能突圍升級(jí)的“上海模式”
 
  來(lái)源:上海人民廣播電臺(tái)
 
  作者:趙宏輝
 
  發(fā)布日期:2025年2月20日
 
  上春晚扭秧歌、實(shí)驗(yàn)室里學(xué)街舞、進(jìn)廠擰螺絲……人形機(jī)器人近期頻頻占據(jù)C位。
 
  以前,不同廠商的產(chǎn)品,總是各自修煉。眼下在上海張江的一所“人形機(jī)器人學(xué)校”,100多臺(tái)來(lái)自不同廠商的人形機(jī)器人在一起開(kāi)展集訓(xùn)。作為國(guó)內(nèi)該領(lǐng)域首個(gè)開(kāi)源共創(chuàng)平臺(tái),這里匯聚行業(yè)合力,推動(dòng)人形機(jī)器人加速進(jìn)化。
 
 
  “這里是智元的機(jī)器人,這是樂(lè)聚的,樓上有傅利葉的——各家的機(jī)器人都在這里。”
 
  位于張江模力社區(qū)里的這座訓(xùn)練場(chǎng),是眼下國(guó)內(nèi)人形機(jī)器人種類最多的地方。踢足球、擦桌子、搬運(yùn)、裝配、檢測(cè)……樣貌各異的“硅基打工人”忙得不亦樂(lè)乎。
 
  國(guó)家地方共建人形機(jī)器人創(chuàng)新中心市場(chǎng)體系總監(jiān)楊正葉說(shuō),相比傳統(tǒng)的工業(yè)機(jī)器人,人形機(jī)器人最大的進(jìn)步不是外形更像人,而在于它們的工作方式更智能、更柔性。
 
  “比如一個(gè)器件在流水線上檢測(cè),傳統(tǒng)工業(yè)機(jī)器人更多基于機(jī)器視覺(jué)來(lái)識(shí)別;而人形機(jī)器人是用大模型來(lái)判斷推理。如果送來(lái)一個(gè)返修品,狀態(tài)改變了,我們就希望它跟人一樣,能識(shí)別出這里凹陷了一塊,那就意味著這臺(tái)機(jī)器人就具有柔性了。”楊正葉說(shuō)。
 
 
  不同于傳統(tǒng)機(jī)器人只專攻一項(xiàng)技能,具備通用智能的人形機(jī)器人能勝任多種任務(wù)。為此,訓(xùn)練場(chǎng)也匹配了多種訓(xùn)練方式。
 
  記者看到,有訓(xùn)練師頭戴VR眼鏡、身穿動(dòng)作捕捉服,“手把手”地指導(dǎo)機(jī)器人完成規(guī)定動(dòng)作;也有提前寫(xiě)好算法,讓機(jī)器人獨(dú)立完成動(dòng)作,訓(xùn)練師在一旁監(jiān)督。每完成一遍動(dòng)作,便記錄下一條數(shù)據(jù),而單臺(tái)機(jī)器人每天就能采集500條數(shù)據(jù)。
 
  “每一遍動(dòng)作看似是重復(fù)的,但實(shí)際上每一條數(shù)據(jù)的關(guān)鍵參數(shù)、整個(gè)行程都是不一樣的。模型會(huì)不斷強(qiáng)化學(xué)習(xí)、不斷修正自己。我們認(rèn)為,一個(gè)動(dòng)作有5萬(wàn)小時(shí)的數(shù)據(jù),它就具備通用性了。”楊正葉說(shuō)。
 
  在這個(gè)面積約5000平米的訓(xùn)練場(chǎng)里,有100多臺(tái)機(jī)器人在同步進(jìn)行不同場(chǎng)景、不同工種的訓(xùn)練。楊正葉說(shuō),此前機(jī)器人公司各自閉門苦修,訓(xùn)練模型的數(shù)據(jù)規(guī)模有限。送來(lái)“上學(xué)”、同臺(tái)競(jìng)技之后,能源源不斷產(chǎn)生數(shù)據(jù);通過(guò)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),還能實(shí)現(xiàn)跨平臺(tái)共享。所以,廠商的主動(dòng)性普遍很高。
 
  “以后會(huì)形成一個(gè)數(shù)據(jù)交易的平臺(tái)。比如有的廠商有家電場(chǎng)景的數(shù)據(jù),別的廠商有臨床康養(yǎng)的數(shù)據(jù),雙方采集的數(shù)據(jù)進(jìn)行交換,就能減少重復(fù)投入,效率就大大提升。”楊正葉說(shuō)。
 
  這些異構(gòu)機(jī)器人的訓(xùn)練數(shù)據(jù),還會(huì)同時(shí)“喂料”形成一個(gè)通用的具身智能大模型。國(guó)地中心首席科學(xué)家江磊說(shuō),未來(lái)在這個(gè)“超級(jí)大腦”的指揮下,不同廠商、不同形態(tài)的機(jī)器人能夠高效協(xié)作、共同升級(jí)。
 
  “這個(gè)‘超級(jí)大腦’不是解決某一個(gè)機(jī)器人的問(wèn)題,是同時(shí)解決所有機(jī)器人操作、行走、訓(xùn)練的這些智能化問(wèn)題,也就是我們所設(shè)想的‘一腦多形’。”江磊說(shuō)。
 
  預(yù)計(jì)今年,訓(xùn)練場(chǎng)有望沉淀下1000萬(wàn)條數(shù)據(jù)。部分訓(xùn)練數(shù)據(jù)集將通過(guò)國(guó)地中心的OpenLoong開(kāi)源社區(qū)開(kāi)放共享,邀請(qǐng)人形機(jī)器人整機(jī)企業(yè)、具身智能研發(fā)團(tuán)隊(duì)以及科研院所等持續(xù)完善,共同突破數(shù)據(jù)瓶頸。
 
  “我們會(huì)采用基金會(huì)的方式,滿足世界上各種開(kāi)源的標(biāo)準(zhǔn),實(shí)現(xiàn)數(shù)據(jù)的匯聚、互聯(lián)互通,才能確保這個(gè)數(shù)據(jù)集足夠大。這個(gè)模式應(yīng)當(dāng)說(shuō)是上海首創(chuàng)。”江磊說(shuō)。
 
  去年,我國(guó)人形機(jī)器人已形成27.6億元產(chǎn)值,今年有望直接翻番,到2030年將突破千億元。站在爆發(fā)前夜,是單打獨(dú)斗還是協(xié)同創(chuàng)新,行業(yè)已經(jīng)給出答案。