【ZiDongHua之創(chuàng)新自化成收錄關(guān)鍵詞:人形機(jī)器人 人工智能 機(jī)器人
 
  開源智匯|OpenLoong:開源人形機(jī)器人的挑戰(zhàn)與革命
 
  前言:人形機(jī)器人因其與人類相似的外形和動(dòng)作,被視為未來機(jī)器人技術(shù)發(fā)展的重要方向。它們在工業(yè)、救援和家庭服務(wù)等領(lǐng)域有著廣泛的應(yīng)用前景。同時(shí),人形機(jī)器人發(fā)展面臨運(yùn)動(dòng)控制、環(huán)境感知、人工智能和人機(jī)交互等眾多技術(shù)挑戰(zhàn)。開源作為一種創(chuàng)新模式,匯聚全球開發(fā)者智慧,共同解決技術(shù)問題,加速人形機(jī)器人技術(shù)的發(fā)展和應(yīng)用。
 
  在2024年12月20日的開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)開幕式上,國家地方共建人形機(jī)器人創(chuàng)新中心的首席科學(xué)家江磊發(fā)表了題為《OpenLoong:開源人形機(jī)器人的挑戰(zhàn)與革命》的主題演講,闡述了人形機(jī)器人行業(yè)的發(fā)展前景與挑戰(zhàn),提出通過開源推動(dòng)機(jī)器人行業(yè)發(fā)展的思路,在OpenLoong開源平臺(tái),隨著技術(shù)的持續(xù)進(jìn)步和全球開發(fā)者的合作,將引發(fā)人形機(jī)器人技術(shù)的革命性變革。
 
 
  下面是對江磊先生演講的整理:
 
  “國家地方共建人形機(jī)器人創(chuàng)新中心是開源領(lǐng)域的新成員。這次來到開放原子大會(huì)抱著一腔熱血走開源,希望能在開放原子基金會(huì)指導(dǎo)下穩(wěn)步前進(jìn)。恰逢龍年,國地中心也啟動(dòng)了我國首個(gè)人形機(jī)器人的開源生態(tài)項(xiàng)目“OepnLoong”。這一舉措不僅標(biāo)志著人形機(jī)器人在開源領(lǐng)域的新起點(diǎn),也預(yù)示著我們將在這個(gè)領(lǐng)域中發(fā)揮重要作用,為開源社區(qū)貢獻(xiàn)自己的力量。”
 
  1、為什么要開源?
 
  人形機(jī)器人領(lǐng)域今年異常火熱,國地中心團(tuán)隊(duì)兩年前便開始探索其發(fā)展。2022年世界機(jī)器人大會(huì)上僅有3款人形機(jī)器人參展,2023年增至10款,今年已達(dá)27款,且更多在開發(fā)中。截至2024年11月18日,人形機(jī)器人領(lǐng)域發(fā)生了49起融資,最大單筆近10億元,總?cè)谫Y超80億元。我國人形機(jī)器人整機(jī)公司從年初的31家增至80家,全球超過200家。整合這些力量,一方面需要政府支持和資本投入,同時(shí),開源也是把大家聚集在一起的非常好的方式,匯聚技術(shù)社區(qū)智慧,共同推動(dòng)創(chuàng)新和進(jìn)步。
 
  人形機(jī)器人概念源自百年前,科技進(jìn)步使其從概念走向現(xiàn)實(shí),它們的發(fā)展歷史見證了人類對于機(jī)械工程、電子技術(shù)、計(jì)算機(jī)科學(xué)以及人工智能等多個(gè)領(lǐng)域的探索和突破。
 
  在人形機(jī)器人的發(fā)展中,我們要關(guān)注阿西莫和特斯拉兩條路徑。阿西莫路徑主要側(cè)重于機(jī)器人只是一個(gè)硬件平臺(tái),強(qiáng)調(diào)機(jī)器人的機(jī)械工程和運(yùn)動(dòng)能力。而特斯拉路徑則是將人形機(jī)器人的發(fā)展與具身智能相結(jié)合,強(qiáng)調(diào)AI基礎(chǔ)設(shè)施的支持,如智算中心、數(shù)據(jù)中心和云服務(wù)平臺(tái)。所以新一代人形機(jī)器人是機(jī)器人+具身智能+AI基礎(chǔ)設(shè)施的聯(lián)合體。這引出三個(gè)發(fā)展問題:低成本、數(shù)據(jù)集、大投入,尤其后面兩個(gè)問題。開源開放是構(gòu)建數(shù)據(jù)集的有效方式,而AI基礎(chǔ)設(shè)施的投入則考驗(yàn)生態(tài)組織能力。
 
  開源開放成為推動(dòng)機(jī)器人技術(shù)和人工智能交叉融合的重要技術(shù)。過去十年我國一直在奮起直追,但在機(jī)器人界的ROS和Hugging Face等開源社區(qū)都源自美國。開放原子開源基金會(huì)支持下,國地中心希望建立國內(nèi)人形機(jī)器人開源社區(qū),OpenLoong開源社區(qū)希望打造屬于我們自己的通用人形機(jī)器人開源開放生態(tài),期待大家參與共建。
 
  我國人形機(jī)器人面臨“一高五難”問題,硬件門檻高、軟件算法難、軟硬解耦難、知識(shí)積累難、人才聚集難、安全應(yīng)用難。國家地方共建人形機(jī)器人創(chuàng)新中心應(yīng)運(yùn)而生,今年5月17日,在工信部的指導(dǎo)下,金壯龍部長授牌并要求國地中心聚焦共性技術(shù)、開源,加速創(chuàng)新中心建設(shè)。
 
 
  2、OpenLoong是什么?
 
  國家地方共建人形機(jī)器人創(chuàng)新中心在今年的世界人工智能大會(huì)上公布了世界首款青龍開源通用人形機(jī)器人公版機(jī),這個(gè)公版機(jī)有幾大技術(shù),正在逐步開源到OpenLoong開源網(wǎng)站上。
 
 
  第一部分就是硬件公版機(jī),目前1.85米高,80公斤重,有很多領(lǐng)導(dǎo)到過創(chuàng)新中心,也歡迎大家來現(xiàn)場體驗(yàn)公版機(jī)。
 
  國地中心團(tuán)隊(duì)在今年的世界人工智能大會(huì)上聯(lián)合“書生”大模型跟訊飛星火大模型,首次推出了能用大模型驅(qū)動(dòng)人形機(jī)器人的軟件框架。這其實(shí)不是一件容易的事,國地中心三個(gè)團(tuán)隊(duì)經(jīng)過數(shù)月努力才完成。這個(gè)框架不僅實(shí)現(xiàn)了大模型驅(qū)動(dòng),更重要的是首次成功跑通了全尺寸人形機(jī)器人的數(shù)據(jù)格式,搞清楚這個(gè)東西如何去存儲(chǔ)數(shù)據(jù),未來可以成為一個(gè)標(biāo)準(zhǔn)。
 
  第二個(gè),人們好奇行走是否算智能?大家知道語言和雙手操作是人工智能,行走同樣是一個(gè)人工智能神經(jīng)網(wǎng)絡(luò),需要用一個(gè)機(jī)器小腦神經(jīng)網(wǎng)絡(luò)來驅(qū)動(dòng)。明年,基礎(chǔ)通用模型或許能讓機(jī)器人自主探索世界。
 
  第三個(gè)就是全身動(dòng)力學(xué)的控制軟件包,這個(gè)正在經(jīng)過開放原子開源基金會(huì)的答辯,目前已經(jīng)有1200個(gè)開發(fā)者用到這個(gè)開放包,同時(shí),URDF文件已公開,在B站上很多人已經(jīng)做青龍的二次開發(fā)。
 
  還有一個(gè),是希望把數(shù)據(jù)集開源,前面雖然用分層架構(gòu)完成,但這個(gè)數(shù)據(jù)集的標(biāo)準(zhǔn)很關(guān)鍵。為什么青龍涉及到43個(gè)自由度?因?yàn)閿?shù)據(jù)維度越高,未來可以降維使用,但數(shù)據(jù)維度如果不夠,它可能未來指導(dǎo)性就會(huì)差,所以采用了最高維度的。
 
  對于開源計(jì)劃,計(jì)劃每年發(fā)布一個(gè)新版本,就像之前的機(jī)器人操作系統(tǒng)ROS一樣。在這里,做幾個(gè)關(guān)于機(jī)器人研究及開源的預(yù)告,首先,我們已經(jīng)發(fā)布直線缸版本,2025年將要推出旋轉(zhuǎn)+直線青龍2.0版本。參考ROS用英文字母代表了他們文化,我們是以十二生肖作為每年版本的代號(hào),敬請期待。
 
  第二個(gè),將會(huì)開源10km/h的高速步態(tài),希望把這個(gè)步態(tài)開源到網(wǎng)站上,助力研究者提升機(jī)器人行走能力。
 
  第三個(gè),國地中心組建了“白虎”開源數(shù)據(jù)聯(lián)盟,希望在三年內(nèi)完成1PB+數(shù)據(jù)集的建設(shè),預(yù)計(jì)明年中期率先用500萬條的真實(shí)數(shù)據(jù)訓(xùn)推一個(gè)大模型。
 
  最后,國地中心在年底會(huì)建成容納100個(gè)機(jī)器人的訓(xùn)練場,匯聚國內(nèi)10余家人形機(jī)器人公司產(chǎn)品,通過異構(gòu)機(jī)器人訓(xùn)練強(qiáng)化人工智能。我們認(rèn)為,只有多樣化的機(jī)器人訓(xùn)練,人工智能才能更健壯。
 
  3、挑戰(zhàn)與展望
 
  “通用人形機(jī)器人”是一個(gè)非常復(fù)雜的技術(shù),沒有一個(gè)集體能夠獨(dú)善其身,所以一定要聯(lián)合起來。特斯拉構(gòu)建了閉環(huán)生態(tài),被比作人形機(jī)器人界的iOS;Figure01則像安卓。我們也期待我國鴻蒙的人形機(jī)器人底座能不能開始?
 
  國地中心從一開始就致力于開源人形機(jī)器人產(chǎn)業(yè),原因有二:一是開源促進(jìn)知識(shí)自由流通和協(xié)作創(chuàng)新,發(fā)揮集體智慧;二是人形機(jī)器人作為人工智能在物理世界的載體,其安全性應(yīng)通過開源公開,讓更多正能量的人共同來開發(fā)人形機(jī)器人技術(shù),這項(xiàng)技術(shù)才是足夠健壯與開源的,同時(shí)也是人形機(jī)器人做倫理治理的一個(gè)最重要的抓手。
 
  最后,希望大家了解一下OpenLoong開源社區(qū),包括了硬件、操作系統(tǒng)、動(dòng)力學(xué)跟數(shù)據(jù)集的開源資料,希望大家注冊網(wǎng)站并且在網(wǎng)站上多多交流。
 
  「READING」
 
  OpenLoong開源社區(qū)介紹
 
  “OpenLoong”是全球領(lǐng)先的、綜合性的人形機(jī)器人開源社區(qū),社區(qū)秉持著技術(shù)驅(qū)動(dòng)和開放透明的價(jià)值觀,致力于匯聚全球開發(fā)者,共同推動(dòng)人形機(jī)器人產(chǎn)業(yè)的發(fā)展,為全球人形機(jī)器人產(chǎn)業(yè)賦能。
 
  我們的使命是通過在機(jī)器人本體技術(shù)、平臺(tái)軟件、具身智能、具身數(shù)據(jù)集以及上層應(yīng)用等多個(gè)方面做出重大貢獻(xiàn),從而推動(dòng)整個(gè)產(chǎn)業(yè)的進(jìn)步。
 
  探索人形機(jī)器人技術(shù),共享創(chuàng)新成果。在這里,我們不僅分享最新的機(jī)器人技術(shù)動(dòng)態(tài),還有深度的行業(yè)分析和精彩的社區(qū)活動(dòng)。歡迎關(guān)注OpenLoong開源社區(qū)公眾號(hào),一起見證開源的力量!
 
  留言互動(dòng):歡迎在文章下方評論、分享、轉(zhuǎn)發(fā),讓我們共同營造開放且有趣的社區(qū)氛圍!
 
  投稿邀請:如果你有關(guān)于人形機(jī)器人技術(shù)、應(yīng)用、行業(yè)見解等方面的獨(dú)到思考或精彩故事,歡迎向我們投稿,一起豐富人形機(jī)器人相關(guān)內(nèi)容~