【ZiDongHua 之“自動(dòng)化學(xué)院派”收錄關(guān)鍵詞:哈爾濱工業(yè)大學(xué)   自主智能系統(tǒng)  人工智能  機(jī)器學(xué)習(xí)  智能自動(dòng)化 】

觀點(diǎn) | 北京加速布局具身智能產(chǎn)業(yè) 引領(lǐng)全國(guó)具身智能高質(zhì)量發(fā)展

具身智能將人工智能與人形機(jī)器人、四足機(jī)器人等物理實(shí)體深度融合,使其不僅具備數(shù)據(jù)處理和決策能力,還能通過(guò)感知、運(yùn)動(dòng)與真實(shí)環(huán)境交互,實(shí)現(xiàn)自主學(xué)習(xí)和適應(yīng)性行為。與傳統(tǒng)的人工智能軟件不同,具身智能強(qiáng)調(diào)“身體”與“智能”的結(jié)合,通過(guò)“感知—決策—行動(dòng)一反饋”的閉環(huán)適應(yīng)復(fù)雜現(xiàn)實(shí)場(chǎng)景。2025年政府工作報(bào)告提出“培育生物制造、量子科技、具身智能、6G等未來(lái)產(chǎn)業(yè)。大力發(fā)展智能網(wǎng)聯(lián)新能源汽車、人工智能手機(jī)和電腦、智能機(jī)器人等新一代智能終端以及智能制造裝備”。這標(biāo)志著發(fā)展具身智能產(chǎn)業(yè)正式上升為國(guó)家戰(zhàn)略。北京作為全國(guó)科技創(chuàng)新中心,在具身智能領(lǐng)域儲(chǔ)備了良好的發(fā)展基礎(chǔ),正在引領(lǐng)全國(guó)具身智能高質(zhì)量發(fā)展,著力打造全球具身智能產(chǎn)業(yè)高地。

具身智能技術(shù)實(shí)現(xiàn)新突破

近年來(lái),北京市的具身智能產(chǎn)業(yè)加速產(chǎn)學(xué)研聯(lián)動(dòng),匯聚創(chuàng)新合力,集聚了北京智源人工智能研究院、國(guó)家地方共建具身智能機(jī)器人創(chuàng)新中心(以下簡(jiǎn)稱創(chuàng)新中心)等一批新型研發(fā)機(jī)構(gòu),人工智能創(chuàng)新指數(shù)排名全國(guó)第一、全球第二。

北京擁有全國(guó)最多的國(guó)家級(jí)人工智能科研平臺(tái)及頂尖科研人才。北京大學(xué)、清華大學(xué)、北京理工大學(xué)、中國(guó)科學(xué)院等高校、科研院所積極投身具身智能基礎(chǔ)研究與關(guān)鍵技術(shù)攻關(guān),為產(chǎn)業(yè)發(fā)展源源不斷地輸送創(chuàng)新理論與前沿技術(shù)。相關(guān)研發(fā)機(jī)構(gòu)在情感智能、工業(yè)機(jī)器人、電子皮膚、電子芯片等前沿領(lǐng)域持續(xù)創(chuàng)新。

北京人形機(jī)器人創(chuàng)新中心有限公司、北京優(yōu)必選科技有限公司、北京理工華匯智能科技有限公司、北京銀河通用機(jī)器人有限公司等人形機(jī)器人企業(yè),積極與高校、科研院所開(kāi)展合作,通過(guò)共建研發(fā)平臺(tái)、聯(lián)合承擔(dān)科研項(xiàng)目、人才聯(lián)合培養(yǎng)等多元模式,加速科技成果轉(zhuǎn)化,推動(dòng)具身智能技術(shù)從實(shí)驗(yàn)室走向市場(chǎng),實(shí)現(xiàn)產(chǎn)業(yè)化應(yīng)用。目前,數(shù)百家具身智能企業(yè)已在北京的多個(gè)園區(qū)顯現(xiàn)出集群效應(yīng),在具身智能產(chǎn)業(yè)的人形化、人性化、應(yīng)用化等方面取得重要突破,形成了以“大腦、小腦、本體”為核心的具身智能全產(chǎn)業(yè)鏈條。

在聚焦具身智能“認(rèn)知—執(zhí)行”雙模態(tài)架構(gòu)協(xié)同創(chuàng)新方面,具身“大腦”與“小腦”的深度耦合突破了技術(shù)瓶頸。具身“大腦”負(fù)責(zé)由AI大模型驅(qū)動(dòng)的任務(wù)規(guī)劃,能自然交互、感知空間、理解意圖、分層規(guī)劃和反思錯(cuò)誤,具備多本體兼容、多場(chǎng)景適應(yīng)和強(qiáng)大泛化能力。具身“小腦”負(fù)責(zé)協(xié)調(diào)數(shù)據(jù)驅(qū)動(dòng)的端到端技能執(zhí)行,操作子平臺(tái)執(zhí)行元技能庫(kù)、泛化抓取等功能,運(yùn)控子平臺(tái)負(fù)責(zé)全身控制、雙臂協(xié)作等任務(wù)。“大腦”規(guī)劃任務(wù),調(diào)用“小腦”技能庫(kù)執(zhí)行,控制肢體運(yùn)動(dòng),再反饋形成閉環(huán)。

2025年3月12日,創(chuàng)新中心發(fā)布全球首個(gè)“一腦多能”“一腦多機(jī)”的通用具身智能平臺(tái)“慧思開(kāi)物”,填補(bǔ)行業(yè)空白,為具身智能產(chǎn)業(yè)發(fā)展注入強(qiáng)大動(dòng)力。該平臺(tái)由AI大模型驅(qū)動(dòng)的具身“大腦”與數(shù)據(jù)驅(qū)動(dòng)的端到端技能執(zhí)行具身“小腦”協(xié)同構(gòu)成。配備“慧思開(kāi)物”平臺(tái)的人形機(jī)器人,能夠精準(zhǔn)解析自然語(yǔ)言指令,通過(guò)多模態(tài)信息融合與上下文理解,將復(fù)雜任務(wù)細(xì)化為可執(zhí)行的子任務(wù)序列,并在執(zhí)行過(guò)程中實(shí)時(shí)監(jiān)測(cè)狀態(tài),借助自適應(yīng)糾錯(cuò)與動(dòng)態(tài)路徑規(guī)劃,確保任務(wù)高效、準(zhǔn)確完成。

在具身智能的本體設(shè)計(jì)與研發(fā)領(lǐng)域,北京的創(chuàng)新主體已取得了顯著的技術(shù)突破與產(chǎn)業(yè)化進(jìn)展,形成從本體設(shè)計(jì)、運(yùn)動(dòng)控制到仿生交互的完整具身智能技術(shù)鏈條,為人工智能技術(shù)賦能物理世界提供了關(guān)鍵支撐。2024年8月,北京星動(dòng)紀(jì)元科技有限公司正式發(fā)布其首款面向商業(yè)化應(yīng)用的人形機(jī)器人產(chǎn)品星動(dòng)STAR1,該機(jī)器人身高171厘米、體重63千克,采用高集成度電驅(qū)系統(tǒng),可實(shí)現(xiàn)55個(gè)自由度的全域運(yùn)動(dòng)控制,其室外奔跑速度達(dá)3.6米/秒,刷新了電驅(qū)人形機(jī)器人運(yùn)動(dòng)性能的國(guó)際紀(jì)錄。該機(jī)器人配備12個(gè)主動(dòng)自由度全驅(qū)動(dòng)的靈巧手,具備單手4指20千克負(fù)載能力,通過(guò)強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)復(fù)雜操作泛化,可完成筷子夾取水餃、指尖操控骰子等高精度任務(wù),并依托高密度觸覺(jué)傳感陣列,實(shí)現(xiàn)毫米級(jí)力控精度,支持超百種工具化操作場(chǎng)景,為工業(yè)制造、醫(yī)療護(hù)理、家庭服務(wù)等垂直領(lǐng)域提供技術(shù)驗(yàn)證平臺(tái)。在運(yùn)動(dòng)控制基礎(chǔ)之上,北京清飛科技有限公司突破仿生交互技術(shù)瓶頸,基于機(jī)器人本體開(kāi)發(fā)出覆蓋全身的彈性體表皮系統(tǒng),通過(guò)多模態(tài)神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)面部42組仿生肌肉與表皮協(xié)同運(yùn)動(dòng),實(shí)現(xiàn)六大類基礎(chǔ)情緒的200余種動(dòng)態(tài)表情生成,其唇形與語(yǔ)音的同步精度達(dá)98%,支持中、英、韓等多語(yǔ)種跨模態(tài)表達(dá),為教育陪伴、服務(wù)咨詢等場(chǎng)景構(gòu)建了更具情感交互能力的具身智能終端。

具身智能生態(tài)日趨完善

政策構(gòu)筑北京具身智能的創(chuàng)新基石。2025年2月28日,市科委、中關(guān)村管委會(huì)、市發(fā)展改革委、市經(jīng)濟(jì)和信息化局聯(lián)合發(fā)布《北京具身智能科技創(chuàng)新與產(chǎn)業(yè)培育行動(dòng)計(jì)劃(2025-2027年)》(以下簡(jiǎn)稱《行動(dòng)計(jì)劃》),為北京具身智能的未來(lái)發(fā)展錨定清晰航向?!缎袆?dòng)計(jì)劃》劍指關(guān)鍵技術(shù)攻堅(jiān),計(jì)劃通過(guò)“揭榜掛帥”等創(chuàng)新機(jī)制,全力突破具身大腦模型、小腦技能庫(kù)、智能芯片等“卡脖子”技術(shù),全面提升具身機(jī)器人應(yīng)對(duì)復(fù)雜任務(wù)的能力,旨在打造具有國(guó)際影響力的具身智能產(chǎn)業(yè)生態(tài),推動(dòng)具身大腦與小腦模型、智能芯片、全身運(yùn)動(dòng)控制等上下游產(chǎn)業(yè)鏈基本實(shí)現(xiàn)國(guó)產(chǎn)化。

創(chuàng)新中心還將聯(lián)合高校、科研院所、集成商等具備人形機(jī)器人二次開(kāi)發(fā)能力的機(jī)構(gòu),共同打造具身智能開(kāi)源開(kāi)放社區(qū),重點(diǎn)推進(jìn)數(shù)據(jù)、模型、場(chǎng)景驗(yàn)證等研究,為具身智能機(jī)器人大模型訓(xùn)練提供數(shù)據(jù)支持,加速通用本體的關(guān)鍵共性技術(shù)突破,推動(dòng)具身智能機(jī)器人加速落地應(yīng)用。

通過(guò)技術(shù)開(kāi)源、數(shù)據(jù)共享、標(biāo)準(zhǔn)制定及產(chǎn)業(yè)協(xié)同,北京正在推進(jìn)構(gòu)建全球領(lǐng)先的具身智能開(kāi)放生態(tài)。2024年11月11日,創(chuàng)新中心發(fā)布“天工開(kāi)源計(jì)劃”,開(kāi)放通用機(jī)器人母平臺(tái)“天工”的軟件開(kāi)發(fā)文檔、結(jié)構(gòu)設(shè)計(jì)文檔,并計(jì)劃逐步開(kāi)源結(jié)構(gòu)圖紙、電氣系統(tǒng)、運(yùn)動(dòng)控制框架等核心資源。在數(shù)據(jù)集開(kāi)源方面,創(chuàng)新中心發(fā)布的首個(gè)標(biāo)準(zhǔn)化通用具身智能數(shù)據(jù)集(RoboMIND),適用于多平臺(tái)、多場(chǎng)景、多技能,經(jīng)多個(gè)模型驗(yàn)證有效,首批開(kāi)放高質(zhì)量具身智能數(shù)據(jù)10萬(wàn)條。在數(shù)據(jù)生態(tài)方面,創(chuàng)新中心數(shù)據(jù)采集涵蓋6類機(jī)器人本體7個(gè)典型場(chǎng)景,支持模型訓(xùn)練與泛化能力提升。同時(shí),創(chuàng)新中心牽頭編制了《腿式機(jī)器人性能及試驗(yàn)方法標(biāo)準(zhǔn)》《人工智能具身智能數(shù)據(jù)采集規(guī)范》,推動(dòng)了數(shù)據(jù)格式統(tǒng)一與行業(yè)規(guī)范化。

在2025中關(guān)村論壇年會(huì)“未來(lái)人工智能先鋒論壇”上,北京智源人工智能研究院發(fā)布了全球首個(gè)跨本體具身大小腦協(xié)作框架RoboOS及開(kāi)源具身大腦模型RoboBrain。該技術(shù)通過(guò)“大腦—小腦”分層架構(gòu)與共享記憶系統(tǒng),推動(dòng)單機(jī)智能邁向群體智能,為構(gòu)建具身智能開(kāi)源統(tǒng)一生態(tài)、加速場(chǎng)景應(yīng)用提供了底層技術(shù)支持,可應(yīng)用于服務(wù)機(jī)器人、工業(yè)自動(dòng)化、智慧物流、智能制造等領(lǐng)域,支撐復(fù)雜任務(wù)的多機(jī)協(xié)作需求。

目前,北京市具身智能正以蓬勃之勢(shì)向多領(lǐng)域持續(xù)拓展應(yīng)用,為各行業(yè)轉(zhuǎn)型升級(jí)與社會(huì)生活品質(zhì)提升注入強(qiáng)勁動(dòng)力。在工業(yè)制造領(lǐng)域,具身智能推進(jìn)提質(zhì)增效。在汽車制造領(lǐng)域,具身智能機(jī)器人已深度嵌入生產(chǎn)流程。具備精準(zhǔn)視覺(jué)識(shí)別與靈活機(jī)械臂操作能力的具身智能機(jī)器人,可承擔(dān)零部件裝配等任務(wù)。在醫(yī)療健康領(lǐng)域,北京已有多家三甲醫(yī)院引入手術(shù)輔助機(jī)器人,依據(jù)術(shù)前影像數(shù)據(jù),精準(zhǔn)規(guī)劃手術(shù)路徑,術(shù)中通過(guò)機(jī)械臂實(shí)現(xiàn)毫米級(jí)精準(zhǔn)操作,輔助醫(yī)生完成高難度手術(shù),降低手術(shù)創(chuàng)傷,提高手術(shù)成功率與患者康復(fù)速度。在教育科研領(lǐng)域,教學(xué)輔助機(jī)器人通過(guò)生動(dòng)有趣的互動(dòng)形式,激發(fā)學(xué)生學(xué)習(xí)興趣。在科學(xué)實(shí)驗(yàn)課程中,機(jī)器人能模擬復(fù)雜實(shí)驗(yàn)操作,展示實(shí)驗(yàn)現(xiàn)象,幫助學(xué)生理解抽象科學(xué)知識(shí)。此外,在家庭服務(wù)領(lǐng)域,陪伴型機(jī)器人能陪老年人聊天解悶、提醒按時(shí)服藥,為獨(dú)居老人提供情感關(guān)懷與生活照料。

 

具身智能產(chǎn)業(yè)發(fā)展的挑戰(zhàn)與趨勢(shì)

在具身智能產(chǎn)業(yè)快速發(fā)展的同時(shí),也面臨著數(shù)據(jù)獲取難題、模型能力仍待提升、標(biāo)準(zhǔn)與合規(guī)存在問(wèn)題等挑戰(zhàn)。

在數(shù)據(jù)獲取方面,目前高質(zhì)量機(jī)器人數(shù)據(jù)集缺失,收集真實(shí)世界的機(jī)器人數(shù)據(jù)耗時(shí)且昂貴,3D數(shù)據(jù)集建設(shè)也仍舊緩慢。行業(yè)中已經(jīng)出現(xiàn)不少開(kāi)源的機(jī)器人數(shù)據(jù)集,但數(shù)據(jù)質(zhì)量參差不齊,無(wú)法實(shí)現(xiàn)跨場(chǎng)景、跨任務(wù)應(yīng)用的通用機(jī)器人訓(xùn)練。

在模型能力方面,當(dāng)前的多模態(tài)大模型仍然處于快速發(fā)展中,語(yǔ)言、視覺(jué)、觸覺(jué)等多模態(tài)融合感知能力尚淺,無(wú)法支撐機(jī)器人在開(kāi)放場(chǎng)景中運(yùn)行,在復(fù)雜環(huán)境與長(zhǎng)周期的任務(wù)執(zhí)行能力不足?,F(xiàn)有的智能體與計(jì)算能力無(wú)法實(shí)現(xiàn)知識(shí)的有效轉(zhuǎn)移與泛化,任務(wù)規(guī)劃器無(wú)法實(shí)現(xiàn)通用場(chǎng)景的適應(yīng)性。

在標(biāo)準(zhǔn)與合規(guī)層面,具身智能技術(shù)、評(píng)測(cè)、安全倫理等標(biāo)準(zhǔn)缺失。因涉及跨人工智能、機(jī)械自動(dòng)化等交叉學(xué)科技術(shù),安全和倫理問(wèn)題突出,標(biāo)準(zhǔn)化工作面臨著系列挑戰(zhàn)和難度。具身智能機(jī)器人的出現(xiàn),不僅要考慮生命安全風(fēng)險(xiǎn),還面臨著信息安全、個(gè)人隱私等一系列倫理和社會(huì)學(xué)問(wèn)題。當(dāng)機(jī)器人與人類倫理發(fā)生沖突時(shí),如何規(guī)范、合理地開(kāi)發(fā)技術(shù)、使用智能產(chǎn)品,以及如何應(yīng)對(duì)人機(jī)交互過(guò)程中可能出現(xiàn)的社會(huì)問(wèn)題,成為亟待解決的問(wèn)題,需要相關(guān)的監(jiān)管標(biāo)準(zhǔn)和規(guī)范,明確機(jī)器人在各個(gè)場(chǎng)景中的應(yīng)用邊界和限制。

隨著技術(shù)瓶頸的突破與生態(tài)的完善,具身智能將深入人們生活,重塑社會(huì)生產(chǎn)與生活方式,未來(lái)發(fā)展呈現(xiàn)出以下趨勢(shì)。

技術(shù)創(chuàng)新發(fā)展。具身智能繼續(xù)加深對(duì)智能本質(zhì)的理解,將具備跨模態(tài)感知認(rèn)知能力,形成“感知—決策—行動(dòng)—反饋”閉環(huán),理解復(fù)雜場(chǎng)景,世界模型是實(shí)現(xiàn)通用具身智能的關(guān)鍵。具身智能借助強(qiáng)化學(xué)習(xí)等技術(shù)將實(shí)現(xiàn)具身智能形態(tài)和行為的自適應(yīng)優(yōu)化,減少人類干預(yù),提升自主決策和行為執(zhí)行精確性。同時(shí),構(gòu)建智能體協(xié)作框架實(shí)現(xiàn)集體優(yōu)化,未來(lái)或發(fā)展出高級(jí)群體智能算法和多智能體系統(tǒng),完成復(fù)雜任務(wù)。

加速產(chǎn)業(yè)跨界整合。具身智能將深入工業(yè)制造領(lǐng)域,提升生產(chǎn)自動(dòng)化與智能化水平,為醫(yī)療、教育、服務(wù)等行業(yè)帶來(lái)全新變革。未來(lái)的機(jī)器人應(yīng)用將更加多樣化、個(gè)性化、智能化,跨界融合成為機(jī)器人應(yīng)用的新趨勢(shì),促使不同產(chǎn)業(yè)相互學(xué)習(xí)、協(xié)同創(chuàng)新,創(chuàng)造出更多新的產(chǎn)品、服務(wù)與商業(yè)模式,全面推動(dòng)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級(jí)。加速社會(huì)體系重構(gòu)。具身智能代表著人工智能發(fā)展的新里程碑,預(yù)示著人類即將進(jìn)入一個(gè)“知行合一”的新時(shí)代。智能將不再局限于冰冷的算法和數(shù)據(jù),而是與現(xiàn)實(shí)世界緊密交織、共生共進(jìn)。在勞動(dòng)就業(yè)層面,傳統(tǒng)的工作崗位將被自動(dòng)化技術(shù)所取代,這要求社會(huì)對(duì)就業(yè)結(jié)構(gòu)進(jìn)行調(diào)整,并提供再培訓(xùn)和轉(zhuǎn)崗的機(jī)會(huì)。在人機(jī)關(guān)系層面,具身智能可完成日常輔助工作與高級(jí)決策支持,讓人類與機(jī)器的關(guān)系更加緊密。在社會(huì)關(guān)系層面,社會(huì)需提高公眾對(duì)具身智能技術(shù)的認(rèn)識(shí)和理解。此外,還要解決好具身智能的自主性和決策能力帶來(lái)的倫理和法律問(wèn)題。

 

文| 趙剛 董璞玉

(賽智產(chǎn)業(yè)研究院院長(zhǎng)/賽智產(chǎn)業(yè)研究院高級(jí)咨詢顧問(wèn))

排版 | 林曉彤