【ZiDongHua 之“會展賽培壇”收錄關(guān)鍵詞: 人形機器人 具身智能 機器人 智能制造
 
  北京人形亮相WAIC:全國首個工業(yè)多本體多場景多任務(wù)自主協(xié)同作業(yè)
 
  7月26日,世界人工智能大會(WAIC)在上海拉開帷幕。作為全球人工智能技術(shù)的風(fēng)向標,本屆大會匯聚了來自全球30多個國家的頂尖企業(yè)與研究機構(gòu),共同探討人工智能的前沿突破與產(chǎn)業(yè)變革。北京人形機器人創(chuàng)新中心(國家地方共建具身智能機器人創(chuàng)新中心)集聚產(chǎn)業(yè)創(chuàng)新資源,聚焦具身智能機器人關(guān)鍵共性技術(shù)研發(fā)和產(chǎn)業(yè)生態(tài)建設(shè),確保核心技術(shù)和產(chǎn)品自主可控,打造世界頂尖的具身智能創(chuàng)新平臺,支撐中國智能機器人產(chǎn)業(yè)發(fā)展。全國首個工業(yè)“多本體、多場景、多任務(wù)自主協(xié)同作業(yè)”實戰(zhàn)演示亮相,意味著其今年3月發(fā)布的“慧思開物”,在分布式具身智能體系統(tǒng)能力方面已經(jīng)實現(xiàn)了全面升級。
 
 
  北京人形機器人創(chuàng)新中心攜全國首個工業(yè)“多本體、多場景、多任務(wù)自主協(xié)同作業(yè)”實戰(zhàn)演示亮相WAIC
 
  當(dāng)前,具身智能仍停留在“單場景、單任務(wù)、單構(gòu)型”的早期階段。行業(yè)亟需一套通用、可擴展的平臺,支持多構(gòu)型機器人在復(fù)雜真實環(huán)境中的應(yīng)用。北京人形此次帶來的多個工業(yè)場景具身智能體協(xié)作展示,是業(yè)內(nèi)首個實現(xiàn)了公開真機演示的多具身智能體協(xié)作應(yīng)用,具備重要突破意義。該系統(tǒng)基于通用具身智能平臺“慧思開物”構(gòu)建,具備跨本體兼容、任務(wù)異步協(xié)同自主調(diào)度,實現(xiàn)了真正意義上的“一腦多機、一腦多能”。這也標志著具身智能正從實驗室走向產(chǎn)業(yè)化,為實際應(yīng)用提供了可落地、可復(fù)制的路徑。
 
  同時,這一系列具身智能體能力也正應(yīng)用于北京人形的明星產(chǎn)品“天工”上,持續(xù)推動其技術(shù)進化與實際應(yīng)用拓展。在WAIC展區(qū),“天工”通過一段段精彩舞蹈獲得了現(xiàn)場觀眾們的廣泛認可。秀“動感舞蹈”是對人形機器人全身運動控制能力的集中展示,全尺寸的人形機器人跳舞,因為身高和體重的增加會導(dǎo)致整體難度呈指數(shù)級增長,想要順利完成全身協(xié)同的復(fù)雜動作難度極大。而“天工”現(xiàn)場流暢協(xié)調(diào)的舞蹈動作,則充分體現(xiàn)了其在全身協(xié)調(diào)性和動態(tài)控制能力上領(lǐng)先的技術(shù)實力。此外,“天工”還搭載雙電池快換電系統(tǒng),具備長時間續(xù)航能力,綜合能效指標達到國際領(lǐng)先水平,雙臂末端穩(wěn)態(tài)負重更大,未來可在工業(yè)場景、物流場景中完成各種精細操作類任務(wù)。在8月8日即將開幕的2025世界機器人大會上,全新升級的“天工”還將重點展示其具備占據(jù)網(wǎng)絡(luò)環(huán)境感知的自主導(dǎo)航能力和全身控制的自主操作等核心技術(shù),加速人形機器人在實際場景中的規(guī)?;涞亍?/div>
 
 
  北京人形的明星機器人“天工”在WAIC展區(qū)被觀眾圍觀
 
  通用具身智能平臺調(diào)度多個智能體,實現(xiàn)全國首次全自主多本體協(xié)作任務(wù)鏈
 
  北京人形在WAIC展區(qū)呈現(xiàn)了一條完整的工業(yè)場景任務(wù)鏈:在通用具身智能平臺“慧思開物”的統(tǒng)一指揮下,各智能體機器人自主相互通報進展、溝通工作,電控柜操作區(qū)模擬精細操作,燈泡質(zhì)檢線完成工業(yè)檢測,物品封裝區(qū)執(zhí)行封裝作業(yè),機器人穿梭于三個場景之間,完成搬運工作。系統(tǒng)通過分布式具身智能體架構(gòu),在四個機器人本體上部署了“電工大師”“搬運工”“質(zhì)檢員”“封裝助手”四個任務(wù)執(zhí)行智能體,同時在云端部署了任務(wù)調(diào)度智能體,負責(zé)接受指令和整體任務(wù)調(diào)度,將子任務(wù)分發(fā)給四個機器人協(xié)同完成,現(xiàn)場多個智能體共同構(gòu)建起一個高效的“任務(wù)執(zhí)行網(wǎng)絡(luò)”。而操作員只需在“慧思開物”App上發(fā)送“開始”指令,觀眾便能在大屏幕上見證從任務(wù)下發(fā)到多個機器人協(xié)同完成全鏈路操作的全過程,直觀感受到智能機器人在各類復(fù)雜場景的落地應(yīng)用。
 
 
  “慧思開物”App在現(xiàn)場實時演示,觀眾能從大屏幕上直觀看到從任務(wù)下發(fā)到多個機器人協(xié)同操作的全過程
 
  在常見的智能體工作流中,同一時刻僅有一個或部分智能體被激活,只能支持同步工作流,而“慧思開物”系統(tǒng)讓所有智能體都處于活躍異步協(xié)作狀態(tài):機器人根據(jù)任務(wù)優(yōu)先級與自身狀態(tài)自主執(zhí)行任務(wù),能夠像人一樣通過自然語言而非程序代碼相互溝通,完成后觸發(fā)下一階段協(xié)作流程,實現(xiàn)真正意義上的“機器決策機器”。多具身智能體異步協(xié)作,要求系統(tǒng)具備實時多任務(wù)并發(fā)處理能力,包括帶優(yōu)先級的多任務(wù)插入、暫停、恢復(fù)。相比同步工作流,對整體系統(tǒng)提出更高級別的挑戰(zhàn)。每個智能體機器人都配備獨立的大腦與小腦,使得它們既可以完全獨立工作,同時可以協(xié)同作業(yè),具備從認知到執(zhí)行的全鏈條能力,構(gòu)筑起支持未來多場景泛化、跨機器人協(xié)同的核心技術(shù)底座。
 
  正因如此,觀眾才得以在展區(qū)近距離感受到各構(gòu)型機器人絲滑流暢的工業(yè)作業(yè)流程。而這背后,是北京人形研發(fā)團隊在分布式具身智能體系統(tǒng)、多模態(tài)操作VLA大模型、視覺理解、空間感知、復(fù)雜任務(wù)理解、任務(wù)精準拆解、工具調(diào)用、雙臂協(xié)作、自主糾錯、實時重規(guī)劃執(zhí)行等關(guān)鍵技術(shù)上的持續(xù)進化和集中展現(xiàn)。
 
  在電控柜操作區(qū),接收到“慧思開物”的指令后,機器人自主完成開柜、點按旋鈕、合閘等多工序的靈巧作業(yè)。這些看似簡單的操作背后,是 35 自由度機器人系統(tǒng)與接觸密集型長任務(wù)雙臂靈巧手協(xié)作VLA(視覺-語言-動作)模型的技術(shù)結(jié)晶。在電力檢修場景下,機器人需要應(yīng)對長任務(wù)誤差累積、電氣操作邏輯和密集元件接觸等復(fù)雜挑戰(zhàn)。
 
  機器人在電控柜操作區(qū)自主完成開柜、點按旋鈕、合閘等多工序的靈巧作業(yè)
 
  為攻克這一難題,研發(fā)團隊基于多模態(tài)感知系統(tǒng),采集高質(zhì)量人工演示數(shù)據(jù),開發(fā)了基于視覺-觸覺-動作模型的雙臂-手靈巧操作算法。針對當(dāng)前機器人無法準確完成長程任務(wù)的挑戰(zhàn),采用基于關(guān)鍵幀的多任務(wù)串聯(lián)與預(yù)測算法,有效降低誤差累積;通過任務(wù)自糾錯機制,模型可根據(jù)電氣信號自動判斷操作是否完成;結(jié)合指尖觸覺特征提取,模型能精準感知接觸變化,有效應(yīng)對旋鈕和空氣開關(guān)等復(fù)雜元件的應(yīng)力突變。與主流的單模態(tài)感知系統(tǒng)和傳統(tǒng)模仿學(xué)習(xí)相比,這一方法能夠顯著提升任務(wù)成功率至90%以上。機器人憑借這些技術(shù)能夠?qū)崿F(xiàn)多場景適應(yīng)和智能決策,在保障作業(yè)安全的同時,推動電力行業(yè)智能化升級,減少高危人工操作。
 
  電控柜通電后,燈泡質(zhì)檢區(qū)啟動的雙機協(xié)同流程則是更具挑戰(zhàn)的柔性展現(xiàn)。機器人從貨架抓取燈泡箱體并精準搬運至指定位置,機械臂已同步被喚醒,啟動“抓取-插裝-點亮-質(zhì)檢-分揀”的標準化作業(yè),視覺傳感器結(jié)合多模態(tài)大模型完成光效檢測,實現(xiàn)對燈泡好壞的判斷并規(guī)劃好下一步操作。
 
  燈泡質(zhì)檢區(qū)機的機器人根據(jù)檢測光效和細微特征,實現(xiàn)對每一個燈泡的自主判斷和分揀
 
  整個過程中,機器人基于三維環(huán)境感知,實現(xiàn)雙機械臂自主規(guī)避障礙、動態(tài)規(guī)劃抓取與操作軌跡;結(jié)合力位混合控制技術(shù),末端執(zhí)行器能夠靈敏調(diào)整力度和位置,確保插裝過程平穩(wěn)且對燈泡無損傷,高精度視覺定位系統(tǒng)同時確保對燈泡的精準定位。此外,機器人通過VLM場景理解能力,能根據(jù)檢測到的光效和細微特征,實現(xiàn)對每一個燈泡的自主判斷和分揀。在“慧思開物”通用具身智能平臺的調(diào)配下,系統(tǒng)可自主規(guī)劃流程,靈活調(diào)用傳感器與工具,實現(xiàn)多設(shè)備協(xié)同與任務(wù)快速重組,為“柔性自動化工廠”提供了高效、可擴展的方案。
 
  在物品封裝區(qū),基于北京人形自研的端到端VLA模型,實現(xiàn)了業(yè)內(nèi)領(lǐng)先的實時糾錯雙臂協(xié)同流暢操作。機械臂執(zhí)行物品封裝與二維碼貼合任務(wù),現(xiàn)場引入了燈光變化、物品位置更換等復(fù)雜擾動,以模擬真實場景下的動態(tài)環(huán)境,系統(tǒng)仍能自適應(yīng)處理干擾,穩(wěn)定完成各項操作,真正做到了“使命必達”。最終由機器人在展區(qū)中自主穿梭,完成各項物品搬運。
 
  這得益于“慧思開物”的中控決策模塊所融合的自研VLA模型賦予了機器人快速的動作預(yù)測與下發(fā)能力,確保各環(huán)節(jié)操作流暢。在外部光線干擾下,機器人容易出現(xiàn)動作失誤或異常。對此,研發(fā)團隊利用特征提取能力和數(shù)據(jù)生成方案,有效解決現(xiàn)實場景中經(jīng)常出現(xiàn)的燈光干擾問題;同時,通過異步推理大幅提升了推理速度,使整個模型具備出色的環(huán)境適應(yīng)性與執(zhí)行魯棒性。面對突發(fā)干擾,它可實時感知任務(wù)狀態(tài),自主完成策略調(diào)整與糾錯,確保操作穩(wěn)定且準確。以二維碼貼合環(huán)節(jié)為例,該模型能夠像人類一樣理解物品袋的當(dāng)前姿態(tài),快速預(yù)測并下發(fā)合適動作,使機械臂完成轉(zhuǎn)向與調(diào)整,并將二維碼準確粘貼到位。相比傳統(tǒng)機器人依賴穩(wěn)定環(huán)境的運行模式,該架構(gòu)通過在非結(jié)構(gòu)化場景中的驗證,在動態(tài)條件下展現(xiàn)出更強的任務(wù)完成能力和環(huán)境適應(yīng)性。
 
  物品封裝區(qū),雙臂協(xié)同流暢操作,精準完成二維碼貼合與物品分發(fā)
 
  全身運動控制與數(shù)據(jù)賦能,構(gòu)筑人形智能新底座
 
  展區(qū)另一側(cè),人形機器人“天工2.0”正伴隨動感音樂節(jié)拍“舞力全開”,流暢協(xié)調(diào)的舞姿瞬間點燃現(xiàn)場氣氛,成為引人駐足圍觀的焦點。舞蹈過程中,它全身多達42個自由度的關(guān)節(jié)協(xié)調(diào)統(tǒng)一,指尖的輕巧靈動、手臂的高速流暢、軀干的沉穩(wěn)搖曳,無一不展現(xiàn)其高動態(tài)全身協(xié)調(diào)控制的先進性和穩(wěn)定性。
 
  天工2.0身高約173cm,體重約73KG,更大的重量和更長的肢體意味著更大的運動慣性和力矩變化,動作控制更需快速精準的實時運算與穩(wěn)定響應(yīng);而42個高自由度的動態(tài)聯(lián)動,則考驗系統(tǒng)多關(guān)節(jié)協(xié)同、實時規(guī)劃與抗干擾能力的極限。高速舞動中,天工2.0憑借下肢的大運動范圍與高扭矩、上肢的精準控制和軀干的靈動姿態(tài),實現(xiàn)了全身重心的持續(xù)穩(wěn)定和高動態(tài)平衡控制。除了在運動控制與系統(tǒng)協(xié)同方面的精彩表現(xiàn)之外,更長的續(xù)航能力、更靈活的上肢操作,也為天工2.0未來廣泛應(yīng)用于工業(yè)場景、物流場景提供了堅實基礎(chǔ)。
 
  “天工”在展區(qū)“舞力全開”,流暢舞姿點燃現(xiàn)場氣氛
 
  值得一提的是,今年4月在北京亦莊半程馬拉松中以2小時40分42秒創(chuàng)造世界紀錄的冠軍機器人“天工Ultra”也驚喜亮相,吸引了大量觀眾與其打卡合影。
 
  支撐這套系統(tǒng)運行的數(shù)據(jù)基礎(chǔ)同樣令人矚目。在現(xiàn)場的數(shù)據(jù)采集區(qū),觀眾可以體驗北京人形自研的同構(gòu)臂遙操作真機和仿真天工的實時演示,操作員的每一個動作都能被真機和仿真機器人精準復(fù)現(xiàn)和完整記錄,這種高動態(tài)、高保真的數(shù)據(jù)采集為算法訓(xùn)練提供了寶貴素材。配合北京人形自研數(shù)據(jù)采集平臺,完整呈現(xiàn)了從虛實結(jié)合的數(shù)據(jù)獲取到模型訓(xùn)練的全鏈條技術(shù)能力。這些數(shù)據(jù)不僅支撐了算法的快速迭代,更為行業(yè)標準化發(fā)展奠定了堅實基礎(chǔ)。北京人形發(fā)布的RoboMIND數(shù)據(jù)集已累計下載使用超4萬次,成為具身智能研究的重要開源資源。
 
  同構(gòu)臂遙操作真機和仿真天工實時演示,精準復(fù)現(xiàn)操作員的動作
 
  作為國家級創(chuàng)新平臺,北京人形正在構(gòu)建的不僅是技術(shù)平臺,更是整個產(chǎn)業(yè)生態(tài)的底層架構(gòu)。
 
  從競技舞臺到未來場景:開啟人機共融時代
 
  工業(yè)場景“多本體、多場景、多任務(wù)自主協(xié)同作業(yè)”能力的突破預(yù)示著具身智能正在從“展示型”向“應(yīng)用型”演進。北京人形機器人創(chuàng)新中心(國家地方共建具身智能機器人創(chuàng)新中心)的這次亮相不僅完成了對具身智能技術(shù)能力的全面檢閱,也為工業(yè)制造的智能化升級提供了全新路徑。
 
  當(dāng)展館內(nèi)最后一個任務(wù)指令完成,所有機器人自主、有序地返回待機位置時,現(xiàn)場觀眾見證的已不僅是一場技術(shù)演示,更是一個標志性的時刻——在這個智能制造的新時代里,機器人將不再是孤立的工具,而是能夠相互協(xié)作、主動適應(yīng)的智能伙伴。
 
  
我要收藏
點個贊吧
轉(zhuǎn)發(fā)分享
上一篇:西門子中國董事長肖松博士在WAIC 2025上發(fā)表主旨演講
下一篇: 自主筑基 智驅(qū)未來 中國電子精彩亮相世界人工智能大會