【ZiDongHua 之“創(chuàng)新自化成”收錄關(guān)鍵詞:埃夫特機(jī)器人 機(jī)器人 智能制造

北京大學(xué)武漢人工智能研究院在“全手觸覺機(jī)器人仿生手”上取得重要突破

近日,由北京大學(xué)人工智能研究院、北京大學(xué)武漢人工智能研究院、北京通用人工智能研究院等單位聯(lián)合組成的科研團(tuán)隊(duì),開發(fā)出全球首個(gè)同時(shí)具備全手高分辨率觸覺感知和完整運(yùn)動(dòng)能力的機(jī)器人手系統(tǒng)——“基于全手觸覺的機(jī)器人仿生手”(簡(jiǎn)稱F—TAC Hand),展示了我國(guó)在機(jī)器人前沿技術(shù)領(lǐng)域的創(chuàng)新能力,對(duì)推動(dòng)機(jī)器人技術(shù)的自主創(chuàng)新和國(guó)產(chǎn)化具有重要意義。相關(guān)成果北京時(shí)間6月9日在國(guó)際頂級(jí)學(xué)術(shù)期刊《自然·機(jī)器智能》(Nature Machine Intelligence)上發(fā)表。

北京大學(xué)武漢人工智能研究院首席科學(xué)家朱松純教授為本文的合作作者,本文通訊作者為北京大學(xué)武漢人工智能研究院具身智能實(shí)驗(yàn)室主任、北京大學(xué)人工智能研究院助理教授朱毅鑫。

北京大學(xué)武漢人工智能研究院(簡(jiǎn)稱“北武院”)成立于2022年11月,是由北京大學(xué)、武漢市人民政府、武漢東湖新技術(shù)開發(fā)區(qū)管理委員會(huì)共建,武漢市人民政府批準(zhǔn)成立的獨(dú)立事業(yè)法人單位。北武院以全社會(huì)應(yīng)用為場(chǎng)景,構(gòu)建全球首個(gè)大型社會(huì)模擬器;以智能社會(huì)治理為主線,建設(shè)國(guó)家智能社會(huì)治理實(shí)驗(yàn)綜合基地。

 

圖片

手部既是人類改造自然與外界交互的重要器官,也是實(shí)現(xiàn)智能的關(guān)鍵載體。人的手部由27塊骨骼和34塊肌肉組成,提供了24個(gè)自由度的靈活性,具有結(jié)構(gòu)高度復(fù)雜、功能極為精密等特點(diǎn)。因此,對(duì)人類手部功能的研究是具身智能與機(jī)器人研究的前沿。

人的手部在拿取物體時(shí)涉及“觸覺反饋”與“運(yùn)動(dòng)功能”兩大能力。以往的研究中,觸覺反饋與運(yùn)動(dòng)能力的整合被認(rèn)為是機(jī)器人研究領(lǐng)域中的關(guān)鍵挑戰(zhàn)之一。研究團(tuán)隊(duì)通過傳感器與結(jié)構(gòu)一體化設(shè)計(jì),使F—TAC Hand在保持完整運(yùn)動(dòng)能力的前提下,實(shí)現(xiàn)了機(jī)器人手掌表面高分辨率觸覺覆蓋,使機(jī)器人能夠像人類一樣通過觸覺反饋進(jìn)行精確操作和適應(yīng)性抓取。

據(jù)介紹,高分辨率觸覺傳感器覆蓋手掌表面70%的區(qū)域,空間分辨率達(dá)到0.1毫米,相當(dāng)于每平方厘米約有1萬個(gè)觸覺像素,遠(yuǎn)超目前商用機(jī)器人手的觸覺感知能力。此外,F(xiàn)—TAC Hand還借鑒了人類手部的生物結(jié)構(gòu),將17個(gè)高分辨率觸覺傳感器以6種不同配置集成,使其像人類手掌一樣,在抓取過程中實(shí)時(shí)感知接觸變化并迅速調(diào)整,極大提升了機(jī)器人在不確定環(huán)境中的操作穩(wěn)定性。此外,研究團(tuán)隊(duì)還開發(fā)出生成人類多樣化抓取策略的算法,涵蓋了人類常見的19種抓取類型。

 

實(shí)驗(yàn)結(jié)果表明,相比沒有觸覺反饋的系統(tǒng),F(xiàn)—TAC Hand在面臨執(zhí)行誤差和物體碰撞風(fēng)險(xiǎn)時(shí)表現(xiàn)出顯著的適應(yīng)性優(yōu)勢(shì),平均成功率從53.5%提升至了100%。這項(xiàng)研究成果有望推動(dòng)機(jī)器人技術(shù)在醫(yī)療、工業(yè)制造、特殊環(huán)境作業(yè)等領(lǐng)域的落地應(yīng)用。朱毅鑫博士表示:“未來,我們將繼續(xù)深化觸覺感知與機(jī)器人控制的結(jié)合,探索更加智能的體感交互范式,為實(shí)現(xiàn)真正意義上的通用人工智能奠定基礎(chǔ)。”

成果解讀

 

隨著人類的進(jìn)化,手部的功能由攀爬轉(zhuǎn)為使用工具,并逐漸掌握了精準(zhǔn)抓握能力。手部既是人類改造自然與外界交互的核心器官,也是智能的核心載體。人的手部具有結(jié)構(gòu)高度復(fù)雜、功能極為精密的特點(diǎn),手部由27塊骨骼和34塊肌肉組成,提供了24個(gè)自由度的靈活性,對(duì)人類手部功能的研究是具身智能與機(jī)器人學(xué)科研的前沿領(lǐng)域。

人在拿取物體時(shí)涉及到“觸覺反饋”與“運(yùn)動(dòng)功能”兩大能力:觸覺反饋包含運(yùn)動(dòng)覺(通過肌肉、肌腱和關(guān)節(jié)感知力量)與皮膚觸覺(通過皮膚感知接觸狀態(tài)、紋理、溫度、摩擦力等物理特性);運(yùn)動(dòng)功能包括運(yùn)動(dòng)學(xué)(研究關(guān)節(jié)的角度、位置及其運(yùn)動(dòng)的幾何關(guān)系)與動(dòng)力學(xué)(研究力和扭矩應(yīng)該如何作用于關(guān)節(jié)和肢體,從而實(shí)現(xiàn)精確的運(yùn)動(dòng)控制)。

在以往的研究中,觸覺反饋與運(yùn)動(dòng)能力的整合被認(rèn)為是機(jī)器人研究領(lǐng)域中的關(guān)鍵挑戰(zhàn)之一。F-TAC Hand通過傳感器與結(jié)構(gòu)一體化設(shè)計(jì)成功突破了這一瓶頸。首先,從硬件角度來看,如何避免觸覺傳感器的引入對(duì)機(jī)器人的運(yùn)動(dòng)靈活性造成影響是第一個(gè)難題,同時(shí)當(dāng)前的觸覺傳感技術(shù)在覆蓋率、分辨率和耐久性等方面仍難以滿足實(shí)際應(yīng)用需求。其次,即便獲得了具備高分辨率觸覺感知能力的機(jī)器手,如何高效地處理大量的觸覺數(shù)據(jù),并以此驅(qū)動(dòng)每個(gè)關(guān)節(jié)協(xié)同運(yùn)動(dòng),使其在高自由度空間中像人一樣完成復(fù)雜的任務(wù),依然是一個(gè)亟待解決的難題。

聯(lián)合科研團(tuán)隊(duì)取得的成果是首次在保持完整運(yùn)動(dòng)能力的前提下,實(shí)現(xiàn)了機(jī)器手掌表面70%區(qū)域的高分辨率觸覺覆蓋,使機(jī)器人能夠像人類一樣通過觸覺反饋進(jìn)行精確操作和適應(yīng)性抓取。

在缺乏豐富的觸覺反饋的情況下,目前主流的機(jī)器手或抓取器難以應(yīng)對(duì)動(dòng)態(tài)環(huán)境中的復(fù)雜操作任務(wù)。論文第一作者、北京大學(xué)人工智能研究院博士生趙秭杭介紹道:“人類手部的靈活性和適應(yīng)性很大程度上歸功于其密集的觸覺傳感能力,這使我們能夠精確感知與調(diào)整抓握過程。例如,人類在抓取一個(gè)裝滿水的杯子與一個(gè)空杯子時(shí),抓握杯子的位置、角度、方式可能完全不同。然而,在機(jī)器人領(lǐng)域,如何在不影響運(yùn)動(dòng)功能的前提下實(shí)現(xiàn)全手觸覺覆蓋一直是一個(gè)難題。” 研究團(tuán)隊(duì)開發(fā)的F-TAC Hand解決了這一難題。高分辨率觸覺傳感器覆蓋了該手部系統(tǒng)手掌表面70%的廣大區(qū)域,空間分辨率達(dá)到0.1毫米,相當(dāng)于每平方厘米約有10,000個(gè)觸覺像素,遠(yuǎn)超目前商用機(jī)器手的觸覺感知能力,如目前最先進(jìn)的Shadow Hand僅在指尖提供單點(diǎn)力傳感。

 

F-TAC Hand的設(shè)計(jì)靈感來源于人類手部的生物結(jié)構(gòu)。“人類手部觸覺系統(tǒng)由兩個(gè)關(guān)鍵要素組成:遍布皮膚的密集觸覺傳感器陣列和大腦中專門解釋這些海量感覺輸入的神經(jīng)處理機(jī)制。我們的F-TAC Hand模擬了這種設(shè)計(jì),將17個(gè)高分辨率觸覺傳感器以6種不同配置集成在一起,同時(shí)巧妙地將傳感器設(shè)計(jì)為既是感知元件又是結(jié)構(gòu)部件,從而在不犧牲靈活性的前提下實(shí)現(xiàn)了前所未有的觸覺覆蓋范圍。”趙秭杭介紹道。這種創(chuàng)新設(shè)計(jì)使F-TAC Hand能夠像人類手掌一樣,在抓取過程中實(shí)時(shí)感知接觸變化并迅速調(diào)整,極大提升了機(jī)器人在不確定環(huán)境中的操作穩(wěn)定性。

 

論文共同第一作者、北京大學(xué)人工智能研究院博士生李宇飏說:“機(jī)器手高度的關(guān)節(jié)靈活性會(huì)給控制算法帶來極大挑戰(zhàn),我們通過開發(fā)一種生成人類多樣化抓取策略的算法來解決這一問題。該算法基于概率模型,能夠產(chǎn)生與人類非常相似的抓取方式,涵蓋了人類常見的19種抓取類型。”

李宇飏進(jìn)一步解釋了F-TAC Hand的適應(yīng)性智能機(jī)制:“多物體同時(shí)抓取是評(píng)估機(jī)器手靈巧性的重要基準(zhǔn)測(cè)試,比單一物體要復(fù)雜得多。抓取單一物品可以通過雙指夾持的方式實(shí)現(xiàn),但當(dāng)用一只手抓取多個(gè)物體時(shí),需要做精確的全手接觸檢測(cè)并調(diào)整運(yùn)動(dòng)策略才能實(shí)現(xiàn)精準(zhǔn)、穩(wěn)定抓取。”

實(shí)驗(yàn)結(jié)果表明,當(dāng)理論上最優(yōu)的抓取策略在現(xiàn)實(shí)環(huán)境中遇到障礙時(shí),F(xiàn)-TAC Hand能夠在約100毫秒內(nèi)感知情況并快速切換到替代策略,確保任務(wù)完成。為驗(yàn)證這一技術(shù)的實(shí)際效果,研究團(tuán)隊(duì)在600次真實(shí)世界實(shí)驗(yàn)中評(píng)估了F-TAC Hand的多物體抓取能力。結(jié)果表明,相比沒有觸覺反饋的系統(tǒng),F(xiàn)-TAC Hand在面臨執(zhí)行誤差和物體碰撞風(fēng)險(xiǎn)時(shí)表現(xiàn)出顯著的適應(yīng)性優(yōu)勢(shì),平均成功率從53.5%提升至了100%。這種基于觸覺的閉環(huán)反饋機(jī)制,使F-TAC Hand能夠像人類一樣,在不確定環(huán)境中保持高效靈活的操作能力,這對(duì)機(jī)器人在家庭、醫(yī)療和工業(yè)環(huán)境中的實(shí)際應(yīng)用至關(guān)重要。

論文通訊作者、北京大學(xué)人工智能研究院助理教授、北京大學(xué)武漢人工智能研究院具身智能實(shí)驗(yàn)室主任朱毅鑫說:“我們的研究不僅是技術(shù)上的突破,更為理解智能的本質(zhì)提供了全新視角。人類智能深深植根于身體的感知能力,尤其是手部的觸覺體驗(yàn)對(duì)我們認(rèn)知世界至關(guān)重要。F-TAC Hand的成果表明,豐富的感知能力對(duì)于機(jī)器智能的發(fā)展同樣不可或缺。”

機(jī)器手作為人形機(jī)器人與外界交互的重要媒介,是機(jī)器人功能性的直接體現(xiàn),需要“人手”參與的工作都是機(jī)器手的應(yīng)用場(chǎng)景,在特定場(chǎng)景(如精密裝配)中展現(xiàn)出超越人類手部的穩(wěn)定性。由于其可提供超越人類手部穩(wěn)定性的操作,該科研成果在對(duì)操作精度有極高要求的輔助手術(shù)、高精密組裝類工作以及航空航天、應(yīng)急響應(yīng)等領(lǐng)域有廣泛的落地場(chǎng)景。

這項(xiàng)研究成果有望推動(dòng)機(jī)器人技術(shù)在醫(yī)療、工業(yè)制造、特殊環(huán)境作業(yè)等領(lǐng)域的落地應(yīng)用。朱毅鑫博士表示:“未來我們將繼續(xù)深化觸覺感知與機(jī)器人控制的結(jié)合,探索更加智能的體感交互范式,為實(shí)現(xiàn)真正意義上的通用人工智能奠定基礎(chǔ)。”

他進(jìn)一步說,“近年來大型語言模型等基于純計(jì)算的人工智能取得了顯著進(jìn)展,但它們?cè)谔幚砦锢硎澜绲膶?shí)際交互任務(wù)時(shí)仍面臨巨大挑戰(zhàn)。我們的研究表明,真正的智能行為需要‘知行合一’。F-TAC Hand的成功為‘具身智能’開辟了新的研究方向,這種將高保真物理感知與智能控制系統(tǒng)結(jié)合的方法,代表了通向更高級(jí)別機(jī)器智能的重要路徑。通過這項(xiàng)研究,我們不僅推動(dòng)了機(jī)器人技術(shù)的發(fā)展,也加深了對(duì)智能本質(zhì)的理解,這對(duì)構(gòu)建下一代人工智能系統(tǒng)具有重要啟示意義,也將為具身智能與千行百業(yè)融合發(fā)展,賦能我國(guó)經(jīng)濟(jì)、社會(huì)高質(zhì)量發(fā)展,注入新質(zhì)生產(chǎn)力。”

該研究工作得到了武漢市科創(chuàng)局和東湖高新區(qū)國(guó)家智能社會(huì)治理實(shí)驗(yàn)綜合基地的支持。