【ZiDongHua 之“創(chuàng)新自化成”收錄關(guān)鍵詞:埃夫特機器人 機器人 智能制造

北京大學武漢人工智能研究院在“全手觸覺機器人仿生手”上取得重要突破

近日,由北京大學人工智能研究院、北京大學武漢人工智能研究院、北京通用人工智能研究院等單位聯(lián)合組成的科研團隊,開發(fā)出全球首個同時具備全手高分辨率觸覺感知和完整運動能力的機器人手系統(tǒng)——“基于全手觸覺的機器人仿生手”(簡稱F—TAC Hand),展示了我國在機器人前沿技術(shù)領(lǐng)域的創(chuàng)新能力,對推動機器人技術(shù)的自主創(chuàng)新和國產(chǎn)化具有重要意義。相關(guān)成果北京時間6月9日在國際頂級學術(shù)期刊《自然·機器智能》(Nature Machine Intelligence)上發(fā)表。

北京大學武漢人工智能研究院首席科學家朱松純教授為本文的合作作者,本文通訊作者為北京大學武漢人工智能研究院具身智能實驗室主任、北京大學人工智能研究院助理教授朱毅鑫。

北京大學武漢人工智能研究院(簡稱“北武院”)成立于2022年11月,是由北京大學、武漢市人民政府、武漢東湖新技術(shù)開發(fā)區(qū)管理委員會共建,武漢市人民政府批準成立的獨立事業(yè)法人單位。北武院以全社會應(yīng)用為場景,構(gòu)建全球首個大型社會模擬器;以智能社會治理為主線,建設(shè)國家智能社會治理實驗綜合基地。

 

圖片

手部既是人類改造自然與外界交互的重要器官,也是實現(xiàn)智能的關(guān)鍵載體。人的手部由27塊骨骼和34塊肌肉組成,提供了24個自由度的靈活性,具有結(jié)構(gòu)高度復(fù)雜、功能極為精密等特點。因此,對人類手部功能的研究是具身智能與機器人研究的前沿。

人的手部在拿取物體時涉及“觸覺反饋”與“運動功能”兩大能力。以往的研究中,觸覺反饋與運動能力的整合被認為是機器人研究領(lǐng)域中的關(guān)鍵挑戰(zhàn)之一。研究團隊通過傳感器與結(jié)構(gòu)一體化設(shè)計,使F—TAC Hand在保持完整運動能力的前提下,實現(xiàn)了機器人手掌表面高分辨率觸覺覆蓋,使機器人能夠像人類一樣通過觸覺反饋進行精確操作和適應(yīng)性抓取。

據(jù)介紹,高分辨率觸覺傳感器覆蓋手掌表面70%的區(qū)域,空間分辨率達到0.1毫米,相當于每平方厘米約有1萬個觸覺像素,遠超目前商用機器人手的觸覺感知能力。此外,F(xiàn)—TAC Hand還借鑒了人類手部的生物結(jié)構(gòu),將17個高分辨率觸覺傳感器以6種不同配置集成,使其像人類手掌一樣,在抓取過程中實時感知接觸變化并迅速調(diào)整,極大提升了機器人在不確定環(huán)境中的操作穩(wěn)定性。此外,研究團隊還開發(fā)出生成人類多樣化抓取策略的算法,涵蓋了人類常見的19種抓取類型。

 

實驗結(jié)果表明,相比沒有觸覺反饋的系統(tǒng),F(xiàn)—TAC Hand在面臨執(zhí)行誤差和物體碰撞風險時表現(xiàn)出顯著的適應(yīng)性優(yōu)勢,平均成功率從53.5%提升至了100%。這項研究成果有望推動機器人技術(shù)在醫(yī)療、工業(yè)制造、特殊環(huán)境作業(yè)等領(lǐng)域的落地應(yīng)用。朱毅鑫博士表示:“未來,我們將繼續(xù)深化觸覺感知與機器人控制的結(jié)合,探索更加智能的體感交互范式,為實現(xiàn)真正意義上的通用人工智能奠定基礎(chǔ)。”

成果解讀

 

隨著人類的進化,手部的功能由攀爬轉(zhuǎn)為使用工具,并逐漸掌握了精準抓握能力。手部既是人類改造自然與外界交互的核心器官,也是智能的核心載體。人的手部具有結(jié)構(gòu)高度復(fù)雜、功能極為精密的特點,手部由27塊骨骼和34塊肌肉組成,提供了24個自由度的靈活性,對人類手部功能的研究是具身智能與機器人學科研的前沿領(lǐng)域。

人在拿取物體時涉及到“觸覺反饋”與“運動功能”兩大能力:觸覺反饋包含運動覺(通過肌肉、肌腱和關(guān)節(jié)感知力量)與皮膚觸覺(通過皮膚感知接觸狀態(tài)、紋理、溫度、摩擦力等物理特性);運動功能包括運動學(研究關(guān)節(jié)的角度、位置及其運動的幾何關(guān)系)與動力學(研究力和扭矩應(yīng)該如何作用于關(guān)節(jié)和肢體,從而實現(xiàn)精確的運動控制)。

在以往的研究中,觸覺反饋與運動能力的整合被認為是機器人研究領(lǐng)域中的關(guān)鍵挑戰(zhàn)之一。F-TAC Hand通過傳感器與結(jié)構(gòu)一體化設(shè)計成功突破了這一瓶頸。首先,從硬件角度來看,如何避免觸覺傳感器的引入對機器人的運動靈活性造成影響是第一個難題,同時當前的觸覺傳感技術(shù)在覆蓋率、分辨率和耐久性等方面仍難以滿足實際應(yīng)用需求。其次,即便獲得了具備高分辨率觸覺感知能力的機器手,如何高效地處理大量的觸覺數(shù)據(jù),并以此驅(qū)動每個關(guān)節(jié)協(xié)同運動,使其在高自由度空間中像人一樣完成復(fù)雜的任務(wù),依然是一個亟待解決的難題。

聯(lián)合科研團隊取得的成果是首次在保持完整運動能力的前提下,實現(xiàn)了機器手掌表面70%區(qū)域的高分辨率觸覺覆蓋,使機器人能夠像人類一樣通過觸覺反饋進行精確操作和適應(yīng)性抓取。

在缺乏豐富的觸覺反饋的情況下,目前主流的機器手或抓取器難以應(yīng)對動態(tài)環(huán)境中的復(fù)雜操作任務(wù)。論文第一作者、北京大學人工智能研究院博士生趙秭杭介紹道:“人類手部的靈活性和適應(yīng)性很大程度上歸功于其密集的觸覺傳感能力,這使我們能夠精確感知與調(diào)整抓握過程。例如,人類在抓取一個裝滿水的杯子與一個空杯子時,抓握杯子的位置、角度、方式可能完全不同。然而,在機器人領(lǐng)域,如何在不影響運動功能的前提下實現(xiàn)全手觸覺覆蓋一直是一個難題。” 研究團隊開發(fā)的F-TAC Hand解決了這一難題。高分辨率觸覺傳感器覆蓋了該手部系統(tǒng)手掌表面70%的廣大區(qū)域,空間分辨率達到0.1毫米,相當于每平方厘米約有10,000個觸覺像素,遠超目前商用機器手的觸覺感知能力,如目前最先進的Shadow Hand僅在指尖提供單點力傳感。

 

F-TAC Hand的設(shè)計靈感來源于人類手部的生物結(jié)構(gòu)。“人類手部觸覺系統(tǒng)由兩個關(guān)鍵要素組成:遍布皮膚的密集觸覺傳感器陣列和大腦中專門解釋這些海量感覺輸入的神經(jīng)處理機制。我們的F-TAC Hand模擬了這種設(shè)計,將17個高分辨率觸覺傳感器以6種不同配置集成在一起,同時巧妙地將傳感器設(shè)計為既是感知元件又是結(jié)構(gòu)部件,從而在不犧牲靈活性的前提下實現(xiàn)了前所未有的觸覺覆蓋范圍。”趙秭杭介紹道。這種創(chuàng)新設(shè)計使F-TAC Hand能夠像人類手掌一樣,在抓取過程中實時感知接觸變化并迅速調(diào)整,極大提升了機器人在不確定環(huán)境中的操作穩(wěn)定性。

 

論文共同第一作者、北京大學人工智能研究院博士生李宇飏說:“機器手高度的關(guān)節(jié)靈活性會給控制算法帶來極大挑戰(zhàn),我們通過開發(fā)一種生成人類多樣化抓取策略的算法來解決這一問題。該算法基于概率模型,能夠產(chǎn)生與人類非常相似的抓取方式,涵蓋了人類常見的19種抓取類型。”

李宇飏進一步解釋了F-TAC Hand的適應(yīng)性智能機制:“多物體同時抓取是評估機器手靈巧性的重要基準測試,比單一物體要復(fù)雜得多。抓取單一物品可以通過雙指夾持的方式實現(xiàn),但當用一只手抓取多個物體時,需要做精確的全手接觸檢測并調(diào)整運動策略才能實現(xiàn)精準、穩(wěn)定抓取。”

實驗結(jié)果表明,當理論上最優(yōu)的抓取策略在現(xiàn)實環(huán)境中遇到障礙時,F(xiàn)-TAC Hand能夠在約100毫秒內(nèi)感知情況并快速切換到替代策略,確保任務(wù)完成。為驗證這一技術(shù)的實際效果,研究團隊在600次真實世界實驗中評估了F-TAC Hand的多物體抓取能力。結(jié)果表明,相比沒有觸覺反饋的系統(tǒng),F(xiàn)-TAC Hand在面臨執(zhí)行誤差和物體碰撞風險時表現(xiàn)出顯著的適應(yīng)性優(yōu)勢,平均成功率從53.5%提升至了100%。這種基于觸覺的閉環(huán)反饋機制,使F-TAC Hand能夠像人類一樣,在不確定環(huán)境中保持高效靈活的操作能力,這對機器人在家庭、醫(yī)療和工業(yè)環(huán)境中的實際應(yīng)用至關(guān)重要。

論文通訊作者、北京大學人工智能研究院助理教授、北京大學武漢人工智能研究院具身智能實驗室主任朱毅鑫說:“我們的研究不僅是技術(shù)上的突破,更為理解智能的本質(zhì)提供了全新視角。人類智能深深植根于身體的感知能力,尤其是手部的觸覺體驗對我們認知世界至關(guān)重要。F-TAC Hand的成果表明,豐富的感知能力對于機器智能的發(fā)展同樣不可或缺。”

機器手作為人形機器人與外界交互的重要媒介,是機器人功能性的直接體現(xiàn),需要“人手”參與的工作都是機器手的應(yīng)用場景,在特定場景(如精密裝配)中展現(xiàn)出超越人類手部的穩(wěn)定性。由于其可提供超越人類手部穩(wěn)定性的操作,該科研成果在對操作精度有極高要求的輔助手術(shù)、高精密組裝類工作以及航空航天、應(yīng)急響應(yīng)等領(lǐng)域有廣泛的落地場景。

這項研究成果有望推動機器人技術(shù)在醫(yī)療、工業(yè)制造、特殊環(huán)境作業(yè)等領(lǐng)域的落地應(yīng)用。朱毅鑫博士表示:“未來我們將繼續(xù)深化觸覺感知與機器人控制的結(jié)合,探索更加智能的體感交互范式,為實現(xiàn)真正意義上的通用人工智能奠定基礎(chǔ)。”

他進一步說,“近年來大型語言模型等基于純計算的人工智能取得了顯著進展,但它們在處理物理世界的實際交互任務(wù)時仍面臨巨大挑戰(zhàn)。我們的研究表明,真正的智能行為需要‘知行合一’。F-TAC Hand的成功為‘具身智能’開辟了新的研究方向,這種將高保真物理感知與智能控制系統(tǒng)結(jié)合的方法,代表了通向更高級別機器智能的重要路徑。通過這項研究,我們不僅推動了機器人技術(shù)的發(fā)展,也加深了對智能本質(zhì)的理解,這對構(gòu)建下一代人工智能系統(tǒng)具有重要啟示意義,也將為具身智能與千行百業(yè)融合發(fā)展,賦能我國經(jīng)濟、社會高質(zhì)量發(fā)展,注入新質(zhì)生產(chǎn)力。”

該研究工作得到了武漢市科創(chuàng)局和東湖高新區(qū)國家智能社會治理實驗綜合基地的支持。