宇樹:人形機(jī)器人開啟具身智能新紀(jì)元
【ZiDongHua 之人文化天下收錄關(guān)鍵詞: 機(jī)器人 人工智能 大模型】
宇樹:人形機(jī)器人開啟具身智能新紀(jì)元

“人形機(jī)器人不僅將擁有超越四足機(jī)器人的巨大潛力,更是實現(xiàn)具身智能落地的最佳硬件載體。”這是杭州宇樹科技有限公司(以下簡稱宇樹)聯(lián)合創(chuàng)始合伙人陳立的判斷。
在科技發(fā)展的浪潮中,人形機(jī)器人作為智能科技的杰出代表,正逐步從實驗室走進(jìn)我們的生活。近日,《企業(yè)家》雜志就人形機(jī)器人的研發(fā)與應(yīng)用前景采訪了陳立。他不僅分享了宇樹在四足機(jī)器人領(lǐng)域的開創(chuàng)性成果,更對人形機(jī)器人的上限、發(fā)展?jié)摿σ约懊媾R的挑戰(zhàn)提出了獨到見解。
《企業(yè)家》雜志
弘揚企業(yè)家精神 傳播管理智慧

陳立
杭州宇樹科技有限公司聯(lián)合創(chuàng)始合伙人
01
上限遠(yuǎn)高于四足機(jī)器人
《企業(yè)家》:宇樹在2023年8月,僅用半年時間發(fā)布了全尺寸通用人形機(jī)器人 Unitree H1。作為全球四足機(jī)器人行業(yè)的開創(chuàng)者,您在研發(fā)過程中感受最深的是什么?
陳立:回顧整個Unitree H1的開發(fā)過程,我印象最深刻的有三點。第一,這款H1定位于在工業(yè)場景中承擔(dān)“吃苦耐勞”的功能,對各方面要求非常高。因此,要開發(fā)一款人形機(jī)器人產(chǎn)品,必須對它的可靠性、穩(wěn)定性更具前瞻性。
第二,我們采用了小步快跑的方式進(jìn)行迭代。從H1 1.0學(xué)會走路、H1 2.0學(xué)會搬運物體及對地形的適應(yīng)能力到H1 3.0奔跑速度達(dá)3.3m/s,再到H1 4.0實現(xiàn)了后空翻動作,這一系列功能的完成不是一蹴而就的,而是逐步遞進(jìn)的。
第三,底層技術(shù)積累至關(guān)重要。宇樹的四足機(jī)器人核心零部件如電機(jī)、減速器、電機(jī)驅(qū)動器、編碼器、傳感器、主控甚至電池都采用自研,將四足機(jī)器人的相關(guān)技術(shù)遷移到人形機(jī)器人上,對宇樹來說也是理所當(dāng)然的。雖然人形機(jī)器人與四足機(jī)器人是完全不同的兩個產(chǎn)品,技術(shù)上比四足機(jī)器人更有難度,但它們之間的底層邏輯是相通的。只有掌握了核心技術(shù),才能在產(chǎn)品上發(fā)揮出超乎預(yù)期的能量。
《企業(yè)家》:人形機(jī)器人與四足機(jī)器人的區(qū)別是什么?從四足到人形,宇樹面臨的最大挑戰(zhàn)是什么?
陳立:從現(xiàn)階段來看,四足機(jī)器人在產(chǎn)品穩(wěn)定性、可靠性和負(fù)載能力等方面展現(xiàn)出了比人形機(jī)器人更卓越的性能。但是從潛力來看,人形機(jī)器人或許具有更大的優(yōu)勢。由于人形機(jī)器人的形態(tài)、關(guān)節(jié)設(shè)計等與人類高度相似,它更易于適應(yīng)和融入人類的生活及工作場景,比如進(jìn)行烹飪、操作工具(電鉆、螺絲刀等),甚至駕駛汽車等復(fù)雜任務(wù)。
從四足機(jī)器人發(fā)展到人形機(jī)器人,我們面臨的最大挑戰(zhàn)在于后者需要適應(yīng)更多樣化的環(huán)境和任務(wù),無論是家庭服務(wù)、工業(yè)生產(chǎn)還是公共服務(wù)領(lǐng)域,人形機(jī)器人都需要展現(xiàn)出高度的靈活性和適應(yīng)性。這意味著它不僅要具備強大的感知和認(rèn)知能力,以理解和響應(yīng)各種復(fù)雜場景,還需要擁有卓越的運動控制和操作能力,以執(zhí)行各種復(fù)雜的任務(wù)。
與四足機(jī)器人相比,人形機(jī)器人的復(fù)雜性大大增加,需要考慮其可靠性、穩(wěn)定性、成本、續(xù)航能力以及運動控制的復(fù)雜性。比如,四足機(jī)器人只有12個關(guān)節(jié)電機(jī)(即12個自由度),而宇樹最新的G1人形機(jī)器人擁有43個自由度,電機(jī)數(shù)量是四足機(jī)器人的3到4倍。
目前,我們的核心業(yè)務(wù)仍然是以四足機(jī)器人為主。但伴隨人形機(jī)器人的快速發(fā)展,它在公司業(yè)務(wù)中的比重將會逐步增大,甚至有望超過四足機(jī)器人。
02
實現(xiàn)具身智能最好的形態(tài)
《企業(yè)家》:人形機(jī)器人是實現(xiàn)具身智能最好的形態(tài)嗎?
陳立:是的。人形機(jī)器人是實現(xiàn)具身智能落地的最佳載體。因為具身智能涉及多種感知和控制,類似于人類的視覺、聽覺、嗅覺、觸覺以及大腦和小腦的功能等。人形機(jī)器人也具有類似的結(jié)構(gòu),大腦負(fù)責(zé)認(rèn)知和感知,小腦負(fù)責(zé)運動控制,可以完成各種任務(wù)和動作。
具身智能還包括手和腳的靈巧操作,以及快速的運動能力。具身智能的訓(xùn)練成果可以直接遷移到人形機(jī)器人身上,實現(xiàn)無縫對接。
《企業(yè)家》:人形機(jī)器人非常依賴AI大模型的發(fā)展嗎?
陳立:是的。幾年前,人工智能的發(fā)展被認(rèn)為已經(jīng)到達(dá)瓶頸。這是因為人工智能的泛化能力不足,無法實現(xiàn)舉一反三,只能回答特定問題,無法進(jìn)行更深入的對話。
然而,隨著大模型的出現(xiàn),人工智能的泛化能力得到了顯著提升。例如,使用ChatGPT進(jìn)行對話時,它能夠根據(jù)針對性的問題進(jìn)行有條理的回答,提供了更好的用戶體驗。這主要得益于AI大模型的強大泛化能力。

△Unitree G1 具有超越常人的靈活性,擁有超大關(guān)節(jié)遠(yuǎn)動角度空間,能夠完成更加精準(zhǔn)和靈活的動作。
對于人形機(jī)器人來說,面臨的任務(wù)是多樣且復(fù)雜的,需要它具備更強的泛化能力。比如,讓人形機(jī)器人在桌子上擺放西紅柿、菜刀和砧板,完成握住菜刀切西紅柿等任務(wù),這需要它具備更高的泛化能力才能完成。
AI大模型讓人形機(jī)器人進(jìn)入千家萬戶提供了巨大的可能性。在AI大模型尚未成熟之前,人形機(jī)器人的應(yīng)用可能僅限于工廠中的特定工序,完成一些簡單且重復(fù)性的工作,這與現(xiàn)有的機(jī)械臂并無太大差異。
然而,隨著AI大模型的發(fā)展,人形機(jī)器人的功能和應(yīng)用范圍得到了極大的拓展。它不再局限于簡單的工廠工作,而是能夠勝任更加復(fù)雜、多樣化的任務(wù)。這是因為AI大模型賦予了它強大的泛化能力和學(xué)習(xí)能力,使其能夠像人類一樣處理各種復(fù)雜的場景和問題。
《企業(yè)家》:既然AI大模型對人形機(jī)器人如此重要,宇樹是如何布局的?
陳立:目前,宇樹H1已經(jīng)開始使用英偉達(dá)的人形機(jī)器人通用基礎(chǔ)模型,這些大模型提高了人形機(jī)器人在仿真環(huán)境中的學(xué)習(xí)效率,也讓我們的研發(fā)團(tuán)隊能夠更快地開發(fā)出運動控制模型。
2023年9月,宇樹人形機(jī)器人團(tuán)隊的幾位工程師第一次開發(fā)人形機(jī)器人運動AI大模型時,表現(xiàn)得相當(dāng)糟糕,機(jī)器人在運動時搖搖晃晃,甚至無法站立。有一天晚上,團(tuán)隊的一位工程師在電腦上對AI大模型進(jìn)行訓(xùn)練,忘記關(guān)機(jī)便回家了。第二天回來時,發(fā)現(xiàn)訓(xùn)練出來的性能超出了預(yù)期。這正是當(dāng)前人工智能技術(shù)為人形機(jī)器人帶來的驚喜。
盡管AI大模型很重要,但仍存在不足之處和挑戰(zhàn)。目前,語言大模型的應(yīng)用更為廣泛,但僅依靠語言大模型是不夠的。實際上,對于更智能的人形機(jī)器人來說,它還需要具備決策能力,以及如何協(xié)調(diào)雙手或雙腿來完成任務(wù),這也是未來需要克服的難點。
AI大模型面臨成本和能源效率兩方面的挑戰(zhàn)。比如,OpenAI在開發(fā)如GPT-4模型時,資源消耗大。不僅大量依賴GPU板卡,同時又非常耗電。
03
落地還差什么?
《企業(yè)家》:H1的落地應(yīng)用情況如何?宇樹又是如何了解客戶的真實需求的?
陳立:我們已經(jīng)在高??蒲性核?、能源行業(yè)如國家電網(wǎng)、汽車工廠等場景落地。
在具體的場景下有怎樣的需求,人形機(jī)器人能執(zhí)行哪些任務(wù),這需要雙方共同探索。比如,我們與國網(wǎng)成立了聯(lián)合攻關(guān)實驗室,主要探索地下隧道和地下管廊等惡劣環(huán)境下,如何引入人形機(jī)器人進(jìn)行定期巡檢和維修。
如果不建立這種合作,我們可能不了解這些需求和場景,也不清楚工人在這些環(huán)境中面臨的問題,以及我們的人形機(jī)器人如何完成這些工作。合作的基礎(chǔ)是雙方互補。
目前在具體需求方面,更多是需求方主動找到我們。例如一些工廠的零部件裝配由工人完成,隨著勞動力成本的上升,他們想改變,那么人形機(jī)器人就非常適合,因此會主動找到我們,我們再進(jìn)行評估。如果適合使用人形機(jī)器人,就會進(jìn)行現(xiàn)場測試,并與他們的團(tuán)隊共同合作。
為了推動人形機(jī)器人產(chǎn)業(yè)發(fā)展,我認(rèn)為強強聯(lián)合非常重要,而且這種合作方式是無邊界的,這樣不僅效率高,而且相互之間的配合程度也會非常好。
《企業(yè)家》:為了加速人形機(jī)器人落地,您認(rèn)為還需要做些什么?
陳立:我認(rèn)為目前應(yīng)著重考慮以下兩個方面的問題。一方面,我們需要更深入地了解產(chǎn)品的應(yīng)用。比如,宇樹可能對某些行業(yè)的需求并不了解,但行業(yè)內(nèi)的專業(yè)人士卻非常了解。因此,我們需要與他們充分溝通,了解他們的需求和痛點。另一方面,我們需要考慮在實際場景中解決問題的方法。有時候,人形機(jī)器人可能無法完成某些工作或者成本過高。這時,我們可以通過工程化手段,在不改變機(jī)器人本身的情況下,調(diào)整場景或適配工程,以降低成本并提高適用性。
《企業(yè)家》:隨著人形機(jī)器人的發(fā)展,會衍生出哪些新生態(tài)?如何參與這場浪潮?
陳立:例如人形機(jī)器人進(jìn)入家庭充當(dāng)保姆的角色。對于家政公司來說,未來可能變成提供人形機(jī)器人租賃服務(wù)的公司。同樣,工廠中的工人也會改變。未來更多的人形機(jī)器人可能會進(jìn)入工廠,而勞務(wù)市場服務(wù)的對象可能就是人形機(jī)器人。人形機(jī)器人進(jìn)入工廠并不是取代工人的工作,而是讓工人從枯燥的工作中解放出來,轉(zhuǎn)而從事更具技術(shù)含量的工作,推動整個社會的進(jìn)步。
從長期來看,特別是在未來3~5年,對于提供服務(wù)類型的業(yè)務(wù),本地合作伙伴將發(fā)揮關(guān)鍵作用。我們可以輸出人形機(jī)器人本體,而本地的集成商、代理商或合作伙伴則負(fù)責(zé)提供本地化的服務(wù),實現(xiàn)共贏。
《企業(yè)家》:對于正在創(chuàng)業(yè)的人,您有哪些經(jīng)驗和建議?
陳立:作為一名創(chuàng)業(yè)者,我在整個創(chuàng)業(yè)過程中面臨很多選擇和誘惑。作為企業(yè)的創(chuàng)始人/合伙人,我認(rèn)為重要的是堅守自己的內(nèi)心,不被外界誘惑所左右。不能因為某個領(lǐng)域很火就去跟風(fēng),而應(yīng)該堅持自己的方向和未來規(guī)劃,避免精力分散。
此外,如何帶領(lǐng)團(tuán)隊也非常重要。要讓團(tuán)隊成員清楚公司的核心價值觀、產(chǎn)品理念,共同為公司的發(fā)展而努力。
我要收藏
點個贊吧
轉(zhuǎn)發(fā)分享
評論排行