【ZiDongHua 之品牌自定位收錄關(guān)鍵詞:大模型 機(jī)器人 大模型 自動(dòng)駕駛
  
  00后耶魯博士攜產(chǎn)業(yè)鏈老兵創(chuàng)業(yè),半年造出的人形機(jī)器人要量產(chǎn)了 | U報(bào)道
  
  在人工智能不斷突破邊界的今天,具身智能正掀起新一輪技術(shù)革命浪潮。作為這波熱潮中的一枚創(chuàng)業(yè)新星,UniX AI僅成立半年,便推出兩款自主研發(fā)的人形機(jī)器人產(chǎn)品,其中輪式雙臂機(jī)器人Wanda即將步入量產(chǎn)階段。
  
  近日,UniX AI CEO&創(chuàng)始人楊豐瑜圍繞人形機(jī)器人產(chǎn)品切入場(chǎng)景、研發(fā)路線、觸覺(jué)大模型等話題,接受「甲子蘇州」專(zhuān)訪,闡述UniX AI對(duì)具身智能的獨(dú)特理解,展示這一段不同尋常的產(chǎn)業(yè)化加速之路。
  
  來(lái)源 | 甲子蘇州
  
  作者 | 八度
  
  設(shè)想一個(gè)場(chǎng)景,對(duì)機(jī)器人說(shuō)一句:“我想吃一份減肥餐。”
  
  它在幾分鐘內(nèi),給你拿上一塊嫩豆腐,給土豆絲胡蘿卜削皮,制作出一碗減脂豆腐湯,并拿出勺子端到你面前,待你吃完,給你把盤(pán)子刷了洗了。
  
  當(dāng)你下令“幫我把衣服洗了”,它能自己拿起你的臟衣服,放入洗衣機(jī),并操作好洗衣機(jī)的各項(xiàng)模式。
  
  這些場(chǎng)景好似只存在于科幻影片,但如今,它已經(jīng)進(jìn)入現(xiàn)實(shí)。在優(yōu)理奇科技(UniX AI)辦公室內(nèi),Wanda和Martian,兩款人形機(jī)器人,正在廚房、臥室等家庭場(chǎng)景中模擬運(yùn)作。
 
  
  UniX AI是一家創(chuàng)立半年多的公司,為何能迅速開(kāi)發(fā)兩款人形機(jī)器人產(chǎn)品?「甲子蘇州」在深入對(duì)話后,發(fā)現(xiàn)了兩點(diǎn)原因:
  
  其一,這和創(chuàng)始人和團(tuán)隊(duì)的技術(shù)沉淀有很大關(guān)系。創(chuàng)始人楊豐瑜,00年出生,畢業(yè)于密歇根大學(xué)工學(xué)院計(jì)算機(jī)專(zhuān)業(yè),并于耶魯大學(xué)進(jìn)行博士深造,目前已發(fā)表15篇機(jī)器人視觸覺(jué)論文。楊豐瑜提出了世界首個(gè)融合觸覺(jué)的預(yù)訓(xùn)練多模態(tài)大模型UniTouch。
  
  在楊豐瑜看來(lái),觸覺(jué)最大的應(yīng)用一定是機(jī)器人。
  
  “這波具身智能浪潮最重要的就是通用和泛化,我們?cè)跈C(jī)器人材料識(shí)別、非剛性物體抓取操作等精細(xì)動(dòng)作上,觸覺(jué)大模型都發(fā)揮了非常重要的作用。”楊豐瑜說(shuō)道。
  
  換言之,觸覺(jué)大模型,可以讓機(jī)器人連續(xù)處理家庭場(chǎng)景中的精細(xì)活,這項(xiàng)技術(shù)正是UniX AI的長(zhǎng)處。
  
  其二,要想具身智能機(jī)器人真正產(chǎn)業(yè)化,楊豐瑜非常清楚,一定要降成本。“我們的產(chǎn)品必須是C端用戶(hù)可以接受的成本。如果我賣(mài)幾十萬(wàn)、上百萬(wàn),那就不是C端場(chǎng)景了。”
  
  楊豐瑜表示,團(tuán)隊(duì)在工程和供應(yīng)鏈管理上投入了巨大的精力,特別是在優(yōu)化物料清單(BOM)方面。
  
  當(dāng)然,這也與UniX AI地處蘇州有很大關(guān)系。他提到,蘇州在許多關(guān)鍵零部件的生產(chǎn)上,提供了強(qiáng)有力的支持。結(jié)合自主研發(fā),UniX AI從一開(kāi)始就直奔機(jī)器人的量產(chǎn),并且力求普惠性。
  
  楊豐瑜向「甲子蘇州」透露,UniX AI的物料清單(BOM)成本介于一部蘋(píng)果手機(jī)和一輛入門(mén)級(jí)汽車(chē)的價(jià)格之間。
 
  
  由「甲子蘇州」現(xiàn)場(chǎng)拍攝
  
  伴隨大模型發(fā)展,具身智能的熱度“扶搖直上”,輿論場(chǎng)聲量日益高漲,相關(guān)公司的融資動(dòng)輒數(shù)億。
  
  作為這波熱潮中的一枚創(chuàng)業(yè)新星,UniX AI為何選擇先從家庭場(chǎng)景切入?具身智能技術(shù)發(fā)展到了哪一步?創(chuàng)業(yè)半年,楊豐瑜向我們展現(xiàn)了他對(duì)行業(yè)的觀察,和作為局中人的思考。
  
  以下為「甲子蘇州」與楊豐瑜的對(duì)話內(nèi)容,經(jīng)過(guò)編輯整理。
  
  01
  
  00后創(chuàng)業(yè),瞄準(zhǔn)消費(fèi)級(jí)通用機(jī)器人
  
  甲子蘇州:你之前提到,公司的核心邏輯是從場(chǎng)景出發(fā)。你從什么時(shí)候確定公司圍繞C端市場(chǎng)及家庭場(chǎng)景的機(jī)器人展開(kāi)?為什么瞄準(zhǔn)消費(fèi)級(jí)?
  
  楊豐瑜:對(duì),這是一個(gè)非常好的問(wèn)題。在選擇應(yīng)用場(chǎng)景時(shí),我們有一整套自己的邏輯,主要基于三個(gè)關(guān)鍵點(diǎn)。
  
  首先,具身智能這個(gè)行業(yè)在今天還處于非常早期的階段,并沒(méi)有太成熟。
  
  在我看來(lái),如果我們拿蘋(píng)果手機(jī)來(lái)類(lèi)比這個(gè)賽道的話,它可能還處在“iPhone 1”時(shí)代。所以我們認(rèn)為,在挑場(chǎng)景的時(shí)候優(yōu)先要考慮能不能“真的賣(mài)出去”,賣(mài)出去的前提是,容錯(cuò)率不能太低。
  
  我們今天討論的這一波具身智能,無(wú)論從場(chǎng)景的復(fù)雜度還是泛化性要求來(lái)看,都非常高。如果想從Day 1就做到99%甚至更高的準(zhǔn)確率,那是非常困難的。因此,我們選擇場(chǎng)景時(shí),必須選擇一些即使只有80%、90%或者95%的準(zhǔn)確率,客戶(hù)也愿意買(mǎi)單的場(chǎng)景。我們認(rèn)為,對(duì)于初期來(lái)說(shuō),這可能是一個(gè)比較好的起點(diǎn)。
  
  其次,我們不會(huì)一開(kāi)始就深入到特定的工廠生產(chǎn)線,因?yàn)榻裉旌芏嗳硕荚诤?ldquo;上產(chǎn)線”這個(gè)事兒,但我們觀察過(guò)很多生產(chǎn)線,也和很多伙伴交流過(guò),工廠對(duì)容錯(cuò)率的要求非常嚴(yán)格。
  
  在許多高復(fù)雜性場(chǎng)景中,機(jī)器人的表現(xiàn)還不夠精準(zhǔn),所以我們認(rèn)為在這種情況下,選擇容錯(cuò)率較高的場(chǎng)景是很重要的一點(diǎn)。
  
  第三,我們的終極目標(biāo)是做一個(gè)通用具身的場(chǎng)景,也就是說(shuō),很多年以后,機(jī)器人會(huì)是一個(gè)科幻片里看到的,能夠執(zhí)行任何任務(wù)的通用機(jī)器人,我們公司從上到下都高度相信這件事兒能做成。
  
  因此以終為始,我們認(rèn)為數(shù)據(jù)對(duì)智能機(jī)器人的發(fā)展至關(guān)重要。我們?cè)诳紤]數(shù)據(jù)飛輪的時(shí)候,不光考慮數(shù)據(jù)的絕對(duì)數(shù)量,也會(huì)考慮數(shù)據(jù)的質(zhì)量和多樣性,我們希望前期收集到的數(shù)據(jù)是高質(zhì)量、有意義的。
  
  甲子蘇州:也就是說(shuō),在你看來(lái),C端市場(chǎng)的容錯(cuò)率更高?
  
  楊豐瑜:是的,公司幾個(gè)核心高管都是從大的場(chǎng)景方出來(lái),包括C端、工廠、物流、供應(yīng)鏈、to G等幾乎所有的潛在場(chǎng)景我們團(tuán)隊(duì)原來(lái)都深度參與過(guò)。目前大多數(shù)面向企業(yè)(ToB)的需求我們都慎重評(píng)估過(guò),客觀地說(shuō)對(duì)初創(chuàng)公司不算特別友好。我們也不完全鎖定在C端這個(gè)場(chǎng)景里面,B端我們也考慮做,但是有選擇性地做。
  
  說(shuō)到容錯(cuò)率,B端工業(yè)場(chǎng)景,其實(shí)是要求你不允許出錯(cuò)。因?yàn)槲覀兪褂脵C(jī)器人的地方都是量產(chǎn)場(chǎng)景,任何一個(gè)小錯(cuò)誤都可能導(dǎo)致災(zāi)難性的后果。比如在汽車(chē)產(chǎn)業(yè)中,可能就要返廠,這個(gè)影響非常大。
  
  在家庭場(chǎng)景中,容錯(cuò)率高一些,這其實(shí)也是相對(duì)的。比如機(jī)器人在洗衣服時(shí)不小心將衣物掉在地上,這影響沒(méi)有太大,可以讓機(jī)器人撿起來(lái)再放回洗衣機(jī)。當(dāng)然家庭場(chǎng)景中也要求安全,所以我們?cè)诎踩陨舷铝撕芏喙Ψ颉?/div>
 
  
  甲子蘇州:在創(chuàng)業(yè)之前你做過(guò)怎樣的調(diào)研?這種消費(fèi)級(jí)場(chǎng)景的機(jī)器人市場(chǎng)需求有多大?
  
  楊豐瑜:在創(chuàng)業(yè)之前,我們做了大量調(diào)研,不然不會(huì)盲目進(jìn)入這個(gè)賽道。當(dāng)然,無(wú)論是技術(shù)還是場(chǎng)景,它們都是快速變化的。但我們對(duì)我們選擇的這個(gè)場(chǎng)景是有高度的信心。
  
  我認(rèn)為第一點(diǎn)是,消費(fèi)級(jí)機(jī)器人理論上市場(chǎng)空間非常大,它不僅包括家庭,還包括零售、辦公服務(wù)等場(chǎng)景。我們只看家庭,中國(guó)家庭的規(guī)模大約有5億戶(hù),假設(shè)我們的產(chǎn)品能覆蓋1%的家庭,再乘以我們產(chǎn)品的單價(jià),整個(gè)潛在的市場(chǎng)空間至少在千億元以上。當(dāng)然,家庭場(chǎng)景肯定有自己的挑戰(zhàn)。
  
  所以,如果我們想盡快實(shí)現(xiàn)機(jī)器人的普及,特別是在消費(fèi)級(jí)場(chǎng)景中,我認(rèn)為有幾個(gè)要素。
  
  第一個(gè)要素是從成本端考慮,我們的產(chǎn)品必須是C端用戶(hù)可以接受的成本。如果我賣(mài)幾十萬(wàn)、上百萬(wàn),那就不是C端場(chǎng)景了。
  
  基于此,我們團(tuán)隊(duì)投入了大量精力在供應(yīng)鏈上,包括自研優(yōu)化BOM(物料清單)等方面,我們會(huì)非??焖俚貙⒊杀窘档紺端用戶(hù)可以接受的水平。我認(rèn)為這是非常重要的第一點(diǎn)。
  
  第二點(diǎn)從價(jià)值上講,強(qiáng)替代邏輯在具身智能的第一輪演進(jìn)中很難實(shí)現(xiàn),所謂的強(qiáng)替代邏輯,就是要求你新的產(chǎn)品與原有的東西進(jìn)行比較。比如在家庭中,我賣(mài)的機(jī)器人,我可以負(fù)責(zé)任地說(shuō),我的第一代產(chǎn)品替代不了人,也不是用來(lái)替代人的。無(wú)論是從速度、準(zhǔn)確率還是智能性來(lái)看,都跟人沒(méi)有辦法比較。
  
  當(dāng)然我對(duì)整個(gè)機(jī)器人行業(yè)的長(zhǎng)期發(fā)展,非常有信心。我堅(jiān)信未來(lái)的某一天,機(jī)器人可能跟人差不多,甚至超過(guò)人的效率,就像我們?cè)诼娪爸锌吹降墓芗屹Z維斯一樣。
  
  但我們從務(wù)實(shí)的角度上來(lái)看,這是一個(gè)漸進(jìn)式的路線,人機(jī)混合將會(huì)長(zhǎng)期存在。這種人機(jī)混合不一定是物理上的混合,可能是人和機(jī)器人在同一個(gè)空間內(nèi)工作,也可能是工序上或流程上的分配。類(lèi)似于自動(dòng)駕駛的L2、L3級(jí)別,機(jī)器人或自動(dòng)駕駛的智能體可能能夠處理80%、90%甚至99%的情況。但在一些極端情況下,可能需要人為干預(yù)。
  
  從整個(gè)產(chǎn)品的角度來(lái)看,L0意思是純?nèi)斯みh(yuǎn)程控制操作,L2意味著快速學(xué)習(xí)一些自定義功能,再加上一些半人為干預(yù)的功能,再加上少量的幾乎不需要人為參與的全閉環(huán)功能。我覺(jué)得它是這么一個(gè)漸進(jìn)式的路線。
  
  從我們近期的觀察來(lái)看,包括特斯拉Optimus最新的發(fā)布會(huì)也從一味的強(qiáng)調(diào)B端到更多的C端人機(jī)混合漸進(jìn)式路線,這和我對(duì)行業(yè)的理解思考不謀而合。
  
  甲子蘇州:以前自動(dòng)駕駛經(jīng)常講L2、L4,現(xiàn)在具身智能也有L2、L4路線出來(lái)了?
  
  楊豐瑜:其實(shí)沒(méi)有,這是我們自己內(nèi)部類(lèi)比的自動(dòng)駕駛路線,可能也有別的名字,這樣主要便于理解,總之它是個(gè)漸進(jìn)式的路線。
  
  甲子蘇州:現(xiàn)在你會(huì)怎么分配學(xué)業(yè)和創(chuàng)業(yè)之間的時(shí)間精力?
  
  楊豐瑜:其實(shí)我覺(jué)得不矛盾,我現(xiàn)階段精力差不多全部在創(chuàng)業(yè)上面了,前兩天我又中了一篇文章,我今年應(yīng)該中了接近10篇關(guān)于人工智能或機(jī)器人領(lǐng)域的頂會(huì),所以現(xiàn)在我也是從學(xué)校里on leave(休假)全職創(chuàng)業(yè)做事。
  
  02
  
  半年自研機(jī)器人
  
  優(yōu)理奇選擇“先入為主”
  
  甲子蘇州:UniX AI的首款產(chǎn)品是輪臂式機(jī)器人,為什么選擇輪臂式,而不是現(xiàn)在大火的人形機(jī)器人、雙足機(jī)器人?
  
  楊豐瑜:我覺(jué)得第一點(diǎn)是從技術(shù)層面來(lái)講,你可以看到我們實(shí)際上有兩款產(chǎn)品,一款叫Wanda(輪式雙臂),另一款叫Martian(人形雙足)。從技術(shù)戰(zhàn)略上講,我們是瞄準(zhǔn)難度更大的雙足加上靈巧手來(lái)進(jìn)行研發(fā)的。
  
  第二點(diǎn),我們從商業(yè)化的角度來(lái)考慮這個(gè)問(wèn)題。我認(rèn)為有很多因素需要考慮,其中之一是場(chǎng)景的成熟度。今天很多場(chǎng)景并不一定需要雙足機(jī)器人來(lái)做,輪臂式機(jī)器人完全能夠覆蓋。
  
  而且,輪臂加上機(jī)械爪的方案,無(wú)論從前期開(kāi)發(fā)、成本,還是推廣角度來(lái)看,都相對(duì)有優(yōu)勢(shì)。我們認(rèn)為這種方案基本上適用于家庭和絕大多數(shù)的商業(yè)服務(wù)場(chǎng)景,甚至在工廠里,原來(lái)使用AGV的地方,我認(rèn)為都可以使用輪式,除了可能需要上樓梯或戶(hù)外的情況。
  
  當(dāng)然,我們最終的目標(biāo)肯定是瞄準(zhǔn)全場(chǎng)景的通用性,這是一個(gè)循序漸進(jìn)的過(guò)程。
  
  甲子蘇州:其實(shí)還是漸進(jìn)式路線的一環(huán)。
  
  楊豐瑜:是的。
  
  甲子蘇州:科技圈經(jīng)常用“拿著錘子找釘子”來(lái)比喻只有技術(shù)沒(méi)有落地場(chǎng)景。你認(rèn)為現(xiàn)在UniX AI瞄準(zhǔn)的消費(fèi)級(jí)機(jī)器人存在這一現(xiàn)象嗎?
  
  楊豐瑜:我們公司整個(gè)核心高管都是從產(chǎn)業(yè)里面出來(lái)的,我們擁有全球性的領(lǐng)軍人才,加上產(chǎn)業(yè)界經(jīng)驗(yàn)非常豐富的老兵,所以我們對(duì)應(yīng)用場(chǎng)景的理解非常深刻,這是第一點(diǎn)。
  
  第二點(diǎn)是,我們的研發(fā)是全棧式的自研,我們的產(chǎn)品團(tuán)隊(duì)會(huì)做非常深入的一些調(diào)研,我們不會(huì)閉門(mén)造車(chē),我們也不會(huì)盲目追隨許多大B的長(zhǎng)尾需求。
  
  從功能上講,我們是L4+L2+L0漸進(jìn)式的路線,以上這幾個(gè)點(diǎn)是互相結(jié)合、互相擴(kuò)充的。
  
  我們制定這三個(gè)技術(shù)路線和功能,其實(shí)也是避免“拿著錘子找釘子”的現(xiàn)象。
  
  甲子蘇州:你們?cè)趧?chuàng)業(yè)的時(shí)候,在行業(yè)里有對(duì)標(biāo)的公司嗎?
  
  楊豐瑜:具身智能,客觀來(lái)說(shuō),是去年才出現(xiàn)的一個(gè)新事物。在國(guó)內(nèi),我們的友商成立時(shí)間最早是2022年底,絕大多數(shù)是在2023年。
  
  實(shí)際上,我想創(chuàng)業(yè)的時(shí)候,應(yīng)該是去年這段時(shí)間,我們大概花了半年左右的時(shí)間來(lái)招攬人才。那個(gè)時(shí)候,我認(rèn)為整個(gè)具身智能行業(yè)都還在一個(gè)早期階段,談不上對(duì)標(biāo),因?yàn)榇蠹叶紱](méi)有產(chǎn)品,很多商業(yè)化路徑都沒(méi)有形成。
  
  所以我覺(jué)得整個(gè)行業(yè)中所有人都在摸著石頭過(guò)河做這件事,大家勇于走出了第一步,我們也愿意在具身智能行業(yè)里面作為一個(gè)先驅(qū)者不斷探索技術(shù)的極限、產(chǎn)品的極限。
  
  甲子蘇州:此前優(yōu)理奇對(duì)外稱(chēng),首批百臺(tái)人形機(jī)器人即將量產(chǎn),現(xiàn)在量產(chǎn)計(jì)劃和節(jié)奏大致如何?
  
  楊豐瑜:我們從第一代產(chǎn)品發(fā)布以來(lái),收到的訂單意向已經(jīng)超出了我們的預(yù)期,我們正在緊鑼密鼓地研發(fā)Wanda 2.0版本,后續(xù)的產(chǎn)品會(huì)分批次的交付。這一百臺(tái)機(jī)器人的主要價(jià)值不在于它能夠?yàn)槲覀儺a(chǎn)生多少收入,而在于可以極大程度鍛煉團(tuán)隊(duì)的量產(chǎn)能力以及深入場(chǎng)景與用戶(hù)一起共創(chuàng)打磨產(chǎn)品。我們認(rèn)為,“三代出精品”是非常重要的一件事。
  
  03
  
  當(dāng)機(jī)器人遇見(jiàn)觸覺(jué)大模型
  
  甲子蘇州:我們看到,優(yōu)理奇在觸覺(jué)大模型上是有自己的技術(shù)之道,觸覺(jué)大模型,可以讓機(jī)器人連續(xù)處理家庭的精細(xì)活,這算是你們最大的亮點(diǎn)之一?
  
  楊豐瑜:當(dāng)然,我本人是搞觸覺(jué)傳感研究出身。我們所說(shuō)的觸覺(jué),因?yàn)槲以瓉?lái)是這塊研究的第一作者,所以可以肯定地說(shuō),它是全世界第一個(gè)包含觸覺(jué)的多模態(tài)大模型。
  
  我認(rèn)為觸覺(jué)在操作上是“皇冠上的明珠”,在許多精細(xì)操作層面上,比如我需要把一個(gè)水瓶蓋擰緊,需要擰到什么程度,水才不會(huì)漏,才能確保它被擰緊?或者怎么把一些比較軟的物體拿起來(lái)?
  
  其實(shí)我們之前發(fā)布的demo你可以看到,我們甚至可以用我們的觸覺(jué)算法拿起一塊嫩豆腐,所以毋庸置疑,在觸覺(jué)傳感領(lǐng)域,這絕對(duì)是我們一個(gè)非常大的競(jìng)爭(zhēng)優(yōu)勢(shì)。
  
  在模型層面上,我們擁有全世界最頂尖的包含觸覺(jué)的多模態(tài)大模型。在數(shù)據(jù)層面上,全世界最大的兩個(gè)包含觸覺(jué)的視觸覺(jué)數(shù)據(jù)集都是我本人做的。當(dāng)然,我們?cè)趧?chuàng)業(yè)之后又將這些數(shù)據(jù)集的規(guī)模擴(kuò)大了一個(gè)量級(jí)。
  
  觸覺(jué)大模型,在絕大部分的物理世界交互中有極其重要的作用,也能沉淀具身智能相對(duì)稀缺的數(shù)據(jù)。
  
  甲子蘇州:這些已有的技術(shù),是支撐你們快速進(jìn)行產(chǎn)品研發(fā)的重要支撐?
  
  楊豐瑜:是,剛剛我們講的是觸覺(jué)傳感領(lǐng)域,這是我自己的一些技術(shù)。我們團(tuán)隊(duì)不只是我一個(gè)人的技術(shù)結(jié)晶,我們還有一套感知操作解耦的范式。
  
  我們看到這一代的具身智能核心變量是泛化,但很可惜的是,生搬硬套端到端模型的做法,反而沒(méi)有用上大模型帶來(lái)的泛化能力。通過(guò)感知和操作解耦,我們有一套基于關(guān)鍵點(diǎn)的模仿學(xué)習(xí)可以快速通過(guò)少量示教模仿學(xué)習(xí)動(dòng)作實(shí)質(zhì)。同時(shí)通過(guò)我們自己預(yù)訓(xùn)練的觸覺(jué)融合多模態(tài)大模型的泛化能力,在物體、場(chǎng)景、運(yùn)動(dòng),三個(gè)維度達(dá)到非常強(qiáng)的泛化性。
  
  另一個(gè)重要的點(diǎn)是,我們用多模態(tài)反饋?zhàn)隽碎]環(huán)的控制。我覺(jué)得具身智能從定義上講,就是跟環(huán)境實(shí)時(shí)交互,并通過(guò)環(huán)境交互反饋的數(shù)據(jù)不斷優(yōu)化它的策略的過(guò)程。
  
  所以,我們不是一套開(kāi)環(huán)邏輯,比如我要讓機(jī)器人去抓一個(gè)東西,不是說(shuō)“好的,我看到了,我要抓取一個(gè)點(diǎn),然后開(kāi)始執(zhí)行傳統(tǒng)的運(yùn)動(dòng)控制算法”。如果過(guò)程中物體位置發(fā)生挪動(dòng),或者中間出現(xiàn)障礙物需要繞行,這些都是原來(lái)開(kāi)環(huán)沒(méi)有辦法做到的,但我們可以做到非常強(qiáng)的一個(gè)閉環(huán)控制。
  
  另外,我們的模型是一個(gè)白盒模型,而不是一個(gè)端到端的純黑盒模型。這意味著我們有幾個(gè)關(guān)鍵點(diǎn),可以人為地進(jìn)行可視化,并進(jìn)行添加、刪除或修改。你可以理解為,比如讓大家一起參加考試,其他一些端到端的方式可能只是輸入題目,然后輸出答案,沒(méi)有中間過(guò)程,你不知道為什么對(duì),也不知道為什么錯(cuò)。這種模型的可干預(yù)性和可糾錯(cuò)性實(shí)際上很差。
  
  但我們的白盒模型的可解釋性非常高,我們兼具了強(qiáng)大的泛化性和靈活性,能夠支持非常復(fù)雜的任務(wù)。另外,我們對(duì)數(shù)據(jù)的利用率非常高,只需要非常少量的數(shù)據(jù)就能做到非常強(qiáng)的泛化性。
  
  而且,從算法層面上講,我覺(jué)得機(jī)器人一定是軟硬件深度耦合的結(jié)果。我們的算法和硬件同步開(kāi)發(fā),軟件強(qiáng)耦合,迭代速度非???。我們的硬件成本基本上在行業(yè)中做到了極致。
  
  同時(shí),我還想補(bǔ)充一點(diǎn),我們對(duì)算力的要求非常低,是真正可端側(cè)訓(xùn)練部署的模型架構(gòu),我們甚至在和一些國(guó)產(chǎn)GPU探索合作機(jī)會(huì)。
  
  所以在WRC上,可以看到我們不需要在機(jī)器人旁邊插上一臺(tái)電腦。我的機(jī)器人可以使用一些工控機(jī)和端側(cè)芯片來(lái)完成很多任務(wù),滿(mǎn)足了具身智能在場(chǎng)景中發(fā)揮作用的前提??梢砸贿呉苿?dòng)一邊操作,這在行業(yè)里非常難得。
  
  04
  
  具身智能機(jī)器人的“普惠點(diǎn)”
  
  甲子蘇州:聽(tīng)說(shuō)UniX AI的團(tuán)隊(duì)中有很多從機(jī)器人、汽車(chē)產(chǎn)業(yè)出來(lái)的供應(yīng)鏈專(zhuān)家,在團(tuán)隊(duì)搭建上你是如何考慮的?如何看待供應(yīng)鏈的重要性?
  
  楊豐瑜:我覺(jué)得這個(gè)問(wèn)題問(wèn)得非常好。從第一天開(kāi)始,我們就堅(jiān)決要走全棧式的軟硬件深度耦合的路線。這件事從一開(kāi)始就非常明確,因?yàn)槲覀兛醋詣?dòng)駕駛,最終能夠走到終局的要么是主機(jī)廠,如特斯拉,要么是跟主機(jī)廠深度綁定的一些公司。
  
  所以,從軟硬件的角度來(lái)講,我們一定是兩手都要抓,兩手都要硬。你剛談到供應(yīng)鏈,供應(yīng)鏈更多是在硬件層面,我們整個(gè)硬件團(tuán)隊(duì)也投入了非常大精力,我覺(jué)得硬件團(tuán)隊(duì)有幾個(gè)價(jià)值:
  
  第一,我們整個(gè)軟件核心自研實(shí)現(xiàn)了指數(shù)級(jí)別的成本降低。今天很多公司如果依靠外購(gòu)來(lái)組裝一個(gè)機(jī)器人,現(xiàn)在市面上能做人形機(jī)器人或者搭建人形機(jī)器人框架的公司,雖然沒(méi)有上百家,肯定也有大幾十家。所以,組裝一個(gè)機(jī)器人本身并沒(méi)有大家想象的那么困難。但是,如果要把機(jī)器人賣(mài)到實(shí)際場(chǎng)景中,從降本的角度考慮,這是非常重要的事。因?yàn)榻裉烊诵螜C(jī)器人還沒(méi)有起量,這是一個(gè)先有雞還是先有蛋的問(wèn)題。
  
  第二,我前面反復(fù)強(qiáng)調(diào)初期快速迭代的能力非常重要。我們有一個(gè)非常精干的硬件團(tuán)隊(duì),使得我們的產(chǎn)品開(kāi)發(fā)迭代速度非??欤绕涫俏覀兛梢噪S時(shí)發(fā)現(xiàn)問(wèn)題、隨時(shí)修改。
  
  比如,我們的軟件深度耦合了很多需求,這些需求不是硬件本身的需求,而是由場(chǎng)景、由實(shí)現(xiàn)這個(gè)場(chǎng)景的算法端提出的需求,這些需求可能會(huì)發(fā)生變化。所以,我們需要保證一個(gè)非常敏捷高效的迭代速度。如果依靠外購(gòu),這件事很難做到。外購(gòu)一方面很多時(shí)候只能買(mǎi)到一些標(biāo)品,這些標(biāo)品不能滿(mǎn)足特定場(chǎng)景的需求。如果讓他們定制化開(kāi)發(fā),靈活性又不如自己來(lái)做。
  
  第三點(diǎn)是我們?cè)谒惴ㄉ鲜且粋€(gè)白盒,但我們也希望在硬件上接近一個(gè)白盒。因?yàn)榻裉斓臄?shù)據(jù)飛輪肯定是一個(gè)長(zhǎng)周期的事情,不是一兩年就能見(jiàn)效的。就自動(dòng)駕駛而言,數(shù)據(jù)飛輪才初見(jiàn)成效。
  
  所以,我們一定要考慮到長(zhǎng)周期內(nèi)硬件的遷移復(fù)用,以及數(shù)據(jù)的遷移復(fù)用,這是非常關(guān)鍵的。
  
  甲子蘇州:你在選人上有哪些標(biāo)準(zhǔn)?
  
  楊豐瑜:可以肯定的是,我們不會(huì)過(guò)度擴(kuò)張團(tuán)隊(duì)。我們現(xiàn)在大約有100人的規(guī)模,不準(zhǔn)備快速擴(kuò)張到幾倍的規(guī)模。我覺(jué)得機(jī)器人這個(gè)行業(yè),不是一個(gè)勞動(dòng)密集型產(chǎn)業(yè),它是一個(gè)技術(shù)和知識(shí)密集型產(chǎn)業(yè)。所以,人才的密度很重要。
  
  關(guān)鍵的幾個(gè)人很多時(shí)候就能讓你做得非???,這也是我們團(tuán)隊(duì)發(fā)展非??焖俚囊粋€(gè)原因。從硬件上我們少走了很多彎路,從算法上我們從一開(kāi)始就非常清醒地知道應(yīng)該怎么做,而且我們的算法團(tuán)隊(duì)能夠快速落地,有非常強(qiáng)的軟件結(jié)合經(jīng)驗(yàn),才能讓我們?cè)诎肽陼r(shí)間內(nèi)就完成了產(chǎn)品的發(fā)布和非常多的demo。
  
  甲子蘇州:我對(duì)你們?cè)跈C(jī)器人供應(yīng)鏈中“降本增效”這塊非常感興趣。你剛才也提到了一些,現(xiàn)在UniX AI機(jī)器人價(jià)格可以透露嗎?
  
  楊豐瑜:價(jià)格我現(xiàn)在不方便透露,但我可以給你一個(gè)大致的概念,我的BOM成本應(yīng)該是在一個(gè)蘋(píng)果智能手機(jī)和一個(gè)入門(mén)級(jí)汽車(chē)的售價(jià)之間。
  
  你也提到了增效這個(gè)詞,我們團(tuán)隊(duì)在提升機(jī)器人現(xiàn)有階段效用的點(diǎn)上也花了非常多的精力。具體產(chǎn)品細(xì)節(jié)現(xiàn)在不太好披露,不過(guò)可以說(shuō)的是具身智能的iPhone 1時(shí)代已經(jīng)到來(lái)。
  
  只有成本和效用兩條曲線的加速交匯,才可以加速通用具身智能普惠點(diǎn)的到來(lái)。
  
  從我們現(xiàn)在的市場(chǎng)調(diào)研來(lái)看,對(duì)于部分行業(yè)嘗鮮者,普惠點(diǎn)已經(jīng)到來(lái)。隨著我們的量產(chǎn)機(jī)會(huì)推動(dòng),針對(duì)大眾的具身智能普惠點(diǎn)也不會(huì)遙遠(yuǎn)。
  
  甲子蘇州:一個(gè)機(jī)器人它會(huì)涉及多少零部件?
  
  楊豐瑜:我們大概拆細(xì)了,不算螺絲、螺母,其他大約有3~500個(gè)零部件。
  
  甲子蘇州:機(jī)器人供應(yīng)鏈的降本增效,和UniX AI地處蘇州有關(guān)系嗎?
  
  楊豐瑜:當(dāng)然,客觀地講,我認(rèn)為蘇州在制造業(yè)技術(shù)上非常扎實(shí),尤其在機(jī)器人產(chǎn)業(yè)上游許多關(guān)鍵零部件上,比如減速器、關(guān)鍵傳感器等領(lǐng)域很成熟。
  
  今天中國(guó)機(jī)器人供應(yīng)鏈主要集中在以蘇州為中心的長(zhǎng)三角地區(qū)和以深圳為中心的珠三角地區(qū)。而且在上一波機(jī)器人浪潮中,蘇州在掃地機(jī)器人、移動(dòng)機(jī)器人、服務(wù)機(jī)器人等方面有著非常強(qiáng)的聚集效應(yīng)。我們?cè)谂琶a(chǎn)業(yè)鏈的過(guò)程中也多次碰到特斯拉在長(zhǎng)三角儲(chǔ)備供應(yīng)鏈,這些也是我們團(tuán)隊(duì)深耕長(zhǎng)三角的原因。
  
  而且,因?yàn)樘K州的制造業(yè)底子很厚實(shí),在生產(chǎn)資源上也非常支持。比如蘇州工業(yè)園區(qū)有很多工廠場(chǎng)地,有非常豐富的配套政策,我覺(jué)得這些對(duì)創(chuàng)業(yè)者來(lái)說(shuō)是非常友好的。
我要收藏
點(diǎn)個(gè)贊吧
轉(zhuǎn)發(fā)分享
上一篇:實(shí)力領(lǐng)航!圖達(dá)通榮獲蘇州市首批智能車(chē)聯(lián)網(wǎng)實(shí)驗(yàn)室和江蘇獨(dú)角獸稱(chēng)號(hào)
下一篇: SGS為正浩頒發(fā)全球首張五星Performance Tested Mark證書(shū)