自杭州宇樹科技股份有限公司(以下簡稱“宇樹科技”)的機(jī)器人在春晚舞臺(tái)“出圈”以后,宇樹科技的機(jī)器人和宇樹科技創(chuàng)始人王興興就成為了人形機(jī)器人行業(yè)的“頂流”,但在過去半年的時(shí)間里,王興興和自家的機(jī)器人公開亮相的場合并不多見。

在第七屆智源大會(huì)的現(xiàn)場,王興興和宇樹科技機(jī)器人G1(宇樹科技的一款人形機(jī)器人產(chǎn)品)同時(shí)亮相,在聚光燈下,G1一套格斗拳引爆了現(xiàn)場氣氛,臺(tái)下的觀眾紛紛拿出手機(jī)拍照記錄,王興興也首次回應(yīng)了關(guān)于機(jī)器人跳舞、打格斗等存在爭議的話題。

在開幕式智源具身智能會(huì)客廳環(huán)節(jié),北京人形機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍、北京大學(xué)助理教授、智源具身智能研究中?主任、銀河通用創(chuàng)始?兼CTO(首席技術(shù)官)、穹徹智能聯(lián)合創(chuàng)始?盧策吾、 Physical Intelligence聯(lián)合創(chuàng)始?兼CEO(首席執(zhí)行官)Karol Hausman共同參與了討論。

終極目標(biāo)是讓機(jī)器人“干活”


在人形機(jī)器人真正走入千家萬戶之前,市場習(xí)慣給予這些新生事物過高的期待。宇樹機(jī)器人在贏得掌聲和關(guān)注的時(shí)間里,同樣也面臨著質(zhì)疑與爭議?!爸粫?huì)跳跳舞的機(jī)器人有什么意義,能帶來什么價(jià)值?”這樣的質(zhì)疑聲一直存在。

王興興在此次具身智能會(huì)客廳中也公開回應(yīng)了上述爭議?!盁o論是春晚上的表演還是格斗比賽,我們是希望展示給公眾目前機(jī)器人行業(yè)的發(fā)展現(xiàn)狀,從而帶動(dòng)整個(gè)機(jī)器人行業(yè)的發(fā)展,未來我們也希望做更多的商業(yè)化拓展和嘗試?!?/p>

在6月7日的具身智能與人形機(jī)器人專題論壇上,眾擎機(jī)器人創(chuàng)始人、董事長趙同陽也回應(yīng)了上述爭議。“任何一種新的設(shè)備出現(xiàn)時(shí),都會(huì)帶來一定的情緒價(jià)值,前段時(shí)間我們被定義成為‘影視公司’,只會(huì)做表演,我并不覺得這種定義是不好的,相反我是擁抱這個(gè)事情的,如果能把表演這個(gè)行業(yè)做大也是一個(gè)很好的經(jīng)歷?!壁w同陽表示。

事實(shí)上,不僅僅是機(jī)器人跳舞受到質(zhì)疑,也同樣存在聲音質(zhì)疑機(jī)器人跑馬拉松的意義。對(duì)此熊友軍的觀點(diǎn)是,通過比賽的形式可以讓大眾對(duì)現(xiàn)在機(jī)器人的發(fā)展?fàn)顩r以及技術(shù)水平有更好地了解。賽場本就是一個(gè)很好的技術(shù)訓(xùn)練場,因?yàn)楹芏啾荣惖膱鼍岸际莵碜匀祟愓鎸?shí)的生活場景,而實(shí)驗(yàn)室的場景很多都是自己構(gòu)建的場景。

“我們畢竟希望機(jī)器人真正走入我們生活、服務(wù)人類,所以這是很好的訓(xùn)練場,對(duì)提升機(jī)器人的技術(shù)有很大的幫助?!毙苡衍娭赋?。

多位長期關(guān)注人形機(jī)器人賽道的投資人告訴新京報(bào)貝殼財(cái)經(jīng)記者,今年在選擇投資標(biāo)的時(shí),他們會(huì)更加注重場景應(yīng)用與落地能力。而這也是目前人形機(jī)器人行業(yè)創(chuàng)業(yè)者們正在追求突破的事情,在北京經(jīng)開區(qū)落地人形機(jī)器人總部的優(yōu)必選正在加速商業(yè)化進(jìn)程,20臺(tái)優(yōu)必選工業(yè)人形機(jī)器人Walker S1將于今年上半年在東風(fēng)柳汽的汽車制造工廠完成部署,應(yīng)用于汽車整車制造;樂聚機(jī)器人已經(jīng)與多家車廠達(dá)成了合作。

王興興指出,“我們的終極目標(biāo)是希望在AI技術(shù)的發(fā)展下幫助人類去從事一些辛苦的工作,在終極目標(biāo)沒有實(shí)現(xiàn)之前,通過參加一些表演展示機(jī)器人的真實(shí)發(fā)展進(jìn)度,同時(shí)產(chǎn)生一部分的商用價(jià)值?!?/p>

銀河通用計(jì)劃今年開出100家機(jī)器人藥店


“今天我們?cè)僬劸呱碇悄軙r(shí),一個(gè)很重要的目標(biāo)就是要推動(dòng)其產(chǎn)業(yè)化落地,如果我們的人形機(jī)器人可以24小時(shí)服務(wù),這樣就構(gòu)成了具身智能真正走向產(chǎn)業(yè)化,創(chuàng)造新的生產(chǎn)力。”王鶴指出。

與宇樹科技不同,銀河通用機(jī)器人專注研究具身智能大腦。在去年的世界機(jī)器人大會(huì)現(xiàn)場,銀河通用的機(jī)器人在現(xiàn)場展示從貨架上抓取飲料;在今年的中關(guān)村論壇現(xiàn)場,銀河通用機(jī)器人將兩臺(tái)機(jī)器人Galbot設(shè)置到了主論壇一層小關(guān)店鋪,與北京好飲科技的機(jī)械臂打配合,兩個(gè)機(jī)器人合作就可以完成一杯咖啡,實(shí)現(xiàn)了無人化操作。

在目前學(xué)術(shù)界的研究中,VLA(視覺-語言-動(dòng)作模型,Vision-Language-Action)熱度高漲,在王鶴看來,VLA能夠真正充分地吸收數(shù)據(jù)背后的知識(shí),讓這些知識(shí)發(fā)揮出最大的性能,而不會(huì)受制于一些模塊化方案中間階段的一些錯(cuò)誤。

6月1日,銀河通用正式推出自主研發(fā)的產(chǎn)品級(jí)端到端導(dǎo)航大模型TrackVLA。這是一款具備純視覺環(huán)境感知、語言指令驅(qū)動(dòng)、可自主推理、具備零樣本(Zero-Shot)泛化能力的具身大模型。“VLA雖然是具身智能領(lǐng)域的熱點(diǎn),但VLA到底應(yīng)該做什么任務(wù)業(yè)界并沒有統(tǒng)一認(rèn)知。我認(rèn)為目前 VLA最適合做的就是移動(dòng)、抓取和放置,這幾項(xiàng)技能主要依靠視覺,末端再加上觸覺或力覺傳感器,就可以很好地在目前的一些場景中應(yīng)用?!蓖斛Q表示。

據(jù)介紹,銀河通用機(jī)器人已經(jīng)在北京開了7家無人藥店,今年將在北京、上海、深圳一共開100家藥店。在6月7日的具身智能分論壇上,王鶴算了一筆賬,24小時(shí)營業(yè)的店員工是要3班倒,這些人力成本是遠(yuǎn)高于機(jī)器人運(yùn)用三年的成本的?!叭耆齻€(gè)工人需要的工資大概在70萬左右,只要機(jī)器人的價(jià)格低于70萬就可以低于雇傭店員需要花費(fèi)的費(fèi)用。”王鶴指出。

在盧策吾看來,具身智能需要逐步落地,但同時(shí)也需要星辰大海。想要具身智能逐步落地,就需要通用,如果做通用,VLA需要壓縮不確定性。“如果把VLA比作火鍋底料的話,現(xiàn)在還是一個(gè)清水鍋,只能服務(wù)一部分人,要服務(wù)更多人就需要不停往里面加?xùn)|西,本質(zhì)是增加更多額外信息,使VLA更加強(qiáng)大,穹徹智能一直在探索力反饋模式的研發(fā)?!北R策吾說。

透過智源大會(huì)的主論壇,可以看到目前具身智能的發(fā)展并未到技術(shù)收斂的階段,但各家企業(yè)正在變得更加務(wù)實(shí),落地能力也正在逐步提升,人形機(jī)器人所帶來的想象空間正在走進(jìn)現(xiàn)實(shí)。

新京報(bào)貝殼財(cái)經(jīng)記者 張晗

編輯 岳彩周

校對(duì) 柳寶慶