小米發(fā)布全尺寸人形仿生機(jī)器人CyberOne 引來業(yè)內(nèi)大佬側(cè)目

2022-08-12 13:29:21       來源:量子位

什么?小米發(fā)布了全尺寸仿生人形機(jī)器人? 就在雷軍在個人年度演講快結(jié)束時(shí),順手扔出了這個王炸——全尺寸仿生人形機(jī)器人CyberOne。并且這次不是PPT,也不是請人穿著道具上去跳舞,而是直接拿出原型機(jī),現(xiàn)場和雷軍互動了一番。

近些年,機(jī)器人儼然成為眾多科技公司展現(xiàn)自己綜合研發(fā)實(shí)力最好的產(chǎn)品。

從早年的波士頓動力、軟銀Pepper,到去年馬斯克的一手‘快閃’,每次發(fā)布都引來無數(shù)關(guān)注——

小米這臺CyberOne與其他家有什么區(qū)別?這個雷總的新寵到底有多少技術(shù)含金量?

老規(guī)矩,更多軟硬件細(xì)節(jié)及幕后信息,一并為大家揭秘。

小米人形機(jī)器人,究竟是個啥?

縱觀當(dāng)下叫得上號的“網(wǎng)紅”人形機(jī)器人,我們不難發(fā)現(xiàn),各家公司對于人形機(jī)器人的描摹有很大差異。

按產(chǎn)品定位大致可以分為三個方向。

超越人,以大名鼎鼎的波士頓動力為代表,旨在追求極致機(jī)能以達(dá)到擁有超越人類的運(yùn)動能力。

這個方向也吸引了國內(nèi)外眾多科研單位參與??梢哉f波士頓動力在姿態(tài)控制、動作預(yù)判算法、動力輸出等領(lǐng)域走在了全球人形機(jī)器人領(lǐng)域的前列。

替代人,以去年宣布打造人形機(jī)器人的特斯拉為代表。

馬斯克是個明白人,特斯拉出貨量穩(wěn)步提高,光超級工廠就規(guī)劃了不下10個,如果能打造一個人形機(jī)器人來代替工廠中重復(fù)勞動的員工,只要綜合成本低過員工工資,就是筆好生意。所以馬老板也絲毫不掩飾他想通過人形機(jī)器人替代人的想法。

服務(wù)人,這是小米CyberOne選擇的方向。

具體來說,是依托人形更好的研究人感知、認(rèn)知、決策、執(zhí)行過程從而更好服務(wù)于人。

這一定位方向,在產(chǎn)品細(xì)節(jié)上如何體現(xiàn)?我們一項(xiàng)一項(xiàng)看。

如果給CyberOne來個外科體檢,高177cm,是一個標(biāo)準(zhǔn)的成年人身高。

體重則僅為52kg,別看現(xiàn)在身板有點(diǎn)單薄,其實(shí)也是為了后續(xù)進(jìn)一步演進(jìn)做重量冗余。

再查五官科,CyberOne的臉蛋沒走擬真的精致五官路線。

頭部前面是個面罩,外層半透明材質(zhì),內(nèi)層為OLED與柔光特效,再加上2D彎曲貼合顯示模組實(shí)時(shí)表達(dá)機(jī)器人情緒。

下一項(xiàng)該考察機(jī)器人的運(yùn)動能力。

這其中,關(guān)節(jié)是核心,業(yè)內(nèi)皆知,這塊相關(guān)組件一般占人形機(jī)器人成本三分之一以上。

以CyberOne上肢關(guān)節(jié)電機(jī)為例,小米自研了一枚重量僅為500g,額定輸出扭矩高達(dá)30N·m的高效電機(jī),保證上肢靈活性。

CyberOne髖關(guān)節(jié)主要電機(jī)瞬時(shí)峰值扭矩可達(dá)300N·m,配合自研的人形雙足控制算法,行走姿態(tài)更加平穩(wěn)。

再有就是‘手’了,CyberOne單手垂直抓握物體重量為1.5kg。

總體來看,極致運(yùn)動能力非CyberOne的目標(biāo)。

CyberOne更多的采用了以高性能、小型化電機(jī)為主的干系統(tǒng)作為運(yùn)動能力支撐,并沒有過多的使用機(jī)械性能當(dāng)下更強(qiáng)大的液壓濕系統(tǒng)。

這種選擇上的傾向還是較為激進(jìn)的,迎合了新能源時(shí)代下例如智能汽車從濕系統(tǒng)逐步替換成干系統(tǒng)的大趨勢。

傳感器方面,CyberOne對外界信息獲取來自聽覺和視覺。

深度相機(jī)配合AI相機(jī)幫助機(jī)器人收入真實(shí)場景和物體,通過CV算法獲得物體三維模型實(shí)現(xiàn)避障,自帶小米傳統(tǒng)藝能‘萬物追焦’技術(shù),讓CyberOne能夠集中注意力看關(guān)鍵物體。

聽覺傳感器配合音頻算法可識別6類45種人類情緒語音,外加85種環(huán)境音識別。

你大概好奇環(huán)境音識別有什么用?小米工程師舉了一個有趣的例子——

離家前忘關(guān)水龍頭?它就能識別滋滋水流聲并提醒你。

據(jù)了解,CyberOne還實(shí)現(xiàn)了‘拖動示教學(xué)習(xí)’這項(xiàng)特別的功能。

所謂拖動示教學(xué)習(xí),就像是父母手把手教你第一次學(xué)會用上了筷子。

這動作對人來說簡單,但對機(jī)器就難度很大了。不僅要求硬件機(jī)械臂是‘活’的,可被移動,反驅(qū)的形式對關(guān)鍵部位電機(jī)性能要求更高,也是小米團(tuán)隊(duì)最初要求的關(guān)鍵指標(biāo)。

除此之外,機(jī)器人還要通過傳感器和軟件層能夠記憶學(xué)習(xí)動作,重復(fù)執(zhí)行,工程師們希望通過該功能實(shí)現(xiàn),讓機(jī)器人模擬人的學(xué)習(xí)過程。

看到這,大致能得出些不吹不黑的結(jié)論——

小米新發(fā)布這個人形機(jī)器人的確挺像樣,不僅外觀,其各方面組件的確滿足人形機(jī)器人要求。

無論行動速度,還是抓握力,再到突出的交互能力和AI算法對環(huán)境語義的識別判斷,能看出這臺CyberOne更面向/服務(wù)于人本身。

不管怎么說,小米居然不聲不響,閃亮登場一個全尺寸人形仿生機(jī)器人,還是出乎了所有人意料。

人形機(jī)器人,有多難?

人形是解決綜合問題最高效的形態(tài)之一,是機(jī)器人領(lǐng)域公認(rèn)的終極方向,同時(shí)也是技術(shù)難度最大、需要投入最多的。

毫不夸張的說,全尺寸人形仿生機(jī)器人是“機(jī)器人皇冠上的明珠”。

原因也不難理解。

身體結(jié)構(gòu)上,人類雙足直立行走、雙手操作工具都是歷經(jīng)上百萬年進(jìn)化而來,靠的可是自然選擇的力量。

想用完全不同于生物的一套材料、靠人為設(shè)計(jì)去模仿逼近,工程難度可見一斑。

行為和決策上,人形機(jī)器人要做到和人一樣、解決復(fù)雜問題問題,這就就需要做到對環(huán)境的全面理解,需要多模態(tài)結(jié)合的推理和交互,除了視覺、聽覺,還要考慮更不成熟的嗅覺、觸覺等。

最后還有點(diǎn)現(xiàn)實(shí)原因,人形機(jī)器人行業(yè)還沒有機(jī)器狗那么成熟,不要說開源方案了,連論文都沒有幾篇可以參考。

小米人形機(jī)器人項(xiàng)目的負(fù)責(zé)人向迪昀表示,這次難度和去年的機(jī)器狗鐵蛋不在一個level上。

看上去理論似乎很健全,但怎么做、技術(shù)如何演進(jìn),誰也沒有正確答案。

縱觀目前市面上成熟的項(xiàng)目,從產(chǎn)品迭代路線來看大概能分4步:先做下半身站立,到下半身行走,組裝上半身,最后是全身的動作協(xié)同。

小米則通過在智能制造和之前CyberDog機(jī)器狗項(xiàng)目上的技術(shù)積累,最終決定下半身和上半身并行推進(jìn),項(xiàng)目進(jìn)展較快。

機(jī)械方面對應(yīng)人類行為的執(zhí)行部分,一般由小腦控制。但如果只做到擬人運(yùn)動能力,充其量可以稱之為機(jī)器。

只有擁有了感知-認(rèn)知-執(zhí)行的大腦能力,才真的稱得上機(jī)器人。而大腦能力也是仿生人形機(jī)器人的技術(shù)制高點(diǎn)。

從已公開的信息來看,CyberOne首先擁有空間感知、認(rèn)知能力。

CyberOne搭載自研Mi-Sense深度視覺模組,結(jié)合AI交互算法,使其不僅擁有完整的三維空間感知能力,更能夠?qū)崿F(xiàn)人物身份識別、手勢識別、表情識別,CyberOne真正做到了不僅看得到也能看得懂。

但相比于機(jī)器狗,人的世界中信息量級堪稱爆炸。就以簡單的路徑規(guī)劃為例,目前最全面、技術(shù)難度最高的路徑規(guī)劃為自動駕駛路徑規(guī)劃。

智能汽車路徑規(guī)劃除了解決機(jī)器人從A點(diǎn)到B點(diǎn)外,還需要在過程中針對各種情況進(jìn)行語義標(biāo)定,例如停止的障礙車輛、地上的行車線、運(yùn)動中的行人等等,從而對其作出預(yù)判,保證安全舒適行車。

雖然CyberOne得到了來自小米自動駕駛團(tuán)隊(duì)的技術(shù)幫助,但自動駕駛?cè)匀皇窃诘缆方煌ㄓ邢迗鼍跋碌穆窂揭?guī)劃技術(shù),而人形機(jī)器人則是全場景的路徑規(guī)劃,面對的情況更加豐富,需要對環(huán)境語義的標(biāo)定更加復(fù)雜。

CyberOne同樣擁有情緒的感知和認(rèn)知能力,這部分能力則是師承小米內(nèi)部小愛同學(xué)團(tuán)隊(duì)。

小米人形機(jī)器人項(xiàng)目的負(fù)責(zé)人向迪昀表示,小愛同學(xué)面向大眾展現(xiàn)的能力只是冰山一角,其實(shí)小愛團(tuán)隊(duì)很早就開始搭建情緒訓(xùn)練模型和環(huán)境語音語義模型,這方面技術(shù)對軟硬件平臺要求較高,尚未開放給大眾用戶,而讓CyberOne搶了“首發(fā)”。

解決了諸如上述的各類問題后,CyberOne有了基本的感知、決策、運(yùn)動和交互能力,可以算是大小腦平衡發(fā)展了,所以這次發(fā)布會上雷總把他帶上臺進(jìn)行了演示。

CyberOne和所有的人形仿生機(jī)器人一樣,都是處在持續(xù)演進(jìn)過程中。

接下來一段時(shí)間,CyberOne還需要改進(jìn)的地方有很多,硬件上比如完善手指靈活性、學(xué)著像人一樣使用工具,軟件的架構(gòu)也需要整合,從分布式迭代固化為集成式,智能算法更是需要持續(xù)迭代改進(jìn)等。

不過擺在機(jī)器人行業(yè)面前的問題,從來就不局限于技術(shù)本身。

人形機(jī)器人投入成本高、回報(bào)周期長,商業(yè)化進(jìn)展上這幾年也經(jīng)歷了一番波折。

波士頓動力公司7年內(nèi)被3次轉(zhuǎn)手,產(chǎn)品上機(jī)器狗Spot公布的銷量只有數(shù)百臺,人形機(jī)器人Atlas就要更少。

軟銀的人形機(jī)器人Pepper則在去年被曝出直接停產(chǎn)。

總之,邁過技術(shù)驗(yàn)證階段之后,小米想要把機(jī)器人打造成一款產(chǎn)品推向市場還有很長的路要走。

既然如此之難,小米為何要做?

在外界看來,小米新技術(shù)研發(fā)更值得投入精力的地方,似乎應(yīng)該是造車。

分出人力物力來搞這么難的人形機(jī)器人,是出于什么考慮?

對于這個問題,小米給出的答案是CyberOne并不是規(guī)劃而來的。

他更像是人,是小米“科技生態(tài)”自然進(jìn)化而來的產(chǎn)物,也是小米科技生態(tài)的代言人,可分為兩個方面來看。

第一是技術(shù)方面。

小米自成立以來,從智能手機(jī)出發(fā),到可穿戴設(shè)備、智能家居,再到智能制造、智能電動汽車以及仿生機(jī)器人,貫穿其中的是一套不斷融合進(jìn)化的技術(shù)體系。

融合進(jìn)化,說的是看似已成熟的技術(shù)用在新的領(lǐng)域就會暴露出新的問題,然后才有機(jī)會做出改進(jìn)。

舉例來說,機(jī)器人自身可以移動,對視覺、語音算法的要求就和手機(jī)完全不同。這也印證了AI學(xué)術(shù)界最近呼聲很高的”具身智能”——給AI一個身體,它理解這個世界的方式才能更貼近人類。

進(jìn)一步來說,通過融合創(chuàng)新和改進(jìn)的技術(shù)還可以在科技生態(tài)內(nèi)的各個場景相互遷移。

如最初用在機(jī)器狗上的萬物追焦算法也能用于手機(jī);小米自動駕駛進(jìn)展非??欤靡嬗?017年創(chuàng)辦的小米人工智能實(shí)驗(yàn)室;未來人形機(jī)器人上驗(yàn)證成熟的技術(shù)也有機(jī)會支援造車。

正如小米機(jī)器狗項(xiàng)目發(fā)起人去年說過的,”手機(jī)就是沒有腿的機(jī)器人,機(jī)器狗有腿但不需要顯示屏,汽車則是四輪機(jī)器人”。

第二個是場景方面。

如果簡單粗暴的將人的行為分為四個狀態(tài):居家生活、工作辦公、交通出行、睡眠休息。那么一個好的商業(yè)模型應(yīng)該盡可能多的覆蓋人的四個狀態(tài),并且越了解四個狀態(tài)中用戶不同的需求,從而提供更好的服務(wù),那么這個商業(yè)模型的價(jià)值就越高。

小米目前提供的服務(wù)恰好對這四種狀態(tài)全覆蓋,前面也提到,人形機(jī)器人目前有三種發(fā)展方向。

一種是‘超越人’,以波士頓動力為代表,專注提升機(jī)器人的運(yùn)動性能。

一種是‘替代人’,以特斯拉為代表,要讓機(jī)器人進(jìn)入造車工廠補(bǔ)充勞動力。

小米選擇的是第三種‘服務(wù)人’,要圍繞人的生活和工作,更好為人服務(wù),緊密連接人和萬物。

從這個角度看,小米的科技生態(tài)在理解人方面有著得天獨(dú)厚的優(yōu)勢。

原研哉在為小米設(shè)計(jì)全新LOGO的時(shí)候,就提到全新的小米LOGO能夠體現(xiàn)小米的品牌精神:科技就越是進(jìn)化,就越接近生命的形態(tài)。如此看來,小米能夠率先推出仿生機(jī)器人也是順理成章。

△小米集團(tuán)技術(shù)能力示意圖

關(guān)于機(jī)器人如此之難,為何還要做,國家也給出了相關(guān)答案。

在工信部等十五部門聯(lián)合印發(fā)《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》中提到:

面向制造業(yè)、采礦業(yè)、建筑業(yè)、農(nóng)業(yè)等行業(yè),以及家庭服務(wù)、公共服務(wù)、醫(yī)療健康、養(yǎng)老助殘、特殊環(huán)境作業(yè)等領(lǐng)域需求,集聚優(yōu)勢資源,重點(diǎn)推進(jìn)工業(yè)機(jī)器人、服務(wù)機(jī)器人、特種機(jī)器人重點(diǎn)產(chǎn)品的研制及應(yīng)用,拓展機(jī)器人產(chǎn)品系列,提升性能、質(zhì)量和安全性,推動產(chǎn)品高端化智能化發(fā)展。

……

看了這么多,最后不妨一起來聊聊,你覺得人形機(jī)器人離廣泛來到人們身邊還有多遠(yuǎn)?

超越人、代替人、服務(wù)人這三種路線,你又更期待哪個?

x 廣告
x 廣告

Copyright @  2015-2022 海外生活網(wǎng)版權(quán)所有  備案號: 滬ICP備2020036824號-21   聯(lián)系郵箱:562 66 29@qq.com