作者:豐寧
近年來(lái),人形機(jī)器人的關(guān)注度明顯增加了:主要是因?yàn)檫@個(gè)領(lǐng)域漸有爆發(fā)之勢(shì)。黃仁勛在去年的不止一個(gè)場(chǎng)合都說(shuō)過(guò)機(jī)器人即將迎來(lái)“ChatGPT時(shí)刻”,NVIDIA眼中在生成式AI之外的下一個(gè)爆點(diǎn)就是機(jī)器人。
行業(yè)內(nèi)像ROSCon這樣的機(jī)器人開(kāi)發(fā)者大會(huì)越來(lái)越火;宇樹(shù)科技機(jī)器人亮相春晚扭秧歌,特斯拉擎天柱機(jī)器人疊衣服等引發(fā)極大關(guān)注......這些都讓人感覺(jué)機(jī)器人正在以前所未有的速度發(fā)展。然而,4月初的一場(chǎng)人形機(jī)器人馬拉松比賽卻為火熱的機(jī)器人澆下來(lái)一盆冷水。
?01人形機(jī)器人水平低于市場(chǎng)預(yù)期
最近,北京亦莊半程馬拉松暨人形機(jī)器人半程馬拉松在南海子公園南門開(kāi)跑。這是全球首個(gè)人形機(jī)器人半程馬拉松,20支人形機(jī)器人賽隊(duì)與跑步愛(ài)好者一起沖出起跑線,在21.0975公里長(zhǎng)的賽道上挑戰(zhàn)極限。
然而,多個(gè)網(wǎng)傳視頻顯示,此前被寄予厚望的宇樹(shù)科技G1人形機(jī)器人在跑步過(guò)程中摔倒,此后站起繼續(xù)比賽。
宇樹(shù)科技對(duì)此發(fā)布聲明稱:“宇樹(shù)最近完全沒(méi)有參與任何比賽,主要忙著準(zhǔn)備人形機(jī)器人的格斗直播。G1人形機(jī)器人,從去年發(fā)貨開(kāi)始,已經(jīng)出售給全球非常多的客戶,使用了很久。所以這次馬拉松比賽,也有好幾個(gè)獨(dú)立的團(tuán)隊(duì)使用我們的機(jī)器人。比如我們的客戶用他們自己的算法參與了比賽,所以在現(xiàn)場(chǎng)能看到不少我們的機(jī)器人。有好幾個(gè)獨(dú)立團(tuán)隊(duì)在使用,不同人操作或開(kāi)發(fā)情況下,機(jī)器人的表現(xiàn)差別很大,請(qǐng)大家不要誤解。機(jī)器人和其他電子產(chǎn)品類似,表現(xiàn)性能和使用者息息相關(guān),希望大家一起共同推動(dòng)機(jī)器人行業(yè)的進(jìn)步?!?/p>
宇樹(shù)科技相關(guān)負(fù)責(zé)人進(jìn)一步解釋,現(xiàn)場(chǎng)出現(xiàn)的G1 機(jī)器人由客戶團(tuán)隊(duì)自主改裝算法及硬件,例如城市之間科技隊(duì)為 G1 加裝了道路感知系統(tǒng)、優(yōu)化續(xù)航能力,其表現(xiàn)反映的是客戶團(tuán)隊(duì)的技術(shù)適配情況,而非產(chǎn)品本身缺陷?!皺C(jī)器人和其他電子產(chǎn)品類似,性能高度依賴使用者的調(diào)試與優(yōu)化,希望外界給予行業(yè)更多理解與包容?!?/p>
似乎是作為回應(yīng)質(zhì)疑,4月24日,宇樹(shù)科技創(chuàng)始人兼首席執(zhí)行官王興興與香港特別行政區(qū)行政長(zhǎng)官舉行會(huì)晤,通過(guò)動(dòng)態(tài)演示向特首團(tuán)隊(duì)全面呈現(xiàn)了企業(yè)自主研發(fā)的智能機(jī)器人產(chǎn)品矩陣。在技術(shù)交流過(guò)程中,四足機(jī)器人、仿生機(jī)械臂等創(chuàng)新產(chǎn)品先后展示了復(fù)雜地形行走、物體抓取搬運(yùn)等先進(jìn)功能。
但目前,人形機(jī)器人的發(fā)展明顯低于大眾的市場(chǎng)預(yù)期。
?02人形機(jī)器人:小腦發(fā)育不完全,大腦完全不發(fā)育
人形機(jī)器人是具身智能的最佳形態(tài)之一,更側(cè)重智能體于環(huán)境的交互和自主行為能力。具身智能是具備環(huán)境感知、智能交互和規(guī)劃行動(dòng)的智能系統(tǒng),包括感知模塊、交互模塊、運(yùn)控模塊三大核心模塊,通過(guò)與環(huán)境交互感知、自主決策、執(zhí)行規(guī)劃的人形機(jī)器人,實(shí)現(xiàn)任務(wù)級(jí)交互。
人形機(jī)器人的任務(wù)執(zhí)行模式與自動(dòng)駕駛汽車的模式相似,均基于感知、決策、運(yùn)控三大模塊。人形機(jī)器人通過(guò)大腦的語(yǔ)音識(shí)別、環(huán)境感知等功能接受指令,并進(jìn)行任務(wù)拆解等上層規(guī)劃,隨后小腦實(shí)現(xiàn)對(duì)路徑的最優(yōu)規(guī)劃,最終下達(dá)決策指令,通過(guò)驅(qū)動(dòng)伺服系統(tǒng)進(jìn)行本體運(yùn)動(dòng),完成任務(wù)指令。在任務(wù)執(zhí)行過(guò)程中,大模型的通識(shí)理解能力、多級(jí)推理能力賦予人形機(jī)器人具身智能的核心,更好地理解泛化任務(wù)。
然而從公開(kāi)比賽來(lái)看,當(dāng)前人形機(jī)器人還存在諸多問(wèn)題:自主辨別方向不容易,證明不能根據(jù)裝載地圖自動(dòng)尋的;續(xù)航力太差,跑幾公里要換電池,甚至換人,還要噴酒精降溫;平衡性不行,比賽時(shí)候需要工作人員隨跑,甚至還需要扶著才能不摔,摔倒了也很難自己爬起來(lái);機(jī)器人腦袋掉下來(lái),兩只腳照樣可以往前走,顯然頭部可有可無(wú);擺臂動(dòng)作清晰,沒(méi)有順拐,但是手臂在摔倒后不知所措;實(shí)際運(yùn)動(dòng)中,絕大部分人形機(jī)器人并非跑步,而是走路,沒(méi)有兩腳同時(shí)離地的過(guò)程……
有網(wǎng)友戲稱,當(dāng)前的人形機(jī)器人“小腦發(fā)育不完全,大腦完全不發(fā)育”。某種程度上,這也證明了人形機(jī)器人距離真正的產(chǎn)業(yè)化、商業(yè)化依然很遙遠(yuǎn)。
?03人形機(jī)器人需要更強(qiáng)大腦
早在70年前,具身智能就被看做是通往AGI(通用人工智能)的路徑之一。只是礙于那個(gè)時(shí)候各項(xiàng)技術(shù)尚不成熟,一直起起伏伏。很顯然,當(dāng)下這波具身智能的熱潮,得益于第三次AI浪潮的驅(qū)動(dòng)。
這波具身智能和以往大家聊的機(jī)器人的根本區(qū)別,就在于智能化程度。比如這兩年被馬斯克大吹特吹的機(jī)器人進(jìn)廠打工,早在幾十年前就實(shí)現(xiàn)了。原理就是通過(guò)給機(jī)器人設(shè)定一個(gè)程序,讓它們?cè)谝阎h(huán)境里,完成規(guī)定動(dòng)作。不光智能水平不高,而且還是被動(dòng)智能。它無(wú)論如何也不可能知道,什么叫該出手時(shí)就出手。
然而到了神經(jīng)網(wǎng)絡(luò)時(shí)代,真正的具身智能得主動(dòng),就像電影里一樣,通過(guò)感知獲取關(guān)于世界的信息,接著把感知到的信息,轉(zhuǎn)換成機(jī)器可以處理的形式。比如把圖像轉(zhuǎn)換成像素值,把文本轉(zhuǎn)換成詞向量,在這個(gè)基礎(chǔ)上機(jī)器自己做出決定,和世界完成交互。同時(shí)也意味著,機(jī)器人的市場(chǎng)定位,很可能會(huì)從工業(yè)場(chǎng)景,轉(zhuǎn)向我們?nèi)粘5纳顖?chǎng)景,這才是具身智能市場(chǎng)火熱的關(guān)鍵要素。
芯片作為人形機(jī)器人的“大腦”,其性能直接決定了人形機(jī)器人的智能化程度和性能表現(xiàn)。比如宇樹(shù)在硬件上采用了行業(yè)內(nèi)很頂?shù)?核高性能CPU和NVIDIA Jetson Orin高算力模組,比同類型機(jī)器人要技術(shù)上更精進(jìn)一些。以G1為例,它就可以在這些支持下,通過(guò)深度強(qiáng)化學(xué)習(xí)(DRL),在仿真環(huán)境中模擬數(shù)萬(wàn)次跌倒與站起,最終實(shí)現(xiàn)“摔倒自動(dòng)爬起”“單腳跳躍避障”等高難度動(dòng)作。
英偉達(dá)研發(fā)的高性能GPU芯片憑借其卓越的圖形處理性能,提升了在視覺(jué)信息識(shí)別以及各類復(fù)雜任務(wù)處理方面的能力,實(shí)現(xiàn)了質(zhì)的飛躍。而國(guó)內(nèi)也有多家科技企業(yè)取得關(guān)鍵性突破,成功推動(dòng)了芯片技術(shù)從實(shí)驗(yàn)階段邁向商業(yè)化應(yīng)用。
優(yōu)必選在初代Walker 主要搭載Inteli7 7500U 頻率2.7Ghz和Intel i5 6200U 頻率2.3Ghz芯片,在升級(jí)版Walker X主要是Intel i7-8665U(雙路,1.9GHz)+NVIDIA GT1030顯卡,384核心。
傅里葉智能的GR-1也是首臺(tái)具備端到端環(huán)境感知能力的人形機(jī)器人,中央處理器主要采用I7 13700H。
2024 年 Engine AI 眾擎機(jī)器人推出的 PM01 人形機(jī)器人,首次將 Intel N97 處理器與 NVIDIA Jetson Orin 模組深度融合,標(biāo)志著人形機(jī)器人進(jìn)入異構(gòu)計(jì)算的新紀(jì)元。這種創(chuàng)新組合通過(guò) CPU 與 GPU 的協(xié)同優(yōu)化,在能效比、實(shí)時(shí)響應(yīng)和擴(kuò)展性方面實(shí)現(xiàn)了突破性提升。
智元機(jī)器人配置的Jetson AGX Orin 64GB擁有極致 AI 算力,275 TOPS 的 INT8 算力,是上一代 Jetson AGX Xavier 的 8 倍,支持同時(shí)運(yùn)行多個(gè)復(fù)雜 AI 模型(如 VLM 視覺(jué)語(yǔ)言模型、SLAM 算法)。
最近,黑芝麻智能將基于新款華山A2000和武當(dāng)C1236芯片,為“天問(wèn)”機(jī)器人賦予更智慧的“大腦”和“小腦”?!癆2000芯片致力于讓‘天問(wèn)’具備人類的常識(shí)和知識(shí),進(jìn)而達(dá)成人類的決策水平;C1236芯片可讓AI運(yùn)算任務(wù)與控制任務(wù)實(shí)現(xiàn)并行處理,為‘天問(wèn)’在復(fù)雜環(huán)境下的穩(wěn)定運(yùn)行與精準(zhǔn)操作提供可靠保障。”
A2000被定義為“專為下一代AI模型設(shè)計(jì)的高算力芯片平臺(tái)”,Lite版、標(biāo)準(zhǔn)版和Pro版三款芯片的性能分別對(duì)標(biāo)1顆、2顆和4顆行業(yè)旗艦芯片。
這里提到的“行業(yè)旗艦芯片”,指的是英偉達(dá)的OrinX。A2000Pro芯片對(duì)標(biāo)4顆OrinX,意味著能與英偉達(dá)即將量產(chǎn)的旗艦芯片Thor“掰手腕”,后者的算力達(dá)到1000TOPS。
?04首屆具身智能運(yùn)動(dòng)會(huì)開(kāi)賽
人形機(jī)器人馬拉松只是開(kāi)始,通過(guò)比賽可以測(cè)試人形機(jī)器人的長(zhǎng)時(shí)間運(yùn)動(dòng)能力和跑步能力,從而發(fā)現(xiàn)問(wèn)題、解決問(wèn)題。但要解鎖更多的運(yùn)動(dòng)形態(tài)還需要更多維度、更全面復(fù)雜的測(cè)試。
2025年4月24日至26日,首屆具身智能機(jī)器人運(yùn)動(dòng)會(huì)在無(wú)錫市惠山區(qū)舉辦。
來(lái)自全國(guó)各地的百余家企業(yè),攜近兩百多件展品集結(jié)運(yùn)動(dòng)會(huì)。開(kāi)幕式后,運(yùn)動(dòng)會(huì)將開(kāi)展競(jìng)速跑、越野跑、足球、籃球、舞蹈、格斗等競(jìng)技項(xiàng)目,智能性、運(yùn)動(dòng)規(guī)劃、本體設(shè)計(jì)等能力皆是“考點(diǎn)”;應(yīng)用賽項(xiàng)目則聚焦于搬運(yùn)、智能抓取、室內(nèi)救援、創(chuàng)新場(chǎng)景等,多維度展示機(jī)器人完成環(huán)境識(shí)別、抓取、規(guī)劃設(shè)計(jì)等復(fù)雜任務(wù)的綜合能力。
在競(jìng)速跑項(xiàng)目中,宇樹(shù)機(jī)器人將與國(guó)家地方共建具身智能機(jī)器人創(chuàng)新中心(北京)、國(guó)家地方共建人形機(jī)器人創(chuàng)新中心(上海)以及來(lái)自深圳、上海、西安、重慶等地的機(jī)器人企業(yè)同臺(tái)競(jìng)技。
據(jù)了解,除了激烈的競(jìng)速跑比賽,宇樹(shù)機(jī)器人還將參與舞蹈表演環(huán)節(jié)。屆時(shí),它將與東莞市本末科技有限公司、深圳市優(yōu)必選科技股份有限公司的機(jī)器人同臺(tái)演出。
有分析人士認(rèn)為,宇樹(shù)科技突然宣布參加首屆具身智能機(jī)器人運(yùn)動(dòng)會(huì)與其產(chǎn)品在4月下旬舉辦的北京機(jī)器人半馬比賽成績(jī)有一定關(guān)系。雖然宇樹(shù)科技對(duì)外表示并沒(méi)有參賽,參賽機(jī)器人是客戶購(gòu)買用于展示的產(chǎn)品,賽前宇樹(shù)科技并沒(méi)有進(jìn)行針對(duì)性的調(diào)試。但是,比賽結(jié)果仍然給宇樹(shù)科技帶來(lái)一定輿情。參加此次具身智能機(jī)器人運(yùn)動(dòng)會(huì)或許是宇樹(shù)科技為自身技術(shù)實(shí)力再次正名的表現(xiàn),也是運(yùn)動(dòng)會(huì)的看點(diǎn)之一。