硬件共生進化
在全球科技競爭白熱化、產(chǎn)業(yè)融合加速的當(dāng)下,智能科技產(chǎn)業(yè)尋求降本增效與技術(shù)突破多重新路徑幾乎成為跨行業(yè)共識。
在此趨勢下,智能電動汽車(Smart EV)與具身智能機器人作為前沿賽道,看似分屬不同領(lǐng)域,實則在技術(shù)架構(gòu)與產(chǎn)業(yè)生態(tài)等多維度存在深度耦合。蓋世汽車研究發(fā)現(xiàn),整體來看,二者在包括芯片、傳感器和動力系統(tǒng)的硬件技術(shù)方面,在包括自動駕駛算法、智能互聯(lián)的軟件技術(shù)方面,和在供應(yīng)鏈需求、制造供應(yīng)鏈環(huán)節(jié)的能力都具備復(fù)用潛力,不僅能加速各自領(lǐng)域的創(chuàng)新迭代,更將為智能科技產(chǎn)業(yè)開辟協(xié)同發(fā)展的新藍海。
此外,在市場應(yīng)用方面,人形機器人還可以提升汽車制造效率,拓展至生活服務(wù)等場景,形成“出行+服務(wù)”的生態(tài)閉環(huán),實現(xiàn)商業(yè)模式的多樣化探索。
特斯拉開發(fā)的人形機器人——擎天柱(Optimus)就是較為典型的例證。特斯拉把汽車的一些技術(shù)運用到了人形機器人擎天柱上,例如電池組、冷卻系統(tǒng)等,還使用與汽車測試類似的技術(shù)來進行擎天柱的運動和對外部碰撞模擬。此外,特斯拉的全自動駕駛系統(tǒng)FSD直接被應(yīng)用在擎天柱身上,機器人采用了與汽車一樣的視覺感知,使用攝像頭輸入數(shù)據(jù),以神經(jīng)網(wǎng)絡(luò)進行計算。
去年4月,特斯拉已在工廠部署兩個Optimus機器人。特斯拉將在今年開始“限量生產(chǎn)”擎天柱機器人,未來可能會有數(shù)千個擎天柱機器人在特斯拉工作。
·硬件傳感器領(lǐng)域
在智能汽車領(lǐng)域,攝像頭、雷達等傳感器早已成為車輛的“眼睛”和“耳朵”,它們能夠?qū)崟r監(jiān)測車輛周圍環(huán)境,為自動駕駛提供關(guān)鍵數(shù)據(jù)支持。具身智能機器人同樣需要對外部環(huán)境進行感知,以實現(xiàn)自主行動。智能汽車中廣泛應(yīng)用的多傳感器融合技術(shù),如將攝像頭的視覺信息與毫米波雷達、激光雷達的距離探測信息相結(jié)合,能夠精準(zhǔn)識別障礙物和目標(biāo)物體,這種技術(shù)完全可以遷移至具身智能機器人。
例如,在復(fù)雜的室內(nèi)外環(huán)境中,機器人通過復(fù)用此類傳感器技術(shù),能夠?qū)崟r感知周圍環(huán)境的動態(tài)變化,實現(xiàn)對障礙物的規(guī)避和對目標(biāo)物體的抓取,從而在物流搬運、家庭服務(wù)等場景中發(fā)揮重要作用。小米汽車在其人形機器人產(chǎn)品CyberOne的傳感器中,搭載了小米自研的Mi-Sense深度視覺模組,可以對人臉、肢體動作等外界環(huán)境進行感知,該款機器人計劃2025年量產(chǎn)發(fā)售。
·硬件芯片領(lǐng)域
智能汽車的計算芯片在處理能力和功耗管理方面具有顯著優(yōu)勢。為了滿足自動駕駛對海量數(shù)據(jù)實時處理的需求,智能汽車芯片不斷提升計算能力,同時優(yōu)化功耗,以保證車輛長時間運行。這些芯片具備強大的并行計算能力,能夠快速處理傳感器采集的大量數(shù)據(jù),并進行復(fù)雜的算法運算,為自動駕駛決策提供支持。
在具身智能機器人中,同樣面臨著數(shù)據(jù)處理和決策控制的挑戰(zhàn),將智能汽車的計算芯片適配到機器人中,能夠為機器人提供強大的運算支持,使其快速處理視覺、觸覺等多源信息,做出準(zhǔn)確的決策,從而實現(xiàn)更靈活、智能的動作控制。此外,芯片的低功耗特性還能延長機器人的工作時間,降低能源消耗。
小鵬汽車就將車端AI鷹眼視覺系統(tǒng)、自研圖靈芯片、端到端大模型以及強化學(xué)習(xí)算法移植至IRON人形機器人上,當(dāng)前,IRON已在小鵬廣州工廠投入使用,計劃2026年實現(xiàn)量產(chǎn)。
·動力系統(tǒng)領(lǐng)域
智能汽車的電池技術(shù)和電機驅(qū)動技術(shù)也為具身智能機器人的動力供應(yīng)和運動執(zhí)行帶來了新的可能。長續(xù)航電池能夠為機器人提供更持久的工作時間,使其無需頻繁充電,提高工作效率。同時,高效電機驅(qū)動技術(shù)能夠?qū)崿F(xiàn)機器人更精準(zhǔn)的動作控制,使機器人在抓取物體、攀爬等動作中更加靈活、穩(wěn)定。智能汽車電機的高精度控制算法,經(jīng)過優(yōu)化后應(yīng)用于機器人電機,能夠?qū)崿F(xiàn)對機器人關(guān)節(jié)的精確控制,提升機器人的運動性能。
比如,廣汽人形機器人GoMate,搭載全固態(tài)電池,續(xù)航達到6小時,并采用軸向磁通電機,最大輸出力矩達到1000N·m,該款機器人將會率先進入廣汽傳祺、埃安等生產(chǎn)線和園區(qū)率先示范應(yīng)用,計劃2025年實現(xiàn)自研零部件批量生產(chǎn),2026年整機小批量生產(chǎn)。
智駕軟技跨域賦能
·軟件技術(shù)復(fù)用
在自動駕駛算法方面,智能汽車的自動駕駛算法,如路徑規(guī)劃算法、目標(biāo)識別與跟蹤算法等,經(jīng)過多年的研發(fā)和實踐,已經(jīng)相對成熟。在具身智能機器人的自主導(dǎo)航和操作任務(wù)中,這些算法經(jīng)過優(yōu)化后能夠發(fā)揮重要作用。
比如特斯拉的人形機器人產(chǎn)品Optimus Gen2,安裝無人駕駛系統(tǒng)FSD,接入和特斯拉汽車同樣的神經(jīng)網(wǎng)絡(luò),可以全面識別周邊環(huán)境,并通過AI算法識別和學(xué)習(xí)人類動作。Optimus Gen2目前已實現(xiàn)小批量生產(chǎn),計劃2025年生產(chǎn)數(shù)千臺,2026年目標(biāo)提升至5-10萬臺。
此外,奇瑞汽車Mornine,與AI公司Aimoga共同研發(fā),配備大型語言模型 (LLM),該款機器人將在優(yōu)先在在汽車銷售中心擔(dān)任服務(wù)人員,逐步向家庭服務(wù)場景拓展。
·智能互聯(lián)技術(shù)
智能汽車的車聯(lián)網(wǎng)技術(shù)能夠?qū)崿F(xiàn)車輛與云端、其他車輛以及基礎(chǔ)設(shè)施之間的數(shù)據(jù)交互和遠程控制。這種技術(shù)在具身智能機器人中同樣具有廣闊的應(yīng)用前景。通過復(fù)用車聯(lián)網(wǎng)技術(shù),機器人可以與云端服務(wù)器進行實時數(shù)據(jù)交互,上傳自身的工作狀態(tài)和環(huán)境信息,同時下載最新的任務(wù)指令和算法更新。此外,機器人還能與其他設(shè)備進行互聯(lián)互通,實現(xiàn)協(xié)同工作。例如,在智慧城市的建設(shè)中,多個清潔機器人可以通過智能互聯(lián)技術(shù)進行信息共享和任務(wù)分配,提高清潔效率,拓展機器人的應(yīng)用場景和功能。
供應(yīng)鏈的共生密碼
·供應(yīng)鏈需求的高度復(fù)用
在零部件采購方面,智能汽車和具身智能機器人存在著大量的重疊部分。傳感器、芯片、電機等零部件是兩者不可或缺的關(guān)鍵組件,這使得它們在供應(yīng)商選擇上具有較高的重合度。通過共享零部件供應(yīng)商,兩者可以形成規(guī)模效應(yīng),降低采購成本。例如,大量采購?fù)愋偷膫鞲衅骱托酒?,能夠增強企業(yè)與供應(yīng)商的議價能力,獲得更優(yōu)惠的價格。
·智能制造產(chǎn)線及能力復(fù)用
智能汽車的整車制造流程和生產(chǎn)線布局在自動化生產(chǎn)、組裝工藝等方面具有諸多優(yōu)勢,這些經(jīng)驗可以借鑒到具身智能機器人的制造過程中。智能汽車生產(chǎn)線采用的自動化裝配技術(shù),如機器人焊接、自動化噴涂等,能夠提高生產(chǎn)效率和產(chǎn)品質(zhì)量的一致性。在具身智能機器人的制造中,引入類似的自動化生產(chǎn)設(shè)備和工藝,可以減少人工操作的誤差,提高機器人的生產(chǎn)效率,降低生產(chǎn)成本。
同時,智能汽車制造過程中成熟的質(zhì)量控制體系和供應(yīng)鏈管理模式,也能夠為具身智能機器人的制造提供有益的參考,幫助企業(yè)建立完善的質(zhì)量管理和供應(yīng)鏈協(xié)同機制,確保機器人產(chǎn)品的質(zhì)量和交付周期。
破界全場景生態(tài)
在人工智能技術(shù)飛速發(fā)展的當(dāng)下,具身智能作為融合機器人實體與智能算法的前沿領(lǐng)域,正以前所未有的態(tài)勢重塑人類生產(chǎn)生活格局。從工業(yè)車間的精密裝配,到家庭空間的智能服務(wù);從物流倉庫的高效搬運,到醫(yī)療養(yǎng)老的貼心守護,具身智能憑借其獨特的物理交互能力,在多領(lǐng)域開辟出全新應(yīng)用場景,開啟了智能生態(tài)網(wǎng)絡(luò)構(gòu)建的新紀元。
在人形機器人眾多應(yīng)用場景中,工業(yè)制造場景率先落地,具身智能機器人正成為提升生產(chǎn)效率與質(zhì)量的關(guān)鍵力量。
優(yōu)必選推出的工業(yè)人形機器人Walker S系列,憑借高度靈活的機械臂與精準(zhǔn)的動作控制能力,成功進駐比亞迪、吉利汽車、富士康等許多大型車廠進行實訓(xùn)。目前,優(yōu)必選已與東風(fēng)柳汽、吉利汽車、一汽紅旗等多家知名汽車企業(yè)建立了合作關(guān)系,并在富士康、順豐等領(lǐng)軍企業(yè)的支持下,成功構(gòu)建了多場景的人形機器人應(yīng)用生態(tài)。值得一提的是,優(yōu)必選是全球唯一一家能與多家車企宣布合作的人形機器人公司,其Walker S系列機器人也因此在全球車廠實訓(xùn)中脫穎而出。
另外,在工業(yè)領(lǐng)域,宇樹科技機器人也已經(jīng)在工廠巡檢、物流搬運等場景中得到應(yīng)用,幫助企業(yè)提高生產(chǎn)效率,降低人力成本;在教育領(lǐng)域,宇樹科技的機器人憑借其高性價比和開放的SDK,吸引了眾多教育機構(gòu)和學(xué)校的關(guān)注,成為培養(yǎng)學(xué)生科技興趣和創(chuàng)新能力的重要工具。
宇樹科技機器人的跨場景服務(wù)也正在說明,具身智能產(chǎn)業(yè)鏈下游應(yīng)用場景的拓展,正呈現(xiàn)出從工業(yè)制造的剛性需求向服務(wù)業(yè)柔性創(chuàng)新延伸的顯著趨勢。
在工業(yè)制造領(lǐng)域,具身智能機器人的應(yīng)用最初是為了滿足企業(yè)對生產(chǎn)效率提升、人力成本降低等剛性需求,解決重復(fù)性、高強度的體力勞動與高精度操作難題。隨著技術(shù)的不斷成熟與發(fā)展,具身智能逐漸將應(yīng)用范圍拓展至多元化服務(wù)業(yè)領(lǐng)域。
比如,追覓科技推出X50 Ultra掃地機;九號公司推出Navimow X3割草機器人;新加坡企業(yè)Primech AI推出Hytron衛(wèi)生間清潔機器人;美國企業(yè)OpenDroids 推出R2D3家庭助理機器人;銀河通用推出的商業(yè)服務(wù)Galbot機器人;法國企業(yè)Capsix Robotics推出IYU按摩機器人。
值得注意的是,盡管具身智能應(yīng)用前景廣闊,但因場景及技術(shù)成熟度不同,其商業(yè)化落地進程存在顯著差異。
在工業(yè)制造領(lǐng)域,由于生產(chǎn)流程相對標(biāo)準(zhǔn)化,對機器人的功能需求明確,且企業(yè)具備較強的資金與技術(shù)實力,能夠承擔(dān)具身智能機器人的研發(fā)、采購與部署成本,因此商業(yè)化落地速度相對較快,部分頭部企業(yè)已實現(xiàn)規(guī)模化應(yīng)用。
然而,在家庭服務(wù)、醫(yī)療養(yǎng)老等場景,商業(yè)化落地面臨諸多挑戰(zhàn)。家庭服務(wù)場景需求分散且個性化強,用戶對機器人的功能、價格、外觀等方面要求多樣,同時家庭環(huán)境復(fù)雜多變,對機器人的環(huán)境感知、自主決策能力提出了更高要求,目前技術(shù)尚未完全成熟,導(dǎo)致產(chǎn)品難以滿足用戶多樣化需求,市場推廣難度較大。
尤其在醫(yī)療養(yǎng)老領(lǐng)域,涉及嚴格的法規(guī)監(jiān)管、專業(yè)的醫(yī)療知識與倫理問題,對具身智能機器人的安全性、可靠性、精準(zhǔn)性要求極高,技術(shù)研發(fā)與驗證周期長,使得商業(yè)化落地進程相對緩慢。
換言之,具身智能正以多元化的應(yīng)用場景為基石,構(gòu)建起龐大的智能生態(tài)網(wǎng)絡(luò),從工業(yè)制造的剛性需求到服務(wù)業(yè)的柔性創(chuàng)新,其發(fā)展趨勢不可阻擋。盡管商業(yè)化落地受場景與技術(shù)因素制約存在差異,但隨著技術(shù)的持續(xù)突破與應(yīng)用模式的不斷創(chuàng)新,具身智能必將在更多領(lǐng)域?qū)崿F(xiàn)深度滲透,為人類社會帶來更高效、便捷、智能的生活與生產(chǎn)方式。
產(chǎn)業(yè)融合搶灘戰(zhàn)
在科技飛速發(fā)展的當(dāng)下,智能汽車與具身智能產(chǎn)業(yè)的融合已成為行業(yè)發(fā)展的重要趨勢。這種融合不僅源于技術(shù)層面的共通性,更受到企業(yè)戰(zhàn)略需求和商業(yè)前景的驅(qū)動,正從企業(yè)布局和技術(shù)創(chuàng)新兩個維度,重塑著未來出行與智能機器人領(lǐng)域的格局。
企業(yè)層面:戰(zhàn)略布局搶占融合高地
在智能汽車與具身智能產(chǎn)業(yè)融合的賽道上,車企正以積極的姿態(tài)加速布局。為了在這場競爭中占得先機,眾多車企紛紛成立專門的研發(fā)團隊,將具身智能技術(shù)的研究與產(chǎn)品開發(fā)提上日程。
其中,特斯拉持續(xù)加大AI人才投入。在2025年第一季度全員大會上,馬斯克宣布將于年內(nèi)完成首批5000臺Optimus人形機器人的生產(chǎn)目標(biāo)。這一戰(zhàn)略部署伴隨著大規(guī)模人才儲備計劃,特斯拉官方招聘頁面顯示,Optimus項目團隊正在美國四大生產(chǎn)基地展開人才招募,涉及機械設(shè)計、軟件開發(fā)、系統(tǒng)集成、生產(chǎn)制造等關(guān)鍵領(lǐng)域的80個新增崗位。崗位分布數(shù)據(jù)顯示,研發(fā)類職位占比達65%,制造工程類占30%,驗證測試類占5%,形成金字塔型人才結(jié)構(gòu)。
公開信息顯示,小鵬汽車從2020年起開始布局人形機器人產(chǎn)業(yè)。其研發(fā)團隊已深耕該領(lǐng)域5年,并于2024年11月推出首款A(yù)I人形機器人IRON?;贚3級自動駕駛技術(shù)積累,小鵬汽車計劃2026年量產(chǎn)面向工業(yè)場景的L3級人形機器人,實現(xiàn)手、腳、眼、腦全向協(xié)同能力。
何小鵬表示:“小鵬汽車已在人形機器人產(chǎn)業(yè)深耕5年,未來可能還要做20年,再花500億,甚至投入上千億?!?/p>
此外,經(jīng)濟觀察報援引業(yè)內(nèi)消息稱,國內(nèi)某頭部新能源車企已啟動人形機器人項目,內(nèi)部代號為“堯舜禹”;蔚來汽車也已組建約20人的團隊,專注于機器狗項目的調(diào)研。理想汽車創(chuàng)始人李想表示,公司100%將涉足人形機器人領(lǐng)域。
不只是車企,多家輔助駕駛廠商也在積極布局具身智能業(yè)務(wù)。
2024年1月,芯片公司地平線宣布將分拆AIoT團隊,成立全資控股子公司——地瓜機器人。2024年9月,地瓜機器人推出面向“機器人+”時代的軟硬件產(chǎn)品全家桶,包括專為新一代通用機器人而生的旭日5智能計算芯片、易用全能開發(fā)首選RDK X5機器人開發(fā)者套件、具身智能全場景算力核心RDK S100等。
另外,速騰聚創(chuàng)將自己定位為智能機器人增量零部件及解決方案供應(yīng)商,立足整機開發(fā)通用的機器人移動及操作解決方案,并推出適用于各類場景的智能機器人增量零部件。面向智能機器人市場,速騰聚創(chuàng)推出全球首款機器人全固態(tài)數(shù)字化激光雷達E1R和192線半球形數(shù)字化激光雷達Airy。
VLA破界融合
技術(shù)層面:端到端技術(shù)引領(lǐng)融合趨勢
在技術(shù)層面,智能汽車與具身智能的融合也取得了顯著進展。
蓋世汽車研究院報告顯示,多數(shù)企業(yè)正加速自動駕駛端到端技術(shù)的量產(chǎn)上車。無論是自動駕駛還是機器人領(lǐng)域,使用的模型從技術(shù)類別上,由小模型→大模型→端到端大模型發(fā)展。這種演變不僅提升了模型的處理能力和智能水平,還實現(xiàn)了從感知到?jīng)Q策的一體化,大大提高了系統(tǒng)的響應(yīng)速度和準(zhǔn)確性。
圖源:蓋世汽車研究院報告
VLA(Vision-Language-Action)模型被認為可能是“端到端+VLM”技術(shù)框架的終局形態(tài)。VLA是融合了視覺、語言和動作的多模態(tài)大模型范式,VLA模型通過結(jié)合視覺和語言處理,可以解釋復(fù)雜的指令并在物理世界中執(zhí)行動作,可進行視覺理解與空間推理、綜合感知與預(yù)測。 比如谷歌DeepMind推出的RT-2,由MIT等機構(gòu)的研究人員開發(fā)的開源視覺-語言-動作(Vision-Language-Action, VLA)模型Open VLA等等。
在智能汽車領(lǐng)域,VLA模型可以幫助車輛更好地理解復(fù)雜的交通場景,做出更合理的駕駛決策;在具身智能機器人領(lǐng)域,它則能讓機器人更準(zhǔn)確地理解人類指令,并完成相應(yīng)任務(wù)。這種技術(shù)上的共通性,為智能汽車與具身智能產(chǎn)業(yè)的深度融合奠定了堅實基礎(chǔ)。
理想VLA(Vision-Language-Action Model,視覺語言行動模型)是理想研發(fā)的司機AI大模型。
2024年10月,理想汽車推送的端到端+VLM功能,真正意義上實現(xiàn)了One Model一體化端到端模型的大規(guī)模實踐應(yīng)用,并首次將大模型部署至車端量產(chǎn)芯片。這一突破性進展不僅體現(xiàn)了理想在AI算法上的深厚積累,更展示了其在車規(guī)級硬件與大模型融合方面的獨特優(yōu)勢。
2025年3月,理想汽車正式發(fā)布下一代自動駕駛架構(gòu)VLA。也就是說,理想汽車的智能駕駛技術(shù)經(jīng)歷了從規(guī)則算法、到無圖NOA、再到端到端+VLM,最終邁向VLA司機大模型的“三段”進化。
李想認為,人工智能走向生產(chǎn)力的關(guān)鍵在于Agent能力的釋放,即AI不再只是輔助人類思考和判斷,而是能夠獨立完成專業(yè)工作,承擔(dān)“替代性”的角色。理想汽車當(dāng)前的VLA戰(zhàn)略,正是對這一目標(biāo)的路徑設(shè)計。VLA是李想眼中“類人智能”的起點,在他看來,VLA能夠解決全自動駕駛,將成為現(xiàn)階段能力最強的架構(gòu),甚至有機會超越人類開車的能力。
當(dāng)前,智能汽車與具身智能產(chǎn)業(yè)的融合已進入快速發(fā)展階段,企業(yè)的積極布局和技術(shù)的持續(xù)創(chuàng)新,正推動著這一融合向更深層次、更廣領(lǐng)域拓展。未來,隨著技術(shù)的不斷成熟和應(yīng)用場景的進一步豐富,智能汽車與具身智能產(chǎn)業(yè)的融合必將帶來更多驚喜,重塑人們的出行方式和生活體驗。
四大趨勢領(lǐng)航
在人工智能的浪潮中,具身智能正以驚人的速度重塑人機交互的邊界。具身智能的每一次進步都引發(fā)行業(yè)對其未來的深度思考,結(jié)合當(dāng)前技術(shù)演進與產(chǎn)業(yè)動態(tài),蓋世汽車研究院認為,四大趨勢正成為具身智能邁向新階段的關(guān)鍵路標(biāo)。
一、世界模型:具身智能的認知革命
世界模型(World Model)的崛起,標(biāo)志著具身智能從“感知 - 執(zhí)行”的簡單模式向“理解 - 預(yù)測”的高階形態(tài)跨越。傳統(tǒng)機器人依賴預(yù)設(shè)程序或即時傳感器數(shù)據(jù)完成任務(wù),而引入世界模型的具身智能體,能夠基于過往經(jīng)驗構(gòu)建虛擬環(huán)境,通過模擬推演制定最優(yōu)行動策略。
隨著谷歌Deepmind - Genie 2、英偉達Cosmos等模型發(fā)布,大模型開始展現(xiàn)出對世界常識的潛在理解能力。
其中,谷歌Deepmind - Genie能夠通過單張圖片或文字描述生成720p清晰度的交互式3D場景,并支持長達一分鐘的沉浸式探索,生成可交互、可玩的3D環(huán)境,可用于具身智能體訓(xùn)練。
英偉達Cosmos通過多模態(tài)生成與物理規(guī)律建模、高保真仿真環(huán)境構(gòu)建、高效合成數(shù)據(jù)生成與訓(xùn)練優(yōu)化、多版本適配與低延遲響應(yīng),解決了真實數(shù)據(jù)稀缺與訓(xùn)練成本高昂的行業(yè)痛點。該模型通過模擬真實交通場景(如多智能體協(xié)作、極端天氣應(yīng)對),優(yōu)化自動駕駛系統(tǒng)的路徑規(guī)劃和動態(tài)決策能力,并支持復(fù)雜環(huán)境導(dǎo)航,結(jié)合物理規(guī)律模擬提升動作協(xié)調(diào)性,實現(xiàn)機器人智能升級。
二、數(shù)據(jù)采集:從單一到多元的范式轉(zhuǎn)換
數(shù)據(jù)作為具身智能的“燃料”,其采集方式正經(jīng)歷前所未有的變革。傳統(tǒng)依賴真實場景采集數(shù)據(jù)的模式,逐漸向人工示教(遙操、動捕)、仿真合成數(shù)據(jù)、自主探索等多元化數(shù)據(jù)采集方式演進。其中,真實世界人工采集、虛擬環(huán)境仿真與合成都是當(dāng)前主流的數(shù)據(jù)采集方式。
比如,上海人工智能實驗室在研究工作EmbodiedScan中提出更大、更真實的數(shù)據(jù)集、更多樣的場景和更詳盡的標(biāo)注可以顯著提升具身智能的3D感知能力;北京大學(xué)構(gòu)建了涵蓋132萬條的靈巧機械手抓取數(shù)據(jù)集DexGraspNet,在規(guī)模、穩(wěn)定性和多樣性上明顯優(yōu)于現(xiàn)有數(shù)據(jù)集,已有算法訓(xùn)練后能提升抓取成功率,最高可達10%;谷歌聯(lián)合全球機構(gòu)匯集了22種不同機器人類型的數(shù)據(jù),構(gòu)建了最全面的具身智能數(shù)據(jù)集Open X-Embodiment,并用于訓(xùn)練通用具身智能大模型RTX,RTX可以在無需任何訓(xùn)練數(shù)據(jù)或極少訓(xùn)練的情況下,泛化到特定任務(wù)上。
三、合成數(shù)據(jù):破解高質(zhì)量數(shù)據(jù)的供給困局
盡管數(shù)據(jù)采集方式日益多元,但高質(zhì)量數(shù)據(jù)的稀缺性仍是行業(yè)發(fā)展的瓶頸。據(jù)業(yè)內(nèi)預(yù)測,到2026年大模型將消耗盡所有高質(zhì)量數(shù)據(jù),低質(zhì)量數(shù)據(jù)將在2030~2050年消耗殆盡。
蓋世汽車研究院認為,合成數(shù)據(jù)通過算法或模型生成人工數(shù)據(jù),模擬真實數(shù)據(jù)的統(tǒng)計特性和分布規(guī)律,將成為具身智能訓(xùn)練的重要數(shù)據(jù)來源。
圖源:蓋世汽車研究院報告
現(xiàn)如今,以英偉達為代表的科技企業(yè)加快合成數(shù)據(jù)技術(shù)的迭代與應(yīng)用,為具身智能帶來了豐富、可控且經(jīng)濟的訓(xùn)練與學(xué)習(xí)材料。據(jù)了解,英偉達與德克薩斯大學(xué)奧斯汀分校于2023年聯(lián)合提出了MimicGen合成數(shù)據(jù)生成系統(tǒng),通過對人類演示進行處理,自動生成不同場景下的大規(guī)模合成數(shù)據(jù)集,用于機器人的模仿學(xué)習(xí)。在Square等18個任務(wù)中,只用175個人類示例就生成超過5萬個訓(xùn)練數(shù)據(jù)集,并在Square任務(wù)中將成功率從人類示例數(shù)據(jù)集的11.3%提升至90.7%。
在2025年CES,英偉達推出構(gòu)建三種類型機器人的平臺,旨在推動人工智能和機器人領(lǐng)域的革新。這三類機器人分別是:
知識型機器人(Knowledge Robots):也被稱為代理型人工智能(Agentic AI),主要用于知識處理和數(shù)字化任務(wù)。例如,可作為虛擬助手處理復(fù)雜信息,為用戶提供智能化服務(wù)。
通才型機器人(Generalist Robots):即人形機器人(Humanoid Robots),設(shè)計用于多功能場景下的任務(wù)執(zhí)行,模仿人類的行為和交互方式,適應(yīng)家庭、服務(wù)和制造業(yè)等多元場景。
運輸型機器人(Transportation Robots):即自動駕駛汽車,通過結(jié)合AI模型和物理AI技術(shù),能夠自主完成運輸任務(wù),推動物流、出行和交通領(lǐng)域的智能化發(fā)展。
四、具身智能將在2030年迎來規(guī)?;拯c
具身智能的商業(yè)化進程正遵循“技術(shù)突破 - 成本下降 - 規(guī)模擴張” 的經(jīng)典路徑。
圖源:蓋世汽車研究院報告
當(dāng)前,具身智能產(chǎn)業(yè)成本問題限制了其大規(guī)模應(yīng)用,以人形機器人為例。
人形機器人的成本因多種因素存在較大差異,目前市場上大部分人形機器人的成本在數(shù)十萬元左右 。蓋世汽車研究院認為,隨著Tesla、宇樹等企業(yè)公布人形機器人量產(chǎn)計劃,疊加DeepSeek技術(shù)突破,將推動行業(yè)進入“硬件規(guī)?;?軟件開源化”雙輪驅(qū)動階段。隨著技術(shù)的進步、供應(yīng)鏈的成熟以及量產(chǎn)規(guī)模的擴大,人形機器人的成本正在逐漸下降,比如宇樹科技的第二代人形機器人 G1 起售價為 9.9 萬元,眾擎機器人的人形機器人 PM01 售價為 8.8 萬元。 隨著價格持續(xù)下探,具身智能產(chǎn)業(yè)的大規(guī)模應(yīng)用指日可待。
具身智能的未來,既是技術(shù)創(chuàng)新的前沿戰(zhàn)場,也是產(chǎn)業(yè)變革的戰(zhàn)略高地。世界模型的認知突破、多元化的數(shù)據(jù)采集、合成數(shù)據(jù)的技術(shù)賦能,以及即將到來的規(guī)模化拐點,共同勾勒出一幅人機協(xié)同的新圖景。隨著這些趨勢的加速演進,具身智能有望從實驗室走向日常生活,成為重塑人類生產(chǎn)生活方式的核心力量。