如同手機(jī)“功能機(jī)”向“智能機(jī)”的升級(jí),在人形機(jī)器人進(jìn)入千家萬(wàn)戶(hù),真正改變我們生活的過(guò)程中,它們要為我們連接外界的信息、產(chǎn)品和服務(wù),就必須,也必然身在本地,腦在云端。
2023剛剛開(kāi)年,人工智能與機(jī)器人就再一次點(diǎn)燃了各界對(duì)科技創(chuàng)新的關(guān)注和暢想。
無(wú)論《流浪地球2》電影里讓人后背發(fā)涼的人工智能MOSS,憨態(tài)可掬的智能機(jī)器狗“笨笨”;還是在各個(gè)創(chuàng)作和互動(dòng)領(lǐng)域狂刷成就,被視為人工智能全新里程的ChatGPT,都在公眾、行業(yè)和資本等各個(gè)領(lǐng)域不斷引發(fā)連鎖反應(yīng)。
那么,在真實(shí)的世界里,人工智能和機(jī)器人的智能化水平達(dá)到什么程度了?二者相遇碰撞之后又將向如何進(jìn)化?
【ChatGPT:人工智能的新時(shí)代起點(diǎn)】
從通過(guò)美國(guó)高校的入學(xué)資格考試(SAT),到編寫(xiě)代碼、撰寫(xiě)報(bào)告和構(gòu)思小說(shuō),ChatGPT的出現(xiàn)都讓公眾感到了前所未有的壓力,迅速破圈。
與此類(lèi)似的還有早先興起過(guò)的AI繪圖作畫(huà),這些AIGC(人工智能生產(chǎn)內(nèi)容)被看作是繼UGC(用戶(hù)生產(chǎn)內(nèi)容)之后新的創(chuàng)新模式。
它為我們帶來(lái)的,不僅是在幾秒鐘之內(nèi)根據(jù)需求迅速生成內(nèi)容的效率提升。更重要的是,在回答開(kāi)放問(wèn)題,生成文字、圖片、視頻等創(chuàng)造性?xún)?nèi)容等傳統(tǒng)AI最受困擾的領(lǐng)域,它也展現(xiàn)出了驚人的表現(xiàn)。
這些現(xiàn)象背后,一個(gè)最根本的變化是:
依托大型語(yǔ)言模型的訓(xùn)練,ChatGPT對(duì)人類(lèi)意圖的理解,有了跨越式的質(zhì)變提升。
在此之前,人工智能發(fā)展的上一個(gè)關(guān)鍵里程碑事件,是2016年3月,“深度學(xué)習(xí)”的代表AlphaGo正式擊敗圍棋世界冠軍李世石。
此后6年來(lái),人工智能的發(fā)展日新月異,但始終存在一個(gè)巨大障礙:
由于算法復(fù)雜度和數(shù)據(jù)規(guī)模的限制,當(dāng)下幾乎所有的AI,都只能同時(shí)在少量的垂直應(yīng)用方向上,實(shí)現(xiàn)接近或超越人類(lèi)的智能表現(xiàn);而無(wú)法在對(duì)話(huà)、創(chuàng)造、情感、認(rèn)知等更加開(kāi)放、復(fù)雜的領(lǐng)域,實(shí)現(xiàn)從“弱人工智能”向“強(qiáng)人工智能”的關(guān)鍵一躍。
而現(xiàn)在,以ChatGPT的火爆為標(biāo)志,我們已經(jīng)看到一個(gè)新的臨界點(diǎn)到來(lái)。
“從某種意義上來(lái)講,AlphaGo 是人工智能領(lǐng)域的第1顆原子彈,而ChatGPT就是氫彈?!边_(dá)闥機(jī)器人創(chuàng)始人、CEO黃曉慶認(rèn)為,雖然ChatGPT還需要更多的優(yōu)化,但它已經(jīng)跨越了圖靈測(cè)試的邊界,在那些需要高創(chuàng)作性的領(lǐng)域,為人工智能的發(fā)展和應(yīng)用推開(kāi)了一個(gè)新的時(shí)代。
相較于傳統(tǒng)的人工標(biāo)注的模型訓(xùn)練,通過(guò)堆疊數(shù)據(jù)集進(jìn)行“自學(xué)習(xí)”訓(xùn)練的大模型、多模態(tài)AI,正如2016年的深度學(xué)習(xí)一樣,成為新的行業(yè)主流。
而在這個(gè)過(guò)程中,我們也將全面進(jìn)入一個(gè)“強(qiáng)人工智能”的時(shí)代。具有更強(qiáng)感知、交互和創(chuàng)造力的,能在更加開(kāi)放環(huán)境下,同時(shí)完成更多不同任務(wù)的新一代人工智能,將從AIGC應(yīng)用、生成式AI到更多應(yīng)用場(chǎng)景,為整個(gè)人類(lèi)社會(huì)帶來(lái)新的改變。
【機(jī)器人應(yīng)用升級(jí):4個(gè)D和4個(gè)C】
在這些改變中,最值得期待的領(lǐng)域之一,是智能機(jī)器人。
尤其是服務(wù)機(jī)器人。
多年來(lái),幾乎所有從事機(jī)器人產(chǎn)業(yè)的人,都?jí)粝胫龀隹梢宰哌M(jìn)千家萬(wàn)戶(hù),完全替代人類(lèi)的服務(wù)機(jī)器人;但同時(shí)也都明白,這一夢(mèng)想在現(xiàn)階段幾乎不可能達(dá)成。
與傳統(tǒng)的在封閉環(huán)境里完成固定任務(wù),更強(qiáng)調(diào)精確性和高效性的工業(yè)機(jī)器人不同,服務(wù)機(jī)器人的應(yīng)用場(chǎng)景,主要是跟人類(lèi)打交道,所以它更需要像人一樣,在開(kāi)放復(fù)雜環(huán)境下具備相當(dāng)強(qiáng)的自適應(yīng)能力。
無(wú)論是人類(lèi)還是別的生物體,有些自適應(yīng)能力是天然形成的。比如看到障礙會(huì)躲開(kāi),碰到障礙物會(huì)后退等。
這些看起來(lái)稀松平常的行為,要讓機(jī)器人能夠?qū)崿F(xiàn),卻并非易事:先要對(duì)外部環(huán)境進(jìn)行動(dòng)態(tài)的數(shù)據(jù)和信息采集,根據(jù)信息匯總進(jìn)行準(zhǔn)確判斷,計(jì)算出最佳的行動(dòng)軌跡,再將操作指令分解傳遞到各部件執(zhí)行并收集反饋。
與此同時(shí),還必須要保持平衡,能上樓下樓,繞開(kāi)障礙物,不會(huì)被突然撲過(guò)來(lái)的人車(chē)寵物撞倒;需要與人交互,聽(tīng)懂我們的提問(wèn)和指令,并馬上高效地理解和執(zhí)行;需要通過(guò)機(jī)械手完成更復(fù)雜的工作,比如掃地做飯,搬高挪低,扶老攜幼……
機(jī)器人表現(xiàn)出的自適應(yīng)能力和人越接近,就意味著輔助甚至取代人類(lèi)工作的可能性越大。
在此之前,從本田公司發(fā)布第一代ASIMO算起,具備人類(lèi)雙足行走能力的智能機(jī)器人問(wèn)世已有23年。
這23年,正是人類(lèi)科技,尤其是數(shù)字化產(chǎn)業(yè)蓬勃發(fā)展的階段,也帶動(dòng)了機(jī)器人技術(shù)和產(chǎn)業(yè)的不斷突破和創(chuàng)新。
在這個(gè)過(guò)程中:
有的機(jī)器人公司更注重技術(shù)的研究。比如波士頓動(dòng)力,每隔一段時(shí)間,就會(huì)發(fā)布一些讓業(yè)界嘆為觀止的演示視頻。雖然因?yàn)椴捎?a class="article-link" target="_blank" href="/baike/1658381.html">液壓驅(qū)動(dòng)技術(shù),結(jié)構(gòu)復(fù)雜、成本高、維護(hù)難,重量高,難以轉(zhuǎn)化為商業(yè)產(chǎn)品,但卻讓我們對(duì)人形機(jī)器人的未來(lái)發(fā)展,有了更大的信心。
有的更長(zhǎng)于商業(yè)化探索。比如特斯拉,雖然去年發(fā)布的擎天柱在感知、運(yùn)動(dòng)、交互等方面的能力和體驗(yàn)都還有待進(jìn)一步完善,但只是一場(chǎng)發(fā)布會(huì),已經(jīng)把公眾的期待牢牢拉滿(mǎn)。
有的更聚焦于“內(nèi)功”的修煉。比如達(dá)闥機(jī)器人,以打造機(jī)器人產(chǎn)業(yè)生態(tài)為目標(biāo),蟄伏7年,終于在智能柔性關(guān)節(jié)、云端大腦、機(jī)器人操作系統(tǒng)、機(jī)器人元宇宙等關(guān)鍵技術(shù)和關(guān)鍵元器件領(lǐng)域完成了全方位的戰(zhàn)略卡位。
但不論是怎樣的方向,伴隨著大模型、多模態(tài)“強(qiáng)人工智能”的發(fā)展,智能機(jī)器人的發(fā)展也即將獲得更有力的助推。
黃曉慶認(rèn)為,在未來(lái)幾年,智能機(jī)器人就將在4個(gè)D和4個(gè)C領(lǐng)域,為我們的生活帶來(lái)巨大改變:
4個(gè)D(主要面向垂直行業(yè)):
Dull,重復(fù)性很高,無(wú)聊的工作。
Dangerous,巡夜、爬高等危險(xiǎn)工作。
Dirty,讓人感覺(jué)臟的工作,比如掃地、清潔等等。
Demeaning,比較沒(méi)有尊嚴(yán)的工作。
4個(gè)C(主要面向家庭):
Conversation,與人交流。
Clean,做清潔。
Care,照顧老人,照顧小孩。
Cooking,做飯。
【從“功能機(jī)”到“智能機(jī)”:機(jī)器人呼喚RobotGPT】
在“強(qiáng)人工智能”時(shí)代,智能機(jī)器人將如何學(xué)習(xí)和進(jìn)步,不斷刷新自己的能力與體驗(yàn)上限?
在我看來(lái),圍繞“智能”兩個(gè)字,完全可以從手機(jī)的發(fā)展歷程中,得到非常有意思的參考和借鑒。
最初的手機(jī),被稱(chēng)為“功能機(jī)”,所有功能都固化在手機(jī)里。在這個(gè)時(shí)代,手機(jī)的功能相對(duì)單一,只能打電話(huà)和發(fā)短信,以及使用鬧鐘、游戲等少量“內(nèi)置功能”。
而隨著“智能機(jī)時(shí)代”來(lái)臨,手機(jī)逐漸成為了我們肢體、意志和生活的延伸,除了打電話(huà)和發(fā)短信,手機(jī)可以聽(tīng)音樂(lè)、玩游戲,看新聞,點(diǎn)外賣(mài),上網(wǎng)課、買(mǎi)東西……
在這個(gè)過(guò)程中,最大的改變不僅在于手機(jī)本身軟件和硬件的升級(jí),更在于手機(jī)的功能已經(jīng)不再固化在手機(jī)內(nèi)部,而是來(lái)自于云端。
于是手機(jī)的作用完成了從工具到樞紐的質(zhì)變:通過(guò)越來(lái)越發(fā)達(dá)的信息高速網(wǎng)絡(luò),智能手機(jī)將我們與數(shù)據(jù)、資金、物流連接在了一起,將個(gè)體與整個(gè)世界的各種產(chǎn)品和服務(wù)連接在了一起。
而現(xiàn)在,這也將會(huì)是智能機(jī)器人發(fā)展的大勢(shì)所趨。
許多人認(rèn)為,機(jī)器人發(fā)展的終極目標(biāo),是要讓一個(gè)機(jī)器人獨(dú)立實(shí)現(xiàn)接近人的思考能力和運(yùn)動(dòng)能力;但遺憾的是,大模型的人工智能,對(duì)算力和數(shù)據(jù)都有巨大要求,以我們當(dāng)下的技術(shù)能力,存在太多短期內(nèi)無(wú)法解決的技術(shù)難題。
谷歌2021年發(fā)布的超級(jí)語(yǔ)言模型Switch Transformer參數(shù)規(guī)模達(dá)到1.6萬(wàn)億,阿里達(dá)摩院的多模態(tài)大模型M6參數(shù)更直接突破了10萬(wàn)億。
如果要讓機(jī)器人直接加載“強(qiáng)人工智能”,那只會(huì)讓機(jī)器人的芯片瞬間過(guò)載死機(jī)——即使能勉強(qiáng)運(yùn)行,也會(huì)對(duì)本來(lái)就艱難的功耗和續(xù)航帶來(lái)巨大負(fù)擔(dān)。
對(duì)單機(jī)芯片的算力來(lái)說(shuō),這是讓人絕望的量級(jí)差。
所以,更科學(xué)更有效的辦法是,建立一個(gè)完整、高速的“端-網(wǎng)-云”體系,用強(qiáng)大的云端大腦,高速可靠的神經(jīng)網(wǎng)絡(luò),來(lái)承擔(dān)海量的計(jì)算工作,以此讓機(jī)器人突破算力和功耗的瓶頸,為我們提供所需要的智能服務(wù)。
從這個(gè)意義上來(lái)說(shuō),大模型人工智能的發(fā)展,也將為云端智能機(jī)器人的發(fā)展,打造出一個(gè)具有決定性的強(qiáng)大引擎。
而以更長(zhǎng)遠(yuǎn)的發(fā)展來(lái)看,人形機(jī)器人也將取代手機(jī),新的“個(gè)人管家”將成為個(gè)體與世界連接的新的樞紐。
如同手機(jī)“功能機(jī)”向“智能機(jī)”的升級(jí),在人形機(jī)器人進(jìn)入千家萬(wàn)戶(hù),真正改變我們生活的過(guò)程中,它們要為我們連接外界的信息、產(chǎn)品和服務(wù),就必須,也必然身在本地,腦在云端。
這將是機(jī)器人的RobotGPT,機(jī)器人的未來(lái)。
【云端機(jī)器人:中國(guó)已經(jīng)領(lǐng)先全球】
就目前而言,已經(jīng)落地的智能機(jī)器人,絕大多數(shù)都還是通過(guò)終端自身算力承擔(dān)計(jì)算工作,功能和應(yīng)用粗糙的“弱人工智能”。
所以我們看到,雖然各種機(jī)器人五花八門(mén),看上去種類(lèi)繁多、功能各異,甚至在公眾宣傳和資本市場(chǎng)上喧囂熱鬧,但最終的用戶(hù)體驗(yàn)都還普遍停留在“玩具”或者“初級(jí)服務(wù)層面”,未來(lái)都將被逐漸淘汰。
在未來(lái)幾年,我們很快會(huì)看到“強(qiáng)人工智能”驅(qū)動(dòng)的新一代云端機(jī)器人,為我們帶來(lái)能力和體驗(yàn)的質(zhì)變。
尤其值得注意的是,隨著近期ChatGPT的火熱,“中國(guó)與美國(guó)人工智能存在多大差異”成了一個(gè)新的火爆話(huà)題。
在這個(gè)問(wèn)題上,各界議論紛紛,還未有統(tǒng)一答案。
但我們可以肯定的是,在云端機(jī)器人領(lǐng)域,中國(guó)已經(jīng)處在領(lǐng)先位置。
早在2015年,達(dá)闥機(jī)器人就已經(jīng)率先提出了云端機(jī)器人概念,并在此后幾年時(shí)間里,從專(zhuān)利、標(biāo)準(zhǔn)、技術(shù)平臺(tái)、操作系統(tǒng)、關(guān)鍵元器件、生態(tài)平臺(tái)在內(nèi)的整個(gè)產(chǎn)業(yè)鏈條,完成了全方位的技術(shù)和產(chǎn)業(yè)布局,構(gòu)建出了完整云端機(jī)器人的技術(shù)體系和運(yùn)營(yíng)平臺(tái)。
更重要的是,達(dá)闥的戰(zhàn)略并不是一家企業(yè)自己的“單打獨(dú)斗”,而是以帶動(dòng)產(chǎn)業(yè)鏈共同發(fā)展為理念,搭建起一個(gè)由運(yùn)營(yíng)商、應(yīng)用開(kāi)發(fā)商、人工智能提供商和機(jī)器人本體制造商共同形成的云端機(jī)器人生態(tài),從而匯聚整個(gè)產(chǎn)業(yè)鏈力量,形成了共同繁榮的積極生態(tài)。
通過(guò)達(dá)闥構(gòu)建的機(jī)器人云端大腦操作系統(tǒng)“海?!?,以及機(jī)器人虛擬開(kāi)發(fā)平臺(tái)“海元世界”,任何開(kāi)發(fā)者都可以根據(jù)自己的需要,在虛擬平臺(tái)上快速、高效、低成本地開(kāi)發(fā)、訓(xùn)練和驗(yàn)證機(jī)器人,并通過(guò)云端機(jī)器人的標(biāo)準(zhǔn)控制單元(RCU)接入云端大腦,在千行百業(yè)投入應(yīng)用。
這樣一個(gè)生態(tài),就像是智能手機(jī)背后的操作系統(tǒng)、應(yīng)用商店、以及云端的海量應(yīng)用服務(wù),將成為機(jī)器人產(chǎn)業(yè)鏈從“功能機(jī)”向“智能機(jī)”升級(jí)的根基沃土。
更重要的是,達(dá)闥的理念和戰(zhàn)略布局,也已經(jīng)得到了國(guó)家層面的支持以及國(guó)際產(chǎn)業(yè)界的認(rèn)可。
2022年,達(dá)闥獲得科技部許可,建立中國(guó)第一家、也是目前唯一一個(gè)國(guó)家級(jí)的新一代人工智能云端機(jī)器人開(kāi)放創(chuàng)新平臺(tái)。
2022世界機(jī)器人大會(huì)發(fā)布的《機(jī)器人十大前沿?zé)狳c(diǎn)領(lǐng)域(2022-2023)》,達(dá)闥海睿操作系統(tǒng)、達(dá)闥“云端大腦+本地機(jī)器人”核心技術(shù)入選“2022—2023年機(jī)器人十大前沿技術(shù)”。
這意味著,與很多科技領(lǐng)域,中國(guó)落后于國(guó)際競(jìng)爭(zhēng)對(duì)手不同,在這個(gè)代表未來(lái)大勢(shì)的關(guān)鍵行業(yè),中國(guó)已經(jīng)占據(jù)了寶貴先機(jī)。