作者|劉佳藝,編輯|白雪
新車發(fā)布會上,車企公布智駕行駛里程,已經(jīng)成為了智駕秀肌肉的基本操作。譬如 8 月份,鴻蒙智行公布了智駕里程達(dá)到 2 億公里。
車企之所以把智駕行駛里程拿到臺面上講,原因在于,這些真實(shí)的里程數(shù)據(jù),構(gòu)成了車企在智駕訓(xùn)練上的數(shù)字資產(chǎn),幫助車企在模型訓(xùn)練上不斷迭代升級。
這個過程發(fā)生在云端。
事實(shí)上,一個循環(huán)的數(shù)據(jù)流程在車端、云端之間 24 小時不間斷運(yùn)轉(zhuǎn)。即車端將數(shù)據(jù)反饋給云端,在云端集中進(jìn)行模型訓(xùn)練與仿真,再把模型數(shù)據(jù)發(fā)回車端形成閉環(huán),完成 OTA 部署及更新。
所以車企總喜歡把「開得越多,越好開」放在嘴邊,因?yàn)榈讓舆壿嬚沁@樣。這種「端到端」正是自動駕駛大模型固有的訓(xùn)練方式。
不過,這和現(xiàn)在行業(yè)熱議的端到端自動駕駛并不同,它指代的則是一種技術(shù)路徑,從輸入端到輸出端,從前被切分開的感知、預(yù)測、規(guī)劃、控制等任務(wù)模塊,貫穿成一個巨大的 AI 神經(jīng)網(wǎng)絡(luò),它能像人類大腦一樣快速作出決策。
有意思的是,這兩種「端到端」正碰撞到了一起,還對模型訓(xùn)練提出了更高要求:
-
- 采集、存儲百 PB 級別的數(shù)據(jù)量;
- 對高質(zhì)量數(shù)據(jù)實(shí)現(xiàn)高效率處理、訓(xùn)練;
- 完成從感知到規(guī)控一體的仿真測試;
- 保證數(shù)據(jù)全流程的合規(guī)安全;
- ……
顯然,這需要車企/智駕供應(yīng)商投入巨大的時間成本與人力成本,構(gòu)建出一套成熟、合規(guī)、穩(wěn)定的數(shù)據(jù)工具鏈,以此支撐 AI 模型高效地迭代升級,模型的迭代效率越高,智駕產(chǎn)品落地速度越快,性能表現(xiàn)得越好。
對于車企/智駕供應(yīng)商而言,從零搭建地基,挑戰(zhàn)很大。
而以百度為代表的智能云服務(wù)商都看準(zhǔn)了這種為車企賦能的巨大機(jī)遇,在汽車云建設(shè)上打造了一整套數(shù)據(jù)工具鏈,貫穿數(shù)據(jù)采集、標(biāo)注、管理、仿真、測試等全流程,支持了業(yè)內(nèi)大批企業(yè)自動駕駛服務(wù)的落地發(fā)展。
在最新一屆百度云智大會上,百度汽車云迭代到 3.0 版本,圍繞著端到端自動駕駛的特性對工具鏈做了針對性優(yōu)化升級,助力自動駕駛玩家們打造高效運(yùn)轉(zhuǎn)的數(shù)據(jù)閉環(huán),攻克端到端自動駕駛的落地難點(diǎn)。
01、用生成式AI 解開「數(shù)據(jù)劫」
端到端技術(shù)范式,是行業(yè)公認(rèn)通向高階自動駕駛的最優(yōu)解。
這種與 AI 深度綁定的技術(shù)路徑,相當(dāng)于把摩天大樓繼續(xù)筑高,無疑給充當(dāng)?shù)鼗臄?shù)據(jù)工具鏈?zhǔn)┘恿烁髩毫Α?/p>
一方面,數(shù)據(jù)規(guī)模開始瘋狂擴(kuò)大,數(shù)據(jù)處理難度上升。
一個大致標(biāo)準(zhǔn)是:
實(shí)現(xiàn) L2、L3 級的自動駕駛 Demo 模型,只需要百萬張圖片的數(shù)據(jù)量;
實(shí)現(xiàn) L2、L3 級自動駕駛的量產(chǎn),需要億張圖片,數(shù)據(jù)量大于 100T;
實(shí)現(xiàn) L4 級的自動駕駛 Demo 模型,存儲數(shù)據(jù)量從 T 級進(jìn)化為 P 級;
最后,實(shí)現(xiàn) L4 級的自動駕駛量產(chǎn),數(shù)據(jù)量已經(jīng)大于 50PB。
很明顯,每上升一個難度或?qū)蛹壓?,?shù)據(jù)處理變得越來越難掌控。
如果把自動駕駛數(shù)據(jù)處理鏈條攤開,可以看到這個流程包括篩選、清洗、標(biāo)注等重點(diǎn)環(huán)節(jié),這個步驟的關(guān)鍵目的是把真實(shí)數(shù)據(jù)變得有用。
端到端自動駕駛對于「數(shù)據(jù)有用」的定義,是系統(tǒng)通過數(shù)據(jù)訓(xùn)練實(shí)現(xiàn)強(qiáng)大的泛化能力,能夠像老司機(jī)一樣,應(yīng)對各種復(fù)雜多變的駕駛場景,包括 Corner case(極端情況),如行人突然橫穿馬路、多路口環(huán)島路線、極限直角型轉(zhuǎn)彎等。
用一個比喻來講,就是訓(xùn)練出一個聰明大腦,它不僅會做大量的常規(guī)題目,面對沒有做過的難題時,也能冷靜思考,合理分析,通過舉一反三的方式寫出正確解法。所以訓(xùn)練策略上需要注重廣度和深度,用來訓(xùn)練的數(shù)據(jù)要足夠豐富、多樣、具備挑戰(zhàn)性。
這就要求數(shù)據(jù)處理過程中,能從海量數(shù)據(jù)庫中快速挖掘、標(biāo)注這些高質(zhì)量的題型,構(gòu)成一個優(yōu)質(zhì)的訓(xùn)練集。
另一方面,仿真訓(xùn)練的邏輯發(fā)生變化,成為新的難題。
仿真訓(xùn)練相當(dāng)于自動駕駛研發(fā)最后一道防線,驗(yàn)證評估。它好比一個專業(yè)的評價體系,給模型打分,分?jǐn)?shù)高的才能進(jìn)行到下面的車端部署環(huán)節(jié)上,分?jǐn)?shù)低的則要找到 bug 點(diǎn),回到訓(xùn)練模塊重新優(yōu)化。
目前,自動駕駛的測評分為兩類,開環(huán)評估與閉環(huán)評估。
前者對于不同任務(wù)可以單拎出來,例如單獨(dú)評估感知、預(yù)測、規(guī)劃等環(huán)節(jié)的效果,與真實(shí)數(shù)據(jù)或標(biāo)注數(shù)據(jù)相比對;
后者指在仿真引擎構(gòu)建的虛擬世界中建立反饋閉環(huán),從輸入到輸出端接受反饋信號,與現(xiàn)在行業(yè)反復(fù)提及的「世界模型」一個概念。
端到端自動駕駛由于感知、規(guī)劃這些環(huán)節(jié)都連成一體,意味著它只能走閉環(huán)評估的路線,這就要求,底層的數(shù)據(jù)工具鏈也能支持這種一體化的訓(xùn)練方式。
另外一層難度,體現(xiàn)在仿真訓(xùn)練更需要龐大的數(shù)據(jù)支撐,因?yàn)樗谋举|(zhì)是要建立一個虛擬世界,模擬車在真實(shí)世界中遭遇的一切,比如遇到水坑怎么過,前面迎面飄來塑料袋該做出什么反應(yīng),這需要包含許多長尾場景,并且場景要全面、真實(shí),因?yàn)樗悄P妥詈蟮脑u價體系,如果評價體系都不專業(yè),那整個模型訓(xùn)練都是一場無用功。
所以,針對這些層面上的升級要求,百度汽車云對數(shù)據(jù)工具鏈產(chǎn)品做了不同程度的升級完善,主要體現(xiàn)在兩點(diǎn)。
一是增加數(shù)據(jù)智搜功能,包括以文搜圖,以圖搜圖。
這可以幫助數(shù)據(jù)管理平臺快速完成數(shù)據(jù)篩選,精準(zhǔn)找到高質(zhì)量、有價值的數(shù)據(jù),比如需要一個公路上路面積水的場景,可以直接用一張圖、一句話描述,就能快速把相關(guān)數(shù)據(jù)鎖定、檢索出來,喂給 AI 模型做訓(xùn)練。
二是對采集數(shù)據(jù)進(jìn)行生成式動作,用真實(shí)場景做仿真。
這可以實(shí)現(xiàn)對真實(shí)數(shù)據(jù)的再利用,正常情況下,一組高質(zhì)量的數(shù)據(jù)只能作為一次場景使用,但通過生成式 AI,把場景中某個障礙物抹除,再注入新的車輛,就能生成其他同樣真實(shí)的場景。
顯然,這是一種降本增效的有利解法,尤其對于場景匱乏,路測數(shù)據(jù)不足的企業(yè)而言,生成式 AI 在有限成本基礎(chǔ)上,讓采集數(shù)據(jù)在更多的泛化參數(shù)下,得到有效利用。
英偉達(dá)全球副總裁、汽車事業(yè)部負(fù)責(zé)人吳新宙認(rèn)為,隨著端到端大模型上車,AI 將以無限度的規(guī)則重新定義汽車。
某種程度上,生成式 AI 與自動駕駛技術(shù)相結(jié)合,重塑智能化體驗(yàn),指向了高階自動駕駛的落地實(shí)現(xiàn)。
所以,要在汽車智能化下半場提高勝率,則是要學(xué)會四個字,借力打力,抓住 AI 這一變革力量,這是百度智能云正在做的事。
另外需要強(qiáng)調(diào)的是,百度本身作為自動駕駛的頭號玩家,十年的研究歷程下來,擁有真實(shí)、海量、豐富的數(shù)據(jù)資源,比如在百度地圖支持下,擁有上百個國內(nèi)主要城市全域數(shù)據(jù),測試?yán)锍谈采w千萬公里。這類豐富的數(shù)據(jù)資產(chǎn)對于建立仿真訓(xùn)練平臺有極大的優(yōu)勢。
02全鏈路訓(xùn)練優(yōu)化,把算力吃透
某智駕供應(yīng)商曾表示,數(shù)據(jù)會占據(jù)端到端自動駕駛開發(fā)中 80% 以上的研發(fā)成本。
這其中也包含了算力,龐大的數(shù)據(jù)資產(chǎn)需要強(qiáng)大的算力資源支撐。
尤其是仿真平臺,大量仿真任務(wù)并發(fā)運(yùn)行時,CPU、GPU 任務(wù)混合在一起,這對算力資源造車不小壓力。
算力成為了自動駕駛玩家們錨定的軍備競賽,這指向了兩種統(tǒng)一動作。
一是興建智算中心。
以特斯拉為例,其消耗數(shù)十億美金興建超算中心,預(yù)計(jì)今年底算力最高將達(dá)到 100E FLOPS。
國內(nèi)智駕玩家顯然不具備這番資金實(shí)力,但在智算中心的算力投入上,一直不遺余力的提高上限。
二是打造世界模型。
端到端自動駕駛對于「驗(yàn)證」的高要求,使得世界模型/仿真平臺成為智駕企業(yè)的加碼重點(diǎn)。
尤其是生成式 AI 出現(xiàn)后,這種模擬現(xiàn)實(shí)的強(qiáng)大工具被深度應(yīng)用在世界模型/仿真平臺的搭建中。
與之伴隨的,是對算力的高需求與高消耗。
據(jù)悉,端到端自動駕駛的起步算力,大概在 1000P 左右。越往上走,算力要求越高,成本負(fù)荷越重。
與此同時,還伴隨著一個難題,即算力效率低,如果算力冗余,沒有得到充分利用,那在算力上花費(fèi)的資金成本則又被砌高了。
所以關(guān)鍵是把有限算力發(fā)揮出最大價值,降低成本和時間,提高迭代速度。
百度智能云的算力服務(wù)優(yōu)勢由此凸顯出來,推出了百舸· AI 異構(gòu)計(jì)算平臺 4.0,提供了一套低成本、高效能的優(yōu)化方案。
這里值得一提的是,百舸平臺為了追求訓(xùn)練的極致性能,除了追求單卡本身的訓(xùn)練性能,也重視多卡之間的并行效率。
這種多芯訓(xùn)練,使得平臺能夠支持不同類型的芯片算力運(yùn)轉(zhuǎn),包括 A100、A800、國產(chǎn)芯片等,還能夠支持萬卡規(guī)模的大型集群,進(jìn)而幫助模型提升計(jì)算效率。
另外,百舸平臺這種端到端加速能力,對于不同的算法框架也做到了泛化性適配。
一個熱知識是,同一個算法模型在不同的訓(xùn)練框架上獲得的優(yōu)化能力不同,如果算法框架和模型的耦合能力差的話,還會造車算力資源使用差的負(fù)收益。
所以百舸平臺基于自動調(diào)優(yōu)策略,通過并行優(yōu)化、顯存優(yōu)化,各種算子、存儲、網(wǎng)絡(luò)的各方面優(yōu)化行為,最大程度提高了訓(xùn)練效能。
可以通過一組數(shù)據(jù)論證:
在標(biāo)注場景下,百舸平臺的 GPU 共享方案將自動化標(biāo)注的成本降低了 1 倍以上;
在模型訓(xùn)練場景下,百舸平臺幫助模型訓(xùn)練吞吐平均提升 138%,最高 400%,最多縮短 80% 的模型訓(xùn)練時間;
在仿真場景下,百舸平臺可以支持仿真平臺實(shí)現(xiàn)日行百萬公里的仿真里程。
一個真實(shí)案例是,某頭部車企通過百度智能云助力,模型訓(xùn)練性能提升了 170%,GPU 的資源效率提升了 2.5 倍。
顯然,百舸平臺作為強(qiáng)大的 AI 基礎(chǔ)設(shè)施,讓算力資源在多樣化場景下得到充分發(fā)揮,幫助智駕企業(yè)們抓住研發(fā)效率這個核心競爭力。
03云智一體,加速智能化終局
智能化的下半場,比拼的核心在于基礎(chǔ)設(shè)施——汽車云的能力,這決定水面之上性能的上限。
在這種云智一體的生態(tài)中,同樣能看到兩種趨勢正在生長。
一是車路云結(jié)合,把路測的數(shù)據(jù)引入進(jìn)來。
以往在路上開車,遇到交通事故、施工路段往往需要承受長達(dá)幾小時的堵塞折磨,這給出行帶來極大的不便利性。
而百度智能云和路測交通集團(tuán)合作,把數(shù)據(jù)聯(lián)通后。這些動態(tài)的路況,以及天氣信息,都能早早通過 AI 提醒獲得,用戶可以提前根據(jù)信息規(guī)劃線路,保證出行的通暢。
比如,有車企就通過公交車的潮汐車道數(shù)據(jù)做路徑規(guī)劃,用戶可以巧妙避開堵塞路段,提升駕乘體驗(yàn)感。
值得一提的是,這種路況提醒,可以建立在不開啟導(dǎo)航地圖的基礎(chǔ)上,直接通過智能座艙實(shí)現(xiàn)。
這也指向了第二種趨勢,即智能座艙的體驗(yàn)感越來越好。
在 AI 大模型上車后,智能座艙從多模態(tài)的交互性演變成 AI 的主動性越來越強(qiáng)。
也就是說,從用戶主動發(fā)起問答式、指令式對話,AI 準(zhǔn)確理解并回答、執(zhí)行,變成 AI 主動揣測用戶需求,在恰當(dāng)?shù)臅r機(jī)發(fā)起相關(guān)對話,推送對應(yīng)功能等。
另外,智能座艙的體驗(yàn)感也在逐步提升,比如極越 01、07 等車型上車了百度的座艙大模型后,能做到車外語音控制,通勤自動導(dǎo)航等功能,并且還能通過「哨兵模式」,在車未啟動時,幫助用戶自動記錄到車輛剮蹭等意外情況,并自動啟動行車記錄儀保留證據(jù)。
一個確定路徑是,伴隨著自動駕駛、智能座艙向更高緯度的性能進(jìn)階,云服務(wù)商都在抓住這種為車企賦能的機(jī)遇,不斷推出具備競爭力的服務(wù)方案,在數(shù)據(jù)工具鏈的產(chǎn)力上內(nèi)卷。
小馬智行 CTO 樓天城在最新采訪中表示,數(shù)據(jù)鏈的成熟度,決定了最后模型好壞的關(guān)鍵。
而有能力把數(shù)據(jù)鏈做到支撐 L4 的一定是百度。事實(shí)上,百度本身就在 AI 領(lǐng)域長期積累,打造的 Apollo 平臺具備支撐 L2 至 L4 的量產(chǎn)落地實(shí)力。
而百度作為頭部自動駕駛科技企業(yè),選擇以一種開放的心態(tài)來做云服務(wù),把核心工具鏈開放給行業(yè)使用。
根據(jù)全球領(lǐng)先的 IT 市場研究和咨詢公司 IDC 發(fā)布《中國人工智能公有云服務(wù)市場份額,2023》報(bào)告顯示,2023 年中國 AI 公有云服務(wù)市場整體規(guī)模達(dá) 126.1 億元人民幣,百度智能云市場份額以 26.4% 的成績排名第一。
值得一提的是,自 IDC 發(fā)布中國 AI 公有云市場報(bào)告以來,百度智能云已經(jīng)連續(xù) 5 年蟬聯(lián)中國市場第一。
在汽車行業(yè)集體擁抱智能化的今天,沒有一家車企能做到全棧自研,絕大多數(shù)都選擇與云服務(wù)商來個雙向奔赴,在強(qiáng)大的數(shù)字基建上構(gòu)建智能化壁壘,也正是在這種合作共贏的生態(tài)下,智能駕駛的想象力能夠進(jìn)一步延伸,并一步步轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)。