免费看麻豆视频,国产一级一级一级A片

作者｜劉佳藝，編輯｜白雪

新車發(fā)布會上，車企公布智駕行駛里程，已經(jīng)成為了智駕秀肌肉的基本操作。譬如 8 月份，鴻蒙智行公布了智駕里程達到 2 億公里。

車企之所以把智駕行駛里程拿到臺面上講，原因在于，這些真實的里程數(shù)據(jù)，構(gòu)成了車企在智駕訓(xùn)練上的數(shù)字資產(chǎn)，幫助車企在模型訓(xùn)練上不斷迭代升級。

這個過程發(fā)生在云端。

事實上，一個循環(huán)的數(shù)據(jù)流程在車端、云端之間 24 小時不間斷運轉(zhuǎn)。即車端將數(shù)據(jù)反饋給云端，在云端集中進行模型訓(xùn)練與仿真，再把模型數(shù)據(jù)發(fā)回車端形成閉環(huán)，完成 OTA 部署及更新。

所以車企總喜歡把「開得越多，越好開」放在嘴邊，因為底層邏輯正是這樣。這種「端到端」正是自動駕駛大模型固有的訓(xùn)練方式。

不過，這和現(xiàn)在行業(yè)熱議的端到端自動駕駛并不同，它指代的則是一種技術(shù)路徑，從輸入端到輸出端，從前被切分開的感知、預(yù)測、規(guī)劃、控制等任務(wù)模塊，貫穿成一個巨大的 AI 神經(jīng)網(wǎng)絡(luò)，它能像人類大腦一樣快速作出決策。

有意思的是，這兩種「端到端」正碰撞到了一起，還對模型訓(xùn)練提出了更高要求：

- 采集、存儲百 PB 級別的數(shù)據(jù)量；
- 對高質(zhì)量數(shù)據(jù)實現(xiàn)高效率處理、訓(xùn)練；
- 完成從感知到規(guī)控一體的仿真測試；
- 保證數(shù)據(jù)全流程的合規(guī)安全；
- ……

顯然，這需要車企/智駕供應(yīng)商投入巨大的時間成本與人力成本，構(gòu)建出一套成熟、合規(guī)、穩(wěn)定的數(shù)據(jù)工具鏈，以此支撐 AI 模型高效地迭代升級，模型的迭代效率越高，智駕產(chǎn)品落地速度越快，性能表現(xiàn)得越好。

對于車企/智駕供應(yīng)商而言，從零搭建地基，挑戰(zhàn)很大。

而以百度為代表的智能云服務(wù)商都看準(zhǔn)了這種為車企賦能的巨大機遇，在汽車云建設(shè)上打造了一整套數(shù)據(jù)工具鏈，貫穿數(shù)據(jù)采集、標(biāo)注、管理、仿真、測試等全流程，支持了業(yè)內(nèi)大批企業(yè)自動駕駛服務(wù)的落地發(fā)展。

在最新一屆百度云智大會上，百度汽車云迭代到 3.0 版本，圍繞著端到端自動駕駛的特性對工具鏈做了針對性優(yōu)化升級，助力自動駕駛玩家們打造高效運轉(zhuǎn)的數(shù)據(jù)閉環(huán)，攻克端到端自動駕駛的落地難點。

01、用生成式AI 解開「數(shù)據(jù)劫」

端到端技術(shù)范式，是行業(yè)公認通向高階自動駕駛的最優(yōu)解。

這種與 AI 深度綁定的技術(shù)路徑，相當(dāng)于把摩天大樓繼續(xù)筑高，無疑給充當(dāng)?shù)鼗臄?shù)據(jù)工具鏈?zhǔn)┘恿烁髩毫Α?/p>

一方面，數(shù)據(jù)規(guī)模開始瘋狂擴大，數(shù)據(jù)處理難度上升。

一個大致標(biāo)準(zhǔn)是：

實現(xiàn) L2、L3 級的自動駕駛 Demo 模型，只需要百萬張圖片的數(shù)據(jù)量；

實現(xiàn) L2、L3 級自動駕駛的量產(chǎn)，需要億張圖片，數(shù)據(jù)量大于 100T；

實現(xiàn) L4 級的自動駕駛 Demo 模型，存儲數(shù)據(jù)量從 T 級進化為 P 級；

最后，實現(xiàn) L4 級的自動駕駛量產(chǎn)，數(shù)據(jù)量已經(jīng)大于 50PB。

很明顯，每上升一個難度或?qū)蛹壓?，?shù)據(jù)處理變得越來越難掌控。

如果把自動駕駛數(shù)據(jù)處理鏈條攤開，可以看到這個流程包括篩選、清洗、標(biāo)注等重點環(huán)節(jié)，這個步驟的關(guān)鍵目的是把真實數(shù)據(jù)變得有用。

端到端自動駕駛對于「數(shù)據(jù)有用」的定義，是系統(tǒng)通過數(shù)據(jù)訓(xùn)練實現(xiàn)強大的泛化能力，能夠像老司機一樣，應(yīng)對各種復(fù)雜多變的駕駛場景，包括 Corner case（極端情況），如行人突然橫穿馬路、多路口環(huán)島路線、極限直角型轉(zhuǎn)彎等。

用一個比喻來講，就是訓(xùn)練出一個聰明大腦，它不僅會做大量的常規(guī)題目，面對沒有做過的難題時，也能冷靜思考，合理分析，通過舉一反三的方式寫出正確解法。所以訓(xùn)練策略上需要注重廣度和深度，用來訓(xùn)練的數(shù)據(jù)要足夠豐富、多樣、具備挑戰(zhàn)性。

這就要求數(shù)據(jù)處理過程中，能從海量數(shù)據(jù)庫中快速挖掘、標(biāo)注這些高質(zhì)量的題型，構(gòu)成一個優(yōu)質(zhì)的訓(xùn)練集。

另一方面，仿真訓(xùn)練的邏輯發(fā)生變化，成為新的難題。

仿真訓(xùn)練相當(dāng)于自動駕駛研發(fā)最后一道防線，驗證評估。它好比一個專業(yè)的評價體系，給模型打分，分數(shù)高的才能進行到下面的車端部署環(huán)節(jié)上，分數(shù)低的則要找到 bug 點，回到訓(xùn)練模塊重新優(yōu)化。

目前，自動駕駛的測評分為兩類，開環(huán)評估與閉環(huán)評估。

前者對于不同任務(wù)可以單拎出來，例如單獨評估感知、預(yù)測、規(guī)劃等環(huán)節(jié)的效果，與真實數(shù)據(jù)或標(biāo)注數(shù)據(jù)相比對；

后者指在仿真引擎構(gòu)建的虛擬世界中建立反饋閉環(huán)，從輸入到輸出端接受反饋信號，與現(xiàn)在行業(yè)反復(fù)提及的「世界模型」一個概念。

端到端自動駕駛由于感知、規(guī)劃這些環(huán)節(jié)都連成一體，意味著它只能走閉環(huán)評估的路線，這就要求，底層的數(shù)據(jù)工具鏈也能支持這種一體化的訓(xùn)練方式。

另外一層難度，體現(xiàn)在仿真訓(xùn)練更需要龐大的數(shù)據(jù)支撐，因為它的本質(zhì)是要建立一個虛擬世界，模擬車在真實世界中遭遇的一切，比如遇到水坑怎么過，前面迎面飄來塑料袋該做出什么反應(yīng)，這需要包含許多長尾場景，并且場景要全面、真實，因為它是模型最后的評價體系，如果評價體系都不專業(yè)，那整個模型訓(xùn)練都是一場無用功。

所以，針對這些層面上的升級要求，百度汽車云對數(shù)據(jù)工具鏈產(chǎn)品做了不同程度的升級完善，主要體現(xiàn)在兩點。

一是增加數(shù)據(jù)智搜功能，包括以文搜圖，以圖搜圖。

這可以幫助數(shù)據(jù)管理平臺快速完成數(shù)據(jù)篩選，精準(zhǔn)找到高質(zhì)量、有價值的數(shù)據(jù)，比如需要一個公路上路面積水的場景，可以直接用一張圖、一句話描述，就能快速把相關(guān)數(shù)據(jù)鎖定、檢索出來，喂給 AI 模型做訓(xùn)練。

二是對采集數(shù)據(jù)進行生成式動作，用真實場景做仿真。

這可以實現(xiàn)對真實數(shù)據(jù)的再利用，正常情況下，一組高質(zhì)量的數(shù)據(jù)只能作為一次場景使用，但通過生成式 AI，把場景中某個障礙物抹除，再注入新的車輛，就能生成其他同樣真實的場景。

顯然，這是一種降本增效的有利解法，尤其對于場景匱乏，路測數(shù)據(jù)不足的企業(yè)而言，生成式 AI 在有限成本基礎(chǔ)上，讓采集數(shù)據(jù)在更多的泛化參數(shù)下，得到有效利用。

英偉達全球副總裁、汽車事業(yè)部負責(zé)人吳新宙認為，隨著端到端大模型上車，AI 將以無限度的規(guī)則重新定義汽車。

某種程度上，生成式 AI 與自動駕駛技術(shù)相結(jié)合，重塑智能化體驗，指向了高階自動駕駛的落地實現(xiàn)。

所以，要在汽車智能化下半場提高勝率，則是要學(xué)會四個字，借力打力，抓住 AI 這一變革力量，這是百度智能云正在做的事。

另外需要強調(diào)的是，百度本身作為自動駕駛的頭號玩家，十年的研究歷程下來，擁有真實、海量、豐富的數(shù)據(jù)資源，比如在百度地圖支持下，擁有上百個國內(nèi)主要城市全域數(shù)據(jù)，測試里程覆蓋千萬公里。這類豐富的數(shù)據(jù)資產(chǎn)對于建立仿真訓(xùn)練平臺有極大的優(yōu)勢。

02全鏈路訓(xùn)練優(yōu)化，把算力吃透

某智駕供應(yīng)商曾表示，數(shù)據(jù)會占據(jù)端到端自動駕駛開發(fā)中 80% 以上的研發(fā)成本。

這其中也包含了算力，龐大的數(shù)據(jù)資產(chǎn)需要強大的算力資源支撐。

尤其是仿真平臺，大量仿真任務(wù)并發(fā)運行時，CPU、GPU 任務(wù)混合在一起，這對算力資源造車不小壓力。

算力成為了自動駕駛玩家們錨定的軍備競賽，這指向了兩種統(tǒng)一動作。

一是興建智算中心。

以特斯拉為例，其消耗數(shù)十億美金興建超算中心，預(yù)計今年底算力最高將達到 100E FLOPS。

國內(nèi)智駕玩家顯然不具備這番資金實力，但在智算中心的算力投入上，一直不遺余力的提高上限。

二是打造世界模型。

端到端自動駕駛對于「驗證」的高要求，使得世界模型/仿真平臺成為智駕企業(yè)的加碼重點。

尤其是生成式 AI 出現(xiàn)后，這種模擬現(xiàn)實的強大工具被深度應(yīng)用在世界模型/仿真平臺的搭建中。

與之伴隨的，是對算力的高需求與高消耗。

據(jù)悉，端到端自動駕駛的起步算力，大概在 1000P 左右。越往上走，算力要求越高，成本負荷越重。

與此同時，還伴隨著一個難題，即算力效率低，如果算力冗余，沒有得到充分利用，那在算力上花費的資金成本則又被砌高了。

所以關(guān)鍵是把有限算力發(fā)揮出最大價值，降低成本和時間，提高迭代速度。

百度智能云的算力服務(wù)優(yōu)勢由此凸顯出來，推出了百舸· AI 異構(gòu)計算平臺 4.0，提供了一套低成本、高效能的優(yōu)化方案。

這里值得一提的是，百舸平臺為了追求訓(xùn)練的極致性能，除了追求單卡本身的訓(xùn)練性能，也重視多卡之間的并行效率。

這種多芯訓(xùn)練，使得平臺能夠支持不同類型的芯片算力運轉(zhuǎn)，包括 A100、A800、國產(chǎn)芯片等，還能夠支持萬卡規(guī)模的大型集群，進而幫助模型提升計算效率。

另外，百舸平臺這種端到端加速能力，對于不同的算法框架也做到了泛化性適配。

一個熱知識是，同一個算法模型在不同的訓(xùn)練框架上獲得的優(yōu)化能力不同，如果算法框架和模型的耦合能力差的話，還會造車算力資源使用差的負收益。

所以百舸平臺基于自動調(diào)優(yōu)策略，通過并行優(yōu)化、顯存優(yōu)化，各種算子、存儲、網(wǎng)絡(luò)的各方面優(yōu)化行為，最大程度提高了訓(xùn)練效能。

可以通過一組數(shù)據(jù)論證：

在標(biāo)注場景下，百舸平臺的 GPU 共享方案將自動化標(biāo)注的成本降低了 1 倍以上；

在模型訓(xùn)練場景下，百舸平臺幫助模型訓(xùn)練吞吐平均提升 138%，最高 400%，最多縮短 80% 的模型訓(xùn)練時間；

在仿真場景下，百舸平臺可以支持仿真平臺實現(xiàn)日行百萬公里的仿真里程。

一個真實案例是，某頭部車企通過百度智能云助力，模型訓(xùn)練性能提升了 170%，GPU 的資源效率提升了 2.5 倍。

顯然，百舸平臺作為強大的 AI 基礎(chǔ)設(shè)施，讓算力資源在多樣化場景下得到充分發(fā)揮，幫助智駕企業(yè)們抓住研發(fā)效率這個核心競爭力。

03云智一體，加速智能化終局

智能化的下半場，比拼的核心在于基礎(chǔ)設(shè)施——汽車云的能力，這決定水面之上性能的上限。

在這種云智一體的生態(tài)中，同樣能看到兩種趨勢正在生長。

一是車路云結(jié)合，把路測的數(shù)據(jù)引入進來。

以往在路上開車，遇到交通事故、施工路段往往需要承受長達幾小時的堵塞折磨，這給出行帶來極大的不便利性。

而百度智能云和路測交通集團合作，把數(shù)據(jù)聯(lián)通后。這些動態(tài)的路況，以及天氣信息，都能早早通過 AI 提醒獲得，用戶可以提前根據(jù)信息規(guī)劃線路，保證出行的通暢。

比如，有車企就通過公交車的潮汐車道數(shù)據(jù)做路徑規(guī)劃，用戶可以巧妙避開堵塞路段，提升駕乘體驗感。

值得一提的是，這種路況提醒，可以建立在不開啟導(dǎo)航地圖的基礎(chǔ)上，直接通過智能座艙實現(xiàn)。

這也指向了第二種趨勢，即智能座艙的體驗感越來越好。

在 AI 大模型上車后，智能座艙從多模態(tài)的交互性演變成 AI 的主動性越來越強。

也就是說，從用戶主動發(fā)起問答式、指令式對話，AI 準(zhǔn)確理解并回答、執(zhí)行，變成 AI 主動揣測用戶需求，在恰當(dāng)?shù)臅r機發(fā)起相關(guān)對話，推送對應(yīng)功能等。

另外，智能座艙的體驗感也在逐步提升，比如極越 01、07 等車型上車了百度的座艙大模型后，能做到車外語音控制，通勤自動導(dǎo)航等功能，并且還能通過「哨兵模式」，在車未啟動時，幫助用戶自動記錄到車輛剮蹭等意外情況，并自動啟動行車記錄儀保留證據(jù)。

一個確定路徑是，伴隨著自動駕駛、智能座艙向更高緯度的性能進階，云服務(wù)商都在抓住這種為車企賦能的機遇，不斷推出具備競爭力的服務(wù)方案，在數(shù)據(jù)工具鏈的產(chǎn)力上內(nèi)卷。

小馬智行 CTO 樓天城在最新采訪中表示，數(shù)據(jù)鏈的成熟度，決定了最后模型好壞的關(guān)鍵。

而有能力把數(shù)據(jù)鏈做到支撐 L4 的一定是百度。事實上，百度本身就在 AI 領(lǐng)域長期積累，打造的 Apollo 平臺具備支撐 L2 至 L4 的量產(chǎn)落地實力。

而百度作為頭部自動駕駛科技企業(yè)，選擇以一種開放的心態(tài)來做云服務(wù)，把核心工具鏈開放給行業(yè)使用。

根據(jù)全球領(lǐng)先的 IT 市場研究和咨詢公司 IDC 發(fā)布《中國人工智能公有云服務(wù)市場份額，2023》報告顯示，2023 年中國 AI 公有云服務(wù)市場整體規(guī)模達 126.1 億元人民幣，百度智能云市場份額以 26.4% 的成績排名第一。

值得一提的是，自 IDC 發(fā)布中國 AI 公有云市場報告以來，百度智能云已經(jīng)連續(xù) 5 年蟬聯(lián)中國市場第一。

在汽車行業(yè)集體擁抱智能化的今天，沒有一家車企能做到全棧自研，絕大多數(shù)都選擇與云服務(wù)商來個雙向奔赴，在強大的數(shù)字基建上構(gòu)建智能化壁壘，也正是在這種合作共贏的生態(tài)下，智能駕駛的想象力能夠進一步延伸，并一步步轉(zhuǎn)變?yōu)楝F(xiàn)實。

端到端自動駕駛落地，需要「對口」的云加速器

01、用生成式AI 解開「數(shù)據(jù)劫」

02全鏈路訓(xùn)練優(yōu)化，把算力吃透

03云智一體，加速智能化終局

相關(guān)推薦

端到端自動駕駛落地，需要「對口」的云加速器

01、用生成式AI 解開「數(shù)據(jù)劫」

02全鏈路訓(xùn)練優(yōu)化，把算力吃透

03云智一體，加速智能化終局

相關(guān)推薦

端到端自動駕駛落地，需要「對口」的云加速器

01、用生成式AI 解開「數(shù)據(jù)劫」

02全鏈路訓(xùn)練優(yōu)化，把算力吃透

03云智一體，加速智能化終局