隨著智能駕駛技術(shù)的發(fā)展,越來越多企業(yè)紛紛進入汽車行業(yè),希望能分得獨屬于自己的一杯羹。但在市場的選擇下,已有一部分品牌走入了歷史的塵埃。但也有部分車企,卻穩(wěn)穩(wěn)地站穩(wěn)了腳跟,小米就是其中一個,作為后起之秀,小米在宣布造車前被非常多的人質(zhì)疑,但在“真香”定律下,小米創(chuàng)下了很多友商所不能及的成就。作為科技企業(yè),小米也在智能駕駛領(lǐng)域也不斷研發(fā)及突破,并推送了端到端自動駕駛系統(tǒng)。
小米端到端功能簡介
所謂“端到端”,即是指系統(tǒng)從最初的外部環(huán)境信息捕捉,到最終的車輛控制指令輸出,都由一個整體化的軟件和硬件平臺協(xié)同完成,無需中間繁瑣的模塊拆分,從而大幅降低了信息傳遞的延遲和誤差。這種架構(gòu)不僅在技術(shù)實現(xiàn)上更加高效,也使得系統(tǒng)能夠自適應(yīng)各類復(fù)雜場景,在多變的道路環(huán)境中依然保持高水平的魯棒性與安全性。
今年2月份,小米端到端全場景智能駕駛功能實現(xiàn)了全量推送,這一功能給車主提供了“上車即用,車位到車位”的智能駕駛體驗。與傳統(tǒng)模塊化架構(gòu)相比,小米采用了端到端的深度神經(jīng)網(wǎng)絡(luò)建模方式,從傳感器信號輸入到?jīng)Q策規(guī)劃輸出均由一個統(tǒng)一的模型完成。這種數(shù)據(jù)驅(qū)動和模型泛化能力極強的架構(gòu),使得系統(tǒng)能夠面對復(fù)雜多變的現(xiàn)實路況,呈現(xiàn)出前所未有的駕控體驗。
只需上車、開啟導(dǎo)航、掛入D擋,再按下智駕鍵,車輛即可自動完成路邊啟動、ETC或閘機通行、環(huán)島駕駛等多種駕駛場景的無縫銜接。無論是在城市道路、快速路,還是高速公路、封閉園區(qū)和停車場,小米的端到端全場景智能駕駛都能夠提供穩(wěn)定、流暢的行駛體驗。使用體驗也力求充分體現(xiàn)出“駕駛更擬人”的理念,即可以提供老司機的駕駛經(jīng)驗,能夠提前預(yù)判路況并規(guī)劃出最優(yōu)行駛路徑,確保行車安全和舒適。
得益于系統(tǒng)對前方障礙物和復(fù)雜情況的快速反應(yīng)能力,在遇到緩行車輛、行人以及路邊障礙時,小米的端到端智駕系統(tǒng)能夠迅速做出繞行決策,保持車輛在車道中央安全行駛,從而顯著提升通行效率。這種全新的端到端體驗不僅大大降低了駕駛員的操作負擔(dān),更讓駕駛變得簡單、便捷,成為未來智能出行的重要趨勢。
硬件基礎(chǔ)決定智駕能力下限
硬件平臺作為智能駕駛系統(tǒng)的基石,對系統(tǒng)整體性能起到了至關(guān)重要的作用。智能駕駛系統(tǒng)的高效運行離不開對物理世界的精確感知,而這一切的實現(xiàn)都建立在堅實的硬件基礎(chǔ)之上。小米汽車在設(shè)計之初,就充分考慮到了對外部世界的探索需求。以小米SU7為例,其全系車型均標(biāo)配11顆高清攝像頭,實現(xiàn)了車輛周圍360度無死角的環(huán)境感知;而在小米SU7 Pro、Max及Ultra版本中,更是增加了前向激光雷達,進一步提升了前方感知能力,確保在各種復(fù)雜場景下都能精準(zhǔn)捕捉環(huán)境信息。
這種多傳感器融合方案,為車輛構(gòu)建了一座“海量數(shù)據(jù)底座”,使得系統(tǒng)能夠獲取更豐富、準(zhǔn)確的實時場景信息。不論是高速行駛中的動態(tài)路況,還是停車場等封閉區(qū)域內(nèi)的微小障礙,均能通過高清攝像頭、毫米波雷達與激光雷達協(xié)同感知得到有效監(jiān)測。多傳感器的高精度數(shù)據(jù)采集還為后續(xù)的物理世界建模提供了豐富素材。通過實時采集車輛周邊的圖像、距離和運動信息,系統(tǒng)得以形成對復(fù)雜交通環(huán)境的整體認知,從而為后續(xù)的決策規(guī)劃奠定堅實基礎(chǔ)。
數(shù)據(jù)處理決定智駕能力上限
要讓智能駕駛系統(tǒng)真正“看懂”周圍的世界,僅僅依賴硬件采集數(shù)據(jù)遠遠不夠。更為關(guān)鍵的是如何將這些零散的信息進行整合、解讀并最終轉(zhuǎn)化為可執(zhí)行的駕駛決策,這就對數(shù)據(jù)處理能力提出了很高的要求。小米在這一過程中構(gòu)建了一個完整的物理世界建模體系,這一體系主要分為三個層次,即數(shù)據(jù)觀測層、隱式特征層和顯式符號層。
數(shù)據(jù)觀測層相當(dāng)于系統(tǒng)的“眼睛”。數(shù)據(jù)觀察層與傳統(tǒng)架構(gòu)中的感知結(jié)構(gòu)相似,主要用于查勘路況、收集交通信息。小米HAD(智能駕駛系統(tǒng))同時采集來自11顆高清攝像頭、毫米波雷達與激光雷達的數(shù)據(jù),實時捕捉車輛周圍360°內(nèi)的包含圖像、激光雷達點云以及領(lǐng)航功能所需要的導(dǎo)航信息等。這個層次將分散的傳感器信號整合成可供后續(xù)處理的數(shù)據(jù)流,為系統(tǒng)提供了第一手的真實、多維度場景狀態(tài)信息。
隱式特征層則類似于系統(tǒng)的“思考大腦”。隱式特征層與傳統(tǒng)架構(gòu)中的決策層類似,在這一層,系統(tǒng)對從數(shù)據(jù)觀測層獲得的原始數(shù)據(jù)進行處理和分析,通過深度神經(jīng)網(wǎng)絡(luò)提取出隱藏在大量數(shù)據(jù)背后的特征和規(guī)律。這些隱式特征雖然不易直接被人類理解,但卻包含了對周邊車輛、行人等目標(biāo)的精細判別信息。借助強大的模型推理能力,系統(tǒng)甚至能夠恢復(fù)部分被遮擋區(qū)域的信息,為決策提供更為全面的依據(jù)。
顯式符號層則起到了“翻譯官”的作用,即將復(fù)雜的數(shù)據(jù)信息以人類可以理解的樣式展現(xiàn)出來。它將隱式特征層提取出的模糊信息轉(zhuǎn)化為人類可直接理解的符號或標(biāo)簽,從而實現(xiàn)對模型輸出結(jié)果的直觀判別。通過這種方式,系統(tǒng)不僅能夠?qū)γ恳豢赡艿男旭傑壽E進行安全性、舒適性、高效性等多維度的評估,還可以不斷優(yōu)化模型,使得最終輸出的決策更加精準(zhǔn)可靠。這種端到端的建模方法,不僅簡化了傳統(tǒng)系統(tǒng)中模塊之間的數(shù)據(jù)交互流程,更大幅提高了在動態(tài)變化環(huán)境中的反應(yīng)速度和決策準(zhǔn)確性。
此外,為應(yīng)對物理世界中時間維度的動態(tài)變化,小米還嘗試將三層模型進行聯(lián)合時序建模。在云端,利用未來幀數(shù)據(jù)作為自監(jiān)督信號不斷參與訓(xùn)練;而在車端,實時優(yōu)化的模型則可以迅速適應(yīng)各種突發(fā)情況。這種協(xié)同進化的設(shè)計,使得小米智能駕駛系統(tǒng)在不斷學(xué)習(xí)與進化中,逐步實現(xiàn)了對復(fù)雜場景的精準(zhǔn)判斷與快速反應(yīng)。
其實早在去年3月,小米SU7的智能駕駛系統(tǒng)就已具備高速領(lǐng)航、主動安全、代客泊車以及輔助泊車等先進功能。而在隨后的OTA升級過程中,系統(tǒng)不斷解鎖城區(qū)場景,從最初覆蓋部分城市擴展至中國大陸全域,實現(xiàn)了HAD端到端全場景智能駕駛功能的全量推送。在2023年12月28日的汽車技術(shù)發(fā)布會上,小米首次公開了變焦BEV技術(shù)、超分辨率OCC技術(shù)以及感知決策一體模型等一系列核心關(guān)鍵技術(shù)。這些技術(shù)的公開不僅證明了小米在智能駕駛研發(fā)上的深厚積累,更展示了其未來在自動駕駛領(lǐng)域的無限可能。憑借對物理世界建模能力的不斷提升以及深度工程優(yōu)化,小米智能駕駛系統(tǒng)正完成從“高精地圖+模塊架構(gòu)”,到“無圖+模塊架構(gòu)”,再到“端到端架構(gòu)”的跨越式演進。