座艙交互專利研究：多模態(tài)交互成研發(fā)重點(diǎn)，應(yīng)用場景不斷拓展

04/25 14:24 作者：佐思產(chǎn)研

1531

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

佐思汽研發(fā)布《座艙交互專利研究-汽車新技術(shù)月度監(jiān)測與分析報(bào)告 2025年4月期》。

本期新技術(shù)月報(bào)對主機(jī)廠和供應(yīng)商在座艙交互方面的專利進(jìn)行分析總結(jié)，主要包括在語音、人臉、指紋、手勢、情緒、虹膜、動作、靜脈、肌電、掌紋等各種模態(tài)中的專利布局和應(yīng)用特點(diǎn)，以及多模態(tài)融合在座艙交互中的專利研究。

截至2025年3月，中國座艙交互專利超2萬件

截至2025年3月31日，中國公開的座艙交互專利總計(jì)23821件，每年公開專利數(shù)量在2000件左右。其中2025年1-3月，中國座艙交互專利共計(jì)435件，與上年同期（433件）基本持平。

2015-2025年中國座艙交互專利公開數(shù)量（單位：件）

來源：佐思汽研《座艙交互專利研究-汽車新技術(shù)月度監(jiān)測與分析報(bào)告 2025年4月期》

從專利涉及的技術(shù)類型來看：

語音和人臉識別是目前座艙交互的主要技術(shù)路線，在本專題所跟蹤統(tǒng)計(jì)的座艙交互專利中，語音專利數(shù)量最多，占到總量的56.6%；其次是人臉識別，占到總量的20.9%。

基于視覺技術(shù)（手勢、動作等）和生物技術(shù)（指紋、掌紋、靜脈、虹膜、肌電等）的交互方式正在崛起，與語音識別、人臉識別形成互補(bǔ)。

多模態(tài)交互是未來的發(fā)展趨勢，已占到專利總量的10.3%。

中國座艙交互專利分布（分技術(shù)類型）

來源：佐思汽研《座艙交互專利研究-汽車新技術(shù)月度監(jiān)測與分析報(bào)告 2025年4月期》

多模態(tài)交互專利數(shù)量猛增

智能座艙交互正在從單一模態(tài)向多模態(tài)轉(zhuǎn)變，通過車內(nèi)傳感器及AI算法，融合語音、視覺、生物識別、嗅覺等多種類型數(shù)據(jù)，從而提供更準(zhǔn)確、更高可信度的感知，提供更加自然的人機(jī)交互。截至2025年3月31日，中國公開的多模態(tài)交互專利總計(jì)2458件，其中2024年專利數(shù)量猛增至355件。2025年1-3月，中國座艙多模態(tài)交互專利共計(jì)95件，高于上年同期（64件）。

2015-2025年中國多模態(tài)交互專利公開數(shù)量（單位：件）

來源：佐思汽研《座艙交互專利研究-汽車新技術(shù)月度監(jiān)測與分析報(bào)告 2025年4月期》

從各技術(shù)類型的專利數(shù)量占比看：

目前，中國智能座艙多模態(tài)交互研究主要集中在雙模態(tài)融合，主要有語音+人臉、語音+手勢、人臉+指紋、語音+指紋等。

三模態(tài)和四模態(tài)的融合仍比較少，三模態(tài)融合主要有語音+人臉+指紋、語音+人臉+情緒、人臉+指紋+虹膜等；四模態(tài)融合主要有語音+人臉+指紋+虹膜、語音+指紋+虹膜+掌紋等。

甚至還有部分五模態(tài)或更多模態(tài)融合，例如語音+人臉+指紋+靜脈+掌紋、語音+人臉+指紋+虹膜+靜脈+掌紋+情緒。

中國多模態(tài)交互專利技術(shù)類型分布（專利數(shù)量占比）

來源：佐思汽研《座艙交互專利研究-汽車新技術(shù)月度監(jiān)測與分析報(bào)告 2025年4月期》

主機(jī)廠多模態(tài)交互的典型專利

奇瑞、長安、一汽、北汽、賽力斯等主機(jī)廠申請了頗具規(guī)模的多模態(tài)交互專利，正在擴(kuò)大多模態(tài)感知交互的研究和應(yīng)用，通過深度融合多種傳感器信息技術(shù)，為用戶提供更豐富、更精細(xì)的信息服務(wù)。

案例一：吉利汽車基于多模態(tài)數(shù)據(jù)的導(dǎo)航推薦

專利名稱：導(dǎo)航推薦方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲介質(zhì)

專利號：CN118999595A

技術(shù)特點(diǎn)：在啟動導(dǎo)航地圖時(shí)，對駕駛員的生物特征信息（主要是聲紋和人臉信息）進(jìn)行識別，與該駕駛員的常去地進(jìn)行匹配，輸出最終目的地。

吉利汽車《導(dǎo)航推薦方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲介質(zhì)》系統(tǒng)流程

來源：國家知識產(chǎn)權(quán)局

案例二：奇瑞汽車基于多模態(tài)的座艙觀影氛圍營造

專利名稱：基于人工智能的汽車座艙觀影氛圍營造方法及系統(tǒng)

專利號：CN119189866A

技術(shù)特點(diǎn)：通過大模型自動分析用戶選擇的觀影內(nèi)容，利用深度學(xué)習(xí)算法對內(nèi)容進(jìn)行情感分析、氛圍分析，識別其主題、情感基調(diào)和關(guān)鍵場景的時(shí)間幀數(shù)據(jù)。利用攝像頭或運(yùn)動追蹤技術(shù)捕捉用戶的行為數(shù)據(jù)，包括頭部和身體的位置、姿勢變化、手勢動作、面部表情、語音等信息，實(shí)時(shí)分析用戶的觀影體驗(yàn)，并根據(jù)分析結(jié)果調(diào)整氛圍渲染模式。

奇瑞汽車《基于人工智能的汽車座艙觀影氛圍營造方法及系統(tǒng)》流程

來源：國家知識產(chǎn)權(quán)局

案例三：長安汽車基于多模態(tài)數(shù)據(jù)和車輛場景的語音功能自動控制

專利名稱：一種基于場景的汽車語音控制系統(tǒng)及控制方法

專利號：CN114758654B

技術(shù)特點(diǎn)：通過采集用戶的人臉、語音、聲紋等信息，結(jié)合車輛的狀態(tài)信息，以針對不同場景對語音控制功能進(jìn)行權(quán)限限制，提升用戶體驗(yàn)，提高車輛及車內(nèi)人員安全性。例如在車內(nèi)人員睡覺或者打電話時(shí)，系統(tǒng)自動關(guān)閉車內(nèi)語音控制功能，同時(shí)關(guān)閉車外語音控制功能；在車輛靜止且車內(nèi)有人的場景下，如果未征得車內(nèi)人員同意，車外語音控制功能會關(guān)閉，只有聲紋識別成功且征得車內(nèi)人員同意的情況下才能開啟車外語音控制功能；在車輛靜止且車內(nèi)無人的場景下，只有車外人員人臉識別成功，且車外人員聲紋識別成功時(shí)，場景識別控制器才確定開啟車外語音控制功能。

長安汽車《一種基于場景的汽車語音控制系統(tǒng)及控制方法》系統(tǒng)流程

來源：國家知識產(chǎn)權(quán)局

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點(diǎn)僅代表作者本人，不代表與非網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問題，請聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）

座艙交互專利研究：多模態(tài)交互成研發(fā)重點(diǎn)，應(yīng)用場景不斷拓展

多模態(tài)交互專利數(shù)量猛增

主機(jī)廠多模態(tài)交互的典型專利

相關(guān)推薦

座艙交互專利研究：多模態(tài)交互成研發(fā)重點(diǎn)，應(yīng)用場景不斷拓展