佐思汽研發(fā)布《座艙交互專利研究-汽車新技術月度監(jiān)測與分析報告 2025年4月期》。
本期新技術月報對主機廠和供應商在座艙交互方面的專利進行分析總結,主要包括在語音、人臉、指紋、手勢、情緒、虹膜、動作、靜脈、肌電、掌紋等各種模態(tài)中的專利布局和應用特點,以及多模態(tài)融合在座艙交互中的專利研究。
截至2025年3月,中國座艙交互專利超2萬件
截至2025年3月31日,中國公開的座艙交互專利總計23821件,每年公開專利數(shù)量在2000件左右。其中2025年1-3月,中國座艙交互專利共計435件,與上年同期(433件)基本持平。
2015-2025年中國座艙交互專利公開數(shù)量(單位:件)
來源:佐思汽研《座艙交互專利研究-汽車新技術月度監(jiān)測與分析報告 2025年4月期》
從專利涉及的技術類型來看:
語音和人臉識別是目前座艙交互的主要技術路線,在本專題所跟蹤統(tǒng)計的座艙交互專利中,語音專利數(shù)量最多,占到總量的56.6%;其次是人臉識別,占到總量的20.9%。
基于視覺技術(手勢、動作等)和生物技術(指紋、掌紋、靜脈、虹膜、肌電等)的交互方式正在崛起,與語音識別、人臉識別形成互補。
多模態(tài)交互是未來的發(fā)展趨勢,已占到專利總量的10.3%。
中國座艙交互專利分布(分技術類型)
來源:佐思汽研《座艙交互專利研究-汽車新技術月度監(jiān)測與分析報告 2025年4月期》
多模態(tài)交互專利數(shù)量猛增
智能座艙交互正在從單一模態(tài)向多模態(tài)轉變,通過車內傳感器及AI算法,融合語音、視覺、生物識別、嗅覺等多種類型數(shù)據,從而提供更準確、更高可信度的感知,提供更加自然的人機交互。截至2025年3月31日,中國公開的多模態(tài)交互專利總計2458件,其中2024年專利數(shù)量猛增至355件。2025年1-3月,中國座艙多模態(tài)交互專利共計95件,高于上年同期(64件)。
2015-2025年中國多模態(tài)交互專利公開數(shù)量(單位:件)
來源:佐思汽研《座艙交互專利研究-汽車新技術月度監(jiān)測與分析報告 2025年4月期》
從各技術類型的專利數(shù)量占比看:
目前,中國智能座艙多模態(tài)交互研究主要集中在雙模態(tài)融合,主要有語音+人臉、語音+手勢、人臉+指紋、語音+指紋等。
三模態(tài)和四模態(tài)的融合仍比較少,三模態(tài)融合主要有語音+人臉+指紋、語音+人臉+情緒、人臉+指紋+虹膜等;四模態(tài)融合主要有語音+人臉+指紋+虹膜、語音+指紋+虹膜+掌紋等。
甚至還有部分五模態(tài)或更多模態(tài)融合,例如語音+人臉+指紋+靜脈+掌紋、語音+人臉+指紋+虹膜+靜脈+掌紋+情緒。
中國多模態(tài)交互專利技術類型分布(專利數(shù)量占比)
來源:佐思汽研《座艙交互專利研究-汽車新技術月度監(jiān)測與分析報告 2025年4月期》
主機廠多模態(tài)交互的典型專利
奇瑞、長安、一汽、北汽、賽力斯等主機廠申請了頗具規(guī)模的多模態(tài)交互專利,正在擴大多模態(tài)感知交互的研究和應用,通過深度融合多種傳感器信息技術,為用戶提供更豐富、更精細的信息服務。
案例一:吉利汽車基于多模態(tài)數(shù)據的導航推薦
專利號:CN118999595A
技術特點:在啟動導航地圖時,對駕駛員的生物特征信息(主要是聲紋和人臉信息)進行識別,與該駕駛員的常去地進行匹配,輸出最終目的地。
吉利汽車《導航推薦方法、裝置、電子設備和計算機可讀存儲介質》系統(tǒng)流程
來源:國家知識產權局
案例二:奇瑞汽車基于多模態(tài)的座艙觀影氛圍營造
專利名稱:基于人工智能的汽車座艙觀影氛圍營造方法及系統(tǒng)
專利號:CN119189866A
技術特點:通過大模型自動分析用戶選擇的觀影內容,利用深度學習算法對內容進行情感分析、氛圍分析,識別其主題、情感基調和關鍵場景的時間幀數(shù)據。利用攝像頭或運動追蹤技術捕捉用戶的行為數(shù)據,包括頭部和身體的位置、姿勢變化、手勢動作、面部表情、語音等信息,實時分析用戶的觀影體驗,并根據分析結果調整氛圍渲染模式。
奇瑞汽車《基于人工智能的汽車座艙觀影氛圍營造方法及系統(tǒng)》流程
來源:國家知識產權局
案例三:長安汽車基于多模態(tài)數(shù)據和車輛場景的語音功能自動控制
專利名稱:一種基于場景的汽車語音控制系統(tǒng)及控制方法
專利號:CN114758654B
技術特點:通過采集用戶的人臉、語音、聲紋等信息,結合車輛的狀態(tài)信息,以針對不同場景對語音控制功能進行權限限制,提升用戶體驗,提高車輛及車內人員安全性。例如在車內人員睡覺或者打電話時,系統(tǒng)自動關閉車內語音控制功能,同時關閉車外語音控制功能;在車輛靜止且車內有人的場景下,如果未征得車內人員同意,車外語音控制功能會關閉,只有聲紋識別成功且征得車內人員同意的情況下才能開啟車外語音控制功能;在車輛靜止且車內無人的場景下,只有車外人員人臉識別成功,且車外人員聲紋識別成功時,場景識別控制器才確定開啟車外語音控制功能。
長安汽車《一種基于場景的汽車語音控制系統(tǒng)及控制方法》系統(tǒng)流程
來源:國家知識產權局