AI 在邊緣領(lǐng)域的優(yōu)勢現(xiàn)在是顯而易見的。在這些領(lǐng)域中,實時響應(yīng)起到?jīng)Q定性的作用。比如說,在安全敏感型應(yīng)用中,既要將原始數(shù)據(jù)傳輸到云的通信成本降至最低,又要降低功耗、保護隱私并提高對多個邊緣節(jié)點的可擴展性。對于以上這些要求,我們建議通過邊緣設(shè)備內(nèi)的人工智能而不是遠程云服務(wù)來滿足。然而,一個 AI 引擎無法服務(wù)我們現(xiàn)在所知的邊緣應(yīng)用范圍。家用電器可能只需要識別一組簡單的語音命令或食品容器上的圖片。更復(fù)雜的監(jiān)控系統(tǒng)或工業(yè)機器人系統(tǒng)則可能需要融合圖像傳感器、麥克風(fēng)、運動傳感器等的多方輸入。就高端領(lǐng)域而言,自動或半自動駕駛識別系統(tǒng)需要用到非常復(fù)雜的深度神經(jīng)網(wǎng)絡(luò) (DNN)。CEVA SensPro2 和 NeuPro-M 平臺恰能滿足這些需求。
邊緣 AI 市場
自現(xiàn)在起至本世紀(jì)末,邊緣 AI 處理器芯片市場的年復(fù)合增長率預(yù)計將達到 20% 左右。這一增長是由智能設(shè)備采用率/發(fā)展程度不斷提高推動的,具體涉及:攝像頭、可穿戴設(shè)備和家庭自動化領(lǐng)域消費者;安全和自動化程度日益提高的汽車行業(yè);行業(yè)監(jiān)控、機器人、機器/工廠控制和預(yù)測性維護。
最有可能在這些領(lǐng)域取得成功的產(chǎn)品自然必須功能十足、性能強大,如此才能滿足應(yīng)用這些產(chǎn)品的認(rèn)可需求。此類產(chǎn)品必須根據(jù)消費者定價和/或在大規(guī)模部署時具有成本效益,同時還應(yīng)該最大限度地減少現(xiàn)有無線基礎(chǔ)設(shè)施的增量負(fù)載。此類產(chǎn)品的軟件還必須可以升級,如此才能適應(yīng)快速發(fā)展的 AI 技術(shù)領(lǐng)域的新興解決方案。
傳感器融合和 SensPro2
除了最簡單的智能邊緣設(shè)備之外,其他所有設(shè)備現(xiàn)在都使用多個傳感器。兩個或更多傳感器的融合信息通??勺屩悄芟到y(tǒng)提供準(zhǔn)確性度更高的信息或補充信息。例如,在自動平行泊車或自動代客泊車系統(tǒng)中,可結(jié)合使用探測可用空間的視覺傳感技術(shù)/雷達與超聲波測距技術(shù),另外也可以結(jié)合使用 IMU 輸入,進一步細化定位估計結(jié)果。SLAM 算法可以對這些功能形成補充,在停車場內(nèi)導(dǎo)航以便自動代客泊車。
CEVA SensPro2 傳感器中樞 DSP 是傳感器中樞/融合應(yīng)用的完美答案。SensPro2 是第二代 CEVA 傳感器中樞 DSP,允許圖像傳感器、麥克風(fēng)、雷達、飛行時間、IMU 等的多個傳感器輸入?;谏窠?jīng)網(wǎng)絡(luò)的軟件可在這種 DSP 架構(gòu)上快速運行。因為這種架構(gòu)提供整套豐富的硬件支持功能,包括:具有靈活 MAC 操作范圍的矢量單元、整數(shù)和浮點運算支持、針對應(yīng)用的 ISA 擴展和全面的非線性指令集。SensPro2 可利用這些功能提供 2 倍的 AI 速度、6 倍的 SLAM 速度、8 倍的雷達速度、10 倍的音頻速度(相較于上一代 SensPro 而言)。
在各種消費者應(yīng)用中,邊緣人工智能已通過 SensPro2 部署到 SoC,最近發(fā)布的新 Novatek 監(jiān)控 SoC 版本就是一個示例。
DNN 智能和 NeuPro-M
高端邊緣智能需要深度神經(jīng)網(wǎng)絡(luò) (DNN) 支持、高水平的并行性能和帶寬優(yōu)化,以及擁有最新 AI 算法的異構(gòu)加速器。對于第一種需求而言,自動/半自動駕駛時的可用空間檢測是一個不錯的應(yīng)用示例。此檢測目的在于沿著公路/高速公路的安全駕駛區(qū)域行駛,避開障礙物,避免駛上對向車道、未鋪砌的路肩和隔離帶。在這種情況下必須迅速響應(yīng),因此會將前方道路圖像分解為 4 個子幀,對其進行并行處理。之后再在每個子圖像上運行可用空間檢測,并重新組合以提供完整的結(jié)果。對于邊緣應(yīng)用中的此類人工智能而言,NeuPro-M 可支持多達 8 個并行運行的引擎。
大家對精度和性能的期望遠不止并行這么簡單。如今的網(wǎng)絡(luò)開發(fā)人員希望利用現(xiàn)在 NeuPro-M 中采用硬件加速的專用功能,如矩陣分解、稀疏、Winograd 及混合精度的神經(jīng)操作,且以上所有功能都可以在每個并行引擎中使用。
NeuPro-M 于 2022 年發(fā)布,榮獲了“亞洲金選獎”之“金選潛力標(biāo)桿獎”及“2022 年邊緣人工智能與視覺聯(lián)盟產(chǎn)品獎”之“年度最佳邊緣 AI 處理器榮譽獎”。目前已部署在設(shè)計中的多個 SoC 中,并預(yù)計會在未來幾年出現(xiàn)在最終產(chǎn)品中。
面向未來的解決方案
在標(biāo)準(zhǔn) CPU 或 GPU 上運行的純軟件 AI 解決方案效率過低,功耗又大,不太實用,但在理論上來說又具有一定的吸引力,因為您可以隨時更改軟件,而無需更改硬件。隨著 AI 技術(shù)和網(wǎng)絡(luò)層的發(fā)展,能否在獲得硬件加速帶來的所有性能和功耗優(yōu)勢的同時,保持靈活升級?SensPro2 和 NeuPro-M 能夠做到這一點。這些 AI 解決方案的矢量 DSP 基礎(chǔ)確保您能夠隨著市場需求和網(wǎng)絡(luò)的發(fā)展,在軟件中對產(chǎn)品實施進行升級。CEVA 的深度神經(jīng)網(wǎng)絡(luò) (CDNN) AI 編譯器簡化了從標(biāo)準(zhǔn)網(wǎng)絡(luò)(TensorFlow、PyTorch 等)實施到在特定 SoC 中實施時映射到處理器 IP 的一應(yīng)事宜。您也可以在此步驟中控制優(yōu)化,以充分利用特殊加速器(如 NeuPro-M 中的加速器),或添加您在設(shè)計中可能需要的、自己的加速器。CEVA CDNN-Invite API 為此類擴展提供支持。
作者:Moshe Sheier, Vice President of Marketing, CEVA