作者|劉佳藝,編輯|白雪
DeepSeek 往 AI 行業(yè)丟擲了一枚重磅炸彈。
低成本、低算力,做出了媲美 Chatgpt 的高性能模型。這項(xiàng)革新的直接影響者是英偉達(dá),市值一度蒸發(fā)超 3000 億美元。
這也使得關(guān)于「算力過(guò)?!沟挠懻撛俣缺涣嗌吓_(tái)面。
實(shí)際上,DeepSeek 的案例揭示了 AI 行業(yè)隱藏在算力神話下,更具含金量的東西,比如算法模型、芯片性能以及性價(jià)比。
它揭示了一個(gè)基本事實(shí),算力只是關(guān)乎模型訓(xùn)練的有力條件,但不是充要條件。
今天留在牌桌上的芯片企業(yè),英偉達(dá)、地平線、黑芝麻、華為、Mobileye 已經(jīng)注意到了這點(diǎn),從它們最新動(dòng)作中可見(jiàn),算力只是握在手中的籌碼之一,且態(tài)度各異。
包括一度用算力標(biāo)榜自身的英偉達(dá),在當(dāng)下也感到了不小危機(jī)感。
市場(chǎng)對(duì)于芯片企業(yè)的要求一直是做到未雨綢繆,現(xiàn)在它們都朝著軟硬一體的大方向強(qiáng)化競(jìng)爭(zhēng)壁壘,這其中,性價(jià)比才是重點(diǎn),擴(kuò)大生態(tài)圈才是核心。
01算力斗獸場(chǎng),上演「紅與黑」
2022 年,英偉達(dá)發(fā)布了一顆算力猛獸——Drive Thor,AI 算力最高達(dá)到 2000TOPS,是上一代 Orin X(256TOPS)的 8 倍。
在業(yè)界還習(xí)慣于用 100TOPS 作為中、高算力的分水嶺時(shí),Thor 無(wú)疑來(lái)到了夸張級(jí)別。
但本應(yīng)在 2024 年中量產(chǎn)的 Thor 陷入難產(chǎn),最新消息是,Thor 的算力被修改為 1000TOPS,今年中將先提供 730TOPS 的低算力版本芯片。
把算力拉滿,Thor 的確值得期待。
極氪、理想、小鵬、比亞迪、沃爾沃、豐田等車(chē)企,以及元戎啟行、卓馭科技等供應(yīng)商,早早就下了量產(chǎn)訂單。
根本原因?yàn)?,行業(yè)新技術(shù)對(duì)于算力的需求值漲到了千 TOPS 級(jí)別。
顯著代表是「VLA」——視覺(jué)語(yǔ)言動(dòng)作模型,被元戎啟行、理想都視為開(kāi)啟端到端 2.0 時(shí)代的鑰匙。但 VLA 需要處理大量視覺(jué)、語(yǔ)言等多模態(tài)數(shù)據(jù),對(duì)于算力的需求更為苛刻。
目前,理想單「端到端+VLM」雙系統(tǒng)模型,就需要消耗兩顆 Orin-X 芯片,即 508TOPS 算力。
有行業(yè)人士認(rèn)為,如果要部署「端到端+VLA」模型,Orin-X 顯然不夠,Thor 可能成為了必選項(xiàng)。
英偉達(dá)的 Thor 撕開(kāi)了市場(chǎng)對(duì)于芯片超高性能的需求裂口,揭開(kāi)整個(gè)算力市場(chǎng)「紅與黑」的兩面性。
紅指激進(jìn)。
在大算力緯度上,Thor 已經(jīng)有了對(duì)手。
黑芝麻 2024 年 12 月底發(fā)布的華山 A2000 系列。
上一代 A1000 系列中的旗艦款,A1000Pro 的 AI 算力還是 106TOPS。
而新發(fā)布的 A2000Pro 盡管未直接標(biāo)明算力大小,但從「4 倍行業(yè)旗艦芯片」的性能注解,可以預(yù)估至少有幾百 TOPS,如果行業(yè)旗艦芯片指 Orin-X,那么 A2000Pro 的算力將來(lái)到 1000TOPS,與 Thor 不相上下。
地平線則在 2024 年 4 月推出征程 6 系列,覆蓋低中高階智駕,其中旗艦款產(chǎn)品征程 6P 的 AI 算力一度被拉到 560TOPS,幾乎是征程 5(128TOPS)的 5 倍,Orin-x 的兩倍。
據(jù)地平線介紹,征程 6P 采用「神經(jīng)網(wǎng)絡(luò)+規(guī)則引擎」的混合架構(gòu),支持端到端大模型,以及時(shí)下流行的 VLM、VLA 等技術(shù)路徑。
值得一提的是,地平線征程 6P 的 560TOPS 算力旁,還有一句注解:在 1/2 稀疏網(wǎng)絡(luò)下的等效算力。
它指的是征程 6P 在稀疏網(wǎng)絡(luò)下 AI 算力可以達(dá)到 560TOPS。
所謂稀疏網(wǎng)絡(luò),是指網(wǎng)絡(luò)中的權(quán)重矩陣中有大量的零權(quán)重,即只有部分神經(jīng)元與前一層的神經(jīng)元相連。
它對(duì)應(yīng)的是稠密網(wǎng)絡(luò),指網(wǎng)絡(luò)中的每個(gè)神經(jīng)元都與前一層的每個(gè)神經(jīng)元相連,沒(méi)有零權(quán)重。
兩者呈現(xiàn)的算力數(shù)值代表意義不同,可以簡(jiǎn)單理解為,稀疏算力指計(jì)算簡(jiǎn)單題的能力,而稠密算力指計(jì)算復(fù)雜題的能力。
目前包括英偉達(dá),大多數(shù)芯片的高 TOPS 背后,其實(shí)指代的只是稀疏算力,相比稠密算力,它在數(shù)值表現(xiàn)上往往會(huì)高出一倍。
在這種情況下,華為選擇強(qiáng)調(diào)稠密算力,由此引出了算力場(chǎng)「黑」的一面,即對(duì)算力保持克制態(tài)度。
華為昇騰 610 發(fā)布于 2020 年,算力 200TOPS,此后很長(zhǎng)一段時(shí)間,華為暫未有發(fā)布新產(chǎn)品的正式動(dòng)作。
原因有兩點(diǎn)。
一是晟騰 610 足夠能打,200TOPS 級(jí)別算力,已經(jīng)是地平線 J5、黑芝麻 A1000Pro 的兩倍,毫無(wú)疑問(wèn)是算力王者。
更何況,200TOPS 是稠密算力,這意味著該芯片在處理智駕這類復(fù)雜計(jì)算任務(wù)時(shí),效率更高,性能表現(xiàn)更好。
二是華為作為 Tier1 的身份,使其芯片可以在軟硬一體的優(yōu)勢(shì)下,與算法協(xié)同發(fā)揮出更強(qiáng)大效能。
由此,伴隨著華為乾崑 ADS 方案,昇騰 610 一直在市場(chǎng)吃香,據(jù)蓋世汽車(chē)研究院數(shù)據(jù)顯示,2024 年前 8 個(gè)月,華為昇騰 610 憑借 10.3% 的市占率在國(guó)內(nèi)智駕域控芯片市場(chǎng)排名第三。
目前,華為對(duì)于昇騰 610 的預(yù)期已經(jīng)提升至 L3 級(jí),比如昊鉑 GT 智駕版就搭載了昇騰 610,目前其同款硬件車(chē)型已經(jīng)拿下了 L3 級(jí)的上路牌照。
如果說(shuō)華為對(duì)于算力的克制是因?yàn)槭翘崆皼_刺,并且準(zhǔn)備充分,Mobileye 就是一直小步慢跑,算力一點(diǎn)點(diǎn)往上加。
2022 年,Mobileye 發(fā)布的 EyeQ 6 系列芯片,AI 算力雖然是 EyeQ 5 的兩倍,也僅為 34TOPS。
但 Mobileye 一直自信認(rèn)為,EyeQ 6 High 的支持上限并不低,比如基于復(fù)合人工智能系統(tǒng),搭載了 2 顆 EyeQ 6 High 的 SuperVision 方案能夠達(dá)到可脫手的智駕能力。
而下一站的 EyeQ 7 系列,算力也僅是在 EyeQ 6 High 上繼續(xù)翻倍,AI 算力僅為 67TOPS,不過(guò)制程突破到了 5nm,預(yù)計(jì) 2025 年中提供樣品,在 2027 年開(kāi)始量產(chǎn)。
與華為一樣,Mobileye 的芯片與方案往往打包出售,并且,它認(rèn)為大算力并不能決定一切。
Mobileye 認(rèn)為 FPS 才是算力更貼切的指標(biāo),相比 TOPS 只計(jì)算每秒運(yùn)算次數(shù),F(xiàn)PS 計(jì)算每秒幀數(shù)的方式,更能直觀體現(xiàn)該芯片在處理智駕圖像、視頻數(shù)據(jù)的能力。
比如 EyeQ6 High 每秒可以處理超過(guò) 1000 幀像素標(biāo)記神經(jīng)網(wǎng)絡(luò),相比 EyeQ5 的每秒 91 幀,效率提高了超十倍。
這意味著,EyeQ6 High 能夠以高幀率完成圖像數(shù)據(jù)處理,在感知、決策端擁有更好表現(xiàn)。
從理性主義出發(fā),Mobileye 已經(jīng)歸納出一條低成本、高性能抵達(dá)全無(wú)人駕駛的路徑。盡管算力還未超過(guò) 100TOPS,但依托于對(duì)算法與規(guī)則的融合處理,它堅(jiān)信這是一條可行的方法論。
02軟硬一體,性價(jià)比才是好生意
正如 Mobileye 所言,算力僅是芯片的核心評(píng)判維度之一。
今天關(guān)于芯片的終極討論在于性能,芯片企業(yè)都瞄準(zhǔn)了不同的價(jià)格帶,竭力思考如何把性能拉到最滿。
通過(guò)性價(jià)比超車(chē),永遠(yuǎn)是一個(gè)更切實(shí)的機(jī)會(huì)。
從目前各家芯片的特點(diǎn)中,其實(shí)能看到一些共性:
- 車(chē)規(guī)級(jí)芯片,獲得 ASIL-D 安全認(rèn)證;集合 CPU、GPU、MCU 等多類型計(jì)算單元,完成異構(gòu)計(jì)算;7nm 制程成為最低門(mén)檻。
而當(dāng)共識(shí)成為同質(zhì)化表現(xiàn)后,芯片企業(yè)還需要面向未來(lái),注入其它維度的「加成」打造差異化性能。
這里存在兩個(gè)發(fā)力方向。
一是芯片都在圍繞高效,強(qiáng)調(diào)「原生適配 Transformer 架構(gòu)」。
這點(diǎn)像是在異構(gòu)計(jì)算的基礎(chǔ)上把力打透,Transformer 架構(gòu)作為目前智駕行業(yè)公認(rèn)的算法框架,芯片支持該模型,強(qiáng)調(diào)的是與主流算法適配,開(kāi)發(fā)出高階端到端智駕方案的能力。
此前 Orin-X 就因不支持 Transformer 架構(gòu),推理時(shí)延長(zhǎng),被理想詬病過(guò)。
所以英偉達(dá)在 Thor 的產(chǎn)品簡(jiǎn)介中,強(qiáng)調(diào)了其 CPU 采用了全新 Blackwell 架構(gòu),專為 Transformer 大模型和生成式 AI 功能設(shè)計(jì)的能力。
而地平線征程 6P 與黑芝麻 A2000Pro 也是在這點(diǎn)上「炫技」。
征程 6P 搭載了地平線自研的第三代 BPU 納什架構(gòu),這種架構(gòu)的特點(diǎn)在于靈活計(jì)算,即能夠?qū)?Transformer 算法中的各種細(xì)小操作進(jìn)行高效處理,如目標(biāo)檢測(cè)、軌跡預(yù)測(cè)、路徑規(guī)劃等。
它能確保在處理復(fù)雜運(yùn)算任務(wù)時(shí),提供足夠的精度與計(jì)算速度,同時(shí)三層存儲(chǔ)架構(gòu)的設(shè)計(jì)也能優(yōu)化帶寬。
黑芝麻 A2000Pro 同樣應(yīng)用了其獨(dú)創(chuàng)的 NPU 架構(gòu)——九韶,特點(diǎn)在于大核架構(gòu),解決了算力利用率低、延時(shí)高的問(wèn)題,確保在面對(duì)復(fù)雜運(yùn)算時(shí)能高效運(yùn)行并輸出準(zhǔn)確推理結(jié)果。
此外,芯片還集成了 Transformer 的硬加速模塊,可以提升該模型的算法運(yùn)行效率,并同樣用三層內(nèi)存架構(gòu)降低了對(duì)外部存儲(chǔ)的依賴。
思路其實(shí)是一致的,相當(dāng)于此前是培訓(xùn)做題方法,現(xiàn)在是培訓(xùn)專有題型,把智駕難題做得更得心應(yīng)手了。
二是優(yōu)化服務(wù)能力,提供完整的開(kāi)發(fā)工具鏈。
芯片公司如今卷起了軟硬協(xié)同下的服務(wù)能力,這同樣是「性價(jià)比」的重要表現(xiàn)。
一方面是開(kāi)放,為開(kāi)發(fā)者提供更多的自主性與可操作性。
Mobileye 從 EyeQ5 開(kāi)始也意識(shí)到這點(diǎn),芯片開(kāi)始可編程操作。從 EyeQ6 系列開(kāi)始,它開(kāi)始提供軟件開(kāi)發(fā)工具包 EyeQ Kit,包含算法庫(kù)、驅(qū)動(dòng)程序等,能使得開(kāi)發(fā)者基于需求完成個(gè)性化設(shè)計(jì)。
今年 CES 上,MobileyeCEO Amnon Shashua 教授還直言,「我們?cè)试S客戶直接在芯片上托管第三方應(yīng)用程序?!?/p>
當(dāng)然,開(kāi)放更是國(guó)內(nèi)芯企的強(qiáng)項(xiàng)。
黑芝麻創(chuàng)始人單記章曾提到,黑芝麻芯片之上的每一層軟件都可以進(jìn)行定制與替換,進(jìn)而拓寬使用場(chǎng)景,實(shí)現(xiàn)大規(guī)模出貨。
這也來(lái)到開(kāi)放的另一方面,提供更豐富、好用的開(kāi)發(fā)工具。
比如,地平線、黑芝麻為了讓開(kāi)發(fā)者快速上手最新芯片,孵化了一整套開(kāi)發(fā)工具,覆蓋從標(biāo)注、訓(xùn)練到仿真等模型開(kāi)發(fā)全流程。
- 前者打造了 BPU 工具鏈、天工開(kāi)物平臺(tái)等。后者則是構(gòu)建了新一代 BaRT 工具鏈、雙芯?;ヂ?lián)技術(shù) BLink 等。
這些工具適配于 TensorFlow、PyTorch 等主流訓(xùn)練框架,可以幫助開(kāi)發(fā)者充分利用芯片強(qiáng)大潛力,擴(kuò)展算力邊界,提高模型開(kāi)發(fā)效率。
實(shí)際上,這些行為也在印證并加速軟硬協(xié)同的大趨勢(shì)。
黃仁勛一直把英偉達(dá)定位成軟件與系統(tǒng)整合的企業(yè),認(rèn)為旗下的軟件與硬件具備同等價(jià)值。
英偉達(dá)打造 Thor 能成為性能王者,離不開(kāi)其在軟件平臺(tái)上的高速創(chuàng)新,這其中包括 CUDA 生態(tài)系統(tǒng)、Drive 軟件平臺(tái)、推理工具 TensorRT、數(shù)字孿生平臺(tái) NVIDIA Omniverse 等穩(wěn)定的開(kāi)發(fā)工具。
今天的芯片公司,不僅在比拼在底部構(gòu)筑地基的能力,也在較量往高處建設(shè)大廈的水平。
03生態(tài)攻防戰(zhàn),卡位下一個(gè)爆款
芯片企業(yè)已經(jīng)告別了單純賣(mài)硬件的生意模式。
它們構(gòu)建完整開(kāi)發(fā)工具鏈背后,是一直反復(fù)強(qiáng)調(diào)的關(guān)鍵詞:生態(tài)。
比如英偉達(dá),屹立不倒的重要原因之一,源于其早早就構(gòu)建了一整套成熟的生態(tài)系統(tǒng),讓客戶形成一定的技術(shù)依賴與轉(zhuǎn)換成本,產(chǎn)生粘性。
而國(guó)內(nèi)的后起之秀地平線、黑芝麻也通過(guò)性價(jià)比策略接連完成了從 0 到 1 的生態(tài)建設(shè)過(guò)程,并敲響上市鐘聲。
而華為、Mobileye 在生態(tài)建設(shè)上具有先天優(yōu)勢(shì)。
兩者作為智駕供應(yīng)商,能夠通過(guò)出售軟硬一體的方案增加芯片出貨量。
- 華為的芯片,背靠鴻蒙智行、Hi 模式,享受著「朋友圈」不斷擴(kuò)大的銷量紅利;Mobileye 芯片則依靠早期品牌聲量積累,能夠吃到全球化市場(chǎng)的蛋糕。
現(xiàn)在,五家芯片企業(yè)在不同節(jié)奏下走到了分岔路口。
在如何進(jìn)一步上量,擴(kuò)大生態(tài)圈的命題面前,選擇了不同方向。
一是強(qiáng)調(diào)可擴(kuò)展性,擴(kuò)大生態(tài)橫截面。
英偉達(dá)打了個(gè)樣,Thor 的應(yīng)用場(chǎng)景已經(jīng)不止 L2、L3 階段,它能夠覆蓋智駕全場(chǎng)景,包括 L4 的 Robotaxi,已經(jīng) L5 全無(wú)人駕駛階段。
而黑芝麻也立刻跟上,其對(duì)于 A2000Pro 的定位是全場(chǎng)景通識(shí)智駕,簡(jiǎn)單理解就是強(qiáng)調(diào)芯片對(duì)于駕駛場(chǎng)景的全面理解能力,包括城市道路、高速公路、晝夜變化及各類天氣條件下的不同場(chǎng)景。
這意味著,A2000Pro 同樣可以覆蓋從 L2-L5 的全場(chǎng)景智駕。
值得一提的是,黑芝麻智能 CMO 楊宇欣曾表示,A2000 將不止于智駕,還會(huì)面向具身智能等大模型應(yīng)用場(chǎng)景去拓展。
他表示,機(jī)器人的產(chǎn)業(yè)鏈、生態(tài)的布局和結(jié)構(gòu)跟汽車(chē)的重疊度非常高。
這指向了智駕芯片企業(yè)的另一條增長(zhǎng)曲線。
二是深度強(qiáng)化軟硬一體,從 Tier2 向前大邁步。
隨著智駕開(kāi)發(fā)周期越來(lái)越緊張,芯企需要靈活配合車(chē)企/方案商,滿足不同的市場(chǎng)需求。
- 若車(chē)企/供應(yīng)商有自研能力,則提供靈活性開(kāi)發(fā)工具進(jìn)行適配;若沒(méi)有模型開(kāi)發(fā)經(jīng)驗(yàn),則提供全棧軟件方案。
黑芝麻在 A2000 系列發(fā)布前不久推出了端到端算法參考方案,基于端到端架構(gòu),在決策單元引入了 VLM 視覺(jué)語(yǔ)言模型與 PRR 行車(chē)規(guī)則等,提升智駕系統(tǒng)決策規(guī)劃能力。
這相當(dāng)于一個(gè)智駕 Demo,幫助車(chē)企/供應(yīng)商快速上手軟件開(kāi)發(fā)。
值得一提的是,地平線在戰(zhàn)略上選擇了 All in。
從縱向、橫向把市場(chǎng)全面吃透。
憑借 700 萬(wàn)顆芯片出貨量成績(jī),地平線已經(jīng)牢牢穩(wěn)住了國(guó)內(nèi)低階、高階市場(chǎng)位置,分別僅次于 Mobileye 與英偉達(dá)。
而從征程 6 系列開(kāi)始,地平線依然可以用「芯片全家桶」的形式,吃準(zhǔn)低中高階智駕的新需求。
此外,地平線也在延展商業(yè)邊界,用征程 6P 打出了 SuperDrive 這張王牌,該方案目前已經(jīng)在北京晚高峰、上海老城區(qū)等復(fù)雜場(chǎng)景中進(jìn)行測(cè)試,做到了全程無(wú)接管,今年 8 月實(shí)現(xiàn)量產(chǎn)落地。
從芯片到完整方案,地平線重新定義了自我身份,將商業(yè)生態(tài)的天花板繼續(xù)抬高。
由此,一輪新的較量在芯片行業(yè)開(kāi)始上演,在這個(gè)同樣研發(fā)投入巨大,靠高出貨量解渴的供應(yīng)鏈上,各家都加緊擴(kuò)建森林,打造良性循環(huán)的生態(tài)模式。
更殘酷的一點(diǎn)是,身處 AI 急劇變化的時(shí)代,一條游戲規(guī)則改寫(xiě)就足以顛覆整個(gè)行業(yè)。
DeepSeek 已經(jīng)敲響了警鐘,今天的芯片企業(yè)必須時(shí)刻緊繃著,它們不僅要煉出鋒利的武器攻擂,還要磨出堅(jiān)固的盾牌守塔。
在攻防之間,芯片企業(yè)們,亟待下一個(gè)爆款出現(xiàn)。