• 正文
    • 一:靈活擴(kuò)展的算力架構(gòu)
    • 二:算法定義芯片的計(jì)算范式
    • 三:算力平權(quán)的開(kāi)源生態(tài)
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

DeepSeek最佳拍檔?深度解析RISC-V顛覆AI芯片的三大殺招

03/03 10:45
1816
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

如果票選25年春晚最精彩的節(jié)目,機(jī)器人扭秧歌絕對(duì)是前三名,這動(dòng)作比村頭吳老二可好太多了。

也恰恰在春節(jié)期間,DeepSeek-r1開(kāi)源了。

我在想,如果每一個(gè)機(jī)器人都裝上支持deepseek的智能芯片,能夠本地低延遲完成和人類(lèi)的交互,這樣的機(jī)器人真的可以從動(dòng)作和思想成為一個(gè)“智能人”,其想象空間絕對(duì)不可限量。

這就是天命!

機(jī)器人革命的最大障礙竟被開(kāi)源打破了?

可能有人說(shuō),不需要本地部署芯片,只用聯(lián)網(wǎng)用云端的服務(wù)就好了。

Hi ,兄弟,你也不想你的機(jī)器人扶你過(guò)馬路的時(shí)候,突然斷網(wǎng),從智能變成智障吧。

所以,這樣的機(jī)器人必須部署那一個(gè)不依賴(lài)云端算力的端側(cè)AI芯片。

才能同時(shí)滿足低功耗和高性能的需求。

那什么架構(gòu)的芯片能滿足deepseek高效在機(jī)器人以及其他端側(cè)部署環(huán)境?

作為這個(gè)芯片設(shè)計(jì)師,我會(huì)選擇risc-v+張量計(jì)算擴(kuò)展,這是端側(cè)算力的“天命人架構(gòu)”。

一:靈活擴(kuò)展的算力架構(gòu)

為什么說(shuō)RISC-V是端側(cè)算力的“天命人架構(gòu)”?

DeepSeek大模型開(kāi)源普惠眾生,讓算力從云端神壇走向萬(wàn)物終端。

這一個(gè)多月,我們大家都看到了,deepseek開(kāi)源帶來(lái)科技平權(quán)力量是如何勢(shì)不可擋。

從智算應(yīng)用,智算基礎(chǔ)設(shè)施,智算服務(wù)等千行百業(yè),甚至到普通人都感受到了開(kāi)源科技平權(quán)的力量。

AI算力的終極戰(zhàn)場(chǎng)上,能不能做到萬(wàn)物智能,答案就在部署在智能終端的芯片之中。

但是,隨之而來(lái)帶來(lái)一個(gè)尷尬的地方,卻是本地部署少之又少可憐的token處理能力。

而目前看,面對(duì)大模型推理的需求,端側(cè)芯片的算力還是捉襟見(jiàn)肘。

而RISC-V正以開(kāi)源架構(gòu)的顛覆性?xún)?yōu)勢(shì),成為破局的核心變量。

RISC-V以開(kāi)放指令集為基礎(chǔ),摒棄歷史包袱,僅保留最簡(jiǎn)指令集,允許開(kāi)發(fā)者根據(jù)場(chǎng)景需求自定義擴(kuò)展(如AI加速模塊)。

這種“歸零解構(gòu)”契合第一性原原理。

就是從算力需求本質(zhì)出發(fā),而非模仿現(xiàn)有架構(gòu)。

我稱(chēng)之為面向算力需求的架構(gòu)。

面向人工智能算力,而RISC-V通過(guò)開(kāi)放、靈活、高能效的設(shè)計(jì),完美契合AI算力對(duì)本質(zhì)化創(chuàng)新的需求。

AI時(shí)代需要CPU、GPU、TPU等多計(jì)算單元協(xié)同。

而RISC-V的模塊化設(shè)計(jì)天然支持異構(gòu)融合,通過(guò)定制化指令集提升資源調(diào)度效率,適應(yīng)端側(cè)異構(gòu)計(jì)算融合的趨勢(shì)。

也就是說(shuō),RISC-V通過(guò)指令和模塊擴(kuò)展,在一套體系架構(gòu)下,融合了CPU,GPU,TPU等不同功能的單元。

例如在低功耗領(lǐng)域,RISC-V精簡(jiǎn)指令集減少冗余計(jì)算,能效比顯著優(yōu)于傳統(tǒng)架構(gòu),適合端側(cè)設(shè)備的續(xù)航要求。

在高性能方面:通過(guò)模塊化擴(kuò)展,支持按需組合功能模塊(如浮點(diǎn)運(yùn)算、向量處理),靈活適配AI推理、圖像處理等場(chǎng)景,而不是做一個(gè)大而全的CPU,很多硬件都浪費(fèi)。

而RISC-V的模塊化設(shè)計(jì),讓開(kāi)發(fā)者能像拼樂(lè)高般定制計(jì)算單元。

也就是說(shuō)開(kāi)發(fā)者可以根據(jù)需求自主添加指令集。

例如可以添加SIMD的指令,達(dá)到GPU向量計(jì)算能力,添加矩陣運(yùn)算的指令模塊,達(dá)到TPU的張量運(yùn)算的能力。而RISC-V本身就具備標(biāo)量運(yùn)算的能力。

這么說(shuō)比較枯燥,我們舉個(gè)例子。

例如達(dá)摩院玄鐵C930?搭載vector+matrix雙引擎,8位整數(shù)指令專(zhuān)攻AI推理,512位矢量單元應(yīng)對(duì)科學(xué)計(jì)算 。

這么設(shè)計(jì)的還有Semidynamics將張量單元焊入CPU核內(nèi),軟件復(fù)雜度腰斬。

還有大神Jim keller創(chuàng)辦的Tenstorrent ?BlackHole,這個(gè)芯片用768個(gè)RISC-V核懟出745TFLOPS算力,成本僅GPU方案1/10。

除了在架構(gòu)方面,在計(jì)算范式上,RISC-V也在重構(gòu)端側(cè)算力格局。

二:算法定義芯片的計(jì)算范式

RISC-V不是走一場(chǎng)傳統(tǒng)的CPU的路徑,而RISC-V要從“通用計(jì)算”到“算法定義芯片” 的計(jì)算范式革命。

傳統(tǒng)把CPU,GPU,TPU(NPU)異構(gòu)集成SOC的方式,三駕馬車(chē),各拉各的套,三種編程方式,用過(guò)的人都知道,這個(gè)編程難度和效率有些一言難盡。

而RISC-V擴(kuò)展指令和模塊的方式,能夠最大限度的解決算力編程的問(wèn)題,(當(dāng)然也是一種DSL面向?qū)S妙I(lǐng)域架構(gòu)的變成語(yǔ)言)。

算法定義芯片能夠最大限度解決,軟件和硬件匹配的問(wèn)題。

這種理念讓芯片成為算法本身的拓?fù)渫队啊?/b>

大家仔細(xì)看最近DeepSeek開(kāi)源的幾個(gè)工程,有幾個(gè)在講從芯片底層優(yōu)化算法效率,包括多頭注意力機(jī)制的運(yùn)算優(yōu)化,GEMM的矩陣乘法優(yōu)化等等。

這些都在在優(yōu)化GPU調(diào)用本身,其本質(zhì)原因,GPU并不是為了大模型推理而設(shè)計(jì)的。

基于RISC-V的DSL本身,作為算法定義芯片的開(kāi)發(fā)語(yǔ)言,就可以在算子力度最大限度的講芯片算法提交給應(yīng)用,減少了優(yōu)化的時(shí)間。

動(dòng)態(tài)異構(gòu)計(jì)算的本質(zhì)優(yōu)勢(shì),RISC-V通過(guò)可擴(kuò)展指令集架構(gòu)(如V擴(kuò)展、自定義加速器接口),天然支持硬件任務(wù)動(dòng)態(tài)分區(qū)。

同一芯片內(nèi),算力資源可按需分配給AI推理(如矩陣乘加速模塊)或通用計(jì)算(如控制邏輯),實(shí)現(xiàn)“時(shí)分復(fù)用硬件”的極致靈活性。

這種能力使端側(cè)設(shè)備既能滿足AI推理的突發(fā)性高吞吐需求(如視覺(jué)識(shí)別峰值算力),又能在空閑時(shí)段無(wú)縫切換至傳感器數(shù)據(jù)處理、通信協(xié)議棧運(yùn)行等任務(wù),突破傳統(tǒng)GPU/ASIC架構(gòu)的“功能固化”瓶頸。

傳統(tǒng)CPU如同笨重的卡車(chē),30%芯片面積被復(fù)雜解碼邏輯占據(jù),還有層層疊疊積累的前向兼容和后向兼容的指令。

RISC-V通過(guò)架構(gòu)精簡(jiǎn)+軟硬協(xié)同實(shí)現(xiàn)能效碾壓,RISC-V指令解碼器面積比x86小30%,玄鐵C930在28nm工藝下實(shí)現(xiàn)2.3W/GHz,同等性能功耗僅為Arm A55的60%;

數(shù)據(jù)對(duì)比在端側(cè)典型任務(wù)(如720P圖像分類(lèi))中,RISC-V方案能效比可達(dá)x86架構(gòu)的7倍,Arm架構(gòu)的2.3倍。

這種降維打擊策略已見(jiàn)成效。

預(yù)計(jì)到2030年RISC-V芯片出貨量預(yù)計(jì)超過(guò)160億顆,產(chǎn)品出貨量CAGR保持40%高速增長(zhǎng),在自動(dòng)駕駛域控領(lǐng)域滲透率超30%。

正如Arm顛覆x86的移動(dòng)端霸權(quán),RISC-V正從邊緣側(cè)包抄傳統(tǒng)架構(gòu)腹地。

看到這里,可能很多人心中都有疑問(wèn)。

是真的嗎?

為什么RISC-V發(fā)展如此迅猛?

為什么我的筆記本電腦/手機(jī)上還沒(méi)有用上?

接下來(lái),我們來(lái)講講為什么RISC-V這么受歡迎,你就對(duì)這些心中有了答案。

三:算力平權(quán)的開(kāi)源生態(tài)

變革是一個(gè)量變引起質(zhì)變的過(guò)程。我們用的藍(lán)牙耳機(jī)中絕大部分芯片,都已經(jīng)用了risc-v的處理器核,出貨在十幾億顆,這還僅僅是一個(gè)應(yīng)用。很多的MCU也逐漸向RISC-V遷移。而端側(cè)算力芯片也將逐漸滲透。大家用RISC-V做芯片,不是為了趕時(shí)髦,是為了賺錢(qián)。在芯片界沒(méi)有不變的架構(gòu)只有永恒的利益。而追求這些利益就是芯片發(fā)展的動(dòng)力。

當(dāng)下,傳統(tǒng)芯片架構(gòu)(x86/Arm)的封閉性導(dǎo)致端側(cè)算力陷入雙重困境

開(kāi)發(fā)門(mén)檻高:Arm每核授權(quán)費(fèi)高達(dá)數(shù)百萬(wàn)美元,中小企業(yè)難以承受;

迭代周期長(zhǎng):新增AI指令需經(jīng)漫長(zhǎng)標(biāo)準(zhǔn)審批,無(wú)法響應(yīng)大模型快速演進(jìn)需求。

開(kāi)源就是RISC-V打破算力壟斷的核武器。

我們從Deepseek的開(kāi)源,能夠看到開(kāi)源帶來(lái)的技術(shù)力量。

同樣RISC-V的開(kāi)源,也帶來(lái)了強(qiáng)大的技術(shù)使能。

這種開(kāi)源帶來(lái)了三個(gè)好處,分別是成本,敏捷,生態(tài)。

第一個(gè)是成本。

如同Deepseek的開(kāi)源,每個(gè)企業(yè)或者個(gè)人都能部署最先進(jìn)的推理模型,而不用花費(fèi)千萬(wàn)美金甚至上億美金去訓(xùn)練自己的大模型,一下子降低了大模型的門(mén)檻。

而RISC-V在CPU領(lǐng)域也是如此,同樣降低了設(shè)計(jì)一個(gè)芯片的門(mén)檻。當(dāng)Arm每核授權(quán)費(fèi)高達(dá)數(shù)百萬(wàn)美元級(jí)別時(shí),RISC-V的零成本特性讓中小企業(yè)也能玩轉(zhuǎn)高端芯片,即使是用商用支持的RISC-V的IP,也不同級(jí)別的ARM授權(quán)費(fèi)用要低不少。

第二個(gè)是敏捷。

RISC-V通過(guò)開(kāi)源生態(tài)+模塊化架構(gòu)重構(gòu)游戲規(guī)則,達(dá)摩院玄鐵團(tuán)隊(duì)僅用6個(gè)月完成Vector 1.0到Matrix指令集升級(jí)。通過(guò)自定義指令集,其GEMM計(jì)算速度提升超7倍,Transformer算子性能提升超17倍,

這種敏捷創(chuàng)新在封閉架構(gòu)中需要2年審批周期,而RISC-V開(kāi)發(fā)者僅用6個(gè)月就實(shí)現(xiàn)技術(shù)迭代。

時(shí)間就是金錢(qián),快速迭代才能快速收獲。

這種“全民開(kāi)發(fā)者”模式,使端側(cè)芯片能快速適配大模型需求。

RISC-V的模塊化基因使其成為大模型時(shí)代的最佳載體。

第三個(gè)是生態(tài),

生態(tài)升維定義產(chǎn)業(yè)規(guī)則,RISC-V國(guó)際基金會(huì)推動(dòng)RVV矢量擴(kuò)展標(biāo)準(zhǔn)化,同時(shí)允許企業(yè)自定義指令,形成“安卓式開(kāi)源+廠商定制”的生態(tài)范式。

谷歌Android 15、華為鴻蒙全面擁抱RISC-V,云計(jì)算,人工智能、自動(dòng)駕駛,更不要說(shuō)藍(lán)牙耳機(jī)等等,RISC-V已實(shí)現(xiàn)規(guī)?;逃谩?/p>

還有類(lèi)似RISC-V無(wú)劍聯(lián)盟這樣的上下游一體的產(chǎn)業(yè)生態(tài)。

RISC-V的開(kāi)放標(biāo)準(zhǔn)允許全球開(kāi)發(fā)者協(xié)作優(yōu)化,加速技術(shù)迭代。

遠(yuǎn)超傳統(tǒng)架構(gòu)發(fā)展速度,這種開(kāi)源特性與第一性原理倡導(dǎo)的“打破知識(shí)藩籬”高度一致,推動(dòng)端側(cè)算力突破經(jīng)驗(yàn)局限。

從這次達(dá)摩院RISC-V生態(tài)大會(huì)傳遞出一個(gè)信號(hào):“RISC-V正從替代品升維為定義者”。

RISC-V正通過(guò)開(kāi)源標(biāo)準(zhǔn)化+定制化并行重構(gòu)產(chǎn)業(yè)生態(tài):

未來(lái)不屬于算力最強(qiáng)的架構(gòu),而屬于最能激活算力場(chǎng)景的生態(tài)。

也就是構(gòu)建算力-芯片-生態(tài)的閉環(huán)。

工具鏈方面:平頭哥無(wú)劍600平臺(tái)提供從算法優(yōu)化到芯片驗(yàn)證的全流程工具,開(kāi)發(fā)者僅需3個(gè)月即可完成AI芯片流片;

場(chǎng)景化擴(kuò)展:RISC-V國(guó)際基金會(huì)推動(dòng)RVA22虛擬化標(biāo)準(zhǔn),允許單芯片同時(shí)運(yùn)行Linux大模型和RTOS實(shí)時(shí)控制任務(wù),滿足自動(dòng)駕駛多域融合需求。

在大模型方面:玄鐵團(tuán)隊(duì)選擇DeepSeek模型蒸餾+稀疏化壓后1.5B參數(shù)模型在玄鐵C920上快速適配,達(dá)到GPT-4o 80%的準(zhǔn)確率,證明“小模型+高能效芯片”組合的可行性。

軟件定義硬件,達(dá)摩院發(fā)布全球首個(gè)RISC-V AI編譯器,支持PyTorch模型自動(dòng)編譯為RVV指令,算子優(yōu)化效率提升4倍;

目前我們經(jīng)歷Deepseek的洗禮,沒(méi)有人會(huì)懷疑AI改變我們這個(gè)世界的能力。

這是一場(chǎng)AI革命。

AI革命,終將讓每個(gè)智能終端都成為AI進(jìn)化的神經(jīng)元——而開(kāi)源的基因,正是點(diǎn)燃燎原之火的火種。

RISC-V正在證明,真正的算力革命,永遠(yuǎn)始于開(kāi)放,成于普惠。

RISC-V引發(fā)的不僅是技術(shù)變革,更是產(chǎn)業(yè)權(quán)力結(jié)構(gòu)的重塑:

開(kāi)源生態(tài)使AI芯片開(kāi)發(fā)成本降低90%,中小企業(yè)可參與高端市場(chǎng);

中國(guó)企業(yè)在RISC-V基金會(huì)貢獻(xiàn)超40%技術(shù)提案,打破歐美在芯片架構(gòu)領(lǐng)域的壟斷。

到2030年,RISC-V將占據(jù)端側(cè)AI芯片60%份額。

當(dāng)大模型通過(guò)RISC-V實(shí)現(xiàn)“泛在智能”——從端側(cè)算力到智能,這場(chǎng)由開(kāi)源架構(gòu)驅(qū)動(dòng)的算力平權(quán)運(yùn)動(dòng),將AI算力部署在端側(cè),或?qū)⒔K結(jié)“算力霸權(quán)主義”,開(kāi)啟人機(jī)協(xié)同的新紀(jì)元。

正如倪光南院士所言:“RISC-V正從架構(gòu)替代走向規(guī)則定義。”

當(dāng)傳統(tǒng)巨頭還在為制程內(nèi)卷時(shí),RISC-V軍團(tuán)已帶著開(kāi)源生態(tài)的“技術(shù)核彈”,在端側(cè)智算戰(zhàn)場(chǎng)完成合圍。

也許很快我們就能看到,能夠基于risc-v的deepseek推理芯片能夠部署在人形機(jī)器人身上,完成從行走到智能思考交互的改變。

算力革命的勝負(fù)手不在工藝制程,而在生態(tài)開(kāi)放性。

Deepseek是這樣,RISC-V也是這樣。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫(xiě)文章/發(fā)需求
立即登錄