• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

傳英偉達(dá)單獨(dú)設(shè)計(jì)特供中國芯片,最快Q2面世

3小時(shí)前
195
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

英偉達(dá)的中國特供版AI?GPU 芯片主要有以下幾款

1. A800(2022?年推出)

A100?的替代方案,面向推理與輕量訓(xùn)練。

技術(shù)特性:

架構(gòu):Ampere架構(gòu),臺(tái)積電7nm工藝。

算力:FP16?算力?62 TFLOPS,較A100(156 TFLOPS)下降?60%。

顯存:40GB HBM2,帶寬1.6TB/s(A100?為?1.5TB/s)。

互聯(lián):NVLink帶寬從?600GB/s?降至?400GB/s,支持?8?卡集群。

市場表現(xiàn):2023?年出貨量超30萬顆,占英偉達(dá)中國區(qū)營收的?35%。

2.H800(2023?年推出)

H100?的替代方案,面向大模型訓(xùn)練。

技術(shù)特性:

架構(gòu):Hopper架構(gòu),臺(tái)積電4N?工藝。

算力:FP8?算力60 TFLOPS,較H100(60 TFLOPS)未降,但?FP16?算力從?312 TFLOPS?降至?148 TFLOPS。

顯存:80GB HBM2e,帶寬?3TB/s(H100?為?3.35TB/s)。

互聯(lián):NVLink?帶寬從?900GB/s?降至?900GB/s,支持?8?卡集群。

市場表現(xiàn):2023?年?Q4?出貨量超?10?萬顆,主要用于百度文心一言、阿里通義千問等模型訓(xùn)練。

3.H20(2023?年推出)

H100?的進(jìn)一步簡化版,面向垂類模型推理。

技術(shù)特性:

架構(gòu):Hopper架構(gòu),臺(tái)積電4N?工藝。

算力:FP16?算力148 TFLOPS,與H800?持平,但取消?FP8?計(jì)算單元。

顯存:96GB HBM3,帶寬4TB/s,支持?NVLink 900GB/s。

功耗:400W,適配現(xiàn)有服務(wù)器散熱系統(tǒng)。

市場表現(xiàn):2024?年出貨量超?50?萬顆,占英偉達(dá)中國區(qū)營收的?60%。

4. HGX H20、L20 PCle、L2 PCle(2023?年推出)

H100?的替代方案,面向不同部署場景。

技術(shù)特性:

HGX H20:SXM板卡形態(tài),支持8卡集群,F(xiàn)P16?算力148TFLOPS,適配英偉達(dá)?HGX?服務(wù)器。

L20 PCle:PCIe接口,48GB GDDR6顯存,F(xiàn)P16?算力74TFLOPS,面向邊緣推理。

L2 PCle:PCIe接口,24GB GDDR6?顯存,F(xiàn)P16?算力37TFLOPS,面向輕量級AI應(yīng)用。

市場表現(xiàn):L20 PCle在安防、工業(yè)質(zhì)檢等領(lǐng)域出貨量超?20?萬顆。

5.RTX 4090D:Ada Lovelace(2023?年推出)

RTX4090?的替代方案,面向不同部署場景。

架構(gòu)與參數(shù):基于Ada Lovelace架構(gòu),搭載AD102-250 GPU,擁有14592個(gè)CUDA?核心、456?個(gè)?Tensor Core?和?176個(gè)RT Core,顯存為24GB GDDR6X(384bit?位寬),加速頻率2.52GHz,總功耗?425W。

英偉達(dá)為中國市場推出的定制版游戲顯卡。美國2023年10?月更新的出口管制要求,將?AI?算力超過?4800 TPP(總性能參數(shù))的?GPU?列為對華禁售產(chǎn)品。原版?RTX 4090?的?TPP?為?5285,而?RTX 4090D?通過削減?11%?的?CUDA?核心和?Tensor Core,將?TPP?降至?476.8,規(guī)避了出口限制。

6. RTX 5090D:Blackwell?架構(gòu)(2025年1月推出)

RTX5090?的替代方案,面向不同部署場景。

架構(gòu)與參數(shù):基于Blackwell?架構(gòu),搭載B102-250 GPU,擁有21760?個(gè)?CUDA?核心、512?個(gè)?Tensor Core和224個(gè)RT Core,顯存為?32GB GDDR7(512bit?位寬),加速頻率?2.41GHz,總功耗?575W。與原版?RTX 5090?相比,ROP?單元減少?8?個(gè)(從?176?個(gè)降至?168?個(gè)),可能導(dǎo)致性能損失約?4%-11%。

英偉達(dá)在?CES 2025?上推出的中國獨(dú)有的顯卡。這款產(chǎn)品保留了其全球版本?RTX 5090?的大部分規(guī)格,除了人工智能性能方面,RTX 5090?的?3352 AI TOPS?被降低到?RTX 5090D?的?2375 AI TOPS,降幅為?29%,同時(shí)取消?NVLink?互聯(lián)功能,避免用于超算集群。

7. B20(2025?年6月推出)

B20是Blackwell B200?的一個(gè)簡化版,預(yù)計(jì)于?2025?年第二季度(2025年6月份)發(fā)布,面向下一代推理需求。

架構(gòu):Blackwell?架構(gòu),臺(tái)積電?4N?工藝。

由英偉達(dá)在中國的主要合作伙伴浪潮進(jìn)行銷售。為了符合美國的出口限制,B20?會(huì)進(jìn)行一定程度的性能削減,預(yù)計(jì)將成為入門級產(chǎn)品,具體太多參數(shù)信息還比較少。要滿足美國?2025?年4月出口管制新規(guī)要求,其性能將被大幅削弱,與?Blackwell?系列的旗艦?GPU B200?不是一個(gè)等級。因此,相比英偉達(dá)其他高端?GPU?產(chǎn)品,B20?可能并不存在傳統(tǒng)意義上在算力、內(nèi)存等方面的優(yōu)勢。

筆者的思考部分:

B20?通過參數(shù)調(diào)整符合美國當(dāng)前出口限制,可6月份出貨中國,但美國政府可能進(jìn)一步收緊規(guī)則。例如,2025年4月對H20?的管制升級,未來?B20?可能面臨類似限制。英偉達(dá)已計(jì)提?55?億美元準(zhǔn)備金,反映其對政策風(fēng)險(xiǎn)的審慎態(tài)度。

B20?的推出是英偉達(dá)在政策高壓下的生存策略,也是中國?AI?產(chǎn)業(yè)在技術(shù)封鎖中尋找平衡的縮影。盡管其性能受限,但B20延續(xù)CUDA?生態(tài),支持?PyTorch、TensorFlow?等主流框架,且與英偉達(dá)?AI Enterprise?軟件套件深度整合。這對依賴現(xiàn)有開發(fā)工具鏈的企業(yè)具有強(qiáng)粘性。例如,百度、阿里等云廠商等,使其在未來2-3?年仍將占據(jù)

歡迎加入讀者交流群xinkejiquan001(與行業(yè)大咖交流、互換名片),請備注名字+公司+崗位。

英偉達(dá)

英偉達(dá)

NVIDIA(中國大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦