傳英偉達(dá)單獨(dú)設(shè)計(jì)特供中國(guó)芯片，最快Q2面世

05/06 10:00 作者：芯科技圈

2149

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

英偉達(dá)的中國(guó)特供版AI?GPU 芯片主要有以下幾款

1. A800（2022?年推出）

A100?的替代方案，面向推理與輕量訓(xùn)練。

技術(shù)特性：

架構(gòu)：Ampere架構(gòu)，臺(tái)積電7nm工藝。

算力：FP16?算力?62 TFLOPS，較A100（156 TFLOPS）下降?60%。

顯存：40GB HBM2，帶寬1.6TB/s（A100?為?1.5TB/s）。

互聯(lián)：NVLink帶寬從?600GB/s?降至?400GB/s，支持?8?卡集群。

市場(chǎng)表現(xiàn)：2023?年出貨量超30萬(wàn)顆，占英偉達(dá)中國(guó)區(qū)營(yíng)收的?35%。

2.H800（2023?年推出）

H100?的替代方案，面向大模型訓(xùn)練。

技術(shù)特性：

架構(gòu)：Hopper架構(gòu)，臺(tái)積電4N?工藝。

算力：FP8?算力60 TFLOPS，較H100（60 TFLOPS）未降，但?FP16?算力從?312 TFLOPS?降至?148 TFLOPS。

顯存：80GB HBM2e，帶寬?3TB/s（H100?為?3.35TB/s）。

互聯(lián)：NVLink?帶寬從?900GB/s?降至?900GB/s，支持?8?卡集群。

市場(chǎng)表現(xiàn)：2023?年?Q4?出貨量超?10?萬(wàn)顆，主要用于百度文心一言、阿里通義千問(wèn)等模型訓(xùn)練。

3.H20（2023?年推出）

H100?的進(jìn)一步簡(jiǎn)化版，面向垂類(lèi)模型推理。

技術(shù)特性：

架構(gòu)：Hopper架構(gòu)，臺(tái)積電4N?工藝。

算力：FP16?算力148 TFLOPS，與H800?持平，但取消?FP8?計(jì)算單元。

顯存：96GB HBM3，帶寬4TB/s，支持?NVLink 900GB/s。

功耗：400W，適配現(xiàn)有服務(wù)器散熱系統(tǒng)。

市場(chǎng)表現(xiàn)：2024?年出貨量超?50?萬(wàn)顆，占英偉達(dá)中國(guó)區(qū)營(yíng)收的?60%。

4. HGX H20、L20 PCle、L2 PCle（2023?年推出）

H100?的替代方案，面向不同部署場(chǎng)景。

技術(shù)特性：

HGX H20：SXM板卡形態(tài)，支持8卡集群，F(xiàn)P16?算力148TFLOPS，適配英偉達(dá)?HGX?服務(wù)器。

L20 PCle：PCIe接口，48GB GDDR6顯存，F(xiàn)P16?算力74TFLOPS，面向邊緣推理。

L2 PCle：PCIe接口，24GB GDDR6?顯存，F(xiàn)P16?算力37TFLOPS，面向輕量級(jí)AI應(yīng)用。

市場(chǎng)表現(xiàn)：L20 PCle在安防、工業(yè)質(zhì)檢等領(lǐng)域出貨量超?20?萬(wàn)顆。

5.RTX 4090D：Ada Lovelace（2023?年推出）

RTX4090?的替代方案，面向不同部署場(chǎng)景。

架構(gòu)與參數(shù)：基于Ada Lovelace架構(gòu)，搭載AD102-250 GPU，擁有14592個(gè)CUDA?核心、456?個(gè)?Tensor Core?和?176個(gè)RT Core，顯存為24GB GDDR6X（384bit?位寬），加速頻率2.52GHz，總功耗?425W。

英偉達(dá)為中國(guó)市場(chǎng)推出的定制版游戲顯卡。美國(guó)2023年10?月更新的出口管制要求，將?AI?算力超過(guò)?4800 TPP（總性能參數(shù)）的?GPU?列為對(duì)華禁售產(chǎn)品。原版?RTX 4090?的?TPP?為?5285，而?RTX 4090D?通過(guò)削減?11%?的?CUDA?核心和?Tensor Core，將?TPP?降至?476.8，規(guī)避了出口限制。

6. RTX 5090D：Blackwell?架構(gòu)（2025年1月推出）

RTX5090?的替代方案，面向不同部署場(chǎng)景。

架構(gòu)與參數(shù)：基于Blackwell?架構(gòu)，搭載B102-250 GPU，擁有21760?個(gè)?CUDA?核心、512?個(gè)?Tensor Core和224個(gè)RT Core，顯存為?32GB GDDR7（512bit?位寬），加速頻率?2.41GHz，總功耗?575W。與原版?RTX 5090?相比，ROP?單元減少?8?個(gè)（從?176?個(gè)降至?168?個(gè)），可能導(dǎo)致性能損失約?4%-11%。

英偉達(dá)在?CES 2025?上推出的中國(guó)獨(dú)有的顯卡。這款產(chǎn)品保留了其全球版本?RTX 5090?的大部分規(guī)格，除了人工智能性能方面，RTX 5090?的?3352 AI TOPS?被降低到?RTX 5090D?的?2375 AI TOPS，降幅為?29%，同時(shí)取消?NVLink?互聯(lián)功能，避免用于超算集群。

7. B20（2025?年6月推出）

B20是Blackwell B200?的一個(gè)簡(jiǎn)化版，預(yù)計(jì)于?2025?年第二季度（2025年6月份）發(fā)布,面向下一代推理需求。

架構(gòu)：Blackwell?架構(gòu)，臺(tái)積電?4N?工藝。

由英偉達(dá)在中國(guó)的主要合作伙伴浪潮進(jìn)行銷(xiāo)售。為了符合美國(guó)的出口限制，B20?會(huì)進(jìn)行一定程度的性能削減，預(yù)計(jì)將成為入門(mén)級(jí)產(chǎn)品，具體太多參數(shù)信息還比較少。要滿足美國(guó)?2025?年4月出口管制新規(guī)要求，其性能將被大幅削弱，與?Blackwell?系列的旗艦?GPU B200?不是一個(gè)等級(jí)。因此，相比英偉達(dá)其他高端?GPU?產(chǎn)品，B20?可能并不存在傳統(tǒng)意義上在算力、內(nèi)存等方面的優(yōu)勢(shì)。

筆者的思考部分：

B20?通過(guò)參數(shù)調(diào)整符合美國(guó)當(dāng)前出口限制，可6月份出貨中國(guó)，但美國(guó)政府可能進(jìn)一步收緊規(guī)則。例如，2025年4月對(duì)H20?的管制升級(jí)，未來(lái)?B20?可能面臨類(lèi)似限制。英偉達(dá)已計(jì)提?55?億美元準(zhǔn)備金，反映其對(duì)政策風(fēng)險(xiǎn)的審慎態(tài)度。

B20?的推出是英偉達(dá)在政策高壓下的生存策略，也是中國(guó)?AI?產(chǎn)業(yè)在技術(shù)封鎖中尋找平衡的縮影。盡管其性能受限，但B20延續(xù)CUDA?生態(tài)，支持?PyTorch、TensorFlow?等主流框架，且與英偉達(dá)?AI Enterprise?軟件套件深度整合。這對(duì)依賴(lài)現(xiàn)有開(kāi)發(fā)工具鏈的企業(yè)具有強(qiáng)粘性。例如，百度、阿里等云廠商等，使其在未來(lái)2-3?年仍將占據(jù)

歡迎加入讀者交流群xinkejiquan001（與行業(yè)大咖交流、互換名片），請(qǐng)備注名字+公司+崗位。

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點(diǎn)僅代表作者本人，不代表與非網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問(wèn)題，請(qǐng)聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）

英偉達(dá)

NVIDIA（中國(guó)大陸譯名：英偉達(dá)，港臺(tái)譯名：輝達(dá)），成立于1993年，是一家美國(guó)跨國(guó)科技公司，總部位于加利福尼亞州圣克拉拉市，由黃仁勛、克里斯·馬拉科夫斯基（Chris Malachowsky）和柯蒂斯·普里姆（Curtis Priem）共同創(chuàng)立。公司早期專(zhuān)注于圖形芯片設(shè)計(jì)業(yè)務(wù)，隨著公司技術(shù)與業(yè)務(wù)發(fā)展，已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司，致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件，為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車(chē)等領(lǐng)域的計(jì)算解決方案提供支持。

傳英偉達(dá)單獨(dú)設(shè)計(jì)特供中國(guó)芯片，最快Q2面世

相關(guān)推薦

傳英偉達(dá)單獨(dú)設(shè)計(jì)特供中國(guó)芯片，最快Q2面世