近期,中國(guó)人工智能企業(yè)深度求索(DeepSeek)的大模型憑借其卓越的技術(shù)優(yōu)勢(shì)和廣泛的應(yīng)用前景,迅速成為行業(yè)焦點(diǎn)。隨著多家國(guó)內(nèi)外知名云平臺(tái)和科技企業(yè)相繼宣布上線DeepSeek大模型,人工智能市場(chǎng)迎來(lái)了新的變革浪潮。
據(jù)全球半導(dǎo)體觀察不完全統(tǒng)計(jì),目前已包括國(guó)外巨頭英偉達(dá)、AMD、微軟、亞馬遜云科技、英特爾,國(guó)內(nèi)GPU企業(yè)沐曦、天數(shù)智芯、摩爾線程、海光信息,云計(jì)算大廠華為云、騰訊云、天翼云、阿里云、百度智能云、火山引擎,以及無(wú)問(wèn)芯穹、壁仞科技、硅基流動(dòng)、PPIO派歐云、云軸科技等總計(jì)20家企業(yè)均已宣布適配及上架DeepSeek模型服務(wù)。
國(guó)際巨頭積極布局,引領(lǐng)全球AI發(fā)展
AMD
在國(guó)際市場(chǎng)上,AMD最早在1月25日就官宣將DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平臺(tái)發(fā)文中,AMD董事長(zhǎng)兼CEO蘇姿豐稱贊DeepSeek展現(xiàn)了“AI世界創(chuàng)新的速度和步伐”、“模型和算法創(chuàng)新有利于AI普及”。
微軟
微軟也不甘落后,1月30日,微軟宣布DeepSeek-R1模型已通過(guò)AzureAIFoundry和GitHub提供。微軟計(jì)劃將該模型應(yīng)用于其AI電腦Copilot+PC,并推出了針對(duì)NPU優(yōu)化的版本,進(jìn)一步拓展了其AI應(yīng)用生態(tài)。
英偉達(dá)
1月31日,英偉達(dá)接連官宣上線搭載DeepSeek-R1的軟件服務(wù)。英偉達(dá)官網(wǎng)顯示,DeepSeek-R1模型現(xiàn)已作為NVIDIANIM微服務(wù)預(yù)覽版提供,為開發(fā)者開啟了測(cè)試和體驗(yàn)該API的通道。
英特爾
同樣在1月31日,英特爾也宣布DeepSeek能夠在搭載酷睿處理器的AI PC上離線使用。在酷睿Ultra 200H(Arrow Lake H)平臺(tái)上,DeepSeek-R1-1.5B模型能夠本地離線運(yùn)行,做翻譯、做會(huì)議紀(jì)要、進(jìn)行文檔撰寫等任務(wù)。
AWS(亞馬遜云科技)
AWS(亞馬遜云科技)同樣積極布局,1月31日,亞馬遜云科技宣布用戶可以在AmazonBedrock和AmazonSageMakerAI中部署DeepSeek-R1模型。此外,用戶還可以通過(guò)AmazonEC2和AmazonSageMakerAI,使用AmazonTrainium和AmazonInferentia部署DeepSeek-R1-Distill模型。
國(guó)內(nèi)企業(yè)迅猛跟進(jìn)
華為云
2月1日,華為云發(fā)文稱,硅基流動(dòng)與華為云團(tuán)隊(duì)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。該服務(wù)借助自研推理加速引擎,不僅能讓部署的DeepSeek模型獲得與全球高端GPU部署模型相當(dāng)?shù)男Ч?,還具備穩(wěn)定的生產(chǎn)級(jí)服務(wù)能力。
騰訊云
2月2日,騰訊云宣布在高性能應(yīng)用服務(wù)HAI上支持一鍵部署DeepSeek-R1模型,開發(fā)者僅需3分鐘即可完成模型的啟動(dòng)和配置,并且能與其他騰訊云服務(wù)無(wú)縫集成,極大提高了構(gòu)建基于DeepSeekR1完整AI應(yīng)用的效率。
天翼云
2月5日,中國(guó)電信天翼云宣布成為國(guó)內(nèi)最早支持DeepSeek-R1模型的云服務(wù)商之一。天翼云在其智算產(chǎn)品體系中全面接入DeepSeek-R1模型,涉及的產(chǎn)品和服務(wù)涵蓋息壤-科研助手、天翼AI云電腦、“息壤”智算平臺(tái)、GPU云主機(jī)/裸金屬等。
阿里云
2月3日,阿里云宣布其PAIModelGallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型,用戶可以在該平臺(tái)上零代碼實(shí)現(xiàn)從訓(xùn)練到部署再到推理的全過(guò)程。
百度智能云
2月3日,百度智能云千帆平臺(tái)正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價(jià)格方案以及限時(shí)免費(fèi)服務(wù)。
火山引擎
2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企業(yè)用戶可在火山引擎機(jī)器學(xué)習(xí)平臺(tái)veMLP中部署或通過(guò)火山方舟平臺(tái)直接調(diào)用。
沐曦
沐曦聯(lián)合中國(guó)開源大模型平臺(tái)Gitee AI發(fā)布了全套DeepSeek-R1千問(wèn)蒸餾模型,2月2日首批上線了1.5B、7B、14B、32B四個(gè)較小規(guī)模的模型,均部署在國(guó)產(chǎn)沐曦曦云GPU上。DeepSeek-R1模型與沐曦曦云GPU及Gitee AI平臺(tái)的結(jié)合,實(shí)現(xiàn)了從芯片到平臺(tái)、從算力到模型的全國(guó)產(chǎn)研發(fā)和中國(guó)制造,官方稱之為“100%國(guó)產(chǎn)AI的力量”。
天數(shù)智芯
天數(shù)智芯于2月4日宣布與Gitee AI合作,僅用時(shí)一天就完成了與DeepSeek-R1模型的適配工作,并正式上線多個(gè)大模型服務(wù),包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。其表示國(guó)內(nèi)GPU與DeepSeek的適配可實(shí)現(xiàn)深度學(xué)習(xí)框架與國(guó)內(nèi)自主硬件的深度融合,促進(jìn)國(guó)內(nèi)AI產(chǎn)業(yè)鏈自主可控發(fā)展,減少對(duì)國(guó)外硬件平臺(tái)的依賴,降低技術(shù)風(fēng)險(xiǎn)和成本。
摩爾線程
摩爾線程于2月4日宣布已實(shí)現(xiàn)對(duì)DeepSeek蒸餾模型推理服務(wù)的部署,并即將開放自主設(shè)計(jì)的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。其認(rèn)為DeepSeek的開源模型與摩爾線程的硬件形成閉環(huán),驗(yàn)證了國(guó)產(chǎn)全功能GPU對(duì)復(fù)雜AI任務(wù)的支持能力,為AGI技術(shù)普惠化提供了可行路徑。
海光信息
海光信息于2月4日宣布其技術(shù)團(tuán)隊(duì)已完成DeepSeek V3和R1模型與海光DCU的適配并上線。海光DCU是其推出的高性能GPGPU架構(gòu)AI加速卡,已在多個(gè)領(lǐng)域規(guī)?;瘧?yīng)用。用戶可通過(guò)“光合開發(fā)者社區(qū)”中的“光源”板塊訪問(wèn)并下載相關(guān)模型,基于DCU平臺(tái)快速部署和使用。
無(wú)問(wèn)芯穹
無(wú)問(wèn)芯穹早在1月28日就宣布其Infini-AI異構(gòu)云對(duì)DeepSeek-R1-Distill 32B模型的支持。無(wú)問(wèn)芯穹的Infini-AI異構(gòu)云平臺(tái)上線了DeepSeek-R1-Distill等產(chǎn)品,為客戶提供基于DeepSeek模型的服務(wù)。
PPIO派歐云
PPIO派歐云于2月2日正式官宣其云服務(wù)平臺(tái)對(duì)DeepSeek模型的支持。PPIO派歐算力云支持了DeepSeek-V3、DeepSeek-R1以及蒸餾模型DeepSeek-R1-Distill-Llama-70B。
360數(shù)字安全
2月2日,360數(shù)字安全宣布其安全大模型正式接入DeepSeek。通過(guò)強(qiáng)化學(xué)習(xí)等技術(shù)手段,360將推出“DeepSeek版”安全大模型,發(fā)揮其安全大數(shù)據(jù)優(yōu)勢(shì)。
云軸科技ZStack
2月2日,云軸科技ZStack宣布其AIInfra平臺(tái)ZStack智塔全面支持企業(yè)私有化部署DeepSeekV3/R1/JanusPro三種模型。該平臺(tái)可基于多種國(guó)內(nèi)外CPU/GPU適配,滿足企業(yè)不同AI場(chǎng)景的需求。
DeepSeek崛起:AI基建需求增長(zhǎng),產(chǎn)業(yè)邁向高成本效益
TrendForce集邦咨詢表示,全球AI Server市場(chǎng)自2023年起快速成長(zhǎng),預(yù)期2025年占整體Server出貨比例將逾15%,至2028年有望接近20%。近年大型CSP業(yè)者順應(yīng)AI訓(xùn)練需求積極擴(kuò)建,自2025年起將重心擴(kuò)展至邊緣AI推理,除了采用NVIDIA Blackwell等新一代GPU平臺(tái),AWS等也加大開發(fā)自家ASIC力道,以提升成本效益、滿足特定AI應(yīng)用需求。中國(guó)CSP和DeepSeek等相關(guān)AI業(yè)者著重開發(fā)更高效的AI芯片或算法,以促進(jìn)AI需求和應(yīng)用的多元發(fā)展。
AI 行業(yè)過(guò)去依賴擴(kuò)大模型、增加數(shù)據(jù)和提升硬件效能來(lái)發(fā)展,但成本與效率成為挑戰(zhàn)。DeepSeek 采用蒸餾模型(Model Distillation)技術(shù),壓縮大型模型以提升推理速度并降低硬件需求,同時(shí)充分發(fā)揮 NVIDIA Hopper 降規(guī)版芯片的效益,最大化運(yùn)算資源利用。其成本優(yōu)勢(shì)來(lái)自高效能硬件選擇、新型蒸餾技術(shù)及 API 開源策略,不僅優(yōu)化技術(shù)與商業(yè)應(yīng)用的平衡,也展現(xiàn) AI 產(chǎn)業(yè)向高效發(fā)展的趨勢(shì)。
DeepSeek大模型的成功上線,為企業(yè)提供了低成本、高性能的技術(shù)解決方案,還推動(dòng)了人工智能行業(yè)的良性競(jìng)爭(zhēng)與發(fā)展。隨著更多應(yīng)用場(chǎng)景的開發(fā)和落地,DeepSeek有望在更多領(lǐng)域發(fā)揮重要作用,后續(xù)發(fā)展值得持續(xù)關(guān)注。