英特爾此次同時(shí)推出了全新服務(wù)器 GPU 和 oneAPI 軟件,意味著英特爾開(kāi)始釋放 XPU 的強(qiáng)大實(shí)力。
?
雷鋒網(wǎng)消息,11 月 11 日,英特爾正式發(fā)布其全新服務(wù)器 GPU,即首款數(shù)據(jù)中心的獨(dú)顯產(chǎn)品,該服務(wù)器基于 Xe LP 微架構(gòu),專為高密度、低時(shí)延的安卓云游戲和流媒體服務(wù)而設(shè)計(jì)。同時(shí),英特爾還宣布將于 12 月正式交付相應(yīng)的軟件堆棧 oneAPI Gold 工具。
英特爾此次同時(shí)推出了全新服務(wù)器 GPU 和 oneAPI 軟件,意味著英特爾開(kāi)始釋放 XPU 的強(qiáng)大實(shí)力。
1、英特爾率先定義 XPU 時(shí)代
10 年前,美國(guó)數(shù)據(jù)科學(xué)家舍恩伯格在《大數(shù)據(jù)時(shí)代》一書中對(duì)“大數(shù)據(jù)時(shí)代”作出系統(tǒng)闡釋。
10 年后,互聯(lián)網(wǎng)、人工智能、云計(jì)算的發(fā)展正飛速推動(dòng)全球數(shù)據(jù)量的增長(zhǎng)。國(guó)際數(shù)據(jù)公司 IDC 統(tǒng)計(jì)顯示,預(yù)計(jì)到 2025 年,全球數(shù)據(jù)量將比 2016 年的 16.1 ZB(1 ZB=十萬(wàn)億字節(jié))增加 10 倍,達(dá)到 163 ZB。
盡管越來(lái)越多的數(shù)據(jù)讓現(xiàn)代人置身于信隱私泄露的恐慌之中,但不可否認(rèn)的是,大數(shù)據(jù)正為硬件、軟件乃至服務(wù)等市場(chǎng)帶來(lái)前所未有的經(jīng)濟(jì)增長(zhǎng)。
中國(guó)通信院發(fā)布的《大數(shù)據(jù)白皮書(2019)》顯示,預(yù)計(jì)到 2020 年,全球大數(shù)據(jù)硬件、軟件和服務(wù)的市場(chǎng)規(guī)模將分別達(dá)到 150 億美元、200 億美元和 210 億美元。這意味著基于大數(shù)據(jù),將產(chǎn)生一個(gè)全球范圍內(nèi)價(jià)值 560 億美元的市場(chǎng)。
但在這之前需要解決一個(gè)關(guān)鍵問(wèn)題,在單一芯片算力受限的情況下,如何更好地發(fā)揮海量數(shù)據(jù)的真正價(jià)值?
對(duì)于這一問(wèn)題,英特爾早已給出了答案。2015 年,英特爾就開(kāi)始斥資 167 億美元收購(gòu)當(dāng)時(shí)全球第二大 FPGA 廠商 Altera,此后,又接連收購(gòu)主攻深度學(xué)習(xí)方向的 Nervana Systems、計(jì)算視覺(jué)公司 Movidius、自動(dòng)駕駛視覺(jué)處理公司 Mobileye 和云端 AI 推理芯片已經(jīng)商用的 Habana Labs。
英特爾成為業(yè)界唯一一家擁有全類別 AI 芯片的公司之后,緊接著吸納業(yè)界頂尖的芯片人才,并于 2018 年架構(gòu)日提出制程、封裝、架構(gòu)、存儲(chǔ)、互聯(lián)、安全、軟件的六大技術(shù)戰(zhàn)略。
2018 年的架構(gòu)日在英特爾歷史上具有劃時(shí)代的意義,XPU 異構(gòu)愿景就誕生于此,即由標(biāo)量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的 SVMS 架構(gòu),分別對(duì)應(yīng) CPU、GPU、加速器和 FPGA,可以進(jìn)行多種異構(gòu)組合。
這是英特爾首次、也是業(yè)界首次明確將單一架構(gòu)之后的發(fā)展方向定義為 XPU。
英特爾數(shù)據(jù)中心 XPU 產(chǎn)品和解決方案副總裁 Jeff McVeigh 表示:“XPU 戰(zhàn)略的提出,在于我們意識(shí)到需要不同類型的架構(gòu)來(lái)服務(wù)于各種不同的工作負(fù)載,其中一些工作負(fù)載在本質(zhì)上是標(biāo)量的,另一些是向量、矩陣、空間等等?!?/p>
2、從 Xe 架構(gòu)到獨(dú)立顯卡,實(shí)現(xiàn) XPU 愿景的重要一步
英特爾在 XPU 戰(zhàn)略上進(jìn)展迅速,在其它芯片公司還處于大規(guī)模并購(gòu)階段時(shí),就已經(jīng)基于其豐富的技術(shù)經(jīng)驗(yàn)推出了自有的首款面向數(shù)據(jù)中心的獨(dú)顯產(chǎn)品。
英特爾表示,這款 GPU 采用的是英特爾能效最高的圖形架構(gòu),英特爾 Xe LP 微架構(gòu),擁有低功耗、獨(dú)立片上系統(tǒng)(SoC)設(shè)計(jì),并配備 128 比特管道和 8GB 專用板載低功耗 DDR4 顯存。
另外,如果將英特爾服務(wù)器 GPU 同英特爾至強(qiáng)可擴(kuò)展處理器組合,服務(wù)提供商可以在不改變服務(wù)器數(shù)量的情況下,單獨(dú)擴(kuò)展顯卡容量,得以在每個(gè)系統(tǒng)上支持更多流和訂閱用戶,并且同時(shí)實(shí)現(xiàn)較低的總體擁有成本(TCO)。
通過(guò)在新華三 3/4 長(zhǎng)、全高的 x16 PCIe 3.0 擴(kuò)展卡內(nèi)封裝四個(gè)英特爾服務(wù)器 GPU,即可在一個(gè)典型雙卡系統(tǒng)中支持超過(guò) 100 個(gè)安卓云游戲并發(fā)用戶。這一數(shù)量最高可擴(kuò)展至 160 個(gè)并發(fā)用戶,實(shí)際數(shù)量取決于具體的游戲和服務(wù)器配。
之所以說(shuō)英特爾 XPU 戰(zhàn)略進(jìn)展迅速,是因?yàn)槠鋸?2019 年底發(fā)布 Xe 架構(gòu)到推出基于 Xe 架構(gòu)的集成 GPU 和獨(dú)立 GPU 產(chǎn)品,以及用于數(shù)據(jù)中心獨(dú)顯產(chǎn)品,間隔時(shí)間不到一年,就兌現(xiàn)了產(chǎn)品交付計(jì)劃。
事實(shí)上,Xe 架構(gòu)作為一個(gè)基礎(chǔ) GPU 架構(gòu),屬性靈活且擴(kuò)展性強(qiáng),能夠衍生出多種針對(duì)不同領(lǐng)域和場(chǎng)景的 GPU 產(chǎn)品。
在英特爾 2020 年架構(gòu)日上,英特爾官方首次詳細(xì)介紹了可實(shí)現(xiàn)全擴(kuò)展的 Xe 圖形架構(gòu)。按照不同的應(yīng)用場(chǎng)景分,可將 Xe 架構(gòu)分成四個(gè)系列:Xe LP、Xe HP、Xe HPC 和 Xe HPG。
Xe LP 屬于低功耗系列,是針對(duì) PC 和移動(dòng)計(jì)算平臺(tái)的最高效架構(gòu),最高配置 EU 單元多達(dá) 96 組,并具有新架構(gòu)設(shè)計(jì),包括異步計(jì)算、視圖實(shí)例化 (view instancing)、采樣器反饋(sampler feedback)、帶有 AV1 的更新版媒體引擎以及更新版顯示引擎等。
TigerLake SoC 里集成的 GPU、英特爾銳炬 Xe MAX 獨(dú)立顯卡和此次發(fā)布的面向數(shù)據(jù)中心的獨(dú)顯產(chǎn)品均采用這一架構(gòu)。
作為首批使用英特爾首款數(shù)據(jù)中心獨(dú)顯產(chǎn)品的客戶之一,騰訊先游云游戲總經(jīng)理方亮認(rèn)為:“SG1 的編碼能力非常強(qiáng),它能夠提供一個(gè)高密度、低延遲、靈活多樣的視頻編碼能力,另外在我們所測(cè)試的產(chǎn)品中,英特爾 SG1 的性價(jià)比高,英特爾技術(shù)團(tuán)隊(duì)的支持也非常給力。”
Xe HP 屬于高性能系列,是業(yè)界首個(gè)多區(qū)塊(multi-tiled)、高度可擴(kuò)展的高性能架構(gòu),可提供數(shù)據(jù)中心級(jí)、機(jī)架級(jí)媒體性能,GPU 可擴(kuò)展性和 AI 優(yōu)化。目前處于同客戶共同測(cè)試的階段,Xe HP 產(chǎn)品將于明年推出。
Xe HPC 屬于高性能計(jì)算系列,可用于超級(jí)計(jì)算機(jī)。Xe HPG 是一種為游戲優(yōu)化的微架構(gòu),將具有加速的光線跟蹤支持,Xe HPG 產(chǎn)品預(yù)計(jì)將于 2021 年開(kāi)始發(fā)貨。
3、天下大同 oneAPI,實(shí)現(xiàn) XPU 的“靈魂互通”
一般而言,基于底層硬件架構(gòu)的不同,完成同一項(xiàng)開(kāi)發(fā)往往需要開(kāi)發(fā)者使用不同的代碼重寫一次,需要付出極大的人力成本和財(cái)力成本。如果將硬件層面 XPU 的實(shí)現(xiàn)比喻成一個(gè)語(yǔ)言互不相通的團(tuán)隊(duì),那么要想更好地釋放團(tuán)體的真正實(shí)力,還需要一臺(tái)能夠降低隊(duì)員們溝通成本,甚至能夠?qū)崿F(xiàn)“靈魂互通”的機(jī)器。
雖然從生物算法的角度,目前還沒(méi)有辦法實(shí)現(xiàn)意識(shí)和“靈魂”的交換和交流,計(jì)算機(jī)應(yīng)用程序的跨平臺(tái)優(yōu)化也一直是業(yè)界難點(diǎn),但對(duì)于 XPU 而言,英特爾已經(jīng)開(kāi)發(fā)出幫助 XPU 團(tuán)隊(duì)釋放真正實(shí)力的工具,即英特爾軟件級(jí) oneAPI 工具包。
英特爾官方表示,如果用上了 oneAPI 工具包,開(kāi)發(fā)者就能夠訪問(wèn)英特爾 XPU 的通用、開(kāi)放且基于行業(yè)標(biāo)準(zhǔn)高的編程模型,釋放底層硬件性能的同時(shí)降低軟件開(kāi)發(fā)和維護(hù)成本。
?
同時(shí),Jeff 也告訴雷鋒網(wǎng):“oneAPI 能夠把人們熟悉的語(yǔ)言和庫(kù)上的代碼,比如所有目前已經(jīng)在至強(qiáng)處理器上運(yùn)行的代碼,無(wú)縫地遷移到 GPU 和其他的架構(gòu)上。所以它確實(shí)有很多好處,比如代碼重用,能夠利用現(xiàn)有的庫(kù)等等。如果你已經(jīng)熟悉了一些庫(kù),比如 TBB 和其他來(lái)自英特爾的庫(kù),我們把它們進(jìn)行了擴(kuò)展以支持多種架構(gòu)。這樣已經(jīng)使用過(guò)這些庫(kù)的開(kāi)發(fā)者可以繼續(xù)做開(kāi)源,支持 GPU 和其他 XPU 架構(gòu)?!?/p>
“oneAPI 讓你不必有兩種不同的配置,兩種不同的構(gòu)建,但是能夠在設(shè)計(jì)點(diǎn)之間為完全相同的服務(wù)提供一些靈活性?!庇⑻貭枖?shù)據(jù)平臺(tái)事業(yè)部副總裁,視覺(jué)基礎(chǔ)架構(gòu)事業(yè)部和 NPG 戰(zhàn)略總經(jīng)理 LynnComp 補(bǔ)充道。
oneAPI 是英特爾在 SuperComputing2019 大會(huì)上首次提出且為實(shí)現(xiàn)統(tǒng)一、簡(jiǎn)化的跨架構(gòu)編程模型的一個(gè)愿景,即不受限于單一廠商專用的代碼構(gòu)建,且能實(shí)現(xiàn)源有代碼的集成。借助 oneAPI,開(kāi)發(fā)者可以針對(duì)他們要解決的特定問(wèn)題選擇最佳的加速器架構(gòu),且無(wú)需為此一個(gè)架構(gòu)和平臺(tái)再重寫軟件。
英特爾初次提出這一愿景時(shí),很多人認(rèn)為其實(shí)現(xiàn)難度大,能夠完成的可能性幾乎為零。但今天英特爾卻如期交付了 oneAPI 開(kāi)發(fā)者工具包,足以證明其軟件實(shí)力。
英特爾宣布,英特爾 oneAPI 工具包將于 12 月在本地和英特爾 DevCould 上免費(fèi)提供,同時(shí)還將提供包括英特爾技術(shù)咨詢工程師全球支持的商業(yè)版本。英特爾還會(huì)將英特爾 Parallel Studio XE 和英特爾 System Studio 工具套件遷移到 oneAPI 產(chǎn)品中。
?
值得一提的是,即便沒(méi)有使用英特爾的芯片,oneAPI 也能包容和支持,具有實(shí)現(xiàn)“天下大同”的能力,擁有廣泛的生態(tài)系統(tǒng),這也促使 oneAPI 得到更加廣泛的業(yè)界支持。近期,微軟 Azure 和谷歌的 TensorFlow 已經(jīng)宣布支持 oneAPI,眾多領(lǐng)先的研究機(jī)構(gòu)、公司和大學(xué)也支持 oneAPI。
4、雷鋒網(wǎng)小結(jié)
從收購(gòu) FPGA 公司到吸納圖形處理器頂尖人才,從發(fā)展單一架構(gòu)到定義 XPU 時(shí)代,從 Xe 架構(gòu)提出到如期交付產(chǎn)品,近些年英特爾一直在釋放大數(shù)據(jù)潛力的產(chǎn)業(yè)領(lǐng)域探索,如今成長(zhǎng)為業(yè)界唯一一家能夠提供 XPU 芯片的全能性公司,且能為其應(yīng)將提供相適配的軟件、應(yīng)用程序和生態(tài),英特爾在數(shù)據(jù)在數(shù)據(jù)中心擁有獨(dú)一無(wú)二的實(shí)力。
未來(lái)的英特爾,又會(huì)在實(shí)現(xiàn) XPU 的路上取得什么樣的成績(jī)呢?