美國謀求重新奪回超級計算機霸主地位;
IBM 終于開始出貨其獨具風(fēng)格的 Power9 處理器;
英偉達的 Volta GPU 將成為 Summit 和 Sierra 的主力計算單元。
美國欲憑借 Summit 超級計算機重回世界之巔
計算機領(lǐng)域的軍備競賽對國際關(guān)系和地緣政治的影響和其它任何常規(guī)軍備競賽一樣重要。這是一場關(guān)于打造出全球最快的超級計算機的競賽。擁有最快的超級計算機不僅僅關(guān)乎民族自豪感,它還具備貨真價實的經(jīng)濟、政治和軍事利益。超級計算機有諸多用武之地,不僅可以用于大范圍地區(qū)的天氣預(yù)報,還可以用于核武器的建模和設(shè)計。
目前,世界上最快的超級計算機是中國的神威·太湖之光,其運算能力能夠達到驚人的 93 PetaFLOPS,即每秒執(zhí)行 93×10 ^ 15 次浮點運算。 2018 年,美國計劃在田納西州的橡樹嶺國家實驗室(ORNL)打造出超過神威·太湖之光的超級計算機。這臺名為 Summit 的超級計算機的運算能力將達到 200 PetaFLOPS,同時,加利福尼亞州的勞倫斯利弗莫爾國家實驗室也正在建造一個設(shè)計上與 Summit 類似的姊妹計算機 Sierra。
Summit 由大約 4600 個“節(jié)點”組成,這些節(jié)點基本上都是機架式服務(wù)器。雖然 Summit 的計算能力將比其前任強大 5-10 倍,但它的節(jié)點只有前任的 1/4,而且耗電量也大大降低。
這臺超級計算機這么強悍,靠的是這些節(jié)點的特殊內(nèi)在。每個節(jié)點都包含一個由 IBM 設(shè)計的專用 HPC(高性能計算)服務(wù)器。 該節(jié)點包含兩個 IBM Power9 處理器、六個英偉達的 Tesla V100 SXM2 GPU 加速器,而且整個盒子采用水冷設(shè)計,如文章頂部的硬件照片所示。該硬件最近曾在全球超算大會 SC17 上展出過。
IBM 系統(tǒng)的獨特之處在于,每個 Power9 處理器都通過英偉達專有的高速 NVLink 數(shù)字接口直接與英偉達的 GPU 通信。 這種內(nèi)置功能是 Power9 獨有的,可通過 NVLink 2.0 實現(xiàn) 100 GB/ 秒的吞吐能力。
如 Tom 硬件的圖中所示,整個系統(tǒng)架構(gòu)廣泛使用 NVLink 連接各個 Power9 處理器、各個 GPU,并將 GPU 和 Power9 處理器互相連接在一起。
在實際工作中,由這些 Power9 處理器協(xié)調(diào)每個節(jié)點的計算流程,Tesla V100 則負責(zé)繁重的計算工作。IBM 將 NVLink 2 接口集成到芯片上這個設(shè)計決策表明它深諳高性能計算的發(fā)展方向。IBM 并沒有抗拒越來越流行使用 GPU 進行計算的趨勢,而是明智地選擇了它。
IBM 終于開始出貨其獨具一格的 Power9 處理器
每顆 Power9 處理器本身就是一臺功能強大的計算機,最多可包含 24 個處理器內(nèi)核,每個內(nèi)核可以并行執(zhí)行四個線程,Power9 支持 96 個線程的并行計算。此外,每顆 Power9 還支持 48 路 PCIE 4.0 通道和 8 個內(nèi)存通道。
IBM 的 Power 處理器系列基于 PowerPC RISC 架構(gòu),曾經(jīng)用在蘋果的 Mac 電腦上,當(dāng)蘋果公司改用英特爾的 x86 處理器后,IBM 將重點放在了服務(wù)器市場上。
客戶早就對 Power9 望眼欲穿,IBM 去年發(fā)布了這顆芯片,人們普遍預(yù)計 IBM 將在 2017 年年底出貨這顆芯片。根據(jù)目前得到的消息,Power9 已經(jīng)應(yīng)用在 Sierra 和 Summit 上,但是 IBM 并沒有公布 Power9 全面供貨的信息,現(xiàn)在業(yè)界認為該芯片可能于 2018 年初上市銷售。
Power9 是一個龐大無比的芯片,這可能是它遲遲沒有面世的原因。 Power9 現(xiàn)在采用格羅方德的 14 納米制程制造。它可能是格羅方德試圖在其 14 納米節(jié)點工藝上制造的最大的芯片,所以,如果產(chǎn)能和良率達不到 IBM 的預(yù)期,我一點都不會感到驚訝。同樣影響產(chǎn)能和良率的一個因素是,Power9 是一顆龐大而且復(fù)雜的高性能芯片。
英偉達 Volta GPU 將成為 Summit 和 Sierra 的主力計算單元
Summit 和 Sierra 都將使用相似的搭載雙 Power9 處理器的 IBM HPC 計算機,它們兩個的主要區(qū)別在于 Sierra 每個節(jié)點只有四個 Tesla V100 GPU,而 Summit 每個節(jié)點包含六個 Tesla V100 SXM2 GPU。雖然 GPU 數(shù)量更少,但是這種設(shè)計方式可以實現(xiàn) CPU 和 GPU 之間 150 GB/ 秒的 NVLink 2 通信速度,從而提高吞吐能力。
Tesla V100 中的每個 GV100 GPU 都比 Power9 更加龐大,正是因為每個 V100 都需要消耗 300 瓦的功率,才使用了昂貴的水冷解決方案。據(jù)預(yù)計,整個 Summit 的的功耗為 13 兆瓦,而擁有 4000-5000 個節(jié)點的 Sierra 的功耗為 11 兆瓦。就所有實際應(yīng)用而言,Summit 和 Sierra 的計算能力大小主要取決于 Tesla V100 GPU 的能力限制。
從美國這兩款超級計算機可以一窺英偉達 V100 GPU 的市場機會。這兩個系統(tǒng)將使用超過 45,000 個 V100 GPU,美國能源部的一位客戶表示,每顆 V100 GPU 的價格在 8000 美元左右,這兩臺超級計算機為 Tesla V100 貢獻的銷售額就超過了 3.6 億美元。
IBM 和英偉達很可能會成為全球超級計算領(lǐng)域的強勢存在,并持續(xù)受益于永無休止的打造更快超級計算機的軍備競賽。
?
更多有關(guān)超級計算機的資訊,歡迎訪問 與非網(wǎng)超級計算機專區(qū)
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!