8月2日,UCIe(通用芯粒高速互連)聯(lián)盟宣布阿里巴巴和英偉達新當選董事會成員,加上此前的創(chuàng)始成員日月光半導體、AMD、Arm、谷歌云、英特爾、Meta、微軟、高通、三星、臺積電,該聯(lián)盟董事會成員拓展到12家。阿里巴巴也成為首家加入UCIe董事會的中國大陸企業(yè)。
UCIe定義了封裝內(nèi)Chiplet(芯?;蛐?a class="article-link" target="_blank" href="/tag/%E8%8A%AF%E7%89%87/">芯片)之間的互連標準,以打造開放的芯粒生態(tài)系統(tǒng)并更好地支持芯片之間的高速互連。英特爾、AMD、英偉達等主流通用處理器供應商與云廠商積極組建、加入UCIe聯(lián)盟,也令Chiplet的生態(tài)漸行漸近。
通用處理器企業(yè)的技術儲備
如何在制程工藝之外開辟一條繼續(xù)提升處理器性能的道路,并使處理器功能更加定制化,覆蓋云服務、深度學習、元宇宙等層出不窮的高性能計算需求,已經(jīng)成為頭部芯片廠商進行技術研發(fā)和儲備的重要考量。此次英偉達加入UCIe董事會,也顯示出主流通用處理器廠商對Chiplet的重視。
各類先進封裝市場營收占比(2016-2022,單位:10億美元)
來源:Yole
對于英特爾而言,Chiplet是延續(xù)摩爾定律的技術路線和IDM 2.0戰(zhàn)略的重要組成。英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera表示,半導體行業(yè)的未來是將多個芯粒集成到一個封裝中,以實現(xiàn)跨細分市場的產(chǎn)品創(chuàng)新,這也是英特爾IDM 2.0戰(zhàn)略的重要一環(huán)。英特爾的3D Foveros封裝可以把不同計算功用的小芯片在垂直層面上進行封裝,實現(xiàn)更小更簡單的電路和更快的芯片互聯(lián)速度。結合英特爾的封裝微縮技術,F(xiàn)overos能進一步縮短封裝凸點(裸芯片連接點)的間距,以提升芯片之間和總線的傳輸速率。
AMD也在基于Chiplet技術,推行模塊化的SoC設計理念。早在2019年發(fā)布的7nm Zen2架構銳龍?zhí)幚砥髦?,AMD就采用了Chiplet設計,將不同工藝、不同架構的芯片電路按需搭配,實現(xiàn)更加靈活的配置。AMD面向CPU與GPU互聯(lián)的Infinity架構也在第四代版本中支持AMD IP和第三方小芯片的無縫集成。在GPU領域,AMD面向數(shù)據(jù)中心圖形的CDNA 3架構在單個封裝中結合了5nm小芯片,面向游戲的5nm GPU架構RDNA 3也融入了Chiplet設計,預計每瓦性能提升超50%。
“Chiplet的主要功能就是通過將單芯片中的功能塊分拆出來,通過模塊化封裝實現(xiàn)高集成度單芯片功能,可以用相對成熟的工藝制程去做、成本更低,同時可以實現(xiàn)更短的產(chǎn)品開發(fā)周期,實現(xiàn)更快的產(chǎn)品迭代。” 芯謀研究分析師張先揚向《中國電子報》表示。
而向來專注GPU的英偉達,在近兩年推出DPU和Grace CPU之后,顯然也有了在異構計算領域的布局需求。尤其Grace CPU在設計之初就充分考慮了與英偉達GPU的耦合,英偉達為此推出了提供“CPU+GPU一致性內(nèi)存模型”的NVLink技術。此次加入UCIe聯(lián)盟董事會,顯示出英偉達進一步提升GPU、CPU和DPU等芯片集成密度和配置靈活性的意向,未來或?qū)⑴c英特爾、AMD一樣,推出更多面向消費電子和高性能計算的SoC產(chǎn)品。
云廠商融入Chiplet生態(tài)
自研服務器處理器乃至加速器,正在成為頭部云廠商的同步動作。相比第三方的通用芯片,自研的定制化芯片能夠使硬件性能與云廠商各自的業(yè)務更加匹配,進而實現(xiàn)效能的提升。頭部云廠商還可以基于自身的業(yè)務特點和功能需求進行IP的開發(fā)和儲備,進而降低芯片的開發(fā)和部署成本。同時,定制化的芯片有利于云廠商形成軟硬件閉環(huán),更好地保護客戶的數(shù)據(jù)安全。
來源:IDC
UCIe聯(lián)盟的創(chuàng)始成員谷歌云和本次加入董事會的阿里巴巴,都是“為云造芯”的行家里手。
谷歌研發(fā)的TPU被廣泛應用于谷歌翻譯、搜索、相冊等產(chǎn)品以及圍棋機器人Alpha Go的學習模型訓練和計算加速。這種定制化的芯片針對機器學習的工作負載加速進行了優(yōu)化,支持研究人員、開發(fā)者和企業(yè)構建可使用CPU、GPU和TPU的TensorFlow(端到端開源機器學習平臺)計算集群。谷歌于2018年向云客戶開放了TPU的beta版本,其2021年發(fā)布的TPUv4 可通過4096個TPUv4單芯片組成的POD運算集群釋放高達1exaflop(每秒10的18次方浮點運算)的算力。
阿里巴巴在云端有著相對豐富的自研芯片品類。2021年,阿里巴巴旗下半導體公司平頭哥發(fā)布自研ARM服務器芯片倚天710,采用5nm工藝,含128核CPU,面向云場景的高并發(fā)、高性能和高能效需求進行設計和優(yōu)化。今年6月,阿里云發(fā)布自研CIPU,其定位是用于加速和管控計算資源的數(shù)據(jù)中心專用處理器,以進一步提升數(shù)據(jù)中心的計算、網(wǎng)絡和存儲效率。
目前,阿里云已建立芯片、服務器、飛天操作系統(tǒng)等軟硬一體的自研基礎設施。
在不斷積累研發(fā)底蘊的同時,云廠商要為客戶提供更加豐富且定制化的產(chǎn)品組合,就需要繼續(xù)拓展硬件的產(chǎn)品矩陣。
Chiplet不依賴先進制程提升產(chǎn)品性能,且能夠兼容多種IP、芯片的特性,會讓云廠商的硬件開發(fā)更加靈活高效。
“Chiplet降低了云廠商的芯片設計門檻,能讓廠商更高效地把產(chǎn)品定義落實到芯片層面。” 開源證券副所長、電子行業(yè)首席分析師劉翔向《中國電子報》表示。
而云廠商的加入,也讓Chiplet產(chǎn)業(yè)更緊密地結合用戶企業(yè),有利于產(chǎn)業(yè)生態(tài)的成熟。
“云服務廠商對高性能計算芯片需求不斷攀升,高性能計算和數(shù)據(jù)中心市場對異構集成有著明確的需求。在市場需求的推動下,Chiplet生態(tài)將進一步加速完善。”賽迪顧問集成電路產(chǎn)業(yè)研究中心總經(jīng)理滕冉向《中國電子報》指出。
Chiplet生態(tài)標準需持續(xù)完善
從云服務廠商、芯片代工廠、系統(tǒng)原始設備制造商、芯片IP供應商和芯片設計公司紛紛加入UCIe聯(lián)盟,不難看出計算產(chǎn)業(yè)對于Chiplet標準建設和生態(tài)構建的期許。UCIe聯(lián)盟主席Debendra Das Sharma表示,目前已經(jīng)有超過60家企業(yè)加入了聯(lián)盟。
UCIe等標準的出現(xiàn),讓Chiplet能夠結合計算產(chǎn)業(yè)各個環(huán)節(jié)的需求,更好地優(yōu)化技術標準。目前來看,UCIe的技術指標還有進一步提升的空間。
“UCle集聚了一批產(chǎn)業(yè)龍頭企業(yè),并推動他們與用戶企業(yè)聯(lián)合,可以更快推動Chiplet技術的發(fā)展。目前UCle標準可以實現(xiàn)的時延遲和傳輸性能還有很大的進步空間,以蘋果為例,UCle對比蘋果的Chiplet技術能力,還有較大差距。Chiplet封裝的工藝也需要不斷完善以實現(xiàn)更高的產(chǎn)品性能。”張先揚說。
同時,人工智能、虛擬仿真、物聯(lián)網(wǎng)等技術,使高性能計算不斷涌現(xiàn)新的需求和場景,Chiplet的行業(yè)規(guī)范和標準也需要與時俱進,覆蓋更多場景需求。
“目前大型芯片企業(yè)都推出了基于Chiplet的產(chǎn)品,但各家廠商的互聯(lián)標準都是私有協(xié)議,限制了不同企業(yè)的Chiplet的融合使用,提升了行業(yè)進入門檻。UCIe聯(lián)盟的建立意在打造Chiplet通用互聯(lián)標準,提供高帶寬、低延遲、高性價比的芯片封裝連接。在標準制定方面,Chiplet技術還在不斷演進,行業(yè)標準需要緊跟技術發(fā)展、市場需求的變化動態(tài)調(diào)整。” 滕冉說。
作者丨張心怡
編輯丨邱江勇
美編丨馬利亞
監(jiān)制丨連曉東