• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

驍龍855/麒麟980/蘋果A12/聯(lián)發(fā)科P60/瑞芯微RK3399,誰能領(lǐng)跑AI時代?

原創(chuàng)
2018/12/14
448
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

?

2018 年,AI 幾乎充斥了我們的生活,如果見朋友不聊點和 AI 相關(guān)的話題,似乎自己就與這個時代脫節(jié)了,近期高通驍龍 855 的發(fā)布再次把 AI 的關(guān)注度推向了高潮,從權(quán)威統(tǒng)計機構(gòu)的預(yù)測來看,2018 年全球 AI 市場規(guī)模預(yù)計為 1.2 萬億美元,到 2022 年有望達到 3.9 萬億美元。AI 勢不可擋的發(fā)展勢頭讓各大科技公司不得不一擁而上,不管是做芯片還是做產(chǎn)品,統(tǒng)統(tǒng)都要和 AI 掛鉤,大有“得 AI 者得天下”之勢。AI 已經(jīng)在各個領(lǐng)域開始滲透,光 AI 音箱這一種亞馬遜、天貓、小米就打得不可開交,其它智能電子產(chǎn)品更是不勝枚舉,當(dāng)然,這都不是今天的重點,今天我主要想談的是 AI 芯片,今年推出的這些 AI 芯片看看哪些比較靠譜。

目前,筆者知曉的 AI 芯片有驍龍 855、麒麟 980、蘋果 A12、聯(lián)發(fā)科 P60、紫光展銳 SC9863A 和瑞芯微 RK3399Pro,誰強誰弱先拉出來比一比:

1、驍龍 855:張量加速器不等于獨立 NPU
驍龍 855 采用臺積電 7nm 工藝制程,CPU 為 Kryo485(超級內(nèi)核基于 A76 定制主頻 2.84GHz、性能內(nèi)核主頻 2.42GHz、效率內(nèi)核主頻 1.8GHz,1+3+4 架構(gòu));GPU 為 Adreno640,與前代產(chǎn)品相比,渲染速度提升 20%,支持 Vulkan1.1/HDR/PBR。


驍龍 855

在 AI 性能方面,驍龍 855 加入新的張量加速器(TensorAccelerator),專門負(fù)責(zé) AI,組成第四代 AI 引擎。可以實現(xiàn)每秒超過 7 萬億次運算(7TOPs),AI 性能比驍龍 845 提高了 3 倍,比蘋果 A12 每秒 5 萬億次運算(5TOPs)也高出不少。
?
高通的 DSP 數(shù)字信號處理器升級為最新的 Hexagon690,具備四線程標(biāo)量內(nèi)核,性能提升 20%,四個向量擴展核心(HVX),性能提升 1 倍,另外一個重要的改進是引入了張量加速器(HTA),自主設(shè)計,專為 AI 而設(shè),支持多元數(shù)學(xué)運算、非線性方程、INT16/INT8 與混合精度整數(shù)運算,大幅提升了機器學(xué)習(xí)算法的性能和能效。結(jié)合 HexagonDSP、新的張量加速器,再借助更強的 GPU 和 CPU 完成終端側(cè)神經(jīng)網(wǎng)絡(luò)運算,所有單元綜合實現(xiàn)了專有的、可編程的 AI 加速。

但是,值得注意的是,驍龍 855 并沒有配置獨立 NPU 單元,其 AI 運算需要協(xié)調(diào) CPU、DSP、GPU 等處理器單元,如果應(yīng)用場景復(fù)雜,恰巧占用了這些處理單元,AI 運算就要排隊等候。也就是,其他公司的芯片的人工智能算力是獨立算力,高通的 AI 運算是綜合算力。

2、麒麟 980: 配置雙 NPU
麒麟 980 采用 7nm 工藝制程,基于 ARM 的 A76 架構(gòu),主頻是 2.6GHz,八核心分別是 2×A76(超大核)+2×A76(大核)+4×A55(小核),其中 A76 四個核心上采用了智能調(diào)度機制。相對于傳統(tǒng)的大小核兩檔位設(shè)計,麒麟 980 讓 CPU 在重載、中載、輕載場景下靈活適配。

在 AI 配置上,麒麟 970 搭載了一個 NPU(神經(jīng)處理單元),其專門負(fù)責(zé) AI 運算,在大幅提高手機 AI 性能的同時降低了 AI 任務(wù)功耗。麒麟 980 則配置了兩個 NPU,因此在 ResNet-50 圖像識別測試中得到了 4500 張每分鐘的成績。整體來看,相較于麒麟 970,麒麟 980 的 CPU 性能提升 75%,能效提升 58%,內(nèi)置的 10 核 GPU Mali-G76 讓性能密度號稱提升 30%,能效提升 30%。

3、蘋果 A12:搭載 8 核神經(jīng)網(wǎng)絡(luò)引擎
A12 采用 7nm 技術(shù),內(nèi)部有 69 億個晶體管,采用六核 CPU 設(shè)計,相比 A11 處理器,其中兩個大核心性能提速 15%、功耗降低了 40%,四個小核心功耗降低最多 50%。A12 采用自研四核 GPU,性能相比 A11 的 GPU 性能提高 50%,并強化了對 AR 混合現(xiàn)實的支持,支持曲面細分、無損內(nèi)存壓縮和實時多層渲染功能,AR 性能獲得大幅度提升。

關(guān)于 AI 性能,蘋果 A12 還搭載了八核神經(jīng)網(wǎng)絡(luò)引擎,其運算速度達每秒 5 萬億次,遠超 A11 的每秒六千萬次,可以更獨立機器學(xué)習(xí),支持多精度,智能計算系統(tǒng)。同時,蘋果還將神經(jīng)網(wǎng)絡(luò)引擎開放給 Core?ML 平臺,開發(fā)者可將機器學(xué)習(xí)技術(shù)應(yīng)用到自己的 app 中,讓學(xué)習(xí)過程在用戶的 iPhone 上進行。提升了 Siri 易用性、使 A12 芯片的機器學(xué)習(xí)能力相比之前能夠提升 9 倍,而能耗則降低到原來的十分之一。

4、聯(lián)發(fā)科 Helio P60
聯(lián)發(fā)科 Helio P60 采用 ARM Cortex A73 和 A53 大小核架構(gòu),采用八核心大小核(big.LITTLE)架構(gòu),內(nèi)建四顆 ARM A73 2.0 Ghz 處理器與四顆 ARM A53 2.0 Ghz 處理器。相較于上一代產(chǎn)品 P23 與 P30,CPU 及 GPU 性能均提升 70%。采用 12nm FinFET 制程工藝,功耗表現(xiàn)得到很大提升,整體效能提升 12%,執(zhí)行大型游戲時的功耗降低 25%,大幅延長手機電池的使用時間。

關(guān)于 AI 配置,聯(lián)發(fā)科在 P60 中引入了 AI 單元 APU,在 P60 中采用了三核 ISP+雙核 APU 的架構(gòu),性能提升兩倍。ISP+APU 的多核圖像處理單元除了提供硬件加速之外,還能夠提供多線程的處理能力,這使得對于圖片處理能力和速度大幅提升。包括自動對焦、白平衡以及高規(guī)格 HDR 在內(nèi)等反映的速度更快。此外,APU 的引入以及聯(lián)發(fā)科提供的平臺化的策略,也更有利于開放給合作伙伴以及第三方進行拍照的后處理,定制更多的拍照算法。應(yīng)該說 AI 的引入,使得 P60 的硬件性能進一步得到釋放。與此同時,AI 所帶來的軟件層面的超級算力也將帶來諸如人臉、語音識別等功能的進一步增強。

?

5、紫光展銳 SC9863
紫光展銳 SC9863 主打 AI 牌,被稱為 8 核 AI 芯片,支持 CAT-7,采用 Arm Cortex-A55 處理器架構(gòu)的 SoC 芯片平臺,在 Cortex-A55 人工智能的基礎(chǔ)上,進行了應(yīng)用開發(fā)。Cortex-A75 與 Cortex-A55 均采用 Arm DynamlQ 技術(shù)打造,而 DynamlQ 融入了 AI 神經(jīng)網(wǎng)絡(luò)技術(shù)。相比前代 Cortex-A53,Cortex-A55 NEON 進行了流水線改進與新增機器學(xué)習(xí)指令,讓其在矩陣乘法運算方面的機器學(xué)習(xí)性能大幅提升,如果按照 AI 8bit dot-product 運算能力,比 Cortex-A53 提升 6 倍。

同時,得益于 ARM DynamlQ 單簇組合方式,Cortex-A75 與 Cortex-A55 可實現(xiàn) 1+3、1+7 或者 4 個大核、8 個小核的組合,多個 CPU 核芯以單簇的方式一起工作,可發(fā)揮更強大的性能,避免“1 核有難,7 核圍觀”的狀況。紫光展銳 SC9863 采用的是 8 核 Cortex-A55 的組合方式,而高通驍龍 845 是 4 核 Cortex-A75 與 4 核 Cortex-A55 的組合方式。

SC9863 芯片平臺的 AI 能力體現(xiàn)在支持基于深度神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù),可實現(xiàn)快速精準(zhǔn)的人臉認(rèn)證;通過智能 AI 算法,實現(xiàn)實時智能場景檢測識別、不同場景智能拍照增強、支持手機側(cè)圖庫照片的智能識別與分類。但是,沒有加入獨立的神經(jīng)處理單元,計算能力是否會出現(xiàn)折扣不得而知。

6、瑞芯微 RK3399
RK3399Pro 采用 big.LITTLE 大小核 CPU 架構(gòu),雙核 Cortex-A72+四核 Cortex-A53+四核 ARM 高端 GPU Mali-T860,其集成的 NPU(神經(jīng)網(wǎng)絡(luò)處理器)融合了 Rockchip 在機器視覺、語音處理、深度學(xué)習(xí)等領(lǐng)域的多年經(jīng)驗。相較傳統(tǒng)芯片,典型深度神經(jīng)網(wǎng)絡(luò) Inception V3、ResNet34、VGG16 等模型在 RK3399Pro 芯片上的運行效果表現(xiàn)出眾。

RK3399Pro 的 AI 特性有三點:
1)AI 硬件性能高,采用專有 AI 硬件設(shè)計,NPU 運算性能高達 2.4TOPs,高性能與低功耗指標(biāo)均大幅領(lǐng)先:相較同類 NPU 芯片性能領(lǐng)先 150%;相較 GPU 作為 AI 運算單元的大型芯片方案,功耗不到其所需的 1%;
2)平臺兼容性,RK3399Pro 的 NPU 支持 8bit 與 16bit 運算,能夠兼容各類 AI 軟件框架。現(xiàn)有 AI 接口支持 OpenVX 及 TensorFlowLite/AndroidNN API,AI 軟件工具支持對 Caffe/TensorFlow 模型的導(dǎo)入及映射、優(yōu)化;
3)完整方案易于開發(fā),Rockchip 基于 RK3399Pro 芯片提供一站式 AI 解決方案,包括硬件參考設(shè)計及軟件 SDK,可大幅提高全球開發(fā)者的 AI 產(chǎn)品研發(fā)速度,并極大縮短產(chǎn)品上市時間。

從以上六款帶有 AI 功能的芯片來看,在架構(gòu)上基本都是采用了多核模式,以八核為主;另外,關(guān)于 AI 運算,在原有 CPU、GPU 的基礎(chǔ)上增加獨立神經(jīng)元計算處理單元成為主流趨勢,這樣可以實現(xiàn) AI 運算加速,從而帶來更好的用戶體驗;在應(yīng)用方面,還是以手機的人臉識別、圖像處理為主,未來隨著 5G 的商用,在自動駕駛汽車中的應(yīng)用也會逐漸增加。

從對比中可以看出,國產(chǎn)廠商和國內(nèi)廠商各占一半,從高端到低端均有覆蓋,在獨立神經(jīng)元計算單元的集成上,只有海思、蘋果、聯(lián)發(fā)科的產(chǎn)品上已經(jīng)實現(xiàn),其它幾家廠商還在追趕。由于智能手機強烈的市場需求,因此 AI 普及起來更為順暢,但是目前需要在人臉識別和圖像處理的基礎(chǔ)上探索更多可能的應(yīng)用。

與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!

高通

高通

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設(shè)于美國加利福尼亞州圣迭戈市,高通的基礎(chǔ)科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術(shù)研發(fā)的領(lǐng)先企業(yè),已經(jīng)向全球多家制造商提供技術(shù)使用授權(quán),涉及了世界上所有電信設(shè)備和消費電子設(shè)備的品牌。在中國,高通開展業(yè)務(wù)已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網(wǎng)、大數(shù)據(jù)、軟件、汽車等眾多行業(yè)。

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設(shè)于美國加利福尼亞州圣迭戈市,高通的基礎(chǔ)科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術(shù)研發(fā)的領(lǐng)先企業(yè),已經(jīng)向全球多家制造商提供技術(shù)使用授權(quán),涉及了世界上所有電信設(shè)備和消費電子設(shè)備的品牌。在中國,高通開展業(yè)務(wù)已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網(wǎng)、大數(shù)據(jù)、軟件、汽車等眾多行業(yè)。收起

查看更多

相關(guān)推薦