金融高頻交易場景中,主流的自營交易公司、對沖基金、經紀公司和交易所等都在利用強大的計算機系統(tǒng)和復雜算法在極短的時間內執(zhí)行大量交易。這是一場超低時延的競速賽,對于最高頻交易來說,一納秒差別可能就意味著百萬美元的盈虧。正因如此,尋求創(chuàng)新方法來優(yōu)化tick-to-trade延遲(從接收市場數(shù)據(jù)到執(zhí)行交易訂單所需的時間),是獲得競爭優(yōu)勢的關鍵。
專為實現(xiàn)超低延遲性能而打造的FPGA加速卡
高頻交易主要有三大特點:首先,交易執(zhí)行要求低時延,幾微秒之差可能就是盈利幾百萬美元和虧損之間的差別。第二,基礎設施非常關鍵,要進行高頻交易經常需要在交易所租用服務器,實現(xiàn)服務器共置來獲得優(yōu)勢。很多高頻交易公司都是在非常接近交易所的地方或是在交易所部署基礎設施。此外,不論是基礎設施,還是產品尺寸、機架上服務器的數(shù)量,對于高頻交易來說也非常重要。第三,算法也能夠給高頻交易帶來優(yōu)勢,通過不斷演進的算法打造差異化優(yōu)勢,能夠幫助交易商實現(xiàn)監(jiān)管合規(guī),這對效率也非常重要。
結合上述需求,AMD日前推出了Alveo UL3422金融科技加速卡,將超低延遲網絡與自適應硬件相結合,能夠推動交易策略以納秒級速度加速執(zhí)行。它主要有三大亮點:超低時延,滿足對速度要求最嚴苛的交易執(zhí)行;纖薄尺寸規(guī)格,可實現(xiàn)極具性價比的部署;易于開發(fā),可實現(xiàn)快速交易。
亮點一:超低時延,納秒級加速執(zhí)行
AMD Alveo UL3422加速卡基于Virtex UltraScale+ VU2P FPGA,并采用全新的收發(fā)器架構。該FPGA結構能夠在進行16位操作時達到644MHz的時鐘速度,可高效傳輸市場數(shù)據(jù)。該器件還集成了固化的以太網MAC和PCS IP,可實現(xiàn)超低延遲數(shù)據(jù)傳輸和控制管理,并簡化了ULL交易的時序收斂。該卡的FPGA和收發(fā)器架構配有兩個網絡端口,分別支持10Gb/s和25Gb/s數(shù)據(jù)傳輸速率,符合大多數(shù)市場交易所的運行標準。
值得一提的還有,Virtex UltraScale+ VU2P FPGA基于前幾代進行了架構上的顯著提升,采用的是GTF收發(fā)器,比之前的GTY提升了約7倍性能。由于實現(xiàn)了最大程度的硬化,從而將tick-to-trade時延降低了40%-49%,相當于13.9納秒。對于金融交易來說,這是一個巨大的優(yōu)勢。
其中,GTF與GTY的主要區(qū)別在于,GTF收發(fā)器是專為Virtex UltraScale+ VU2P FPGA芯片設計的,專為超低時延市場量身定制;GTY收發(fā)器技術則被廣泛應用于Virtex UltraScale+系列的所有納米級別產品,包括16納米產品中。
在Alveo UL3422加速卡的硬件架構中,F(xiàn)PGA架構和DSP塊能夠針對不斷演進的交易策略進行靈活加速,嵌入式RAM用于對定價數(shù)據(jù)、交易記錄等進行快速內存存取,DDR4用于存儲訂單簿信息、歷史定價數(shù)據(jù)等,這種架構設計便于實現(xiàn)靈活的交易。
Alveo UL3422具體如何滿足對速度要求最嚴苛的交易執(zhí)行?AMD自適應和嵌入式計算事業(yè)部Alveo加速卡高級產品線經理Shyam Chander介紹,Alveo UL3422能夠進行實時的數(shù)據(jù)送達和交易執(zhí)行,算法支持交易前的風險檢測,無論是經紀商還是交易商都有著風險管控的需求,通過這樣的方式能夠減少錯誤的發(fā)生,并且更好地滿足合規(guī)要求。
亮點二:極具性價比的纖薄尺寸
作為專為加速交易打造的FPGA卡,Alveo UL3422采用纖薄 FHHL(全高半長)外形尺寸設計,在實際部署中,這樣的尺寸規(guī)格極具性價比,可以降低進入門檻,實現(xiàn)廣泛采用。
Shyam Chander介紹,Alveo UL3422是AMD Alveo超低時延加速卡產品組合的最新成員,與一年前推出的Alveo UL3524相比,它更具性價比,同時保持了UL3524的諸多優(yōu)勢。具體而言,它尺寸更小,和很多服務器都能兼容,特別是有些企業(yè)在尋求共置服務器的時候特別注重空間方面的需要,Alveo UL3422實現(xiàn)了性能與性價比之間的出色平衡。
Shyam Chander表示,基礎設施策略對高頻交易的盈利能力至關重要,涵蓋全球前25、市值超過了100萬億美元的證券交易所,需要主機共置以確保最低時延,而這涉及資本支出與運營支出,包括機架空間、能源、網絡、數(shù)據(jù)饋送等。由于共置服務器的數(shù)量空間非常有限的,對成本的要求非常高,所以需要相關的器件封裝尺寸要盡可能小。此外還有功耗,所需調配網絡的數(shù)量和服務器數(shù)量等,都是非常關鍵的因素。
亮點三:易于開發(fā),實現(xiàn)快速交易
面向傳統(tǒng)的FPGA開發(fā)者,Alveo UL3422也展現(xiàn)出了較高的靈活性,使得高頻交易公司能夠持續(xù)優(yōu)化其交易策略,并適應交易、算法及監(jiān)管要求的不斷演進。
針對傳統(tǒng)FPGA開發(fā)者,該硬件平臺展現(xiàn)出極高的靈活性,使得高頻交易公司能夠持續(xù)優(yōu)化其交易策略,并適應交易、算法及監(jiān)管要求的不斷演進。開發(fā)者可以利用熟悉的FPGA工具流程,通過AMD Vivado工具進行RTL設計,同時,針對時延基準測試的參考設計,可以評估和集成自定義算法。
此外,AMD擁有豐富的IP工具包和生態(tài)系統(tǒng)解決方案,能夠實現(xiàn)快速部署,無論是直接使用IP還是通過合作伙伴如Exegy提供的預構建基礎設施IP,都能達到超低時延,運行時堆棧和API的簡化進一步加快了開發(fā)進程。該平臺還支持工業(yè)標準的機器學習開發(fā)框架,以實現(xiàn)低時延,例如FINN編譯器,它支持PyTorch開發(fā)、神經網絡量化,并能生成RTL IP。
Alveo加速卡如何成為金融科技優(yōu)選?
當前,金融領域許多交易商開始采用AI交易策略,這些策略與FPGA的靈活加速計算能力結合成為一種趨勢。在金融科技領域,AI應用正逐漸從非核心部分轉變?yōu)榻灰坠芫€的關鍵組成部分。
Shyam Chander表示,F(xiàn)PGA在這一過程中的價值和優(yōu)勢主要體現(xiàn)在兩個方面:首先,F(xiàn)PGA的可編程性使其能夠適應各種算法需求,實現(xiàn)利潤最大化和特定算法的無縫連接,這是ASIC或SSD無法實現(xiàn)的;其次,針對金融科技對超低時延的嚴格要求,F(xiàn)PGA加速卡通過其GTF收發(fā)器能夠在20納秒內完成數(shù)據(jù)傳輸,從而滿足超低時延的需求。
并且,Alveo加速卡面向金融科技領域提供多樣化的產品線,其中Alveo UL3524和Alveo UL3422專為超低時延需求而設計;Alveo V80等產品則更側重于計算和內存密集型工作負載,對于時延的要求相對寬松。這也意味著,Alveo加速卡系列能夠同時滿足通用和專業(yè)化需求,對于FPGA和自適應SoC而言,市場應用空間廣闊。
除了金融科技,最新推出的Alveo UL3422加速卡是否還有其他潛在應用領域?對此,Shyam Chander表示,確實存在其他的目標應用,尤其是和低時延相關的,例如科研和智駕汽車領域??蒲蓄I域中,許多數(shù)據(jù)饋送處理需要在交換機中完成,超低時延的芯片能力對于這些應用至關重要。
Shyam Chander 強調,AMD正在通過高性能和自適應計算技術,積極推動金融服務領域的數(shù)字化轉型,這包括Ryzen(銳龍)、EPYC處理器以及FPGA技術等。高頻交易方面,由于低時延是降低成本和獲得利潤的關鍵,AMD希望通過持續(xù)創(chuàng)新,滿足更多應用需求。