Oracle Cloud Infrastructure率先運行NVIDIA AI超級計算實例;微軟Azure、谷歌云等即將托管DGX Cloud
NVIDIA今日發(fā)布NVIDIA DGX Cloud?。這項AI超級計算服務使企業(yè)能夠即時接入用于訓練生成式AI等開創(chuàng)性應用的高級模型所需的基礎設施和軟件。
DGX Cloud可提供NVIDIA DGX? AI超級計算專用集群,并配以NVIDIA AI軟件。這項服務使得每個企業(yè)都可以通過一個簡單的網(wǎng)絡瀏覽器就能訪問自己的AI超級計算機,免除了購置、部署和管理本地基礎設施的復雜性。
企業(yè)可按月租用DGX Cloud集群,以便能夠快速、輕松地擴展大型多節(jié)點訓練工作負載的開發(fā),無須等待需求量通常很大的加速計算資源。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“我們正處于AI的‘iPhone’時刻。初創(chuàng)企業(yè)正在競相打造顛覆性的產(chǎn)品和商業(yè)模式,老牌企業(yè)則在尋求應對之法。DGX Cloud 使客戶能夠在全球規(guī)模的云上即時接入NVIDIA AI超級計算?!?/p>
NVIDIA正在與領先的云服務商聯(lián)合托管DGX Cloud基礎設施,Oracle Cloud Infrastructure(OCI)將首當其沖,通過其OCI超級集群,提供專門構建的RDMA網(wǎng)絡、裸金屬計算以及高性能本地塊存儲,可擴展到超過32,000個GPU所組成的超級集群。
微軟Azure預計將在下個季度開始托管DGX Cloud。這項服務還將在不久之后擴展到谷歌云等。
行業(yè)巨頭利用NVIDIA DGX Cloud加速取得成功
首批使用DGX Cloud的AI行業(yè)先鋒包括全球領先的生物技術公司安進(Amgen)、保險科技領導者CCC Intelligent Solutions(CCC)以及數(shù)字業(yè)務平臺提供商ServiceNow。
安進正在使用DGX Cloud與NVIDIA BioNeMo?大型語言模型軟件來加速藥物研發(fā),比如包含NVIDIA RAPIDS?數(shù)據(jù)科學加速庫的NVIDIA AI Enterprise軟件。
安進數(shù)字創(chuàng)新研究加速中心、生物制劑治療研究執(zhí)行總監(jiān)Peter Grandsard表示:“借助NVIDIA DGX Cloud和NVIDIA BioNeMo,我們的研究人員能夠把精力集中在更深層次的生物學研究上,無需再處理AI 基礎設施和設置機器學習工程。相較于其他平臺,我們借助DGX Cloud的強大算力和多節(jié)點能力,同時結合BioNeMo將蛋白質LLM的訓練速度提高了3倍,使用NVIDIA RAPIDS將訓練后分析速度提高了100倍。”
財產(chǎn)和意外保險領域的領先云平臺CCC正在使用DGX Cloud,以加快和擴展其AI模型的開發(fā)與訓練。這些模型為該公司的創(chuàng)新汽車理賠解決方案賦能, 幫助加速該行業(yè)的智能自動化,并為每天數(shù)百萬的企業(yè)用戶及其消費者改進理賠體驗。
ServiceNow正在使用DGX Cloud與本地NVIDIA DGX超級計算機,來構建靈活可擴展的混合云AI超級計算,以來幫助其在大型語言模型、代碼生成和因果分析方面的AI研究。ServiceNow還與其他機構共同發(fā)起了一個負責任的開放科學生成式AI倡議——BigCode項目,其在NVIDIA的Megatron-LM框架上進行訓練。
打開一個瀏覽器即可使用NVIDIA AI超級計算和軟件
企業(yè)可以使用 NVIDIA Base Command?平臺軟件管理和監(jiān)控DGX Cloud訓練工作負載,該軟件可實現(xiàn)DGX Cloud以及本地NVIDIA DGX超級計算機之間用戶體驗的無縫銜接。通過使用Base Command 平臺,用戶可根據(jù)每項工作所需的DGX基礎設施的數(shù)量和類型,將工作負載與之相匹配。
DGX Cloud包含NVIDIA AI Enterprise。NVIDIA AI Enterprise作為NVIDIA AI平臺的軟件層,通過提供端到端AI框架和預訓練模型,來加速數(shù)據(jù)科學流程,并簡化生產(chǎn)級AI的開發(fā)和部署。今日發(fā)布的NVIDIA AI Enterprise 3.1提供新的預訓練模型、經(jīng)過優(yōu)化的框架和加速數(shù)據(jù)科學軟件庫,可進一步幫助開發(fā)人員啟動他們的AI項目。
DGX Cloud的每個實例都配有8個NVIDIA H100或A100 80GB Tensor Core GPU,每個節(jié)點共有640GB GPU內(nèi)存。使用NVIDIA 網(wǎng)絡解決方案構建的高性能、低延遲結構確保了工作負載能夠在互連系統(tǒng)集群中擴展,使多個實例就像一個巨型的GPU,以滿足高級AI訓練性能要求。集成在DGX Cloud中的高性能存儲為AI超級計算提供了完整的解決方案。
DGX Cloud特有的來自NVIDIA專家的支持貫穿整個AI開發(fā)流程。用戶可以直接與NVIDIA工程師一起優(yōu)化模型,并迅速解決各種行業(yè)用例中的開發(fā)難題。
供應情況
DGX Cloud實例的價格為每實例每月36,999美元起。企業(yè)機構可以聯(lián)系NVIDIA Partner Network合作伙伴了解更多詳情。
觀看黃仁勛GTC主題演講,黃仁勛在演講中介紹了NVIDIA DGX Cloud。