在本周的 GPU 技術大會 (GTC) 上,NVIDIA 提出了一系列公告強調了該公司如何讓開發人員比以往更輕松地大規模構建和部署生成式人工智能應用程序。新產品包括針對 AI 工作負載進行優化的強大計算平臺、用于訪問 NVIDIA 基礎設施和軟件的云服務,以及用于簡化開發的微服務和 API。
“生成式人工智能是我們這個時代的決定性技術。Blackwell 是推動這場新工業革命的引擎,”黃仁勛,NVIDIA 創始人兼首席執行官。 “與世界上最具活力的公司合作,我們將實現人工智能對每個行業的承諾。”
Blackwell GPU 架構為下一代人工智能計算提供動力
此次發布的頭條新聞是全新 Blackwell GPU 架構,這是 NVIDIA 用于加速計算和生成式 AI 的下一代平臺。 Blackwell 推出了多項創新技術來支持萬億參數 AI 模型,包括統一的 2080 億個晶體管 GPU、第二代 Transformer 引擎以及用于 GPU 之間高速互連的第五代 NVIDIA NVLink。
與 NVIDIA 之前的 Hopper GPU 相比,Blackwell 架構為 AI 訓練提供了令人印象深刻的 2.5 倍的 FP8 性能。對于推理和內容生成,Blackwell 為大型語言模型提供了高達 30 倍的性能提升。這種性能飛躍將使開發人員能夠創建和運行比以往更復雜的人工智能模型。
“Blackwell 提供了巨大的性能飛躍,并將加快我們交付領先模型的能力,”OpenAI 首席執行官 Sam Altman 說道。 “我們很高興繼續與 NVIDIA 合作來增強 AI 計算。”
Dgx 超級計算機提供 Exaflop 的 AI 性能
為了展示 Blackwell 的功能,NVIDIA 宣布推出由 Blackwell GPU 提供支持的新型 DGX 超級計算機。全新 DGX 的單個機架可提供 1 exaflop 的 AI 性能,相當于世界排名前 5 的超級計算機。 NVIDIA 將 576 個 Blackwell GPU 通過 NVLink 連接為一個系統,將其稱為生成式 AI 的“AI 工廠”。
NVIDIA AI 模型微服務簡化部署
為了讓 Blackwell 的強大功能可用,NVIDIA 發布了數十個 NVIDIA NIM(NVIDIA AI 模型)推理微服務。這些云原生微服務構建于 NVIDIA CUDA 平臺之上,通過行業標準 API 為 NVIDIA 及合作伙伴提供的二十多個流行 AI 模型提供優化推理。
NIM 微服務預先打包了所有必要的依賴項,例如 CUDA、cuDNN 和 TensorRT,以消除配置麻煩。得益于 Triton Inference Server 等優化的 NVIDIA 軟件,它們通過容器提供最快的 AI 推理。
開發人員可以輕松地將這些微服務部署在任何 NVIDIA 加速的計算平臺上,從云實例到本地服務器再到邊緣設備。 AWS、Azure 和 Google Cloud 等主要云提供商將提供 NIM 微服務,服務器供應商的 NVIDIA DGX Cloud 和 NVIDIA 認證系統也將提供。
“這些容器化人工智能微服務是與我們的合作伙伴生態系統一起創建的,是各行業企業成為人工智能公司的基石,”黃解釋道。 “成熟的企業平臺坐擁數據金礦,可以轉化為生成型人工智能副駕駛。”
Omniverse 和 CUDA-X 微服務加速開發
除了計算和部署服務之外,NVIDIA 還發布了新的 SDK 和 API,以加速跨行業的 AI 開發。 Omniverse Cloud API 使開發人員能夠將核心 Omniverse 技術集成到現有的設計和模擬應用程序中。這些 API 為數字孿生提供物理精確的 3D 模擬和可視化功能。
Ansys、Autodesk、Bentley 和西門子等工業軟件巨頭正在將 Omniverse Cloud API 集成到其產品設計和工程平臺中。 Omniverse 使這些工具的用戶能夠在 3D 模型上無縫協作,并將生成式 AI 應用于計算機輔助工程工作流程。
“6G 和人工智能的未來融合有望帶來變革性的技術格局,”三星美國研究院高級副總裁 Charlie Zang 表示。 “這將帶來無縫連接和智能系統,從而重新定義我們與數字世界的互動。”
CUDA-X 微服務為常見 AI 工作流程的數據準備、培訓和部署提供端到端構建塊。其中包括用于可定制語音 AI 的 NVIDIA Riva、用于路由優化的 cuOpt、用于全球氣候模擬的 Earth-2 API 以及用于知識檢索和語言理解的 NeMo Retriever 服務。
SAP 合作伙伴關系為企業帶來生成式人工智能
NVIDIA 正在通過有針對性的微服務套件和合作伙伴關系,為醫療保健和生命科學等關鍵行業帶來生成式 AI 功能。與企業軟件領導者 SAP 的合作非常出色。 SAP 和 NVIDIA 正在努力將生成式 AI 與 SAP 的企業應用程序組合和 SAP AI Core 平臺集成。
利用 NVIDIA 的 AI 基礎和 NeMo 定制工具,SAP 將構建嵌入其產品線的生成式 AI 助手。其中包括企業資源規劃套件的人工智能副駕駛以及 SAP SuccessFactors HR 軟件和 SAP Signavio 業務流程智能解決方案中的人工智能增強功能。
“戰略技術合作伙伴關系,例如 SAP 與 NVIDIA 之間的合作伙伴關系, SAP 首席執行官 Christian Klein 表示:“我們戰略的核心是投資技術,最大限度地發揮人工智能的商業潛力和機會。” “NVIDIA 在大規模提供 AI 功能方面的專業知識將幫助 SAP 加快轉型步伐,更好地為我們的云客戶服務。”
NVIDIA AI 為下一代機器人和量子計算提供動力
在機器人技術領域,NVIDIA 推出了 Project GR00T,這是一個用于教學和訓練人形機器人一般技能的基礎模型。它利用新的 Jetson Thor 機器人計算機和 Isaac 機器人平臺的更新來創建黃所說的“人工通用機器人”。
GR00T 旨在使機器人能夠理解自然語言并通過觀察示例來模仿人類行為。該模型采用涵蓋視頻、音頻和傳感器數據的多模態輸入來學習任務。然后,它可以輸出電機控制信號,以使用 NVIDIA 構建的機器人模擬器重現物理世界中的技能。
最后,在量子計算方面,NVIDIA 推出了 Quantum Cloud,這是一項基于開源 CUDA-Q 平臺的云服務,可供研究人員開發量子算法和應用程序。它具有通過量子生態系統開發的強大新功能,包括量子機器學習的生成模型以及與 QC Ware 和 Classiq 軟件的集成。
“量子計算代表了計算的下一個革命性前沿,需要世界上最聰明的人才讓這一未來更近一步,”NVIDIA 高性能計算和量子計算總監 Tim Costa 說道。 “NVIDIA Quantum Cloud 打破了探索這項變革性技術的障礙。”
綜合平臺簡化生成式人工智能開發
從芯片到云服務再到人工智能微服務,NVIDIA 的 GTC 公告展示該公司如何為開發人員提供端到端平臺,以簡化和加速跨行業構建最先進的生成式人工智能應用程序。借助這些新工具,開發人員可以比以往更快地專注于部署變革性人工智能創新。