GTC22 | 全新 NVIDIA DGX 系統軟體和基礎設施解決方案強效賦能企業 AI

nvidia英偉達中國 發佈 2022-09-22T05:07:43.440055+00:00

新一批創新企業開始基於 DGX 系統、Base Command 和 DGX SuperPOD 來實現 AI,包括 Adept AI、現代汽車集團、KT 和威斯康星大學麥迪遜分校。

新一批創新企業開始基於 DGX 系統、Base Command 和 DGX SuperPOD 來實現 AI,包括 Adept AI、現代汽車集團、KT 和威斯康星大學麥迪遜分校。




GTC 大會上,NVIDIA 公布了DGX 產品系列的多項更新,有望推動企業級 AI 開發實現新突破。

NVIDIA DGX H100 系統現已提供訂購。這些基礎設施的基礎構建模塊支持 NVIDIA 的全棧企業級 AI 解決方案。

NVIDIA DGX H100 在 FP8 精度下提供 32 petaflop 的性能,將能大幅提升企業級 AI 開發的效率。與上一代系統相比,DGX H100 的總體擁有成本降至1/3,能效提高 3.5 倍。

新的 NVIDIA Base Command 軟體可簡化和加速 AI 開發,有力支持從單節點到 DGX SuperPOD 的各種 DGX 系統高效運行。

此外,NVIDIA DGX BasePOD(DGX POD 的進階版)也揭開了面紗,它使 IT 團隊能更快速輕鬆地獲得、部署和管理企業級數據中心 AI。

全球許多 AI 領軍企業都在使用 NVIDIA DGX 系統和軟體,致力於尋求技術突破(從自動駕駛汽車到語音助手),且從未放緩創新的步伐。



全新 NVIDIA Base Command 功能

NVIDIA Base Command 提供企業級編排和集群管理功能,並且包含完整的軟體棧,以儘可能地提高 AI 開發者的工作效率、IT 可管理性和工作負載性能。



Base Command 的工作流管理功能現在包含對本地 DGX SuperPOD 環境的支持,使企業能通過簡化的項目團隊協作、集成的監控和報告面板來集中控制 AI 開發項目。

Base Command 與 NVIDIA AI Enterprise 軟體套件配合使用,該套件現已包含在所有 DGX 系統中。藉助此 NVIDIA AI 軟體,客戶可以使用其所支持的 AI 和數據科學工具、優化的框架和預訓練模型,進行端到端 AI 開發和部署。

另外,此軟體還能與以下公司的企業工作流管理和 MLOps 工具進行集成:DGX-Ready 軟體提供商 Domino Data Lab、Run.ai、Weights & Biases,以及NVIDIA初創加速計劃成員 Rescale。此軟體還包含多個庫,不僅能優化和加速計算、存儲和網絡基礎設施,還能確保儘可能地延長系統的正常運行時間、安全性和可靠性。



全新 DGX BasePOD 參考架構

DGX BasePOD 為 DGX 系統提供參考架構,該架構融合了集成計算、網絡、存儲和軟體方面的最佳設計實踐。

客戶已經使用 NVIDIA DGX POD 來推動各種企業應用的開發。DGX BasePOD 基於DGX POD 的成功,其新型行業解決方案瞄準了 AI領域的巨大機遇,包括自然語言處理、醫療健康和生命科學以及欺詐檢測。

DGX BasePOD 解決方案通過 NVIDIA 合作夥伴網絡,作為完全集成、可隨時部署的產品提供給客戶,其規模介於兩個到數百個 DGX 系統之間,並採用由以下 NVIDIA DGX 存儲技術合作夥伴開發的認證高性能存儲技術:DDN、戴爾、NetAppPure Storage、VAST Data 和 WEKA 等。



領軍企業藉助 DGX 系統推動 AI 開發實現突破



世界各地的許多企業都選擇 NVIDIA DGX 系統來有效運行其高級 AI 工作負載。以下是在 DGX A100 系統上開發任務關鍵型 AI 功能的部分 AI 創新者:

  • 機器學習研究和產品實驗室 Adept 正在打造基於大型語言模型的 AI 團隊成員,其原型基於 NVIDIA DGX Foundry 開發,然後利用 Oracle Cloud Infrastructure上的 NVIDIA A100 GPU 和 NVIDIA Megatron 進行擴展。
  • 現代汽車集團正使用 40 個節點的 DGX SuperPOD,探索研究超大規模 AI 工作負載。
  • 電信公司 KT 正在使用 NVIDIA NeMo Megatron 框架、NVIDIA DGX SuperPOD 和 NVIDIA Base Command 軟體,為各種韓語應用(包括 GiGA Genie 智能揚聲器)開發一個包含大約 400 億參數的 LLM。
  • 威斯康星大學麥迪遜分校正在將 NVIDIA DGX 系統與 Flywheel 研究平台以及 NVIDIA Clara 醫療健康應用框架一起使用,致力於快速將 AI 引入到醫學成像設備中。該大學與其他醫院合作,使用 NVIDIA 聯邦學習應用運行時環境 (NVIDIA FLARE) 在 DGX 系統上安全地訓練用於醫學成像、標註數據和分類的 AI 模型。

請觀看 NVIDIA 創始人兼執行長黃仁勛的 GTC 大會主題演講回放,詳細了解 NVIDIA DGX 系統推動實現的 AI 突破。另請參加以「設計您的 AI 卓越中心」為主題的GTC分會,NVIDIA DGX 系統副總裁 Charlie Boyle將出席該分會。

關鍵字: