Skip to main content
NetApp Solutions
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

NVA-1173 NetApp AIPod 搭配 NVIDIA DGX 系統 - 軟體元件

貢獻者

本節重點介紹 NetApp AIPod 搭配 NVIDIA DGX 系統的軟體元件。

NVIDIA 軟體

NVIDIA Base Command

NVIDIA Base Command&#8482 ;為每個 DGX BasePOD 提供強大動力、讓組織能夠充分發揮 NVIDIA 軟體創新的最大效益。企業可以透過備受肯定的平台、充分發揮投資潛力、包括企業級協調與叢集管理、加速運算、儲存與網路基礎架構的程式庫、以及針對 AI 工作負載最佳化的作業系統( OS )。

_NVIDIA BaseCommand 解決方案 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA GPU雲端(NGC)

NVIDIA NGC ™提供軟體、可滿足具有各種 AI 專業水準的資料科學家、開發人員和研究人員的需求。NGC 軟體會掃描一組彙總的常見弱點與曝險( CVE )、加密和私密金鑰。它經過測試與設計、可擴充至多個 GPU 、在許多情況下、可擴充至多節點、確保使用者在 DGX 系統上的投資發揮最大效益。

NVIDIA GPU Cloud _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA AI Enterprise

NVIDIA AI Enterprise 是端點對端軟體平台、可為每個企業提供泛用 AI 、為專為在 NVIDIA DGX 平台上執行而最佳化的泛用 AI 基礎模型提供最快且最有效率的執行時間。憑藉生產級的安全性、穩定性和管理能力、它簡化了泛型 AI 解決方案的開發。DGX BasePOD 隨附 NVIDIA AI Enterprise 、可讓企業開發人員存取預先訓練的模型、最佳化架構、微服務、加速程式庫、以及企業支援。

NetApp 軟體

NetApp ONTAP

NetApp最新一代的儲存管理軟體、即支援企業將基礎架構現代化、並移轉至雲端就緒的資料中心。ONTAP利用領先業界的資料管理功能ONTAP 、無論資料位於何處、只要使用一組工具、即可管理及保護資料。您也可以自由地將資料移至任何需要的位置:邊緣、核心或雲端。支援眾多功能、可簡化資料管理、加速及保護關鍵資料、並在混合雲架構中提供新一代基礎架構功能。ONTAP

加速並保護資料

提供優異的效能與資料保護、並以下列方式擴充這些功能:ONTAP

  • 效能與較低的延遲。ONTAP 以最低可能延遲提供最高的處理量、包括支援使用 NFS over RDMA 、平行 NFS ( pNFS )和 NFS 工作階段主幹的 NVIDIA GPUDirect 儲存設備( GDS )。

  • 資料保護:ONTAP 提供內建的資料保護功能、以及業界最強大的反勒索軟體保證、並可在所有平台上進行通用管理。

  • NetApp Volume Encryption(NVE)。支援內建和外部金鑰管理、提供原生Volume層級的加密功能。ONTAP

  • 儲存設備多租戶和多因素驗證。支援以最高安全等級共享基礎架構資源。ONTAP

簡化資料管理

資料管理對於企業IT營運和資料科學家而言至關重要、因此可將適當的資源用於AI應用程式和訓練AI/ML資料集。下列關於NetApp技術的其他資訊超出此驗證範圍、但可能會因您的部署而有所差異。

包含下列功能的資料管理軟體、可簡化及簡化作業、並降低您的總營運成本:ONTAP

  • 快照和複製功能可讓 ML/DL 工作流程進行協同作業、平行實驗和強化資料管理。

  • SnapMirror 可在混合雲和多站台環境中順暢地移動資料、隨時隨地提供所需的資料。

  • 即時資料精簡與擴充重複資料刪除技術。資料壓縮可減少儲存區塊內的空間浪費、重複資料刪除技術可大幅提升有效容量。這適用於本機儲存的資料、以及分層至雲端的資料。

  • 最低、最大及可調適的服務品質(AQO)。精細的服務品質(QoS)控制有助於維持高共享環境中關鍵應用程式的效能等級。

  • NetApp FlexGroups 可在儲存叢集中的所有節點上散佈資料、為極大型的資料集提供大容量和更高效能。

  • NetApp FabricPool自動將冷資料分層至公有和私有雲端儲存選項、包括Amazon Web Services(AWS)、Azure和NetApp StorageGRID 等儲存解決方案。如需FabricPool 更多有關資訊、請參閱 "TR-4598:FabricPool 最佳實務做法"

  • NetApp FlexCache 。提供遠端磁碟區快取功能、可簡化檔案發佈、減少 WAN 延遲、並降低 WAN 頻寬成本。FlexCache 可在多個站台之間進行分散式產品開發、並可從遠端位置加速存取公司資料集。

符合未來需求的基礎架構

下列功能可協助滿足嚴苛且不斷變化的業務需求:ONTAP

  • 無縫擴充和不中斷營運。ONTAP 支援在線上新增現有控制器和橫向擴充叢集的容量。客戶可以升級至最新技術、例如NVMe和32GB FC、而不需進行昂貴的資料移轉或中斷運作。

  • 雲端連線:ONTAP 是最具雲端連線能力的儲存管理軟體,可在所有公有雲中選擇軟體定義儲存( ONTAP Select )和雲端原生執行個體( Google Cloud NetApp Volumes )。

  • 與新興應用程式整合。利用支援現有企業應用程式的相同基礎架構、為新一代平台和應用程式提供企業級資料服務、例如自動駕駛車輛、智慧城市和產業4.0。ONTAP

NetApp DataOps工具套件

NetApp DataOps Toolkit是一款以Python為基礎的工具、可簡化開發/訓練工作區和推斷伺服器的管理、這些工作區都以高效能橫向擴充的NetApp儲存設備為後盾。DataOps Toolkit 可做為獨立公用程式運作、在 Kubernetes 環境中更有效運用 NetApp Trident 來自動化儲存作業。主要功能包括:

  • 快速配置以高效能橫向擴充NetApp儲存設備為後盾的新高容量JupyterLab工作區。

  • 快速配置以企業級NetApp儲存設備為後盾的全新NVIDIA Triton Inference Server執行個體。

  • 近乎即時的高容量 JupyterLab 工作區複製、以便進行實驗或快速迭代。

  • 高容量 JupyterLab 工作區的近乎即時的快照、用於備份及 / 或可追蹤性 / 基準化。

  • 近乎即時的高容量高效能資料磁碟區資源配置、複製及快照。

NetApp Trident

Trident 是完全支援的開放原始碼儲存協調工具、適用於容器和 Kubernetes 配送、包括 Anthos 。Trident 可搭配整個 NetApp 儲存產品組合使用、包括 NetApp ONTAP 、也支援 NFS 、 NVMe / TCP 和 iSCSI 連線。Trident可讓終端使用者從NetApp儲存系統配置及管理儲存設備、而無需儲存管理員介入、進而加速DevOps工作流程。