NVA-1173 NetApp AIPod 搭配 NVIDIA DGX 系統 - 軟體元件
本節重點介紹 NetApp AIPod 搭配 NVIDIA DGX 系統的軟體元件。
NVIDIA 軟體
NVIDIA Base Command
NVIDIA Base Command™ ;為每個 DGX BasePOD 提供強大動力、讓組織能夠充分發揮 NVIDIA 軟體創新的最大效益。企業可以透過備受肯定的平台、充分發揮投資潛力、包括企業級協調與叢集管理、加速運算、儲存與網路基礎架構的程式庫、以及針對 AI 工作負載最佳化的作業系統( OS )。
_NVIDIA BaseCommand 解決方案 _
NVIDIA GPU雲端(NGC)
NVIDIA NGC ™提供軟體、可滿足具有各種 AI 專業水準的資料科學家、開發人員和研究人員的需求。NGC 軟體會掃描一組彙總的常見弱點與曝險( CVE )、加密和私密金鑰。它經過測試與設計、可擴充至多個 GPU 、在許多情況下、可擴充至多節點、確保使用者在 DGX 系統上的投資發揮最大效益。
NVIDIA GPU Cloud _
NVIDIA AI Enterprise
NVIDIA AI Enterprise 是端點對端軟體平台、可為每個企業提供泛用 AI 、為專為在 NVIDIA DGX 平台上執行而最佳化的泛用 AI 基礎模型提供最快且最有效率的執行時間。憑藉生產級的安全性、穩定性和管理能力、它簡化了泛型 AI 解決方案的開發。DGX BasePOD 隨附 NVIDIA AI Enterprise 、可讓企業開發人員存取預先訓練的模型、最佳化架構、微服務、加速程式庫、以及企業支援。
NetApp 軟體
NetApp ONTAP
NetApp最新一代的儲存管理軟體、即支援企業將基礎架構現代化、並移轉至雲端就緒的資料中心。ONTAP利用領先業界的資料管理功能ONTAP 、無論資料位於何處、只要使用一組工具、即可管理及保護資料。您也可以自由地將資料移至任何需要的位置:邊緣、核心或雲端。支援眾多功能、可簡化資料管理、加速及保護關鍵資料、並在混合雲架構中提供新一代基礎架構功能。ONTAP
加速並保護資料
提供優異的效能與資料保護、並以下列方式擴充這些功能:ONTAP
-
效能與較低的延遲。ONTAP 以最低可能延遲提供最高的處理量、包括支援使用 NFS over RDMA 、平行 NFS ( pNFS )和 NFS 工作階段主幹的 NVIDIA GPUDirect 儲存設備( GDS )。
-
資料保護:ONTAP 提供內建的資料保護功能、以及業界最強大的反勒索軟體保證、並可在所有平台上進行通用管理。
-
NetApp Volume Encryption(NVE)。支援內建和外部金鑰管理、提供原生Volume層級的加密功能。ONTAP
-
儲存設備多租戶和多因素驗證。支援以最高安全等級共享基礎架構資源。ONTAP
簡化資料管理
資料管理對於企業IT營運和資料科學家而言至關重要、因此可將適當的資源用於AI應用程式和訓練AI/ML資料集。下列關於NetApp技術的其他資訊超出此驗證範圍、但可能會因您的部署而有所差異。
包含下列功能的資料管理軟體、可簡化及簡化作業、並降低您的總營運成本:ONTAP
-
快照和複製功能可讓 ML/DL 工作流程進行協同作業、平行實驗和強化資料管理。
-
SnapMirror 可在混合雲和多站台環境中順暢地移動資料、隨時隨地提供所需的資料。
-
即時資料精簡與擴充重複資料刪除技術。資料壓縮可減少儲存區塊內的空間浪費、重複資料刪除技術可大幅提升有效容量。這適用於本機儲存的資料、以及分層至雲端的資料。
-
最低、最大及可調適的服務品質(AQO)。精細的服務品質(QoS)控制有助於維持高共享環境中關鍵應用程式的效能等級。
-
NetApp FlexGroups 可在儲存叢集中的所有節點上散佈資料、為極大型的資料集提供大容量和更高效能。
-
NetApp FabricPool自動將冷資料分層至公有和私有雲端儲存選項、包括Amazon Web Services(AWS)、Azure和NetApp StorageGRID 等儲存解決方案。如需FabricPool 更多有關資訊、請參閱 "TR-4598:FabricPool 最佳實務做法"。
-
NetApp FlexCache 。提供遠端磁碟區快取功能、可簡化檔案發佈、減少 WAN 延遲、並降低 WAN 頻寬成本。FlexCache 可在多個站台之間進行分散式產品開發、並可從遠端位置加速存取公司資料集。
符合未來需求的基礎架構
下列功能可協助滿足嚴苛且不斷變化的業務需求:ONTAP
-
無縫擴充和不中斷營運。ONTAP 支援在線上新增現有控制器和橫向擴充叢集的容量。客戶可以升級至最新技術、例如NVMe和32GB FC、而不需進行昂貴的資料移轉或中斷運作。
-
雲端連線:ONTAP 是最具雲端連線能力的儲存管理軟體,可在所有公有雲中選擇軟體定義儲存( ONTAP Select )和雲端原生執行個體( Google Cloud NetApp Volumes )。
-
與新興應用程式整合。利用支援現有企業應用程式的相同基礎架構、為新一代平台和應用程式提供企業級資料服務、例如自動駕駛車輛、智慧城市和產業4.0。ONTAP
NetApp DataOps工具套件
NetApp DataOps Toolkit是一款以Python為基礎的工具、可簡化開發/訓練工作區和推斷伺服器的管理、這些工作區都以高效能橫向擴充的NetApp儲存設備為後盾。DataOps Toolkit 可做為獨立公用程式運作、在 Kubernetes 環境中更有效運用 NetApp Trident 來自動化儲存作業。主要功能包括:
-
快速配置以高效能橫向擴充NetApp儲存設備為後盾的新高容量JupyterLab工作區。
-
快速配置以企業級NetApp儲存設備為後盾的全新NVIDIA Triton Inference Server執行個體。
-
近乎即時的高容量 JupyterLab 工作區複製、以便進行實驗或快速迭代。
-
高容量 JupyterLab 工作區的近乎即時的快照、用於備份及 / 或可追蹤性 / 基準化。
-
近乎即時的高容量高效能資料磁碟區資源配置、複製及快照。
NetApp Trident
Trident 是完全支援的開放原始碼儲存協調工具、適用於容器和 Kubernetes 配送、包括 Anthos 。Trident 可搭配整個 NetApp 儲存產品組合使用、包括 NetApp ONTAP 、也支援 NFS 、 NVMe / TCP 和 iSCSI 連線。Trident可讓終端使用者從NetApp儲存系統配置及管理儲存設備、而無需儲存管理員介入、進而加速DevOps工作流程。