NVIDIA DGX 시스템을 탑재한 NVA-1173 NetApp AIPod - 소프트웨어 구성 요소
이 섹션에서는 NVIDIA DGX 시스템이 탑재된 NetApp AIPod 의 소프트웨어 구성 요소에 대해 중점적으로 설명합니다.
NVIDIA 소프트웨어
NVIDIA 베이스 명령
NVIDIA Base Command™는 모든 DGX BasePOD를 구동하여 조직이 NVIDIA 소프트웨어 혁신의 장점을 최대한 활용할 수 있도록 지원합니다. 기업은 엔터프라이즈급 오케스트레이션 및 클러스터 관리, 컴퓨팅, 스토리지 및 네트워크 인프라를 가속화하는 라이브러리, AI 워크로드에 최적화된 운영 체제(OS)를 포함하는 검증된 플랫폼을 통해 투자의 잠재력을 최대한 발휘할 수 있습니다.
NVIDIA BaseCommand 솔루션
NVIDIA GPU 클라우드(NGC)
NVIDIA NGC는 다양한 수준의 AI 전문 지식을 갖춘 데이터 과학자, 개발자, 연구자의 요구를 충족하는 소프트웨어를 제공합니다. NGC에 호스팅된 소프트웨어는 공통적인 취약성 및 노출(CVE), 암호 및 개인 키의 집계된 집합에 대한 검사를 거칩니다. DGX 시스템은 여러 GPU에 확장 가능하고, 많은 경우 다중 노드에 확장 가능하도록 테스트 및 설계되어 사용자가 DGX 시스템에 대한 투자를 극대화할 수 있도록 보장합니다.
NVIDIA GPU 클라우드
NVIDIA AI 엔터프라이즈
NVIDIA AI Enterprise는 모든 기업이 생성적 AI를 활용할 수 있도록 하는 엔드 투 엔드 소프트웨어 플랫폼으로, NVIDIA DGX 플랫폼에서 실행되도록 최적화된 생성적 AI 기반 모델을 위한 가장 빠르고 효율적인 런타임을 제공합니다. 프로덕션 수준의 보안, 안정성, 관리 용이성을 갖춰 생성적 AI 솔루션 개발을 간소화합니다. NVIDIA AI Enterprise는 DGX BasePOD에 포함되어 기업 개발자가 사전 학습된 모델, 최적화된 프레임워크, 마이크로서비스, 가속 라이브러리 및 기업 지원에 액세스할 수 있도록 합니다.
NetApp 소프트웨어
NetApp ONTAP
NetApp 의 최신 스토리지 관리 소프트웨어인 ONTAP 9를 사용하면 기업이 인프라를 현대화하고 클라우드 지원 데이터 센터로 전환할 수 있습니다. ONTAP 업계 최고의 데이터 관리 역량을 활용하여 데이터가 어디에 있든 단일 도구 세트를 사용하여 데이터를 관리하고 보호할 수 있도록 지원합니다. 또한 필요한 곳, 즉 엣지, 코어, 클라우드로 데이터를 자유롭게 이동할 수 있습니다. ONTAP 9에는 데이터 관리를 간소화하고, 중요 데이터를 가속화하고 보호하며, 하이브리드 클라우드 아키텍처 전반에서 차세대 인프라 기능을 구현하는 다양한 기능이 포함되어 있습니다.
데이터 가속화 및 보호
ONTAP 뛰어난 수준의 성능과 데이터 보호 기능을 제공하며 다음과 같은 방식으로 이러한 기능을 확장합니다.
-
성능과 낮은 지연 시간. ONTAP RDMA를 통한 NFS, 병렬 NFS(pNFS), NFS 세션 트렁킹을 사용하는 NVIDIA GPUDirect Storage(GDS)에 대한 지원을 포함하여 가능한 가장 낮은 지연 시간으로 가능한 가장 높은 처리량을 제공합니다.
-
데이터 보호. ONTAP 모든 플랫폼에서 공통적으로 관리 가능하며, 내장형 데이터 보호 기능과 업계에서 가장 강력한 랜섬웨어 방지 기능을 제공합니다.
-
NetApp 볼륨 암호화(NVE). ONTAP 온보드 및 외부 키 관리 지원을 통해 기본 볼륨 수준 암호화를 제공합니다.
-
스토리지 멀티테넌시 및 다중 요소 인증. ONTAP 최고 수준의 보안을 통해 인프라 리소스를 공유할 수 있도록 합니다.
데이터 관리 간소화
적절한 리소스가 AI 애플리케이션과 AI/ML 데이터 세트 교육에 사용될 수 있도록 기업 IT 운영과 데이터 과학자에게 데이터 관리가 매우 중요합니다. NetApp 기술에 대한 다음 추가 정보는 이 검증 범위를 벗어나지만 배포에 따라 관련이 있을 수 있습니다.
ONTAP 데이터 관리 소프트웨어에는 다음과 같은 기능이 포함되어 있어 운영을 간소화하고 단순화하며 총 운영 비용을 절감할 수 있습니다.
-
스냅샷과 클론을 사용하면 ML/DL 워크플로에 대한 협업, 병렬 실험 및 향상된 데이터 거버넌스가 가능합니다.
-
SnapMirror 하이브리드 클라우드와 다중 사이트 환경에서 원활한 데이터 이동을 지원하여 필요한 곳에 필요한 시간에 데이터를 제공합니다.
-
인라인 데이터 압축 및 확장된 중복 제거. 데이터 압축은 저장 블록 내부의 낭비되는 공간을 줄이고, 중복 제거는 효과적인 용량을 크게 증가시킵니다. 이는 로컬에 저장된 데이터와 클라우드에 계층화된 데이터 모두에 적용됩니다.
-
최소, 최대 및 적응형 서비스 품질(AQoS). 세분화된 서비스 품질(QoS) 제어는 공유 빈도가 높은 환경에서 중요한 애플리케이션의 성능 수준을 유지하는 데 도움이 됩니다.
-
NetApp FlexGroups를 사용하면 스토리지 클러스터의 모든 노드에 데이터를 분산하여 대규모 데이터 세트에 대해 막대한 용량과 더 높은 성능을 제공할 수 있습니다.
-
NetApp FabricPool. Amazon Web Services(AWS), Azure, NetApp StorageGRID 스토리지 솔루션을 포함한 퍼블릭 및 프라이빗 클라우드 스토리지 옵션에 콜드 데이터의 자동 계층화를 제공합니다. FabricPool 에 대한 자세한 내용은 다음을 참조하세요. "TR-4598: FabricPool 모범 사례" .
-
NetApp FlexCache. 파일 배포를 간소화하고, WAN 지연 시간을 줄이고, WAN 대역폭 비용을 낮추는 원격 볼륨 캐싱 기능을 제공합니다. FlexCache 사용하면 여러 사이트에 걸쳐 분산된 제품 개발을 수행할 수 있을 뿐만 아니라 원격 위치에서도 회사 데이터 세트에 더 빨리 액세스할 수 있습니다.
미래 지향적 인프라
ONTAP 다음과 같은 기능을 통해 까다롭고 끊임없이 변화하는 비즈니스 요구 사항을 충족하는 데 도움이 됩니다.
-
원활한 확장과 중단 없는 운영. ONTAP 기존 컨트롤러와 확장형 클러스터에 용량을 온라인으로 추가하는 것을 지원합니다. 고객은 비용이 많이 드는 데이터 마이그레이션이나 중단 없이 NVMe 및 32Gb FC와 같은 최신 기술로 업그레이드할 수 있습니다.
-
클라우드 연결. ONTAP 모든 퍼블릭 클라우드에서 소프트웨어 정의 스토리지(ONTAP Select)와 클라우드 기반 인스턴스(Google Cloud NetApp Volumes)에 대한 옵션을 제공하는 가장 클라우드에 연결된 스토리지 관리 소프트웨어입니다.
-
새로운 애플리케이션과의 통합. ONTAP 기존 엔터프라이즈 앱을 지원하는 동일한 인프라를 사용하여 자율주행차, 스마트 시티, 산업 4.0과 같은 차세대 플랫폼과 애플리케이션을 위한 엔터프라이즈급 데이터 서비스를 제공합니다.
NetApp DataOps 툴킷
NetApp DataOps Toolkit은 고성능, 확장형 NetApp 스토리지에 의해 지원되는 개발/교육 작업 공간과 추론 서버의 관리를 간소화하는 Python 기반 도구입니다. DataOps Toolkit은 독립형 유틸리티로 작동할 수 있으며 NetApp Trident 활용하여 스토리지 작업을 자동화하는 Kubernetes 환경에서 더욱 효과적입니다. 주요 기능은 다음과 같습니다.
-
고성능, 확장형 NetApp 스토리지로 지원되는 새로운 대용량 JupyterLab 작업 공간을 빠르게 프로비저닝하세요.
-
엔터프라이즈급 NetApp 스토리지로 지원되는 새로운 NVIDIA Triton Inference Server 인스턴스를 빠르게 프로비저닝하세요.
-
실험이나 빠른 반복을 가능하게 하기 위해 대용량 JupyterLab 작업 공간을 거의 즉각적으로 복제합니다.
-
대용량 JupyterLab 작업 공간의 거의 즉각적인 스냅샷을 백업 및/또는 추적/기준 설정에 사용할 수 있습니다.
-
대용량, 고성능 데이터 볼륨에 대한 거의 즉각적인 프로비저닝, 복제 및 스냅샷이 가능합니다.
NetApp Trident
Trident Anthos를 포함한 컨테이너와 Kubernetes 배포판을 위한 완벽하게 지원되는 오픈 소스 스토리지 오케스트레이터입니다. Trident NetApp ONTAP 포함한 전체 NetApp 스토리지 포트폴리오와 호환되며 NFS, NVMe/TCP 및 iSCSI 연결도 지원합니다. Trident 최종 사용자가 스토리지 관리자의 개입 없이 NetApp 스토리지 시스템에서 스토리지를 프로비저닝하고 관리할 수 있도록 하여 DevOps 워크플로를 가속화합니다.