NVIDIA DGX 시스템을 탑재한 NVA-1173 NetApp AIPod - 하드웨어 구성 요소
이 섹션에서는 NVIDIA DGX 시스템이 탑재된 NetApp AIPod 의 하드웨어 구성 요소에 대해 중점적으로 설명합니다.
NetApp AFF 스토리지 시스템
NetApp AFF 최첨단 스토리지 시스템을 사용하면 IT 부서가 업계 최고의 성능, 뛰어난 유연성, 클라우드 통합, 동급 최고의 데이터 관리 기능을 통해 엔터프라이즈 스토리지 요구 사항을 충족할 수 있습니다. 플래시에 맞춰 특별히 설계된 AFF 시스템은 비즈니스에 중요한 데이터를 가속화하고 관리하며 보호하는 데 도움이 됩니다.
AFF A90 저장 시스템
NetApp ONTAP 데이터 관리 소프트웨어 기반의 NetApp AFF A90 내장형 데이터 보호 기능, 옵션으로 제공되는 랜섬웨어 방지 기능, 가장 중요한 비즈니스 워크로드를 지원하는 데 필요한 높은 성능과 복원력을 제공합니다. 이는 임무 수행에 중요한 운영의 중단을 제거하고, 성능 조정을 최소화하며, 랜섬웨어 공격으로부터 데이터를 보호합니다. 다음을 제공합니다. • 업계 최고의 성능 • 타협 없는 데이터 보안 • 간소화된 중단 없는 업그레이드
NetApp AFF A90 스토리지 시스템
업계 최고의 성능
AFF A90 딥 러닝, AI, 고속 분석과 같은 차세대 워크로드는 물론 Oracle, SAP HANA, Microsoft SQL Server, 가상화된 애플리케이션과 같은 기존 엔터프라이즈 데이터베이스도 쉽게 관리합니다. 이 솔루션은 HA 쌍당 최대 240만 IOPS와 최저 100µs의 대기 시간을 제공하여 비즈니스에 중요한 애플리케이션을 최고 속도로 실행하고 이전 NetApp 모델보다 성능을 최대 50%까지 향상시킵니다. RDMA를 통한 NFS, pNFS 및 세션 트렁킹을 통해 고객은 기존 데이터 센터 네트워킹 인프라를 사용하여 차세대 애플리케이션에 필요한 높은 수준의 네트워크 성능을 달성할 수 있습니다. 고객은 SAN, NAS 및 개체 스토리지에 대한 통합된 다중 프로토콜 지원을 통해 확장하고 성장할 수 있으며, 온프레미스 또는 클라우드의 데이터에 대한 통합된 단일 ONTAP 데이터 관리 소프트웨어를 통해 최대한의 유연성을 제공할 수 있습니다. 또한 Active IQ 와 Cloud Insights 가 제공하는 AI 기반 예측 분석을 통해 시스템 상태를 최적화할 수 있습니다.
타협 없는 데이터 보안
AFF A90 시스템에는 NetApp 통합 및 애플리케이션 일관성을 갖춘 전체 데이터 보호 소프트웨어가 포함되어 있습니다. 이 솔루션은 사전 예방 및 공격 후 복구를 위한 내장형 데이터 보호 기능과 최첨단 랜섬웨어 방지 솔루션을 제공합니다. 악성 파일이 디스크에 기록되는 것을 차단할 수 있으며, 저장소 이상을 쉽게 모니터링하여 통찰력을 얻을 수 있습니다.
간소화된 무중단 업그레이드
AFF A90 기존 A800 고객에게 중단 없는 섀시 내부 업그레이드로 제공됩니다. NetApp 고급 안정성, 가용성, 서비스 용이성 및 관리 용이성(RASM) 기능을 통해 임무 수행에 중요한 운영을 간편하게 갱신하고 중단을 제거할 수 있도록 지원합니다. 또한 NetApp ONTAP 소프트웨어가 모든 시스템 구성 요소에 대한 펌웨어 업데이트를 자동으로 적용하므로 운영 효율성을 더욱 높이고 IT 팀의 일상 업무를 간소화합니다.
가장 큰 규모의 배포의 경우, AFF A1K 시스템은 가장 높은 성능과 용량 옵션을 제공하는 반면, AFF A70, AFF C800 과 같은 다른 NetApp 스토리지 시스템은 더 낮은 비용으로 더 작은 규모의 배포를 위한 옵션을 제공합니다.
NVIDIA DGX BasePOD
NVIDIA DGX BasePOD NVIDIA 하드웨어 및 소프트웨어 구성 요소, MLOps 솔루션, 타사 스토리지로 구성된 통합 솔루션입니다. NVIDIA 제품과 검증된 파트너 솔루션을 통해 확장형 시스템 설계의 모범 사례를 활용함으로써 고객은 AI 개발을 위한 효율적이고 관리하기 쉬운 플랫폼을 구현할 수 있습니다. 그림 1은 NVIDIA DGX BasePOD 의 다양한 구성 요소를 강조하여 보여줍니다.
NVIDIA DGX BasePOD 솔루션
NVIDIA DGX H100 시스템
NVIDIA DGX H100™ 시스템은 NVIDIA H100 Tensor Core GPU의 획기적인 성능으로 가속화된 AI 강자입니다.
NVIDIA DGX H100 시스템
DGX H100 시스템의 주요 사양은 다음과 같습니다. • 8개의 NVIDIA H100 GPU. • GPU당 80GB GPU 메모리, 총 640GB. • NVIDIA NVSwitch 칩 4개. • PCIe 5.0을 지원하는 듀얼 56코어 Intel Xeon Platinum 8480 프로세서. • 2TB DDR5 시스템 메모리. • 8개의 싱글 포트 NVIDIA ConnectX®-7(InfiniBand/Ethernet) 어댑터와 2개의 듀얼 포트 NVIDIA ConnectX-7(InfiniBand/Ethernet) 어댑터를 제공하는 4개의 OSFP 포트. • DGX OS용 1.92TB M.2 NVMe 드라이브 2개, 스토리지/캐시용 3.84TB U.2 NVMe 드라이브 8개. • 최대 전력 10.2kW. DGX H100 CPU 트레이의 후면 포트는 아래와 같습니다. OSFP 포트 4개는 InfiniBand 컴퓨팅 패브릭을 위한 8개의 ConnectX-7 어댑터를 지원합니다. 각 듀얼 포트 ConnectX-7 어댑터 쌍은 스토리지 및 관리 패브릭에 대한 병렬 경로를 제공합니다. 대역 외 포트는 BMC 액세스에 사용됩니다.
NVIDIA DGX H100 후면 패널
NVIDIA 네트워킹
NVIDIA Quantum-2 QM9700 스위치
NVIDIA Quantum-2 QM9700 InfiniBand 스위치
400Gb/s InfiniBand 연결 기능을 갖춘 NVIDIA Quantum-2 QM9700 스위치는 NVIDIA Quantum-2 InfiniBand BasePOD 구성의 컴퓨팅 패브릭에 전원을 공급합니다. ConnectX-7 단일 포트 어댑터는 InfiniBand 컴퓨팅 패브릭에 사용됩니다. 각 NVIDIA DGX 시스템은 각 QM9700 스위치에 이중으로 연결되어 있어 시스템 간에 여러 개의 고대역폭, 저지연 경로를 제공합니다.
NVIDIA Spectrum-3 SN4600 스위치
NVIDIA Spectrum-3 SN4600 스위치
NVIDIA Spectrum™-3 SN4600 스위치는 총 128개의 포트(스위치당 64개)를 제공하여 DGX BasePOD의 대역 내 관리를 위한 중복 연결을 제공합니다. NVIDIA SN4600 스위치는 1GbE~200GbE 사이의 속도를 제공할 수 있습니다. 이더넷을 통해 연결된 스토리지 어플라이언스의 경우 NVIDIA SN4600 스위치도 사용됩니다. NVIDIA DGX 듀얼 포트 ConnectX-7 어댑터의 포트는 대역 내 관리와 스토리지 연결에 모두 사용됩니다.
NVIDIA Spectrum SN2201 스위치
NVIDIA Spectrum SN2201 스위치
NVIDIA Spectrum SN2201 스위치는 대역 외 관리를 위한 연결을 제공하기 위해 48개의 포트를 제공합니다. 대역 외 관리 기능은 DGX BasePOD의 모든 구성 요소에 대한 통합 관리 연결을 제공합니다.
NVIDIA ConnectX-7 어댑터
NVIDIA ConnectX-7 어댑터
NVIDIA ConnectX-7 어댑터는 25/50/100/200/400G의 처리량을 제공할 수 있습니다. NVIDIA DGX 시스템은 단일 및 이중 포트 ConnectX-7 어댑터를 모두 사용하여 400Gb/s InfiniBand 및 이더넷을 통한 DGX BasePOD 배포에 유연성을 제공합니다.