NVA-1173 NetApp AIPod 및 NVIDIA DGX 시스템 - 하드웨어 구성 요소
이 섹션에서는 NVIDIA DGX 시스템이 지원되는 NetApp AIPod의 하드웨어 구성요소에 대해 중점적으로 다룹니다.
NetApp AFF 스토리지 시스템
NetApp AFF 최첨단 스토리지 시스템을 사용하면 IT 부서에서 업계 최고 수준의 성능, 탁월한 유연성, 클라우드 통합, 동급 최고의 데이터 관리 등을 통해 엔터프라이즈 스토리지 요구사항을 충족할 수 있습니다. 플래시 전용으로 설계된 AFF 시스템은 비즈니스 크리티컬 데이터를 더 빠르게 처리하고 관리, 보호할 수 있도록 지원합니다.
AFF A90 스토리지 시스템
NetApp ONTAP 데이터 관리 소프트웨어 기반의 NetApp AFF A90은 기본 데이터 보호, 선택적 랜섬웨어 방지 기능, 가장 중요한 비즈니스 워크로드를 지원하는 데 필요한 고성능 및 복원력을 제공합니다. 또한 미션 크리티컬 운영의 중단을 제거하고 성능 조정을 최소화하며 랜섬웨어 공격으로부터 데이터를 보호합니다. 다음과 같은 이점을 제공합니다. • 업계 최고의 성능 • 완벽한 데이터 보안 • 간소화된 무중단 업그레이드
_NetApp AFF A90 스토리지 시스템 _
업계 최고의 성능
AFF A90은 딥 러닝, AI, 고속 분석과 같은 차세대 워크로드와 Oracle, SAP HANA, Microsoft SQL Server, 가상 애플리케이션과 같은 기존 엔터프라이즈 데이터베이스를 손쉽게 관리합니다. 이 솔루션은 HA 쌍당 최대 2.4M IOPS와 지연 시간을 100µs의 낮은 속도로 비즈니스 크리티컬 애플리케이션을 최고 수준으로 실행하는 동시에, 이전 NetApp 모델에 비해 성능을 최대 50%까지 향상합니다. RDMA 기반 NFS, pNFS 및 Session Trunking을 사용하면 기존 데이터 센터 네트워킹 인프라를 사용하여 차세대 애플리케이션에 필요한 높은 수준의 네트워크 성능을 달성할 수 있습니다. 또한 고객은 SAN, NAS 및 오브젝트 스토리지에 대한 통합 멀티 프로토콜 지원을 통해 확장하고 성장할 수 있으며 온프레미스 또는 클라우드 데이터에 대한 통합 단일 ONTAP 데이터 관리 소프트웨어로 최대 유연성을 제공할 수 있습니다. 또한 Active IQ과 Cloud Insights에서 제공하는 AI 기반 예측 분석으로 시스템 상태를 최적화할 수 있습니다.
타협 없는 데이터 보안
AFF A90 시스템에는 NetApp 통합 및 애플리케이션 정합성을 보장하는 데이터 보호 소프트웨어의 전체 제품군이 포함되어 있습니다. 선점 및 공격 후 복구를 위한 내장 데이터 보호 및 최첨단 랜섬웨어 방지 솔루션을 제공합니다. 악성 파일은 디스크에 기록되는 것을 막아낼 수 있으며, 저장 문제를 쉽게 모니터링하여 통찰력을 얻을 수 있습니다.
단순화된 무중단 업그레이드
AFF A90은 기존 A800 고객을 위한 무중단 섀시 내 업그레이드로 사용할 수 있습니다. NetApp은 우수한 안정성, 가용성, 서비스 가능성 및 관리성(RASM) 기능을 통해 간단히 업데이트하고 미션 크리티컬 운영 중단을 제거합니다. 또한, NetApp ONTAP 소프트웨어는 모든 시스템 구성 요소에 대해 펌웨어 업데이트를 자동으로 적용하므로 운영 효율성을 높이고 IT 팀의 일상적인 활동을 간소화합니다.
대규모 구축의 경우 AFF A1K 시스템은 최고의 성능과 용량 옵션을 제공하는 한편, AFF A70 및 AFF C800와 같은 다른 NetApp 스토리지 시스템은 저렴한 비용으로 소규모 구축에 필요한 옵션을 제공합니다.
NVIDIA DGX 베이스POD
NVIDIA DGX BasePOD는 NVIDIA 하드웨어 및 소프트웨어 구성 요소, MLOps 솔루션, 타사 스토리지로 구성된 통합 솔루션입니다. 고객은 NVIDIA 제품과 검증된 파트너 솔루션으로 스케일아웃 시스템 설계의 모범 사례를 활용하여 AI 개발을 위한 효율적이고 관리하기 쉬운 플랫폼을 구축할 수 있습니다. 그림 1은 NVIDIA DGX BasePOD의 다양한 구성 요소를 보여줍니다.
NVIDIA DGX BasePOD 솔루션
NVIDIA DGX H100 시스템
NVIDIA DGX H100 및 #8482; 시스템은 NVIDIA H100 Tensor 코어 GPU의 획기적인 성능을 통해 가속화된 AI 파워하우스입니다.
_NVIDIA DGX H100 시스템 _
DGX H100 시스템의 주요 사양은 다음과 같습니다. • 8개의 NVIDIA H100 GPU. GPU당 • 80GB GPU 메모리, 총 640GB • NVIDIA NVSwitch ™ 칩 4개 • PCIe 5.0을 지원하는 듀얼 56코어 인텔 ® 제온 ® 플래티넘 8480 프로세서. • 2TB의 DDR5 시스템 메모리. • 8개의 단일 포트 NVIDIA ConnectX 및 #174; -7(InfiniBand/이더넷) 어댑터 및 2개의 듀얼 포트 NVIDIA ConnectX-7(InfiniBand/이더넷) 어댑터를 제공하는 OSFP 포트 4개. • DGX OS용 1.92TB M.2 NVMe 드라이브 2개, 스토리지/캐시용 3.84TB U.2 NVMe 드라이브 8개 • 10.2kW 최대 출력. DGX H100 CPU 트레이의 후면 포트는 아래에 나와 있습니다. OSFP 포트 4개는 InfiniBand 컴퓨팅 패브릭에 8개의 ConnectX-7 어댑터를 제공합니다. 각 듀얼 포트 ConnectX-7 어댑터 쌍은 스토리지 및 관리 패브릭에 대한 병렬 경로를 제공합니다. 대역외 포트는 BMC 액세스에 사용됩니다.
_NVIDIA DGX H100 후면 패널 _
NVIDIA 네트워킹
NVIDIA Quantum-2 QM9700 스위치
_NVIDIA Quantum-2 QM9700 InfiniBand 스위치 _
NVIDIA Quantum-2 QM9700 스위치는 400GB/s InfiniBand 연결 기능을 갖추고 있으며 NVIDIA Quantum-2 InfiniBand BasePOD 구성의 컴퓨팅 패브릭에 전력을 공급합니다. ConnectX-7 단일 포트 어댑터는 InfiniBand 컴퓨팅 패브릭에 사용됩니다. 각 NVIDIA DGX 시스템은 각 QM9700 스위치에 대한 이중 연결을 제공하므로 시스템 간에 대역폭이 높고 지연 시간이 짧은 경로를 여러 개 제공합니다.
NVIDIA Spectrum-3 SN4600 스위치
_NVIDIA Spectrum-3 SN4600 스위치 _
NVIDIA 스펙트럼 및 #8482; -3 SN4600 스위치는 총 128개의 포트(스위치당 64개)를 제공하여 DGX BasePOD의 대역 내 관리를 위한 이중화 연결을 제공합니다. NVIDIA SN4600 스위치는 1GbE 및 200GbE 사이의 속도를 제공할 수 있습니다. 이더넷을 통해 연결된 스토리지 어플라이언스의 경우 NVIDIA SN4600 스위치도 사용됩니다. NVIDIA DGX 이중 포트 ConnectX-7 어댑터의 포트는 대역 내 관리 및 스토리지 연결에 모두 사용됩니다.
NVIDIA Spectrum SN2201 스위치
_NVIDIA Spectrum SN2201 스위치 _
NVIDIA Spectrum SN2201 스위치는 대역 외 관리를 위한 연결을 제공하는 48개의 포트를 제공합니다. 대역 외 관리는 DGX BasePOD의 모든 구성 요소에 대한 통합 관리 연결을 제공합니다.
NVIDIA ConnectX-7 어댑터
_NVIDIA ConnectX-7 어댑터 _
NVIDIA ConnectX-7 어댑터는 25/50/100/200/400G의 처리량을 제공할 수 있습니다. NVIDIA DGX 시스템은 단일 포트 및 이중 포트 ConnectX-7 어댑터를 모두 사용하여 400GB/s InfiniBand 및 이더넷을 사용하는 DGX BasePOD 구축에 유연성을 제공합니다.