Skip to main content
NetApp artificial intelligence solutions
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

기술 개요

기여자 kevin-hoke

이 섹션에서는 이 솔루션의 주요 구성 요소를 더 자세히 소개합니다.

NetApp AFF 시스템

NetApp AFF 스토리지 시스템을 사용하면 업계 최고의 성능, 뛰어난 유연성, 클라우드 통합, 동급 최고의 데이터 관리 기능을 통해 기업의 스토리지 요구 사항을 충족할 수 있습니다. 플래시에 맞춰 특별히 설계된 AFF 시스템은 비즈니스에 중요한 데이터를 가속화하고 관리하며 보호하는 데 도움이 됩니다.

이 그래픽은 NetApp AFF A400 스토리지 컨트롤러의 전면을 보여줍니다.

이 그래픽은 NetApp AFF A400 스토리지 컨트롤러의 뒷면을 보여줍니다.

NetApp AFF A400 다음 기능을 포함하는 중급 NVMe 플래시 스토리지 시스템입니다.

  • 최대 유효 용량: ~20PB

  • 최대 확장: 2~24개 노드(12개 HA 쌍)

  • 25GbE 및 16Gb FC 호스트 지원

  • NVMe 확장 스토리지 선반에 대한 100GbE RDMA over Converged Ethernet(RoCE) 연결

  • NVMe 셸프가 연결되지 않은 경우 100GbE RoCE 포트를 호스트 네트워크 연결에 사용할 수 있습니다.

  • 전체 12Gbps SAS 연결 확장 스토리지 선반

  • 두 가지 구성으로 제공됩니다.

    • 이더넷: 4x 25Gb 이더넷(SFP28) 포트

    • 파이버 채널: 4x 16Gb FC(SFP+) 포트

  • 100% 8KB 랜덤 읽기 @.4ms 400k IOPS

엔트리 레벨 AI/ML 배포를 위한 NetApp AFF A250 기능은 다음과 같습니다.

  • 최대 유효 용량: 35PB

  • 최대 확장: 2~24개 노드(12개 HA 쌍)

  • 440k IOPS 랜덤 읽기 @1ms

  • 최신 NetApp ONTAP 릴리스 ONTAP 9.8 이상을 기반으로 구축됨

  • HA 및 클러스터 상호 연결을 위한 2개의 25Gb 이더넷 포트

NetApp 또한 대규모 AI/ML 배포에 더 높은 성능과 확장성을 제공하는 AFF A800 및 AFF A700 과 같은 다른 스토리지 시스템을 제공합니다.

NetApp ONTAP

NetApp 의 최신 스토리지 관리 소프트웨어인 ONTAP 9를 사용하면 기업이 인프라를 현대화하고 클라우드 지원 데이터 센터로 전환할 수 있습니다. ONTAP 업계 최고의 데이터 관리 역량을 활용하여 데이터가 어디에 있든 단일 도구 세트를 사용하여 데이터를 관리하고 보호할 수 있도록 지원합니다. 데이터는 필요한 곳, 즉 엣지, 코어, 클라우드로 자유롭게 이동할 수 있습니다. ONTAP 9에는 하이브리드 클라우드 아키텍처 전반에서 데이터 관리를 간소화하고, 중요 데이터를 가속화하고 보호하며, 미래 지향적인 인프라를 구축하는 다양한 기능이 포함되어 있습니다.

데이터 관리 간소화

적절한 리소스가 애플리케이션과 데이터 세트에 사용되도록 하려면 기업 IT 운영에 데이터 관리가 필수적입니다. ONTAP 에는 다음과 같은 기능이 포함되어 있어 운영을 간소화하고 단순화하며 총 운영 비용을 절감할 수 있습니다.

  • 인라인 데이터 압축 및 확장된 중복 제거. 데이터 압축은 저장 블록 내부의 낭비되는 공간을 줄이고, 중복 제거는 효과적인 용량을 크게 증가시킵니다. 이는 로컬에 저장된 데이터와 클라우드에 계층화된 데이터 모두에 적용됩니다.

  • 최소, 최대 및 적응형 서비스 품질(QoS). 세분화된 QoS 제어는 공유 빈도가 높은 환경에서 중요한 애플리케이션의 성능 수준을 유지하는 데 도움이 됩니다.

  • * ONTAP FabricPool.* 이 기능은 콜드 데이터를 Amazon Web Services(AWS), Azure, NetApp StorageGRID 객체 스토리지를 포함한 퍼블릭 및 프라이빗 클라우드 스토리지 옵션으로 자동으로 계층화합니다.

데이터 가속화 및 보호

ONTAP 뛰어난 수준의 성능과 데이터 보호 기능을 제공하며 다음과 같은 방식으로 이러한 기능을 확장합니다.

  • 성능과 낮은 지연 시간. ONTAP 가능한 가장 낮은 지연 시간으로 가능한 가장 높은 처리량을 제공합니다.

  • 데이터 보호. ONTAP 모든 플랫폼에서 공통적으로 관리할 수 있는 내장형 데이터 보호 기능을 제공합니다.

  • * NetApp 볼륨 암호화.* ONTAP 온보드 및 외부 키 관리 지원을 통해 기본 볼륨 수준 암호화를 제공합니다.

미래 지향적 인프라

ONTAP 9는 까다롭고 끊임없이 변화하는 비즈니스 요구 사항을 충족하는 데 도움이 됩니다.

  • 원활한 확장 및 중단 없는 운영. ONTAP 기존 컨트롤러뿐만 아니라 확장형 클러스터에도 중단 없이 용량을 추가할 수 있도록 지원합니다. 고객은 비용이 많이 드는 데이터 마이그레이션이나 중단 없이 NVMe 및 32Gb FC와 같은 최신 기술로 업그레이드할 수 있습니다.

  • 클라우드 연결. ONTAP 모든 퍼블릭 클라우드에서 소프트웨어 정의 스토리지(ONTAP Select)와 클라우드 기반 인스턴스(Google Cloud NetApp Volumes)에 대한 옵션을 제공하는 가장 클라우드에 연결된 스토리지 관리 소프트웨어입니다.

  • 새로운 애플리케이션과의 통합. ONTAP 기존 엔터프라이즈 앱을 지원하는 동일한 인프라를 사용하여 OpenStack, Hadoop, MongoDB와 같은 차세대 플랫폼과 애플리케이션을 위한 엔터프라이즈급 데이터 서비스를 제공합니다.

NetApp FlexGroup 볼륨

훈련 데이터 세트는 일반적으로 잠재적으로 수십억 개의 파일로 구성된 컬렉션입니다. 파일에는 텍스트, 오디오, 비디오 및 기타 형태의 비정형 데이터가 포함될 수 있으며, 이러한 데이터는 병렬로 읽을 수 있도록 저장하고 처리해야 합니다. 저장 시스템은 많은 작은 파일을 저장해야 하며 순차적이고 무작위적인 I/O를 위해 해당 파일을 병렬로 읽어야 합니다.

FlexGroup 볼륨(다음 그림)은 여러 구성 멤버 볼륨으로 이루어진 단일 네임스페이스로, 스토리지 관리자에게 NetApp FlexVol volume 처럼 관리되고 작동합니다. FlexGroup 볼륨의 파일은 개별 멤버 볼륨에 할당되며 볼륨이나 노드에 걸쳐 스트라이프되지 않습니다. 다음과 같은 기능을 제공합니다.

  • 최대 20페타바이트의 용량과 높은 메타데이터 워크로드를 위한 예측 가능한 낮은 대기 시간

  • 동일한 네임스페이스에 최대 4000억 개의 파일

  • CPU, 노드, 집계 및 구성 FlexVol 볼륨 전반의 NAS 워크로드에서 병렬화된 작업

이 이미지는 FlexGroup 내에 주요 파일이 있는 여러 볼륨을 포함하는 HA 스토리지 컨트롤러 쌍을 보여줍니다.

레노버 ThinkSystem 포트폴리오

Lenovo ThinkSystem 서버는 오늘날 고객이 직면한 과제를 해결하는 혁신적인 하드웨어, 소프트웨어 및 서비스를 갖추고 있으며, 미래의 과제를 해결하기 위해 진화적이고 목적에 맞는 모듈식 설계 방식을 제공합니다. 이러한 서버는 업계 표준의 최고 기술과 차별화된 Lenovo 혁신 기술을 결합하여 x86 서버에서 가능한 가장 큰 유연성을 제공합니다.

Lenovo ThinkSystem 서버를 구축하는 주요 이점은 다음과 같습니다.

  • 비즈니스와 함께 성장하는 확장성이 뛰어난 모듈식 디자인

  • 업계 최고의 복원력으로 예상치 못한 고비용 가동 중단 시간을 절약합니다.

  • 더 낮은 대기 시간, 더 빠른 응답 시간, 더 스마트한 실시간 데이터 관리를 위한 빠른 플래시 기술

AI 분야에서 Lenovo는 기업이 자사 워크로드에 ML과 AI의 이점을 이해하고 도입할 수 있도록 돕기 위해 실용적인 접근 방식을 취하고 있습니다. Lenovo 고객은 Lenovo AI 혁신 센터에서 Lenovo AI 제품을 탐색하고 평가하여 특정 사용 사례에 대한 가치를 완벽하게 이해할 수 있습니다. 가치 실현 시간을 단축하기 위해 이러한 고객 중심적 접근 방식은 고객에게 AI에 맞게 사용할 준비가 되고 최적화된 솔루션 개발 플랫폼에 대한 개념 증명을 제공합니다.

레노버 SR670 V2

Lenovo ThinkSystem SR670 V2 랙 서버는 가속화된 AI와 고성능 컴퓨팅(HPC)을 위한 최적의 성능을 제공합니다. 최대 8개의 GPU를 지원하는 SR670 V2는 ML, DL 및 추론의 계산 집약적 워크로드 요구 사항에 적합합니다.

이 이미지는 SR670의 세 가지 구성을 보여줍니다.  첫 번째는 8개의 2.5인치 HS 드라이브와 2개의 PCIe I/O 슬롯이 있는 4개의 SXM GPU를 보여줍니다.  두 번째는 4개의 더블 폭 또는 8개의 싱글 폭 GPU 슬롯과 8개의 2.5인치 또는 4개의 3.5인치 HS 드라이브가 있는 2개의 PCIe I/O 슬롯을 보여줍니다.  세 번째는 6개의 EDSFF HS 드라이브와 2개의 PCIe I/O 슬롯이 있는 8개의 더블 폭 GPU 슬롯을 보여줍니다.

최신 확장 가능한 Intel Xeon CPU를 탑재하고 하이엔드 GPU( NVIDIA A100 80GB PCIe 8x GPU 포함)를 지원하는 ThinkSystem SR670 V2는 AI 및 HPC 워크로드에 최적화되고 가속화된 성능을 제공합니다.

점점 더 많은 워크로드가 가속기의 성능을 사용하게 되면서 GPU 밀도에 대한 요구도 늘어났습니다. 소매, 금융 서비스, 에너지, 의료 등의 산업에서는 GPU를 사용하여 ML, DL, 추론 기술을 통해 더 많은 통찰력을 추출하고 혁신을 추진하고 있습니다.

ThinkSystem SR670 V2는 차세대 플랫폼을 갖춘 슈퍼컴퓨팅 클러스터의 데이터 센터 밀도를 유지하면서 시스템 성능을 극대화하여 프로덕션에서 가속화된 HPC 및 AI 워크로드를 배포하기 위한 최적화된 엔터프라이즈급 솔루션입니다.

다른 기능은 다음과 같습니다.

  • 고속 네트워크 어댑터가 GPU에 직접 연결되어 I/O 성능을 극대화하는 GPU 직접 RDMA I/O를 지원합니다.

  • NVMe 드라이브가 GPU에 직접 연결되어 스토리지 성능을 극대화하는 GPU 직접 스토리지를 지원합니다.

MLPerf

MLPerf는 AI 성능을 평가하는 업계 최고의 벤치마크 제품군입니다. 이 검증에서는 가장 인기 있는 AI 프레임워크 중 하나인 MXNet의 이미지 분류 벤치마크를 사용했습니다. MXNet_benchmarks 교육 스크립트는 AI 교육을 구동하는 데 사용되었습니다. 이 스크립트는 여러 가지 인기 있는 기존 모델의 구현을 포함하고 있으며 가능한 한 빠르게 실행되도록 설계되었습니다. 단일 머신에서 실행하거나 여러 호스트에 분산 모드로 실행할 수 있습니다.