로컬 연결 스토리지를 위한 ONTAP Select 소프트웨어 RAID 구성 서비스
소프트웨어 RAID는 ONTAP 소프트웨어 스택 내에 구현된 RAID 추상화 계층입니다. FAS 와 같은 기존 ONTAP 플랫폼의 RAID 계층과 동일한 기능을 제공합니다. RAID 계층은 드라이브 패리티 계산을 수행하고 ONTAP Select 노드 내에서 개별 드라이브 장애에 대한 보호 기능을 제공합니다.
ONTAP Select 하드웨어 RAID 구성과 관계없이 소프트웨어 RAID 옵션도 제공합니다. ONTAP Select 소형 폼 팩터 상용 하드웨어에 구축된 경우와 같이 특정 환경에서는 하드웨어 RAID 컨트롤러를 사용할 수 없거나 바람직하지 않을 수 있습니다. 소프트웨어 RAID는 이러한 환경을 포함하도록 사용 가능한 구축 옵션을 확장합니다. 환경에서 소프트웨어 RAID를 활성화하려면 다음 사항을 기억하십시오.
-
프리미엄 또는 프리미엄 XL 라이선스로 제공됩니다.
-
ONTAP 루트 및 데이터 디스크의 경우 SSD 또는 NVMe(Premium XL 라이선스 필요) 드라이브만 지원합니다.
-
ONTAP Select VM 부팅 파티션에 별도의 시스템 디스크가 필요합니다.
-
시스템 디스크(멀티 노드 설정의 NVRAM, 부팅/CF 카드, 코어 덤프, 미디어레이터)에 대한 데이터 저장소를 생성하려면 SSD 또는 NVMe 드라이브 중 하나를 별도의 디스크로 선택합니다.
-
참고사항
-
서비스 디스크와 시스템 디스크라는 용어는 같은 의미로 사용됩니다.
-
서비스 디스크는 ONTAP Select VM 내에서 클러스터링, 부팅 등 다양한 항목을 서비스하는 데 사용되는 VMDK입니다.
-
서비스 디스크는 호스트에서 볼 때 단일 물리적 디스크(통칭하여 서비스/시스템 물리적 디스크)에 물리적으로 위치합니다. 해당 물리적 디스크에는 DAS 데이터 저장소가 있어야 합니다. ONTAP Deploy는 클러스터 배포 중에 ONTAP Select VM에 대한 이러한 서비스 디스크를 생성합니다.
-
-
ONTAP Select 시스템 디스크를 여러 데이터 저장소나 여러 물리적 드라이브에 걸쳐 더 이상 분리할 수 없습니다.
-
하드웨어 RAID는 더 이상 사용되지 않습니다.
로컬 연결 스토리지를 위한 소프트웨어 RAID 구성
소프트웨어 RAID를 사용할 때는 하드웨어 RAID 컨트롤러가 없는 것이 이상적이지만, 시스템에 기존 RAID 컨트롤러가 있는 경우 다음 요구 사항을 준수해야 합니다.
-
디스크가 시스템(JBOD)에 직접 표시될 수 있도록 하드웨어 RAID 컨트롤러를 비활성화해야 합니다. 이 변경은 일반적으로 RAID 컨트롤러 BIOS에서 수행할 수 있습니다.
-
또는 하드웨어 RAID 컨트롤러가 SAS HBA 모드여야 합니다. 예를 들어, 일부 BIOS 구성에서는 RAID 외에도 "AHCI" 모드를 허용하며, 이를 선택하여 JBOD 모드를 활성화할 수 있습니다. 이렇게 하면 패스스루가 활성화되어 호스트에서 물리적 드라이브를 있는 그대로 볼 수 있습니다.
컨트롤러에서 지원하는 최대 드라이브 수에 따라 추가 컨트롤러가 필요할 수 있습니다. SAS HBA 모드에서는 IO 컨트롤러(SAS HBA)가 최소 6Gb/s 속도를 지원하는지 확인하십시오. 단, NetApp 12Gbps 속도를 권장합니다.
다른 하드웨어 RAID 컨트롤러 모드나 구성은 지원되지 않습니다. 예를 들어, 일부 컨트롤러는 디스크 패스스루를 인위적으로 활성화하는 RAID 0 지원을 허용하지만, 그로 인한 부작용이 발생할 수 있습니다. 지원되는 물리적 디스크(SSD만 해당) 크기는 200GB~16TB입니다.
|
관리자는 ONTAP Select VM에서 사용 중인 드라이브를 추적하고 호스트에서 해당 드라이브가 실수로 사용되는 것을 방지해야 합니다. |
ONTAP Select
하드웨어 RAID 컨트롤러를 사용하는 구성의 경우, RAID 컨트롤러가 물리적 디스크 중복성을 제공합니다. ONTAP Select ONTAP 관리자가 데이터 집계를 구성할 수 있는 하나 이상의 VMDK와 함께 제공됩니다. 이러한 VMDK는 RAID 0 형식으로 스트라이핑됩니다. ONTAP 소프트웨어 RAID는 하드웨어 수준에서 제공되는 복원력으로 인해 중복되고 비효율적이며 비효과적이기 때문입니다. 또한, 시스템 디스크에 사용되는 VMDK는 사용자 데이터 저장에 사용되는 VMDK와 동일한 데이터 저장소에 있습니다.
소프트웨어 RAID를 사용할 때 ONTAP Deploy는 SSD의 가상 디스크(VMDK)와 물리적 디스크 RDM(Raw Device Mapping) 및 NVMe의 패스스루 또는 DirectPath IO 장치 세트를 사용하여 ONTAP Select 제공합니다.
다음 그림은 이러한 관계를 더 자세히 보여주며 ONTAP Select VM 내부에 사용되는 가상화된 디스크와 사용자 데이터를 저장하는 데 사용되는 물리적 디스크 간의 차이점을 강조합니다.
-
ONTAP Select 소프트웨어 RAID: 가상화된 디스크 및 RDM 사용*
시스템 디스크(VMDK)는 동일한 데이터 저장소와 동일한 물리적 디스크에 상주합니다. 가상 NVRAM 디스크에는 빠르고 내구성 있는 매체가 필요합니다. 따라서 NVMe 및 SSD 유형의 데이터 저장소만 지원됩니다.
시스템 디스크(VMDK)는 동일한 데이터 저장소와 동일한 물리적 디스크에 상주합니다. 가상 NVRAM 디스크는 빠르고 내구성 있는 미디어를 필요로 합니다. 따라서 NVMe 및 SSD 유형의 데이터 저장소만 지원됩니다. 데이터에 NVMe 드라이브를 사용하는 경우, 성능상의 이유로 시스템 디스크도 NVMe 장치여야 합니다. 모든 NVMe 구성에서 시스템 디스크로 적합한 후보는 인텔 Optane 카드입니다.
|
현재 릴리스에서는 ONTAP Select 시스템 디스크를 여러 데이터 저장소나 여러 물리적 드라이브로 더 이상 분리할 수 없습니다. |
각 데이터 디스크는 세 부분으로 나뉩니다. 작은 루트 파티션(스트라이프)과 동일한 크기의 두 파티션으로, ONTAP Select VM 내에서 두 개의 데이터 디스크가 표시됩니다. 파티션은 다음 그림에 표시된 대로 단일 노드 클러스터와 HA 쌍의 노드에 대해 RD2(Root Data Data) 스키마를 사용합니다.
P
패리티 드라이브를 나타냅니다. DP
듀얼 패리티 드라이브를 나타냅니다. S
예비 드라이브를 나타냅니다.
단일 노드 클러스터를 위한 RDD 디스크 분할
다중 노드 클러스터(HA 쌍)에 대한 RDD 디스크 분할
ONTAP 소프트웨어 RAID는 RAID 4, RAID-DP, RAID-TEC 와 같은 RAID 유형을 지원합니다. 이는 FAS 및 AFF 플랫폼에서 사용하는 것과 동일한 RAID 구성입니다. 루트 프로비저닝을 위해 ONTAP Select RAID 4와 RAID-DP만 지원합니다. 데이터 집계에 RAID-TEC 사용하는 경우 전체 보호는 RAID-DP로 설정됩니다. ONTAP Select HA는 각 노드의 구성을 다른 노드에 복제하는 비공유 아키텍처를 사용합니다. 즉, 각 노드는 자신의 루트 파티션과 피어의 루트 파티션 사본을 저장해야 합니다. 데이터 디스크에는 단일 루트 파티션이 있으므로, ONTAP Select 노드가 HA 쌍에 속하는지 여부에 따라 최소 데이터 디스크 수가 달라집니다.
단일 노드 클러스터의 경우 모든 데이터 파티션은 로컬(활성) 데이터를 저장하는 데 사용됩니다. HA 쌍에 속한 노드의 경우, 하나의 데이터 파티션은 해당 노드의 로컬(활성) 데이터를 저장하는 데 사용되고, 두 번째 데이터 파티션은 HA 피어의 활성 데이터를 미러링하는 데 사용됩니다.
패스스루(DirectPath IO) 장치 대 원시 장치 맵(RDM)
VMware ESX는 현재 NVMe 디스크를 원시 장치 맵으로 지원하지 않습니다. ONTAP Select 에서 NVMe 디스크를 직접 제어하려면 ESX에서 NVMe 드라이브를 패스스루 장치로 구성해야 합니다. NVMe 장치를 패스스루 장치로 구성하려면 서버 BIOS의 지원이 필요하며 ESX 호스트를 재부팅해야 하는 중단 프로세스입니다. 또한 ESX 호스트당 최대 패스스루 장치 수는 16개입니다. 그러나 ONTAP Deploy에서는 이를 14개로 제한합니다. ONTAP Select 노드당 NVMe 장치 수가 14개로 제한되므로 모든 NVMe 구성은 총 용량을 희생하여 매우 높은 IOP 밀도(IOP/TB)를 제공합니다. 또는 더 큰 스토리지 용량을 갖춘 고성능 구성이 필요한 경우 권장되는 구성은 큰 ONTAP Select VM 크기, 시스템 디스크용 INTEL Optane 카드, 데이터 스토리지용 공칭 SSD 드라이브 수입니다.
|
NVMe 성능을 최대한 활용하려면 대용량 ONTAP Select VM 크기를 고려하세요. |
패스스루 장치와 RDM 사이에는 또 다른 차이점이 있습니다. RDM은 실행 중인 VM에 매핑할 수 있습니다. 패스스루 장치는 VM 재부팅이 필요합니다. 즉, NVMe 드라이브 교체 또는 용량 확장(드라이브 추가) 절차에는 ONTAP Select VM 재부팅이 필요합니다. 드라이브 교체 및 용량 확장(드라이브 추가) 작업은 ONTAP Deploy의 워크플로에 따라 진행됩니다. ONTAP Deploy는 단일 노드 클러스터의 ONTAP Select 재부팅과 HA 쌍의 장애 조치/장애 복구를 관리합니다. 그러나 SSD 데이터 드라이브로 작업하는 경우( ONTAP Select 재부팅/장애 조치가 필요 없음)와 NVMe 데이터 드라이브로 작업하는 경우(ONTAP Select 재부팅/장애 조치가 필요함)의 차이점을 알아두는 것이 중요합니다.
물리적 및 가상 디스크 프로비저닝
더욱 간소화된 사용자 환경을 제공하기 위해 ONTAP Deploy는 지정된 데이터 저장소(물리적 시스템 디스크)에서 시스템(가상) 디스크를 자동으로 프로비저닝하고 ONTAP Select VM에 연결합니다. 이 작업은 ONTAP Select VM이 부팅될 수 있도록 초기 설정 과정에서 자동으로 수행됩니다. RDM은 분할되고 루트 집계는 자동으로 구축됩니다. ONTAP Select 노드가 HA 쌍에 속하는 경우, 데이터 파티션은 로컬 스토리지 풀과 미러 스토리지 풀에 자동으로 할당됩니다. 이 할당은 클러스터 생성 작업과 스토리지 추가 작업 모두에서 자동으로 수행됩니다.
ONTAP Select VM의 데이터 디스크는 기본 물리적 디스크와 연결되어 있으므로 물리적 디스크 수가 많은 구성을 만들면 성능에 영향을 미칩니다.
|
루트 애그리게이션의 RAID 그룹 유형은 사용 가능한 디스크 수에 따라 달라집니다. ONTAP Deploy는 적절한 RAID 그룹 유형을 선택합니다. 노드에 할당된 디스크가 충분하면 RAID-DP를 사용하고, 그렇지 않으면 RAID-4 루트 애그리게이션을 생성합니다. |
소프트웨어 RAID를 사용하여 ONTAP Select VM에 용량을 추가할 때 관리자는 물리적 드라이브 크기와 필요한 드라이브 수를 고려해야 합니다. 자세한 내용은 섹션을 참조하세요. "저장 용량을 늘리세요" .
FAS 및 AFF 시스템과 마찬가지로 기존 RAID 그룹에는 동일하거나 더 큰 용량의 드라이브만 추가할 수 있습니다. 용량이 큰 드라이브는 적절한 크기입니다. 새 RAID 그룹을 생성하는 경우, 전체 성능 저하를 방지하기 위해 새 RAID 그룹 크기가 기존 RAID 그룹 크기와 일치해야 합니다.
ONTAP Select 디스크를 해당 ESX 디스크에 일치시킵니다.
ONTAP Select 디스크는 일반적으로 NET xy로 표시됩니다. 다음 ONTAP 명령을 사용하여 디스크 UUID를 얻을 수 있습니다.
<system name>::> disk show NET-1.1 Disk: NET-1.1 Model: Micron_5100_MTFD Serial Number: 1723175C0B5E UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000 BPS: 512 Physical Size: 894.3GB Position: shared Checksum Compatibility: advanced_zoned Aggregate: - Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
ESXi 셸에서 다음 명령을 입력하면 해당 물리적 디스크(naa.unique-id로 식별)의 LED를 깜박일 수 있습니다.
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
소프트웨어 RAID 사용 시 여러 드라이브 오류 발생
시스템에서 여러 드라이브가 동시에 고장 상태인 상황이 발생할 수 있습니다. 시스템 동작은 RAID 보호 구성과 고장난 드라이브 수에 따라 달라집니다.
RAID4 집계는 디스크 1개 장애를 견딜 수 있고, RAID-DP 집계는 디스크 2개 장애를 견딜 수 있으며, RAID-TEC 집계는 디스크 3개 장애를 견딜 수 있습니다.
장애가 발생한 디스크 수가 RAID 유형이 지원하는 최대 장애 수보다 적고 예비 디스크를 사용할 수 있는 경우, 재구성 프로세스가 자동으로 시작됩니다. 예비 디스크를 사용할 수 없는 경우, 집계는 예비 디스크가 추가될 때까지 성능이 저하된 상태로 데이터를 제공합니다.
장애가 발생한 디스크 수가 RAID 유형이 지원하는 최대 장애 수보다 많으면 로컬 플렉스는 장애로 표시되고 집계 상태는 저하됩니다. 데이터는 HA 파트너에 있는 두 번째 플렉스에서 제공됩니다. 즉, 노드 1에 대한 모든 I/O 요청은 클러스터 상호 연결 포트 e0e(iSCSI)를 통해 노드 2에 물리적으로 위치한 디스크로 전송됩니다. 두 번째 플렉스에도 장애가 발생하면 집계 상태는 장애로 표시되고 데이터를 사용할 수 없습니다.
제대로 된 데이터 미러링을 재개하려면 실패한 플렉스를 삭제하고 다시 만들어야 합니다. 다중 디스크 장애로 인해 데이터 집계의 성능이 저하되면 루트 집계의 성능도 저하됩니다. ONTAP Select 루트-데이터-데이터(RDD) 파티셔닝 스키마를 사용하여 각 물리적 드라이브를 루트 파티션 하나와 두 개의 데이터 파티션으로 분할합니다. 따라서 하나 이상의 디스크가 손실되면 로컬 루트 또는 원격 루트 집계의 복사본, 로컬 데이터 집계 및 원격 데이터 집계의 복사본을 포함한 여러 집계에 영향을 미칠 수 있습니다.
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
|
하나 또는 여러 개의 드라이브 오류를 테스트하거나 시뮬레이션하려면 다음을 사용하십시오. storage disk fail -disk NET-x.y -immediate 명령입니다. 시스템에 예비 메모리가 있는 경우 집계가 재구성을 시작합니다. 명령을 사용하여 재구성 상태를 확인할 수 있습니다 storage aggregate show . ONTAP Deploy를 사용하여 시뮬레이션된 실패 드라이브를 제거할 수 있습니다. ONTAP은 드라이브를 Broken . 드라이브는 실제로 손상되지 않았으며 ONTAP Deploy를 사용하여 다시 추가할 수 있습니다. 레이블을 지우려면 ONTAP Select CLI에 다음 명령을 입력하세요.
|
set advanced disk unfail -disk NET-x.y -spare true disk show -broken
마지막 명령에 대한 출력은 비어 있어야 합니다.
가상화된 NVRAM
NetApp FAS 시스템에는 전통적으로 물리적 NVRAM PCI 카드가 장착되어 있습니다. 이 카드는 비휘발성 플래시 메모리를 탑재한 고성능 카드로, 쓰기 성능을 크게 향상시킵니다. ONTAP 수신되는 쓰기 요청을 클라이언트로 즉시 인식할 수 있습니다. 또한, 디스테이징(destaging)이라는 프로세스를 통해 수정된 데이터 블록을 느린 저장 매체로 다시 이동하도록 예약할 수 있습니다.
상용 시스템에는 일반적으로 이러한 유형의 장비가 장착되어 있지 않습니다. 따라서 NVRAM 카드의 기능은 가상화되어 ONTAP Select 시스템 부팅 디스크의 파티션에 배치되었습니다. 이러한 이유로 인스턴스의 시스템 가상 디스크 배치가 매우 중요합니다.