Skip to main content
本製品の最新リリースがご利用いただけます。
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ローカル接続ストレージ用のONTAP Selectソフトウェア RAID 構成サービス

ソフトウェアRAIDは、ONTAPストレージ スタック内に実装されたRAID抽象化レイヤです。FASなどの従来のONTAPプラットフォーム内のRAIDレイヤと同じ機能を提供します。RAIDレイヤは、ドライブ パリティの計算を実行し、ONTAP Selectノード内の個々のドライブ障害に対する保護を提供します。

ハードウェアRAID構成とは無関係に、ONTAP Selectはソフトウェア RAIDオプションも提供しています。ハードウェアRAIDコントローラは、特定の環境では利用できないか、望ましくない場合があります(ONTAP Selectが小型フォームファクタのコモディティ ハードウェアに導入されている場合など)。ソフトウェア RAIDは、このような環境を含むように、利用可能な導入オプションを拡張します。お使いの環境でソフトウェア RAIDを有効にするには、以下の点に注意してください:

  • Premium ライセンスまたは Premium XL ライセンスで利用可能です。

  • ONTAPルートディスクとデータディスクには、SSDまたはNVMe(Premium XLライセンスが必要)ドライブのみをサポートします。

  • ONTAP Select VMブートパーティション用に別のシステムディスクが必要です。

    • システムディスクのデータストアを作成するには、SSDまたはNVMeドライブのいずれかの別のディスクを選択します(NVRAM、ブート/CFカード、コアダンプ、およびマルチノード構成におけるメディエーター)。

メモ
  • サービスディスクとシステムディスクという用語は、同義語として使われる。

    • サービスディスクは、ONTAP Select VM内でクラスタリング、ブートなど、さまざまな項目を処理するために使用される仮想ディスク(VMDK)です。

    • サービスディスクは、ホストから見ると、単一の物理ディスク(総称してサービス/システム物理ディスクと呼ばれる)上に物理的に配置されます。その物理ディスクには、DASデータストアが含まれている必要があります。ONTAP Deploy は、クラスタの導入時に ONTAP Select VM 用のこれらのサービスディスクを作成します。

  • ONTAP Selectシステムディスクを複数のデータストアまたは複数の物理ドライブに分散させることはできません。

  • ハードウェアRAIDは廃止されていません。

ローカル接続ストレージ用のソフトウェアRAID構成

ソフトウェアRAIDを使用する場合、ハードウェアRAIDコントローラが存在しないことが理想的ですが、システムに既存のRAIDコントローラがある場合は、以下の要件を満たさなければなりません:

  • ディスクをシステムに直接提示できるようにするには(JBOD)、ハードウェアRAIDコントローラを無効にする必要があります。通常、この変更はRAIDコントローラBIOSで行うことができます。

  • あるいは、ハードウェア RAID コントローラを SAS HBA モードにする必要があります。たとえば、一部の BIOS 設定では、RAID に加えて「AHCI」モードを使用でき、これを選択して JBOD モードを有効にできます。これにより、パススルーが有効になり、物理ドライブをホスト上でそのまま認識できるようになります。

コントローラがサポートするドライブの最大数によっては、追加のコントローラが必要になる場合があります。SAS HBAモードを使用する場合は、I/Oコントローラ(SAS HBA)が最低6Gbpsの速度に対応していることを確認してください。ただし、NetAppでは12Gbpsの速度を推奨します。

その他のハードウェアRAIDコントローラモードまたは構成はサポートされていません。たとえば、一部のコントローラはRAID 0サポートを許可しており、ディスクのパススルーを人為的に有効にすることができますが、その影響は望ましくない場合があります。サポートされている物理ディスク(SSDのみ)のサイズは200GBから16TBまでです。

メモ 管理者は、ONTAP Select VM で使用されているドライブを追跡し、ホスト上でこれらのドライブが誤って使用されないようにする必要があります。

ONTAP Select 仮想ディスクと物理ディスク

ハードウェア RAID コントローラを備えた構成の場合、物理ディスク冗長性は RAID コントローラによって提供されます。ONTAP Select には 1 つ以上の VMDK が提示され、ONTAP 管理者はそこからデータアグリゲートを設定できます。これらの VMDK は RAID 0 形式でストライピングされます。これは、ハードウェア レベルで提供される耐障害性により、ONTAP ソフトウェア RAID を使用すると冗長性が高く、非効率的で効果がないためです。さらに、システム ディスクに使用される VMDK は、ユーザ データの格納に使用される VMDK と同じデータストアにあります。

ソフトウェアRAIDを使用する場合、ONTAP DeployはONTAP SelectにVMDKと物理ディスクのセット(SSD用のRaw Device Mappings [RDM]、およびNVMe用のパススルーまたはDirectPath IOデバイス)を提供します。

以下の図は、この関係をより詳細に示し、ONTAP Select VMの内部に使用される仮想化ディスクと、ユーザーデータを保存するために使用される物理ディスクの違いを強調しています。

ONTAP Select ソフトウェア RAID:仮想化ディスクと RDM の使用

ONTAP SelectソフトウェアRAID:仮想化ディスクとRDMの使用

システムディスク(VMDK)は、同じデータストア内、同じ物理ディスク上に存在します。仮想NVRAMディスクには、高速かつ耐久性のあるメディアが必要です。したがって、NVMeおよびSSDタイプのデータストアのみがサポートされます。

NVMeドライブを使用したONTAP Selectソフトウェア RAID:仮想化ディスクとパススルー デバイスの使用

システムディスク(VMDK)は、同じデータストア内、同じ物理ディスク上に存在します。仮想NVRAMディスクには、高速かつ耐久性のあるストレージ メディアが必要です。したがって、NVMeおよびSSDタイプのデータストアのみがサポートされます。データ保存にNVMeドライブを使用する場合、パフォーマンス上の理由から、システムディスクもNVMeデバイスであるべきです。NVMe構成におけるシステムディスクの有力候補としては、INTEL Optaneカードが挙げられます。

メモ 現在のリリースでは、ONTAP Selectシステムディスクを複数のデータストアまたは複数の物理ドライブにまたがって分離することはできません。

各データディスクは、小さなルートパーティション(ストライプ)と、同じサイズの2つのパーティションの3つの部分に分割され、ONTAP Select VM内部で確認できる2つのデータディスクが作成されます。パーティションは、単一ノードクラスタおよび高可用性(HA)ペアのノードについて、次の図に示すように、Root Data Data(RD2)スキーマを使用します。

`P`はパリティドライブを表し、 `DP`はデュアルパリティドライブを表し、 `S`はスペア ディスクを表します。

単一ノード クラスタ向けRDD ディスク パーティショニング

シングルノード クラスタ向けRDDディスク パーティショニング

マルチノードクラスタ(HAペア)のRDDディスクパーティショニング

マルチノードクラスタ(HAペア)のRDDディスクパーティショニング

ONTAPソフトウェアRAIDは、次のRAIDタイプをサポートしています:RAID 4、RAID-DP、およびRAID-TEC。これらは、FASおよびAFFプラットフォームで使用されているものと同じRAID構成です。ルートプロビジョニングの場合、ONTAP SelectはRAID 4およびRAID-DPのみをサポートします。データ アグリゲートにRAID-TECを使用する場合、全体的な保護はRAID-DPになります。ONTAP Select HAは、各ノードの構成を他のノードにレプリケートする共有リソースを持たないアーキテクチャを使用します。つまり、各ノードは自身のルートパーティションとピアのルートパーティションのコピーを格納する必要があります。データディスクには、単一のルートパーティションがあります。これは、データディスクの最小数が、ONTAP SelectノードがHAペアの一部であるかどうかによって異なることを意味します。

シングルノードクラスタの場合、すべてのデータパーティションはローカル(アクティブ)データを保存するために使用されます。HAペアを構成するノードの場合、1つのデータパーティションはそのノードのローカル(アクティブ)データを格納するために使用され、2つ目のデータパーティションはHAピアからのアクティブデータをミラーリングするために使用されます。

パススルー(DirectPath IO)デバイスとRaw Device Maps(RDM)の比較

ESXiおよびKVMハイパーバイザーは、NVMeディスクをRaw Device Maps(RDM)としてサポートしていません。ONTAP SelectがNVMeディスクを直接制御できるようにするには、これらのドライブをESXiまたはKVM内でパススルーデバイスとして構成する必要があります。NVMeデバイスをパススルーデバイスとして構成する場合、サーバーBIOSからのサポートが必要になり、ホストの再起動が必要になる場合があります。さらに、ホストごとに割り当て可能なパススルーデバイスの数には制限があり、プラットフォームによって異なる場合があります。ただし、ONTAP DeployではONTAP Selectノードあたり14台のNVMeデバイスに制限されます。つまり、NVMe構成では、総容量を犠牲にして、非常に高いIOPS密度(IOPS/TB)が提供されます。あるいは、大容量ストレージを備えた高性能構成を希望する場合は、大容量のONTAP Select VMサイズ、システムディスク用のINTEL Optaneカード、およびデータストレージ用の適切な数のSSDドライブという構成が推奨されます。

メモ NVMeのパフォーマンスを最大限に活用するには、大規模なONTAP Select VMサイズを検討してください。

パススルー デバイスとRDMには、さらに別の違いがあります。RDMは実行中のVMにマッピングできます。パススルー デバイスを使用するには、VMの再起動が必要です。つまり、NVMeドライブの交換または容量拡張(ドライブの追加)手順では、ONTAP Select VMの再起動が必要になります。ドライブ交換および容量拡張(ドライブ追加)処理は、ONTAP Deployのワークフローによって実行されます。ONTAP Deployは、シングル ノード クラスタのONTAP Select再起動とHAペアのフェイルオーバー/フェイルバックを管理します。ただし、SSDデータ ドライブの操作(ONTAP Selectの再起動/フェイルオーバーは不要)とNVMeデータ ドライブの操作(ONTAP Selectの再起動/フェイルオーバーが必要)の違いに注意することが重要です。

物理ディスクと仮想ディスクのプロビジョニング

より効率的なユーザーエクスペリエンスを提供するために、ONTAP Deploy は、指定されたデータストア(物理システムディスク)からシステム(仮想)ディスクを自動的にプロビジョニングし、それらを ONTAP Select VM に接続します。この処理は初期セットアップ時に自動的に実行されるため、ONTAP Select VM を起動できます。RDM はパーティション化され、ルート アグリゲートが自動的に構築されます。ONTAP Select ノードが HA ペアの一部である場合、データ パーティションは自動的にローカル ストレージ プールとミラー ストレージ プールに割り当てられます。この割り当ては、クラスタ作成処理とストレージ追加処理の両方で自動的に実行されます。

ONTAP Select VMのデータディスクは基盤となる物理ディスクに関連付けられているため、物理ディスクの数が多い構成を作成すると、パフォーマンスに影響が出る可能性があります。

メモ ルート アグリゲートのRAIDグループ タイプは、使用可能なディスクの数によって決まります。ONTAP Deployで適切なRAIDグループ タイプが選択されます。ノードに十分なディスクが割り当てられている場合はRAID-DPが使用され、それ以外の場合はRAID-4ルート アグリゲートが作成されます。

ソフトウェアRAIDを使用してONTAP Select VMに容量を追加する場合、管理者は物理ドライブのサイズと必要なドライブの数を考慮する必要があります。詳細については、"ストレージ容量を増やす"を参照してください。

FASおよびAFFシステムと同様に、既存のRAIDグループに追加できるのは、同等以上の容量を持つドライブのみです。大容量ドライブは適切なサイズに調整されます。新しいRAIDグループを作成する場合は、全体のアグリゲート パフォーマンスが低下しないように、新しいRAIDグループのサイズを既存のRAIDグループのサイズと一致させる必要があります。

ONTAP Selectディスクを対応するESXiまたはKVMディスクに一致させる

ONTAP Select ディスクには通常 NET x.y というラベルが付けられています。次の ONTAP コマンドを使用してディスク UUID を取得できます:

<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host

ONTAP Selectディスクとそれに対応するESXiディスクの照合

ESXi または KVM シェルで、次のコマンドを入力すると、特定の物理ディスク(naa.unique-id で識別されます)の LED を点滅させることができます。

ESXi
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
KVM
cat /sys/block/<block_device_id>/device/wwid

ソフトウェア RAID 使用時の複数ドライブ障害

システムで、複数のドライブが同時に障害状態になる状況が発生する可能性があります。システムの動作は、アグリゲートのRAID保護と障害ドライブの数によって異なります。

RAID4アグリゲートは1つのディスク障害に耐えることができ、RAID-DPアグリゲートは2つのディスク障害に耐えることができ、RAID-TECアグリゲートは3つのディスク障害に耐えることができます。

ディスク障害の数が、RAID タイプがサポートする最大障害数よりも少ない場合、スペア ディスクが利用可能な場合、再構築プロセスが自動的に開始されます。スペア ディスクが利用できない場合、スペア ディスクが追加されるまで、アグリゲートは劣化した状態でデータを提供します。

障害ドライブの数がRAIDタイプでサポートされる最大障害数を超えると、ローカルプレックスは障害とマークされ、アグリゲートの状態はdegradedになります。データは、HAパートナー上に存在する2つ目のプレックスから提供されます。つまり、ノード1に対するすべてのI/O要求は、クラスタ インターコネクト ポートe0e(iSCSI)を介してノード2上に物理的に配置されたディスクに送信されます。2つ目のプレックスも障害が発生した場合、アグリゲートは障害とマークされ、データは使用できなくなります。

データの正しいミラーリングを再開するには、障害が発生したプレックスを削除して再作成する必要があります。マルチディスク障害によりデータ アグリゲートが劣化すると、ルート アグリゲートも劣化します。ONTAP Selectは、ルート・データ・データ(RDD)パーティショニング方式を使用して、各物理ドライブをルート パーティションと2つのデータ パーティションに分割します。したがって、1つ以上のディスクが失われると、ローカル ルートやリモート ルート アグリゲートのコピー、ローカル データ アグリゲート、リモート データ アグリゲートのコピーなど、複数のアグリゲートに影響が及ぶ可能性があります。

次の出力例では、障害が発生したプレックスが削除され、再作成されています:

C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1
Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable
         negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online.
Do you want to continue? {y|n}: y
[Job 78] Job succeeded: DONE

C3111E67::> storage aggregate mirror -aggregate aggr1
Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner:
      Second Plex
        RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp)
                                                            Usable Physical
          Position   Disk                      Type           Size     Size
          ---------- ------------------------- ---------- -------- --------
          shared     NET-3.2                   SSD               -        -
          shared     NET-3.3                   SSD               -        -
          shared     NET-3.4                   SSD         208.4GB  208.4GB
          shared     NET-3.5                   SSD         208.4GB  208.4GB
          shared     NET-3.12                  SSD         208.4GB  208.4GB

      Aggregate capacity available for volume use would be 526.1GB.
      625.2GB would be used from capacity license.
Do you want to continue? {y|n}: y

C3111E67::> storage aggregate show-status -aggregate aggr1
Owner Node: sti-rx2540-335a
 Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums)
  Plex: /aggr1/plex0 (online, normal, active, pool0)
   RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums)
                                                              Usable Physical
     Position Disk                        Pool Type     RPM     Size     Size Status
     -------- --------------------------- ---- ----- ------ -------- -------- ----------
     shared   NET-1.1                      0   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-1.2                      0   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-1.3                      0   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-1.10                     0   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-1.11                     0   SSD        -  205.1GB  447.1GB (normal)
  Plex: /aggr1/plex3 (online, normal, active, pool1)
   RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums)
                                                              Usable Physical
     Position Disk                        Pool Type     RPM     Size     Size Status
     -------- --------------------------- ---- ----- ------ -------- -------- ----------
     shared   NET-3.2                      1   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-3.3                      1   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-3.4                      1   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-3.5                      1   SSD        -  205.1GB  447.1GB (normal)
     shared   NET-3.12                     1   SSD        -  205.1GB  447.1GB (normal)
10 entries were displayed..
メモ

1つまたは複数のドライブ障害をテストまたはシミュレートするには、 `storage disk fail -disk NET-x.y -immediate`コマンドを使用します。システムにスペアがある場合、アグリゲートの再構築が開始されます。再構築のステータスは、 `storage aggregate show`コマンドで確認できます。シミュレートされた障害ドライブは、ONTAP Deployを使用して削除できます。ONTAPがドライブに `Broken`のマークを付けていることに注意してください。ドライブは実際には故障しておらず、ONTAP Deployを使用して再度追加できます。Brokenラベルを消去するには、ONTAP Select CLIで次のコマンドを入力します:

set advanced
disk unfail -disk NET-x.y -spare true
disk show -broken

最後のコマンドの出力は空である必要があります。

仮想化 NVRAM

NetApp FASシステムには従来、物理的なNVRAM PCIカードが搭載されています。このカードは、書き込み性能を大幅に向上させる不揮発性フラッシュメモリを搭載した高性能カードです。これは、ONTAPに受信した書き込みを即座にクライアントに確認応答する機能を付与することで実現されます。また、変更されたデータブロックをより低速なストレージ メディアに戻す移動を、デステージングと呼ばれるプロセスでスケジュールすることもできます。

一般的なシステムには、通常この種の機器は搭載されていません。したがって、NVRAMカードの機能は仮想化され、ONTAP Selectシステムブートディスクのパーティションに配置されています。そのため、インスタンスのシステム仮想ディスクの配置は極めて重要です。