日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

HPE DL380 のドライブを交換

寄稿者 netapp-mwallis

ここに記載されている手順に従って、ドライブをプロアクティブに交換し、障害が発生したドライブを交換し、キャッシュドライブを交換します。SolidFire ESDS クラスタ内のメタデータドライブまたはブロックドライブを交換します。Element UI * Cluster > Drives * ページには、ドライブ摩耗度情報が表示されます。

ドライブをプロアクティブに交換します

SolidFire ESDS クラスタ内のメタデータドライブまたはブロックドライブをプロアクティブに交換する場合は、この手順を実行します。Element UI * Cluster * > * Drives * ページには、ドライブ摩耗度情報が表示されます。

必要なもの
  • NetApp Element ソフトウェア UI で、クラスタの健常性が良好であり、警告やクラスタ障害がないことを確認します。Element UI には、プライマリクラスタノードの管理仮想 IP ( MVIP )アドレスを使用してアクセスできます。

  • クラスタで実行中のアクティブなジョブがないことを確認します。

  • すべての手順を理解していることを確認します。

  • ドライブを取り扱う際には、静電放電( ESD )を防ぐために必要な予防措置を講じてください。

手順
  1. Element UI で次の手順を実行します。

    1. Element UI で、 * Cluster * > * Drives * > * Active * を選択します。

    2. 交換するドライブを選択します。

    3. ドライブのシリアル番号をメモします。これは、ノードの IPMI インターフェイス(この場合は HPE Integrated Lights-Out または iLO )で対応する BayID を特定するのに役立ちます。

    4. [ * 一括操作 * > * 削除 * ] を選択します。ドライブを取り外した後、ドライブは「 Removing * 」 ( 取り外し中 ) 状態になります。この処理は「削除中」のままです。ドライブ上のデータが同期されるか、クラスタ内の残りのドライブに再配置されるのを待っています。削除が完了すると、ドライブは * Available * 状態になります。

  2. 次の手順を実行して、交換するドライブのドライブスロットの位置を確認します。

    1. ノードの IPMI インターフェイス(この場合は iLO )にログインします。

    2. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    3. 前の手順でメモしたシリアル番号を、画面に表示されている番号と一致させます。

    4. 表示されているスロット番号をシリアル番号と照合して確認します。ドライブを取り外す必要がある物理スロットです。

  3. ドライブを特定したら、次のようにドライブを物理的に取り外します。

    1. ドライブボックスを確認します。

      次の図は、サーバの前面とドライブを示しています。

      に、 DL380 ノード上のドライブを示します。
    2. 交換するドライブの電源ボタンを押します。LED が 5 ~ 10 秒間点滅し、停止します。

    3. LED の点滅が停止し、ドライブの電源がオフになったら、赤いボタンを押してラッチを引いて、 LED をサーバーから取り外します。

      注記 ドライブは慎重に扱うようにしてください。

    ドライブを物理的に取り外したあと、 Element UI でドライブの状態が「 * Failed 」に変わります。

  4. Element UI で、 * Cluster * > * Drives * > * Failed * の順に選択します。

  5. [ * アクション * ] の下のアイコンを選択し、 [ * 削除 * ] を選択します。

    これで、新しいドライブをノードに取り付けられるようになります。

  6. 新しいドライブのシリアル番号をメモします。

  7. ラッチを使用してドライブを慎重にベイに押し込み、ラッチを閉じて、交換用ドライブを挿入します。正しく挿入されると、ドライブの電源がオンになります。

  8. iLO で新しいドライブの詳細を確認するには、次の手順を実行します。

    1. iLO にログインします。

    2. [Information>*Integrated Management Log] を選択します。追加したドライブのイベントログが表示されます。

    3. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    4. ドライブを交換したベイの情報が見つかるまでスクロールします。

    5. 画面上のシリアル番号が、交換した新しいドライブのシリアル番号と一致していることを確認します。

  9. ドライブを交換したノードの「 sf_sds_config.yaml 」ファイルに新しいドライブ情報を追加します。

    「 f_sds_config.yaml 」ファイルは「 /opt/sf/` 」に格納されます。このファイルには、ノード内のドライブに関するすべての情報が含まれます。ドライブを交換するたびに、このファイルに交換用ドライブの情報を入力する必要があります。このファイルの詳細については、を参照してください "sf_sds_config.yaml ファイルの内容"

    1. PuTTY を使用して、ノードへの SSH 接続を確立します。

    2. PuTTY 設定ウィンドウの「 * ホスト名(または IP アドレス)」フィールドに、ノードの MIP を入力します。

    3. 「 * 開く * 」を選択します。

    4. 表示されたターミナルウィンドウで、ユーザ名とパスワードを使用してログインします。

    5. # cat /opt/sf/sf_sds_config.yaml コマンドを実行して、ファイルの内容を一覧表示します。

    6. 新しいドライブ情報で置き換えたドライブの「 dataDevices 」または「 cacheDevices 」リストのエントリを置き換えます。

    7. # systemctl start solidfire-san-drivers' を実行します

      このコマンドの実行後に Bash プロンプトが表示されます。追加したドライブをクラスタに追加するには、 Element UI に移動する必要があります。Element UI に、使用可能な新しいドライブに関するアラートが表示されます。

  10. [ クラスタ *]>[ * ドライブ *]>[ * 使用可能 *] を選択します。

    取り付けた新しいドライブのシリアル番号が表示されます。

  11. [ * アクション * ] の下のアイコンを選択し、 [ * 追加 * ] を選択します。

  12. ブロックの同期ジョブが完了したら、 Element UI を更新します。Element UI の * Reporting * タブから * Running Tasks * ページにアクセスすると、使用可能なドライブに関するアラートがクリアされたことがわかります。

障害のあるドライブを交換します

SolidFire ESDS クラスタのドライブに障害がある場合は、 Element UI にアラートが表示されます。クラスタからドライブを取り外す前に、ノード / サーバの IPMI インターフェイスで障害の原因を確認します。これらの手順は、ブロックドライブまたはメタデータドライブを交換する場合に使用できます。

必要なもの
  • NetApp Element ソフトウェア UI で、ドライブで障害が発生していることを確認します。ドライブで障害が発生すると、 Element にアラートが表示されます。Element UI には、プライマリクラスタノードの管理仮想 IP ( MVIP )アドレスを使用してアクセスできます。

  • すべての手順を理解していることを確認します。

  • ドライブを取り扱う際には、静電放電( ESD )を防ぐために必要な予防措置を講じてください。

手順
  1. Element UI を使用して次の手順でクラスタから障害ドライブを削除します。

    1. クラスタ * > * ドライブ * > * エラー * を選択します。

    2. 障害が発生したドライブに関連付けられているノード名とシリアル番号をメモします。

    3. [ * アクション * ] の下のアイコンを選択し、 [ * 削除 * ] を選択します。ドライブに関連付けられているサービスの警告が表示された場合は、 bin sync が完了するまで待ってから、ドライブを取り外します。

  2. ドライブ障害を確認し、ドライブ障害に関連するログに記録されたイベントを表示するには、次の手順を実行します。

    1. ノードの IPMI インターフェイス(この場合は iLO )にログインします。

    2. [Information>*Integrated Management Log] を選択します。ドライブ障害の原因( SSDWearOut など)と場所が表示されます。ドライブのステータスがデグレードになっていることを示すイベントも表示されます。

    3. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    4. 障害が発生したドライブに関する情報を確認します。障害が発生したドライブのステータスは、「 * Degraded * 」と表示されます。

  3. 次の手順でドライブを物理的に取り外します。

    1. シャーシ内のドライブを特定します。

      次の図は、サーバの前面とドライブを示しています。

    に、 DL380 ノード上のドライブを示します。
    1. 交換するドライブの電源ボタンを押します。LED が 5 ~ 10 秒間点滅し、停止します。

    2. LED の点滅が停止し、ドライブの電源がオフになったら、赤いボタンを押してラッチを引いて、 LED をサーバーから取り外します。

      注記 ドライブは慎重に扱うようにしてください。
  4. ラッチを使用してドライブを慎重にベイに押し込み、ラッチを閉じて、交換用ドライブを挿入します。正しく挿入されると、ドライブの電源がオンになります。

  5. iLO で新しいドライブの詳細を確認します。

    1. [Information>*Integrated Management Log] を選択します。追加したドライブのイベントログが表示されます。

    2. ページを更新して、追加した新しいドライブについてログに記録されたイベントを確認します。

  6. iLO でストレージシステムの正常性を確認します。

    1. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    2. 新しいドライブを取り付けたベイに関する情報が見つかるまでスクロールします。

    3. シリアル番号をメモします。

  7. ドライブを交換したノードの「 sf_sds_config.yaml 」ファイルに新しいドライブ情報を追加します。

    「 f_sds_config.yaml 」ファイルは「 /opt/sf/` 」に格納されます。このファイルには、ノード内のドライブに関するすべての情報が含まれます。ドライブを交換するたびに、このファイルに交換用ドライブの情報を入力する必要があります。このファイルの詳細については、を参照してください "sf_sds_config.yaml ファイルの内容"

    1. PuTTY を使用して、ノードへの SSH 接続を確立します。

    2. PuTTY 設定ウィンドウの「 * ホスト名(または IP アドレス)」フィールドに、ノードの MIP を入力します。

    3. 「 * 開く * 」を選択します。

    4. 表示されたターミナルウィンドウで、ユーザ名とパスワードを使用してログインします。

    5. # cat /opt/sf/sf_sds_config.yaml コマンドを実行して、ファイルの内容を一覧表示します。

    6. 新しいドライブ情報で置き換えたドライブの「 dataDevices 」または「 cacheDevices 」リストのエントリを置き換えます。

    7. # systemctl start solidfire-san-drivers' を実行します

      このコマンドの実行後に Bash プロンプトが表示されます。追加したドライブをクラスタに追加するには、 Element UI に移動する必要があります。Element UI に、使用可能な新しいドライブに関するアラートが表示されます。

  8. [ クラスタ *]>[ * ドライブ *]>[ * 使用可能 *] を選択します。

    取り付けた新しいドライブのシリアル番号が表示されます。

  9. [ * アクション * ] の下のアイコンを選択し、 [ * 追加 * ] を選択します。

  10. ブロックの同期ジョブが完了したら、 Element UI を更新します。Element UI の * Reporting * タブから * Running Tasks * ページにアクセスすると、使用可能なドライブに関するアラートがクリアされたことがわかります。

キャッシュドライブを交換します

SolidFire ESDS クラスタのキャッシュドライブを交換する場合は、この手順を実行します。キャッシュドライブはメタデータサービスに関連付けられます。Element UI * Cluster * > * Drives * ページには、ドライブ摩耗度情報が表示されます。

必要なもの
  • NetApp Element ソフトウェア UI で、クラスタの健常性が良好であり、警告やクラスタ障害がないことを確認します。Element UI には、プライマリクラスタノードの管理仮想 IP ( MVIP )アドレスを使用してアクセスできます。

  • クラスタで実行中のアクティブなジョブがないことを確認します。

  • すべての手順を理解していることを確認します。

  • Element UI からメタデータサービスを削除してください。

  • ドライブを取り扱う際には、静電放電( ESD )を防ぐために必要な予防措置を講じてください。

手順
  1. Element UI で次の手順を実行します。

    1. Element UI で、 * Cluster * > * Nodes * > * Active * を選択します。

    2. キャッシュドライブを交換するノードのノード ID と管理 IP アドレスをメモします。

    3. キャッシュドライブが正常な状態でプロアクティブに交換する場合は、「 * Active Drives * 」を選択し、メタデータドライブの場所を確認して UI から削除します。

      削除すると、メタデータドライブの状態が「 Removing * 」になり、次に「 Available * 」になります。

    4. キャッシュドライブの交換に失敗したあとに交換を実行すると、メタデータドライブの状態が「 Available * 」となり、「 * Cluster * > * Drives * > * Available * 」と表示されます。

    5. Element UI で、 * Cluster * > * Drives * > * Active * を選択します。

    6. キャッシュドライブの交換を行うノード名に関連付けられているメタデータドライブを選択します。

    7. [ * 一括操作 * > * 削除 * ] を選択します。ドライブを取り外した後、ドライブは「 Removing * 」 ( 取り外し中 ) 状態になります。この処理は「削除中」のままです。ドライブ上のデータが同期されるか、クラスタ内の残りのドライブに再配置されるのを待っています。削除が完了すると、ドライブは * Available * 状態になります。

  2. 次の手順を実行して、交換するキャッシュドライブのドライブスロットの場所を確認します。

    1. ノードの IPMI インターフェイス(この場合は iLO )にログインします。

    2. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    3. キャッシュドライブを探します。

      注記 キャッシュドライブの容量はストレージドライブよりも少なくなります。
    4. キャッシュドライブのスロット番号を確認します。ドライブを取り外す必要がある物理スロットです。

  3. ドライブを特定したら、次のようにドライブを物理的に取り外します。

    1. ドライブボックスを確認します。

      次の図は、サーバの前面とドライブを示しています。

      に、 DL380 ノード上のドライブを示します。
    2. 交換するドライブの電源ボタンを押します。LED が 5 ~ 10 秒間点滅し、停止します。

    3. LED の点滅が停止し、ドライブの電源がオフになったら、赤いボタンを押してラッチを引いて、 LED をサーバーから取り外します。

      注記 ドライブは慎重に扱うようにしてください。

    ドライブを物理的に取り外したあと、 Element UI でドライブの状態が「 * Failed 」に変わります。

  4. HPE のモデル番号と新しいキャッシュドライブの ISN (シリアル番号)を書き留めます。

  5. ラッチを使用してドライブを慎重にベイに押し込み、ラッチを閉じて、交換用ドライブを挿入します。正しく挿入されると、ドライブの電源がオンになります。

  6. iLO で新しいドライブの詳細を確認するには、次の手順を実行します。

    1. iLO にログインします。

    2. [Information>*Integrated Management Log] を選択します。追加したドライブのイベントログが表示されます。

    3. 左側のナビゲーションから「 * システム情報 * 」を選択し、「 * ストレージ * 」を選択します。

    4. ドライブを交換したベイの情報が見つかるまでスクロールします。

    5. 画面上のシリアル番号が、取り付けた新しいドライブのシリアル番号と一致していることを確認します。

  7. ドライブを交換したノードの「 f_sds_config.yaml 」ファイルに新しいキャッシュドライブ情報を追加します。

    「 f_sds_config.yaml 」ファイルは「 /opt/sf/` 」に格納されます。このファイルには、ノード内のドライブに関するすべての情報が含まれます。このファイルには、ドライブを交換するたびに交換用ドライブの情報を入力する必要があります。このファイルの詳細については、を参照してください "sf_sds_config.yaml ファイルの内容"

    1. PuTTY を使用して、ノードへの SSH 接続を確立します。

    2. PuTTY 設定のウィンドウで、ホスト名(または IP アドレス) * フィールドにノードの MIP アドレス( Element UI でメモしたアドレス)を入力します。

    3. 「 * 開く * 」を選択します。

    4. 表示されたターミナルウィンドウで、ユーザ名とパスワードを使用してログインします。

    5. NVMe list コマンドを実行して 'NMVe デバイスを一覧表示します

      新しいキャッシュドライブのモデル番号とシリアル番号が表示されます。次の出力例を参照してください。

      新しいキャッシュドライブのモデル番号とシリアル番号が表示されます。
    6. 新しいキャッシュ・ドライブ情報を '/opt/sf/sf_sds_config.yaml に追加します

      既存のキャッシュドライブのモデル番号とシリアル番号を、新しいキャッシュドライブの対応する情報に置き換える必要があります。次の例を参照してください。

    モデル番号とシリアル番号が表示されます。
    1. /opt/sf/sf_sds_config.yaml ファイルを保存します。

  8. 該当するシナリオの手順を実行します。

    シナリオ( Scenario ) 手順

    「 nvme list 」コマンドを実行すると、新しく挿入されたキャッシュドライブが表示されます

    1. # systemctl restart SolidFire を実行しますこれには約 3 分かかります。

    2. 「 System status SolidFire 」を実行して、 SolidFire のステータスを確認します。

    3. 手順 9. に進みます。

    「 nvme list 」コマンドを実行しても、新しく挿入されたキャッシュドライブは表示されません

    1. ノードをリブートします。

    2. ノードがリブートしたら、ノードにログインし( PuTTY を使用して)「 system status SolidFire 」コマンドを実行して、 SolidFire サービスが実行されていることを確認します。

    3. 手順 9. に進みます。

    注記 SolidFire を再起動するかノードを再起動すると ' 一部のクラスタ障害が発生し ' 最終的には約 5 分後にクリアされます
  9. Element UI で、削除したメタデータドライブを再度追加します。

    1. [ クラスタ *]>[ * ドライブ *]>[ * 使用可能 *] を選択します。

    2. アクションの下のアイコンを選択し、 * 追加 * を選択します。

  10. ブロックの同期ジョブが完了したら、 Element UI をリフレッシュしてください。

    使用可能なドライブに関するアラートが他のクラスタエラーと一緒にクリアされたことを確認できます。