• ホーム
  • ドキュメント
  • HCI
  • ストレージをアップグレードする前に、 Element ストレージの健全性チェックを実行します
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ストレージをアップグレードする前に、 Element ストレージの健全性チェックを実行します

寄稿者 netapp-pcarriga dbag-personal netapp-dbagwell netapp-mwallis amgrissino このページの PDF をダウンロード

Element ストレージをアップグレードする前に健全性チェックを実行して、クラスタ内のすべてのストレージノードで次回の Element ストレージアップグレードの準備ができていることを確認する必要があります。

必要なもの
  • 最新の管理サービスバンドル( 2.10.27 以降)に更新しておきます。

    重要 Element ソフトウェアをアップグレードする前に、最新の管理サービスバンドルにアップグレードする必要があります。
  • 管理ノード 11.3 以降が実行されていることを確認します。

  • クラスタで NetApp Element ソフトウェア 11.3 以降を実行している必要があります。

健全性チェックは、 NetApp Hybrid Cloud Control ( HCC ) UI 、 HCC API 、または HealthTools スイートを使用して実行できます。

サービスで実行されるストレージ健全性チェックの詳細についても確認できます。

NetApp Hybrid Cloud Control を使用して Element ストレージの健全性を実行します ストレージをアップグレードする前にチェックします

NetApp Hybrid Cloud Control ( HCC )を使用して、ストレージクラスタをアップグレードする準備が完了していることを確認できます。

手順
  1. Web ブラウザを開き、管理ノードの IP アドレスにアクセスします。

    https://<ManagementNodeIP>
  2. ストレージクラスタ管理者のクレデンシャルを指定して NetApp Hybrid Cloud Control にログインします。

  3. インターフェイスの右上にある [* Upgrade] を選択します。

  4. [ アップグレード * ( Upgrades * ) ] ページで、 [ * ストレージ * ( Storage * ) ] タブを選択します。

  5. 健全性チェックを選択します をクリックします。 アップグレードの準備状況を確認するクラスタ

  6. [ * ストレージヘルスチェック * ] ページで、 [ * ヘルスチェックの実行 * ] を選択します。

  7. 問題がある場合は、次の手順を実行します。

    1. 各問題について記載されている特定の技術情報アーティクルに移動するか、指定された対処方法を実行します。

    2. KB を指定した場合は、関連する技術情報アーティクルに記載されているプロセスを完了します。

    3. クラスタの問題を解決したら、「 * Re-Run Health Check * 」を選択します。

健全性チェックの完了後、エラーは発生しません。ストレージクラスタをアップグレードする準備は完了しています。ストレージノードのアップグレードを参照してください "手順" 続行してください。

API を使用して、実行前に Element ストレージの健全性チェックを実行 ストレージをアップグレードする

REST API を使用して、ストレージクラスタをアップグレードする準備が完了していることを確認できます。健全性チェックでは、保留中のノード、ディスクスペースの問題、クラスタ障害など、アップグレードが必要な障害がないことを確認します。

手順
  1. ストレージクラスタ ID を確認します。

    1. 管理ノードで管理ノード REST API UI を開きます。

      https://[management node IP]/mnode
    2. 「 * Authorize * 」(認証)を選択して、次の手順を実行

      1. クラスタのユーザ名とパスワードを入力します。

      2. 値がまだ入力されていない場合は、クライアント ID を「 m node-client 」として入力します。

      3. セッションを開始するには、 * Authorize * を選択します。

      4. 承認ウィンドウを閉じます。

    3. REST API UI から 'get/assets' を選択します

    4. [* 試してみてください * ] を選択します。

    5. [* Execute] を選択します。

    6. 応答から ' アップグレードの準備状況を確認するクラスタのストレージセクションから 'id' をコピーします

      注記 このセクションの「親」の値は、ストレージクラスタの ID ではなく、管理ノードの ID であるため使用しないでください。
    "config": {},
    "credentialid": "12bbb2b2-f1be-123b-1234-12c3d4bc123e",
    "host_name": "SF_DEMO",
    "id": "12cc3a45-e6e7-8d91-a2bb-0bdb3456b789",
    "ip": "10.123.12.12",
    "parent": "d123ec42-456e-8912-ad3e-4bd56f4a789a",
    "sshcredentialid": null,
    "ssl_certificate": null
  2. ストレージクラスタで健全性チェックを実行します。

    1. 管理ノードでストレージ REST API UI を開きます。

      https://[management node IP]/storage/1/
    2. 「 * Authorize * 」(認証)を選択して、次の手順を実行

      1. クラスタのユーザ名とパスワードを入力します。

      2. 値がまだ入力されていない場合は、クライアント ID を「 m node-client 」として入力します。

      3. セッションを開始するには、 * Authorize * を選択します。

      4. 承認ウィンドウを閉じます。

    3. [* POST/Health-Checks ( POST / ヘルスチェック) ] を選択します。

    4. [* 試してみてください * ] を選択します。

    5. パラメータフィールドに、手順 1 で取得したストレージクラスタ ID を入力します。

      {
        "config": {},
        "storageId": "123a45b6-1a2b-12a3-1234-1a2b34c567d8"
      }
    6. 指定したストレージクラスタでヘルスチェックを実行するには、 * Execute * を選択します。

      応答は ' ステータスを初期化中と表示する必要があります

    {
      "_links": {
        "collection": "https://10.117.149.231/storage/1/health-checks",
        "log": "https://10.117.149.231/storage/1/health-checks/358f073f-896e-4751-ab7b-ccbb5f61f9fc/log",
        "self": "https://10.117.149.231/storage/1/health-checks/358f073f-896e-4751-ab7b-ccbb5f61f9fc"
      },
      "config": {},
      "dateCompleted": null,
      "dateCreated": "2020-02-21T22:11:15.476937+00:00",
      "healthCheckId": "358f073f-896e-4751-ab7b-ccbb5f61f9fc",
      "state": "initializing",
      "status": null,
      "storageId": "c6d124b2-396a-4417-8a47-df10d647f4ab",
      "taskId": "73f4df64-bda5-42c1-9074-b4e7843dbb77"
    }
    1. 応答の一部である「 healthCheckID 」をコピーします。

  3. 健全性チェックの結果を確認します。

    1. [* 一時的なもの / 正常性チェックの一時的なもの / { healthCheckId } * ] を選択します。

    2. [* 試してみてください * ] を選択します。

    3. パラメータフィールドにヘルスチェック ID を入力します。

    4. [* Execute] を選択します。

    5. 応答の本文の一番下までスクロールします。

      すべての健全性チェックが成功した場合の出力例を次に示します。

    "message": "All checks completed successfully.",
    "percent": 100,
    "timestamp": "2020-03-06T00:03:16.321621Z"
  4. 「メッセージ」が「クラスタの正常性」に問題があることを示している場合は、次の手順を実行します。

    1. [* Get Singges/health-checksSries/{ healthCheckId}/log* ] を選択します

    2. [* 試してみてください * ] を選択します。

    3. パラメータフィールドにヘルスチェック ID を入力します。

    4. [* Execute] を選択します。

    5. 特定のエラーを確認し、関連する KB 記事のリンクを取得します。

    6. 各問題について記載されている特定の技術情報アーティクルに移動するか、指定された対処方法を実行します。

    7. KB を指定した場合は、関連する技術情報アーティクルに記載されているプロセスを完了します。

    8. クラスタの問題を解決したら、 * Get Sedges/health-checksRunges/{ healthCheckId } /log * を再度実行します。

前に HealthTools を使用して Element ストレージの健全性チェックを実行してください ストレージをアップグレードする

「 fupgradecheck 」コマンドを使用して、ストレージクラスタをアップグレードする準備が完了していることを確認できます。このコマンドは、保留中のノード、ディスクスペース、クラスタ障害などの情報を検証します。

管理ノードが外部に接続されていないダークサイトにある場合、アップグレードの準備状況を確認するには、ダウンロードした「 metadats.json 」ファイルが必要です "HealthTools のアップグレード" を実行してください。

ここでは、次のいずれかの結果をもたらすアップグレードチェックに対処する方法について説明します。

  • 「 fupgradecheck 」コマンドを実行すると、正常に実行されます。クラスタをアップグレードする準備は完了しています。

  • 「アップグレードチェック」ツールでのチェックが失敗し、エラーメッセージが表示される。クラスタをアップグレードする準備が完了しておらず、追加の手順が必要です。

  • アップグレードチェックが失敗し、 HealthTools が最新バージョンでないというエラーメッセージが表示される。

  • 管理ノードがダークサイトにあるため、アップグレードチェックが失敗する。

手順
  1. 「 fupgradecheck 」コマンドを実行します。

    sfupgradecheck -u <cluster-user-name> MVIP
    注記 パスワードに特殊文字が含まれる場合は、各特殊文字の前にバックスラッシュ(「 \ 」)を追加します。たとえば、「 mypass ! @1 」は「 'm ypass\ ! \@1 」と入力する必要があります。

    サンプルの入力コマンド。エラーは表示されず、アップグレードの準備ができている場合の出力例です。

    sfupgradecheck -u admin 10.117.78.244
    check_pending_nodes:
    Test Description: Verify no pending nodes in cluster
    More information: https://kb.netapp.com/support/s/article/ka11A0000008ltOQAQ/pendingnodes
    check_cluster_faults:
    Test Description: Report any cluster faults
    check_root_disk_space:
    Test Description: Verify node root directory has at least 12 GBs of available disk space
    Passed node IDs: 1, 2, 3
    More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/
    SolidFire-Disk-space-error
    check_mnode_connectivity:
    Test Description: Verify storage nodes can communicate with management node
    Passed node IDs: 1, 2, 3
    More information: https://kb.netapp.com/support/s/article/ka11A0000008ltYQAQ/mNodeconnectivity
    check_files:
    Test Description: Verify options file exists
    Passed node IDs: 1, 2, 3
    check_cores:
    Test Description: Verify no core or dump files exists
    Passed node IDs: 1, 2, 3
    check_upload_speed:
    Test Description: Measure the upload speed between the storage node and the
    management node
    Node ID: 1 Upload speed: 90063.90 KBs/sec
    Node ID: 3 Upload speed: 106511.44 KBs/sec
    Node ID: 2 Upload speed: 85038.75 KBs/sec
  2. エラーが発生した場合は、追加の操作が必要です。詳細については、次のサブセクションを参照してください。

クラスタをアップグレードする準備が完了していません

いずれかの健全性チェックに関連するエラーメッセージが表示された場合は、次の手順を実行します。

  1. 「 fupgradecheck 」エラーメッセージを確認します。

    回答例:

The following tests failed:
check_root_disk_space:
Test Description: Verify node root directory has at least 12 GBs of available disk space
Severity: ERROR
Failed node IDs: 2
Remedy: Remove unneeded files from root drive
More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/SolidFire-
Disk-space-error
check_pending_nodes:
Test Description: Verify no pending nodes in cluster
More information: https://kb.netapp.com/support/s/article/ka11A0000008ltOQAQ/pendingnodes
check_cluster_faults:
Test Description: Report any cluster faults
check_root_disk_space:
Test Description: Verify node root directory has at least 12 GBs of available disk space
Passed node IDs: 1, 3
More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/SolidFire-
Disk-space-error
check_mnode_connectivity:
Test Description: Verify storage nodes can communicate with management node
Passed node IDs: 1, 2, 3
More information: https://kb.netapp.com/support/s/article/ka11A0000008ltYQAQ/mNodeconnectivity
check_files:
Test Description: Verify options file exists
Passed node IDs: 1, 2, 3
check_cores:
Test Description: Verify no core or dump files exists
Passed node IDs: 1, 2, 3
check_upload_speed:
Test Description: Measure the upload speed between the storage node and the management node
Node ID: 1 Upload speed: 86518.82 KBs/sec
Node ID: 3 Upload speed: 84112.79 KBs/sec
Node ID: 2 Upload speed: 93498.94 KBs/sec

この例では、ノード 1 のディスクスペースが少なくなっています。詳細については、を参照してください "ナレッジベース" ( KB )エラーメッセージに記載されている記事。

HealthTools が最新バージョンではありません

HealthTools が最新バージョンではないことを示すエラーメッセージが表示された場合は、次の手順に従います。

  1. アップグレードチェックが失敗したことをエラーメッセージで確認します。

    回答例:

    sfupgradecheck failed: HealthTools is out of date:
    installed version: 2018.02.01.200
    latest version: 2020.03.01.09.
    The latest version of the HealthTools can be downloaded from: https://mysupport.netapp.com/NOW/cgi-bin/software/
    Or rerun with the -n option
  2. 応答に記載されている手順に従います。

管理ノードがダークサイトにあります

  1. アップグレードチェックが失敗したことをメッセージで確認します。

    回答例:

    sfupgradecheck failed: Unable to verify latest available version of healthtools.
  2. をダウンロードします "JSON ファイル" 管理ノードではないコンピュータのネットアップサポートサイトから、「 metadats.json 」に名前を変更します。

  3. 次のコマンドを実行します。

    sfupgradecheck -l --metadata=<path-to-metadata-json>
  4. 詳細については、「追加」を参照してください "HealthTools のアップグレード" ダークサイトの情報。

  5. 次のコマンドを実行して、 HealthTools スイートが最新バージョンであることを確認します。

    sfupgradecheck -u <cluster-user-name> -p <cluster-password> MVIP

サービスによるストレージの健全性チェック

ストレージの健全性チェックでは、クラスタごとに以下のチェックが行われます。

[ 名前( Name ) ] を ノード / クラスタ 説明

check_async 結果

クラスタ

データベースの非同期結果の数がしきい値を下回っていることを検証します。

check_cluster_faults

クラスタ

( Element ソースで定義された)アップグレードがブロックされているクラスタエラーがないことを確認します。

check_upload_speed

ノード

ストレージノードと管理ノードの間のアップロード速度を測定します。

connection_speed_check

ノード

ノードがアップグレードパッケージを提供する管理ノードに接続されていることを確認し、接続速度を推定します。

コアをチェックします

ノード

ノード上のカーネルクラッシュダンプファイルとコアファイルをチェックします。直近の期間(しきい値 7 日)にクラッシュが発生した場合、チェックは失敗します。

check_root_disk_space を選択します

ノード

ルートファイルシステムにアップグレードを実行するための十分な空きスペースがあることを確認します。

var_log_disk_space を確認します

ノード

/var/log の空き領域が、空きしきい値のパーセンテージを満たしていることを確認します。サポートされていない場合は、しきい値を下回るために、古いログがローテーションされてパージされます。十分な空きスペースの作成に失敗した場合、チェックは失敗します。

check_pending_nodes

クラスタ

クラスタに保留状態のノードがないことを確認します。

詳細については、こちらをご覧ください