システム構成を復元して確認します( AFF A900 )
寄稿者
ハードウェアの交換が完了したら、交換用コントローラの下位のシステム構成を確認し、必要に応じてシステム設定を再設定してから、システムレベルの診断を実行します。
手順 1 :コントローラモジュールの交換後にシステム時間を設定して確認します
交換用コントローラモジュールの日付と時刻は、 HA ペアの正常なコントローラモジュール、またはスタンドアロン構成の信頼できるタイムサーバに照らして確認する必要があります。日付と時刻が一致しない場合は、時刻の違いによるクライアントの停止を防ぐために、交換用コントローラモジュールで日付と時刻をリセットする必要があります。
これらの手順のコマンドを正しいシステムに適用することが重要です。
-
replacement _node は、この手順で障害ノードと交換した新しいノードです。
-
healthy_node は、 _replacement _node の HA パートナーです。
-
_replacement _node に LOADER プロンプトが表示されない場合は、システムを停止して LOADER プロンプトを表示します。
-
_healthy_node で、システム時刻「 show date 」を確認します
日付と時刻は GMT で表示されます。
-
LOADER プロンプトで、 _replacement node の日付と時刻を確認します。 'how date]
日付と時刻は GMT で表示されます。
-
必要に応じて、交換用ノードの日付を GMT で設定します。 'et date_mm/dd/yyyy_`
-
必要に応じて、交換用ノードの時刻を GMT で設定します。「 set time hh : mm : ss` 」
-
LOADER プロンプトで、 _replacement _node の日付と時刻を確認します。 'how dat'
日付と時刻は GMT で表示されます。
手順 2 :コントローラモジュールの HA 状態を確認して設定します
コントローラモジュールの「 HA 」状態を確認し、必要に応じてシステム構成に合わせて状態を更新する必要があります。
-
交換用コントローラモジュールの保守モードで ' すべてのコンポーネントが同じ HA 状態を表示していることを確認します HA 構成の場合は 'ha-config show と表示されます
システムの構成 すべてのコンポーネントの HA の状態 HA ペア
高可用性
4 つ以上のノードを含む MetroCluster FC 構成
MCC
MetroCluster IP 構成
mccip
-
表示されたコントローラモジュールのシステム状態がシステム構成と一致しない場合は、コントローラモジュールの HA 状態を「 ha-config modify controller_A_2 state_」 に設定します
-
表示されたシャーシのシステム状態がシステム構成と一致しない場合は ' シャーシの HA 状態を設定します HA config modify chassis_HA-state_
手順 3 :システムレベルの診断を実行します
コントローラを交換するたびに、特定のコンポーネントとサブシステムについて包括的な診断テストまたは集中的な診断テストを実行する必要があります。
診断手順のコマンドは、すべてコンポーネントを交換するコントローラから実行します。
-
対象となるコントローラが LOADER プロンプトに表示されていない場合は、コントローラをリブートします。「 halt
コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。
-
LOADER プロンプトで、システムレベルの診断用に特別に設計されたドライバ「 boot_diags 」にアクセスします
ブート・プロセス中に 'Maintenance] モードのプロンプト( *> )が表示されるまで 'y とプロンプトを入力しても安全です
-
コントローラモジュールで使用可能なデバイスを表示してメモします。 'diag device show -dev MB
コントローラモジュールのデバイスおよびポートとして、次のいくつかが表示されます。
-
bootmedia は、システムのブートデバイスです。
-
cna は、ネットワークやストレージデバイスに接続されていない統合ネットワークアダプタまたはインターフェイスです。
-
fcal は、 Fibre Channel ネットワークに接続されていない Fibre Channel-Arbitrated Loop デバイスです。
-
env は、マザーボード環境です。
-
mem はシステムメモリです。
-
nic は、ネットワークインターフェイスカードです。
-
nvram は、不揮発性 RAM です。
-
nvmem は、 NVRAM とシステムメモリの組み合わせです。
-
sas は、ディスクシェルフに接続されていない Serial Attached SCSI デバイスです。
-
-
必要に応じて診断を実行します。
診断テストを実行する対象 作業 個々のコンポーネント
-
ステータスログ「
diag device clearstatus
」を消去します -
選択したデバイスで使用可能なテストを表示します。「 sldiag device show -dev dev_name
dev_name には、前の手順で特定したポートとデバイスのいずれかを指定します。
-
出力を確認し、必要に応じて実行するテストのみを選択します。「 sldiag device modify -dev dev_name -selection only
-
selection only を指定すると、デバイスに対して実行しないその他のテストがすべて無効になります。
-
-
選択したテスト「 sldiag device run -dev dev_name 」を実行します
テストが完了すると、次のメッセージが表示されます。
*> <SLDIAG:_ALL_TESTS_COMPLETED>
-
失敗したテストがないことを確認します :sldiag device status -dev dev_name -long-state failed
テストに失敗した場合は、プロンプトに戻ります。失敗した場合は、そのステータスがすべて表示されます。
同時に複数のコンポーネント
-
前の手順の出力で有効なデバイスと無効なデバイスを確認し、同時に実行するデバイスを決定します。
-
デバイスに対する個々のテストを一覧表示します。「 sldiag device show -dev dev_name 」
-
出力を確認し、必要に応じて実行するテストのみを選択します。「 sldiag device modify -dev dev_name -selection only
-
selection only を指定すると、デバイスに対して実行しないその他のテストがすべて無効になります。
-
-
テストが変更されたことを確認します。 'lddiag device show'
-
同時に実行するデバイスごとに上記の手順を繰り返します。
-
すべてのデバイスで診断を実行します: 'lddiag device run
診断の実行を開始した後は、エントリを追加または変更しないでください。 テストが完了すると、次のメッセージが表示されます。
*> <SLDIAG:_ALL_TESTS_COMPLETED>
-
コントローラにハードウェアの問題がないことを確認します。「 sldiag device status -long-state failed. 」というメッセージが表示されます
テストに失敗した場合は、プロンプトに戻ります。失敗した場合は、そのステータスがすべて表示されます。
-
-
前述の手順の結果に応じて、次に進みます。
システムレベルの診断のテスト結果 作業 は失敗なしで完了しました
-
ステータスログ「
diag device clearstatus
」を消去します -
ログがクリアされたことを確認します。「 diag device status 」
次のデフォルトの応答が表示されます。
SLDIAG :ログメッセージが存在しません。
-
保守モードを終了します :halt
コントローラに LOADER プロンプトが表示されます。
-
LOADER プロンプトからコントローラをブートします
-
コントローラを通常動作に戻します。
-
コントローラの構成 | 作業 |
---|---|
HA ペア |
ギブバックを実行します。 storage failover giveback -ofnode replacement_node_name * 注: * 自動ギブバックを無効にした場合は、 storage failover modify コマンドを使用して再度有効にします。 |
テストが失敗しました |
問題の原因を特定します。
|