DIMM- AFF A900 を交換してください
ストレージシステムでヘルスモニタアラートに基づく大量のCECC(修正可能なエラー訂正コード)エラーや修正不可能なECCエラーなどのエラーが発生した場合は、コントローラのDIMMを交換する必要があります。これらのエラーは通常、DIMMの1つの障害が原因でストレージシステムがONTAPをブートできないことが原因です。
システムのその他のコンポーネントがすべて正常に動作している必要があります。問題がある場合は、必ずテクニカルサポートにお問い合わせください。
障害が発生したコンポーネントは、プロバイダから受け取った交換用 FRU コンポーネントと交換する必要があります。
手順 1 :障害のあるコントローラをシャットダウンします
次のいずれかのオプションを使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーします。
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。
-
SANシステムを使用している場合は、障害コントローラのSCSIブレードのイベントメッセージを確認しておく必要があり `cluster kernel-service show`ます)。コマンド(priv advancedモードから)を実行すると、 `cluster kernel-service show`そのノードのノード名、そのノードの可用性ステータス、およびそのノードの動作ステータスが表示され"クォーラムステータス"ます。
各 SCSI ブレードプロセスは、クラスタ内の他のノードとクォーラムを構成している必要があります。交換を進める前に、すべての問題を解決しておく必要があります。
-
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"。
-
AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
次のAutoSupport メッセージは、ケースの自動作成を2時間停止します。
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
正常なコントローラのコンソールから自動ギブバックを無効にします。
storage failover modify -node local -auto-giveback false
自動ギブバックを無効にしますか?_と表示されたら'y'を入力します -
障害のあるコントローラに LOADER プロンプトを表示します。
障害のあるコントローラの表示 作業 LOADER プロンプト
次の手順に進みます。
ギブバックを待っています
Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト
正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _
障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。
2 ノード MetroCluster 構成のシステムでは、この手順を使用しないでください。 |
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。
-
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"。
-
MetroCluster 構成を使用している場合は、 MetroCluster 構成状態が構成済みで、ノードが有効かつ正常な状態であることを確認しておく必要があります(「 MetroCluster node show 」)。
-
AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。「 system node AutoSupport invoke -node * -type all -message MAINT=number_OF_hours_downh
次の AutoSupport メッセージは、ケースの自動作成を 2 時間停止します。 cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h`
-
正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify – node local-auto-giveback false
-
障害のあるコントローラに LOADER プロンプトを表示します。
障害のあるコントローラの表示 作業 LOADER プロンプト
次の手順に進みます。
ギブバックを待っています
Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト(システムパスワードの入力)
正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _
障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。
手順 2 :コントローラモジュールを取り外す
コントローラ内部のコンポーネントにアクセスするには、まずコントローラモジュールをシステムから取り外し、続いてコントローラモジュールのカバーを外す必要があります。
-
接地対策がまだの場合は、自身で適切に実施します。
-
障害のあるコントローラモジュールからケーブルを外し、どのケーブルが何に接続されていたかを記録します。
-
カムハンドルのテラコッタボタンを下にスライドさせてロックを解除します。
アニメーション-コントローラを取り外しますカムハンドルのリリースボタン
カムハンドル
-
カムハンドルを回転させて、コントローラモジュールをシャーシから完全に外し、コントローラモジュールをシャーシから引き出します。
このとき、空いている手でコントローラモジュールの底面を支えてください。
-
コントローラモジュールのふた側を上にして、平らで安定した場所に置きます。カバーの青いボタンを押し、コントローラモジュールの背面にカバーをスライドさせてから、カバーを上に動かしてコントローラモジュールから外します。
コントローラモジュールのカバーの固定ボタン
手順 3 : DIMM を交換します
DIMM を交換するには、コントローラ内で DIMM の場所を確認し、特定の手順を実行します。
Ver2コントローラに搭載されているDIMMソケットの数が少なくなっています。サポートされるDIMMの数が減少したり、DIMMソケットの番号が変更されたりすることはありません。DIMMを新しいコントローラモジュールに移動するときは、障害のあるコントローラモジュールと同じソケット番号/場所にDIMMを取り付けます。 DIMMソケットの位置については、Ver2コントローラモジュールのFRUマップ図を参照してください。 |
-
接地対策がまだの場合は、自身で適切に実施します。
-
コントローラモジュールで DIMM の場所を確認します。
-
DIMM の両側にある 2 つのツメをゆっくり押し開いて DIMM をスロットから外し、そのままスライドさせてスロットから取り出します。
DIMM 回路基板のコンポーネントに力が加わらないように、 DIMM の両端を慎重に持ちます。 アニメーション- DIMMを交換しますDIMM のツメ
DIMM
-
交換用 DIMM を静電気防止用の梱包バッグから取り出し、 DIMM の端を持ってスロットに合わせます。
DIMM のピンの間にある切り欠きを、ソケットの突起と揃える必要があります。
-
コネクタにある DIMM のツメが開いた状態になっていることを確認し、 DIMM をスロットに対して垂直に挿入します。
DIMM のスロットへの挿入にはある程度の力が必要です。簡単に挿入できない場合は、 DIMM をスロットに正しく合わせてから再度挿入してください。
DIMM がスロットにまっすぐ差し込まれていることを目で確認してください。 -
DIMM の両端のノッチにツメがかかるまで、 DIMM の上部を慎重にしっかり押し込みます。
-
コントローラモジュールのカバーを閉じます。
手順 4 :コントローラを取り付ける
コンポーネントをコントローラモジュールに取り付けたら、コントローラモジュールをシステムシャーシに取り付け直してオペレーティングシステムをブートする必要があります。
2 台のコントローラモジュールを同じシャーシに搭載する HA ペアでは、シャーシへの設置が完了すると同時にリブートが試行されるため、コントローラモジュールの取り付け順序が特に重要です。
-
接地対策がまだの場合は、自身で適切に実施します。
-
コントローラモジュールのカバーをまだ取り付けていない場合は取り付けます。
コントローラモジュールのカバーの固定ボタン
-
コントローラモジュールの端をシャーシの開口部に合わせ、コントローラモジュールをシステムに半分までそっと押し込みます。
アニメーション-コントローラを取り付けますカムハンドルのリリースボタン
カムハンドル
指示があるまでコントローラモジュールをシャーシに完全に挿入しないでください。 -
システムにアクセスして以降のセクションのタスクを実行できるように、管理ポートとコンソールポートのみをケーブル接続します。
残りのケーブルは、この手順の後半でコントローラモジュールに接続します。 -
コントローラモジュールの再取り付けを完了します。
-
ケーブルマネジメントデバイスをまだ取り付けていない場合は、取り付け直します。
-
コントローラモジュールをシャーシに挿入し、ミッドプレーンまでしっかりと押し込んで完全に装着します。
コントローラモジュールが完全に装着されると、ロックラッチが上がります。
コネクタの破損を防ぐため、コントローラモジュールをスライドしてシャーシに挿入する際に力を入れすぎないでください。
コントローラモジュールは、シャーシに完全に装着されるとすぐにブートを開始します。ブートプロセスを中断できるように準備しておきます。
-
ロックラッチを上に回転させてロックピンが外れるように傾け、ロックされるまで下げます。
-
起動メニューに Ctrl+C キーを押して ' 起動プロセスを中断します
-
表示されたメニューからメンテナンスモードでブートするオプションを選択します。
-
手順 5 :システムレベルの診断を実行します
新しい DIMM を取り付けたら、診断を実行する必要があります。
システムレベルの診断を開始するには、システムに LOADER プロンプトが表示されている必要があります。
診断手順のコマンドは、すべてコンポーネントを交換するコントローラから実行します。
-
作業をするコントローラに LOADER プロンプトが表示されていない場合は、次の手順を実行します。
-
表示されたメニューからメンテナンスモードオプションを選択します。
-
コントローラがメンテナンスモードでブートしたら、コントローラを停止します。
halt
コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。
ブートプロセス中に、安全に応答できます。 y
をクリックします。-
HA 構成でメンテナンスモードに切り替えたときに、正常なコントローラが停止したままであることの確認を求めるプロンプトが表示される場合。
-
-
-
LOADER プロンプトで、システムレベルの診断用に特別に設計されたドライバにアクセスします。
boot_diags
ブートプロセス中に、安全に応答できます。
y
メンテナンスモードプロンプト(*>)が表示されるまで、プロンプトに従います。 -
システムメモリの診断を実行します。
sldiag device run -dev mem
-
DIMMの交換が原因でハードウェアの問題が発生していないことを確認します。
sldiag device status -dev mem -long -state failed
テストに失敗した場合は、プロンプトに戻ります。失敗した場合は、そのステータスがすべて表示されます。
-
前述の手順の結果に応じて、次に進みます。
システムレベルの診断のテスト結果 作業 は失敗なしで完了しました
-
ステータスログを消去します。
sldiag device clearstatus
-
ログが消去されたことを確認します。
sldiag device status
次のデフォルトの応答が表示されます。
SLDIAG :ログメッセージが存在しません。
-
保守モードを終了します :halt
コントローラに LOADER プロンプトが表示されます。
-
LOADERプロンプトからコントローラをブートします。
bye
-
コントローラを通常動作に戻します。
コントローラの構成 作業 HA ペア
ギブバックを実行します。
storage failover giveback -ofnode replacement_node_name
*注:*自動ギブバックを無効にした場合は、storage failover modifyコマンドを使用して再度有効にします。テストが失敗しました
問題の原因を特定します。
-
保守モードを終了します :halt
コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。
-
システムレベルの診断を実行するための考慮事項をすべて確認するとともに、ケーブルがしっかりと接続されているか、ハードウェアコンポーネントがストレージシステムに適切に取り付けられているかを確認します。
-
対象となるコントローラモジュールをブートし、
Ctrl-C
ブートメニューを表示するように求められたら、次の手順を実行します。-
シャーシ内にコントローラモジュールが 2 つある場合は、対象となるコントローラモジュールをシャーシに完全に取り付けます。
コントローラモジュールを完全に取り付けると、モジュールがブートします。
-
シャーシ内にコントローラモジュールが 1 つしかない場合は、電源装置を接続して電源をオンにします。
-
-
メニューから、メンテナンスモードでのブートを選択します。
-
次のコマンドを入力してメンテナンスモードを終了します。
halt
コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。
-
システムレベルの診断テストを再実行します。
-
手順 6 :障害が発生したパーツをネットアップに返却する
障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。