NVIDIA SN2100ストレージスイッチを交換してください
障害のあるNVIDIA SN2100ストレージスイッチを交換できます。これは無停止の手順です。
NVIDIA SN2100ストレージスイッチにCumulusソフトウェアとRCFをインストールする前に、次の点を確認してください。
-
お使いのシステムではNVIDIA SN2100ストレージスイッチをサポートできます。
-
該当するRCFをダウンロードしておきます。
。 "Hardware Universe" サポートされているポートとその構成の詳細が表示されます。
既存のネットワーク構成には、次のような特徴があります。
-
スイッチの交換が必要かどうかを確認するために、すべてのトラブルシューティング手順が完了していることを確認します。
-
両方のスイッチで管理接続が確立されている必要があります。
スイッチの交換が必要かどうかを確認するために、すべてのトラブルシューティング手順が完了していることを確認します。
交換用NVIDIA SN2100スイッチには次の特性が必要です。
-
管理ネットワーク接続は機能しています。
-
交換用スイッチへのコンソールアクセスが確立されています。
-
適切なRCFおよびCumulusオペレーティングシステムイメージがスイッチにロードされます。
-
スイッチの初期カスタマイズが完了しました。
この手順 は、2台目のNVIDIA SN2100ストレージスイッチSW2を新しいNVIDIA SN2100スイッチnsw2に置き換えます。2 つのノードは node1 と node2 になります。
完了する手順:
-
交換するスイッチがSW2であることを確認します。
-
スイッチSW2からケーブルを外します。
-
スイッチnsw2にケーブルを再接続します。
-
スイッチnsw2のすべてのデバイス設定を確認します。
-
このクラスタで AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。
'system node AutoSupport invoke -node * -type all -message MAINT=xh`
x は、メンテナンス時間の長さ(時間単位)です。
-
権限レベルを advanced に変更します。続行するかどうかを尋ねられたら、「 * y * 」と入力します。
「 advanced 」の権限が必要です
-
ストレージノードポートのヘルスステータスをチェックして、ストレージスイッチ S1 に接続されていることを確認します。
storage port show -port-type enet
例を示します
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID -------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
ストレージスイッチsw1が使用可能であることを確認します。
network device-discovery show -protocol lldp
例を示します
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
を実行します
net show interface
動作中のスイッチに対してコマンドを実行し、ノードとすべてのシェルフの両方が表示されることを確認します。net show interface
例を示します
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ------ ---- ----- ---------- -------------------- -------------------- ... ... UP swp1 100G 9216 Trunk/L2 node1 (e3a) Master: bridge(UP) UP swp2 100G 9216 Trunk/L2 node2 (e3a) Master: bridge(UP) UP swp3 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp5 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP) UP swp6 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP)) ... ...
-
ストレージシステムのシェルフポートを確認します。
storage shelf port show -fields remote-device, remote-port
例を示します
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 - - 3.20 2 swp4 sw1 3.20 3 - - 3.30 0 swp5 sw1 3.20 1 - - 3.30 2 swp6 sw1 3.20 3 - - cluster1::*>
-
ストレージスイッチSW2に接続されているすべてのケーブルを取り外します。
-
交換用スイッチnsw2にすべてのケーブルを再接続します。
-
ストレージノードポートのヘルスステータスを再確認します。
storage port show -port-type enet
例を示します
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID ---------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
両方のスイッチが使用可能であることを確認します。
net device-discovery show -protocol lldp
例を示します
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
ストレージシステムのシェルフポートを確認します。
storage shelf port show -fields remote-device, remote-port
例を示します
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 swp3 nsw2 3.20 2 swp4 sw1 3.20 3 swp4 nsw2 3.30 0 swp5 sw1 3.20 1 swp5 nsw2 3.30 2 swp6 sw1 3.20 3 swp6 nsw2 cluster1::*>
-
次の2つのコマンドを使用して、スイッチ関連のログファイルを収集するためのイーサネットスイッチヘルスモニタログ収集機能を有効にします。
'system switch ethernet log setup-password 'および'system switch ethernet log enable-colion
「 system switch ethernet log setup -password 」と入力します
例を示します
cluster1::*> system switch ethernet log setup-password Enter the switch name: <return> The switch name entered is not recognized. Choose from the following list: sw1 nsw2 cluster1::*> system switch ethernet log setup-password Enter the switch name: sw1 RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc Do you want to continue? {y|n}::[n] y Enter the password: <enter switch password> Enter the password again: <enter switch password> cluster1::*> system switch ethernet log setup-password Enter the switch name: nsw2 RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1 Do you want to continue? {y|n}:: [n] y Enter the password: <enter switch password> Enter the password again: <enter switch password>
その後に次のコマンドを入力
「システムスイッチのイーサネットログの有効化」
例を示します
cluster1::*> system switch ethernet log enable-collection Do you want to enable cluster log collection for all nodes in the cluster? {y|n}: [n] y Enabling cluster switch log collection. cluster1::*>
これらのコマンドのいずれかでエラーが返される場合は、ネットアップサポートにお問い合わせください。 -
スイッチのログ収集機能をテストします。
system switch ethernet log collect -device *
10分間待ってから'次のコマンドを使用してログ収集が成功したことを確認しますsystem switch ethernet log show
例を示します
cluster1::*> system switch ethernet log show Log Collection Enabled: true Index Switch Log Timestamp Status ------ ---------------------------- ------------------- --------- 1 sw1 (b8:ce:f6:19:1b:42) 4/29/2022 03:05:25 complete 2 nsw2 (b8:ce:f6:19:1b:96) 4/29/2022 03:07:42 complete
-
権限レベルを admin に戻します。
「特権管理者」
-
ケースの自動作成を抑制した場合は、 AutoSupport メッセージを呼び出して作成を再度有効にします。
「 system node AutoSupport invoke -node * -type all -message MAINT= end 」というメッセージが表示されます