CLIを使用した手動による無停止ONTAPアップグレード(標準構成)
System Managerを使用した自動アップグレードが推奨されるアップグレード方法です。System Mangerでサポートされない構成の場合は、ONTAPコマンドライン インターフェイス(CLI)を使用して手動無停止アップグレードを実行できます。手動の無停止方式を使用して 2 つ以上のノードのクラスタをアップグレードするには、 HA ペアの各ノードでフェイルオーバー処理を開始し、「 failed 」ノードを更新してギブバックを開始してから、クラスタ内の各 HA ペアについてこの処理を繰り返す必要があります。
アップグレード要件を満たしておく必要があり"準備"ます。
HAペアの最初のノードの更新
ノードのパートナーによるテイクオーバーを開始することで、HAペアの最初のノードを更新できます。最初のノードをアップグレードしている間、ノードのデータはパートナーから提供されます。
メジャー アップグレードを実行する場合は、外部接続用にデータLIFを設定し、最初のONTAPイメージをインストールしたノードをアップグレード対象の最初のノードにする必要があります。
最初のノードをアップグレードしたら、できるだけ早くパートナーノードをアップグレードする必要があります。2つのノードを必要以上に長い間状態のままにしないで"バージョンノコンザイ"ください。
-
AutoSupportメッセージを呼び出して、クラスタ内の最初のノードを更新します。
autosupport invoke -node * -type all -message "Starting_NDU"
このAutoSupport通知には、更新直前のシステムステータスの記録が含まれます。これにより、更新処理で問題が発生した場合に役立つトラブルシューティング情報が保存されます。
AutoSupportメッセージを送信するようにクラスタが設定されていない場合は、通知のコピーがローカルに保存されます。
-
権限レベルをadvancedに設定します。続行するかどうかを尋ねられたら、「* y *」と入力します。
set -privilege advanced
advancedプロンプト(`*>`が表示されます)。
-
新しいONTAPソフトウェアイメージをデフォルトのイメージとして設定します。
system image modify {-node nodenameA -iscurrent false} -isdefault true
system image modifyコマンドでは、拡張クエリを使用して、(代替イメージとしてインストールされる)新しいONTAPソフトウェアイメージをノードのデフォルトイメージに変更します。
-
更新の進捗状況を監視します。
system node upgrade-revert show
-
新しいONTAPソフトウェアイメージがデフォルトのイメージとして設定されたことを確認します。
system image show
次の例では、image2が新しいONTAPバージョンで、node0でデフォルトのイメージとして設定されています。
cluster1::*> system image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false true X.X.X MM/DD/YYYY TIME image2 true false Y.Y.Y MM/DD/YYYY TIME node1 image1 true true X.X.X MM/DD/YYYY TIME image2 false false Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
自動ギブバックが有効になっている場合は、パートナーノードで無効にします。
storage failover modify -node nodenameB -auto-giveback false
2ノードクラスタの場合は、自動ギブバックを無効にすると、交互に障害が発生した場合に管理クラスタのサービスがオンラインにならないことを示す警告メッセージが表示されます。と入力し `y`て続行します。
-
ノードのパートナーの自動ギブバックが無効になっていることを確認します。
storage failover show -node nodenameB -fields auto-giveback
cluster1::> storage failover show -node node1 -fields auto-giveback node auto-giveback -------- ------------- node1 false 1 entry was displayed.
-
次のコマンドを2回実行して、更新対象のノードが現在クライアントに対して処理を行っているかどうかを確認します。
system node run -node nodenameA -command uptime
uptimeコマンドでは、ノードの前回のブート以降にNFS、SMB、FC、iSCSIの各クライアントに対してノードが実行した処理の総数が表示されます。プロトコルごとにコマンドを2回実行して、処理数が増加しているかどうかを確認する必要があります。増加している場合は、そのプロトコルのクライアントに対してノードが現在処理を行っています。増加していない場合は、そのプロトコルのクライアントに対してノードは現在処理を行っていません。
ノードの更新後にクライアント トラフィックが再開したことを確認できるように、クライアントの処理数が増加しているプロトコルをすべて書き留めてください。 次の例は、NFS、SMB、FC、およびiSCSIの処理が検出されたノードを示しています。ただし、ノードは現在NFSクライアントとiSCSIクライアントに対してのみ処理を行っています。
cluster1::> system node run -node node0 -command uptime 2:58pm up 7 days, 19:16 800000260 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32810 iSCSI ops cluster1::> system node run -node node0 -command uptime 2:58pm up 7 days, 19:17 800001573 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32815 iSCSI ops
-
ノードからすべてのデータLIFを移行します。
network interface migrate-all -node nodenameA
-
移行したLIFを確認します。
network interface show
LIFのステータスの確認に使用できるパラメータの詳細については、network interface showのマニュアル ページを参照してください。
次の例は、node0のデータLIFが正常に移行されたことを示しています。それぞれのLIFについて、この例に含まれるフィールドを使用して、LIFのホーム ノードとポート、LIFの移行先である現在のノードとポート、およびLIFの動作ステータスと管理ステータスを確認できます。
cluster1::> network interface show -data-protocol nfs|cifs -role data -home-node node0 -fields home-node,curr-node,curr-port,home-port,status-admin,status-oper vserver lif home-node home-port curr-node curr-port status-oper status-admin ------- ------- --------- --------- --------- --------- ----------- ------------ vs0 data001 node0 e0a node1 e0a up up vs0 data002 node0 e0b node1 e0b up up vs0 data003 node0 e0b node1 e0b up up vs0 data004 node0 e0a node1 e0a up up 4 entries were displayed.
-
テイクオーバーを開始します。
storage failover takeover -ofnode nodenameA
テイクオーバーするノードを新しいソフトウェア イメージでブートするには通常のテイクオーバーが必要なため、-option immediateパラメータは指定しないでください。ノードからLIFを手動で移行しなかった場合は、LIFがノードのHAパートナーに自動的に移行されるので、サービスが停止することはありません。
最初のノードがブートし、Waiting for giveback状態になります。
AutoSupportが有効な場合は、ノードがクラスタ クォーラムのメンバーでないことを示すAutoSupportメッセージが送信されます。この通知を無視し、更新を続行してかまいません。 -
テイクオーバーが正常に完了したことを確認します。
storage failover show
バージョンの不一致およびメールボックス形式の問題を示すエラーメッセージが表示される場合があります。これは想定される動作であり、無停止メジャーアップグレードにおける一時的な状態を表しており、悪影響はありません。
次の例は、テイクオーバーが正常に完了したことを示しています。ノードnode0の状態はWaiting for giveback、パートナーの状態はIn takeoverになっています。
cluster1::> storage failover show Takeover Node Partner Possible State Description -------------- -------------- -------- ------------------------------------- node0 node1 - Waiting for giveback (HA mailboxes) node1 node0 false In takeover 2 entries were displayed.
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがテイクオーバー中に発生した I/O 処理の中断から回復している。
リカバリ時間はクライアントによって異なり、クライアントアプリケーションの特性によっては8分以上かかることがあります。
-
-
アグリゲートを最初のノードに戻します。
storage failover giveback -ofnode nodenameA
ギブバックでは、最初にルート アグリゲートをパートナー ノードに戻し、そのノードのブートが完了すると、ルート以外のアグリゲートと自動的にリバートするように設定されたすべてのLIFを戻します。新しくブートしたノードで、戻されたアグリゲートから順番にクライアントへのデータ提供が開始されます。
-
すべてのアグリゲートが戻されたことを確認します。
storage failover show-giveback
Giveback Statusフィールドにギブバックするアグリゲートがないことが示されている場合は、すべてのアグリゲートが戻されています。ギブバックが拒否された場合は、コマンドによってギブバックの進捗が表示され、拒否したサブシステムも表示されます。
-
いずれかのアグリゲートが戻されていない場合は、次の手順を実行します。
-
拒否された回避策を確認して、「 ve to 」状態に対処するか、拒否を無視するかを決定します。
-
必要に応じて、エラーメッセージに記載されている「宛」の状態に対処し、特定された処理が正常に終了するようにします。
-
storage failover givebackコマンドを再実行します。
「 "" ~ "" 」条件をオーバーライドする場合は、 -override-vetoes パラメータを true に設定します。
-
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがギブバック中に発生したI/O処理の中断から回復している。
リカバリ時間はクライアントによって異なり、クライアントアプリケーションの特性によっては8分以上かかることがあります。
-
-
ノードの更新が正常に完了したことを確認します。
-
advanced権限レベルに切り替えます。
set -privilege advanced
-
ノードの更新ステータスが完了になっていることを確認します。
system node upgrade-revert show -node nodenameA
ステータスがcompleteと表示されます。
ステータスがcompleteでない場合は、テクニカルサポートにお問い合わせください。
-
admin権限レベルに戻ります。
set -privilege admin
-
-
ノードのポートが動作していることを確認します。
network port show -node nodenameA
このコマンドは、ONTAP 9の上位バージョンにアップグレードされたノードで実行する必要があります。
次の例は、ノードのすべてのポートが動作していることを示しています。
cluster1::> network port show -node node0 Speed (Mbps) Node Port IPspace Broadcast Domain Link MTU Admin/Oper ------ --------- ------------ ---------------- ----- ------- ------------ node0 e0M Default - up 1500 auto/100 e0a Default - up 1500 auto/1000 e0b Default - up 1500 auto/1000 e1a Cluster Cluster up 9000 auto/10000 e1b Cluster Cluster up 9000 auto/10000 5 entries were displayed.
-
LIFをノードにリバートします。
network interface revert *
このコマンドを実行すると、移行したLIFが元のノードに戻されます。
cluster1::> network interface revert * 8 entries were acted on.
-
ノードのデータLIFが正常にノードにリバートされ、動作していることを確認します。
network interface show
次の例は、ノードがホストするすべてのデータLIFが正常にノードにリバートされ、動作ステータスが「up」になっていることを示しています。
cluster1::> network interface show Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- vs0 data001 up/up 192.0.2.120/24 node0 e0a true data002 up/up 192.0.2.121/24 node0 e0b true data003 up/up 192.0.2.122/24 node0 e0b true data004 up/up 192.0.2.123/24 node0 e0a true 4 entries were displayed.
-
前の手順でこのノードがクライアントに対して処理を行っていることを確認した場合は、その時点で処理を行っていたプロトコルごとに、ノードがサービスを提供していることを確認します。
system node run -node nodenameA -command uptime
更新中に、処理数はゼロにリセットされます。
次の例は、更新したノードがNFSクライアントとiSCSIクライアントに対する処理を再開していることを示しています。
cluster1::> system node run -node node0 -command uptime 3:15pm up 0 days, 0:16 129 NFS ops, 0 CIFS ops, 0 HTTP ops, 0 FCP ops, 2 iSCSI ops
-
前の手順でパートナー ノードの自動ギブバックを無効にした場合は、再度有効にします。
storage failover modify -node nodenameB -auto-giveback true
できるだけ早くノードのHAパートナーの更新に進んでください。何らかの理由で更新プロセスを中断する必要がある場合は、HAペアの両方のノードで同じバージョンのONTAPを実行する必要があります。
HAペアのパートナー ノードの更新
HAペアの最初のノードを更新したあとは、そのノードでテイクオーバーを開始してパートナーを更新します。パートナーをアップグレードしている間、パートナーのデータは最初のノードから提供されます。
-
権限レベルをadvancedに設定します。続行するかどうかを尋ねられたら、「* y *」と入力します。
set -privilege advanced
advancedプロンプト(`*>`が表示されます)。
-
新しいONTAPソフトウェアイメージをデフォルトのイメージとして設定します。
system image modify {-node nodenameB -iscurrent false} -isdefault true
system image modifyコマンドでは、拡張クエリを使用して、(代替イメージとしてインストールされる)新しいONTAPソフトウェアイメージがノードのデフォルトイメージになるように変更します。
-
更新の進捗状況を監視します。
system node upgrade-revert show
-
新しいONTAPソフトウェアイメージがデフォルトのイメージとして設定されたことを確認します。
system image show
次の例で `image2`は、がONTAPの新しいバージョンであり、ノードでデフォルトのイメージとして設定されています。
cluster1::*> system image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME node1 image1 false true X.X.X MM/DD/YYYY TIME image2 true false Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
自動ギブバックが有効になっている場合は、パートナーノードで無効にします。
storage failover modify -node nodenameA -auto-giveback false
2ノードクラスタの場合は、自動ギブバックを無効にすると、交互に障害が発生した場合に管理クラスタのサービスがオンラインにならないことを示す警告メッセージが表示されます。と入力し `y`て続行します。
-
パートナーノードの自動ギブバックが無効になっていることを確認します。
storage failover show -node nodenameA -fields auto-giveback
cluster1::> storage failover show -node node0 -fields auto-giveback node auto-giveback -------- ------------- node0 false 1 entry was displayed.
-
次のコマンドを2回実行して、更新対象のノードが現在クライアントに対して処理を行っているかどうかを確認します。
system node run -node nodenameB -command uptime
uptimeコマンドでは、ノードの前回のブート以降にNFS、SMB、FC、iSCSIの各クライアントに対してノードが実行した処理の総数が表示されます。プロトコルごとにコマンドを2回実行して、処理数が増加しているかどうかを確認する必要があります。増加している場合は、そのプロトコルのクライアントに対してノードが現在処理を行っています。増加していない場合は、そのプロトコルのクライアントに対してノードは現在処理を行っていません。
ノードの更新後にクライアント トラフィックが再開したことを確認できるように、クライアントの処理数が増加しているプロトコルをすべて書き留めてください。 次の例は、NFS、SMB、FC、およびiSCSIの処理が検出されたノードを示しています。ただし、ノードは現在NFSクライアントとiSCSIクライアントに対してのみ処理を行っています。
cluster1::> system node run -node node1 -command uptime 2:58pm up 7 days, 19:16 800000260 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32810 iSCSI ops cluster1::> system node run -node node1 -command uptime 2:58pm up 7 days, 19:17 800001573 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32815 iSCSI ops
-
ノードからすべてのデータLIFを移行します。
network interface migrate-all -node nodenameB
-
移行したLIFのステータスを確認します。
network interface show
LIFのステータスの確認に使用できるパラメータの詳細については、network interface showのマニュアル ページを参照してください。
次の例は、node1のデータLIFが正常に移行されたことを示しています。それぞれのLIFについて、この例に含まれるフィールドを使用して、LIFのホーム ノードとポート、LIFの移行先である現在のノードとポート、およびLIFの動作ステータスと管理ステータスを確認できます。
cluster1::> network interface show -data-protocol nfs|cifs -role data -home-node node1 -fields home-node,curr-node,curr-port,home-port,status-admin,status-oper vserver lif home-node home-port curr-node curr-port status-oper status-admin ------- ------- --------- --------- --------- --------- ----------- ------------ vs0 data001 node1 e0a node0 e0a up up vs0 data002 node1 e0b node0 e0b up up vs0 data003 node1 e0b node0 e0b up up vs0 data004 node1 e0a node0 e0a up up 4 entries were displayed.
-
テイクオーバーを開始します。
storage failover takeover -ofnode nodenameB -option allow-version-mismatch
テイクオーバーされたノードを新しいソフトウェアイメージでブートするには通常のテイクオーバーが必要なため、-option immediateパラメータは指定しないでください。ノードからLIFを手動で移行しなかった場合は、LIFがノードのHAパートナーに自動的に移行されるため、サービスが停止することはありません。
警告が表示されます。続行するには、と入力する必要があります
y
。テイクオーバーされたノードがブートし、Waiting for giveback状態になります。
AutoSupportが有効な場合は、ノードがクラスタ クォーラムのメンバーでないことを示すAutoSupportメッセージが送信されます。この通知を無視し、更新を続行してかまいません。 -
テイクオーバーが正常に完了したことを確認します。
storage failover show
次の例は、テイクオーバーが正常に完了したことを示しています。ノードnode1の状態はWaiting for giveback、パートナーの状態はIn takeoverになっています。
cluster1::> storage failover show Takeover Node Partner Possible State Description -------------- -------------- -------- ------------------------------------- node0 node1 - In takeover node1 node0 false Waiting for giveback (HA mailboxes) 2 entries were displayed.
-
次の条件が有効になるまで、8分以上待ちます。+
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがテイクオーバー中に発生したI/Oの中断から回復している。
回復までの時間はクライアントによって異なり、クライアントアプリケーションの特性によっては8分以上かかることがあります。
-
-
アグリゲートをパートナーノードに戻します。
storage failover giveback -ofnode nodenameB
ギブバック処理では、最初にルートアグリゲートがパートナーノードに戻され、そのノードのブートが完了すると、ルート以外のアグリゲートと自動的にリバートするように設定されたLIFが戻されます。新しくブートしたノードで、戻されたアグリゲートから順番にクライアントへのデータ提供が開始されます。
-
すべてのアグリゲートが戻されたことを確認します。
storage failover show-giveback
Giveback Statusフィールドにギブバックするアグリゲートがないことが示されている場合は、すべてのアグリゲートが戻されています。ギブバックが拒否された場合は、コマンドによってギブバックの進捗が表示され、ギブバック処理を拒否したサブシステムも表示されます。
-
いずれかのアグリゲートが戻されていない場合は、次の手順を実行します。
-
拒否された回避策を確認して、「 ve to 」状態に対処するか、拒否を無視するかを決定します。
-
必要に応じて、エラーメッセージに記載されている「宛」の状態に対処し、特定された処理が正常に終了するようにします。
-
storage failover givebackコマンドを再実行します。
「 "" ~ "" 」条件をオーバーライドする場合は、 -override-vetoes パラメータを true に設定します。
-
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがギブバック中に発生したI/O処理の中断から回復している。
リカバリ時間はクライアントによって異なり、クライアントアプリケーションの特性によっては8分以上かかることがあります。
-
-
ノードの更新が正常に完了したことを確認します。
-
advanced権限レベルに切り替えます。
set -privilege advanced
-
ノードの更新ステータスが完了になっていることを確認します。
system node upgrade-revert show -node nodenameB
ステータスがcompleteと表示されます。
ステータスがcompleteでない場合は、ノードからコマンドを実行し `system node upgrade-revert upgrade`ます。コマンドを実行しても更新が完了しない場合は、テクニカルサポートにお問い合わせください。
-
admin権限レベルに戻ります。
set -privilege admin
-
-
ノードのポートが動作していることを確認します。
network port show -node nodenameB
このコマンドはONTAP 9にアップグレードされたノードで実行する必要があります。4.
次の例は、ノードのすべてのデータポートが動作していることを示しています。
cluster1::> network port show -node node1 Speed (Mbps) Node Port IPspace Broadcast Domain Link MTU Admin/Oper ------ --------- ------------ ---------------- ----- ------- ------------ node1 e0M Default - up 1500 auto/100 e0a Default - up 1500 auto/1000 e0b Default - up 1500 auto/1000 e1a Cluster Cluster up 9000 auto/10000 e1b Cluster Cluster up 9000 auto/10000 5 entries were displayed.
-
LIFをノードにリバートします。
network interface revert *
このコマンドを実行すると、移行したLIFが元のノードに戻されます。
cluster1::> network interface revert * 8 entries were acted on.
-
ノードのデータLIFが正常にノードにリバートされ、動作していることを確認します。
network interface show
次の例は、ノードでホストされるすべてのデータLIFが正常にノードにリバートされ、動作ステータスが「up」になっていることを示しています。
cluster1::> network interface show Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- vs0 data001 up/up 192.0.2.120/24 node1 e0a true data002 up/up 192.0.2.121/24 node1 e0b true data003 up/up 192.0.2.122/24 node1 e0b true data004 up/up 192.0.2.123/24 node1 e0a true 4 entries were displayed.
-
前の手順でこのノードがクライアントに対して処理を行っていることを確認した場合は、その時点で処理を行っていたプロトコルごとに、ノードがサービスを提供していることを確認します。
system node run -node nodenameB -command uptime
更新中に、処理数はゼロにリセットされます。
次の例は、更新したノードがNFSクライアントとiSCSIクライアントに対する処理を再開していることを示しています。
cluster1::> system node run -node node1 -command uptime 3:15pm up 0 days, 0:16 129 NFS ops, 0 CIFS ops, 0 HTTP ops, 0 FCP ops, 2 iSCSI ops
-
これがクラスタ内で更新される最後のノードであった場合は、AutoSupport通知をトリガーします。
autosupport invoke -node * -type all -message "Finishing_NDU"
このAutoSupport通知には、更新直前のシステムステータスの記録が含まれます。これにより、更新処理で問題が発生した場合に役立つトラブルシューティング情報が保存されます。
AutoSupportメッセージを送信するようにクラスタが設定されていない場合は、通知のコピーがローカルに保存されます。
-
HAペアの両方のノードで新しいONTAPソフトウェアが実行されていることを確認します。
set -privilege advanced
system node image show
次の例では、image2がONTAPの更新後のバージョンで、両方のノードのデフォルトのバージョンです。
cluster1::*> system node image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME node1 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
前の手順でパートナー ノードの自動ギブバックを無効にした場合は、再度有効にします。
storage failover modify -node nodenameA -auto-giveback true
-
コマンドと
cluster ring show
(advanced権限レベル)コマンドを使用して、クラスタがクォーラムにあること、およびサービスが実行されていることを確認しますcluster show
。この手順は、追加のHAペアをアップグレードする前に実行する必要があります。
-
admin権限レベルに戻ります。
set -privilege admin
-
追加のHAペアがある場合はアップグレードします。