升級Element軟體
若要升級NetApp Element VMware軟體、您可以使用NetApp混合雲控制UI、REST API或HealthTools套裝工具。某些作業會在元素軟體升級期間受到抑制、例如新增和移除節點、新增和移除磁碟機、以及與啟動器、Volume存取群組和虛擬網路相關的命令等。
-
管理權限:您有儲存叢集管理員權限可執行升級。
-
* 有效升級路徑 * :您已檢查要升級至的元素版本的升級路徑資訊、並確認升級路徑有效。https://kb.netapp.com/Advice_and_Troubleshooting/Data_Storage_Software/Element_Software/What_is_the_upgrade_matrix_for_storage_clusters_running_NetApp_Element_software%3F["NetApp KB :執行 NetApp Element 軟體之儲存叢集的升級對照表(需要登入)"^]
-
系統時間同步:您已確保所有節點上的系統時間均已同步、且儲存叢集和節點的NTP設定正確。每個節點都必須在每個節點的 Web UI 中使用 DNS 名稱伺服器進行設定(
https://[IP address]:442
、且沒有與時間偏差相關的未解析叢集故障。 -
系統連接埠:如果您使用NetApp混合式雲端控制進行升級、您已確保所需的連接埠已開啟。如需詳細資訊、請參閱 "網路連接埠" 。
-
管理節點:對於NetApp混合雲控制UI和API、您環境中的管理節點執行版本11.3。
-
管理服務:您已將管理服務套裝組合更新為最新版本。
|
您必須先升級至最新的管理服務套裝組合、才能將Element軟體升級至版本12。如果您要將Element軟體更新至版本12.2、則需要使用管理服務2.14.60或更新版本才能繼續。 |
-
叢集健全狀況:您已確認叢集已準備好升級。請參閱。 "升級儲存設備之前、請先執行Element儲存設備健全狀況檢查"
-
*更新BMC for H610S nodes *:您已升級H610S節點的BMC版本。請參閱"版本說明與升級指示"。
-
終端使用者授權合約(EULA):從管理服務2.20.69開始、您必須先接受並儲存EULA、才能使用NetApp混合雲控制UI或API來升級Element軟體:
-
在Web瀏覽器中開啟管理節點的IP位址:
https://<ManagementNodeIP>
-
提供儲存叢集管理員認證資料、以登入NetApp混合雲控制系統。
-
選取介面右上角附近的*升級*。
-
隨即顯示EULA。向下捲動、選取*我接受目前及所有未來更新*、然後選取*儲存*。
-
請選擇下列其中一個元素軟體升級選項:
|
如果您要將 H610S 系列節點升級至元素 12.2 、且節點執行的元件版本早於 11.8 、則需要為每個儲存節點執行額外的升級步驟(第2階段)。如果您執行的是元素11.8或更新版本、則不需要執行其他升級步驟(階段2)。 |
使用NetApp混合雲控制UI來升級元素儲存設備
您可以使用NetApp混合雲控制UI來升級儲存叢集。
|
有關使用 NetApp 混合雲控制升級儲存叢集的潛在問題及其因應措施,請參閱 "知識庫文章"。 |
|
對於非H610S平台、每個節點的升級程序約需30分鐘。 |
-
在Web瀏覽器中開啟管理節點的IP位址:
https://<ManagementNodeIP>
-
提供儲存叢集管理員認證資料、以登入NetApp混合雲控制系統。
-
選取介面右上角附近的*升級*。
-
在「升級」頁面上、選取「儲存設備」。
「儲存設備」索引標籤會列出您安裝時所需的儲存叢集。如果NetApp混合雲控制無法存取叢集、則不會顯示在「升級」頁面上。
-
從下列選項中選擇、然後執行適用於您叢集的一組步驟:
選項 步驟 執行元素11.8及更新版本的所有叢集
-
選擇*瀏覽*上傳您下載的升級套件。
-
等待上傳完成。進度列會顯示上傳狀態。
如果您離開瀏覽器視窗、檔案上傳將會遺失。 檔案成功上傳及驗證後、畫面上會顯示一則訊息。驗證可能需要幾分鐘的時間。如果您在此階段離開瀏覽器視窗、檔案上傳會保留下來。
-
選擇*開始升級*。
升級期間*升級狀態*會變更、以反映程序的狀態。它也會因應您採取的行動而變更、例如暫停升級、或升級傳回錯誤。請參閱。 升級狀態變更 在升級進行期間、您可以離開頁面、稍後再返回頁面、繼續監控進度。如果叢集列收合、頁面不會動態更新狀態和目前版本。叢集列必須展開以更新表格、否則您可以重新整理頁面。 您可以在升級完成後下載記錄。
您正在升級執行元素11.8之前版本的H610S叢集。
-
升級狀態變更
以下是使用者介面中「升級狀態」欄在升級前、期間及之後顯示的不同狀態:
升級狀態 | 說明 |
---|---|
最新 |
叢集已升級至可用的最新元素版本。 |
提供版本 |
有更新版本的Element和/或儲存韌體可供升級。 |
進行中 |
升級正在進行中。進度列會顯示升級狀態。畫面上的訊息也會顯示節點層級的故障、並在升級過程中顯示叢集中每個節點的節點ID。您可以使用Element UI或NetApp Element vCenter Server UI的VMware外掛程式來監控每個節點的狀態。 |
升級暫停 |
您可以選擇暫停升級。視升級程序的狀態而定、暫停作業可能會成功或失敗。您會看到UI提示、要求您確認暫停作業。為了確保叢集在暫停升級之前處於安全位置、升級作業可能需要兩小時才能完全暫停。若要繼續升級、請選取*恢復*。 |
已暫停 |
您已暫停升級。選取*恢復*以繼續處理程序。 |
錯誤 |
升級期間發生錯誤。您可以下載錯誤記錄並將其傳送至NetApp支援部門。解決錯誤之後、您可以返回頁面、然後選取*恢復*。當您繼續升級時、進度列會在系統執行健全狀況檢查並檢查升級的目前狀態時、向後移幾分鐘。 |
完成後續追蹤 |
僅適用於從11.8之前的元素版本升級的H610S節點。升級程序的第 1 階段完成後,此狀態會提示您執行升級的第 2 階段(請參閱 "知識庫文章")。完成階段2並確認您已完成、狀態會變更為*最新*。 |
使用NetApp混合雲控制API來升級元素儲存設備
您可以使用API將叢集中的儲存節點升級至最新的Element軟體版本。您可以使用自己選擇的自動化工具來執行API。此處記錄的API工作流程使用管理節點上可用的REST API UI作為範例。
-
將儲存升級套件下載至管理節點可存取的裝置、然後前往 NetApp HCI 軟體 "下載頁面"下載最新的儲存節點映像。
-
將儲存升級套件上傳至管理節點:
-
在管理節點上開啟管理節點REST API UI:
https://<ManagementNodeIP>/package-repository/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
從REST API UI中、選取* POST /套件*。
-
選擇*試用*。
-
選擇*瀏覽*並選擇升級套件。
-
選取*執行*以啟動上傳。
-
從響應中複製並保存軟件包 ID (
"id"
),以便在以後的步驟中使用。
-
-
確認上傳狀態。
-
從REST API UI中、選取* GETRIVE/套件SESI/{id}/狀態*。
-
選擇*試用*。
-
在「* id*」中輸入您在上一個步驟中複製的套件ID。
-
選取*執行*以啟動狀態要求。
回應會顯示 `state`為 `SUCCESS`完成。
-
-
找出儲存叢集ID:
-
在管理節點上開啟管理節點REST API UI:
https://<ManagementNodeIP>/inventory/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
從REST API UI中、選取* Get /Installations *。
-
選擇*試用*。
-
選擇*執行*。
-
從響應中複製安裝資產 ID (
"id"
)。 -
從REST API UI中選取* Get /Installations/{id}*。
-
選擇*試用*。
-
將安裝資產ID貼到* id*欄位。
-
選擇*執行*。
-
從(`"id"`您要升級的叢集的回應中、複製並儲存儲存叢集 ID (儲存叢集 ID )、以便在稍後的步驟中使用。
-
-
執行儲存設備升級:
-
在管理節點上開啟儲存REST API UI:
https://<ManagementNodeIP>/storage/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
選擇* POST /升級*。
-
選擇*試用*。
-
在參數欄位中輸入升級套件ID。
-
在參數欄位中輸入儲存叢集ID。
有效負載應類似下列範例:
{ "config": {}, "packageId": "884f14a4-5a2a-11e9-9088-6c0b84e211c4", "storageId": "884f14a4-5a2a-11e9-9088-6c0b84e211c4" }
-
選擇*執行*以啟動升級。
回應應指出狀態為
initializing
:
{ "_links": { "collection": "https://localhost:442/storage/upgrades", "self": "https://localhost:442/storage/upgrades/3fa85f64-1111-4562-b3fc-2c963f66abc1", "log": https://localhost:442/storage/upgrades/3fa85f64-1111-4562-b3fc-2c963f66abc1/log }, "storageId": "114f14a4-1a1a-11e9-9088-6c0b84e200b4", "upgradeId": "334f14a4-1a1a-11e9-1055`-6c0b84e2001b4", "packageId": "774f14a4-1a1a-11e9-8888-6c0b84e200b4", "config": {}, "state": "initializing", "status": { "availableActions": [ "string" ], "message": "string", "nodeDetails": [ { "message": "string", "step": "NodePreStart", "nodeID": 0, "numAttempt": 0 } ], "percent": 0, "step": "ClusterPreStart", "timestamp": "2020-04-21T22:10:57.057Z", "failedHealthChecks": [ { "checkID": 0, "name": "string", "displayName": "string", "passed": true, "kb": "string", "description": "string", "remedy": "string", "severity": "string", "data": {}, "nodeID": 0 } ] }, "taskId": "123f14a4-1a1a-11e9-7777-6c0b84e123b2", "dateCompleted": "2020-04-21T22:10:57.057Z", "dateCreated": "2020-04-21T22:10:57.057Z" }
-
複製(`"upgradeId"`作爲響應一部分的升級 ID )。
-
-
驗證升級進度和結果:
-
選取*「Get」(取得)/「upgrade/eId」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
選擇*執行*。
-
如果升級期間發生問題或特殊需求、請執行下列其中一項:
選項 步驟 您需要修正因回應本文中的訊息所造成的叢集健全狀況問題
failedHealthChecks
。-
請前往每個問題所列的特定KB文章、或執行指定的補救措施。
-
如果指定KB、請完成相關KB文章中所述的程序。
-
解決叢集問題之後、視需要重新驗證、然後選取*「PE/upgrades/{upgradeId}*」。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"resume"`要求本文。
{ "action": "resume" }
-
選擇*執行*。
您需要暫停升級、因為維護時間已經關閉或是因為其他原因。
-
視需要重新驗證、然後選取*「PGE」(更新)/「{upgradeId}」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"pause"`要求本文。
{ "action": "pause" }
-
選擇*執行*。
如果您要升級執行 11.8 之前元素版本的 H610S 叢集、您會在回應本文中看到狀態
finishedNeedsAck
。您需要為每個H610S儲存節點執行額外的升級步驟(階段2)。-
請參閱[Upgrading H610S storage nodes to Element 12.2 or later (phase 2)]並完成每個節點的程序。
-
視需要重新驗證、然後選取*「PGE」(更新)/「{upgradeId}」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"acknowledge"`要求本文。
{ "action": "acknowledge" }
-
選擇*執行*。
-
-
視需要多次執行*「Get」(取得)/「upgradeId」* API(升級/{upgradeId}* API)、直到程序完成為止。
在升級期間、
status`會指出 `running`是否發生錯誤。當每個節點升級時、值會 `step`變更為 `NodeFinished
。
當值爲
100`且 `state`指示 `finished`時,升級已成功完成 `percent
。 -
如果使用NetApp混合式雲端控制進行升級失敗、會發生什麼情況
如果磁碟機或節點在升級期間故障、則元素UI會顯示叢集故障。升級程序不會繼續到下一個節點、而是等待叢集故障解決。UI中的進度列顯示升級正在等待叢集故障解決。在此階段、在UI中選取* Pause*將無法運作、因為升級會等待叢集正常運作。您需要與NetApp支援部門接洽、以協助調查故障。
NetApp混合雲控制系統有預先設定的三小時等候時間、在此期間可能發生下列其中一種情況:
-
叢集故障會在三小時內解決、並恢復升級。您不需要在此案例中採取任何行動。
-
三小時後問題仍然存在、升級狀態會顯示*錯誤*並顯示紅色橫幅。您可以在問題解決後選取*恢復*來繼續升級。
-
NetApp支援部門已決定、必須在三小時前暫時中止升級、以便採取修正行動。支援人員將使用API中止升級。
|
在更新節點時中止叢集升級、可能會導致磁碟機無法正常移除節點。如果未正常移除磁碟機、在升級期間重新新增磁碟機將需要NetApp支援人員手動介入。節點執行韌體更新或更新後同步活動可能需要較長時間。如果升級進度似乎停滯、請聯絡NetApp支援部門以尋求協助。 |
使用HealthTools升級連線站台的Element軟體
-
下載儲存升級套件;前往 NetApp HCI 軟體 "下載頁面"、將最新的儲存節點映像下載至非管理節點的裝置。
您需要最新版本的HealthTools來升級Element儲存軟體。 -
將ISO檔案複製到管理節點的可存取位置、例如/tmp.
上傳ISO檔案時、請確定檔案名稱未變更、否則後續步驟將會失敗。
-
選用:升級前、請從管理節點下載ISO至叢集節點。
此步驟可在儲存節點上預先執行ISO、並執行額外的內部檢查、以確保叢集處於良好的升級狀態、進而縮短升級時間。執行此作業不會使叢集進入「升級」模式、也不會限制任何叢集作業。
sfinstall <MVIP> -u <cluster_username> <path-toinstall-file-ISO> --stage
在命令列中省略密碼、以便 sfinstall`提示輸入資訊。對於包含特殊字符的密碼,請(
`在每個特殊字符之前添加反斜槓)。例如, `mypass!@1`應輸入為 `mypass\!\@`。*範例*請參閱下列範例輸入:
sfinstall 10.117.0.244 -u admin /tmp/solidfire-rtfisodium-11.0.0.345.iso --stage
範例的輸出顯示
sfinstall`嘗試驗證是否有可用的較新版本 `sfinstall
:sfinstall 10.117.0.244 -u admin /tmp/solidfire-rtfisodium-11.0.0.345.iso 2018-10-01 16:52:15: Newer version of sfinstall available. This version: 2018.09.01.130, latest version: 2018.06.05.901. The latest version of the HealthTools can be downloaded from: https:// mysupport.netapp.com/NOW/cgi-bin/software/ or rerun with --skip-version-check
請參閱以下成功的準備作業摘錄範例:
當整備完成時、會在升級事件之後顯示訊息 Storage Node Upgrade Staging Successful
。flabv0004 ~ # sfinstall -u admin 10.117.0.87 solidfire-rtfi-sodium-patch3-11.3.0.14171.iso --stage 2019-04-03 13:19:58: sfinstall Release Version: 2019.01.01.49 Management Node Platform: Ember Revision: 26b042c3e15a Build date: 2019-03-12 18:45 2019-04-03 13:19:58: Checking connectivity to MVIP 10.117.0.87 2019-04-03 13:19:58: Checking connectivity to node 10.117.0.86 2019-04-03 13:19:58: Checking connectivity to node 10.117.0.87 ... 2019-04-03 13:19:58: Successfully connected to cluster and all nodes ... 2019-04-03 13:20:00: Do you want to continue? ['Yes', 'No']: Yes ... 2019-04-03 13:20:55: Staging install pack on cluster nodes 2019-04-03 13:20:55: newVersion: 11.3.0.14171 2019-04-03 13:21:01: nodeToStage: nlabp2814, nlabp2815, nlabp2816, nlabp2813 2019-04-03 13:21:02: Staging Node nlabp2815 mip=[10.117.0.87] nodeID=[2] (1 of 4 nodes) 2019-04-03 13:21:02: Node Upgrade serving image at http://10.117.0.204/rtfi/solidfire-rtfisodium- patch3-11.3.0.14171/filesystem.squashfs ... 2019-04-03 13:25:40: Staging finished. Repeat the upgrade command without the --stage option to start the upgrade.
升級完成後、階段性ISO會自動刪除。不過、如果升級尚未啟動、需要重新排程、則可使用下列命令手動取消工位ISO:
sfinstall <MVIP> -u <cluster_username> --destage
升級開始後、取消階段選項將不再可用。
-
使用命令和 ISO 檔案路徑開始升級
sfinstall
:sfinstall <MVIP> -u <cluster_username> <path-toinstall-file-ISO>
-
範例 *
請參閱下列輸入命令範例:
sfinstall 10.117.0.244 -u admin /tmp/solidfire-rtfi-sodium-11.0.0.345.iso
範例的輸出顯示
sfinstall`嘗試驗證是否有可用的較新版本 `sfinstall
:sfinstall 10.117.0.244 -u admin /tmp/solidfire-rtfi-sodium-11.0.0.345.iso 2018-10-01 16:52:15: Newer version of sfinstall available. This version: 2018.09.01.130, latest version: 2018.06.05.901. The latest version of the HealthTools can be downloaded from: https://mysupport.netapp.com/NOW/cgi-bin/software/ or rerun with --skip-version-check
請參閱下列成功升級的摘錄範例。升級事件可用於監控升級進度。
# sfinstall 10.117.0.161 -u admin solidfire-rtfi-sodium-11.0.0.761.iso 2018-10-11 18:28 Checking connectivity to MVIP 10.117.0.161 Checking connectivity to node 10.117.0.23 Checking connectivity to node 10.117.0.24 ... Successfully connected to cluster and all nodes ################################################################### You are about to start a new upgrade 10.117.0.161 10.3.0.161 solidfire-rtfi-sodium-11.0.0.761.iso Nodes: 10.117.0.23 nlabp1023 SF3010 10.3.0.161 10.117.0.24 nlabp1025 SF3010 10.3.0.161 10.117.0.26 nlabp1027 SF3010 10.3.0.161 10.117.0.28 nlabp1028 SF3010 10.3.0.161 ################################################################### Do you want to continue? ['Yes', 'No']: yes ... Watching for new network faults. Existing fault IDs are set([]). Checking for legacy network interface names that need renaming Upgrading from 10.3.0.161 to 11.0.0.761 upgrade method=rtfi Waiting 300 seconds for cluster faults to clear Waiting for caches to fall below threshold ... Installing mip=[10.117.0.23] nodeID=[1] (1 of 4 nodes) Starting to move primaries. Loading volume list Moving primary slice=[7] away from mip[10.117.0.23] nodeID[1] ssid[11] to new ssid[15] Moving primary slice=[12] away from mip[10.117.0.23] nodeID[1] ssid[11] to new ssid[15] ... Installing mip=[10.117.114.24] nodeID=[2] (2 of 4 nodes) Starting to move primaries. Loading volume list Moving primary slice=[5] away from mip[10.117.114.24] nodeID[2] ssid[7] to new ssid[11] ... Install of solidfire-rtfi-sodium-11.0.0.761 complete. Removing old software No staged builds present on nodeID=[1] No staged builds present on nodeID=[2] ... Starting light cluster block service check
-
|
如果您要將 H610S 系列節點升級至元素 12.2 、且節點執行的元件版本早於 11.8 、則需要為每個儲存節點執行額外的升級步驟(第2階段)。如果您執行的是元素11.8或更新版本、則不需要執行其他升級步驟(階段2)。 |
使用HealthTools升級黑暗站台的Element軟體
您可以使用 HealthTools 工具套件在黑暗的網站上更新 NetApp Element 軟體。
-
執行 `sfupdate-healthtools`命令:
sfupdate-healthtools <path-to-healthtools-package>
-
檢查安裝的版本:
sfupdate-healthtools -v
-
對照中繼資料Json檔案檢查最新版本:
sfupdate-healthtools -l --metadata=<path-to-metadata-json>
-
確保叢集已就緒:
sudo sfupgradecheck -u <cluster_username> -p <cluster_password> MVIP --metadata=<path-to-metadata-json>
-
使用 ISO 檔案和中繼資料 JSON 檔案的路徑執行 `sfinstall`命令:
sfinstall -u <cluster_username> <MVIP> <path-toinstall-file-ISO> --metadata=<path-to-metadata-json-file>
請參閱下列輸入命令範例:
sfinstall -u admin 10.117.78.244 /tmp/solidfire-rtfi-11.3.0.345.iso --metadata=/tmp/metadata.json
-
選用 * 您可以在命令中新增
--stage`旗標 `sfinstall
、以便預先升級。
-
|
如果您要將 H610S 系列節點升級至元素 12.2 、且節點執行的元件版本早於 11.8 、則需要為每個儲存節點執行額外的升級步驟(第2階段)。如果您執行的是元素11.8或更新版本、則不需要執行其他升級步驟(階段2)。 |
如果使用HealthTools升級失敗、會發生什麼情況
如果軟體升級失敗、您可以暫停升級。
|
您只能使用 Ctrl-C 暫停升級。這可讓系統自行清理。 |
當等待叢集故障清除時 sfinstall
、如果任何故障導致故障繼續存在、 `sfinstall`將不會繼續前往下一個節點。
-
您應該停止 `sfinstall`使用 Ctrl+C
-
請聯絡NetApp支援部門、以協助調查故障。
-
使用相同的命令繼續升級
sfinstall
。 -
使用Ctrl+C暫停升級時、如果升級目前正在升級節點、請選擇下列其中一個選項:
-
* wait*:在重設叢集常量之前、請先讓目前升級的節點完成。
-
繼續:繼續升級、取消暫停。
-
中止:重設叢集常量、並立即中止升級。
在更新節點時中止叢集升級、可能會導致磁碟機無法正常移除節點。如果未正常移除磁碟機、在升級期間重新新增磁碟機將需要NetApp支援人員手動介入。節點執行韌體更新或更新後同步活動可能需要較長時間。如果升級進度似乎停滯、請聯絡NetApp支援部門以尋求協助。
-
將 H610S 儲存節點升級至元素 12.2 (階段 2 )
如果您要將 H610S 系列節點升級至元素 12.2 、且節點執行的元件版本早於 11.8 、則升級程序會涉及兩個階段。
第 1 階段先執行、步驟與標準升級至元素 12.2 程序相同。它一次在叢集的一個節點上、以循環方式安裝Element Software和所有5個韌體更新。由於韌體有效負載的關係、此程序預計每個H610S節點約需1.5至2小時、包括在升級結束時為每個節點執行單一冷開機週期。
階段 2 包括完成步驟,以便對每個 H610S 節點執行完整的節點關機和斷電,如所需 "KB"。此階段預計每個H610S節點約需一小時。
|
完成階段1之後、五個韌體更新中的四個會在每個H610S節點的冷開機期間啟動;不過、複雜的可程式化邏輯裝置(CPLD)韌體需要完全中斷電源並重新連線才能完全安裝。CPLD韌體更新可在未來重新開機或重新開機期間、防止NVDIMM故障和中繼資料磁碟機被逐出。此電力重設預計每個H610S節點約需一小時。它需要關閉節點、拔下電源線或透過智慧型PDU中斷電源、等待約3分鐘、然後重新連接電源。 |
-
您已完成H610S升級程序的第1階段、並已使用標準元素儲存升級程序之一來升級儲存節點。
|
第2階段需要現場人員。 |
-
(階段2)完成叢集中每個H610S節點所需的電源重設程序:
|
如果叢集也有非H610S節點、則這些非H610S節點可免除階段2的限制、不需要關閉或中斷電源。 |
-
請聯絡NetApp支援部門以取得協助、並安排此升級。
-
請遵循本課程中的第 2 階段升級程序 "KB"、完成每個 H610S 節點的升級。