升級Element軟體
若要升級NetApp Element 功能、您可以使用NetApp混合雲控制UI或REST API。某些作業會在元素軟體升級期間受到抑制、例如新增和移除節點、新增和移除磁碟機、以及與啟動器、Volume存取群組和虛擬網路相關的命令等。
從元素12.5開始、NetApp HealthTools不再支援元素軟體升級。如果您執行的是 Element 11.0 或 11.1 、則必須先"使用HealthTools升級至Element 12.3.x"使用 NetApp 混合雲控制、然後再升級至 Element 12.5 或更新版本。 |
-
管理權限:您有儲存叢集管理員權限可執行升級。
-
* 有效升級路徑 * :您已檢查要升級至的元素版本的升級路徑資訊、並確認升級路徑有效。https://kb.netapp.com/Advice_and_Troubleshooting/Data_Storage_Software/Element_Software/What_is_the_upgrade_matrix_for_storage_clusters_running_NetApp_Element_software%3F["NetApp知識庫:執行NetApp Element 「更新軟體」之儲存叢集的升級對照表"^]
-
系統時間同步:您已確保所有節點上的系統時間均已同步、且儲存叢集和節點的NTP設定正確。每個節點都必須在每個節點的 Web UI 中使用 DNS 名稱伺服器進行設定(
https://[IP address]:442
、且沒有與時間偏差相關的未解析叢集故障。 -
系統連接埠:如果您使用NetApp混合式雲端控制進行升級、您已確保所需的連接埠已開啟。如需詳細資訊、請參閱 "網路連接埠" 。
-
管理節點:對於NetApp混合雲控制UI和API、您環境中的管理節點執行版本11.3。
-
管理服務:您已將管理服務套裝組合更新為最新版本。
您必須先升級至最新的管理服務套裝組合、才能將Element軟體升級至版本12.5或更新版本。如果您要將Element軟體更新至版本12.5或更新版本、則需要使用管理服務2.21.61或更新版本才能繼續。 |
-
叢集健全狀況:您已確認叢集已準備好升級。請參閱。 "升級儲存設備之前、請先執行Element儲存設備健全狀況檢查"
-
* H610S儲存節點*的更新基板管理控制器(BMC):您已升級H610S節點的BMC版本。請參閱"版本說明與升級指示"。
-
升級程序時間:您已排定足夠的時間來執行升級。升級至Element軟體12.5或更新版本時、升級程序時間會因您目前的Element軟體版本和韌體更新而有所不同。
儲存節點 目前Element軟體版本 每個節點的軟體與韌體安裝時間約為1^ 每個節點的資料同步時間約為2^ 每個節點的大約總升級時間 所有包含最新韌體的功能為更新版本的NetApp H系列節點SolidFire
12.x
15 分鐘
10至15分鐘
20至30分鐘
H610S 和 H410S
12.x和11.8
60 分鐘
30至60分鐘
90至120分鐘
H610S
11.7 及更早版本
90 分鐘
40至70分鐘
每個 H610S 節點也必須有 130 到 160 分鐘 "執行完整的節點關機和電源中斷"的時間。
1 如需硬體韌體與驅動程式韌體的完整對照表,請參閱"支援的儲存韌體版本SolidFire 、適用於不支援的儲存節點"。
2如果將叢集與大量寫入IOPS負載結合、並延長韌體更新時間、資料同步時間將會增加。
不支援以元素12.7開頭的3、SF2405和SF9608儲存節點、以及FC0025和SF-FCN-01 FC節點。如果您嘗試將其中一個節點升級至元素12.7、您會看到錯誤訊息、指出元素12.7不支援此節點。
-
終端使用者授權合約(EULA):從管理服務2.20.69開始、您必須先接受並儲存EULA、才能使用NetApp混合雲控制UI或API來升級Element軟體:
-
在Web瀏覽器中開啟管理節點的IP位址:
https://<ManagementNodeIP>
-
提供儲存叢集管理員認證資料、以登入NetApp混合雲控制系統。
-
選取介面右上角附近的*升級*。
-
隨即顯示EULA。向下捲動、選取*我接受目前及所有未來更新*、然後選取*儲存*。
-
請選擇下列其中一個元素軟體升級選項:
如果您要將 H610S 系列節點升級至元素 12.5 或更新版本、且節點執行的元件版本早於 11.8 、則您必須針對每個儲存節點執行此部分中的其他升級步驟 "知識庫文章"。如果您執行的是元素11.8或更新版本、則不需要執行其他升級步驟。 |
使用NetApp混合雲控制UI來升級元素儲存設備
您可以使用NetApp混合雲控制UI來升級儲存叢集。
有關使用 NetApp 混合雲控制升級儲存叢集的潛在問題及其因應措施,請參閱本 "知識庫文章"。 |
-
在Web瀏覽器中開啟管理節點的IP位址:
https://<ManagementNodeIP>
-
提供儲存叢集管理員認證資料、以登入NetApp混合雲控制系統。
-
選取介面右上角附近的*升級*。
-
在「升級」頁面上、選取「儲存設備」。
「儲存設備」索引標籤會列出您安裝時所需的儲存叢集。如果NetApp混合雲控制無法存取叢集、則不會顯示在「升級」頁面上。
-
從下列選項中選擇、然後執行適用於您叢集的一組步驟:
選項 步驟 執行元素11.8及更新版本的所有叢集
-
選擇*瀏覽*上傳您下載的升級套件。
-
等待上傳完成。進度列會顯示上傳狀態。
如果您離開瀏覽器視窗、檔案上傳將會遺失。 檔案成功上傳及驗證後、畫面上會顯示一則訊息。驗證可能需要幾分鐘的時間。如果您在此階段離開瀏覽器視窗、檔案上傳會保留下來。
-
選擇*開始升級*。
升級期間*升級狀態*會變更、以反映程序的狀態。它也會因應您採取的行動而變更、例如暫停升級、或升級傳回錯誤。請參閱。 升級狀態變更 在升級進行期間、您可以離開頁面、稍後再返回頁面、繼續監控進度。如果叢集列收合、頁面不會動態更新狀態和目前版本。叢集列必須展開以更新表格、否則您可以重新整理頁面。 您可以在升級完成後下載記錄。
您正在升級執行元素11.8之前版本的H610S叢集。
-
升級狀態變更
以下是使用者介面中「升級狀態」欄在升級前、期間及之後顯示的不同狀態:
升級狀態 | 說明 |
---|---|
最新 |
叢集已升級至可用的最新元素版本。 |
提供版本 |
有更新版本的Element和/或儲存韌體可供升級。 |
進行中 |
升級正在進行中。進度列會顯示升級狀態。畫面上的訊息也會顯示節點層級的故障、並在升級過程中顯示叢集中每個節點的節點ID。您可以使用Element UI或NetApp Element vCenter Server UI的VMware外掛程式來監控每個節點的狀態。 |
升級暫停 |
您可以選擇暫停升級。視升級程序的狀態而定、暫停作業可能會成功或失敗。您會看到UI提示、要求您確認暫停作業。為了確保叢集在暫停升級之前處於安全位置、升級作業可能需要兩小時才能完全暫停。若要繼續升級、請選取*恢復*。 |
已暫停 |
您已暫停升級。選取*恢復*以繼續處理程序。 |
錯誤 |
升級期間發生錯誤。您可以下載錯誤記錄並將其傳送至NetApp支援部門。解決錯誤之後、您可以返回頁面、然後選取*恢復*。當您繼續升級時、進度列會在系統執行健全狀況檢查並檢查升級的目前狀態時、向後移幾分鐘。 |
完成後續追蹤 |
僅適用於從11.8之前的元素版本升級的H610S節點。升級程序第 1 階段完成後,此狀態會提示您執行其他升級步驟(請參閱 "知識庫文章")。完成階段2並確認您已完成、狀態會變更為*最新*。 |
使用NetApp混合雲控制API來升級元素儲存設備
您可以使用API將叢集中的儲存節點升級至最新的Element軟體版本。您可以使用自己選擇的自動化工具來執行API。此處記錄的API工作流程使用管理節點上可用的REST API UI作為範例。
-
將儲存升級套件下載至管理節點可存取的裝置。
前往 Element 軟體 "下載頁面"並下載最新的儲存節點映像。
-
將儲存升級套件上傳至管理節點:
-
在管理節點上開啟管理節點REST API UI:
https://<ManagementNodeIP>/package-repository/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
從REST API UI中、選取* POST /套件*。
-
選擇*試用*。
-
選擇*瀏覽*並選擇升級套件。
-
選取*執行*以啟動上傳。
-
從響應中複製並保存軟件包 ID (
"id"
),以便在以後的步驟中使用。
-
-
確認上傳狀態。
-
從REST API UI中、選取* GETRIVE/套件SESI/{id}/狀態*。
-
選擇*試用*。
-
在「* id*」中輸入您在上一個步驟中複製的套件ID。
-
選取*執行*以啟動狀態要求。
回應會顯示 `state`為 `SUCCESS`完成。
-
-
找出儲存叢集ID:
-
在管理節點上開啟管理節點REST API UI:
https://<ManagementNodeIP>/inventory/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
從REST API UI中、選取* Get /Installations *。
-
選擇*試用*。
-
選擇*執行*。
-
從響應中複製安裝資產 ID (
"id"
)。 -
從REST API UI中選取* Get /Installations/{id}*。
-
選擇*試用*。
-
將安裝資產ID貼到* id*欄位。
-
選擇*執行*。
-
從(`"id"`您要升級的叢集的回應中、複製並儲存儲存叢集 ID (儲存叢集 ID )、以便在稍後的步驟中使用。
-
-
執行儲存設備升級:
-
在管理節點上開啟儲存REST API UI:
https://<ManagementNodeIP>/storage/1/
-
選擇*授權*並完成下列項目:
-
輸入叢集使用者名稱和密碼。
-
輸入用戶端 ID 為
mnode-client
。 -
選取*授權*以開始工作階段。
-
關閉授權視窗。
-
-
選擇* POST /升級*。
-
選擇*試用*。
-
在參數欄位中輸入升級套件ID。
-
在參數欄位中輸入儲存叢集ID。
有效負載應類似下列範例:
{ "config": {}, "packageId": "884f14a4-5a2a-11e9-9088-6c0b84e211c4", "storageId": "884f14a4-5a2a-11e9-9088-6c0b84e211c4" }
-
選擇*執行*以啟動升級。
回應應指出狀態為
initializing
:
{ "_links": { "collection": "https://localhost:442/storage/upgrades", "self": "https://localhost:442/storage/upgrades/3fa85f64-1111-4562-b3fc-2c963f66abc1", "log": https://localhost:442/storage/upgrades/3fa85f64-1111-4562-b3fc-2c963f66abc1/log }, "storageId": "114f14a4-1a1a-11e9-9088-6c0b84e200b4", "upgradeId": "334f14a4-1a1a-11e9-1055`-6c0b84e2001b4", "packageId": "774f14a4-1a1a-11e9-8888-6c0b84e200b4", "config": {}, "state": "initializing", "status": { "availableActions": [ "string" ], "message": "string", "nodeDetails": [ { "message": "string", "step": "NodePreStart", "nodeID": 0, "numAttempt": 0 } ], "percent": 0, "step": "ClusterPreStart", "timestamp": "2020-04-21T22:10:57.057Z", "failedHealthChecks": [ { "checkID": 0, "name": "string", "displayName": "string", "passed": true, "kb": "string", "description": "string", "remedy": "string", "severity": "string", "data": {}, "nodeID": 0 } ] }, "taskId": "123f14a4-1a1a-11e9-7777-6c0b84e123b2", "dateCompleted": "2020-04-21T22:10:57.057Z", "dateCreated": "2020-04-21T22:10:57.057Z" }
-
複製(`"upgradeId"`作爲響應一部分的升級 ID )。
-
-
驗證升級進度和結果:
-
選取*「Get」(取得)/「upgrade/eId」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
選擇*執行*。
-
如果升級期間發生問題或特殊需求、請執行下列其中一項:
選項 步驟 您需要修正因回應本文中的訊息所造成的叢集健全狀況問題
failedHealthChecks
。-
請前往每個問題所列的特定KB文章、或執行指定的補救措施。
-
如果指定KB、請完成相關KB文章中所述的程序。
-
解決叢集問題之後、視需要重新驗證、然後選取*「PE/upgrades/{upgradeId}*」。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"resume"`要求本文。
{ "action": "resume" }
-
選擇*執行*。
您需要暫停升級、因為維護時間已經關閉或是因為其他原因。
-
視需要重新驗證、然後選取*「PGE」(更新)/「{upgradeId}」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"pause"`要求本文。
{ "action": "pause" }
-
選擇*執行*。
如果您要升級執行 11.8 之前元件版本的 H610S 叢集、則會在回應本文中看到狀態
finishedNeedsAck
。您必須為每個 H610S 儲存節點執行額外的升級步驟。-
請針對每個節點完成本節中的其他升級步驟 "知識庫文章"。
-
視需要重新驗證、然後選取*「PGE」(更新)/「{upgradeId}」*。
-
選擇*試用*。
-
在* upgradeId*中輸入上一步的升級ID。
-
輸入 `"action":"acknowledge"`要求本文。
{ "action": "acknowledge" }
-
選擇*執行*。
-
-
視需要多次執行*「Get」(取得)/「upgradeId」* API(升級/{upgradeId}* API)、直到程序完成為止。
在升級期間、
status`會指出 `running`是否發生錯誤。當每個節點升級時、值會 `step`變更為 `NodeFinished
。
當值爲
100`且 `state`指示 `finished`時,升級已成功完成 `percent
。 -
如果使用NetApp混合式雲端控制進行升級失敗、會發生什麼情況
如果磁碟機或節點在升級期間故障、則元素UI會顯示叢集故障。升級程序不會繼續到下一個節點、而是等待叢集故障解決。UI中的進度列顯示升級正在等待叢集故障解決。在此階段、在UI中選取* Pause*將無法運作、因為升級會等待叢集正常運作。您需要與NetApp支援部門接洽、以協助調查故障。
NetApp混合雲控制系統有預先設定的三小時等候時間、在此期間可能發生下列其中一種情況:
-
叢集故障會在三小時內解決、並恢復升級。您不需要在此案例中採取任何行動。
-
三小時後問題仍然存在、升級狀態會顯示*錯誤*並顯示紅色橫幅。您可以在問題解決後選取*恢復*來繼續升級。
-
NetApp支援部門已決定、必須在三小時前暫時中止升級、以便採取修正行動。支援人員將使用API中止升級。
在更新節點時中止叢集升級、可能會導致磁碟機無法正常移除節點。如果未正常移除磁碟機、在升級期間重新新增磁碟機將需要NetApp支援人員手動介入。節點執行韌體更新或更新後同步活動可能需要較長時間。如果升級進度似乎停滯、請聯絡NetApp支援部門以尋求協助。 |