使用CVO和AVS(與來賓連線的儲存設備)進行災難恢復
總覽
作者:Ravi BCB和Niyazz Mohamed, NetApp
災難恢復至雲端是一種彈性且具成本效益的方法、可保護工作負載、避免站台中斷運作、以及勒索軟體等資料毀損事件。有了NetApp SnapMirror、使用來賓連線儲存設備的內部部署VMware工作負載可複寫至Cloud Volumes ONTAP Azure上執行的NetApp VMware。這涵蓋應用程式資料、但實際VM本身的情況如何。災難恢復應涵蓋所有相依元件、包括虛擬機器、VMDK、應用程式資料等。為達成此目標、SnapMirror與Jetstream一起可用來無縫恢復從內部部署複寫至Cloud Volumes ONTAP VMware的工作負載、同時使用vSAN儲存設備來執行VM VMDK。
本文件提供逐步的方法來設定及執行使用NetApp SnapMirror、Jetstream及Azure VMware解決方案(AVS)的災難恢復。
假設
本文件著重於客體內儲存應用程式資料(也稱為來賓連線)、我們假設內部環境使用SnapCenter 的是應用程式一致的備份。
本文件適用於任何第三方備份或還原解決方案。視環境中使用的解決方案而定、請遵循最佳實務做法來建立符合組織SLA的備份原則。 |
若要在內部部署環境與Azure虛擬網路之間建立連線、請使用Express Route Global Reach或虛擬WAN搭配VPN閘道。應根據內部部署的VLAN設計來建立區段。
將內部部署資料中心連線至Azure的選項有多種、因此我們無法在此文件中概述特定的工作流程。如需適當的內部部署至Azure連線方法、請參閱Azure文件。 |
部署災難恢復解決方案
解決方案部署總覽
-
確保應用程式資料是以SnapCenter 不必要的RPO要求使用支援功能進行備份。
-
在Cloud Volumes ONTAP 適當的訂購和虛擬網路中使用Cloud Manager、以正確的執行個體大小進行配置。
-
為相關的應用程式磁碟區設定SnapMirror。
-
更新SnapCenter 中的備份原則、以便在排程工作之後觸發SnapMirror更新。
-
-
在內部部署資料中心安裝Jetstream DR軟體、並開始保護虛擬機器。
-
在Azure VMware解決方案私有雲中安裝Jetstream DR軟體。
-
在災難事件期間、請使用Cloud Manager中斷SnapMirror關係、並觸發將虛擬機器容錯移轉至Azure NetApp Files 指定AVS DR站台中的VMware資料存放區或vSAN資料存放區。
-
重新連接應用程式VM的iSCSI LUN和NFS掛載。
-
-
在主站台恢復後、透過反向重新同步SnapMirror來叫用容錯回復至受保護站台。
部署詳細資料
在Azure上設定CVO、並將磁碟區複寫至CVO
第一步是在Cloud Volumes ONTAP Azure上設定功能 ("連結")並以Cloud Volumes ONTAP 所需的頻率和快照保留量、將所需的Volume複製到不間斷的地方。
設定AVS主機和CVO資料存取
部署SDDC時、需要考量的兩個重要因素是Azure VMware解決方案中SDDC叢集的大小、以及SDDC持續服務的時間。這兩項災難恢復解決方案的關鍵考量、有助於降低整體營運成本。SDDC可只有三部主機、在全規模部署中、一直到多主機叢集為止。
部署AVS叢集的決定主要取決於RPO / RTO需求。有了Azure VMware解決方案、SDDC就能準時配置、以準備測試或實際的災難事件。即時部署的SDDC可在不處理災難時節省ESXi主機成本。不過、這種部署方式會在部署SDDC時、影響RTO數小時。
最常見的部署選項是讓SDDC以一律開啟的操作前導指示燈模式執行。此選項可提供三部隨時可用的主機的小型佔用空間、並提供執行中的基準來執行模擬活動和法規遵循檢查、藉此加速恢復作業、避免在正式作業站台和災難恢復站台之間發生作業移位的風險。當需要處理實際的DR事件時、可以將指示燈叢集快速擴充至所需的層級。
若要設定AVS SDDC(無論是隨需或是以指示燈模式)、請參閱 "在Azure上部署及設定虛擬化環境"。先決條件是確認位於AVS主機上的客體VM能夠在Cloud Volumes ONTAP 建立連線之後、從支援中心使用資料。
正確設定好VMware及AVS之後Cloud Volumes ONTAP 、請開始設定Jetstream、使用VAIO機制、並利用SnapMirror將應用程式磁碟區複本複製到Cloud Volumes ONTAP 物件上、將內部部署工作負載自動還原至AVS(使用應用程式VMDK的VM及使用客體內建儲存設備的VM)。
在內部部署資料中心安裝Jetstream DR
Jetstream DR軟體包含三個主要元件:Jetstream DR管理伺服器虛擬設備(MSA)、DR虛擬設備(DRVA)和主機元件(I/O篩選套件)。MSA用於在運算叢集上安裝及設定主機元件、然後管理Jetstream DR軟體。安裝程序如下:
-
檢查先決條件。
-
執行容量規劃工具以取得資源和組態建議。
-
將Jetstream DR MSA部署至指定叢集中的每個vSphere主機。
-
在瀏覽器中使用其DNS名稱啟動MSA。
-
向MSA登錄vCenter伺服器。
-
部署了Jetstream DR MSA並註冊vCenter Server之後、請使用vSphere Web Client瀏覽至Jetstream DR外掛程式。您可以瀏覽至「資料中心」>「設定」>「Jetstream DR」來完成此作業。
-
在Jetstream DR介面中、完成下列工作:
-
使用I/O篩選套件設定叢集。
-
新增位於恢復站台的Azure Blob儲存設備。
-
-
從「應用裝置」索引標籤部署所需數量的DR虛擬應用裝置(DRVA)。
使用容量規劃工具來預估所需的DRVA數量。 -
使用可用的資料存放區或獨立的共享iSCSI儲存池中的VMDK、為每個DRVA建立複寫記錄磁碟區。
-
從「受保護的網域」索引標籤、使用Azure Blob儲存站台、DRVA執行個體和複寫記錄的相關資訊、建立所需數量的受保護網域。受保護的網域會定義叢集中的特定VM或一組應用程式VM、這些VM會一起受到保護、並指派容錯移轉/容錯回復作業的優先順序。
-
選取要保護的VM、並根據相依性將VM分組為應用程式群組。應用程式定義可讓您將一組VM分組為邏輯群組、其中包含開機順序、開機延遲、以及可在恢復時執行的選用應用程式驗證。
請確定保護網域中的所有VM都使用相同的保護模式。 回寫(VMDK)模式可提供更高的效能。 -
請確定複寫記錄磁碟區放置在高效能儲存設備上。
-
完成後、按一下「開始保護受保護網域」。這會開始將所選VM的資料複寫到指定的Blob存放區。
-
複寫完成後、VM保護狀態會標示為可恢復。
容錯移轉Runbook可設定為群組VM(稱為恢復群組)、設定開機順序、以及修改CPU /記憶體設定和IP組態。 -
按一下「設定」、然後按一下Runbook「設定」連結以設定Runbook群組。
-
按一下「Create Group(建立群組)」按鈕、開始建立新的Runbook群組。
如有需要、請在畫面下方套用自訂的預先指令碼和後置指令碼、以便在執行手冊群組作業之前和之後自動執行。確定Runbook指令碼位於管理伺服器上。 -
視需要編輯VM設定。指定用於恢復VM的參數、包括開機順序、開機延遲(以秒為單位)、CPU數量、以及要分配的記憶體容量。按一下向上或向下箭頭、變更VM的開機順序。也提供了用於保留MAC的選項。
-
靜態IP位址可針對群組中的個別VM手動設定。按一下VM的NIC View連結、手動設定其IP位址設定。
-
按一下「Configure(設定)」按鈕以儲存個別VM的NIC設定。
容錯移轉和容錯回復執行工作簿的狀態現在會列為「已設定」。容錯移轉和容錯回復執行手冊群組是以相同的初始VM群組和設定成對建立。如有必要、您可以按一下各自的詳細資料連結並進行變更、個別自訂任何Runbook群組的設定。
在私有雲中安裝AVS的Jetstream DR
恢復站台(AVS)的最佳實務做法是事先建立三節點的指示燈式叢集。如此可預先設定恢復站台基礎架構、包括下列項目:
-
目的地網路區段、防火牆、DHCP和DNS等服務
-
安裝AVS的Jetstream DR
-
將anf磁碟區設定為資料存放區等
對於任務關鍵型網域、Jetstream DR支援的RTO模式接近零。對於這些網域、應該預先安裝目的地儲存設備。在此情況下、建議使用ANF儲存類型。
應在AVS叢集上設定網路組態(包括區段建立)、以符合內部部署需求。 |
視SLA和RTO需求而定、您可以使用持續容錯移轉或一般(標準)容錯移轉模式。對於接近零的RTO、您應該在恢復站台開始持續重新補充。 |
-
若要在Azure VMware解決方案私有雲上安裝適用於AVS的Jetstream DR、請使用Run命令。從Azure入口網站移至Azure VMware解決方案、選取私有雲、然後選取執行命令>套件> JSDR.Configuration。
Azure VMware解決方案的預設CloudAdmin使用者沒有足夠的權限可安裝適用於AVS的Jetstream DR。Azure VMware解決方案可針對Jetstream DR叫用Azure VMware Solution Run命令、以簡化及自動化方式安裝Jetstream DR。 下列螢幕快照顯示使用DHCP型IP位址進行安裝。
-
在安裝AVS的Jetstream DR完成後、請重新整理瀏覽器。若要存取Jetstream DR UI、請前往SDDC資料中心>組態> Jetstream DR。
-
在Jetstream DR介面中、完成下列工作:
-
新增Azure Blob儲存設備帳戶、以保護內部部署叢集做為儲存站台、然後執行「掃描網域」選項。
-
在出現的快顯對話方塊視窗中、選取要匯入的受保護網域、然後按一下其匯入連結。
-
-
網域已匯入以供還原。移至「受保護的網域」索引標籤、確認已選取所需的網域、或從「選取受保護的網域」功能表中選擇所需的網域。隨即顯示受保護網域中可恢復的VM清單。
-
匯入受保護的網域之後、請部署DRVA設備。
您也可以使用由CPt建立的計畫來自動化這些步驟。 -
使用可用的vSAN或ANF資料存放區建立複寫記錄磁碟區。
-
匯入受保護的網域、並將恢復VA設定為使用ANF資料存放區來放置VM。
請確定選取的區段已啟用DHCP、而且有足夠的IP可用。在網域還原期間、會暫時使用動態IP。每個恢復中的VM(包括持續重新補充)都需要個別的動態IP。恢復完成後、IP便會釋出、並可重複使用。 -
選取適當的容錯移轉選項(持續容錯移轉或容錯移轉)。在此範例中、會選取持續還原(持續容錯移轉)。
雖然執行組態時、「持續容錯移轉」和「容錯移轉」模式各有不同、但兩種容錯移轉模式的設定步驟相同。容錯移轉步驟會一起設定及執行、以回應災難事件。您可以隨時設定持續容錯移轉、然後在正常系統作業期間、允許在背景執行。發生災難事件之後、持續容錯移轉作業便會完成、以便立即將受保護VM的擁有權轉移到恢復站台(RTO接近零)。
持續容錯移轉程序隨即開始、其進度可從UI監控。按一下「目前步驟」區段中的藍色圖示、會顯示快顯視窗、顯示容錯移轉程序目前步驟的詳細資料。
容錯移轉與容錯回復
-
在內部部署環境的受保護叢集發生災難(部分或完整故障)之後、您可以在中斷個別應用程式磁碟區的SnapMirror關係之後、使用Jetstream來觸發VM的容錯移轉。
此步驟可輕鬆自動化、以利恢復程序。 -
存取AVS SDDC(目的地端)上的Jetstream UI、然後觸發容錯移轉選項以完成容錯移轉。工作列會顯示容錯移轉活動的進度。
在完成容錯移轉時所出現的對話視窗中、容錯移轉工作可以指定為已規劃或假設為強制進行。
強制容錯移轉假設主站台已無法再存取、且受保護網域的擁有權應由還原站台直接承擔。
-
持續容錯移轉完成後、會出現一則訊息、確認工作已完成。當工作完成時、請存取恢復的VM來設定iSCSI或NFS工作階段。
容錯移轉模式會變更為在容錯移轉中執行、而VM狀態會恢復。受保護網域的所有VM現在都在容錯移轉執行手冊設定所指定的狀態下、於還原站台執行。 為了驗證容錯移轉組態和基礎架構、可以在測試模式(測試容錯移轉選項)下操作、觀察虛擬機器及其資料從物件存放區恢復到測試還原環境的過程。在測試模式下執行容錯移轉程序時、其運作方式類似於實際的容錯移轉程序。 -
虛擬機器恢復後、請使用儲存災難恢復功能來進行客體內儲存設備。為了示範此程序、本範例使用SQL Server。
-
在SnapCenter AVS SDDC上登入恢復的S振 向虛擬機器、並啟用DR模式。
-
使用瀏覽器N存取SnapCenter 這個功能。
-
在「設定」頁面中、瀏覽至「設定」>「全域設定」>「災難恢復」。
-
選取「啟用災難恢復」。
-
按一下套用。
-
按一下「監控」>「工作」、確認DR工作是否已啟用。
NetApp SnapCenter 支援區4.6或更新版本應用於儲存災難恢復。對於舊版、應使用應用程式一致的快照(使用SnapMirror複寫)、如果必須在災難恢復站台中恢復先前的備份、則應執行手動恢復。
-
-
確定SnapMirror關係已中斷。
-
使用Cloud Volumes ONTAP 相同的磁碟機代號、將LUN從支援系統連接到已恢復的SQL客體VM。
-
開啟iSCSI啟動器、清除先前中斷連線的工作階段、並新增新目標及複寫Cloud Volumes ONTAP 的支援區的多重路徑。
-
請確定所有磁碟均使用與DR之前相同的磁碟機代號進行連線。
-
重新啟動MSSQL伺服器服務。
-
請確定SQL資源重新連線。
如果是NFS、請使用mount命令附加磁碟區、然後更新「etc/fstab'」項目。 此時、您可以執行作業並正常營運。
在NSxT-T端點上、可建立獨立的專屬層級1閘道、以模擬容錯移轉案例。如此可確保所有工作負載彼此通訊、但不會有流量進入或離開環境、如此一來、就能執行任何分類、控制或強化工作、而不會產生交叉污染的風險。此作業不在本文件的範圍之內、但可輕鬆模擬隔離。
當主要站台重新啟動並執行之後、您就可以執行容錯回復。系統會由Jetstream恢復VM保護、且SnapMirror關係必須回復。
-
還原內部部署環境。視災難事件類型而定、可能需要還原及/或驗證受保護叢集的組態。如有必要、可能需要重新安裝Jetstream DR軟體。
-
存取還原的內部部署環境、前往Jetstream DR UI、然後選取適當的受保護網域。受保護的站台準備好進行容錯回復之後、請在UI中選取「容錯回復」選項。
此外、也可使用由程式管理產生的容錯回復計畫、將VM及其資料從物件存放區傳回原始的VMware環境。 在恢復站台中暫停VM並在受保護站台重新啟動VM之後、請指定最大延遲。完成此程序所需的時間包括:停止容錯移轉VM後完成複寫、清理恢復站台所需的時間、以及在受保護站台重新建立VM所需的時間。NetApp建議使用10分鐘。 -
完成容錯回復程序、然後確認恢復VM保護和資料一致性。
-
恢復虛擬機器後、請中斷次要儲存設備與主機的連線、並連線至主要儲存設備。
-
重新啟動MSSQL伺服器服務。
-
驗證SQL資源是否重新連線。
若要容錯回復至主要儲存設備、請執行反向重新同步作業、確保關係方向與容錯移轉之前的方向相同。 若要在反向重新同步作業之後保留主要和次要儲存設備的角色、請再次執行反轉重新同步作業。
此程序適用於其他應用程式、例如Oracle、類似的資料庫類型、以及使用客體連線儲存設備的任何其他應用程式。
如同往常一樣、在將關鍵工作負載移轉至正式作業之前、請先測試相關步驟、以恢復這些工作負載。
本解決方案的優點
-
使用SnapMirror的高效率和彈性複寫。
-
利用不含資料的快照保留功能、可即時恢復至任何可用點ONTAP 。
-
從儲存、運算、網路和應用程式驗證步驟、將數百個VM恢復到數千個VM所需的所有步驟均可完全自動化。
-
使用不會變更複寫磁碟區的複製機制。SnapCenter
-
如此可避免磁碟區和快照發生資料毀損的風險。
-
避免災難恢復測試工作流程期間的複寫中斷。
-
利用DR資料處理DR以外的工作流程、例如開發/測試、安全性測試、修補程式與升級測試、以及補救測試。
-
-
CPU與RAM最佳化可讓您恢復至較小的運算叢集、進而降低雲端成本。