使用CVO和AVS(與來賓連線的儲存設備)進行災難恢復
災難恢復至雲端是一種彈性且具成本效益的方法、可保護工作負載、避免站台中斷運作、以及勒索軟體等資料毀損事件。有了NetApp SnapMirror、使用來賓連線儲存設備的內部部署VMware工作負載可複寫至Cloud Volumes ONTAP Azure上執行的NetApp VMware。
總覽
作者:Ravi BCB和Niyazz Mohamed, NetApp
This covers application data; however, what about the actual VMs themselves. Disaster recovery should cover all dependent components, including virtual machines, VMDKs, application data, and more. To accomplish this, SnapMirror along with Jetstream can be used to seamlessly recover workloads replicated from on-premises to Cloud Volumes ONTAP while using vSAN storage for VM VMDKs. 本文件提供逐步的方法來設定及執行使用NetApp SnapMirror、Jetstream及Azure VMware解決方案(AVS)的災難恢復。
假設
本文件著重於客體內儲存應用程式資料(也稱為來賓連線)、我們假設內部環境使用SnapCenter 的是應用程式一致的備份。
本文件適用於任何第三方備份或還原解決方案。視環境中使用的解決方案而定、請遵循最佳實務做法來建立符合組織SLA的備份原則。 |
若要在內部部署環境與Azure虛擬網路之間建立連線、請使用Express Route Global Reach或虛擬WAN搭配VPN閘道。應根據內部部署的VLAN設計來建立區段。
將內部部署資料中心連線至Azure的選項有多種、因此我們無法在此文件中概述特定的工作流程。如需適當的內部部署至Azure連線方法、請參閱Azure文件。 |
部署災難恢復解決方案
解決方案部署總覽
-
確保應用程式資料是以SnapCenter 不必要的RPO要求使用支援功能進行備份。
-
在Cloud Volumes ONTAP 適當的訂購和虛擬網路中使用Cloud Manager、以正確的執行個體大小進行配置。
-
為相關的應用程式磁碟區設定SnapMirror。
-
更新SnapCenter 中的備份原則、以便在排程工作之後觸發SnapMirror更新。
-
-
在內部部署資料中心安裝Jetstream DR軟體、並開始保護虛擬機器。
-
在Azure VMware解決方案私有雲中安裝Jetstream DR軟體。
-
在災難事件期間、請使用Cloud Manager中斷SnapMirror關係、並觸發將虛擬機器容錯移轉至Azure NetApp Files 指定AVS DR站台中的VMware資料存放區或vSAN資料存放區。
-
重新連接應用程式VM的iSCSI LUN和NFS掛載。
-
-
在主站台恢復後、透過反向重新同步SnapMirror來叫用容錯回復至受保護站台。
部署詳細資料
在Azure上設定CVO、並將磁碟區複寫至CVO
第一步是在 Azure 上設定 Cloud Volumes ONTAP ("連結")並以Cloud Volumes ONTAP 所需的頻率和快照保留量、將所需的Volume複製到不間斷的地方。
設定AVS主機和CVO資料存取
部署SDDC時、需要考量的兩個重要因素是Azure VMware解決方案中SDDC叢集的大小、以及SDDC持續服務的時間。這兩項災難恢復解決方案的關鍵考量、有助於降低整體營運成本。SDDC可只有三部主機、在全規模部署中、一直到多主機叢集為止。
部署AVS叢集的決定主要取決於RPO / RTO需求。有了Azure VMware解決方案、SDDC就能準時配置、以準備測試或實際的災難事件。即時部署的SDDC可在不處理災難時節省ESXi主機成本。不過、這種部署方式會在部署SDDC時、影響RTO數小時。
最常見的部署選項是讓SDDC以一律開啟的操作前導指示燈模式執行。此選項可提供三部隨時可用的主機的小型佔用空間、並提供執行中的基準來執行模擬活動和法規遵循檢查、藉此加速恢復作業、避免在正式作業站台和災難恢復站台之間發生作業移位的風險。當需要處理實際的DR事件時、可以將指示燈叢集快速擴充至所需的層級。
若要設定AVS SDDC(無論是隨需或是以指示燈模式)、請參閱 "在Azure上部署及設定虛擬化環境"。先決條件是確認位於AVS主機上的客體VM能夠在Cloud Volumes ONTAP 建立連線之後、從支援中心使用資料。
正確設定好VMware及AVS之後Cloud Volumes ONTAP 、請開始設定Jetstream、使用VAIO機制、並利用SnapMirror將應用程式磁碟區複本複製到Cloud Volumes ONTAP 物件上、將內部部署工作負載自動還原至AVS(使用應用程式VMDK的VM及使用客體內建儲存設備的VM)。
在內部部署資料中心安裝Jetstream DR
Jetstream DR軟體包含三個主要元件:Jetstream DR管理伺服器虛擬設備(MSA)、DR虛擬設備(DRVA)和主機元件(I/O篩選套件)。MSA用於在運算叢集上安裝及設定主機元件、然後管理Jetstream DR軟體。安裝程序如下:
-
檢查先決條件。
-
執行容量規劃工具以取得資源和組態建議。
-
將Jetstream DR MSA部署至指定叢集中的每個vSphere主機。
-
在瀏覽器中使用其DNS名稱啟動MSA。
-
向MSA登錄vCenter伺服器。
-
部署了Jetstream DR MSA並註冊vCenter Server之後、請使用vSphere Web Client瀏覽至Jetstream DR外掛程式。您可以瀏覽至「資料中心」>「設定」>「Jetstream DR」來完成此作業。
-
在Jetstream DR介面中、完成下列工作:
-
使用I/O篩選套件設定叢集。
-
新增位於恢復站台的Azure Blob儲存設備。
-
-
從「應用裝置」索引標籤部署所需數量的DR虛擬應用裝置(DRVA)。
使用容量規劃工具來預估所需的DRVA數量。 -
使用可用的資料存放區或獨立的共享iSCSI儲存池中的VMDK、為每個DRVA建立複寫記錄磁碟區。
-
從「受保護的網域」索引標籤、使用Azure Blob儲存站台、DRVA執行個體和複寫記錄的相關資訊、建立所需數量的受保護網域。受保護的網域會定義叢集中的特定VM或一組應用程式VM、這些VM會一起受到保護、並指派容錯移轉/容錯回復作業的優先順序。
-
選取要保護的VM、並根據相依性將VM分組為應用程式群組。應用程式定義可讓您將一組VM分組為邏輯群組、其中包含開機順序、開機延遲、以及可在恢復時執行的選用應用程式驗證。
請確定保護網域中的所有VM都使用相同的保護模式。 回寫(VMDK)模式可提供更高的效能。 -
請確定複寫記錄磁碟區放置在高效能儲存設備上。
-
完成後、按一下「開始保護受保護網域」。這會開始將所選VM的資料複寫到指定的Blob存放區。
-
複寫完成後、VM保護狀態會標示為可恢復。
容錯移轉Runbook可設定為群組VM(稱為恢復群組)、設定開機順序、以及修改CPU /記憶體設定和IP組態。 -
按一下「設定」、然後按一下Runbook「設定」連結以設定Runbook群組。
-
按一下「Create Group(建立群組)」按鈕、開始建立新的Runbook群組。
如有需要、請在畫面下方套用自訂的預先指令碼和後置指令碼、以便在執行手冊群組作業之前和之後自動執行。確定Runbook指令碼位於管理伺服器上。 -
視需要編輯VM設定。指定用於恢復VM的參數、包括開機順序、開機延遲(以秒為單位)、CPU數量、以及要分配的記憶體容量。按一下向上或向下箭頭、變更VM的開機順序。也提供了用於保留MAC的選項。
-
靜態IP位址可針對群組中的個別VM手動設定。按一下VM的NIC View連結、手動設定其IP位址設定。
-
按一下「Configure(設定)」按鈕以儲存個別VM的NIC設定。
容錯移轉和容錯回復執行工作簿的狀態現在會列為「已設定」。容錯移轉和容錯回復執行手冊群組是以相同的初始VM群組和設定成對建立。如有必要、您可以按一下各自的詳細資料連結並進行變更、個別自訂任何Runbook群組的設定。
在私有雲中安裝AVS的Jetstream DR
恢復站台(AVS)的最佳實務做法是事先建立三節點的指示燈式叢集。如此可預先設定恢復站台基礎架構、包括下列項目:
-
目的地網路區段、防火牆、DHCP和DNS等服務
-
安裝AVS的Jetstream DR
-
將anf磁碟區設定為資料存放區等
對於任務關鍵型網域、Jetstream DR支援的RTO模式接近零。對於這些網域、應該預先安裝目的地儲存設備。在此情況下、建議使用ANF儲存類型。
應在AVS叢集上設定網路組態(包括區段建立)、以符合內部部署需求。 |
視SLA和RTO需求而定、您可以使用持續容錯移轉或一般(標準)容錯移轉模式。對於接近零的RTO、您應該在恢復站台開始持續重新補充。 |
-
若要在Azure VMware解決方案私有雲上安裝適用於AVS的Jetstream DR、請使用Run命令。從Azure入口網站移至Azure VMware解決方案、選取私有雲、然後選取執行命令>套件> JSDR.Configuration。
Azure VMware解決方案的預設CloudAdmin使用者沒有足夠的權限可安裝適用於AVS的Jetstream DR。Azure VMware解決方案可針對Jetstream DR叫用Azure VMware Solution Run命令、以簡化及自動化方式安裝Jetstream DR。 下列螢幕快照顯示使用DHCP型IP位址進行安裝。
-
在安裝AVS的Jetstream DR完成後、請重新整理瀏覽器。若要存取Jetstream DR UI、請前往SDDC資料中心>組態> Jetstream DR。
-
在Jetstream DR介面中、完成下列工作:
-
新增Azure Blob儲存設備帳戶、以保護內部部署叢集做為儲存站台、然後執行「掃描網域」選項。
-
在出現的快顯對話方塊視窗中、選取要匯入的受保護網域、然後按一下其匯入連結。
-
-
網域已匯入以供還原。移至「受保護的網域」索引標籤、確認已選取所需的網域、或從「選取受保護的網域」功能表中選擇所需的網域。隨即顯示受保護網域中可恢復的VM清單。
-
匯入受保護的網域之後、請部署DRVA設備。
您也可以使用由CPt建立的計畫來自動化這些步驟。 -
使用可用的vSAN或ANF資料存放區建立複寫記錄磁碟區。
-
匯入受保護的網域、並將恢復VA設定為使用ANF資料存放區來放置VM。
請確定選取的區段已啟用DHCP、而且有足夠的IP可用。在網域還原期間、會暫時使用動態IP。每個恢復中的VM(包括持續重新補充)都需要個別的動態IP。恢復完成後、IP便會釋出、並可重複使用。 -
選取適當的容錯移轉選項(持續容錯移轉或容錯移轉)。在此範例中、會選取持續還原(持續容錯移轉)。
雖然執行組態時、「持續容錯移轉」和「容錯移轉」模式各有不同、但兩種容錯移轉模式的設定步驟相同。容錯移轉步驟會一起設定及執行、以回應災難事件。您可以隨時設定持續容錯移轉、然後在正常系統作業期間、允許在背景執行。發生災難事件之後、持續容錯移轉作業便會完成、以便立即將受保護VM的擁有權轉移到恢復站台(RTO接近零)。
持續容錯移轉程序隨即開始、其進度可從UI監控。按一下「目前步驟」區段中的藍色圖示、會顯示快顯視窗、顯示容錯移轉程序目前步驟的詳細資料。
容錯移轉與容錯回復
-
在內部部署環境的受保護叢集發生災難(部分或完整故障)之後、您可以在中斷個別應用程式磁碟區的SnapMirror關係之後、使用Jetstream來觸發VM的容錯移轉。
此步驟可輕鬆自動化、以利恢復程序。 -
存取AVS SDDC(目的地端)上的Jetstream UI、然後觸發容錯移轉選項以完成容錯移轉。工作列會顯示容錯移轉活動的進度。
在完成容錯移轉時所出現的對話視窗中、容錯移轉工作可以指定為已規劃或假設為強制進行。
強制容錯移轉假設主站台已無法再存取、且受保護網域的擁有權應由還原站台直接承擔。
-
持續容錯移轉完成後、會出現一則訊息、確認工作已完成。當工作完成時、請存取恢復的VM來設定iSCSI或NFS工作階段。
容錯移轉模式會變更為在容錯移轉中執行、而VM狀態會恢復。受保護網域的所有VM現在都在容錯移轉執行手冊設定所指定的狀態下、於還原站台執行。 為了驗證容錯移轉組態和基礎架構、可以在測試模式(測試容錯移轉選項)下操作、觀察虛擬機器及其資料從物件存放區恢復到測試還原環境的過程。在測試模式下執行容錯移轉程序時、其運作方式類似於實際的容錯移轉程序。 -
虛擬機器恢復後、請使用儲存災難恢復功能來進行客體內儲存設備。為了示範此程序、本範例使用SQL Server。
-
在SnapCenter AVS SDDC上登入恢復的S振 向虛擬機器、並啟用DR模式。
-
使用瀏覽器N存取SnapCenter 這個功能。
-
在「設定」頁面中、瀏覽至「設定」>「全域設定」>「災難恢復」。
-
選取「啟用災難恢復」。
-
按一下套用。
-
按一下「監控」>「工作」、確認DR工作是否已啟用。
NetApp SnapCenter 支援區4.6或更新版本應用於儲存災難恢復。對於舊版、應使用應用程式一致的快照(使用SnapMirror複寫)、如果必須在災難恢復站台中恢復先前的備份、則應執行手動恢復。
-
-
確定SnapMirror關係已中斷。
-
使用Cloud Volumes ONTAP 相同的磁碟機代號、將LUN從支援系統連接到已恢復的SQL客體VM。
-
開啟iSCSI啟動器、清除先前中斷連線的工作階段、並新增新目標及複寫Cloud Volumes ONTAP 的支援區的多重路徑。
-
請確定所有磁碟均使用與DR之前相同的磁碟機代號進行連線。
-
重新啟動MSSQL伺服器服務。
-
請確定SQL資源重新連線。
如果是NFS、請使用mount命令附加磁碟區、然後更新「etc/fstab'」項目。 此時、您可以執行作業並正常營運。
在NSxT-T端點上、可建立獨立的專屬層級1閘道、以模擬容錯移轉案例。如此可確保所有工作負載彼此通訊、但不會有流量進入或離開環境、如此一來、就能執行任何分類、控制或強化工作、而不會產生交叉污染的風險。此作業不在本文件的範圍之內、但可輕鬆模擬隔離。
當主要站台重新啟動並執行之後、您就可以執行容錯回復。系統會由Jetstream恢復VM保護、且SnapMirror關係必須回復。
-
還原內部部署環境。視災難事件類型而定、可能需要還原及/或驗證受保護叢集的組態。如有必要、可能需要重新安裝Jetstream DR軟體。
-
存取還原的內部部署環境、前往Jetstream DR UI、然後選取適當的受保護網域。受保護的站台準備好進行容錯回復之後、請在UI中選取「容錯回復」選項。
此外、也可使用由程式管理產生的容錯回復計畫、將VM及其資料從物件存放區傳回原始的VMware環境。 在恢復站台中暫停VM並在受保護站台重新啟動VM之後、請指定最大延遲。完成此程序所需的時間包括:停止容錯移轉VM後完成複寫、清理恢復站台所需的時間、以及在受保護站台重新建立VM所需的時間。NetApp建議使用10分鐘。 -
完成容錯回復程序、然後確認恢復VM保護和資料一致性。
-
恢復虛擬機器後、請中斷次要儲存設備與主機的連線、並連線至主要儲存設備。
-
重新啟動MSSQL伺服器服務。
-
驗證SQL資源是否重新連線。
若要容錯回復至主要儲存設備、請執行反向重新同步作業、確保關係方向與容錯移轉之前的方向相同。 若要在反向重新同步作業之後保留主要和次要儲存設備的角色、請再次執行反轉重新同步作業。
此程序適用於其他應用程式、例如Oracle、類似的資料庫類型、以及使用客體連線儲存設備的任何其他應用程式。
如同往常一樣、在將關鍵工作負載移轉至正式作業之前、請先測試相關步驟、以恢復這些工作負載。
本解決方案的優點
-
使用SnapMirror的高效率和彈性複寫。
-
利用不含資料的快照保留功能、可即時恢復至任何可用點ONTAP 。
-
從儲存、運算、網路和應用程式驗證步驟、將數百個VM恢復到數千個VM所需的所有步驟均可完全自動化。
-
使用不會變更複寫磁碟區的複製機制。SnapCenter
-
如此可避免磁碟區和快照發生資料毀損的風險。
-
避免災難恢復測試工作流程期間的複寫中斷。
-
利用DR資料處理DR以外的工作流程、例如開發/測試、安全性測試、修補程式與升級測試、以及補救測試。
-
-
CPU與RAM最佳化可讓您恢復至較小的運算叢集、進而降低雲端成本。