Skip to main content
NetApp Technical Reports
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

NetApp AFX 架構與統一 ONTAP 有何不同

貢獻者 whyistheinternetbroken elliott-ecton

NetApp AFX 在儲存呈現方式、節點與磁碟互動方式以及容量管理方式方面,與統一的 ONTAP 有顯著的架構差異。

之前,我們概述了統一 ONTAP 架構如何透過直接連接的高可用性(HA)對提供檔案、物件和區塊資料儲存,這些 HA 對各自擁有獨立的磁碟組,並透過磁碟聚合來呈現實體容量。在本節中,我們將更詳細地討論統一 ONTAP 和 NetApp AFX 架構之間的一些主要差異。

如何判斷系統是否運作 NetApp AFX

查看系統是否運行 NetApp AFX 的主要方法是執行以下命令:

AFX::> node show -fields personality
node             personality
---------------- -----------
afx-01           AFX
afx-02           AFX

另一個線索是新的 Storage Availability Zone,但 NetApp All-SAN Arrays (ASA) 也支援這個概念。您可以透過該命令查看容量。

AFX::> storage availability-zone show
                     Availability Zone Name: storage_availability_zone_0
                     Availability Zone UUID: 545cb59f-32e9-11f1-a2f5-d039eabdd925
                                 Total Size: 69.59TB
                              Physical Used: 837.1GB
                      Physical Used Percent: 1%
                                  Available: 68.77TB
                              Metadata Used: 837.1GB
                  Log and Recovery Metadata: 834.6GB
                              Delayed Frees: 2.50GB
 Physical User Data Without Snapshot Copies: 17.24MB
  Logical User Data Without Snapshot Copies: 17.24MB
   Efficiency Ratio Without Snapshot Copies: 1.00:1
               Space Full Threshold Percent: 98%
        Space Nearly Full Threshold Percent: 95%

節點到磁碟的關係

在統一的 ONTAP 架構中,讀寫操作會被導向到特定的磁碟子集。因此,即使在 24 節點叢集中擁有 24 個磁碟架(每個節點一個磁碟架),在任何給定時間,每個節點也只能直接存取一個磁碟架,這限制了叢集的容量和效能。

影像

此外,由於 NVRAM 在 HA 配對之間直接連接,節點必須實際位於彼此相鄰的位置,並且作為容錯移轉目標時耦合性更強。例如,當一個節點容錯移轉到其合作夥伴節點時,它實際能夠存取的唯一磁碟就是 HA 配對網域中的磁碟。

HA 故障轉移期間的統一 ONTAP 叢集

影像

在 NetApp AFX 中,磁碟呈現給運算節點的方式發生了一些重大變化。

所有儲存節點均可看到所有磁碟 — 不存在磁碟所有權歸屬問題。

在 NetApp AFX 中,節點和機架都連接到同一個後端交換器,這使得 ONTAP 可以將磁碟的整體可見性網域擴展到整個堆疊。因此,沒有節點擁有任何特定的磁碟。相反地,所有磁碟都參與單一容量資源池,稱為 Storage Availability Zone (儲存可用性區域),可提供更簡單的容量管理和更高的效能潛力(更多可用磁碟意味著更多可用效能)。

NetApp AFX 儲存可用區

影像

不再有實體 Aggregate

Unified ONTAP 將磁碟分組到 RAID 群組中,然後將它們組合成一個稱為 Aggregate 的容量結構。此 Aggregate 用於向儲存系統呈現實體容量,並決定了可用於建立磁碟區以服務最終使用者資料的空間邊界。每個節點必須至少分配一個 Aggregate,這些 Aggregate 的當前容量上限為 800TB。一旦達到此上限,將沒有更多空間用於寫入操作。

實體 Aggregate 也可能帶來一些容量管理方面的挑戰,因為儲存管理員有時需要手動調整 Volume 的位置,以保持叢集節點間的容量平衡。當採用橫向擴展 Volume 架構(例如 FlexGroup Volume)時,這些挑戰會更加突出。Aggregate 的大小、磁碟數量、磁碟類型等也可能存在差異,這會導致在存取不同節點時出現效能差異。

統一 ONTAP 中的 Aggregate

影像

NetApp AFX 將實體集合體的概念虛擬化,並由 ONTAP 管理,然後透過全新的 Storage Availability Zone,將實體容量管理從每個節點的方法轉變為每個叢集。這個單一容量池提供「所見即所得」的空間管理方式。

NetApp AFX 儲存可用區

影像

NVRAM 從直接連線遷移到交換複寫

ONTAP 使用 NVRAM 作為暫存區,以保護傳入叢集的寫入作業。ONTAP 叢集中的每個節點都配備一塊帶電池備援的 NVRAM 卡。當客戶端向磁碟區發送寫入作業時,資料會先儲存在 NVRAM 中。當 NVRAM 被填滿或 10 秒定時器逾時(以先到者為準)時,NVRAM 的內容會被刷新到磁碟。這被稱為一致性點。

NVRAM 內容也會在 HA 對之間不斷複製,這進一步有助於保護資料一致性,因為如果節點發生故障,NVRAM 內容將保留在倖存的節點上並提交到磁碟。

在統一的 ONTAP 叢集中,HA 配對之間的 NVRAM 卡直接相互連接。NetApp AFX 將 NVRAM 複寫移至後端叢集網路。因此,HA 合作夥伴節點對於節點沒有如此嚴格的距離要求。相反地,HA 配對可以分隔到乙太網路的最大距離。

*NetApp AFX NVRAM 複寫 *

影像

寫入可用區域中任何 ( 和所有 ) 磁碟的資料

NetApp AFX 移除了磁碟擁有權的概念,並將實體集合體的架構轉變為由 ONTAP 管理的虛擬化方式,讓為叢集購買的所有容量都可供連接至該叢集的節點使用。使用 AFX 時,所有節點都能寫入儲存可用性區域中的任何磁碟,無論節點:磁碟區擁有權為何。節點仍然有磁碟區擁有權的概念,因為寫入仍需經過 NVRAM,但該資料可以儲存在任何可用容量中。這表示可以有更多磁碟參與單一工作負載,進而帶來效能上的優勢。

資料如何進入 Storage Availability Zone

影像

獨立擴充容量和運算節點

在 NetApp AFX 架構中,硬體資源實作了解耦,節點不再需要同時新增關聯的磁碟。當叢集的效能相關資源(例如 RAM、CPU 或網路吞吐量)不足時,只需在叢集中新增儲存節點,即可利用現有的儲存可用區。反之,如果需要的是容量,則只需添加儲存架即可。這種靈活性確保您只購買所需的資源,從而避免過度配置。

NetApp AFX – 獨立擴充

影像

節點效能的線性擴充

隨著節點加入 AFF 叢集,工作負載將獲得更多的 CPU、RAM 和網路資源。隨著這些資源納入環境中,效能提升呈線性成長。下圖顯示隨著節點增加,效能如何提升。

隨著 NetApp AFX 節點數量的增加,效能呈現線性提升

影像

更大的 RAID 群組、更少的同位磁碟機

ONTAP 透過 RAID 群組(特別是 RAID-TEC)為磁碟提供資料保護和效能的雙重保障。RAID-TEC 可在磁碟發生故障時提供三重同位元檢查保護。即使 RAID 群組中同時發生三個磁碟機故障,RAID-TEC 也能確保資料安全。在統一的 ONTAP 中,RAID 群組最多可容納 28 個磁碟,其中 3 個磁碟機用於同位元檢查,1 個磁碟機用作備用磁碟機。因此,28 個磁碟機中有 24 個用於資料操作 / RAID 條帶化。

統一的 ONTAP RAID 群組

影像

NetApp AFX 仍然採用 RAID-TEC 技術,但將 RAID 群組的大小增加到 96 個硬碟,而只需要 3 個奇偶校驗盤和 1 個備用碟。更大的 RAID 群組可帶來更高的整體效能,同時,由於 SSD 的低故障率、在更大數量的硬碟上更均勻地分配操作,以及 NetApp AFX 中從奇偶校驗盤重建資料碟的改進,硬碟故障帶來的風險也降至最低。

NetApp AFX 儲存可用區 RAID 群組

影像

下表近似表示統一 ONTAP 和 NetApp AFX 系統中 84 個磁碟在不同磁碟機容量下可用的原始容量。

大致原始容量比較,84 個硬碟 – Unified ONTAP 和 NetApp AFX

磁碟機大小 近似原始容量(統一) 近似原始容量(AFX)

7.6 TB

約 547.2TB

約 608TB(+60.8TB)

15.3 TB

~1101.6TB

約 1224TB (+122.4TB)

30.6 TB

約 2203.2TB

約 2448TB(+244.7TB)

60.1 TB

約 4327.2TB

約 4808TB(+480.8TB)

更快的磁碟故障重建時間

在統一的 ONTAP 中,每個節點擁有儲存堆疊中的一部分磁碟。這意味著該節點只能寫入這些磁碟,而且在磁碟發生故障時,磁碟重建也僅由單一節點處理。

NetApp AFX 無需磁碟所有權。因此,如有需要,所有磁碟機都可以從單一節點寫入資料。這也意味著,當需要根據同位元檢查資訊重建磁碟機時,叢集中的所有節點都會參與,因此磁碟機重建速度比單一節點單獨執行要快得多。

NetApp AFX 中的磁碟重建

影像

重複資料刪除網域

重複資料刪除允許儲存系統在其檔案系統中尋找重複區塊,然後建立指向單一區塊的指標,以減少已使用容量的總量。在統一的 ONTAP 中,重複資料刪除遵循特定的邊界來決定哪些區塊可以被刪減。這些邊界取決於所使用的重複資料刪除類型。一般來說:

  • 基於 Volume 的重複資料刪除 → Volume 邊界

  • 跨磁碟區重複資料刪除 → Aggregate 邊界

統一的 ONTAP 重複資料刪除網域

影像

下表顯示了統一 ONTAP 中不同場景下重複資料的容量變化。由於檔案副本跨越節點和 aggregate(從而跨越重複資料刪除網域),因此節省的空間會減少。

針對相同 10GB 檔案在不同情境下的去重行為 – 統一 ONTAP

情境 已使用空間

同一磁碟區中四個相同的 10GB 檔案副本(磁碟區重複資料刪除)

10 GB

同一個 10GB 檔案的四個副本、不同的磁碟區、相同的 Aggregate(已啟用跨磁碟區重複資料刪除)

10 GB

同一個 10GB 檔案的四個副本,分別位於 4 個不同的磁碟區、4 個不同的 Aggregate(已啟用跨磁碟區重複資料刪除)

40 GB

由於 NetApp AFX 移除了實體聚合並將容量管理遷移到新的儲存可用區,重複資料刪除域的邊界也隨之改變。在 AFX 中,重複資料刪除域位於磁碟區層級(類似於統一 ONTAP)和節點層級(而非聚合層級),這是在 9.19.1 版本之前的情況。

從 ONTAP 9.19.1 開始,AFX 支援儲存可用區層級的全域重複資料刪除網域,因此叢集儲存資源池中的所有重複區塊都以相同的方式處理。

NetApp AFX – 全域重複資料刪除網域(ONTAP 9.19.1)

影像

下表顯示 NetApp AFX 中不同案例下重複資料的容量行為。

針對相同 10GB 檔案在不同場景下的去重行為 – NetApp AFX

情境 已使用空間

同一磁碟區中四個相同的 10GB 檔案副本(磁碟區重複資料刪除)

10GB(9.18.1)10GB(9.19.1)

同一 10GB 檔案的四個副本,位於不同的磁碟區,同一節點(已啟用跨磁碟區重複資料刪除)

10GB(9.18.1)10GB(9.19.1)

同一個 10GB 檔案的四個副本,分別位於 4 個不同的磁碟區、4 個不同的節點上(已啟用跨磁碟區重複資料刪除)

40GB(9.18.1)10GB(9.19.1)

已移除/不再支援的功能

NetApp AFX 專為高效能 NAS 和物件工作負載而設計,特別適用於(但不限於)人工智慧訓練和推理領域。在 NetApp AFX 的設計過程中,我們決定停用 ONTAP 中的一些功能。

  • 由於專注於高效能 NAS 和物件儲存,NetApp AFX 解決方案已移除區塊儲存工作負載。它不支援 FCP、iSCSI 或 NVMe 資料協定,並且沒有計劃添加區塊儲存協定。

  • Disaggregated 與 de-aggregated 同義,這表示 aggregate(至少在實體儲存管理概念上)已被移除。移除實體 aggregate 不僅簡化了 ONTAP 中的容量管理,也提供了實現單一容量池的機制。

  • 移除 Aggregate 意味著 Aggregate 特定功能也會被移除。例如,MetroCluster 利用 Aggregate 層級的鏡射來實現站台容錯移轉功能。因此,MetroCluster 也已從 NetApp AFX 移除。站台容錯移轉功能將由 ONTAP 9.19.1GA 中提供的新 SnapMirror Active-Sync for NAS 功能提供。

  • 名為 FabricPool 的冷資料分層功能目前也無法用於 NetApp AFX,因為它也是特定於 Aggregate 的。

  • 由於採用了新的容量架構,NetApp AFX 中也不再需要基於複製的磁碟區移動。如需詳細資訊,請參閱零複本磁碟區移動

  • 功能移除也意味著一些 CLI/GUI/REST API 的變更,因此任何不再支援的功能的命令或 API 呼叫也將被移除。

  • 目前 NetApp AFX 無法使用 ZAPI。

  • 用於虛擬化的 NFS 複製卸載(僅限具有精細資料分佈的 FlexGroup 磁碟區)

ONTAP 管理變更

整體而言,NetApp AFX 管理不會改變叢集的管理機制。管理員仍然可以利用 CLI、GUI 和 REST API 登入並配置叢集。但 NetApp AFX 確實提供了一個改善儲存管理操作方式的機會。

更簡化的容量管理

NetApp AFX 儲存可用區將管理端點從基於節點和 Aggregate 的方式簡化為整個叢集可用的單一容量資源池。隨著磁碟區的增長和收縮,ONTAP 會自動從儲存可用區借用和釋放容量。

因此,儲存管理員不再需要費心在多達 24 個節點和數百個 Aggregate 中尋找和管理可用空間。現在,只需在一個地方即可管理和檢視容量。

例如,在統一 ONTAP 的 CLI 中,如果要查看叢集的總實體容量資訊,可以使用「aggregate show-space」命令,該命令會列印所有 aggregate 項目。而在 NetApp AFX 中,可以使用「cluster space show」指令,該指令只會顯示單一儲存可用區。

統一 ONTAP 和 NetApp AFX 中容量 CLI 指令的並排比較

影像

在 Unified ONTAP System Manager GUI 中,使用層級來顯示容量。實際上,GUI 會嘗試透過加總總數來顯示叢集的整體容量,但仍會以每個 Aggregate 為基礎顯示整體使用情況。

System Manager 容量檢視 – Unified ONTAP

影像

在 NetApp AFX System Manager 中,叢集空間的檢視幾乎相同,但由於沒有 Aggregate,因此無需進行額外的計算。您看到的容量就是您獲得的容量。

System Manager 容量檢視 – NetApp AFX

影像

FlexGroup Volume 管理改進

FlexGroup 磁碟區由多個底層 FlexVol 組成磁碟區構成,這些底層組成磁碟區分佈在叢集中的多個節點和聚合中,並以單一大型命名空間的形式呈現給 NAS 用戶端。FlexGroup 磁碟區為高效能工作負載提供效能、擴充性、負載平衡和檔案數量的優勢。然而,由於磁碟區需要在節點和聚合之間進行協調,因此當容量開始飽和時,它們有時會遇到一些物理限制,因為聚合提供的獨立檔案系統也具有獨立的容量使用和限制。例如,如果包含 FlexGroup 磁碟區組成磁碟區的某個聚合在叢集中的其他聚合之前開始飽和,則整個 FlexGroup 本身可能會出現容量或效能問題。

因此,儲存管理員可能會過度擔心底層 FlexGroup 基礎架構,而忽略了維護環境的其他方面。

FlexGroup 磁碟區配置 - 統一化 ONTAP Aggregate

影像

NetApp AFX 將容量集中在一個儲存可用區中,這更貼近 FlexGroup 磁碟區的預期運作方式。所有磁碟區都位於同一個容量池中,而不是分佈在多個大小可能不同的獨立 Aggregate 中的多個組成磁碟區,這大大簡化了使用 FlexGroup 磁碟區的整體管理開銷。

此外,AFX 預設會為 FlexGroup 磁碟區啟用進階容量平衡功能,有助於更妥善地在磁碟區中分配較大的檔案。現在,FlexGroup 磁碟區組成要素較不需要管理概念,而是在背景中靜靜地執行其工作。

FlexGroup Volume 配置 - NetApp AFX

影像

自動化儲存管理任務

在 NetApp AFX 中使用 Storage Availability Zone 時,所有容量都會在所有節點之間共享。雖然節點仍擁有磁碟區,但 ONTAP 會根據每個節點在任何特定時間的需求,透過借用和釋放容量來自動管理每個節點的容量使用量。這意味著儲存管理員不再需要擔心如何以最佳方式平衡可用空間。

此外,ONTAP 可自動管理 RAID 群組,無需管理員幹預,即可將新新增的磁碟新增至現有或新建的 RAID 群組。ONTAP 還可跨節點管理磁碟區遷移,而無需複製資料。

零複本磁碟區移動

Unified ONTAP 提供了一種在節點或 Aggregate 之間無中斷地移動 Volume 的方法,以此來管理整個叢集的效能和容量使用情況。

當磁碟區移動開始時,會發生以下情況:

  • 在指定的目標 Aggregate 上建立新的空磁碟區

  • Volume 中繼資料(例如儲存效率資訊、檔案控點等)會複寫到新的目的地 Volume

  • 磁碟區資料透過 SnapMirror 技術經由後端叢集網路複製到目的地磁碟區,目的地 Aggregate 需要有可用的可用空間才能進行移動,否則移動工作將會失敗

  • 磁碟區複寫會再次執行,以確保兩個磁碟區與任何資料變更保持一致

  • 啟動切換流程,將來源磁碟區離線,並將目的地磁碟區升級為新的來源磁碟區供用戶端使用

  • 用戶端 IO 在切換過程中會短暫暫停,但無需重新掛載

在 NetApp AFX 中,儲存可用區會將所有容量提供給所有節點,所有節點都可以寫入該儲存池中的任何磁碟。一旦資料放置完成,即使磁碟區被移動,資料也會保持在原位。這意味著無需複製資料。磁碟區移動程序與統一 ONTAP 相同,只是無需透過 SnapMirror 複製資料。不需要額外的容量。

NetApp AFX 中的零複製磁碟區移動

影像

輕量級的磁碟區遷移功能使 AFX 能夠自動執行許多管理任務,而不會受到效能或容量的限制。這些磁碟區遷移功能在 NetApp AFX 提供的一些新功能中已應用,如下文所述。

HA 故障轉移行為

在統一的 ONTAP 架構中,節點擁有磁碟和 Aggregate,資料透過 Volume 進行服務。寫入作業使用本機節點的 NVRAM 刷新到該節點擁有的磁碟。當節點重新啟動或發生故障時,ONTAP 將觸發故障節點資源的接管,將磁碟和 Aggregate 的所有權轉移給合作夥伴節點。網路介面也會故障轉移到 IP 位址空間中的連接埠。由於 NVRAM 內容在 HA 配對之間持續複寫,因此節點會刷新 NVRAM 內容,以提交故障節點寫入磁碟的資料。之後,倖存節點將擁有故障節點的 Aggregate 和 Volume,直到故障節點恢復正常。這意味著,所有流向這些 Volume(以及倖存節點已擁有的 Volume)的流量都將在單一節點上處理,直到故障轉移問題解決為止。

作為初始統一 ONTAP 叢集部署的一部分,建議事先規劃容錯移轉,以避免單一節點使其合作夥伴過載。這本身就是一個挑戰,因為很難預測哪些磁碟區可能會成為效能霸凌者,但諸如不中斷營運的磁碟區移動和磁碟區服務品質原則等功能可以協助緩解。

下圖顯示統一的 ONTAP 叢集如何在節點間造成效能不均衡,以及故障轉移在某些情況下如何導致效能下降。

統一 ONTAP – 節點利用率可能存在不平衡

影像

當 HA 配對的節點在磁碟區數量和效能使用率方面變得不平衡時、節點容錯移轉會影響整體效能、因為存續的節點現在將擁有所有故障節點的磁碟區。同時、叢集中的其他節點可能有空間承擔額外的工作。

Unified ONTAP – 容錯移轉對節點使用率的影響

影像

如上所示,當 HA 合作夥伴需要承擔額外任務時,可能會出現過載,並影響該節點上所有磁碟區的效能。磁碟區遷移可以緩解這種情況,但這需要在節點之間進行複製(需要可用空間),而且所需時間可能超過節點故障復原所需的時間。此外,如果您遷移磁碟區,它不會故障復原到原始節點。而是會保留在您遷移到的節點上。

使用 NetApp AFX 時,節點容錯移轉會表現出一些不同的行為。

  • 由於節點不擁有磁碟,也沒有實體 Aggregate,因此節點容錯移轉不需要轉移這些資源。相反地,只有網路介面和 Volume 所有權會轉移到其他節點。

  • NVRAM 提交仍然會發生,但透過 HA 網路而不是直接連線進行。

  • 磁碟區完成向夥伴節點的初始容錯移轉後,AFX 會將磁碟區重新分佈到叢集中的其他倖存節點上。這得歸功於零複製磁碟區移動技術。

  • 當節點恢復後,磁碟區將移回原始節點。

NetApp AFX 已經維持叢集中各個節點的效能平衡,以保持相對均勻的使用率,因此當發生容錯移轉並重新平衡磁碟區時,叢集中的節點使用率應該大致相同。

NetApp AFX - 故障轉移後的磁碟區重新平衡

影像

節點新增和移除

統一的 ONTAP 和 NetApp AFX 都允許向叢集中新增和移除節點。但是,由於架構上的一些差異,節點新增和移除的過程略有不同。

在統一化 ONTAP 中新增/移除節點

我們已經了解到,統一的 ONTAP 具有直接的節點到磁碟所有權關係,並且所有節點都必須擁有一些磁碟,並且至少附加一個 aggregate。基於此,以下規則適用於節點的新增和刪除操作。

  • 在統一的 ONTAP 中新增節點無需任何額外步驟,但為了確保所有節點(包括新節點)的效能平衡,需要將磁碟區遷移到新節點。這需要預先分析現有磁碟區及其工作負載,決定要遷移哪些磁碟區,然後執行實際的磁碟區遷移,而實際的磁碟區遷移又需要將資料複製到後端叢集網路。

  • 在統一 ONTAP 中移除節點需要手動遷移節點上的現有磁碟區,這意味著您必須確定哪些節點可以託管哪些磁碟區以保持效能穩定,並且您必須有足夠的可用容量來為這些磁碟區提供遷移空間。如果可用容量不足,可能還需要進行額外的磁碟區遷移,以便在叢集中重新分配工作負載。移除節點也會移除 HA 配對,因此工作量會加倍。由於節點擁有磁碟,因此還需要對這些節點進行完整的磁碟重新初始化。所有這些都會增加原本相對簡單的任務所需的時間和精力。

NetApp AFX 中的節點新增 / 刪除

我們也了解到,NetApp AFX 並沒有利用標準的節點到磁碟所有權機制,也不使用實體聚合來向叢集提供容量。因此,節點的新增和移除行為略有不同。

  • 在 NetApp AFX 中新增節點無需進行預先的磁碟區分析,也無需管理員介入來確保每個節點的磁碟區數量均衡。相反地,ONTAP 會自動平衡新加入節點之間的磁碟區數量,以維持相對均衡的效能設定檔。ONTAP 會自動在節點之間移動磁碟區,而無需複製任何內容,從而減少了向叢集新增節點所需的時間、容量和工作量。

  • 在 NetApp AFX 中移除節點也不需要太多(如果有的話)人工介入。當節點標記為移除時、ONTAP 會自動將磁碟區移至各節點(同樣不需複製)、以清空要移除的節點。而且由於節點不擁有磁碟、因此移除節點後不需要重新初始化磁碟。這使得 AFX 中的節點本質上具有模組化、易於擴充或縮減。

效能導向的磁碟區移動

NetApp AFX 的零複製磁碟區移動功能,表示它可以在不複製資料的情況下根據需要重新平衡磁碟區,這使其能夠快速執行,且無需額外容量。這表示磁碟區移動可以成為 ONTAP 叢集自動負載平衡中更重要的一環。現在移動磁碟區幾乎不產生任何成本,ONTAP 可以利用這個有價值的工具,納入如以效能為導向的磁碟區負載平衡等功能。

在執行 ONTAP 9.18.1 及更新版本的 NetApp AFX 中,節點、HA 配對和磁碟區使用率會持續受到監控,同時也會收集和分析效能資料。如果節點的使用率超出定義的臨界值,ONTAP 會自動選取要移至使用率較低節點的磁碟區,以維持整個叢集的平衡效能。

NetApp AFX 中效能驅動的磁碟區移動 – 高使用率觸發磁碟區移動

影像

NetApp AFX 中效能驅動的磁碟區移動 – 磁碟區移動後的平衡節點使用率

影像

叢集規模和擴充

統一 ONTAP 叢集最多支援 24 個節點,每個新增節點都必須配備磁碟(用於系統功能和資料服務)。磁碟櫃可以新增到叢集中,但即使叢集規模達到 24 個節點,它們也始終連接到單一 HA 配對,並且僅由單一節點擁有。這意味著即使只需要提升效能,叢集也會增加容量,而效能提升主要集中在新節點擁有的特定磁碟集。因此,您最終可能會獲得一些不需要的額外容量。

Unified ONTAP – 新增擴充考量

影像

NetApp AFX 支援更大規模的叢集。從 9.19.1 版本開始,AFX 叢集的單一叢集最多可包含 32 個節點。由於所有節點都能看到並存取所有磁碟,因此它們可以共用這些磁碟機的效能和容量(截至 ONTAP 9.19.1 版本,最高可達 32PB),從而避免資源閒置。磁碟區移動無需複製,因此 ONTAP 能夠自動將磁碟區移動到新增的節點,以確保節點利用率均衡分佈,而容量則透過儲存可用區進行均衡分配。

NetApp AFX – 增加了規模方面的考量

影像

根磁碟區變更

在 NetApp ONTAP 中,每個節點都被指派一個根磁碟區,用於存放系統特定的檔案和功能,例如日誌檔案、開機映像、核心檔案、叢集資料庫等等。

在統一的 ONTAP 中,這些根磁碟區位於實體根 Aggregate 上。為了減少根 Aggregate 使用的容量,它們是透過進階磁碟分割(ADP)在資料磁碟機分割區上建立的。

NetApp AFX 架構移除了實體聚合,因此也不再需要根聚合和 ADP。根磁碟區的概念仍然存在,但它們現在位於容量池的虛擬化區域中,無需額外配置。此外,根磁碟區的功能也發生了變化。開機映像和複寫的叢集資料庫從儲存堆疊移至每個 AFX 節點上的板載開機媒體。現在,即使儲存堆疊存取中斷,節點仍然可以開機並保持叢集資格,從而簡化了疑難排解的複雜性。

機載開機媒體

NetApp AFX 節點利用內建的開機媒體,這是一個 NVMe 連接的 M.2 裝置,容量約為 3.8TB。這些開機裝置包含開機映像檔和複寫的資料庫,這些都與儲存機櫃分離,當發生磁碟存取問題時可提供額外的備援。如果開機媒體故障,該節點將由其 HA 夥伴接管,並可更換開機媒體。更換後,儲存管理員會將新的 ONTAP 映像載入該裝置,ONTAP 會自動重建叢集資料庫以恢復完整功能。