監控及管理警示
警示系統提供易於使用的介面、可偵測、評估及解決StorageGRID 在執行過程中可能發生的問題。
警示系統是您監控StorageGRID 可能在您的作業系統中發生的任何問題的主要工具。
-
警示系統著重於系統中可採取行動的問題。系統會針對需要您立即注意的事件觸發警示、而不會針對可安全忽略的事件觸發警示。
-
「目前警示」和「已解決的警示」頁面提供使用者易用的介面、可用來檢視目前和歷史問題。您可以依個別警示和警示群組來排序清單。例如、您可能想要依節點/站台排序所有警示、以查看哪些警示會影響特定節點。或者、您可能想要依觸發時間排序群組中的警示、以尋找特定警示的最新執行個體。
-
相同類型的多個警示會分成一封電子郵件、以減少通知數量。此外、在「目前警示」和「已解決的警示」頁面上、會以群組形式顯示同類型的多個警示。您可以展開及收合警示群組、以顯示或隱藏個別警示。例如、如果有多個節點報告*無法與節點*通訊警示、則只會傳送一封電子郵件、而且警示會在「目前警示」頁面上顯示為群組。
-
警示使用直覺式名稱和說明、協助您更快瞭解問題所在。警示通知包括受影響節點和站台的詳細資料、警示嚴重性、觸發警示規則的時間、以及警示相關度量的目前值。
-
警示電子郵件通知和「目前警示」和「已解決警示」頁面上的警示清單、提供解決警示的建議行動。這些建議的行動通常包括StorageGRID 直接連結至《介紹》文件、讓您更容易找到及存取更詳細的疑難排解程序。
舊版警示系統已過時。舊版警示系統的使用者介面和API將在未來版本中移除。警示系統有顯著的效益、而且更容易使用。 |
管理警示
所有StorageGRID 的功能使用者都能檢視警示。如果您具有「根存取」或「管理警示」權限、也可以管理警示、如下所示:
-
如果您需要暫時隱藏一或多個嚴重性層級的警示通知、您可以輕鬆地將特定警示規則靜音一段指定的時間。您可以將整個網格、單一站台或單一節點的警示規則設為靜音。
-
您可以視需要編輯預設警示規則。您可以完全停用警示規則、或變更其觸發條件和持續時間。
-
您可以建立自訂警示規則、以鎖定與您的情況相關的特定條件、並提供您自己建議的行動。若要定義自訂警示的條件、您可以使用Grid Management API的Metrics區段提供的Prometheus度量來建立運算式。
例如、如果節點安裝的RAM數量少於24、000、000、000、000位元組(24 GB)、則會觸發警示。
node_memory_MemTotal < 24000000000