Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

警報參考

此參考列出了網格管理器中出現的預設警報。您收到的警報訊息中包含建議的操作。

根據需要,您可以建立自訂警報規則以適合您的系統管理方法。

一些預設警報使用"Prometheus 指標"

家電警報

警報名稱 描述

電器電池已過期

設備儲存控制器中的電池已耗盡。

電器電池故障

設備儲存控制器中的電池故障。

電器電池的學習容量不足

設備儲存控制器中的電池的學習容量不足。

電器電池即將過期

設備儲存控制器中的電池即將耗盡。

已拆除電器電池

設備儲存控制器中的電池遺失。

電器電池過熱

設備儲存控制器中的電池過熱。

設備BMC通訊錯誤

與基板管理控制器 (BMC) 的通訊已遺失。

偵測到設備啟動設備故障

偵測到設備中的啟動設備有問題。

設備快取備份設備失敗

持久性快取備份設備發生故障。

設備快取備份設備容量不足

快取備份設備容量不足。

設備緩存備份設備寫保護

快取備份設備受到寫入保護。

裝置快取記憶體大小不匹配

設備中的兩個控制器具有不同的快取大小。

設備CMOS電池故障

檢測到設備中的 CMOS 電池有問題。

設備計算控制器底盤溫度過高

StorageGRID設備中計算控制器的溫度已超過正常閾值。

設備運算控制器 CPU 溫度過高

StorageGRID設備中計算控制器的 CPU 溫度已超過正常閾值。

設備運算控制器需要注意

在StorageGRID設備的運算控制器中偵測到硬體故障。

設備運算控制器電源 A 出現問題

計算控制器中的電源 A 出現問題。

設備運算控制器電源 B 出現問題

計算控制器中的電源B有問題。

設備計算硬體監控服務停滯

監控儲存硬體狀態的服務已停滯。

設備 DAS 驅動器超出每日寫入資料的限制

每天向驅動器寫入過多的數據,可能會使其保固失效。

偵測到設備 DAS 驅動器故障

偵測到裝置中的直接連接儲存 (DAS) 磁碟機有問題。

設備 DAS 驅動器定位器燈亮起

裝置儲存節點中一個或多個直接連接儲存 (DAS) 磁碟機的磁碟機定位器指示燈亮起。

設備 DAS 驅動器重建

直接連接儲存 (DAS) 磁碟機正在重建。如果最近更換或移除/重新插入,則會發生這種情況。

偵測到設備風扇故障

偵測到設備中的風扇裝置有問題。

偵測到設備光纖通道故障

偵測到設備儲存控制器和運算控制器之間存在光纖通道鏈路問題

設備光纖通道 HBA 連接埠故障

光纖通道 HBA 連接埠正在發生故障或已經發生故障。

裝置快閃記憶體快取驅動器效能不佳

用於 SSD 快取的驅動器不是最佳的。

電器互連/電池盒已拆除

互連器/電池罐遺失。

設備 LACP 連接埠缺失

StorageGRID設備上的連接埠未參與 LACP 綁定。

偵測到設備 NIC 故障

偵測到裝置中的網路介面卡 (NIC) 有問題。

設備整體電源供電下降

StorageGRID設備的電源偏離了建議的工作電壓。

設備 SSD 嚴重警告

設備 SSD 正在報告嚴重警告。

設備儲存控制器 A 故障

StorageGRID設備中的儲存控制器 A 發生故障。

設備儲存控制器 B 故障

StorageGRID設備中的儲存控制器 B 發生故障。

設備儲存控制器驅動器故障

StorageGRID設備中的一個或多個磁碟機發生故障或狀態不佳。

設備儲存控制器硬體問題

SANtricity軟體會報告StorageGRID設備中的某個元件「需要注意」。

設備儲存控制器電源 A 故障

StorageGRID設備中的電源 A 偏離了建議的工作電壓。

設備儲存控制器電源 B 故障

StorageGRID設備中的電源 B 偏離了建議的工作電壓。

設備儲存硬體監控服務停滯

監控儲存硬體狀態的服務已停滯。

家電貨架性能下降

儲存設備的儲存架中某個組件的狀態已降級。

電器溫度超過

已超出設備儲存控制器的標稱或最高溫度。

已移除電器溫度感測器

溫度感測器已被移除。

設備 UEFI 安全啟動錯誤

設備尚未安全啟動。

磁碟 I/O 非常慢

非常慢的磁碟 I/O 可能會影響網格效能。

偵測到儲存設備風扇故障

偵測到設備儲存控制器中的風扇單元有問題。

儲存設備儲存連接性降低

計算控制器和儲存控制器之間的一個或多個連接存在問題。

儲存設備無法存取

無法存取儲存設備。

審計和系統日誌警報

警報名稱 描述

審計日誌正在新增到記憶體佇列

節點無法將日誌傳送到本機系統日誌伺服器,且記憶體佇列已滿。

外部系統日誌伺服器轉送錯誤

節點無法將日誌轉送到外部系統日誌伺服器。

大型審計隊列

審計訊息的磁碟佇列已滿。如果不解決這個問題,S3 或 Swift 操作可能會失敗。

日誌正在新增到磁碟佇列

節點無法將日誌轉送到外部系統日誌伺服器,且磁碟佇列已滿。

儲存桶警報

警報名稱 描述

FabricPool儲存桶具有不受支援的儲存桶一致性設置

FabricPool儲存桶使用可用或強站點一致性級別,但不受支援。

FabricPool儲存桶具有不受支援的版本控制設置

FabricPool儲存桶已啟用版本控製或 S3 物件鎖定,但不受支援。

Cassandra 警報

警報名稱 描述

Cassandra 自動壓縮器錯誤

Cassandra 自動壓實機發生錯誤。

Cassandra 自動壓縮器指標已過時

描述 Cassandra 自動壓縮器的指標已經過時。

Cassandra 通訊錯誤

運行 Cassandra 服務的節點之間無法相互通訊。

Cassandra 壓縮過載

Cassandra 壓縮過程超載。

Cassandra 超大寫入錯誤

內部StorageGRID進程向 Cassandra 發送了過大的寫入請求。

Cassandra 修復指標已過期

描述 Cassandra 修復作業的指標已經過時。

Cassandra修復進展緩慢

Cassandra資料庫修復進度緩慢。

Cassandra 修復服務不可用

Cassandra 修復服務不可用。

Cassandra 表損壞

Cassandra 偵測到表損壞。如果偵測到表格損壞,Cassandra 會自動重新啟動。

雲端儲存池警報

警報名稱 描述

雲端儲存池連接錯誤

雲端儲存池的運作狀況檢查偵測到一個或多個新錯誤。

IAM Roles Anywhere 最終實體認證到期

IAM Roles Anywhere 最終實體憑證即將過期。

跨網格複製警報

警報名稱 描述

跨網格複製永久失敗

發生跨網格複製錯誤,需要使用者介入才能解決。

跨網格複製資源不可用

由於資源不可用,跨網格複製請求處於待處理狀態。

DHCP 警報

警報名稱 描述

DHCP 租約已過期

網路介面上的 DHCP 租約已過期。

DHCP 租約即將到期

網路介面上的 DHCP 租約即將到期。

DHCP 伺服器不可用

DHCP 伺服器不可用。

調試和追蹤警報

警報名稱 描述

調試效能影響

啟用調試模式時,系統效能可能會受到負面影響。

啟用追蹤配置

啟用追蹤配置時,系統效能可能會受到負面影響。

電子郵件和AutoSupport警報

警報名稱 描述

AutoSupport訊息發送失敗

最新的AutoSupport訊息發送失敗。

網域解析失敗

StorageGRID節點無法解析網域名稱。

電子郵件通知失敗

無法發送警報的電子郵件通知。

SNMP 通知錯誤

向陷阱目標發送 SNMP 通知通知時發生錯誤。

偵測到 SSH 或控制台登入

在過去 24 小時內,使用者已使用 Web 控制台或 SSH 登入。

擦除編碼 (EC) 警報

警報名稱 描述

EC 重新平衡失敗

EC 重新平衡程序已失敗或已停止。

EC修復失敗

EC 資料修復作業失敗或已停止。

EC修復停滯

EC 資料的修復工作已停滯。

擦除編碼片段驗證錯誤

已擦除編碼的片段無法再被驗證。損壞的碎片可能無法修復。

證書到期警報

警報名稱 描述

管理代理 CA 憑證過期

管理代理伺服器 CA 套件中的一個或多個憑證即將過期。

用戶端憑證過期

一個或多個客戶端憑證即將過期。

S3 和 Swift 的全域伺服器憑證到期

S3 和 Swift 的全球伺服器憑證即將過期。

負載平衡器端點憑證到期

一個或多個負載平衡器端點憑證即將過期。

管理介面的伺服器憑證過期

用於管理介面的伺服器憑證即將過期。

外部系統日誌 CA 憑證過期

用於簽署外部系統日誌伺服器憑證的憑證授權單位 (CA) 憑證即將過期。

外部系統日誌用戶端憑證過期

外部系統日誌伺服器的客戶端憑證即將過期。

外部系統日誌伺服器憑證過期

外部系統日誌伺服器提供的伺服器憑證即將過期。

電網警報

警報名稱 描述

電網 MTU 不匹配

網格網路介面(eth0)的 MTU 設定在網格中的不同節點之間存在顯著差異。

電網聯合警報

警報名稱 描述

電網聯合證書到期

一個或多個網格聯合證書即將過期。

電網聯合連線失敗

本地和遠端電網之間的電網聯合連接不起作用。

高使用率或高延遲警報

警報名稱 描述

Java 堆使用率高

Java 堆空間的使用率過高。

元資料查詢延遲高

Cassandra 元資料查詢的平均時間太長。

身分聯合警報

警報名稱 描述

身分聯合同步失敗

無法從身分來源同步聯合群組和使用者。

租戶身分聯合同步失敗

無法從租用戶配置的身份來源同步聯合群組和使用者。

資訊生命週期管理 (ILM) 警報

警報名稱 描述

ILM 安置無法實現

對於某些對象,無法實作 ILM 規則中的放置指令。

ILM 掃描率低

ILM 掃描速率設定為低於 100 個物件/秒。

金鑰管理伺服器 (KMS) 警報

警報名稱 描述

KMS CA 憑證過期

用於簽署金鑰管理伺服器 (KMS) 憑證的憑證授權單位 (CA) 憑證即將過期。

KMS 用戶端憑證過期

密鑰管理伺服器的客戶端憑證即將過期

KMS 配置載入失敗

密鑰管理伺服器的配置存在但載入失敗。

KMS 連線錯誤

設備節點無法連接到其網站的金鑰管理伺服器。

未找到 KMS 加密金鑰名稱

配置的金鑰管理伺服器沒有與提供的名稱相符的加密金鑰。

KMS 加密金鑰輪換失敗

所有裝置磁碟區已成功解密,但一個或多個磁碟區無法旋轉至最新金鑰。

未配置 KMS

此網站不存在密鑰管理伺服器。

KMS 金鑰解密裝置磁碟區失敗

無法使用目前 KMS 金鑰解密啟用了節點加密的裝置上一個或多個磁碟區。

KMS 伺服器憑證過期

金鑰管理伺服器(KMS)使用的伺服器憑證即將過期。

KMS 伺服器連線失敗

設備節點無法連接到其網站的金鑰管理伺服器群集中的一個或多個伺服器。

負載平衡器警報

警報名稱 描述

提升零請求負載平衡器連線數

與負載平衡器端點的連線斷開且未執行請求的百分比較高。

本地時鐘偏移警報

警報名稱 描述

本地時鐘時間偏移較大

本地時脈與網路時間協定 (NTP) 時間之間的偏差太大。

內存不足或空間不足警報

警報名稱 描述

審計日誌磁碟容量低

審計日誌的可用空間不足。如果不解決這個問題,S3 或 Swift 操作可能會失敗。

可用節點記憶體不足

節點上可用的 RAM 數量較少。

儲存池可用空間不足

儲存節點中可用於儲存物件資料的空間較少。

安裝節點記憶體不足

節點上安裝的記憶體量較低。

低元數據存儲

可用於儲存物件元資料的空間較少。

低指標磁碟容量

指標資料庫的可用空間不足。

低對象資料存儲

可用於儲存物件資料的空間較少。

低唯讀浮水印覆蓋

儲存卷軟唯讀浮水印覆蓋小於儲存節點的最小最佳化浮水印。

根磁碟容量低

根磁碟上的可用空間不足。

系統資料容量低

/var/local 的可用空間不足。如果不解決這個問題,S3 或 Swift 操作可能會失敗。

tmp 目錄可用空間不足

/tmp 目錄中的可用空間不足。

節點或節點網路警報

警報名稱 描述

管理網路接收使用情況

管理網路上的接收使用率很高。

管理網路傳輸使用情況

管理網路上的傳輸使用率很高。

防火牆配置失敗

無法套用防火牆配置。

管理介面端點處於回退模式

所有管理介面端點都已恢復到預設連接埠太久。

節點網路連線錯誤

在節點之間傳輸資料時發生錯誤。

節點網路接收訊框錯誤

節點接收到的網路訊框中有很大一部分存在錯誤。

節點與 NTP 伺服器不同步

此節點與網路時間協定 (NTP) 伺服器不同步。

節點未透過 NTP 伺服器鎖定

此節點未鎖定至網路時間協定 (NTP) 伺服器。

非設備節點網路故障

一個或多個網路設備發生故障或斷開連線。

管理網路上的服務設備連結斷開

設備到管理網路 (eth1) 的介面已關閉或中斷連線。

管理網路連接埠 1 上的服務設備連結斷開

裝置上的管理網路連接埠 1 已關閉或中斷連線。

用戶端網路上的服務設備連結斷開

裝置到客戶端網路 (eth2) 的介面已關閉或中斷連線。

網路連接埠 1 上的服務設備連結已斷開

裝置上的網路連接埠 1 已關閉或中斷連線。

網路連接埠 2 上的服務設備連結已斷開

裝置上的網路連接埠 2 已關閉或中斷連線。

網路連接埠 3 上的服務設備連結已斷開

裝置上的網路連接埠 3 已關閉或中斷連線。

網路連接埠 4 上的服務設備連結已斷開

裝置上的網路連接埠 4 已關閉或中斷連線。

管理網路上的儲存設備連結斷開

設備到管理網路 (eth1) 的介面已關閉或中斷連線。

管理網路連接埠 1 上的儲存設備連結斷開

裝置上的管理網路連接埠 1 已關閉或中斷連線。

用戶端網路上的儲存設備連結斷開

裝置到客戶端網路 (eth2) 的介面已關閉或中斷連線。

儲存設備在網路連接埠 1 上連結斷開

裝置上的網路連接埠 1 已關閉或中斷連線。

網路連接埠 2 上的儲存設備連結已斷開

裝置上的網路連接埠 2 已關閉或中斷連線。

網路連接埠 3 上的儲存設備連結已斷開

裝置上的網路連接埠 3 已關閉或中斷連線。

網路連接埠 4 上的儲存設備連結已斷開

裝置上的網路連接埠 4 已關閉或中斷連線。

儲存節點未處於所需儲存狀態

由於內部錯誤或磁碟區相關問題,儲存節點上的 LDR 服務無法轉換到所需狀態

TCP 連線使用情況

此節點上的 TCP 連線數已接近可追蹤的最大數量。

無法與節點通信

一個或多個服務無回應,或無法存取節點。

節點意外重啟

過去 24 小時內,一個節點意外重啟。

對象警報

警報名稱 描述

物件存在性檢查失敗

物件存在性檢查作業失敗。

物件存在性檢查停滯

物件存在性檢查作業已停滯。

物品遺失

網格中遺失了一個或多個物件。

S3 PUT 物件大小太大

客戶端正在嘗試執行超出 S3 大小限制的 PUT 物件操作。

偵測到不明損壞物體

在複製物件儲存中發現一個無法辨識為複製物件的檔案。

平台服務警報

警報名稱 描述

平台服務待處理請求容量低

平台服務待處理的請求數量已接近容量上限。

平台服務不可用

在站點中運行或可用的具有 RSM 服務的儲存節點太少。

存儲量警報

警報名稱 描述

需要注意存儲量

儲存卷處於離線狀態,需要注意。

儲存磁碟區需要恢復

儲存卷已恢復,需要恢復。

儲存卷離線

儲存磁碟區已離線超過 5 分鐘。

嘗試重新掛載儲存磁碟區

儲存磁碟區處於離線狀態並觸發自動重新掛載。這可能表示驅動器問題或檔案系統錯誤。

磁碟區復原無法啟動複製資料修復

無法自動啟動已修復磁碟區的複製資料修復。

StorageGRID服務警報

警報名稱 描述

nginx 服務使用備份配置

nginx服務的設定無效。現在正在使用先前的配置。

nginx-gw 服務使用備份配置

nginx-gw 服務的設定無效。現在正在使用先前的配置。

禁用 FIPS 需要重新啟動

安全性原則不需要 FIPS 模式,但啟用了NetApp加密安全模組。

需要重新啟動才能啟用 FIPS

安全性原則需要 FIPS 模式,但NetApp加密安全模組已停用。

使用備份配置的 SSH 服務

SSH服務配置無效。現在正在使用先前的配置。

租戶警報

警報名稱 描述

租戶配額使用率高

配額空間的使用百分比很高。此規則預設已停用,因為它可能會導致過多的通知。