警示參考資料
此參考會列出出現在 Grid Manager 中的預設警示。建議的動作會顯示在您收到的警示訊息中。
您可以視需要建立自訂警示規則、以符合系統管理方法。
部分預設警示會使用 "Prometheus指標"。
應用裝置警示
警示名稱 | 說明 |
---|---|
應用裝置電池已過期 |
應用裝置儲存控制器中的電池已過期。 |
應用裝置電池故障 |
應用裝置儲存控制器中的電池故障。 |
應用裝置電池記憶體容量不足 |
應用裝置儲存控制器中的電池記憶容量不足。 |
應用裝置電池即將過期 |
產品儲存控制器中的電池即將過期。 |
已取出應用裝置電池 |
產品儲存控制器中的電池遺失。 |
應用裝置電池過熱 |
產品儲存控制器中的電池過熱。 |
應用裝置BMC通訊錯誤 |
與基板管理控制器(BMC)的通訊中斷。 |
應用裝置快取備份裝置故障 |
持續快取備份裝置故障。 |
應用裝置快取備份裝置容量不足 |
快取備份裝置容量不足。 |
應用裝置快取備份裝置具有寫入保護 |
快取備份裝置具有寫入保護。 |
應用裝置快取記憶體大小不相符 |
應用裝置中的兩個控制器具有不同的快取大小。 |
應用裝置運算控制器機箱溫度過高 |
在一個應用不支援的應用環境中、StorageGRID 運算控制器的溫度已超過一個標稱臨界值。 |
應用裝置運算控制器CPU溫度過高 |
在一個應用程式中、運算控制器中的CPU溫度StorageGRID 已超過正常臨界值。 |
應用裝置運算控制器需要注意 |
在應用程式的運算控制器中偵測到硬體故障StorageGRID 。 |
應用裝置運算控制器電源供應器A發生問題 |
運算控制器中的電源供應器 A 發生問題。 |
應用裝置運算控制器電源供應器B發生問題 |
運算控制器的電源供應器B發生問題。 |
應用裝置運算硬體監控服務停止 |
監控儲存硬體狀態的服務已停止。 |
偵測到設備 DAS 磁碟機故障 |
偵測到設備中的直接附加儲存( DAS )磁碟機有問題。 |
設備 DAS 磁碟機重建 |
直接附加儲存( DAS )磁碟機正在重建中。如果最近更換或移除 / 重新插入、則預期會出現此情況。 |
偵測到應用裝置風扇故障 |
偵測到產品中的風扇裝置有問題。 |
偵測到應用裝置光纖通道故障 |
偵測到應用裝置儲存控制器與運算控制器之間的光纖通道連結問題 |
應用裝置Fibre Channel HBA連接埠故障 |
Fibre Channel HBA連接埠故障或故障。 |
應用裝置快閃快取磁碟機非最佳化 |
用於SSD快取的磁碟機並非最佳。 |
已移除應用裝置互連/電池箱 |
互連/電池箱遺失。 |
設備LACP連接埠遺失 |
一個連接埠StorageGRID 位於一個不屬於LACP連結的應用裝置上。 |
偵測到應用裝置 NIC 故障 |
偵測到應用裝置中的網路介面卡( NIC )問題。 |
應用裝置整體電源供應器降級 |
不推薦的操作電壓已偏離了產品的功能StorageGRID 。 |
應用裝置 SSD 嚴重警告 |
應用裝置 SSD 回報嚴重警告。 |
應用裝置儲存控制器A故障 |
儲存控制器A StorageGRID 在一個應用程式中故障。 |
應用裝置儲存控制器B故障 |
無法在應用程式中使用StorageGRID 儲存控制器B。 |
應用裝置儲存控制器磁碟機故障 |
一個或多個StorageGRID 驅動器在一個應用程式中故障或不是最佳的。 |
應用裝置儲存控制器硬體問題 |
該軟件報告說某個元件「需要注意」在一個應用程式中。SANtricity StorageGRID |
應用裝置儲存控制器電源供應器故障 |
供應器A StorageGRID 的電源供應器已偏離建議的操作電壓。 |
應用裝置儲存控制器電源供應器B故障 |
供應器B StorageGRID 的電源供應器已偏離建議的操作電壓。 |
應用裝置儲存硬體監控服務停止 |
監控儲存硬體狀態的服務已停止。 |
應用裝置儲存櫃降級 |
儲存設備儲存櫃中其中一個元件的狀態會降級。 |
應用裝置溫度超過上限 |
產品儲存控制器的名義或最高溫度已超過上限。 |
已移除應用裝置溫度感測器 |
已移除溫度感測器。 |
磁碟I/O非常緩慢 |
非常緩慢的磁碟 I/O 可能會影響網格效能。 |
偵測到儲存設備風扇故障 |
偵測到產品儲存控制器中的風扇單元有問題。 |
儲存應用裝置儲存設備連線能力降級 |
運算控制器與儲存控制器之間的一或多個連線發生問題。 |
儲存設備無法存取 |
無法存取儲存裝置。 |
稽核與系統記錄警示
警示名稱 | 說明 |
---|---|
稽核記錄正在新增至記憶體內的佇列 |
節點無法將記錄傳送至本機 Syslog 伺服器、而且記憶體內佇列已滿。 |
外部syslog伺服器轉送錯誤 |
節點無法將記錄轉送至外部 Syslog 伺服器。 |
大型稽核佇列 |
稽核訊息的磁碟佇列已滿。如果未解決此問題、 S3 或 Swift 作業可能會失敗。 |
正在將記錄新增至磁碟上佇列 |
節點無法將記錄轉送至外部 Syslog 伺服器、而且磁碟上的佇列已滿。 |
貯體警示
警示名稱 | 說明 |
---|---|
FabricPool 貯體具有不受支援的貯體一致性設定 |
FabricPool 貯體使用不支援的可用一致性層級。 |
Cassandra 警示
警示名稱 | 說明 |
---|---|
Cassandra自動執行元件錯誤 |
Cassandra自動執行元件發生錯誤。 |
Cassandra自動執行元件度量資料已過期 |
介紹Cassandra自動執行元件的指標已過時。 |
Cassandra通訊錯誤 |
執行Cassandra服務的節點無法彼此通訊。 |
Cassandra相容性過載 |
Cassandra壓縮程序過載。 |
Cassandra 超大寫入錯誤 |
內部 StorageGRID 程序傳送寫入要求給 Cassandra 、要求太大。 |
Cassandra修復指標已過期 |
說明Cassandra修復工作的指標已過時。 |
Cassandra修復進度緩慢 |
Cassandra資料庫修復的進度緩慢。 |
Cassandra修復服務無法使用 |
Cassandra修復服務無法使用。 |
Cassandra表格毀損 |
Cassandra偵測到表格毀損。如果Cassandra偵測到表格毀損、就會自動重新啟動。 |
已停用改善的讀取可用度 |
如果停用改善的讀取可用度、則當儲存節點無法使用時、 GET 和 HEAD 要求可能會失敗。 |
雲端儲存池警示
警示名稱 | 說明 |
---|---|
雲端儲存資源池連線錯誤 |
Cloud Storage Pool的健全狀況檢查偵測到一或多個新錯誤。 |
跨網格複寫警示
警示名稱 | 說明 |
---|---|
跨網格複寫永久失敗 |
發生跨網格複寫錯誤、需要使用者介入才能解決。 |
無法使用跨網格複寫資源 |
由於資源無法使用、因此跨網格複寫要求擱置中。 |
DHCP 警示
警示名稱 | 說明 |
---|---|
DHCP租用已過期 |
網路介面上的DHCP租用已過期。 |
DHCP租約即將到期 |
網路介面上的DHCP租用即將到期。 |
DHCP伺服器無法使用 |
DHCP伺服器無法使用。 |
偵錯與追蹤警示
警示名稱 | 說明 |
---|---|
偵錯效能影響 |
啟用偵錯模式時、系統效能可能會受到負面影響。 |
追蹤組態已啟用 |
啟用追蹤組態時、系統效能可能會受到負面影響。 |
電子郵件和 AutoSupport 警示
警示名稱 | 說明 |
---|---|
AutoSupport 訊息無法傳送 |
最近的 AutoSupport 訊息無法傳送。 |
電子郵件通知失敗 |
無法傳送警示的電子郵件通知。 |
銷毀編碼( EC )警示
警示名稱 | 說明 |
---|---|
EC重新平衡故障 |
EC 重新平衡程序失敗或已停止。 |
EC修復失敗 |
EC 資料的修復工作已失敗或已停止。 |
EC修復停止 |
EC 資料的修復工作已停止。 |
憑證警示過期
警示名稱 | 說明 |
---|---|
用戶端憑證過期 |
一或多個用戶端憑證即將過期。 |
S3 和 Swift 的全域伺服器憑證過期 |
S3 和 Swift 的全域伺服器憑證即將過期。 |
負載平衡器端點憑證過期 |
一個或多個負載平衡器端點憑證即將過期。 |
管理介面的伺服器憑證過期 |
用於管理介面的伺服器憑證即將過期。 |
外部syslog CA憑證過期 |
用於簽署外部syslog伺服器憑證的憑證授權單位(CA)憑證即將過期。 |
外部syslog用戶端憑證過期 |
外部syslog伺服器的用戶端憑證即將過期。 |
外部syslog伺服器憑證過期 |
外部syslog伺服器提供的伺服器憑證即將過期。 |
Grid Network 警示
警示名稱 | 說明 |
---|---|
Grid Network MTU不符 |
網格網路介面( eth0 )的 MTU 設定在網格中的各個節點之間有顯著差異。 |
網格同盟警示
警示名稱 | 說明 |
---|---|
Grid Federation 憑證過期 |
一或多個網格同盟憑證即將過期。 |
Grid Federation 連線失敗 |
本機和遠端網格之間的網格同盟連線無法運作。 |
高使用率或高延遲警示
警示名稱 | 說明 |
---|---|
高Java堆使用率 |
正在使用大量的Java堆空間。 |
中繼資料查詢的高延遲 |
Cassandra中繼資料查詢的平均時間過長。 |
身分識別聯盟警示
警示名稱 | 說明 |
---|---|
身分識別聯盟同步失敗 |
無法同步處理來自身分識別來源的聯盟群組和使用者。 |
租戶的身分識別聯盟同步處理失敗 |
無法從租戶設定的身分識別來源同步處理聯盟群組和使用者。 |
資訊生命週期管理( ILM )警示
警示名稱 | 說明 |
---|---|
ILM放置無法實現 |
某些物件無法在 ILM 規則中取得放置指示。 |
ILM掃描期間過長 |
掃描、評估及套用 ILM 至物件所需的時間過長。 |
ILM掃描率過低 |
ILM掃描速率設定為每秒不到100個物件。 |
金鑰管理伺服器( KMS )警示
警示名稱 | 說明 |
---|---|
KMS CA憑證過期 |
用於簽署金鑰管理伺服器(KMS)憑證的憑證授權單位(CA)憑證即將過期。 |
KMS用戶端憑證過期 |
金鑰管理伺服器的用戶端憑證即將過期 |
無法載入kms組態 |
金鑰管理伺服器的組態存在、但無法載入。 |
KMS連線錯誤 |
應用裝置節點無法連線至其站台的金鑰管理伺服器。 |
找不到kms加密金鑰名稱 |
設定的金鑰管理伺服器沒有符合所提供名稱的加密金鑰。 |
KMS加密金鑰旋轉失敗 |
已成功解密所有應用裝置磁碟區、但一個或多個磁碟區無法旋轉至最新的金鑰。 |
未設定公里 |
此站台不存在金鑰管理伺服器。 |
KMS金鑰無法解密應用裝置磁碟區 |
裝置上啟用節點加密的一或多個磁碟區無法使用目前的KMS金鑰解密。 |
KMS伺服器憑證過期 |
金鑰管理伺服器(KMS)所使用的伺服器憑證即將過期。 |
本機時鐘偏移警示
警示名稱 | 說明 |
---|---|
本機時鐘大時間偏移 |
本機時鐘與網路時間傳輸協定( NTP )時間之間的偏移量太大。 |
記憶體不足或空間不足警示
警示名稱 | 說明 |
---|---|
稽核記錄磁碟容量過低 |
稽核記錄可用空間不足。如果未解決此問題、 S3 或 Swift 作業可能會失敗。 |
可用節點記憶體不足 |
節點上可用的RAM量很低。 |
儲存資源池可用空間不足 |
儲存節點中可用於儲存物件資料的空間不足。 |
安裝的節點記憶體不足 |
節點上安裝的記憶體容量過低。 |
低中繼資料儲存 |
用於儲存物件中繼資料的空間不足。 |
低度量磁碟容量 |
度量資料庫可用空間不足。 |
低物件資料儲存 |
用於儲存物件資料的空間不足。 |
低唯讀浮水印會置換 |
儲存Volume軟式唯讀浮點覆寫低於儲存節點的最佳化浮點下限。 |
低根磁碟容量 |
根磁碟上的可用空間不足。 |
低系統資料容量 |
/var/local 掛載點上的 StorageGRID 系統資料可用空間不足。 |
低溫度目錄可用空間 |
/tmp目錄中的可用空間不足。 |
節點或節點網路警示
警示名稱 | 說明 |
---|---|
防火牆組態失敗 |
無法套用防火牆組態。 |
節點網路連線錯誤 |
在節點之間傳輸資料時發生錯誤。 |
節點網路接收框架錯誤 |
節點接收到的網路框架有很大比例發生錯誤。 |
節點未與NTP伺服器同步 |
節點未與網路時間傳輸協定( NTP )伺服器同步。 |
節點未被NTP伺服器鎖定 |
節點未鎖定至網路時間傳輸協定(NTP)伺服器。 |
非應用裝置節點網路中斷 |
一或多個網路裝置當機或中斷連線。 |
管理網路上的服務應用裝置連結中斷 |
管理網路( eth1 )的應用裝置介面已關閉或中斷連線。 |
管理網路連接埠1上的服務應用裝置連結中斷 |
應用裝置上的管理網路連接埠1已關閉或中斷連線。 |
客戶端網路上的服務應用裝置連結中斷 |
用戶端網路( eth2 )的應用裝置介面已關閉或中斷連線。 |
服務應用裝置在網路連接埠 1 上向下連結 |
裝置上的網路連接埠 1 已關閉或中斷連線。 |
服務應用裝置在網路連接埠 2 上連結中斷 |
裝置上的網路連接埠 2 已關閉或中斷連線。 |
服務應用裝置在網路連接埠 3 上連結中斷 |
裝置上的網路連接埠 3 已關閉或中斷連線。 |
服務應用裝置在網路連接埠 4 上中斷連結 |
裝置上的網路連接埠 4 已關閉或中斷連線。 |
管理網路上的儲存設備連結中斷 |
管理網路( eth1 )的應用裝置介面已關閉或中斷連線。 |
儲存應用裝置連結至管理網路連接埠1 |
應用裝置上的管理網路連接埠1已關閉或中斷連線。 |
儲存設備在用戶端網路上連結中斷 |
用戶端網路( eth2 )的應用裝置介面已關閉或中斷連線。 |
儲存設備在網路連接埠 1 上向下連結 |
裝置上的網路連接埠 1 已關閉或中斷連線。 |
儲存設備在網路連接埠 2 上向下連結 |
裝置上的網路連接埠 2 已關閉或中斷連線。 |
儲存設備在網路連接埠 3 上向下連結 |
裝置上的網路連接埠 3 已關閉或中斷連線。 |
儲存設備在網路連接埠 4 上向下連結 |
裝置上的網路連接埠 4 已關閉或中斷連線。 |
儲存節點未處於所需的儲存狀態 |
儲存節點上的 LDR 服務因為內部錯誤或磁碟區相關問題而無法轉換至所需的狀態 |
無法與節點通訊 |
一或多個服務沒有回應、或無法連線至節點。 |
非預期的節點重新開機 |
節點在過去24小時內意外重新開機。 |
物件警示
警示名稱 | 說明 |
---|---|
物件存在檢查失敗 |
物件存在檢查工作失敗。 |
物件存在檢查停止 |
物件存在檢查工作已停止。 |
物件遺失 |
一個或多個物件已從網格中遺失。 |
S3 將物件大小放得太大 |
用戶端嘗試的「放置物件」作業超過 S3 大小限制。 |
偵測到不明毀損的物件 |
在複寫的物件儲存設備中找到無法識別為複寫物件的檔案。 |
平台服務警示
警示名稱 | 說明 |
---|---|
平台服務無法使用 |
有太少的儲存節點與站台上正在執行或可用的RSM服務。 |
儲存磁碟區警示
警示名稱 | 說明 |
---|---|
儲存磁碟區需要注意 |
儲存磁碟區離線、需要注意。 |
儲存磁碟區需要還原 |
儲存磁碟區已恢復、需要還原。 |
儲存磁碟區離線 |
儲存磁碟區已離線超過 5 分鐘、可能是因為節點在磁碟區格式化步驟期間重新開機。 |
Volume 還原無法開始複寫資料修復 |
無法自動啟動已修復磁碟區的複寫資料修復。 |
StorageGRID 服務警示
警示名稱 | 說明 |
---|---|
使用備份組態的 Nginx 服務 |
Nginx 服務的組態無效。現在正在使用先前的組態。 |
使用備份組態的 Nginx) 服務 |
Nginx) 服務的組態無效。現在正在使用先前的組態。 |
使用備份組態的 SSH 服務 |
SSH 服務的組態無效。現在正在使用先前的組態。 |
租戶警示
警示名稱 | 說明 |
---|---|
租戶配額使用量高 |
使用的配額空間百分比很高。此規則預設為停用、因為它可能導致通知太多。 |