警示參考資料
下表列出所有預設StorageGRID 的資訊提示。您可以視需要建立自訂警示規則、以符合系統管理方法。
請參閱相關資訊 常用的Prometheus指標 以瞭解這些警示中使用的度量。
警示名稱 | 說明與建議行動 | ||
---|---|---|---|
應用裝置電池已過期 |
應用裝置儲存控制器中的電池已過期。
|
||
應用裝置電池故障 |
應用裝置儲存控制器中的電池故障。
|
||
應用裝置電池記憶體容量不足 |
應用裝置儲存控制器中的電池記憶容量不足。
|
||
應用裝置電池即將過期 |
產品儲存控制器中的電池即將過期。
|
||
已取出應用裝置電池 |
產品儲存控制器中的電池遺失。
|
||
應用裝置電池過熱 |
產品儲存控制器中的電池過熱。
|
||
應用裝置BMC通訊錯誤 |
與基板管理控制器(BMC)的通訊中斷。
|
||
應用裝置快取備份裝置故障 |
持續快取備份裝置故障。
|
||
應用裝置快取備份裝置容量不足 |
快取備份裝置容量不足。 聯絡技術支援。 |
||
應用裝置快取備份裝置具有寫入保護 |
快取備份裝置具有寫入保護。 聯絡技術支援。 |
||
應用裝置快取記憶體大小不相符 |
應用裝置中的兩個控制器具有不同的快取大小。 聯絡技術支援。 |
||
應用裝置運算控制器機箱溫度過高 |
在一個應用不支援的應用環境中、StorageGRID 運算控制器的溫度已超過一個標稱臨界值。
|
||
應用裝置運算控制器CPU溫度過高 |
在一個應用程式中、運算控制器中的CPU溫度StorageGRID 已超過正常臨界值。
|
||
應用裝置運算控制器需要注意 |
在應用程式的運算控制器中偵測到硬體故障StorageGRID 。
|
||
應用裝置運算控制器電源供應器A發生問題 |
運算控制器中的電源供應器A發生問題。此警示可能表示電源供應器故障或提供電源時發生問題。
|
||
應用裝置運算控制器電源供應器B發生問題 |
運算控制器的電源供應器B發生問題。 此警示可能表示電源供應器故障、或是供電時發生問題。
|
||
應用裝置運算硬體監控服務停止 |
監控儲存硬體狀態的服務已停止報告資料。
|
||
偵測到應用裝置光纖通道故障 |
偵測到應用裝置儲存控制器與運算控制器之間的光纖通道連結問題。 此警示可能表示應用裝置中的儲存設備與運算控制器之間的光纖通道連線發生問題。
|
||
應用裝置Fibre Channel HBA連接埠故障 |
Fibre Channel HBA連接埠故障或故障。 聯絡技術支援。 |
||
應用裝置快閃快取磁碟機非最佳化 |
用於SSD快取的磁碟機並非最佳。
|
||
已移除應用裝置互連/電池箱 |
互連/電池箱遺失。
|
||
設備LACP連接埠遺失 |
一個連接埠StorageGRID 位於一個不屬於LACP連結的應用裝置上。
|
||
應用裝置整體電源供應器降級 |
不推薦的操作電壓已偏離了產品的功能StorageGRID 。
|
||
應用裝置儲存控制器A故障 |
儲存控制器A StorageGRID 在一個應用程式中故障。
|
||
應用裝置儲存控制器B故障 |
無法在應用程式中使用StorageGRID 儲存控制器B。
|
||
應用裝置儲存控制器磁碟機故障 |
一個或多個StorageGRID 驅動器在一個應用程式中故障或不是最佳的。
|
||
應用裝置儲存控制器硬體問題 |
該軟件報告說某個元件「需要注意」在一個應用程式中。SANtricity StorageGRID
|
||
應用裝置儲存控制器電源供應器故障 |
供應器A StorageGRID 的電源供應器已偏離建議的操作電壓。
|
||
應用裝置儲存控制器電源供應器B故障 |
供應器B StorageGRID 的電源供應器已偏離建議的操作電壓。
|
||
應用裝置儲存硬體監控服務停止 |
監控儲存硬體狀態的服務已停止報告資料。
|
||
應用裝置儲存櫃降級 |
儲存設備儲存櫃中其中一個元件的狀態會降級。
|
||
應用裝置溫度超過上限 |
產品儲存控制器的名義或最高溫度已超過上限。
|
||
已移除應用裝置溫度感測器 |
已移除溫度感測器。聯絡技術支援。 |
||
Cassandra自動執行元件錯誤 |
Cassandra自動執行元件發生錯誤。 Cassandra自動執行元件存在於所有儲存節點上、可管理Cassandra資料庫的大小、以覆寫及刪除繁重的工作負載。雖然這種情況持續存在、但某些工作負載將會意外感受到中繼資料使用量過高的情況。
|
||
稽核記錄正在新增至記憶體內的佇列 |
節點無法將記錄傳送至本機syslog伺服器、而且記憶體內的佇列已滿。
|
||
Cassandra自動執行元件度量資料已過期 |
介紹Cassandra自動執行元件的指標已過時。 Cassandra自動執行元件存在於所有儲存節點上、可管理Cassandra資料庫的大小、以覆寫及刪除繁重的工作負載。雖然此警示持續存在、但某些工作負載會意外地感受到中繼資料使用量過高的情況。
|
||
Cassandra通訊錯誤 |
執行Cassandra服務的節點無法彼此通訊。 此警示表示某個項目正在干擾節點對節點的通訊。可能發生網路問題、或一個或多個儲存節點上的Cassandra服務可能已關閉。
|
||
Cassandra相容性過載 |
Cassandra壓縮程序過載。 如果壓實程序過載、讀取效能可能會降級、RAM可能會被佔用。Cassandra服務也可能變得無回應或當機。
|
||
Cassandra修復指標已過期 |
說明Cassandra修復工作的指標已過時。如果此情況持續超過48小時、客戶查詢(例如庫存清單)可能會顯示刪除的資料。
|
||
Cassandra修復進度緩慢 |
Cassandra資料庫修復的進度緩慢。 資料庫修復速度緩慢時、Cassandra資料一致性作業會受到阻礙。如果此情況持續超過48小時、客戶查詢(例如庫存清單)可能會顯示刪除的資料。
|
||
Cassandra修復服務無法使用 |
Cassandra修復服務無法使用。 Cassandra修復服務存在於所有儲存節點上、並為Cassandra資料庫提供重要的修復功能。如果此情況持續超過48小時、客戶查詢(例如庫存清單)可能會顯示刪除的資料。
|
||
Cassandra表格毀損 |
Cassandra偵測到表格毀損。 如果Cassandra偵測到表格毀損、就會自動重新啟動。 聯絡技術支援。 |
||
雲端儲存資源池連線錯誤 |
Cloud Storage Pool的健全狀況檢查偵測到一或多個新錯誤。
|
||
DHCP租用已過期 |
網路介面上的DHCP租用已過期。如果DHCP租用已過期、請遵循建議的行動:
|
||
DHCP租約即將到期 |
網路介面上的DHCP租用即將到期。 若要防止DHCP租用到期、請遵循建議的動作:
|
||
DHCP伺服器無法使用 |
DHCP伺服器無法使用。 此節點無法聯絡您的DHCP伺服器StorageGRID 。無法驗證節點IP位址的DHCP租用。
|
||
磁碟I/O非常緩慢 |
磁碟I/O速度非常慢、可能會影響StorageGRID 到效能不佳。
*附註:*受影響的節點可能會停用服務並自行重新開機、以避免影響整體網格效能。當清除基礎條件、且這些節點偵測到正常I/O效能時、它們會自動返回完整服務。 |
||
EC重新平衡故障 |
使用者在儲存節點之間重新平衡銷毀編碼資料的工作失敗或已暫停。
|
||
EC修復失敗 |
銷毀編碼資料的修復工作失敗或已停止。
|
||
EC修復停止 |
銷毀編碼資料的修復工作已停止。
|
||
電子郵件通知失敗 |
無法傳送警示的電子郵件通知。 當警示電子郵件通知失敗或測試電子郵件(從*警示*>*電子郵件設定*頁面傳送)無法傳送時、就會觸發此警示。
|
||
在「憑證」頁面上設定的用戶端憑證過期 |
在「憑證」頁面上設定的一或多個用戶端憑證即將過期。
|
||
負載平衡器端點憑證過期 |
一個或多個負載平衡器端點憑證即將過期。
如需管理負載平衡器端點的詳細資訊、請參閱 關於管理StorageGRID 功能的說明。 |
||
管理介面的伺服器憑證過期 |
用於管理介面的伺服器憑證即將過期。
|
||
S3和Swift API的全域伺服器憑證過期 |
用於存取儲存API端點的伺服器憑證即將過期。
|
||
外部syslog CA憑證過期 |
用於簽署外部syslog伺服器憑證的憑證授權單位(CA)憑證即將過期。
|
||
外部syslog用戶端憑證過期 |
外部syslog伺服器的用戶端憑證即將過期。
|
||
外部syslog伺服器憑證過期 |
外部syslog伺服器提供的伺服器憑證即將過期。
|
||
外部syslog伺服器轉送錯誤 |
節點無法將記錄轉送至外部syslog伺服器。
|
||
Grid Network MTU不符 |
網格網路介面(eth0)的最大傳輸單元(MTU)設定、在網格的各個節點之間會有顯著差異。 MTU設定的差異可能代表部分(但並非全部)eth0網路已設定為使用巨型框架。MTU大小不相符的值大於1000、可能會導致網路效能問題。 請參閱中的Grid Network MTU不相符警示說明 疑難排解網路、硬體及平台問題。 |
||
高Java堆使用率 |
正在使用大量的Java堆空間。 如果Java堆填滿、中繼資料服務可能無法使用、用戶端要求可能會失敗。
|
||
中繼資料查詢的高延遲 |
Cassandra中繼資料查詢的平均時間過長。 查詢延遲增加可能是因為硬體變更所致、例如更換磁碟、工作負載變更(例如突然增加擷取)、或是網路變更(例如節點與站台之間的通訊問題)。
|
||
身分識別聯盟同步失敗 |
無法同步處理來自身分識別來源的聯盟群組和使用者。
|
||
租戶的身分識別聯盟同步處理失敗 |
無法從租戶設定的身分識別來源同步處理聯盟群組和使用者。
|
||
ILM放置無法實現 |
ILM規則中的放置指示無法針對特定物件執行。 此警示表示放置指示所需的節點無法使用、或ILM規則設定錯誤。例如、規則可能會指定比儲存節點更多的複寫複本。
*附註:*此警示可能會在升級期間出現、升級成功完成後可能會持續一天。當升級觸發此警示時、系統會自行清除。 |
||
ILM掃描期間過長 |
掃描、評估物件及套用ILM所需的時間太長。 如果完成所有物件完整ILM掃描的預估時間過長(請參閱儀表板上的*掃描期間-預估*)、則使用中的ILM原則可能不會套用至新擷取的物件。ILM原則的變更可能不會套用至現有的物件。
|
||
ILM掃描率過低 |
ILM掃描速率設定為每秒不到100個物件。 此警示表示有人已將系統的ILM掃描速率變更為每秒不到100個物件(預設值:每秒400個物件)。使用中的ILM原則可能不會套用至新擷取的物件。後續的ILM原則變更將不會套用至現有物件。
|
||
KMS CA憑證過期 |
用於簽署金鑰管理伺服器(KMS)憑證的憑證授權單位(CA)憑證即將過期。
|
||
KMS用戶端憑證過期 |
金鑰管理伺服器的用戶端憑證即將過期。
|
||
無法載入kms組態 |
金鑰管理伺服器的組態存在、但無法載入。
|
||
KMS連線錯誤 |
應用裝置節點無法連線至其站台的金鑰管理伺服器。
|
||
找不到kms加密金鑰名稱 |
設定的金鑰管理伺服器沒有符合所提供名稱的加密金鑰。
|
||
KMS加密金鑰旋轉失敗 |
所有應用裝置磁碟區都已解密、但一個或多個磁碟區無法旋轉至最新的金鑰。請聯絡技術支援部門。 |
||
未設定公里 |
|||
KMS金鑰無法解密應用裝置磁碟區 |
裝置上啟用節點加密的一或多個磁碟區無法使用目前的KMS金鑰解密。
|
||
KMS伺服器憑證過期 |
|||
大型稽核佇列 |
稽核訊息的磁碟佇列已滿。
|
||
偵測到舊版CLB負載平衡器活動 |
有些用戶端可能會使用預設的S3和Swift API憑證連線至已過時的CLB負載平衡器服務。
其他活動可能會觸發此警示、包括連接埠掃描。若要判斷目前是否正在使用已過時的CLB服務、請檢視「儲存格RID_Private、CLB_http、connection_ested_Successful」Prometheus度量。 必要時、如果不再使用CLB服務、請將此警示規則設為靜音或停用。 |
||
正在將記錄新增至磁碟上佇列 |
節點無法將記錄轉送至外部syslog伺服器、而且磁碟上的佇列已滿。
|
||
稽核記錄磁碟容量過低 |
稽核記錄可用空間不足。
|
||
可用節點記憶體不足 |
節點上可用的RAM量很低。 低可用RAM可能表示工作負載發生變更、或是一個或多個節點發生記憶體洩漏。
|
||
儲存資源池可用空間不足 |
儲存資源池中儲存物件資料的可用空間量很低。
|
||
安裝的節點記憶體不足 |
節點上安裝的記憶體容量過低。 增加虛擬機器或Linux主機可用的RAM量。檢查主要警示的臨界值、以判斷StorageGRID 預設的支援節點最低需求。請參閱您平台的安裝說明: |
||
低中繼資料儲存 |
用於儲存物件中繼資料的空間不足。 重大警示
重大警示 立即在擴充程序中新增儲存節點。 次要警示
新增儲存節點之後、系統會自動在所有儲存節點之間重新平衡物件中繼資料、並清除警示。 請參閱中的低中繼資料儲存警示指示 疑難排解中繼資料問題。 |
||
低度量磁碟容量 |
度量資料庫可用空間不足。
|
||
低物件資料儲存 |
|||
低唯讀浮水印會置換 |
儲存Volume軟式唯讀浮點覆寫低於儲存節點的最佳化浮點下限。 若要瞭解如何解決此警示、請前往 疑難排解低唯讀浮水印會覆寫警示。 |
||
低根磁碟容量 |
根磁碟可用空間不足。
|
||
低系統資料容量 |
在「/var/local'」檔案系統上、可供資料不全的空間StorageGRID 不足。
|
||
低溫度目錄可用空間 |
/tmp目錄中的可用空間不足。
|
||
節點網路連線錯誤 |
|||
節點網路接收框架錯誤 |
節點接收到的網路框架有很大比例發生錯誤。 此警示可能表示硬體問題、例如乙太網路連線任一端的纜線不良或收發器故障。
|
||
節點未與NTP伺服器同步 |
節點的時間與網路時間傳輸協定(NTP)伺服器不同步。
|
||
節點未被NTP伺服器鎖定 |
節點未鎖定至網路時間傳輸協定(NTP)伺服器。
|
||
非應用裝置節點網路中斷 |
一或多個網路裝置當機或中斷連線。此警示表示無法存取安裝在虛擬機器或Linux主機上之節點的網路介面(eth)。 聯絡技術支援。 |
||
物件存在檢查失敗 |
|||
物件存在檢查停止 |
物件存在檢查工作已停止。 物件存在檢查工作無法繼續。工作中包含的一或多個儲存節點或磁碟區已離線或無回應、或是由於太多節點關閉或無法使用、所選的一致性控制無法再滿足。
|
||
物件遺失 |
一個或多個物件已從網格中遺失。 此警示可能表示資料已永久遺失、無法擷取。
|
||
平台服務無法使用 |
有太少的儲存節點與站台上正在執行或可用的RSM服務。 請確定受影響站台擁有RSM服務的大部分儲存節點都在執行中、且處於非錯誤狀態。 請參閱中的「疑難排解平台服務」 關於管理StorageGRID 功能的說明。 |
||
S3將物件大小設得太大 |
S3用戶端嘗試執行的「放置物件」作業超過S3大小限制。
|
||
管理網路連接埠1上的服務應用裝置連結中斷 |
應用裝置上的管理網路連接埠1已關閉或中斷連線。
|
||
管理網路(或用戶端網路)上的服務應用裝置連結 |
管理網路(eth1)或用戶端網路(eth2)的應用裝置介面關閉或中斷連線。
|
||
服務應用裝置會在網路連接埠1、2、3或4上向下連結 |
裝置上的網路連接埠1、2、3或4已關閉或中斷連線。
|
||
服務應用裝置儲存連線能力降級 |
服務應用裝置中的兩個SSD之一發生故障或無法與另一個SSD同步。 應用裝置功能不受影響、但您應立即解決此問題。如果兩個磁碟機都故障、裝置將無法再運作。
|
||
儲存應用裝置連結至管理網路連接埠1 |
應用裝置上的管理網路連接埠1已關閉或中斷連線。
|
||
管理網路(或用戶端網路)上的儲存應用裝置連結中斷 |
管理網路(eth1)或用戶端網路(eth2)的應用裝置介面關閉或中斷連線。
|
||
儲存應用裝置會在網路連接埠1、2、3或4上向下連結 |
裝置上的網路連接埠1、2、3或4已關閉或中斷連線。
|
||
儲存應用裝置儲存設備連線能力降級 |
運算控制器與儲存控制器之間的一或多個連線發生問題。
|
||
儲存設備無法存取 |
無法存取儲存設備。 此警示表示由於基礎儲存設備發生問題、所以無法掛載或存取磁碟區。
|
||
租戶配額使用量高 |
使用的租戶配額空間百分比很高。如果租戶超過配額、新的擷取便會遭到拒絕。 *注意:*此警示規則預設為停用、因為它可能會產生許多通知。
|
||
無法與節點通訊 |
|||
非預期的節點重新開機 |
節點在過去24小時內意外重新開機。
|
||
偵測到不明毀損的物件 |
在複寫的物件儲存設備中找到無法識別為複寫物件的檔案。
|