本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

疑難排解平台服務

貢獻者

平台服務中使用的端點是由租戶使用者在租戶管理程式中建立和維護、但是、如果租戶在設定或使用平台服務時遇到問題、您可能可以使用Grid Manager來協助解決問題。

新端點的問題

租戶必須先使用租戶管理程式建立一或多個端點、才能使用平台服務。每個端點都代表一個平台服務的外部目的地、例如StorageGRID 一個支援對象、一個支援Amazon Web Services的資源庫、一個簡單通知服務主題、或是在本機或AWS上代管的Elasticsearch叢集。每個端點都包括外部資源的位置、以及存取該資源所需的認證資料。

當租戶建立端點時StorageGRID 、此驗證系統會驗證端點是否存在、以及是否可以使用指定的認證來達到端點。端點的連線會從每個站台的一個節點驗證。

如果端點驗證失敗、會出現錯誤訊息、說明端點驗證失敗的原因。租戶使用者應解決此問題、然後再次嘗試建立端點。

附註 如果未啟用租戶帳戶的平台服務、端點建立將會失敗。

現有端點的問題

如果在嘗試連線至現有端點時發生錯誤StorageGRID 、則會在浮動授權管理員的儀表板上顯示一則訊息。

儀表板上的端點錯誤訊息

租戶使用者可前往「端點」頁面、檢閱每個端點的最新錯誤訊息、並判斷錯誤發生時間多久前。「最後一個錯誤」欄會顯示每個端點的最新錯誤訊息、並指出錯誤發生時間已多久。包括的錯誤 紅色X圖示 過去7天內出現圖示。

顯示「上次錯誤」欄的「端點」頁面的快照
附註 *最後一個錯誤*欄中的某些錯誤訊息可能會在括弧中包含一個記錄ID。網格管理員或技術支援人員可以使用此ID、在bytcast記錄中找到更多有關錯誤的詳細資訊。

與Proxy伺服器相關的問題

如果您已在儲存節點和平台服務端點之間設定儲存Proxy、則當Proxy服務不允許StorageGRID 來自該端點的訊息時、可能會發生錯誤。若要解決這些問題、請檢查Proxy伺服器的設定、確保平台服務相關訊息不會遭到封鎖。

確定是否發生錯誤

如果在過去7天內發生任何端點錯誤、則租戶管理程式中的儀表板會顯示警示訊息。您可以前往「端點」頁面、查看更多錯誤的詳細資料。

用戶端作業失敗

某些平台服務問題可能會導致S3儲存區上的用戶端作業失敗。例如、如果內部複寫狀態機器(RSM)服務停止、或是有太多平台服務訊息排入佇列等待傳送、S3用戶端作業就會失敗。

若要檢查服務狀態:

  1. 選取*支援*>*工具*>*網格拓撲*。

  2. 選擇「站台_>*儲存節點_*>* SUS*>*服務*」。

可恢復和不可恢復的端點錯誤

建立端點之後、平台服務要求可能會因為各種原因而發生錯誤。使用者介入可恢復部分錯誤。例如、可能會發生可恢復的錯誤、原因如下:

  • 使用者的認證資料已刪除或過期。

  • 目的地庫位不存在。

  • 無法傳送通知。

如果遇到可恢復的錯誤、平台服務要求將會重試、直到成功為止。StorageGRID

其他錯誤無法恢復。例如、如果刪除端點、就會發生無法恢復的錯誤。

如果遇到不可恢復的端點錯誤、則會在Grid Manager中觸發Total Event(SMT)舊版警示。StorageGRID若要檢視「事件總數」老舊警示:

  1. 選取*支援*>*工具*>*網格拓撲*。

  2. 選擇*站台_*>*節點_*>* SUS*>*事件*。

  3. 檢視表格頂端的「上次事件」。

    事件訊息也會列在「/var/local/log/bycast-err.log」中。

  4. 請遵循SMTT警示內容中提供的指引來修正問題。

  5. 選取*組態*索引標籤以重設事件計數。

  6. 通知租戶其平台服務訊息尚未傳送的物件。

  7. 指示租戶透過更新物件的中繼資料或標記、重新觸發失敗的複寫或通知。

    租戶可以重新提交現有的值、以避免進行不必要的變更。

無法傳送平台服務訊息

如果目的地遇到問題、導致無法接受平台服務訊息、用戶端在儲存庫上的操作就會成功、但平台服務訊息卻無法傳送。例如、如果目的地上的認證資料已更新、StorageGRID 導致無法再驗證目的地服務、就可能發生此錯誤。

如果由於無法恢復的錯誤而無法傳送平台服務訊息、則會在Grid Manager中觸發Total Event(SMT)舊版警示。

平台服務要求的效能變慢

如果傳送要求的速度超過目的地端點接收要求的速度、則支援使用此軟體來限制傳入S3的貯體要求。StorageGRID節流只會在有待傳送至目的地端點的要求待處理項目時發生。

唯一的可見效果是傳入S3要求執行時間較長。如果您開始偵測到效能大幅降低、應該降低擷取速度、或是使用容量較大的端點。如果要求的待處理項目持續增加、用戶端S3作業(例如PUT要求)最終將會失敗。

CloudMirror要求較容易受到目的地端點效能的影響、因為這些要求通常比搜尋整合或事件通知要求涉及更多資料傳輸。

平台服務要求失敗

若要檢視平台服務的要求失敗率:

  1. 選擇*節點*。

  2. 選擇「站台_>*平台服務*」。

  3. 檢視「要求錯誤率」圖表。

    節點頁面站台層級平台服務

平台服務無法使用警示

*平台服務無法使用*警示表示站台無法執行平台服務作業、因為有太少的儲存節點正在執行或可用、因此無法在站台上執行平台服務作業。

此RSM服務可確保平台服務要求會傳送至各自的端點。

若要解決此警示、請判斷站台上的哪些儲存節點包含了RSM服務。(同時包含ADC服務的儲存節點上會有此RSM服務。) 然後、請確保大部分的儲存節點都在執行中且可供使用。

附註 如果站台上有多個包含RSM服務的儲存節點故障、您就會遺失該站台的任何擱置中平台服務要求。

平台服務端點的其他疑難排解指南

如需平台服務端點疑難排解的其他資訊、請參閱的說明 使用租戶帳戶