よく使用されるPrometheus指標

管理ノードのPrometheusサービスは、すべてのノード上のサービスから時系列の指標を収集します。Prometheusは1,000件以上の指標を収集しますが、StorageGRIDの最も重要な処理を監視するために必要な指標は比較的少数です。

次の表に、最もよく使用されるPrometheus指標と、各指標に対応する属性(アラーム システムで使用)を示します。

このリストを参考に、デフォルトのアラート ルールの条件を把握したり、カスタムのアラート ルールの条件を作成する際の参考にしてください。すべての指標のリストは、[Help] > [API Documentation]で確認できます。

注:名前に_private_が含まれる指標は内部専用で、StorageGRIDの次のリリースまでに予告なく変更されることがあります。
注:Prometheus指標の保存期間は31日です。
Prometheus指標 属性 説明
storagegrid_appliance_failed_disks BADD アプライアンス内のストレージ コントローラの、最適な状態でないドライブの数。
storagegrid_ilm_awaiting_background_objects BQUZ スキャンによるILMに評価を待機しているこのノード上のオブジェクトの合計数。
storagegrid_service_network_received_bytes BREC インストール後にこのサービスが受信したデータの総容量。
storagegrid_service_network_transmitted_bytes BTRA このサービスから送信されたデータの総容量。
storagegrid_storage_utilization_metadata_bytes CADL ストレージ ボリューム0上のオブジェクト メタデータの量(バイト)。
storagegrid_storage_utilization_metadata_allowed_bytes CEMS ストレージ ボリューム0でオブジェクト メタデータに使用できる合計スペース。Metadata Allowed Space(CEMS)は常にMetadata Reserved Space(CAWM)より小さくなります。これは、CAWMはその一部がコンパクションや修復などの重要なデータベース処理に必要となるためです。
storagegrid_metadata_queries_average_latency_milliseconds CQST このサービスからメタデータ ストアに対してクエリを実行するときの平均実行時間。
storagegrid_ilm_awaiting_client_objects CQUZ クライアント処理(取り込みなど)のILMに評価を待機しているこのノード上のオブジェクトの合計数。
storagegrid_ilm_awaiting_client_evaluation_objects_per_second EVRT このノードでILMポリシーに照らしてオブジェクトが評価されている現在の速度。
storagegrid_http_sessions_incoming_attempted HAIS ストレージ ノードに対して試行されたHTTPセッションの総数。
storagegrid_http_sessions_incoming_currently_established HCCS ストレージ ノード上で現在アクティブな(開いている)HTTPセッションの数。
storagegrid_http_sessions_incoming_failed HEIS 誤った形式のHTTP要求または処理実行中のエラーが原因で、正常に完了しなかったHTTPセッションの総数。
storagegrid_http_sessions_incoming_successful HISC 正常に完了したHTTPセッションの総数。
storagegrid_content_objects_lost LOST StorageGRIDシステムに存在しないことが検出されたオブジェクトの総数。
storagegrid_ntp_chosen_time_source_offset_milliseconds NTSO 選択された時間ソースが提供する体系的な時間オフセット。オフセットは、時間ソースに到達するまでの待機時間と、時間ソースがNTPクライアントに到達するために必要な時間が等しくない場合に適用されます。
storagegrid_ilm_awaiting_total_objects QUSZ ILM評価を待機しているオブジェクトの合計数。
storagegrid_service_restarts RSTS サービスが再起動された回数。
storagegrid_content_buckets_and_containers SBKC このストレージ ノードによって認識されているS3バケットとSwiftコンテナの総数。
storagegrid_ilm_scan_objects_per_second SCRT このノードが所有するオブジェクトがILM用にスキャンされてキューに登録される速度。
storagegrid_ilm_scan_period_estimated_minutes SCTM このノードでILMのフル スキャンが完了するまでの推定時間。
注:フル スキャンが完了しても、このノードが所有するすべてのオブジェクトにILMが適用されるとは限りません。
storagegrid_content_objects SDOC このストレージ ノードによって認識されているS3およびSwiftデータ オブジェクトの総数。S3またはSwift経由でシステムとやり取りするクライアント アプリケーションで作成されたデータ オブジェクトのみが対象です。
storagegrid_s3_operations_failed SFAL 失敗したS3処理(HTTPステータス コード4xxと5xx)の総数。S3の認証エラーが原因のものは除きます。
storagegrid_service_load SLOD 使用可能なCPU時間のうち、このサービスが現在使用している割合。サービスがどの程度ビジーであるかを示します。使用可能なCPU時間は、サーバに搭載されているCPUの数によって異なります。
storagegrid_service_memory_usage_bytes SMEM このサービスが現在使用しているメモリ(RAM)の容量。この値は、LinuxのtopユーティリティでRESとして表示される値と同じです。
storagegrid_storage_utilization_data_bytes SPSD ストレージ ノード上のレプリケート オブジェクト データとイレイジャー コーディング オブジェクト データの推定合計サイズ。
storagegrid_s3_data_transfers_bytes_ingested SRXB 属性の前回リセット後にS3クライアントからこのストレージ ノードに取り込まれたデータの総容量。
storagegrid_storage_state_current SSCR ストレージ サービスの現在の状態。次のいずれかです。
  • 10 = Offline
  • 15 = Maintenance
  • 20 = Read-only
  • 30 = Online
storagegrid_storage_status SSTS

ストレージ サービスの現在のステータス。次のいずれかです。

  • 0 = No Errors
  • 10 = In Transition
  • 20 = Insufficient Free Space
  • 30 = Volume(s) Unavailable
  • 40 = Error
storagegrid_s3_operations_successful SSUC 成功したS3処理(HTTPステータス コード2xx)の総数。
storagegrid_storage_utilization_usable_space_bytes STAS オブジェクト ストレージ スペースの残り容量。ストレージ ノード上のすべてのオブジェクト ストアの使用可能スペースを合計して算出されます。
storagegrid_storage_utilization_total_space_bytes STTS すべてのオブジェクト ストアに割り当てられているストレージ スペースの総容量。
storagegrid_s3_data_transfers_bytes_retrieved STXB 属性の前回リセット後にS3クライアントがこのストレージ ノードから読み出したデータの総容量。
storagegrid_s3_operations_unauthorized SUAU 認証エラーが原因で失敗したS3処理の総数。
storagegrid_service_cpu_seconds SUTM インストール後にこのサービスがCPUを使用した時間の累計。
storagegrid_service_runtime_seconds SVRT インストール後にサービスが実行された時間の合計。
storagegrid_service_uptime_seconds SVUT 前回のサービス再起動からの実行時間の合計。
storagegrid_network_received_bytes TRXB インストール後に受信したデータの総容量。
storagegrid_network_transmitted_bytes TTXB インストール後に送信されたデータの総容量。
storagegrid_swift_operations_failed WFAL 失敗したSwift処理(HTTPステータス コード4xxと5xx)の総数。Swiftの認証エラーが原因のものは除きます。
storagegrid_swift_data_transfers_bytes_ingested WRXB 属性の前回リセット以降にこのストレージ ノードに取り込まれたデータの総容量。
storagegrid_swift_operations_successful WSUC 成功したSwift処理(HTTPステータス コード2xx)の総数。
storagegrid_swift_data_transfers_bytes_retrieved WTXB 属性の前回リセット以降にSwiftクライアントがこのストレージ ノードから読み出したデータの総容量。
storagegrid_swift_operations_unauthorized WUAU 認証エラーが原因で失敗したSwift処理(HTTPステータス コード401、403、405)の総数。