日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

よく使用される Prometheus 指標

寄稿者

管理ノードの Prometheus サービスは、すべてのノード上のサービスから時系列の指標を収集します。Prometheus は 1 、 000 件以上の指標を収集しますが、 StorageGRID の最も重要な処理を監視するために必要な指標は比較的少数です。

指標は、 Prometheus データ用にリザーブされたスペースがフルになるまで各管理ノードに保存されます。/var/local/mysql_ibdata/` のボリュームが容量に達すると、最も古いメトリックが最初に削除されます。

すべての指標の一覧を取得するには、グリッド管理 API を使用します。

  1. Grid Manager の上部からヘルプアイコンを選択し、 * API ドキュメント * を選択します。

  2. 指標 * 処理を探します。

  3. GET /grid/metric-names オペレーションを実行します。

  4. 結果をダウンロードします。

次の表に、最もよく使用される Prometheus 指標を示します。このリストを参照して、デフォルトのアラートルールの条件を把握したり、カスタムのアラートルールの条件を作成したりできます。

注記 名前に private が含まれる指標は内部専用です。 StorageGRID のリリースごとに予告なく変更されることがあります。
Prometheus 指標 説明

alertmanager_notifications_failed_total

失敗したアラート通知の総数。

Node_filesystem_avail_bytes です

root 以外のユーザが使用できるファイルシステムスペースのバイト数。

node_memory_MemAvailable_bytes

Memory information (メモリ情報)フィールド MemAvailable_bytes 。

Node_network_carrier

/sys/class/net/<iface> のキャリア値。

Node_network_receate_errs_total

ネットワークデバイスの統計受信エラー。

Node_network_transmit_errs_total

ネットワークデバイス統計 transmit_errs 。

storagegrid_administrative_down

想定内の理由でノードがグリッドに接続されていません。たとえば、ノードまたはノード上のサービスが正常にシャットダウンされた、ノードがリブート中である、ソフトウェアのアップグレード中であるなどの原因が考えられます。

storagegrid_apply_compute_controller_hardware_status

アプライアンスのコンピューティングコントローラハードウェアのステータス。

storagegrid_apply_failed_disks を指定します

アプライアンス内のストレージコントローラの、最適な状態でないドライブの数。

storagegrid_apply_storage_controller_hardware_status

アプライアンス内のストレージコントローラハードウェアの全体的なステータス。

storagegrid_content_bbuckets_or_containers

このストレージノードによって認識されている S3 バケットと Swift コンテナの総数。

storagegrid_content_objects を参照してください

このストレージノードによって認識されている S3 および Swift データオブジェクトの総数。S3 または Swift 経由でシステムとやり取りするクライアントアプリケーションで作成されたデータオブジェクトのみが対象です。

storagegrid_content_objects_lost

StorageGRID システムに存在しないことが検出されたオブジェクトの合計数。損失の原因 を特定し、リカバリが可能かどうかを確認する必要があります。

storagegrid_http_session_ining_attempted 」というメッセージが表示されます

ストレージノードに対して試行された HTTP セッションの総数。

storagegrid_http_session_ining_currently established

ストレージノード上で現在アクティブな(開いている) HTTP セッションの数。

storagegrid_http_session_ining_failed

不正な形式の HTTP 要求または処理中のエラーが原因で、正常に完了しなかった HTTP セッションの総数。

storagegrid_http_session_ining_successful

正常に完了した HTTP セッションの総数。

storagegrid_ilm_Awaiting _background_objects

スキャンによる ILM に評価を待機しているこのノード上のオブジェクトの合計数です。

storagegrid_ilm_Awaiting _client_evaluation_objects_per_second

このノードで ILM ポリシーに照らしてオブジェクトが評価されている現在の速度です。

storagegrid_ilm_Awaiting _client_objects

クライアント処理(取り込みなど)の ILM に評価を待機しているこのノード上のオブジェクトの合計数です。

storagegrid_ilm_Awaiting _total_objects

ILM 評価を待っているオブジェクトの合計数です。

storagegrid_ilm_scan_objects_per_second

このノードが所有するオブジェクトが ILM 用にスキャンされてキューに登録される速度です。

storagegrid_ilm_scan_periodEstimated _ minutes ( StorageGRID _ ILM _ スキャン期間 _ 推定 _ 分)

このノードで ILM のフルスキャンが完了するまでの推定時間です。

  • 注: * フルスキャンは、このノードが所有するすべてのオブジェクトに ILM が適用されたことを保証するものではありません。

storagegrid_load-balancer _endpoint_cert_expiry_time

エポックからのロードバランサエンドポイント証明書の有効期限(秒数)。

storagegrid_meta_query_average _latency _milliseconds

このサービスを使用してメタデータストアに対してクエリを実行するのに必要な平均時間。

storagegrid_network_received_bytes

インストール後に受信したデータの総容量。

storagegrid_network_transmitted _bytes

インストール後に送信されたデータの総容量。

storagegrid_node_name

使用可能な CPU 時間のうち、このサービスが現在使用している割合。サービスのビジー状態を示します。使用可能な CPU 時間は、サーバの CPU 数によって異なります。

storagegrid_ntp_Chosen_time_source_offset_milliseconds

選択した時間ソースによって提供される体系的な時間オフセット。オフセットは、時間ソースに到達するまでの遅延が、時間ソースが NTP クライアントに到達するために必要な時間と等しくない場合に適用されます。

storagegrid_ntp_locked

ノードがネットワークタイムプロトコル( NTP )サーバにロックされていません。

storagegrid_s3_data_transfers _bytes_取り込み 済み

属性の前回リセット後に S3 クライアントからこのストレージノードに取り込まれたデータの総容量。

storagegrid_s3_data_transfers bytes Retrieved 」のように表示されます

属性の前回リセット後に S3 クライアントがこのストレージノードから読み出したデータの総容量。

storagegrid_s3_operations_failed 」というエラーが表示されます

失敗した S3 処理( HTTP ステータスコード 4xx と 5xx )の総数。 S3 の認証エラーが原因のものは除きます。

storagegrid_s3_operations_successful

成功した S3 処理( HTTP ステータスコード 2xx )の総数。

storagegrid_s3_operations_unauthorized

認証エラーが原因で失敗した S3 処理の総数。

storagegrid_servercertificate_management_interface_cert_expiry_days のように指定します

管理インターフェイス証明書が期限切れになるまでの日数。

storagegrid_servercertificate_storage_api_endpoints_cert_expiry_days のように指定します

オブジェクトストレージ API 証明書が期限切れになるまでの日数。

storagegrid_service_cpu_seconds で指定します

インストール後にこのサービスが CPU を使用した時間の累計。

storagegrid_service_memory_usage_bytes

このサービスが現在使用しているメモリ( RAM )の容量。この値は、 Linux の top ユーティリティで RES として表示される値と同じです。

storagegrid_service_network_received_bytes

インストール後にこのサービスが受信したデータの総容量。

storagegrid_service_network_transmitted バイト数

このサービスから送信されたデータの総容量。

storagegrid_service_restarts

サービスが再起動された回数。

storagegrid_service_runtime_seconds

インストール後にサービスが実行されていた合計時間。

storagegrid_service_uptime</1> を指定します

前回のサービス再起動以降にサービスが実行されていた時間の合計。

storagegrid_storage_state_current

ストレージサービスの現在の状態。属性値は次のとおりです。

  • 10 = オフライン

  • 15 = メンテナンス

  • 20 = 読み取り専用

  • 30 = オンライン

storagegrid_storage_status のように指定します

ストレージサービスの現在のステータス。属性値は次のとおりです。

  • 0 = エラーなし

  • 10 = 移行中

  • 20 = 空きスペースが不足しています

  • 30 = ボリュームを使用できません

  • 40= エラー

storagegrid_storage_utilization_metadata_bytes

ストレージノード上のレプリケートオブジェクトデータとイレイジャーコーディングオブジェクトデータの推定合計サイズ。

storagegrid_storage_utilization_meta_allowed_bytes

オブジェクトメタデータに使用できる各ストレージノードのボリューム 0 上の合計スペース。この値は、ノードでメタデータ用にリザーブされている実際のスペースよりも常に小さくなります。これは、重要なデータベース処理(コンパクションや修復など)や将来のハードウェアおよびソフトウェアのアップグレードに必要なリザーブスペースの一部が必要なためです。オブジェクトメタデータ用の許可スペースは、オブジェクトの全体的な容量を制御します。

storagegrid_storage_utilization_metadata_bytes

ストレージボリューム 0 上のオブジェクトメタデータのバイト数。

storagegrid_storage_utilization_total_space_bytes

すべてのオブジェクトストアに割り当てられているストレージスペースの総容量。

storagegrid_storage_utilization_usable_space_bytes

オブジェクトストレージスペースの残り容量。ストレージノード上のすべてのオブジェクトストアの使用可能スペースを合計して算出されます。

storagegrid_swify_data_transfers _bytes_取り込み 済み

属性の前回リセット以降にこのストレージノードに取り込まれたデータの総容量。

storagegrid_wift_data_transfers _byts_retrieved

属性の前回リセット後に Swift クライアントがこのストレージノードから読み出したデータの総容量。

storagegrid_swift_operations_failed 」というエラーが発生しました

失敗した Swift 処理( HTTP ステータスコード 4xx と 5xx )の総数。 Swift の認証エラーが原因のものは除きます。

storagegrid_swift_operations_successful

成功した Swift 処理( HTTP ステータスコード 2xx )の総数。

storagegrid_swift_operations_unauthorized

認証エラーが原因で失敗した Swift 処理( HTTP ステータスコード 401 、 403 、 405 )の総数。

storagegrid_stenantUsagedata_bytes

テナントのすべてのオブジェクトの論理サイズ。

storagegrid_stenantUsageobject_count

テナントのオブジェクトの数。

storagegrid_tenant_dusation_QUOTA_bytes

テナントのオブジェクトに使用できる論理スペースの最大容量。クォータ指標を指定しない場合、使用可能なスペースは無制限です。