よく使用される Prometheus 指標
管理ノードの Prometheus サービスは、すべてのノード上のサービスから時系列の指標を収集します。Prometheus は 1 、 000 件以上の指標を収集しますが、 StorageGRID の最も重要な処理を監視するために必要な指標は比較的少数です。
指標は、 Prometheus データ用にリザーブされたスペースがフルになるまで各管理ノードに保存されます。/var/local/mysql_ibdata/` のボリュームが容量に達すると、最も古いメトリックが最初に削除されます。
すべての指標の一覧を取得するには、グリッド管理 API を使用します。
-
Grid Manager の上部からヘルプアイコンを選択し、 * API ドキュメント * を選択します。
-
指標 * 処理を探します。
-
GET /grid/metric-names オペレーションを実行します。
-
結果をダウンロードします。
次の表に、最もよく使用される Prometheus 指標を示します。このリストを参照して、デフォルトのアラートルールの条件を把握したり、カスタムのアラートルールの条件を作成したりできます。
名前に private が含まれる指標は内部専用です。 StorageGRID のリリースごとに予告なく変更されることがあります。 |
Prometheus 指標 | 説明 |
---|---|
alertmanager_notifications_failed_total |
失敗したアラート通知の総数。 |
Node_filesystem_avail_bytes です |
root 以外のユーザが使用できるファイルシステムスペースのバイト数。 |
node_memory_MemAvailable_bytes |
Memory information (メモリ情報)フィールド MemAvailable_bytes 。 |
Node_network_carrier |
/sys/class/net/<iface> のキャリア値。 |
Node_network_receate_errs_total |
ネットワークデバイスの統計受信エラー。 |
Node_network_transmit_errs_total |
ネットワークデバイス統計 transmit_errs 。 |
storagegrid_administrative_down |
想定内の理由でノードがグリッドに接続されていません。たとえば、ノードまたはノード上のサービスが正常にシャットダウンされた、ノードがリブート中である、ソフトウェアのアップグレード中であるなどの原因が考えられます。 |
storagegrid_apply_compute_controller_hardware_status |
アプライアンスのコンピューティングコントローラハードウェアのステータス。 |
storagegrid_apply_failed_disks を指定します |
アプライアンス内のストレージコントローラの、最適な状態でないドライブの数。 |
storagegrid_apply_storage_controller_hardware_status |
アプライアンス内のストレージコントローラハードウェアの全体的なステータス。 |
storagegrid_content_bbuckets_or_containers |
このストレージノードによって認識されている S3 バケットと Swift コンテナの総数。 |
storagegrid_content_objects を参照してください |
このストレージノードによって認識されている S3 および Swift データオブジェクトの総数。S3 または Swift 経由でシステムとやり取りするクライアントアプリケーションで作成されたデータオブジェクトのみが対象です。 |
storagegrid_content_objects_lost |
StorageGRID システムに存在しないことが検出されたオブジェクトの合計数。損失の原因 を特定し、リカバリが可能かどうかを確認する必要があります。 |
storagegrid_http_session_ining_attempted 」というメッセージが表示されます |
ストレージノードに対して試行された HTTP セッションの総数。 |
storagegrid_http_session_ining_currently established |
ストレージノード上で現在アクティブな(開いている) HTTP セッションの数。 |
storagegrid_http_session_ining_failed |
不正な形式の HTTP 要求または処理中のエラーが原因で、正常に完了しなかった HTTP セッションの総数。 |
storagegrid_http_session_ining_successful |
正常に完了した HTTP セッションの総数。 |
storagegrid_ilm_Awaiting _background_objects |
スキャンによる ILM に評価を待機しているこのノード上のオブジェクトの合計数です。 |
storagegrid_ilm_Awaiting _client_evaluation_objects_per_second |
このノードで ILM ポリシーに照らしてオブジェクトが評価されている現在の速度です。 |
storagegrid_ilm_Awaiting _client_objects |
クライアント処理(取り込みなど)の ILM に評価を待機しているこのノード上のオブジェクトの合計数です。 |
storagegrid_ilm_Awaiting _total_objects |
ILM 評価を待っているオブジェクトの合計数です。 |
storagegrid_ilm_scan_objects_per_second |
このノードが所有するオブジェクトが ILM 用にスキャンされてキューに登録される速度です。 |
storagegrid_ilm_scan_periodEstimated _ minutes ( StorageGRID _ ILM _ スキャン期間 _ 推定 _ 分) |
このノードで ILM のフルスキャンが完了するまでの推定時間です。
|
storagegrid_load-balancer _endpoint_cert_expiry_time |
エポックからのロードバランサエンドポイント証明書の有効期限(秒数)。 |
storagegrid_meta_query_average _latency _milliseconds |
このサービスを使用してメタデータストアに対してクエリを実行するのに必要な平均時間。 |
storagegrid_network_received_bytes |
インストール後に受信したデータの総容量。 |
storagegrid_network_transmitted _bytes |
インストール後に送信されたデータの総容量。 |
storagegrid_node_name |
使用可能な CPU 時間のうち、このサービスが現在使用している割合。サービスのビジー状態を示します。使用可能な CPU 時間は、サーバの CPU 数によって異なります。 |
storagegrid_ntp_Chosen_time_source_offset_milliseconds |
選択した時間ソースによって提供される体系的な時間オフセット。オフセットは、時間ソースに到達するまでの遅延が、時間ソースが NTP クライアントに到達するために必要な時間と等しくない場合に適用されます。 |
storagegrid_ntp_locked |
ノードがネットワークタイムプロトコル( NTP )サーバにロックされていません。 |
storagegrid_s3_data_transfers _bytes_取り込み 済み |
属性の前回リセット後に S3 クライアントからこのストレージノードに取り込まれたデータの総容量。 |
storagegrid_s3_data_transfers bytes Retrieved 」のように表示されます |
属性の前回リセット後に S3 クライアントがこのストレージノードから読み出したデータの総容量。 |
storagegrid_s3_operations_failed 」というエラーが表示されます |
失敗した S3 処理( HTTP ステータスコード 4xx と 5xx )の総数。 S3 の認証エラーが原因のものは除きます。 |
storagegrid_s3_operations_successful |
成功した S3 処理( HTTP ステータスコード 2xx )の総数。 |
storagegrid_s3_operations_unauthorized |
認証エラーが原因で失敗した S3 処理の総数。 |
storagegrid_servercertificate_management_interface_cert_expiry_days のように指定します |
管理インターフェイス証明書が期限切れになるまでの日数。 |
storagegrid_servercertificate_storage_api_endpoints_cert_expiry_days のように指定します |
オブジェクトストレージ API 証明書が期限切れになるまでの日数。 |
storagegrid_service_cpu_seconds で指定します |
インストール後にこのサービスが CPU を使用した時間の累計。 |
storagegrid_service_memory_usage_bytes |
このサービスが現在使用しているメモリ( RAM )の容量。この値は、 Linux の top ユーティリティで RES として表示される値と同じです。 |
storagegrid_service_network_received_bytes |
インストール後にこのサービスが受信したデータの総容量。 |
storagegrid_service_network_transmitted バイト数 |
このサービスから送信されたデータの総容量。 |
storagegrid_service_restarts |
サービスが再起動された回数。 |
storagegrid_service_runtime_seconds |
インストール後にサービスが実行されていた合計時間。 |
storagegrid_service_uptime</1> を指定します |
前回のサービス再起動以降にサービスが実行されていた時間の合計。 |
storagegrid_storage_state_current |
ストレージサービスの現在の状態。属性値は次のとおりです。
|
storagegrid_storage_status のように指定します |
ストレージサービスの現在のステータス。属性値は次のとおりです。
|
storagegrid_storage_utilization_bytes |
ストレージノード上のレプリケートオブジェクトデータとイレイジャーコーディングオブジェクトデータの推定合計サイズ。 |
storagegrid_storage_utilization_meta_allowed_bytes |
オブジェクトメタデータに使用できる各ストレージノードのボリューム 0 上の合計スペース。この値は、ノードでメタデータ用にリザーブされている実際のスペースよりも常に小さくなります。これは、重要なデータベース処理(コンパクションや修復など)や将来のハードウェアおよびソフトウェアのアップグレードに必要なリザーブスペースの一部が必要なためです。オブジェクトメタデータ用の許可スペースは、オブジェクトの全体的な容量を制御します。 |
storagegrid_storage_utilization_metadata_bytes |
ストレージボリューム 0 上のオブジェクトメタデータのバイト数。 |
storagegrid_storage_utilization_total_space_bytes |
すべてのオブジェクトストアに割り当てられているストレージスペースの総容量。 |
storagegrid_storage_utilization_usable_space_bytes |
オブジェクトストレージスペースの残り容量。ストレージノード上のすべてのオブジェクトストアの使用可能スペースを合計して算出されます。 |
storagegrid_swify_data_transfers _bytes_取り込み 済み |
属性の前回リセット以降にこのストレージノードに取り込まれたデータの総容量。 |
storagegrid_wift_data_transfers _byts_retrieved |
属性の前回リセット後に Swift クライアントがこのストレージノードから読み出したデータの総容量。 |
storagegrid_swift_operations_failed 」というエラーが発生しました |
失敗した Swift 処理( HTTP ステータスコード 4xx と 5xx )の総数。 Swift の認証エラーが原因のものは除きます。 |
storagegrid_swift_operations_successful |
成功した Swift 処理( HTTP ステータスコード 2xx )の総数。 |
storagegrid_swift_operations_unauthorized |
認証エラーが原因で失敗した Swift 処理( HTTP ステータスコード 401 、 403 、 405 )の総数。 |
storagegrid_stenantUsagedata_bytes |
テナントのすべてのオブジェクトの論理サイズ。 |
storagegrid_stenantUsageobject_count |
テナントのオブジェクトの数。 |
storagegrid_tenant_dusation_QUOTA_bytes |
テナントのオブジェクトに使用できる論理スペースの最大容量。クォータ指標を指定しない場合、使用可能なスペースは無制限です。 |