Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

Hadoop Data Collector

共同作成者

Cloud Insights は、このデータコレクタを使用して Hadoop からの指標を収集します。

インストール

  1. [Observability]>[Collectors]で、+ Data Collector *をクリックします。Hadoopを選択します。

    Tegraf エージェントがインストールされているオペレーティングシステムまたはプラットフォームを選択します。

  2. Agent for Collection をまだインストールしていない場合、または別のオペレーティングシステムまたはプラットフォームに Agent をインストールする場合は、 Show Instructions をクリックしてを展開します "エージェントのインストール" 手順

  3. このデータコレクタで使用するエージェントアクセスキーを選択します。[+Agent Access Key] ボタンをクリックすると、新しいエージェントアクセスキーを追加できます。ベストプラクティス:別のエージェントアクセスキーを使用するのは、たとえば OS/ プラットフォーム別にデータコレクタをグループ化する場合だけです。

  4. 設定手順に従ってデータコレクタを設定します。手順は、データの収集に使用するオペレーティングシステムまたはプラットフォームのタイプによって異なります。

Hadoop 構成
Hadoop 構成

セットアップ( Setup )

Hadoop を完全に導入するには、次のコンポーネントが必要です。

  • NameNode : Hadoop 分散型ファイルシステム( HDFS )プライマリシステム。一連の DataNode を調整します。

  • セカンダリ NameNode :メイン NameNode のウォームフェイルオーバー。Hadoop では、 NameNode への昇格は自動的には行われません。セカンダリ NameNode は、必要に応じてプロモート可能な状態にするために、 NameNode から情報を収集します。

  • DataNode :データの実際の所有者。

  • ResourceManager :コンピューティングのプライマリシステム( yarn )。一連の NodeManager を調整します。

  • NodeManager :コンピューティング用のリソース。アプリケーションを実行するための実際の場所。

  • JobHistoryServer :ジョブ履歴に関連するすべての要求の処理を担当します。

Hadoop プラグインは、テレグラムの Jolokia プラグインに基づいています。すべての Hadoop コンポーネントから情報を収集するための要件など、 JMX はすべてのコンポーネントで Jolokia 経由で設定および公開する必要があります。

互換性

構成は Hadoop バージョン 2.9.2 に対して開発されました。

セットアップ中です

Jolokia エージェント JAR

個々のコンポーネントについては、 Jolokia エージェント jar ファイルのバージョンをダウンロードする必要があります。テスト対象のバージョンは、でした "Jolokia 代理店 1.6.0"

以下の手順では、ダウンロードした jar ファイル( jolokia-jvm-1.6.0-agent.jar )が「 /opt/hadoop /lib/' 」の下に配置されると想定しています。

NameNode

Jolokia API が公開されるように NameNode を設定するには、 <hadoop home>/etc/hadoop /hadoop -env.sh で次のセットアップを行います。

export HADOOP_NAMENODE_OPTS="$HADOOP_NAMENODE_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7800,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8000 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8000 above) and Jolokia (7800). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

セカンダリ NameNode

セカンダリ NameNode で Jolokia API を公開するように設定するには、 <hadoop home>/etc/hadoop /hadoop -env.sh で次のように設定します。

export HADOOP_SECONDARYNAMENODE_OPTS="$HADOOP_SECONDARYNAMENODE_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7802,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8002 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8002 above) and Jolokia (7802). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

DataNode

Jolokia API が公開されるように DataNode を設定するには、 <hopp_home>/etc/hadoop /hadoop -env.sh に以下のセットアップを行います。

export HADOOP_DATANODE_OPTS="$HADOOP_DATANODE_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7801,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8001 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8001 above) and Jolokia (7801). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

ResourceManager の略

ResourceManager で Jolokia API を公開するように設定するには、 <hadoop HOME>//etc/hadoop /hadoop -env.sh で次の設定を行うことができます。

export YARN_RESOURCEMANAGER_OPTS="$YARN_RESOURCEMANAGER_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7803,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8003 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8003 above) and Jolokia (7803). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

NodeManager

Jolokia API を公開するように NodeManager を設定するには、 <hadoop home>/etc/hadoop /hadoop -env.sh で次の設定を行うことができます。

export YARN_NODEMANAGER_OPTS="$YARN_NODEMANAGER_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7804,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8004 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8004 above) and Jolokia (7804). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

JobHistoryServer

JobHistoryServer で Jolokia API を公開するように設定するには、 <hadoop home>/etc/hadoop /hadoop -env.sh で次の設定を行うことができます。

export HADOOP_JOB_HISTORYSERVER_OPTS="$HADOOP_JOB_HISTORYSERVER_OPTS -javaagent:/opt/hadoop/lib/jolokia-jvm-1.6.0-agent.jar=port=7805,host=0.0.0.0 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=8005 -Dcom.sun.management.jmxremote.password.file=$HADOOP_HOME/conf/jmxremote.password"
You can choose a different port for JMX (8005 above) and Jolokia (7805). If you have an internal IP to lock Jolokia onto you can replace the "catch all" 0.0.0.0 by your own IP. Notice this IP needs to be accessible from the telegraf plugin. You can use the option '-Dcom.sun.management.jmxremote.authenticate=false' if you don't want to authenticate. Use at your own risk.

オブジェクトとカウンタ

次のオブジェクトとそのカウンタが収集されます。

オブジェクト: 識別子: 属性: 「 dataPoints 」:

Hadoop セカンダリ NameNode

クラスタ
ネームスペース
サーバ

ノード名
ノードIP
コンパイル情報
バージョン

GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

Hadoop ノードマネージャ

クラスタ
ネームスペース
サーバ

ノード名
ノードIP

割り当て済みのコンテナ
メモリ割り当て
Memory Allocated Oportunisticの略
仮想コア割り当てオポチュニスティック
仮想コアが割り当てられました
使用可能なメモリ
使用可能な仮想コア
ディレクトリがローカルではありません
ディレクトリの不正なログ
クリーニング前のキャッシュサイズ
コンテナ起動時間平均時間
Container Launch Duration Number of Operations(コンテナ起動時間)
コンテナが完了しました
コンテナが失敗しました
コンテナの初期化
コンテナを強制終了します
コンテナをリリース
コンテナの再構築
障害発生時にコンテナがロールバックされました
実行中のコンテナ
ディスク使用率が良好なローカルディレクトリ
Disk Utilization Good Log Directoriesの略
バイトがプライベート削除されました
Bytes Deleted Public
コンテナはOpportunityを実行しています
削除されたバイト数の合計
接続をシャッフルします
出力バイトをシャッフルします
出力のシャッフルに失敗しました
シャッフル出力OK
GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

Hadoop ResourceManager

クラスタ
ネームスペース
サーバ

ノード名
ノードIP

ApplicationMaster起動遅延平均
ApplicationMaster起動遅延番号
ApplicationMaster登録遅延平均
ApplicationMaster Register Delay Numberの略
NodeManagerアクティブ番号
NodeManagerの運用停止番号
NodeManagerの運用停止番号
NodeManagerの番号が失われました
NodeManagerがリブートしました
NodeManagerシャットダウン番号
NodeManagerの正常な番号
NodeManagerのメモリ制限
NodeManager仮想コア数の制限
使用済み容量
アクティブアプリケーション
アクティブユーザー
割り当て済みアグリゲートコンテナ
アグリゲートコンテナがプリエンプトされました
アグリゲートコンテナが解放されました
アグリゲートメモリの秒数がプリエンプトされました
割り当て済みアグリゲートノードのローカルコンテナ
アグリゲートオフスイッチコンテナの割り当て済み
アグリゲートのAckローカルコンテナの割り当て済み容量
アグリゲート仮想コア(秒)がプリエンプトされました
割り当て済みのコンテナ
割り当てられたメモリ
仮想コアが割り当てられました
アプリケーション試行の最初のコンテナ割り当て遅延平均時間
Application Attempt First Container Allocation Delay Numberの略
アプリケーションが完了しました
アプリケーションに失敗しました
アプリケーションが停止しました
アプリケーションが保留中です
実行中のアプリケーション
提出された申請書
使用可能なメモリ
使用可能な仮想コア
保留中のコンテナ
メモリが保留中です
仮想コアが保留中です
Containers Reserved.
メモリ予約済み
仮想コア予約済み
使用されているMemory ApplicationMaster
Virtual Cores ApplicationMasterが使用されています
使用済み容量
GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

Hadoop DataNode

クラスタ
ネームスペース
サーバ

ノード名
ノードIP
クラスタID
バージョン

トランシーバ数
送信が進行中です
キャッシュ容量
使用されているキャッシュ
容量
使用されるDFS
推定損失合計容量
前回のボリューム障害率
キャッシュされた番号をブロックする
ブロック番号のキャッシュに失敗しました
ブロック番号のキャッシュ解除に失敗しました
ボリューム番号に失敗しました
残り容量
GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

Hadoop NameNode

クラスタ
ネームスペース
サーバ

ノード名
ノードIP
最後に書き込まれたトランザクションID
最後にロードされた編集からの時間
HAの状態
File System Stateの略
ブロックプールID
クラスタID
コンパイル情報
個別のバージョン数
バージョン

ブロック容量
合計ブロック数
合計容量
使用済み容量
Capacity Used Non DFSの略
ブロックが壊れています
推定損失合計容量
超過をブロックします
ハートビートの期限が切れました
ファイル合計
File System Lock Queue Lengthの略
ブロックが見つかりません
第1因子のレプリケーションが欠落しているブロック
クライアントがアクティブです
データノードが故障しています
稼働を停止しているデータノードが故障しています
ライブを運用停止するデータノード
データノードの運用停止
暗号化ゾーン番号
データノードがメンテナンスに移行しています
作成中のファイル
メンテナンス中のデータノードが停止しました
データノードはメンテナンス中です
Data Nodes Liveの略
ストレージが古い
レプリケーション保留タイムアウト
データノードメッセージが保留中です
削除を保留中のブロック
レプリケーションを保留中のブロック
ミスレプリケートされたブロックが延期されました
スケジュールされたレプリケーションをブロックします
Snapshot
スナップショット可能なディレクトリ
データノードが古い
ファイル合計
合計ロード
同期カウント合計
最後のチェックポイント以降のトランザクション
最後のログロール以降のトランザクション
Underreplicatedのブロック
ボリューム障害の合計
同期時間の合計
オブジェクト最大
操作ブロック追加
処理でSnapshotが許可されます
オペレーションブロックがバッチ処理されました
処理ブロックがキューに登録されました
操作ブロック受信および削除
処理レポートの平均時間
Operations Block Report Numberの略
キャッシュレポート平均時間
キャッシュレポート番号
操作ファイルを作成します
処理Snapshotを作成します
[操作][シンボリックリンクの作成
操作ファイル削除
処理Snapshotの削除
操作スナップショットを許可しない
オペレーションファイルイン/アウト
追加されたファイル
作成されたファイル
ファイルを削除しました
ファイルリスト
ファイルの名前変更
ファイルが切り捨てられました
File System Load Timeの略
処理EDEK平均時間の生成
オペレーションEDEKを生成します
処理:追加のデータノードを取得します
ブロックは場所を取得します
編集平均時間の取得
編集番号を取得します
イメージ平均時間の取得
画像番号を取得します
処理がリンクターゲットを取得します
処理が一覧表示されます
処理リストにSnapshotテーブルのディレクトリが表示されます
Replication Not Scheduled Numberの略
PUTイメージの平均時間
PUTイメージ番号
処理Snapshotの名前変更
資源チェック時間平均時間
リソースチェック時間番号
セーフモード時間
処理スナップショット差異レポート
Operations Storage Block Reportの略
レプリケーションに成功しました
同期平均時間
Operations Sync Numberの略
レプリケーションタイムアウト
処理の合計
トランザクション平均時間
トランザクションBatchd in Sync(同期中のトランザクションBatchd
トランザクション番号
EDEKウォームアップ時間平均
EDEKウォームアップ番号
Block Pool Used Spaceの略
キャッシュ容量
使用されているキャッシュ
空き容量
ブロックプールの使用率
残りの割合
使用率
スレッド
GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

Hadoop ジョブ履歴サーバ

クラスタ
ネームスペース
サーバ

ノード名
ノードIP

GCカウント
GCコピー数
GCマークスイープコンパクトカウント
GC番号情報のしきい値を超えました
GC番号警告しきい値を超えました
GC時間
GCコピー時間
GCマークスイープコンパクト時間
GC合計エクストラスリープ時間
エラー数をログに記録します
ログ致命的数
ログ情報数
警告数をログに記録します
メモリヒープがコミットされました
メモリヒープ最大
使用されているメモリヒープ
メモリ最大
メモリのヒープがコミットされていません
メモリ非ヒープ最大
メモリのヒープが使用されていません
ブロックされたスレッド
スレッド新規
スレッド実行可能
スレッドが終了しました
スレッドの待機時間
待機中のスレッド

トラブルシューティング

追加情報はから入手できます "サポート" ページ