CircleCI Server v3.x のメトリクスと監視

CPU やメモリの使用率などのメトリクス、および内部メトリクスを活用すると、以下のことに役立ちます。

  • インシデントや異常な動作をすばやく検出する

  • コンピューティング リソースを動的にスケールする

  • インフラ全体の問題をさかのぼって把握する

メトリクスの収集

スコープ

CircleCI Server では、システムのヘルス状態の監視や、システムの問題のデバッグに役立つ各種メトリクスとログをデフォルトで収集します。

データは最大 15 日間保持されます。
Prometheus のメトリクスの収集範囲は、CircleCI Server のみに限定されていません。 デフォルトでは、クラスタ全体からメトリクスを収集します。 必要に応じて、KOTS 管理者コンソールの [Config (構成)] から Prometheus を無効にできます。

Prometheus

Prometheus は、Kubernetes 用の優れた監視およびアラート システムです。 CircleCI Server 3.x には、一般的なパフォーマンス メトリクスの監視が実装されています。

KOTS 管理者 - メトリクス グラフ

デフォルトでは、Prometheus インスタンスは CircleCI Server と一緒にデプロイされます。 デプロイ後、Prometheus インスタンスのアドレスを KOTS 管理者ダッシュボードに追加できます。 KOTS ではこのアドレスを使用して、クラスタに含まれるコンテナの CPU とメモリ使用率のグラフ データを生成します。

デフォルトの Prometheus アドレスは、http://prometheus-server です。

KOTS ダッシュボードの [Configure graphs (グラフの構成)] を選択し、 http://prometheus-server と入力すると、KOTS でリソース使用率グラフが生成されます。

Telegraf

CircleCI Server 上で実行されるほとんどのサービスは、サーバーで実行されている Telegraf ポッドに StatsD メトリクスを報告します。 この構成は完全にカスタマイズ可能で、https://docs.influxdata.com/telegraf/v1.17/plugins/#output-plugins[出力プラグイン]を介して、Telegraf でサポートされている任意の出力先に Telegraf のメトリクスを転送できます。 デフォルトでは、Prometheus で収集するためのメトリクス エンドポイントが提供されます。

Telegraf から Datadog へのメトリクスの転送

以下に、Telegraf から Datadog にメトリクスを出力する構成方法の例を示します。

管理コンソール ダッシュボードを開いて、メニュー バーの [Config (構成)] を選択します。 [Observability and monitoring (オブザーバビリティと監視)] の下にある [Custom Telegraf config (Telegraf カスタム構成)] を見付けます。 編集可能なテキスト ウィンドウがあり、CircleCI Server の Telegraf メトリクスの転送するためのプラグインを構成できます。 Datadog に転送する場合は、以下のコードを追加します。 ただし、my-secret-key は自身の Datadog API キーに置き換えてください。

[[outputs.datadog]]
  ## "my-secret-key" を Datadog API キーに置き換える
  apikey = "my-secret-key"

詳細については、https://docs.influxdata.com/telegraf/v1.17/plugins/#output-plugins[Influxdata のドキュメント]を参照してください。



ドキュメントの改善にご協力ください

このガイドは、CircleCI の他のドキュメントと同様にオープンソースで、GitHub で使用できます。 ご協力いただき、ありがとうございます。


クリエイティブ・コモンズ・ライセンス
CircleCICircleCI ドキュメントは、クリエイティブ・コモンズの表示--非営利-継承 4.0 国際ライセンス に基づいてライセンス供与されています。