Canonicalとのインタビュー
2016年11月16日筆者: Brian Brazil
Prometheusユーザーへのインタビューシリーズを続けます。CanonicalがPrometheusへの移行について語ります。
ご自身とCanonicalがどのような事業を行っているか教えていただけますか?
Canonicalは、Ubuntu Linuxのスポンサー企業として最もよく知られているでしょう。また、MAAS、Juju、OpenStackなどの多数のオープンソースプロジェクトを制作または貢献しており、これらの製品に対する商用サポートも提供しています。UbuntuはOpenStackデプロイメントの大部分を占めており、本番クラウドの55%、大規模クラウドデプロイメントの58%を支えています。
私のグループであるBootStackは、当社の完全マネージド型プライベートクラウドサービスです。Canonicalのお客様のためにOpenStackクラウドを構築・運用しています。
Prometheus導入前のモニタリング経験について教えていただけますか?
Nagios、Graphite/statsd、そして社内のDjangoアプリを組み合わせて使用していました。これらでは、社内および顧客のクラウド環境の両方で必要となる柔軟性やレポーティングのレベルを提供できませんでした。
なぜPrometheusに着目することにしたのですか?
InfluxDBやGraphiteの利用拡大など、いくつかの代替案を検討しましたが、Prometheusの最初の経験で、私たちが求めていたシンプルさとパワーの組み合わせがあることが証明されました。特に、ラベルの利便性、シンプルなHTTPプロトコル、そしてすぐに使える時系列アラートを高く評価しています。Prometheusで2つの異なるツール(アラートとトレンド)を1つに置き換える可能性は、特に魅力的でした。
また、私たちのスタッフの何人かは、Googleにいた頃のBorgmonの経験があり、それが私たちの興味を大いに掻き立てました!
どのように移行しましたか?
現在、移行作業の途中であり、既存のシステムで使用しているカスタムチェックの数をPrometheusで再実装する必要があるため、しばらく時間がかかると予想しています。最も役立ったリソースは、prometheus.ioサイトのドキュメントでした。
エクスポーターの選択には時間がかかりました。当初はcollectdを使用しましたが、これには限界がありました。現在、openstack-exporterの作成に取り組んでおり、エクスポーターをゼロから作成する方法の良い実例がないことに少し驚きました。
直面した課題としては、ダウンサンプリングのサポートがないこと、長期ストレージソリューションがまだないこと、デフォルトの2週間という保持期間に驚いたことが挙げられます。現在、Jujuとの連携はありませんが、取り組んでいます!
切り替えてからどのような改善が見られましたか?
エクスポーターのコツを掴むと、非常に簡単に書くことができ、非常に有用なメトリクスが得られることがわかりました。例えば、クラウド環境向けにopenstack-exporterを開発しています。また、DevOpsおよびWebOpsグループや開発者からは、チーム間での非常に迅速な採用が見られました。まだアラートは導入していませんが、移行のこの段階に達すれば、さらに多くのことが期待できるでしょう。
CanonicalとPrometheusの将来はどうなると思いますか?
Prometheusは、私たちのモニタリングおよびレポーティングインフラストラクチャの重要な部分となり、現在および将来の多数のシステムのメトリクス収集とストレージを提供すると予想しています。アラートについては、Nagiosに代わる可能性を秘めていると考えています。