Presslabs インタビュー

2018年8月23日筆者: Brian Brazil

Prometheus ユーザーへのインタビューシリーズとして、Presslabs の Mile Rosu 氏がモニタリングの道のりについて語ります。

ご自身のことと、Presslabs がどのような会社か教えていただけますか?

Presslabs は、パブリッシャー、エンタープライズブランド、デジタルエージェンシー向けの高性能マネージド WordPress ホスティングプラットフォームであり、ウェブサイト訪問者に常にシームレスな体験を提供することを目指しています。

最近、コア製品である WordPress Business Intelligence に革新的なコンポーネントを開発しました。ユーザーは、リアルタイムで実行可能なデータを包括的なダッシュボードで取得できるようになり、迅速な問題発生からデプロイまでのプロセスとサイトの継続的な改善をサポートします。

私たちは、1億台の WordPress ホスティング専用マシンで、毎月最大20億ページビューのシームレスな配信をサポートしています。これは、要求の厳しい顧客向けのものです。

現在、私たちは世界中の WordPress パブリッシャーに最高の体験を提供することを使命としています。この旅において、Kubernetes は高可用性 WordPress ホスティングインフラストラクチャにおける今後の標準への道のりを容易にしています。

Prometheus導入前のモニタリング経験について教えてください。

WordPress ホスティングプラットフォームの構築は2009年に開始しました。当時、Munin というオープンソースのシステム、ネットワーク、インフラストラクチャ監視を使用していました。これは、メトリクスの公開、収集、集計、アラート、可視化など、必要なすべての操作を実行していました。うまく機能していましたが、1分ごとの収集と5分ごとの集計では私たちには遅すぎたため、生成された出力はプラットフォーム上のイベントを適切に分析するには十分ではありませんでした。

Graphite はリストの2番目の選択肢であり、Munin が抱えていた時間的な課題を解決しました。メトリクスを公開するために collectd を追加し、Graphite を使用してそれを収集および集計しました。

次に、可視化とアラートのために JavaScript & Python で書いたツールである Viz を作成しました。しかし、Grafana が最初のバージョンから非常にうまく代用してくれたため、メンテナンスに多くの労力がかかるため、このサービスの使用を積極的に中止しました。

Presslab's Viz

2017年後半から、私たちの Presslabs プラットフォームは大規模な移行フェーズに入りました。主な変更点の1つは Kubernetes への移行であり、高性能な監視システムが必要になりました。そこで、Prometheus に目標を定め、それ以来それを使用しており、新しいプラットフォーム全体でメトリクスを抽出および公開するための中心的な要素として、すべてのサービスに統合する予定です。

Prometheusを検討することにした理由は何ですか?

2014年に Velocity Europe Barcelona で Soundcloud のエンジニアチームと話した後、Prometheus を検討し始めました。彼らが示した利点は、Prometheus を試すのに十分説得力がありました。

どのように移行しましたか?

まだ移行プロセス中であるため、2つのシステム、Prometheus と Graphite-collectd の組み合わせを並行して実行しています。クライアントダッシュボードとコアサービスには Prometheus を使用していますが、クライアントサイトにはまだ Graphite-collectd を使用しています。どちらの上にも可視化のために Grafana があります。

Presslab's Redis Grafana dashboards

Prometheus のドキュメント、Github のイシュー、ソースコードが Prometheus を統合するための主なリソースでした。もちろん、StackOverflow はプロセスにスパイスを加え、多くの疑問を解消してくれました。

Prometheus の唯一の問題は、特定のメトリクスに対して長期ストレージを取得できないことです。私たちのホスティングインフラストラクチャプラットフォームは、ページビューなどの使用状況メトリクスを少なくとも1年間保存する必要があります。しかし、Prometheus の状況は、私たちがそれを使用している間、大幅に改善されており、まだ可能な解決策をテストする必要があります。

切り替え以降、どのような改善が見られましたか?

Prometheus に切り替えて以来、以前使用していた他のどの代替手段と比較しても、リソース使用量が大幅に減少したことに気づきました。さらに、Kubernetes との自動統合により、インストールが簡単で、多くの時間を節約できます。

Presslabs と Prometheus の将来について、どのようにお考えですか?

Prometheus には大きな計画があります。現在使用している Prometheus Helm チャートを、新しいインフラストラクチャで Prometheus Operator に置き換える作業を行っています。この実装により、プラットフォームの顧客を分離できるようになります。なぜなら、限られた数のウェブサイトに専用の Prometheus サーバーを割り当てる予定だからです。WordPress の Kubernetes 化を進める一環として、すでにその作業を進めています。

WordPress のメトリクスを Prometheus フォーマットでエクスポートする作業も行っています。Grafana は、可視化のニーズを満たすために Prometheus と連携するため、今後も使用していきます。