Prometheusユーザーへのインタビューシリーズを続け、EuropaceのTobias Gesellchen氏がPrometheusを発見した経緯について語ります。
Europaceの事業内容について教えてください。
Europace AGは、WebベースのEUROPACE金融マーケットプレイスを開発・運営しています。これは、ドイツ最大の住宅ローン、建築金融商品、個人ローンのプラットフォームです。完全に統合されたシステムは、約400のパートナー(銀行、保険会社、金融商品販売会社)を結びつけています。毎月数千人のユーザーがEUROPACEで約35,000件の取引を実行し、その総額は最大40億ユーロに達します。当社のエンジニアはhttp://tech.europace.de/と@EuropaceTechで定期的にブログを更新しています。
Prometheus導入以前のモニタリング体験はどのようなものでしたか?
Nagios/Icingaは他のプロジェクトではまだ使用されていますが、サービス数の増加と柔軟性への要求の高まりに伴い、他のソリューションを探しました。NagiosとIcingaはより中央集権的に管理されているため、PrometheusはDevOpsスタック全体をチーム内に持ち、特定の責任をインフラストラクチャチームからプロジェクトメンバーに移行するという私たちの目標に合致していました。
Prometheusを検討することにした理由は何ですか?
Docker Berlinコミュニティでの活動を通じて、SoundCloudとJulius Volz氏と連絡を取り、彼らから概要を伺いました。柔軟なDockerコンテナと高度に柔軟なラベルベースの概念の組み合わせにより、Prometheusを試してみることにしました。Prometheusのセットアップは非常に簡単で、Alertmanagerは私たちのニーズを満たしていたため、他の選択肢を試す理由はありませんでした。Docker環境やメッセージングツールとの統合を改善するための小さなプルリクエストでさえ、非常に迅速にマージされました。時間の経過とともに、スタックにいくつかのエクスポーターとGrafanaを追加しました。私たちは決して過去を振り返ったり、他の選択肢を探したりしませんでした。
どのように移行しましたか?
私たちのチームは新しいプロジェクトでPrometheusを導入したため、チーム内での移行は発生しませんでした。他のチームは、既存のソリューションと並行してPrometheusを追加することから始め、メトリクスコレクターを段階的に移行しました。カスタムエクスポーターやその他の一時的なサービスが移行中に役立ちました。Grafanaはすでに存在していたため、別のダッシュボードを検討する必要はありませんでした。一部のプロジェクトでは、IcingaとPrometheusの両方を並行して使用しています。
切り替え後、どのような改善が見られましたか?
スケーラビリティの問題でIcingaの使用に問題がありました。複数のチームが中央管理ソリューションを管理しているとうまく機能しませんでした。PrometheusスタックとAlertmanagerを一緒に使用することで、チームとプロジェクトを切り離すことができました。Alertmanagerは高可用性モードでデプロイできるようになり、これはモニタリングインフラストラクチャの中核にとって大きな改善です。
EuropaceとPrometheusの将来はどうなると思いますか?
社内の他のチームも徐々にプロジェクトにPrometheusを採用しています。より多くのプロジェクトがAlertmanagerとともにPrometheusを導入し、徐々にIcingaを置き換えていくと予想しています。Prometheusが持つ固有の柔軟性により、Prometheusは私たちのニーズに合わせて拡張し、将来の要件に適応する際に問題が発生しないと予想しています。