ページの先頭です
IIJ.news Vol.187 April 2025
マルチクラウドの広がりとともに、クラウドの運用管理はますます複雑になっている。
そこで、従来の監視とは異なるアプローチとして「オブザーバビリティ」が注目を集めている。
IIJ クラウド本部 MSP推進部長
福原 亮
IIJでは、アウトソーシングサービスに積極的に取り組んでおり、監視、ジョブ管理、運用機能のほかにも、ITSM(ITサービスマネジメント)ツールや構成管理までを含めた、ITシステム全般を統合的に管理するIIJ統合運用管理サービス(以下、UOM)を提供しています。
今日でもクラウド化の流れは続いており、複数のクラウドを用途に応じて使い分けるマルチクラウドのほか、同じクラウドを事業部門やシステムごとにマルチアカウントで利用するケースが一般的になっています。さらに近年では、仮想サーバ(IaaS)だけでなく、PaaSやコンテナ*1の利用も加速しており、システム構成は年々複雑化しています。こういったトレンドのなか、システムの運用管理はどうあるべきでしょうか?
IaaSを中心としたクラウド利用では、従来型の監視運用手法でも対応できるケースがほとんどですが、マルチクラウド/マルチアカウント環境でPaaSやコンテナを活用した「分散システム」は、従来の手法では対応がむずかしいケースが多いのも事実です。なぜなら、IaaSは実際のサーバからリソースやログ情報を取得して監視できるのに対し、PaaSは直接、情報取得できませんし、コンテナは柔軟にスケールイン/アウトするため監視対象が一定とは限りません。こうした課題の解決策として、新たなアプローチである「オブザーバビリティ」が注目されています。
従来の監視では、あらかじめ監視対象を決める(例えば、CPUやメモリのリソース情報を取得する)限定的なデータ収集形式を取りますが、オブザーバビリティはIaaS、PaaS、コンテナからあらゆる情報を取得し、「蓄積して可視化する」という違いがあります。監視と比べて、オブザーバビリティにはどんなメリットがあるのでしょうか?
一般に、システム障害は監視アラートを介して気がつくように設計されていますが、運用担当者は実際にどこのサーバで何が起きているのかを、その都度、調べる必要があります。つまり、障害のたびにサーバにログインしてリソースやログを調査することを意味しています。しかし、PaaSやコンテナが活用されて分散化してくると、ログインしての調査対象が増えるため、運用者にとって大きな負担になるほか、PaaSに至っては、確認することすら困難です。
オブザーバビリティでは、PaaSやコンテナも含めたあらゆる情報をあらかじめ収集していますので、障害が起きた時にシステムリソースなどが可視化された画面を見るだけで、どこで何が起きたのか一目でわかります。つまり、実機へログインしたり、ネイティブクラウドのコンソールを見なくても、障害発生時のPaaSやコンテナも含めたあらゆる情報をオブザーバビリティツールで確認できるのです。(図1)その結果、運用者の負担が減るだけでなく、システム復旧時間の短縮にもつながります。
オブザーバビリティの導入は、システムの可視化において多くのメリットをもたらします。例えば、ショッピングサイトでは、顧客がスムーズに商品を購入できるかどうかがビジネスの成否に直結します。従来の監視手法はおもにシステムのインフラに焦点を当てていましたが、オブザーバビリティを活用することで、サイトのレスポンス速度などのユーザエクスペリエンス(UX)の観点からシステムを可視化できます。
オブザーバビリティの最大の特徴は、レスポンスが遅い原因を深掘りして調査できる点です。単に遅延を可視化するだけでなく、原因を特定し、迅速に対応することが可能です。これにより、従来の監視手法とは一線を画したアプローチが実現します。
また、データ収集の面でも、オブザーバビリティは非常に柔軟です。システムリソース(メトリクス)だけでなく、ログやトレース情報も収集対象に含まれます。これにより、システムリソース以外の問題も調査・分析でき、ショッピングサイトのWEBアプリケーションの動作が適切だったのかといったことも確認できます。
このように、UX観点から可視化を行なうことで、WEBサイトの健全性をチェックするだけでなく、問題発生時の調査対応を迅速化できます。ユーザアクセスにもとづいたサイトのレスポンス、WEBアプリケーションの処理、インフラリソースをフルスタックで可視化することで、システムの信頼性向上と顧客満足度の向上に寄与します。
図1 データの可視化とドリルダウン分析
オブザーバビリティは障害対応を迅速化するだけでなく、システムの健全性向上にも一役買ってくれます。収集したデータをどのように可視化すべきか、可視化して何を得るのかは、システムの特性によって異なりますが、システム運用だけでなく、ビジネス面でも活用が大きく期待されています。
UOMでは、Splunk Observability Cloud*2をエンジンとして採用してオブザーバビリティ機能を提供しています。日本語サポートや、日本円での月額請求が可能なことに加え、従来の運用管理機能と組み合わせてシステム運用を効率化できます。例えば、オブザーバビリティで検出したイベント(問題事象)をUOMの自動電話通知を使って通報したり、ITSMでイベントを管理することで、運用サイクルを全面的にサポートできます。
IIJでは、オブザーバビリティの提供を通じて、インフラ調査だけでなく、アプリケーションの状態も含む、システム運用をフルアウトソースしていただける世界を目指していきます。データ活用型社会に向けて、ぜひご検討ください!
図2 IIJ統合運用管理サービス オブザーバビリティ機能追加による運用改善サイクルの実現
ページの終わりです