サーバ監視とは|目的や種類、ツールの選び方について解説
セキュリティ面において、そしてサーバを安定的に供給するために欠かせないのがサーバ監視です。 ただ、サーバ運用管理やネットワーク監視など、似たような定義の言葉も存在し、違いがよく分からないという方も多いのではないでしょうか。 本記事では、サーバ監視とサーバ運用管理、ネットワーク監視の違い、サーバ監視の機能やサーバ監視ツールの選び方について分かりやすく解説いたします。
目次
サーバ監視とは?
サーバ監視とは、サーバが正常に稼働しているかチェックする業務を指します。 主に、サーバ監視ツールや統合監視ツールなどを使い、行われます。障害は、日々の小さなトラブルの積み重ねで発生します。 サーバの負荷増大やキャパシティ不足を招かないよう、常に先手を打ち対処することで、システムダウンという最悪の事態を防ぐことができます。
サーバ監視の種類
サーバ監視は、大きく「正常監視」と「異常監視」の2種類あります。
正常監視
サーバーが正常に稼働していることをサーバー管理者に、経常的にステータス表示・通知する監視方法を指します。
異常監視
サーバが正常にサービスを提供できていない、またはサービス提供に影響があることを管理者に通知する監視方法のこと。 メールのほか、物理的な音声やランプによる通知方法も存在します。
統合監視、ネットワーク監視、サーバ運用管理との違い
サーバ監視がサーバが正常に稼働しているかをチェックする業務であるのに対し、統合監視は単一のサーバではなく、ネットワークも含めて監視できます。 全体がチェックできるため、どの機器が壊れているかなどの特定もできます。
ネットワーク監視では、「ネットワーク」に異常がないかをチェックします。 ネットワークが停止してしまうと、サーバに紐づくメールやWebサービスは全て稼働しなくなるため、非常に重要です。
最後に、サーバ運用管理は、サーバの運用状況の管理、セキュリティ管理など、サーバの維持・管理を表す言葉で、サーバ監視を含む広義的な意味を持ちます。
サーバー監視の目的
どのような場面で、サーバ監視は必要になるのでしょうか。 主に、サーバ監視の目的は以下の3つになります。
サーバの稼働確認
Webサーバやメールサーバ、Proxyサーバ、ファイアウォールなどサーバと言っても様々な種類があり、これらのサーバが正常に動作しているかを確認します。 常に監視することで、サーバが停止・中断する時間を最小限にとどめることができます。
障害への迅速な対応と原因究明
サーバの障害の原因は様々です。サーバを早期に復旧させるためには、障害発生をいち早く検知し、どこに原因があるのかを速やかに究明する必要があります。 サーバ監視により常に稼働状況をチェックしておくことで、どのような状態に陥り、障害が発生したかを検知、把握することができます。 また、サーバ監視ツールのログを確認することでより素早い原因の特定が可能になります。
安定性の確保/ネットワークパフォーマンスの最適化
提供するサービスの品質が落ちないよう、サーバのリソースやトラフィックなどの状況を監視します。 監視ツールから返ってきたワークロード(負荷)情報などをもとに、キャパシティプランニングを行います。
サーバ監視ツールの機能
では、サーバ監視ツールには、具体的にどのような機能があるのでしょうか。 サーバ監視ツールに実装されている代表的な機能についてご紹介します。
死活監視
サーバが停止せずに正常に稼働しているか監視する機能のこと。 死活監視では、主にPing(ピング)が使用されます。 Pingとは、ICMPプロトコルを使用したネットワークの診断プログラムで、確認したい機器やサーバにパケットを送信し、対象機器から返ってくるリターンパケットをもとに、稼働状況を判別します。
トラフィック監視
トラフィックとは、サーバのインターフェースやネットワーク上で送受信されるデータ量のことをいいます。 トラフィック転送量を把握するだけでなく、現状の帯域幅で十分か、サーバリソースの拡張や設備増強は必要か、などについて判断できます。 また、Webサイトなどのサーバに対して、大量のトラフィックを送りつける攻撃であるDoS攻撃の検知も可能です。
DoS攻撃についてより詳しく知りたい方はこちらの記事をご覧ください。
パフォーマンス監視
リソース監視とも。サーバのCPU、ディスク、メモリの使用率などを監視する機能です。 リソースを正確に把握していないと、高負荷状態を引き起こし、やがてサーバダウン、システムダウンにつながってしまいます。 パフォーマンス監視を行うことで、障害に至る前に解決し、大きなトラブルに発展することを防ぎます。
アプリケーション監視
サーバ内で動作するアプリケーションを監視する機能。 異常終了や応答時間など、アプリケーションの稼働状況に関する監視を行います。
ハードウェア監視
サーバを構成するハードウェアを対象に監視する機能です。 主に、温度や電圧、ファンなどに異常がないかや、故障の監視などを行います。 ハードウェアの状態に変化があった場合は、その情報をログに出力したり、設定した宛先にメール通知などを行います。 オーバーヒートや、ファン、電圧の異常などハードウェアに起因する障害をいち早く検知できるとともに、データの損傷を防げます。
スクリプト監視
ジョブ監視とも。複数のサーバでバッチを走らせていて、かつシステムとして連携している場合、非常に管理が煩雑になります。 バッチ処理の異常を放置しておくと、次のバッチ処理が正常に行われず、結果、サービスが正しく提供できなかったり、システムが停止する恐れもあります。 スクリプト監視では、こういったバッチ処理を監視し、異常発生時に通知することでいち早く正常な状態に戻し、影響を最小限に食い止めることができます。
ログ監視
サーバ監視ツールの中には、ログ監視機能が実装されているものもあります。 しかし、あくまで監視機能であるため、ログを収集して細かく分析したり、レポートしたりする場合は、ログ管理ツールの導入を検討しましょう。
弊社の統合ログ管理ツール「ALog EVA(エーログ エヴァ)」はこちら
サーバ監視ツールの選び方
最後に、サーバ監視ツールの選び方について解説いたします。
導入形態
サーバ監視ツールの導入形態は、大きく「OSS(オープンソース・ソフトウェア)」か「商用」に分かれます。
OSS(オープンソース・ソフトウェア)とは、ソースコードを一般公開しているソフトウェアの総称で、無料で利用・改変・再配布が行えます。 OSSは一部ライセンスによる制限がありますが、非常に自由度が高い導入形態となります。 しかし、OSSは導入しやすいというメリットがある一方で、ソフトウェアである以上、脆弱性も存在します。 OSSのフォーラム等のコミュニティでセキュリティパッチは配布されるものの、組み込みや導入は自社で行う必要があります。 知見のある専任者がいない場合は、商用のサーバ監視ツールを選びましょう。
エージェントの有無
エージェント型の場合、監視対象の機器全てに専用プログラムの導入が必要になるため、費用がかかる、サーバへ想定していなかった影響が発生する可能性があるといった難点はあります。 しかし、その分フレキシブルに細かい監視が可能で、詳細な情報を数多く収集できるタイプとなります。 エージェントレス型は、監視を行うプログラムを常駐させずに監視を行う仕組みです。 そのため、エージェント代がかからず、コストを安く抑えることができます。
費用
試験的にサーバ監視を行ってみたいなどの理由であれば、無償のサーバ監視ツールでも十分利用できます。 有名なのはZabbix(ザビックス)で、OSSでありながらも企業がサポートを行っており無償で全ての機能が利用可能です。 多くの企業で導入実績があります。 統合管理ツールにはなりますが、NTTデータとNTTデータ先端技術が開発したHinemos(ヒネモス)もOSSであり、一部機能を無料で利用できます。 サブスクリプション(有償版)では、オプション機能や充実したカスタマーサポートを受けることができます。
操作性
サーバ監視ツールが収集したデータをどのような設定や操作でグラフとして出力できるか、またレポート出力できるかなど、操作性にも注目しましょう。 時間軸の分析は、グラフとして落とし込まれていれば、どこに異常があるかが分かりやすくなります。 一方、数値が羅列されただけのデータでは瞬時に異常のある個所が判別できません。 多機能であるほど、操作性は複雑になりがちなので、必要な機能と操作性のバランスを見ながら判断しましょう。
監視項目
社内サーバの監視か、提供サービスにおけるサーバ監視かによっても、監視すべき項目は異なります。 サーバ監視ツールの中には、特定の機能に特化した製品もあります。
外部連携
外部プログラムやサービスとの連携ができるかも一つのポイントとなります。 LINEなどのSNSへの異常検知の通知、slackなどのビジネスチャットへのアラート情報やレポート送信、さらには外部プログラムと連携させることで、運用を効率化・自動化できます。
まとめ
サーバを常に安全に安定稼働させるには、裏側の見えない小さなトラブルの予兆を早めに発見し、解消することが大切です。 本日紹介したサーバ監視ツールの内容を参考に、導入を検討してみてはいかがでしょうか。