7月5日サーバー障害の原因についてご報告
7月5日に発生したサーバー障害について、原因の調査に時間がかかってしまった事を深くお詫びいたします。
原因について、調査結果をお知らせいたします。
【障害日時】
平成23年7月5日 AM 7:55 ~ AM 10:08
【障害内容】
データセンター内、サーバーラックの一部の機器より不正にパケット(機器内部)が発生し、同一ネットワーク上に大量にパケットが送出された為、ネットワークに遅延が生じ、WEBの閲覧、Mail等のアクセスにタイムアウトが発生する状況になりました。
具体的にはCGIプログラム上に不正なコマンドを送り込んでSPAMの踏み台にしようとした模様です。
セキュリティーで不正なコマンドの場合、動作を止めてエラーを返すようになっているのですが、ここに繰り返し機器内部より、不正パケットを送り込まれたため、サーバー全体のトラフィック上がり、サーバーがハングアップしエラーパケットを大量に吐き出し、サーバーがダウンしてしまいました。
※ 外部からの不正パケットではありません。
【今後の同一障害の対応について】
サーバー固有にパケット監視用のプログラムの設置を検討し、8月末までに導入いたします。
※導入には2週間ほどかかります。
※現状はネットワーク全体に対しての監視はしておりますが、今回の障害のようなどの機器からエラーパケットを送出しているか特定するのに調査する時間がかかり障害復旧が遅くなる為、固有に監視することで、エラー処理にかかる時間を短縮します。
※導入は8月末までに完了予定です。