Amazon EC2が落雷で障害

 Amazon EC2が落雷で障害発生、長時間のダウンを余儀なくされたという。米国バージニア州での話とはいえ、クラウドだけにグローバルな経済情勢とも似ていて、いつ障害の影響が周囲にまでやって来ても不思議ではない。

Amazon EC2が落雷で障害 InstagramやPinterestがダウン(ITmedia)
Amazon、EC2の大規模障害について正式に謝罪(4.30)

 最近の障害といえば、例のファーストサーバの一件がある。あれはクラウドではなかったようだが、世の中的にはこうしたグローバルの障害が起こると、すぐにクラウドサービス全体の信頼性が問題とされる。今回はクラウドの代表格であるAmazon EC2での障害だけになおさらであろう。


 どんなサービスでも障害や何らかのトラブルは避けられない。問題は万が一そうしたことが起きてしまった場合の対応によって、信頼性も決まるといってもよいだろう。今回は落雷の影響だったが、日本の震災対応のように「想定外」の弁明で済ますのではなく、重要なインフラだけに柔軟なシステムの対応が求められる。実際EC2を利用している人の話では、Amazonのサポートはかなり良心的だと聞く。料金が驚くほど安いにも拘らず「安かろう悪かろう」の体制にはなっていない。このあたりが「ウチでもクラウドやっています」のような擬似的クラウドサービスと異なるところだろう。


 AmazonにしろGoogleにしろ、クラウドの安全性のベースは「システムの冗長性」にあると思える。たとえばバックアップにしても世界に分散させることができる。仮にどこかのセンターが被害を受けたにしても、分散されているシステム機能から時間が経てば徐々に復活させることができる。いくらを鎧兜のようにローカルのセキュリティばかり高めたところで、震災の時のように、物理的に電源消失のように外堀を埋められたり、建物ごと壊滅してしまえば何にもならないことを我々は経験した。少なくとも「情報」に関しては、我々自身がクラウドへの信頼性を高めていくことが重要であることを教訓として知ったように思える。