Amazon Cloudfront Causing Problems for Many Services
11月27日の午前9時〜11時位のAmazonのCloudFrontが落ちていた事で感じた事をつらつらと書き留めたい。
ま、私自身はクリティカルな領域では利用していなかったので…… それほど深刻には捉えていないので、そのあたりご容赦ください。
クラウドサービスのダウンは孤独ではない
朝、インフラの人から「CloudFront落ちてるよ」の第一報をもらってTwitter見たら……まあ、いろんな人が呟いてて「僕は一人じゃなんだ感」がありました。ま、これは私がエンジニアでは無いし、CloudFrontは実験的エリアでの利用だったから言える事ですが。
なんでも落ちる時は落ちるよね
CDNは大量アクセスのために利用すると思うのですが、CDN自体が落ちることも…… まあ、ありますよね。
瞬間最大風速に備えてCDNを利用していたら、通常時にCDNが落ちたでござる。
どこまでリスクをとってコストをかけるのか
落ちる事を想定して冗長構成があるのは理解しています。
今回のような例でもフェイルオーバーしてリスク回避なども解説されているものもあります。
技術詳細は分かりませんが、どこまでリスクを取るのかは事前に想定しないとなーというのを再認識させられました。
本番サービスであれば冗長してダウンタイムゼロを当然目指すわけですが、プロトタイプやクローズドベータの場合はどこまでリスクをとって、どこまでは許容するのかという決めが必要ですよね。
落ちてから「こんなの聞いてない!!」では何も進まないですし、リスクを極端に嫌って過剰な構成にしていても、それはどこかで必ずユーザーに跳ね返ってしまいますからね。
Amazonの画像は生きていた!?
後で聞いた話で自分が調べたわけではないですが、どうもAmazon.co.jpの画像は生きていたらしい…… ドッグフード食べてください。
もう安全!?
映画「ガープの世界」では、主人公のガープが家を探している真っ只中に飛行機が家に墜落します。その瞬間にガープは「飛行機が同じ場所に墜落する可能性はゼロに近い」という理由で家の購入を決めていました。
ゼロに近いとまではいかないけれど、これで暫くCloudFrontが落ちることがなければいいな。ま、関係無いですけどね。
今日の一番の収穫は下記名言ツイートに出会えた事ですね ;)
プロバイダ各社もCDN死んでる時は空気読んで一斉に死んでほしい
— kyo ago (@kyo_ago) 2014, 11月 27
_人人 人人 人人 _
> 木を隠すなら森 <
 ̄Y ^ Y ^ Y ^ Y ̄