レストランチェーンの災害対応で理解する超入門ガイド
AWSの災害復旧戦略を、人気レストランチェーンの災害対応で分かりやすく説明します!
データ損失許容時間
「何時間前までの 注文履歴 なら失っても大丈夫?」
RPO = 1時間
→ 1時間前までの注文データを失ってもOK
RPO = 0分
→ 1つの注文も失ってはダメ
復旧時間目標
「災害から何時間で 営業再開 する?」
RTO = 24時間
→ 1日以内に営業再開
RTO = 5分
→ 5分以内に営業再開
人気レストラン「AWS亭」の本店が火災で使えなくなりました。
お客様への影響を最小限に抑えて営業を続けるには、どの戦略を選びますか?
「保険で復旧」戦略
完全閉店して、保険金で新店舗を建設。レシピや顧客データは定期的にバックアップ。
S3、Glacier、EBS Snapshot
「最低限の準備」戦略
別の場所に小さな厨房だけ確保。災害時は急いで設備を増強して営業再開。
EC2(停止状態)、RDS(スタンバイ)
「縮小版で継続」戦略
小さな支店で常に営業中。災害時は座席を増やして本店の客を受け入れ。
EC2(小さなインスタンス稼働中)、RDS(リードレプリカ)
「完全冗長化」戦略
複数の同規模店舗が常に営業。本店に問題があっても、他店舗で影響なく継続。
複数リージョンでフル稼働、Route 53、ALB
レストラン:
毎日レシピと顧客データを金庫に保管
AWS:
毎日S3にデータベースのスナップショットを保存
レストラン:
火災で本店使用不可、全面的に営業停止
AWS:
プライマリシステム停止、サービス一時停止
レストラン:
新しい場所で店舗を再建、設備を新調
AWS:
新しいEC2インスタンス起動、バックアップからデータ復元
レストラン:
金庫のデータで顧客情報復元、営業再開
AWS:
最新のバックアップ時点のデータでサービス再開
全戦略共通:サービス停止
0-5分後 :自動切り替えで即座に復旧
5分-1時間後 :縮小環境をスケールアップして復旧
1-24時間後 :最小環境から本格環境を構築して復旧
24時間-数週間後 :ゼロから環境を再構築して復旧
AMIとCloudFormationテンプレートは、災害時の迅速復旧を可能にする「レシピ」と「設計図」です!
完成料理のレシピ
「特製ピザのレシピ」
材料、調理手順、盛り付けまで
すべて記録された完璧なレシピ
AWS:
OS、アプリ、設定が
すべて組み込まれたサーバーイメージ
店舗設計図
「店舗レイアウト設計図」
厨房、客席、設備の配置まで
詳細に記載された設計図
AWS:
VPC、EC2、RDS等の
インフラ構成をコード化したテンプレート
AMI・CloudFormationの事前作成は、主に「パイロットライト戦略」で威力を発揮します
月額コスト: 数千円
復旧時間: 大幅短縮!
レストラン:
特製ピザのレシピを完璧に記録
AWS:
Web/Appサーバーを完全設定してAMI作成
ami-webapp-v1.2.3
レストラン:
災害時の迅速店舗再建設計図を準備
AWS:
インフラ全体をコード化してテンプレート作成
disaster-recovery-template.yaml
レストラン:
本店火災!設計図とレシピで迅速に新店舗オープン
AWS:
本番環境障害!CFテンプレートとAMIで自動復旧開始
aws cloudformation deploy --template-file disaster-recovery-template.yaml
レストラン:
レシピ通りの美味しいピザで営業再開!
AWS:
事前設定済みAMIで本番同等環境を高速構築完了
結果:
データ損失最小限、復旧時間大幅短縮
AMIは月1回更新してセキュリティパッチを適用
CFテンプレートで実際に環境構築テストを実施
AMI・CFテンプレートの世代管理で確実な運用
自動起動の成功/失敗を確実に検知
レストランの金庫
データのバックアップを安全に保管。99.999999999%の耐久性で大切なデータを守ります。
レストランの厨房
アプリケーションが動く仮想サーバー。災害時には素早く別の場所で起動できます。
顧客台帳
データベースを管理。自動バックアップとリードレプリカで高可用性を実現。
道案内係
DNS設定でトラフィックを正常な環境に自動的に誘導。ヘルスチェック機能付き。
受付係
複数のサーバーに負荷を分散。1台が故障しても他のサーバーが処理を継続。
緊急スタッフ
サーバーレスで必要な時だけ起動。災害時の自動処理や通知に最適。
下記の質問に答えて、最適な災害復旧戦略を見つけましょう!
災害復旧計画は定期的にテストして、実際に動作することを確認しましょう。
復旧手順を詳細に文書化し、担当者以外でも実行できるようにしましょう。
災害時の責任者と連絡体制を明確にし、役割分担を決めておきましょう。
可能な限り復旧プロセスを自動化し、人為的ミスを減らしましょう。
小さく始めて段階的に改善し、予算と要件に応じて戦略をアップグレードしましょう。
システムの健全性を常に監視し、問題を早期発見できる体制を整えましょう。
Created by SSuzuki1063
AWS SAP Learning Resources
Created by SSuzuki1063
AWS SAP Learning Resources