階層的冗長性で実現する究極の高可用性ネットワーク
LAG(物理層の冗長性)+ ハイブリッドBGP(論理層の冗長性)で、どんな障害にも対応できる最強のネットワークを構築!
LAGは「車線レベル」の冗長性、ハイブリッドBGPは「道路レベル」の冗長性。 両方組み合わせることで、多層防御による究極の高可用性を実現!
役割: 複数の物理回線を束ねて1つの太い道路として運用
対応する障害: 個別の物理回線断、ケーブル断線、ポート障害
制御方式: LACP(Layer 2レベル)
切り替え時間: 3-5秒
4車線の高速道路
役割: 異なる接続方式(専用線 + インターネット)の組み合わせ
対応する障害: Direct Connect全体の障害、データセンター障害
制御方式: BGP(Layer 3レベル)
切り替え時間: 30-60秒
緊急時のヘリコプター
役割: 複数のアベイラビリティゾーンでの接続
対応する障害: AZ全体の障害、大規模災害
制御方式: BGP + Route 53による地理的ルーティング
切り替え時間: 1-5分
別の都市へのルート
Customer Gateway
BGP ASN: 65000MED: 100, Local Preference: 200
合計: 4Gbps
MED: 200, Local Preference: 100
合計: 2.5Gbps(待機中)
Virtual Private Gateway
マルチAZ配置様々な障害パターンを体験して、多層防御の仕組みを理解しましょう!
1本の専用線のみ
可用性: 低い(SPOF)
帯域幅: 固定
障害時: 完全停止
コスト: 最安
設定: 簡単
運用: シンプル
複数のDirect Connect束ね
可用性: 中程度
帯域幅: 拡張可能
障害時: 部分継続
コスト: 中程度
設定: 中程度
運用: 標準的
LAG + VPNの組み合わせ
可用性: 最高
帯域幅: 最適化
障害時: 完全継続
コスト: 最高
設定: 複雑
運用: 高度
# LAG インターフェース上でのBGP router bgp 65000 # AWS側のVGWとピア neighbor 192.168.1.1 remote-as 64512 neighbor 192.168.1.1 description LAG-to-AWS # 高優先度設定 neighbor 192.168.1.1 route-map LAG-OUT out neighbor 192.168.1.1 route-map LAG-IN in route-map LAG-OUT permit 10 set med 100 set community 65000:100 route-map LAG-IN permit 10 set local-preference 200
# VPN インターフェース上でのBGP router bgp 65000 # AWS側のVGWとピア neighbor 192.168.2.1 remote-as 64512 neighbor 192.168.2.1 description VPN-to-AWS # 低優先度設定(バックアップ用) neighbor 192.168.2.1 route-map VPN-OUT out neighbor 192.168.2.1 route-map VPN-IN in route-map VPN-OUT permit 10 set med 200 set as-path prepend 65000 65000 set community 65000:200 route-map VPN-IN permit 10 set local-preference 100
物理層の冗長性を先に確立
→ Direct Connect LAGを作成(2-4本)
→ オンプレミス側でLACP設定
→ 帯域幅テストと安定性確認
論理層の冗長性を追加構築
→ Site-to-Site VPN作成(同じCustomer Gateway)
→ BGP設定でバックアップ用に調整
→ 待機状態での動作確認
階層的フェイルオーバーの実現
→ LAGに高優先度(MED 100, LP 200)設定
→ VPNに低優先度(MED 200, LP 100)設定
→ AS_PATH Prependでさらに調整
全障害パターンでの動作確認
→ LAG内1本障害(LACP切り替えテスト)
→ LAG全断(BGP切り替えテスト)
→ 復旧時の自動復帰テスト
継続的な高可用性の維持
→ CloudWatch + オンプレ監視の統合
→ アラート設定とエスカレーション
→ 定期的なフェイルオーバー訓練
物理・論理・地理的な3層での冗長性
あらゆる障害パターンに対応
軽微な障害は数秒で対応
重大な障害でも1分以内で復旧
平常時は最高性能
障害時も必要最小限の性能確保
必要な時だけ高コスト回線を使用
ROI計算で十分な投資効果
計画メンテナンス時の無停止運用
段階的なスケールアップ
99.99%以上のアップタイム
Mission-criticalなシステムに対応
段階的導入がおすすめです!
📅 推奨導入順序:
💡 理由:
非常に稀ですが、想定しておくべきです!
🚨 同時障害のパターン:
🛡️ 対策方法:
単一接続の約3-4倍ですが、ROIは十分です!
💰 コスト試算例(東京、月額):
📈 ROI計算:
💡 投資効果: 追加コスト$30,000/年 vs 損失削減$75,000/年 = ROI 250%
初期は複雑ですが、自動化で運用負荷は軽減できます!
🟥 複雑な部分:
🟢 自動化できる部分:
💡 運用負荷軽減のコツ:
🏗️ LAG = 物理層の冗長性(車線レベルの保護)
🌐 ハイブリッドBGP = 論理層の冗長性(道路レベルの保護)
🔄 協調動作 = LACP + BGPによる段階的フェイルオーバー
🛡️ 多層防御 = 物理・論理・地理的な3層保護
この組み合わせで、エンタープライズ級の高可用性ネットワークを実現!
🎯 導入を検討すべき組織:
Created by SSuzuki1063
AWS SAP Learning Resources