BLACKSHIELD

公開ガイド

災害復旧と事業継続

主要なサービスの前に回復目標、フェイルオーバー検証、および通信手順を計画します混乱。 対象: プラットフォーム運用チームと事業継続オーナー. 一般的な設定時間: 12-20 分.

開始前に

  • ビジネスクリティカルなワークフローごとに目標 RTO と RPO を設定します。
  • インフラストラクチャ、データベース、およびアプリケーションの回復所有者を特定します。
  • テーブルトップと技術的な回復演習をスケジュールします。

手順

ステップ 1

RTO および RPO ターゲットを定義します。

ビジネスへの影響に応じて回復目標を設定し、回復作業の優先順位を正しく設定します。

  • API、データ、ダッシュボードのワークフローの目標 RTO と RPO を定義します。
  • ビジネスクリティカルなサービスの復元順序を優先します。
  • 復旧を遅らせる可能性のある依存関係を文書化します。

ステップ 2

文書の復元と検証ワークフロー

各回復タスクの実行者と復元の成功を証明するものを明確にします。

  • インフラストラクチャ、データ、およびアプリケーションの回復タスクに対応者を割り当てます。
  • データの整合性とサービスの可用性に関する検証チェックを定義します。
  • 内部更新と顧客更新のための通信チェックポイントを含めます。

ステップ 3

R継続性訓練を実行してレビューします

定期的な演習により不確実性が軽減され、復旧までの時間が短縮されます。

  • R テーブルトップおよび技術的な復元訓練を定期的に実行します。
  • ドリル ギャップ、フォローアップ アクション、期日を追跡します。
  • それぞれの後にランブックと連絡先リストを更新します演習.

成功チェック

  • リカバリランブックには、検証チェックとコミュニケーション手順が含まれています。
  • ドリルの検出結果は追跡され、各演習後に更新が適用されます。
災害復旧と事業継続 | BlackShield Docs