Was ist Disaster Recovery?

Definition

Disaster Recovery lässt sich grob als die Fähigkeit einer Organisation definieren, auf ein katastrophales Ereignis mit negativen Auswirkungen auf ihre Betriebsabläufe und ihre Infrastruktur zu reagieren und sich davon zu erholen. Es ist die Grundlage für die Identifikation, Bewertung und Behebung von Katastrophen und umfasst auch die nachfolgenden Wiederherstellungsstrategien.

Wenn sie mit einem Cyberangriff konfrontiert sind, müssen Teams einen Disaster-Recovery-Plan parat haben, um Probleme so schnell und so effektiv wie möglich anzugehen. Ohne einen solchen Plan kann jede Minute verschwendeter Zeit die Kosten durch den entstandenen Schaden in die Höhe treiben und die Fähigkeit beeinträchtigen, sich überhaupt davon zu erholen.

Disaster Recovery wird in der Cybersicherheit immer wichtiger, wenn es um den Umgang mit Bedrohungen geht. Der nachfolgende Glossarbeitrag erklärt die Grundlagen von Disaster Recovery und vermittelt Ihnen alles, was Sie wissen müssen, um einen Plan für Ihre eigene Organisation zu entwickeln.

Was ist ein Disaster-Recovery-Plan?

Ein Disaster-Recovery-Plan ist die strategische Dokumentation und der Prozess, den eine Organisation für sich festlegt, um nach einem Cyberangriff, menschlichen Fehlern, Naturkatastrophen oder anderen katastrophalen Ereignissen den Zugang zu kompromittierten Systemen und Infrastruktur wiederherzustellen.

Er ist die systematische Methodologie, anhand derer ein Team entscheidet, wie es seine Ressourcen einsetzt, um im Nachgang eines katastrophalen Ereignisses auf möglichst effiziente Art und Weise die Kontrolle über kritische Daten und Informationssysteme zurückzuerlangen.

Wie funktioniert Disaster Recovery?

Disaster Recovery hat zwei Funktionen – erstens, kritische IT-Systeme und Infrastruktur nach einem Vorfall aufrechtzuerhalten, und zweitens, diese im Falle einer Kompromittierung wiederherzustellen. Die Aufrechterhaltungsfunktion beinhaltet Backups von Daten und Assets, um sie auf bestimmte Wiederherstellungspunkte zurücksetzen zu können. Die Wiederherstellungsfunktion bedeutet, auf einen Vorfall so zu reagieren, dass die Organisation die Funktionalität von und Kontrolle über Systeme und Daten, die infiziert oder kompromittiert wurden, zurückzugewinnt.

Mit einem Disaster-Recovery-Plan können Sie kleine wie große Vorfälle angehen. Dabei kann es sich um Softwareprobleme wie ein fehlerhaftes Programm oder aber auch um wirklich katastrophale Tragödien wie eine systemweite Datenverletzung oder eine Pandemie handeln. Was einen Disaster-Recovery-Plan wirklich effektiv macht, ist das Antizipieren von Bedrohungen, bevor sie auftreten, und das Testen von unterschiedlichen Bedrohungsszenarien, um sicherzustellen, dass der Plan tatsächlich funktioniert.

Die elementaren Bestandteile eines Disaster-Recovery-Plans

Ein wirksamer Disaster-Recovery-Plan befasst sich mit den individuellen Assets, der Infrastruktur und den Schwachstellen einer Organisation. Während jede Organisation ihren Plan auf ihre individuellen Bedürfnisse zuschneiden sollte, gibt es einige grundlegenden Bestandteile, die in jedem Disaster-Recovery-Plan berücksichtigt werden sollten.

  • Risikoanalyse: Teams sollten alle möglichen Bedrohungen und Schwachstellen in ihrer IT-Infrastruktur und anderen Bereichen, die besonders anfällig für Cyberangriffe sind, sorgfältig bewerten.
  • Betriebskontinuität: Bestimmen Sie alle Prozesse und Ressourcen, die im Falle einer Katastrophe zum Einsatz kommen sollen, um kritische Betriebsabläufe aufrechtzuerhalten.
  • Datenarchivierung, Backups und Wiederherstellung: Dokumentieren Sie alle Prozesse, die zur Aufrechterhaltungsfunktion gehören, und setzen Sie diese um. Dazu gehören regelmäßige Backups kritischer Daten und Systeme mit Plänen, wie diese Assets wiederhergestellt werden können, sollten sie aufgrund einer Katastrophe oder eines Angriffs kompromittiert worden sein.
  • Reaktion auf Vorfälle (Incident Response): Entwickeln Sie eine Abfolge an Prozessen und Übungen, die genau und anschaulich erklären, wie ein Team auf einen Cyberangriff, eine Datenverletzung oder eine Katastrophe reagieren soll, inklusive genauer Anweisungen, wie sie eine Bedrohung erkennen und eindämmen, den Schaden einschätzen und betroffene Systeme wiederherstellen.
  • Kommunikation: Größere Unternehmen und Konzerne sollten in ihrem Disaster-Recovery-Plan Anweisungen geben, wie die Situation im Falle eines Angriffs an wichtige Stakeholder kommuniziert werden soll. Stakeholder sind betroffene Angestellte, Kunden, Lieferanten, Investoren und die Medien.
  • Trainings und Weiterbildung: Bauen Sie ein systematisches Trainings- und Weiterbildungsprogramm auf, um Angestellte über die Best Practices von Cybersicherheit und Disaster Resp0nse aufzuklären. Alle Mitarbeiter sollten die wichtigsten Aufgaben, die im Disaster-Recovery-Plan der Organisation enthalten sind, kennen und wissen, was im Falle einer Katastrophe auf sie zukommt.
  • Tests und Übungen: Regelmäßige Übungen und Tests des Disaster-Recovery-Plans sind entscheidend für seine Wirksamkeit. Sie erhöhen außerdem die Zuversicht auf Seiten der Angestellten, dass sie ihre Rollen und Verantwortlichkeiten kennen und im Fall der Fälle anwenden können.

Je besser Ihr Team die Bestandteile eines Disaster-Recovery-Plans versteht, desto besser sind sie in der Lage, einen eigenen Plan aufzustellen und zu testen, der die Bedürfnisse Ihrer Organisation oder die der jeweiligen Abteilung am besten erfüllt.

Einen Disaster-Recovery-Plan erstellen in einfachen Schritten

Cybersicherheit und IT-bezogene Disaster-Recovery-Pläne umfassen viele verschiedene Arbeitsteile, von der Vorbereitung und dem antizipierenden Planen bis hin zur Verteilung von Fachkräften und Ressourcen, wenn ein Vorfall eintritt.

Im Anschluss an die zentralen Bestandteile, die Sie weiter oben finden, sind hier einige wichtige Überlegungen, die Sie im Hinterkopf behalten sollten, wenn Sie Ihren Disaster-Recovery-Plan erstellen:

  1. Stellen Sie Ihr Team zusammen: Legen Sie die Rollen und Verantwortlichkeiten aller Teammitglieder sowie der einzelnen Abteilungen innerhalb Ihrer Organisation fest. Kurz gesagt sollten alle wissen, was im Rahmen des Disaster-Recovery-Plans ihre jeweiligen Aufgaben sind.
  2. Entwickeln Sie einen Vorfallsmanagementplan: Dieser Plan sollte eine umfassende Dokumentation aller Prozesse sein, die zur Anwendung kommen, um Bedrohungen und Cyberangriffe zu lokalisieren und zu melden. Dazu gehören Incident Response genauso wie Untersuchungs- und Wiederherstellungsprozesse.
  3. Führen Sie eine Business-Impact-Analyse (BIA) durch: Bei dieser Art von Analyse  identifizieren Sie diejenigen kritischen Systeme, Assets und Prozesse, die für die Organisation und ihre Abläufe essenziell sind. Sie kann dabei helfen, Prioritäten und Ziele für die Disaster Recovery aufzustellen.
  4. Etablieren Sie ein Recovery-Point-Objective (RPO): Diese Kennzahl definiert den maximal zulässigen Datenverlust gemessen in Zeit. Im Falle eines katastrophalen Vorfalls oder einer Betriebsstörung gibt das RPO an, wie alt ein Backup maximal sein darf bzw. in welchem Zustand es sein muss, damit eine Wiederherstellung der Daten die Organisation an einen normalen, betriebsfähigen Zustand zurückbringt.
  5. Legen Sie ein Recovery-Time-Objective (RTO) fest: Diese Kennzahl bestimmt die maximal zulässige Zeit, in der der Betrieb einer Organisation während einer Katastrophe stillliegen darf. RTO stellt die Ziel-Dauer dar, innerhalb derer Systeme und Infrastruktur auf einen betriebsfähigen Zustand wiederhergestellt werden müssen.
  6. Definieren und dokumentieren Sie Ihren Plan: Im Hauptteil Ihres Plans sollten Sie alle Komponenten, Prozesse und Ressourcen, die Ihren Disaster-Recovery-Plan ausmachen, kleinteilig beschreiben. Einige Überlegungen hierzu sind:
    • - Abhängigkeiten: Bestimmen Sie, welche Systeme und Prozesse voneinander abhängen, und beschreiben sie, wie diese genau miteinander interagieren.
    • - Wichtige Lieferanten: Identifizieren Sie alle kritischen Lieferanten und Partner, die Sie für den Betrieb Ihrer Organisation brauchen. Legen Sie einen Plan fest, wie Sie im Fall eines Vorfalls die Kontinuität mit diesen Partnern aufrechterhalten.
    • - Standorte: Falls verschiedene geografische Orte und physische Infrastruktur eine Rolle spielen, sollten Sie alle Wiederherstellungsorte auflisten, inklusive primärer und sekundärer Alternativen.
    • - Wiederherstellungsprozesse: Identifizieren und dokumentieren Sie alle Prozesse und Werkzeuge, die zur Wiederherstellung kompromittierter Systeme, Anwendungen und Daten je nach Art des Angriffs und der Cyberbedrohung zum Einsatz kommen sollen.
    • - Kommunikationsprozesse: Legen Sie fest, mithilfe welcher alternativen Technologien Sie kommunizieren wollen, insbesondere falls Ihre primären Kommunikationssysteme nicht zur Verfügung stehen. Überlegen Sie sich darüber hinaus eine Strategie dafür, welche Botschaft und welche Informationen Sie an Kunden, Partner und Angestellte vermitteln wollen.
    • - Testprotokolle: Dokumentieren Sie alle Testprotokolle, die die Wirksamkeit Ihres Plans bewerten können, und listen Sie für jedes Testprotokoll die notwendigen Schritte auf. Legen Sie außerdem fest, in welchen zeitlichen Abständen die Tests durchgeführt werden und wie weitreichend sie sein sollen.
  7. Testen Sie den Disaster-Recovery-Plan regelmäßig: Neben dem Aufstellen Ihres Teams und dem Einführen der notwendigen Prozesse ist es ebenso wichtig, regelmäßige Tests einzuplanen, um sicherzustellen, dass Ihr Plan alle potenziellen Cyberangriffe, Fehler und Katastrophen abdeckt.
  8. Überarbeiten und aktualisieren Sie den Plan regelmäßig: Bewerten Sie den Disaster-Recovery-Plan regelmäßig und passen Sie Ihn an, damit er mit den sich wandelnden Bedürfnissen und der sich stetig weiter entwickelnden Cybersicherheitslandschaft mithalten kann.

Wie setzt sich das Disaster-Recovery-Team zusammen?

Ein Disaster-Recovery-Plan ist nur so gut wie das Team, das ihn ausführt. Je nachdem, wie groß und komplex Ihre Organisation ist, sollten bestimmte Fachkräfte Teil Ihres Disaster-Recovery-Teams sein. Manche Teams bestehen aus hochgradig spezialisierten Fachkräften wie Cybersicherheitsingenieuren, Incident-and-Intrusion-Analysten, Sicherheitsanalysten und IT-Inspektoren. In vielen Fällen setzt sich das Team aus verschiedenen Fachkräften innerhalb des weiteren IT-Ökosystems der Organisation zusammen.

Chief-Information-Security-Officer (CISO)

In größeren Unternehmensumgebungen mit fortschrittlicheren IT-Systemen ist sind CISOs für die übergreifende Cybersicherheitsstrategie einer Organisation verantwortlich. Sie leiten die Disaster-Recovery-Leistungen mit an und beaufsichtigen alle Informationssysteme und Daten, um sie vor Cyberangriffen zu schützen.

IT-Sicherheitsteam

Als die spezialisierte Support-Crew unter der Leitung des CiSOs überwacht und schützt das IT-Sicherheitsteam die Netzwerke und Systeme der Organisation. Sie sind häufig die erste Verteidigungslinie beim Eindämmen von Cyberangriffen und führen die Incident-Response-Prozesse aus.

Netzwerkadministratoren

Diese Fachkräfte haben mitunter breit gefächerte Aufgabenbereiche beim Aufrechterhalten und Sichern von Netzwerken, Servern und anderer Infrastruktur des Unternehmens. Netzwerk-Admins spielen oftmals eine kritische Rolle bei Cybersicherheit und Disaster Recovery von kleineren Organisationen.

IT-Operations und -Support

Auch wenn Sie nicht immer direkt für Sicherheitsmonitoring und Incident Response verantwortlich sind, halten diese IT-Fachkräfte die Server, Datenspeicher und andere Hardware-Systeme der Organisation mit am Laufen. Es kommt auch vor, dass sie für Tech-Support und Fehlerbehebung zuständig sind, womit sie für jedes Disaster-Recovery-Team ein Gewinn sind.

Risiko-Management-Experten

Diese Spezialisten bewerten und verwalten die Risiken einer Organisation in Bezug auf Cyberangriffe und andere IT-Bedrohungen. Sie tragen wirksam dazu bei, potenzielle Angriffe vorherzusagen und zu simulieren, um Schwachstellen zu finden, und sie schlagen Verbesserungen vor, um reale Angriffe zu verhindern.

Rechtsabteilung und Compliance

Diese Fachkräfte kümmern sich im Zuge von Disaster Recovery darum, dass die Incident-Response-Strategien und Wiederherstellungsbemühungen einer Organisation mit den spezifischen Compliance-Anforderungen übereinstimmen.

Krisenkommunikation, Medien und Öffentlichkeitsarbeit

Das PR- und Medienteam einer Organisation ist meist eine getrennte Abteilung, die jedoch eng in die Disaster-Recovery-Arbeiten integriert sein sollte. Sie geben Neuigkeiten, Ergebnisse und Updates an wichtige Stakeholder rund um einen Vorfall weiter.

Business-Continuity-Plan-(BCP)-Manager

Diese Spezialrolle nimmt eine qualifizierte Fachkraft ein, die den Kontinuitätsplan einer Organisation während einer Katastrophe entwickeln, aufrechterhalten und umsetzen kann und damit ermöglicht, dass Betriebsabläufe wie geplant weitergehen können. BCP-Manager sind auch für das regelmäßige Testen und Aktualisieren des Plans je nach Bedarf zuständig.

In kleineren Unternehmen übernimmt eine Person häufig mehrere Rollen. In größeren Organisationen sind diese Rollen jedoch mitunter hochgradig individualisiert, wobei einzelne Verantwortlichkeiten auf eigene spezialisierte Fachkräfte verteilt werden.

Was ist ein Disaster-Recovery-Test?

Ein Disaster-Recovery-Test ist ein grundlegender Bestandteil des Betriebskontinuitäts- und Disaster-Recovery-Plans einer Organisation. Dabei wird eine Katastrophe wie ein Cyberangriff durch Ransomware, eine Datenverletzung, Stromausfälle oder eine Naturkatastrophe simuliert, um die Fähigkeit einer Organisation, die Kontrolle über Ihre IT-Systeme zurückzuerlangen, zu bewerten.

Disaster-Recovery-Tests helfen dabei, jegliche Schachstellen oder Lücken im Plan der Organisation zu identifizieren und sicherzustellen, dass die vorgesehenen Strategien und Prozesse kritische Systeme und Daten im Fall der Fälle zuverlässig wiederherstellen. Es gibt verschiedene Methoden, diese Art Test umzusetzen, zum Beispiel Ortsbesichtigungen, funktionale Tests, das theoretische Durchspielen von Szenarien und ein kompletter Test des gesamten Plans mit Unterbrechung des Betriebsablaufs.

Arten von Disaster Recovery

Katastrophen nehmen verschiedene Formen an und bedrohen die Stabilität von unterschiedlichen Systemen und Assets. Einige der häufigsten Arten von Disaster Recovery und die strategischen Initiativen, die dahinterstehen, sind:

Disaster Recovery für Rechenzentren

Bei dieser Art von Disaster Recovery geht es um die Sicherheit der physischen IT-Infrastruktur und jeglicher Daten-Backups. Zu den Strategien gehört ein als Ausfallsicherung fungierender zweiter Standort, um während einer Katastrophe die betriebliche Kontinuität sicherzustellen.

Cloud-Disaster-Recovery

Als kritischer Bestandteil jedes cloudbasierten Disaster-Recovery-Plans nutzen diese Strategien die Vorteile von Cloud-Lösungen, um die virtuellen und physischen Server einer Organisation nachzubilden und zu speichern. Dieser Disaster-Recovery-Ansatz aktiviert im Katastrophenfall automatisch eine Ausfallsicherung in der (öffentlichen) Cloud, sodass kein zweiter physischer Standort notwendig ist.

Network-Disaster-Recovery

Der Betrieb des Netzwerks ist entscheidend, um im Fall einer Bedrohung das Teilen von Daten, den Zugriff auf Anwendungen und Kommunikationswege aufrechtzuerhalten. Network-Disaster-Recovery legt den Fokus darauf, Backup-Daten und -Orte sowie einen Plan parat zu haben, wie die Kontrolle über Netzwerkdienste wiederhergestellt werden kann.

Virtualisierte Disaster Recovery

Virtualisierte Disaster Recovery ist ein Set an Strategien, die dazu dienen, Workloads auf einer alternativen Cloud oder einem alternativen Ort nachzubilden. Dieser Prozess gibt Cybersicherheitsteams größere Flexibilität, Effektivität und eine einfachere Umsetzung von Disaster-Recovery-Maßnahmen.

Disaster Recovery as a Service (DRaaS)

DRaaS ist eine kommerzielle Dienstleistung von externen Drittanbietern, die die virtuellen und physischen Server einer Organisation duplizieren und hosten. Dieser Drittanbieter übernimmt die Verantwortung für die Umsetzung und die Verwaltung der passenden Disaster-Recovery-Strategie und -Planung.

Disaster Recovery vs. Betriebskontinuität

Auch wenn Disaster Recovery und Betriebskontinuität miteinander verwandt und in den Cybersicherheitsprozessen einer Organisation eng miteinander verwoben sind, handelt es sich doch um zwei unterschiedliche Dinge. Disaster Recovery ist ein Set an Prozessen mit dem Fokus der Wiederherstellung von Datenzugriff und IT-Infrastruktur nach einem katastrophalen Ereignis. Bei Betriebskontinuität geht es darum, den Betrieb der Organisation während einer Katastrophe am Laufen zu halten.

Disaster-Recovery-Planung steuert und koordiniert das Team, sodass dieses nach einer Katastrophe oder einem Angriff in der Lage ist, Systeme und Daten erfolgreich wiederherzustellen. Betriebskontinuitätsplanung konzentriert sich darauf, dass funktionale Betriebsabläufe während des Vorfalls nicht zum Erliegen kommen.

Disaster Recovery liegt das Ziel zugrunde, den Schaden einer Katastrophe zu minimieren und der Organisation zu helfen, so schnell wie möglich wieder zu normalen Betriebsabläufen zurückzukehren. Das Ziel von Betriebskontinuität ist es, die Organisation in die Lage zu versetzen, sogar im Katastrophenfall intern weiterarbeiten und Kunden, Lieferanten und Partner weiterhin Dienstleistungen zur Verfügung stellen zu können.

Incident Management vs. Disaster Recovery

Disaster Recovery und Incident Management sind ähnliche Konzepte, unterscheiden sich jedoch in ihren Grundlagen. Incident Management konzentriert sich auf die Reaktion und die Auflösung einzelner Vorfälle, während es bei Disaster-Recovery-Plänen darum geht, den Betrieb der ganzen Organisation wiederherzustellen.

Incident Management ist ein kleinerer Teilbereich von Disaster Recovery, der sich um die unmittelbare Reaktion auf ein bestimmtes Ereignis kümmert, um so zeitnah wie möglich zu normalen Betriebsabläufen zurückkehren zu können.

Disaster-Recovery-Services von Proofpoint

Als Marktführer im Bereich der Cybersicherheitslösungen für Unternehmen hat sich Proofpoint auf den Schutz und die Wiederherstellung von Daten sowie auf Betriebskontinuitätsressourcen für eine große Bandbreite an Organisationen und Branchen spezialisiert. Proofpoint kann Ihr Team dabei unterstützen, einen Disaster-Recovery-Plan mitsamt Support-Systemen aufzustellen, um Datenverlust zu verhindern und Systeme wiederherzustellen. So bleibt Ihre Unternehmensproduktivität bestehen und die Downtime so minimal wie möglich.

Erfahren Sie mehr über die Lösungen und Fähigkeiten von Proofpoint.