RAID Datenrettung - RAID0, RAID1, RAID5, RAID6
Datenrekonstruktion von defekten SAN Systemen
Attingo Datenrettung rekonstruiert jeden Tag Daten von unterschiedlichsten RAID-Systemen.
Laufende Forschung und Entwicklung, tiefgreifendes Know-how der Funktion von RAID-Controllern durch Reverse Engineering
sowie mehr als 15 Jahre Erfahrung machen Attingo Datenrettung zu einem europaweit führenden Anbieter von RAID-Rekonstruktion.Wir rekonstruieren Daten von allen RAID-Systemen, unabhängig von Anzahl der Datenträger, Kapazität oder Hersteller.
Unsere Spezialisten helfen Ihnen
- telefonisch unter (01) 236 01 01 oder 0800 80 81 86,
- per eMail via info@attingo.at oder
- Sie senden uns online eine unverbindliche Diagnose-Anfrage.
Datenrettung und Datenwiederherstellung großer RAID Hersteller
areca
easyRAID
Infortrend
RAIDdeluxe
TopRAID
NASdeluxe
Open-E
FalconstorHäufige Ursachen für Datenverlust bei RAID-Systemen
Daten wiederherstellen nach Ausfall von mehreren Datenträgern im RAID
Je nach eingesetztem RAID-Level verkraftet ein RAID den Ausfall von einem oder mehreren Datenträgern. Zum Beispiel darf bei einem RAID5 ein Datenträger ausfallen, bei einem RAID6 sind es sogar zwei. Das RAID ist dann im Zustand "CRITICAL" oder "DEGRADED". Auf die Daten sollte ein normaler Zugriff möglich sein, jedoch sollte schnellstmöglich der defekte Datenträger ausgetauscht werden. Oft ist die Überwachung per Email oder SNMP nicht korrekt oder gar nicht konfiguriert. Der Ausfall eines Datenträgers im RAID-System wird erst bemerkt, wenn es bereits zu spät und ein Zugriff auf die Daten nicht mehr möglich ist. Attingo Datenrettung kann auch noch Daten von RAID-Systemen rekonstruieren, wenn mehr als die maximale erlaubte Anzahl an Datenträgern defekt oder ungültige Daten enthalten sind.Datenrettung nach fatalen RAID Rebuilds
Am häufigsten tritt Datenverlust bei RAID-Systemen während des sogenannten Rebuilds auf. Wenn ein Datenträger ausfällt und dieser getauscht wird, berechnet der RAID-Controller anhand der Daten der verbleibenden Datenträger den Inhalt des neuen, ersetzten Datenträgers. Dafür muss der RAID-Controller alle Sektoren aller Festplatten im RAID-System auslesen. Die Wahrscheinlichkeit, dass irgendwo eine weitere Festplatte zum Beispiel defekte Sektoren hat, ist überdurchschnittlich hoch. Sobald der RAID-Controller die Fehler erkennt, melden diese häufig den scheinbar weiteren defekten Datenträger ab. Das RAID-System ist offline und die Daten nicht mehr verfügbar. Ein Wiederherstellen der Daten ist erforderlich.RAID-Controller und RAID-Firmware
RAID-Controller funktionieren wie kleine Computer und steuern dutzende Megabyte an Software, um die Funktionalität zu ermöglichen. Software ist fehleranfällig. Eine häufige Ursache sind Bugs in der Firmware von RAID-Controllern. Durch jahrelange Erfahrung und Reverse Engineering von so gut wie allen auf dem Markt befindlichen Controllern ist Attingo zu der Erkenntnis gekommen, dass sogar teure Markengeräte immer wieder mit fehlerhafter Software bespielt sind. Ein häufiger Grund hierfür sind Firmwareupdates. Bei vielen Firmwareupgrades wird empfohlen, vorab ein Backup zu machen, allerdings wird nur selten der Grund dafür erläutert. Manchmal bewirken Aktualisierungen, dass das RAID nun einen anderen Algorithmus der Datenspeicherung anwendet und dies hat zur Folge, dass alle Daten verloren gehen können. Wenn nun keine Datensicherung stattgefunden hat oder die Meldung ignoriert wurde, gehen Daten unwiderruflich verloren.RAID Herstellersupport
Vor allem bei großen Herstellern werden beim Support Call-Center eingesetzt. Die Mitarbeiter haben keinerlei technische Ausbildung, sondern nur vorgefertigte Fragen-Antworten-Kataloge. Glaubt der Mitarbeiter, eine Frage eines Kunden erkannt zu haben, wird einfach die danebenstehende Antwort vorgelesen. Dies führt oft zu fatalen Schritten: Der Support eines großen Herstellers empfiehlt zum Beispiel laufend Kunden, bei Problem mit RAID-Systemen einfach die RAID-Konfiguration zu löschen und diese neu anzulegen. Danach sollte das RAID wieder funktionieren. Das ist auch meistens korrekt, jedoch gehen dabei alle Daten verloren.RAID nicht verfügbar
Bei RAID-Systemen sind zwar häufig Hardwareschäden die Ursache für einen Ausfall, allerdings treten ebenso Softwareschäden auf. Gerade weil heutzutage auf RAIDs mehrere virtuelle Server zeitgleich betrieben werden, sind die Ausfallschance und der Ausfallschaden oftmals größer als angenommen.Resizen – Änderung des RAID-Levels
Eine weitere Gefahr für den Ausfall eines RAIDs kann das sogenannte Resizen sein. Dies bedeutet, dass man den RAID-Level ändert, also zum Beispiel von RAID5 auf RAID6 umkonfiguriert oder das RAID expandet, indem man weitere Festplatten in das System einbaut, um eine höhere Speicherkapazität zu erhalten. Diese Vorgänge sind äußerst sensibel und daraus resultierende Probleme sind keine Seltenheit. Bereits kleinste Fehler in der Software oder Hardware können dazu führen, dass das RAID nicht mehr funktioniert. Daher raten wir, solche Vorgänge nur mit einem vollständig verifizierten Backup durchzuführen.Ausgefallener RAID - Rebuild
Ein Vorteil von RAIDs ist, dass Datenträger ausfallen können, ohne einen Datenverlust zu verursachen. Bei RAID5 darf eine Festplatte ausfallen, bei RAID6 zwei Festplatten. Immer wieder kommt es vor, dass der Ausfall von einer bzw. zwei Festplatten nicht bemerkt wird, entweder weil er ignoriert wird oder weil die Überwachung des RAIDs nicht korrekt eingestellt wurde. Bei dem Großteil unserer Fälle lief das RAID unbemerkt stunden- oder sogar tagelang im Degraded Modus weiter, was zu massiven Schäden am defekten Datenträger führte. Wenn ein weiterer Datenträger ausfällt und das RAID stillsteht, wird etwas unternommen. In der Regel sollte beim Ausfall einer Festplatte der defekte Datenträger ausgetauscht werden. Jedoch liegt hier bereits die nächste Fehlerquelle verborgen. Um ein Rebuild durchzuführen und den neu implementierten Datenträger berechnen zu können, muss das RAID auf alle anderen Festplatten und dort auf alle Sektoren zugreifen. Kommt es hier auch nur zu einem kleinen Lesefehler, wird der Vorgang abgebrochen und die fehlerhafte Platte wird ebenfalls abgemeldet, in Folge kann auf das RAID überhaupt nicht mehr zugegriffen werden.Ausfallgrund Serienfehler
In RAID-Systemen werden oftmals Festplatten derselben Serie verbaut, deshalb sind diese sehr anfällig für Serienfehler. Wenn bei einer Festplatte ein Fehler auftritt, dauert es meist nicht allzu lange, bis eine weitere Festplatte dasselbe oder zumindest ein ähnliches Problem aufweist. Bei einem Rebuild ist aus diesem Grund die Chance sehr hoch, dass es zu einem Fehler kommt und das RAID nicht mehr funktioniert. Wenn sich ein RAID im sogenannten Degraded Modus befindet - wenn also bereits Platten ausgefallen sind - und dann weitere ausfallen, meldet der RAID-Controller diese ab und das RAID geht offline.Datenverlust und fehlendes Know-how
Eine weitere, nicht außer Acht zu lassende Ursache für den Ausfall des RAID-Systems ist das "Herumspielen" mit den Einstellungen des Controllers und der Firmware durch den Support oder die interne/externe IT, ohne richtiges Fachwissen zu besitzen. Falsche Konfigurationen können im schlimmsten Fall zu einem physikalischen Verlust von Daten führen, wenn zum Beispiel einzelne Stripes neu überschrieben werden. Das bedeutet, dass die Daten nicht mehr vollständig rettbar sind. Attingo empfiehlt daher, keine "Experimente" durchzuführen, sondern sofort einen Fachmann aufsuchen, der sich tagtäglich mit der Materie beschäftigt.Weitere Gründe
Wenn man ein RAID übersiedelt oder nach langer Zeit aus- und einschaltet, kann es vorkommen, dass der Server nicht mehr hochfährt. Ein Grund hierfür können Serien- oder Firmwarefehler der verbauten Festplatten sein.
Des Weiteren kann das Durchführen von Dateisystemüberprüfungen (chdsk, fsck) oder ähnlichen Überprüfungs- und Rekonstruktions-Programmen, wenn diese bei einem Neustart des Servers automatisch stattfinden und nicht rechtzeitig abgebrochen werden, zu fatalen Schäden führen. Dies passiert zum Beispiel bei vertauschten Datenträgern und ist unabhängig vom RAID-Level.
Übersicht der häufigsten RAID-Level
RAID0 Datenrettung - Striping
RAID0-Systeme arbeiten nicht redundant, es werden keine Daten gespiegelt.
RAID0 bietet mehr Speicherplatz sowie schnellere Zugriffs- und Übertragungszeiten.
Wird ein Datenträger im RAID0 defekt, so ist der gesamte Verbund nicht mehr verfügbar.
Die meisten RAID0-Algorithmen verteilen die Daten abwechselnd in sogenannten Stripes auf alle Datenträger im Verbund.
Eine andere Variante sind Spanned Volumes oder JBOD, bei denen die Daten sequentiell auf die Datenträger im Verbund geschrieben werden.
Tritt Datenverlust in einem RAID0 auf, so können die Daten unabhängig von der Fehlerursache wiederhergestellt werden.
RAID1 Datenrettung - Mirroring
RAID1 führt eine Spiegelung der Daten durch. Das bedeutet, dass auf jeder Festplatte dieselben Daten vorhanden sind, unabhängig davon, wie viele Festplatten eingebaut sind. Dadurch gehen bei einem Defekt von einer Festplatte die Daten nicht sofort verloren. Allerdings wird der Ausfall einer Festplatte oft nicht bemerkt, sondern erst, wenn alle kaputt sind und das RAID nicht mehr funktioniert.
RAID5 Datenrettung - Parity
Der Vorteil von RAID5 ist eine schnellere Zugriffszeit und eine Redundanz von einer Festplatte. Dies bedeutet, dass ein Datenträger komplett ausfallen kann, ohne dass Daten verloren gehen und das System trotzdem weiterläuft (Degraded Mode). Dies wird durch eine Paritätsberechnung über XOR ermöglicht, allerdings ist die Form der Datenspeicherung nicht standardisiert. Attingo hat durch Forschung nahezu alle Controller reverse engineert und kann diese auch virtuell simulieren.
Datenrettung RAID6 und Datenrettung RAID DP
RAID6 ist in den Grundlagen einem RAID5 sehr ähnlich mit dem Unterschied, dass bis zu zwei Festplatten ausfallen können. Der Controller weist weit höhere Hardwareanforderungen auf, da hier die zusätzliche Parität mit Hilfe von sehr komplexen mathematischen Funktionen berechnet wird, was auch eine Datenrettung extrem aufwendig macht. Aber auch hier hat Attingo so gut wie alle Controller bereits reverse engineert und kann diese virtuell simulieren.
SAN - Storage Area Network bzw. iSCSI Storages
Bei SAN handelt es sich in den meisten Fällen um RAID-Systeme, die via iSCSI an Server oder Workstation angebunden sind. Die häufigsten Fehlerursachen sind meistens wie oben beschrieben als auch Bugs in der iSCSI-Software.Ihre nächsten Schritte
Hilfe bei Datenverlust
Datenverlust bedeutet in den meisten Fällen Ausnahmezustand. Kontaktieren Sie uns! Unser Job ist es Ihren durch Datenverlust entstehenden Schaden auf ein Minimum zu reduzieren.Unsere Spezialisten helfen Ihnen
- telefonisch unter (01) 236 01 01 oder 0800 80 81 86,
- per eMail via info@attingo.at oder
- Sie senden uns online eine unverbindliche Diagnose-Anfrage.
Ihr Ansprechpartner
Maximilian Maurer
Kundenbetreuung
Telefon: (01) 236 01 01
E-Mail: info@attingo.at
Attingo Vorteil 1
Datenrettung in High-Priority 24x7
Bei Datenverlust erreichen Sie uns Mo-So, 0-24h. Qualifizierte Ingenieure bearbeiten Ihren Daten-rettungsfall rund um die Uhr.0-24h Datenrettung

