Articles

fehlertolerant

Fehlertolerante Technologie ist die Fähigkeit eines Computersystems, elektronischen Systems oder Netzwerks, einen unterbrechungsfreien Dienst bereitzustellen, obwohl eine oder mehrere seiner Komponenten ausfallen. Fehlertoleranz behebt auch mögliche Serviceunterbrechungen im Zusammenhang mit Software- oder Logikfehlern. Ziel ist es, katastrophale Ausfälle zu verhindern, die sich aus einem einzigen Fehlerpunkt ergeben können.

VMware vSphere 6 Fault Tolerance ist eine Markenarchitektur für kontinuierliche Datenverfügbarkeit, die eine virtuelle VMware-Maschine auf einem alternativen physischen Host exakt repliziert, wenn der Haupthostserver ausfällt.

Fehlertolerante Systeme sind darauf ausgelegt, Mehrfachausfälle zu kompensieren. Solche Systeme erkennen automatisch einen Ausfall der Computerprozessoreinheit, des E / A-Subsystems, der Speicherkarten, des Motherboards, der Stromversorgung oder der Netzwerkkomponenten. Der Fehlerpunkt wird identifiziert, und eine Sicherungskomponente oder -prozedur tritt sofort an ihre Stelle, ohne dass der Dienst verloren geht.

Um Fehlertoleranz zu gewährleisten, müssen Unternehmen ein Inventar formatierter Computerausrüstung und ein sekundäres unterbrechungsfreies Stromversorgungsgerät erwerben. Ziel ist es, den Absturz wichtiger Systeme und Netzwerke zu verhindern und sich auf Probleme im Zusammenhang mit Verfügbarkeit und Ausfallzeiten zu konzentrieren. Fehlertoleranz kann mit in Hardware eingebetteter Software oder durch eine Kombination der beiden bereitgestellt werden.In einer Softwareimplementierung stellt das Betriebssystem (OS) eine Schnittstelle bereit, die es einem Programmierer ermöglicht, kritische Daten an vorbestimmten Punkten innerhalb einer Transaktion zu überprüfen. Bei einer Hardwareimplementierung (z. B. mit Stratus und seinem virtuellen Betriebssystem) muss der Programmierer die fehlertoleranten Fähigkeiten der Maschine nicht kennen.

Auf Hardwareebene wird die Fehlertoleranz durch Duplexen jeder Hardwarekomponente erreicht. Festplatten werden gespiegelt. Mehrere Prozessoren werden zusammengeschlossen und ihre Ausgänge werden auf Korrektheit verglichen. Wenn eine Anomalie auftritt, wird die fehlerhafte Komponente ermittelt und außer Betrieb genommen, aber die Maschine funktioniert weiterhin wie gewohnt.

Fehlertoleranz vs. hochverfügbarkeit

Fehlertoleranz ist eng mit der Aufrechterhaltung der Geschäftskontinuität über hochverfügbare Computersysteme und Netzwerke verbunden. Fehlertolerante Umgebungen werden als solche definiert, die den Dienst nach einem Dienstausfall sofort wiederherstellen, während eine Hochverfügbarkeitsumgebung fünf Neunen Betriebsdienst anstrebt.

In einem Hochverfügbarkeits-Cluster sind Sätze unabhängiger Server lose miteinander gekoppelt, um die systemweite gemeinsame Nutzung kritischer Daten und Ressourcen zu gewährleisten. Die Cluster überwachen sich gegenseitig und bieten Fehlerbehebung, um sicherzustellen, dass Anwendungen verfügbar bleiben. Umgekehrt besteht ein fehlertoleranter Cluster aus mehreren physischen Systemen, die sich eine einzige Kopie des Betriebssystems eines Computers teilen. Softwarebefehle, die von einem System ausgegeben werden, werden auch auf dem anderen System ausgeführt.

Der Kompromiss zwischen Fehlertoleranz und hoher Verfügbarkeit sind die Kosten. Systeme mit integrierter Fehlertoleranz verursachen aufgrund der Einbeziehung zusätzlicher Hardware höhere Kosten.

Was ist Graceful Degradation?

Fehlertoleranz wird oft synonym mit Graceful Degradation verwendet, obwohl letztere eher auf die ganzheitlichere Disziplin des Fehlermanagements ausgerichtet ist, die darauf abzielt, Probleme präventiv zu erkennen, zu isolieren und zu lösen. Ein fehlertolerantes System tauscht Backup-Komponenten aus, um ein hohes Maß an Systemverfügbarkeit und -leistung aufrechtzuerhalten. Graceful Degradation ermöglicht es einem System, den Betrieb fortzusetzen, wenn auch in einem reduzierten Leistungszustand.

Passende Datensicherung und Fehlertoleranz

Fehlertoleranz hängt von Redundanz ab. Informationen werden nämlich redundant durch Datenreplikation oder synchrones Spiegeln von Volumes in ein externes Rechenzentrum geschützt. Aus Gründen der physischen Redundanz bleibt zusätzliche Hardwareausrüstung für das Failover von Betriebssystemen im Standby-Modus.

Datensicherung ist häufig mit Redundanz verbunden. Beide Strategien sind als Schutz vor Datenverlust gedacht, obwohl sich die Sicherung in der Regel auf die Wiederherstellung zu einem bestimmten Zeitpunkt konzentriert, einschließlich der granularen Wiederherstellung eines diskreten Datenobjekts. Redundante Systeme wurden speziell für Anwendungsworkloads entwickelt, die nur sehr geringe Ausfallzeiten tolerieren.

Bei der Implementierung von Fehlertoleranz sollten Unternehmen die Anforderungen an die Datenverfügbarkeit mit Redundant Array of Independent Disks (RAID) an das entsprechende Datenschutzniveau anpassen. Die RAID-Technik stellt sicher, dass Daten auf mehrere Festplatten geschrieben werden, um den E / A-Betrieb auszugleichen und die Gesamtleistung des Systems zu steigern.

Organisationen, die Fehlertoleranz über Geschwindigkeit und Leistung priorisieren, sind am besten mit RAID 1-Festplattenspiegelung oder RAID 10 bedient, bei dem Festplattenspiegelung und Festplattenstriping kombiniert werden. Wenn Fehlertoleranz und Systemleistung gleichermaßen wichtig sind, kann es sich für ein Unternehmen lohnen, ein wenig mehr Geld für die Kombination von RAID 10 mit RAID 6 oder Doppelparitäts-RAID auszugeben, das den Verlust von zwei Festplattenfehlern toleriert, bevor Daten verloren gehen. Abgesehen von den höheren Kosten besteht der andere Nachteil darin, dass Daten langsamer in das RAID-Set geschrieben werden.Abgesehen von der Hardware sollte eine fehlertolerante Architektur mit regelmäßig geplanten Sicherungen kritischer Daten koordiniert werden, möglicherweise einschließlich einer gespiegelten Kopie an einem sekundären oder alternativen Speicherort. Sicherheit muss Teil der Planung sein, um unbefugten Zugriff zu verhindern und Antiviren-Tools und die neueste Version des Betriebssystems des Computersystems anzuwenden.

Welche Branchen sind auf Systemfehlertoleranz angewiesen?

Fehlertoleranz bezieht sich nicht nur auf die Folge redundanter Geräte, sondern auch auf die grundlegende Methodik, mit der Computerhersteller ihre Systeme auf Zuverlässigkeit hin entwickeln und entwerfen. Fehlertoleranz ist eine erforderliche Entwurfsspezifikation für Computerausrüstung, die in Online-Transaktionsverarbeitungssystemen wie Flugsteuerungs- und Reservierungssystemen von Fluggesellschaften verwendet wird. Fehlertolerante Systeme sind auch in Branchen wie Vertrieb und Logistik, Elektrokraftwerken, Schwerindustrie, industriellen Steuerungssystemen und Einzelhandel weit verbreitet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.