chyba-tolerantní
Chyba-tolerantní technologie je schopnost počítačového systému, elektronického systému nebo sítě pro poskytování nepřetržité služby, i přes jednu nebo více jeho složek nedaří. Odolnost proti chybám také řeší potenciální přerušení služby související se softwarovými nebo logickými chybami. Účelem je zabránit katastrofickému selhání, které by mohlo vyplynout z jediného bodu selhání.
VMware vSphere 6 Fault Tolerance je značková, nepřetržitá Architektura dostupnosti dat, která přesně replikuje virtuální stroj VMware na alternativním fyzickém hostiteli, pokud selže hlavní hostitelský server.
systémy odolné proti poruchám jsou navrženy tak, aby kompenzovaly více poruch. Takové systémy automaticky detekují selhání počítačové procesorové jednotky, i / o subsystému, paměťových karet, základní desky, napájení nebo síťových komponent. Je identifikován bod selhání a záložní součást nebo postup okamžitě zaujme své místo bez ztráty služby.
aby byla zajištěna odolnost proti chybám, musí podniky zakoupit inventář formátovaného počítačového vybavení a sekundární nepřerušitelné napájecí zařízení. Cílem je zabránit zhroucení klíčových systémů a sítí se zaměřením na problémy spojené s provozuschopností a prostoji. Odolnost proti chybám může být poskytnuta se softwarem zabudovaným v hardwaru, nebo nějakou kombinací těchto dvou.
v implementaci softwaru poskytuje operační systém (OS) rozhraní, které umožňuje programátorovi kontrolovat kritická data v předem určených bodech v rámci transakce. V hardwarové implementaci (například se Stratusem a jeho virtuálním operačním systémem) si programátor nemusí být vědom schopností stroje odolných proti chybám.
na hardwarové úrovni je tolerance chyb dosažena duplexem každé hardwarové komponenty. Disky jsou zrcadleny. Více procesorů je uzamčeno dohromady a jejich výstupy jsou porovnány pro správnost. Pokud dojde k anomálii, je vadná součást určena a vyřazena z provozu, ale stroj nadále funguje jako obvykle.
odolnost proti chybám vs. vysoká dostupnost
Fault tolerance je úzce spojena s udržováním kontinuity podnikání prostřednictvím vysoce dostupných počítačových systémů a sítí. Prostředí odolná proti chybám jsou definována jako prostředí, která obnovují službu okamžitě po výpadku služby, zatímco prostředí s vysokou dostupností usiluje o pět devíti provozních služeb.
V high-availability clusteru, sady nezávislé servery jsou spolu volně spolu se zárukou, systém-široký sdílení důležitých dat a zdrojů. Klastry navzájem monitorují zdraví a poskytují obnovu poruch, aby zajistily, že aplikace zůstanou k dispozici. Naopak cluster odolný proti chybám se skládá z více fyzických systémů, které sdílejí jednu kopii operačního systému počítače. Softwarové příkazy vydané jedním systémem jsou také prováděny na druhém systému.
kompromis mezi odolností proti chybám a vysokou dostupností je nákladný. Systémy s integrovanou odolností proti poruchám způsobují vyšší náklady v důsledku zahrnutí dalšího hardwaru.
co je to půvabná degradace?
Fault tolerance je často používán synonymně s elegantní degradaci, i když ta je více sladěna s více celostní disciplína chyba managementu, který si klade za cíl odhalit, izolovat a řešit problémy preventivně. Systém odolný proti chybám vymění záložní komponenty za účelem udržení vysoké úrovně dostupnosti a výkonu systému. Půvabná degradace umožňuje systému pokračovat v provozu, i když ve sníženém stavu výkonu.
odpovídající ochrana dat a odolnost proti chybám
odolnost proti chybám závisí na redundanci. Konkrétně jsou informace redundantně chráněny replikací dat nebo synchronním zrcadlením svazků do datového centra mimo lokalitu. Pro fyzickou redundanci zůstává další hardwarové vybavení v pohotovostním režimu pro převzetí služeb při selhání operačních systémů.
zálohování dat je často kombinováno s redundancí. Obě strategie jsou zamýšleny jako Ochrana proti ztrátě dat, ačkoli zálohování má tendenci se soustředit na obnovu point-in-time, včetně granulární obnovy diskrétního datového objektu. Redundantní systémy jsou navrženy speciálně pro pracovní zatížení aplikací, které tolerují velmi malé prostoje.
při implementaci odolnosti proti chybám by podniky měly přizpůsobit požadavky na dostupnost dat odpovídající úrovni ochrany dat pomocí redundantního pole nezávislých disků (RAID). Technika RAID zajišťuje, že data jsou zapsána na více pevných disků, a to jak pro vyvážení I / O operací, tak pro zvýšení celkového výkonu systému.
organizace, které upřednostňují odolnost proti chybám nad rychlostí a výkonem, by nejlépe sloužily zrcadlení disků RAID 1 nebo RAID 10, které kombinuje zrcadlení disků a pruhování disků. Pokud jsou odolnost proti chybám a výkon systému stejně důležité, může být pro podnik užitečné utratit trochu peněz navíc kombinací RAID 10 s RAID 6 nebo RAID s dvojitou paritou, který toleruje ztrátu dvou selhání disku před ztrátou dat. Kromě vyšších nákladů je další nevýhodou zápis dat do sady RAID pomalejší.
Kromě hardwaru, chyba-tolerantní architektura by měla být koordinována s pravidelně plánované zálohování kritických dat, možná včetně zrcadlové kopírování na sekundární nebo alternativní umístění. Bezpečnost musí být součástí plánování, aby se zabránilo neoprávněnému přístupu, a použít antivirové nástroje, a nejnovější verze výpočetního systému OS.
která průmyslová odvětví závisí na odolnosti systému proti chybám?
Fault tolerance se vztahuje nejen na důsledek nadbytečné vybavení, ale také na zem-up metodika počítač tvůrci používají, aby inženýr a design svých systémů pro spolehlivost. Odolnost proti chybám je požadovaná konstrukční specifikace počítačového vybavení používaného v systémech online zpracování transakcí, jako jsou systémy řízení letu a rezervací leteckých společností. Systémy odolné proti poruchám jsou také široce používány v odvětvích, jako je distribuce a logistika, elektrické elektrárny, těžká výroba, průmyslové řídicí systémy a maloobchod.