odporna na awarie
technologia Odporna na awarie to zdolność systemu komputerowego, systemu elektronicznego lub sieci do zapewnienia nieprzerwanej usługi, pomimo awarii jednego lub więcej jego komponentów. Odporność na błędy eliminuje również potencjalne przerwy w świadczeniu usług związane z błędami oprogramowania lub logiki. Celem jest zapobieganie katastrofalnym awariom, które mogą wynikać z pojedynczego punktu awarii.
VMware vSphere 6 Fault Tolerance to markowa Architektura ciągłej dostępności danych, która dokładnie replikuje maszynę wirtualną VMware na alternatywnym hoście fizycznym w przypadku awarii głównego serwera hosta.
systemy Odporne na awarie są zaprojektowane w celu kompensacji wielu awarii. Takie systemy automatycznie wykrywają awarię jednostki procesora komputera, podsystemu We / Wy, kart pamięci, płyty głównej, zasilacza lub elementów sieci. Punkt awarii jest identyfikowany, a komponent lub procedura kopii zapasowej natychmiast zajmuje jego miejsce bez utraty usługi.
aby zapewnić odporność na awarie, przedsiębiorstwa muszą zakupić zapas sformatowanego sprzętu komputerowego i zapasowego urządzenia zasilającego. Celem jest zapobieganie awariom kluczowych systemów i sieci, koncentrując się na kwestiach związanych z przestojami i przestojami. Odporność na awarie może być dostarczana z oprogramowaniem wbudowanym w sprzęt lub przez pewną kombinację tych dwóch.
w implementacji oprogramowania System operacyjny (OS) zapewnia interfejs, który pozwala programiście na kontrolowanie krytycznych danych w określonych punktach transakcji. W implementacji sprzętowej (na przykład ze Stratus i jego wirtualnym systemem operacyjnym) programista nie musi być świadomy możliwości maszyny odpornej na awarie.
na poziomie sprzętowym tolerancja błędów jest osiągana przez dupleksowanie każdego komponentu sprzętowego. Dyski są lustrzane. Wiele procesorów jest blokowanych razem, a ich wyjścia są porównywane pod kątem poprawności. W przypadku wystąpienia anomalii wadliwy komponent jest wykrywany i wycofywany z eksploatacji, ale maszyna nadal działa jak zwykle.
tolerancja błędów vs. wysoka dostępność
odporność na awarie jest ściśle związana z utrzymaniem ciągłości działania poprzez wysoce dostępne systemy komputerowe i sieci. Środowiska Odporne na awarie są definiowane jako te, które przywracają usługę natychmiast po awarii usługi, podczas gdy środowisko o wysokiej dostępności dąży do pięciu dziewiątek usługi operacyjnej.
w klastrze wysokiej dostępności zestawy niezależnych serwerów są luźno połączone, aby zagwarantować ogólnosystemowe udostępnianie krytycznych danych i zasobów. Klastry monitorują wzajemnie stan zdrowia i zapewniają usuwanie usterek, aby zapewnić dostępność aplikacji. Odwrotnie, klaster odporny na błędy składa się z wielu systemów fizycznych, które dzielą jedną kopię systemu operacyjnego komputera. Polecenia programowe wydawane przez jeden system są również wykonywane na drugim systemie.
kompromis między odpornością na awarie a wysoką dostępnością to koszt. Systemy ze zintegrowaną odpornością na awarie ponoszą wyższe koszty dzięki zastosowaniu dodatkowego sprzętu.
co to jest degradacja?
odporność na błędy jest często używana synonimicznie z degradacją graceful, chociaż ta ostatnia jest bardziej dostosowana do bardziej holistycznej dyscypliny zarządzania błędami, która ma na celu wykrywanie, izolowanie i rozwiązywanie problemów prewencyjnie. Odporny na awarie system zamienia się w komponencie zapasowym, aby utrzymać wysoki poziom dostępności i wydajności systemu. Pełna gracji degradacja pozwala systemowi kontynuować pracę, choć w obniżonym stanie wydajności.
dopasowanie ochrony danych i odporności na awarie
odporność na awarie zależy od redundancji. Mianowicie, informacje są redundantnie chronione poprzez replikację danych lub synchroniczne dublowanie woluminów do zewnętrznego centrum danych. W przypadku fizycznej redundancji dodatkowy sprzęt pozostaje w stanie gotowości do przełączania awaryjnego systemów operacyjnych.
backup danych jest często łączony z redundancją. Obie strategie mają na celu zabezpieczenie przed utratą danych, chociaż tworzenie kopii zapasowych koncentruje się głównie na odzyskiwaniu w czasie, w tym na granularnym odzyskiwaniu dyskretnego obiektu danych. Redundantne systemy są zaprojektowane specjalnie z myślą o obciążeniach aplikacji, które tolerują bardzo mało przestojów.
wdrażając odporność na awarie, przedsiębiorstwa powinny dopasować wymagania dotyczące dostępności danych do odpowiedniego poziomu ochrony danych za pomocą redundantnej macierzy niezależnych dysków (RAID). Technika RAID zapewnia zapisywanie danych na wielu dyskach twardych, zarówno w celu zrównoważenia operacji We / Wy, jak i zwiększenia ogólnej wydajności systemu.
organizacje, które stawiają na odporność na awarie powyżej szybkości i wydajności, najlepiej obsługiwać za pomocą RAID 1 Disk mirroring lub RAID 10, który łączy dublowanie dysku i striping dysku. Jeśli odporność na błędy i wydajność systemu są równie ważne, przedsiębiorstwo może uznać, że warto wydać trochę dodatkowych pieniędzy łącząc RAID 10 z RAID 6 lub DOUBLE-parity RAID, który toleruje utratę dwóch awarii dysku przed utratą danych. Oprócz wyższych kosztów, Inną Wadą jest to, że zapis danych odbywa się wolniej do zestawu RAID.
oprócz sprzętu, Architektura odporna na awarie powinna być koordynowana z regularnie planowanymi kopiami zapasowymi krytycznych Danych, być może w tym kopią lustrzaną w lokalizacji wtórnej lub alternatywnej. Bezpieczeństwo musi być częścią planowania, aby zapobiec nieautoryzowanemu dostępowi i zastosować narzędzia antywirusowe i najnowszą wersję systemu operacyjnego.
które branże zależą od tolerancji usterek systemu?
odporność na awarie odnosi się nie tylko do konsekwencji posiadania redundantnego sprzętu, ale także do podstawowej metodologii, którą twórcy komputerów wykorzystują do projektowania i projektowania swoich systemów pod kątem niezawodności. Tolerancja błędów jest wymaganą specyfikacją projektową dla sprzętu komputerowego używanego w systemach przetwarzania transakcji online, takich jak systemy kontroli lotu linii lotniczych i systemy rezerwacji. Systemy odporne na uszkodzenia są również szeroko stosowane w takich sektorach, jak dystrybucja i logistyka, elektrownie, ciężka produkcja, przemysłowe systemy sterowania i Sprzedaż detaliczna.