GNU/Linux >> Znalost Linux >  >> Linux

Linux Fault Tolerance:Linux High Availability

Odstávky IT jsou pro každou firmu drahé. Gartner[I] odhaduje, že každá minuta výpadku stojí v průměru 5 600 USD, přičemž skutečné náklady závisí na odvětví, velikosti společnosti a dalších faktorech. Náklady se však lze do značné míry vyhnout se systémy navrženými pro vysokou dostupnost a odolnost proti chybám.

Definice:Vysoká dostupnostOracle[II] definuje vysokou dostupnost jako „výpočetní prostředí nakonfigurovaná tak, aby poskytovala dostupnost téměř na plný úvazek“. Běžně používaným standardem pro vysokou dostupnost je „pět devítek“ neboli 99,999 procenta provozuschopnosti.

Ne všichni poskytovatelé služeb jsou schopni splnit tento robustní standard, který umožňuje jen něco málo přes 5 minut výpadku za rok.

Pro organizace, které by se přiblížily průměrným nákladům na prostoje, je dosažení ještě vyšší dostupnosti než „pět devítek“ důležité pro ziskovost a dokonce i přežití. Atlantic.net nabízí špičkovou 100% záruku dostupnosti sítě, částečně díky využití Linux High Availability (Linux-HA).

Úvod do High Availability

Jak vysvětluje Oracle, sítě jsou konfigurovány pro vysokou dostupnost díky využití redundantního hardwaru a softwaru a vyhýbání se jednotlivým „bodům selhání“, aby systém zůstal v provozu v případě problému. Pracovní zátěž rozděluje mezi části sítě nástroj pro vyrovnávání zátěže, který přesměrovává provoz mimo jakoukoli komponentu, která selhala nebo byla přepnuta do režimu offline.

Servery seskupené dohromady pro jednotné fungování pomocí nástroje pro vyrovnávání zatížení se nazývají cluster. Systém, který i nadále funguje správně, když jedna z jeho součástí selže, je považován za odolný proti poruchám. Automatický přesun provozu nebo pracovní zátěže v rámci clusteru, aby se zabránilo selhání, se nazývá proces převzetí služeb při selhání, a když je použit, může koncový uživatel pokračovat v používání aplikace, i když dojde k selhání serveru, na kterém je.

Primární výhodou systémů s vysokou dostupností je snížení nákladů v důsledku neplánovaných odstávek. Vyvažování zátěže nejen zvyšuje spolehlivost, ale může také zlepšit rychlost obnovy pomocí automatizace a detekce chyb. Dále může také zlepšit výkon aplikací.

"I když je aplikace špatně napsaná nebo má problémy se škálováním, nástroj pro vyrovnávání zátěže může zlepšit uživatelské prostředí bez jakýchkoli dalších změn."

NGINX [III]

Schopnost aktualizovat systémové komponenty bez přepnutí celého systému do režimu offline také pomáhá zajistit, aby úkoly údržby, jako je zálohování a aktualizace, byly prováděny správně a nebyly spěchány s opětovným uvedením do provozu. Systémy s vysokou dostupností poskytují další ochranu tím, že umožňují organizacím proaktivně monitorovat svou síť a snižují riziko ztráty dat pomocí redundantního úložiště.

Vysoká dostupnost může být také cenná nebo dokonce nezbytná pro zajištění souladu s předpisy, jako je hosting vyhovující standardu HIPAA. Bezpečnostní pravidlo HIPAA[IV] požaduje, aby „informace byly dostupné a použitelné na vyžádání“, a také plán pro nepředvídané události, který zajistí, že tomu tak zůstane „během neočekávaných negativních událostí“, jako je neočekávaná poptávka nebo selhání hardwaru.

Zabudování odolnosti proti chybám ve vaší síti

Některé běžně používané produkty pro vyrovnávání zátěže, které mohou poskytnout odolnost proti chybám, zahrnují Apache Zookeeper, Pacemaker a HAProxy. Zookeeper[V] je open-source koordinační služba pro distribuované systémy, která poskytuje vysokou dostupnost při běhu na více serverech. Běží na síťových uzlech v lichých „souborech“ a koordinuje je prostřednictvím jmenného prostoru datových registrů, které vytváří. Pacemaker[VI] je správce klastrových zdrojů, je také open source a byl původně součástí projektu Linux-HA, ale od té doby se stal jeho vlastním. Také běží na uzlech a koordinuje je prostřednictvím služby infrastruktury clusteru, jako je Heartbeat nebo OpenAIS.

Naproti tomu HAProxy[VII] je součástí zařízení Atlantic.Net Managed Firewall.

Odolnost proti chybám je zajištěna kontrolou redundantních síťových zdrojů ze strany HAProxy. Pokud server selže, HAProxy použije jeden z řady algoritmů, které obsahuje, k přesměrování provozu pryč od problému a na redundantní server, který má pro tento účel připravený. Přechod na nový server trvá zhruba sekundu, zatímco uvedení havarovaného serveru do režimu online může trvat hodiny. Náklady na tento redundantní server jsou obecně ušetřeny snížením prostojů během pouhých minut od okamžiku, kdy k tomu dojde.

HAProxy nejenže pomáhá vašemu webu v případě, že jeden server selže nebo je potřeba jej odstavit z důvodu údržby, ale také může být nastaven tak, aby vyrovnal zatížení vašeho webového provozu, když jsou oba servery v provozu, čímž se prodlouží doba odezvy vašich zákazníků.

HAProxy je také open-source a je nyní dodáván s mnoha populárními distribucemi Linuxu. Aktivní komunita HAProxy neustále aktualizuje software a nové verze lze nasadit bez překonfigurování. HAProxy obsluhuje miliardy webových stránek denně a přesouvá velké množství peněz pro společnosti z Fortune 500 a je bez chyby ve stabilní (dokončené) verzi nebo bez jediného známého průniku již 13 let.

Vzájemně propojené doporučené postupy

Ve scénáři, ve kterém škodlivý síťový provoz způsobí selhání, vyrovnávání zátěže obecně problém samo o sobě nevyřeší. Brána firewall, která filtruje provoz, zabraňuje tomu, aby problém jednoduše sledoval zátěž na nový server. Podobně filtrování provozu brány firewall jen málo snižuje zranitelnost sítě vůči selhání hardwaru nebo softwarovým chybám v ní. Využití silného firewallu a systému s vysokou dostupností poskytuje dramatické zlepšení celkové ochrany.

Síť s vestavěnou redundancí, s pracovní zátěží řízenou nástrojem pro vyrovnávání zátěže, je tolerantní i k nejhorším chybám a poskytuje maximální dostupnost. Stejně jako správná kombinace různých komponent zajišťuje spolehlivost sítě, organizace, které by těžily z vysoké dostupnosti, ji dosáhnou pomocí nástroje pro vyrovnávání zátěže, jako je HAProxy, spolu s úplnou sadou redundantních síťových komponent.

S řešením VPS Hosting společnosti Atlantic.Net zajistíme, aby byly vaše servery na vyžádání nastaveny pro vysokou dostupnost. V kombinaci s naším zařízením Managed Firewall to poskytuje spolehlivé řešení, které zabrání výpadkům vašeho webu, když to nejvíce potřebujete. Potřebujete-li pomoc nebo další informace, napište nám na [email protected]. Náš prodejní tým vás může rychle a snadno provést celým procesem.

[I] http://blogs.gartner.com/andrew-lerner/2014/07/16/the-cost-of-downtime/

[II] https://docs.oracle.com/cd/A91202_01/901_doc/rac.901/a89867/pshavdtl.htm

[III] https://www.nginx.com/blog/10-tips-for-10x-application-performance/

[IV]https://www.hhs.gov/sites/default/files/ocr/privacy/hipaa/administrative/securityrule/securityrulepdf.pdf?language=es

[V] https://cwiki.apache.org/confluence/display/ZOOKEEPER/ProjectDescription

[VI] http://wiki.clusterlabs.org/wiki/Pacemaker

[VII] http://www.haproxy.org/


Linux
  1. RCRON – Nastavení vysoké dostupnosti úloh cron

  2. Co je velká a nízká paměť v Linuxu?

  3. Upozornění na chyby segmentace webového serveru Linux / Apache

  1. Jak nakonfigurovat převzetí služeb při selhání a vysokokapacitní síťové vazby v systému Linux

  2. Linux – Určení konkrétního souboru odpovědného za vysoké I/O?

  3. Linux – Co je velká a nízká paměť v Linuxu?

  1. Linux – Jsou různá jádra Linux/unix zaměnitelná?

  2. Linuxový příkaz mv

  3. Linux du command