Cluster je skupina počítačů (uzlů), které spolupracují na poskytování sdíleného řešení. Na vysoké úrovni lze na shluk pohlížet tak, že má tři části (často definované jako shlukový zásobník).
Základní pojmy
- Zdroje: To jsou důvody, proč je klastr službami, které je třeba udržovat vysoce dostupné.
- Agenti zdrojů: Jedná se o skripty, součásti operačního systému, které spouštějí, zastavují a monitorují prostředky podle sady parametrů prostředků.
- Oplocení: Jedná se o skripty, které provádějí akce oplocení uzlu zadanému cíli a zařízení oplocení.
- Oplocení: Možnost deaktivovat uzly.
- Kvorum: Zapouzdřuje schopnost určit, zda může cluster pokračovat v bezpečném provozu nebo ne.
Typy clusterů
Tyto čtyři typy jsou následující:
- Vysoká dostupnost (HA): Používá se pro Fault Tolerance, aby byly služby serveru dostupné zaměstnancům nebo zákazníkům.
- Vyrovnávání zátěže: Vyrovnává zatížení mezi více systémy, když služba potřebuje být dostupná pro více systémů najednou (lze použít pro další tři typy Clusterů).
- Distribuce: Úlohy budou spravovány různými systémy.
- Paralelní (Beowulf): Úlohy jsou spravovány více procesory na více systémech.
Také podle konfigurace existuje několik typů clusterů:
- Ruční shlukování: Umožňuje ručně klasifikovat, slučovat a rozdělovat clustery, pokud výstup algoritmů automatického třídění špiček není uspokojivý.
- Sloučení clusterů: Když se zdá, že více shluků odpovídá stejné jednotce.
- Rozdělení shluků: Nový shluk můžete vytvořit nakreslením mnohoúhelníku kolem sady hrotů v zobrazení prvku, zobrazení amplitudy, zobrazení amplitudy šablony nebo zobrazení atributu hrotu.
POZNÁMKA: My zde v Rackspace většinou používáme HA a občas LB clustery. V Rackspace používáme termín Red Hat Cluster Suite (RHCS) na RHEL 6 a Pacemaker Configuration System csd daemon daemonm (PCS) na RHEL 7, abychom zajistili konektivitu mezi uzly clusteru a poskytli platformu pro clusterové služby.
Sada clusterů poskytuje nástroje pro vytváření, konfiguraci a ovládání clusteru.
Důvody, proč mít cluster
Existují různé důvody pro použití clusteru. Používáme je k poskytování odolného a vysoce dostupného backendu pro řešení. To je primárně pro backendové služby jako MySQL, NFS nebo Redis, kde může být služba za frontendem webových serverů.
Vysoká dostupnost je poskytována prostřednictvím automatického převzetí služeb při selhání – pokud dojde k selhání na uzlu clusteru, clusterové služby běžící na tomto uzlu se automaticky přemístí do uzlu, který běží správně.
Clustery budou obecně používat sdílené úložiště (SAN), takže data budou trvalá, když se služby přesouvají mezi uzly.
V případě, že uzel přestane reagovat, bude obvykle tento uzel restartován (chráněn) jinými uzly, aby byla zachována integrita dat sdíleného úložiště a pohyblivé vlastnictví IP.
Linux Open Source High Availability Clustering
Někteří prodejci operačního systému Linux nabízejí software pro clustering, jako je SUSE Linux HAE; Red Hat Enterprise Linux (RHEL); a Oracle Real Application Clusters (RAC).
I když vám umožňují vytvořit cluster s podporou převzetí služeb při selhání, představují řadu problémů, je to vysoce manuální a náchylné k lidské chybě.
Rozšíření HA s otevřeným zdrojovým kódem pro Linux vyžadují vysoký stupeň technických dovedností, což vytváří problémy se složitostí a spolehlivostí, které jsou výzvou pro většinu operátorů.
SUSE
SUSE Linux Enterprise Server a Red Hat Enterprise Linux obě řešení nabízejí prostředí SAN i SANless, ale vyžadují instalaci a konfiguraci replikačního softwaru s názvem DRBD v operačním systému pro podporu replikace dat v prostředí bez SAN. Bohužel to vyžaduje náročné vlastní skriptování, které může trvat dlouho, než se otestuje a ověří, a vyžaduje opětovné testování, když jsou provedeny jakékoli aktualizace prostředí. Vzhledem k tomu, že tyto společnosti jsou především společnostmi zabývajícími se operačními systémy, jejich podpora je zaměřena na problémy na úrovni operačního systému a často neexistuje žádná nebo jen malá odbornost HA, která by zákazníkovi pomohla s jeho problémy.
Oracle Reak Application Clusters (RAC)
Oracle RAC je řešení s vysokou dostupností, ale je primárně navrženo pro úroveň správy databází. To znamená, že budete potřebovat jiné řešení HA pro ty komponenty, které provádějí monitorování, správu a obnovu vašich aplikačních vrstev. Oracle RAC je také velmi drahý a vyžaduje, abyste kromě platby za možnost RAC upgradovali na Oracle Enterprise Edition ve srovnání s jinými řešeními pro clustering Linux, jako je SIOS Protection Suite.
Sada SIOS Protection Suite pro Linux Clustering
Sada SIOS Protection Suite pro Linux poskytuje těsně integrovanou kombinaci klastrování s vysokou dostupností převzetí služeb při selhání, nepřetržitého monitorování aplikací, replikace dat a konfigurovatelných zásad obnovy, které chrání vaše kritické podnikové aplikace před výpadky a katastrofami. Zatímco SIOS Protection Suite může fungovat v prostředí SAN a podporovat tradiční HA hardwarový cluster, architektura využívá sdílený přístup ke clusterování serverů, který umožňuje provozovat bez SAN. Přináší robustní, všestranné a snadno konfigurovatelné řešení s automatickými a manuálními zásadami obnovení/obnovení po selhání/failback pro širokou škálu aplikací.
SIOS Protection Suite pro Linux obsahuje:
- SIOS LifeKeeper: Poskytuje flexibilní software pro klastrování při selhání, který monitoruje celý zásobník aplikací.
- SIOS DataKeeper: Poskytuje rychlou a efektivní replikaci dat na úrovni hostitelů na úrovni bloku pro zrcadlení místního úložiště v konfiguraci clusteru bez SAN nebo replikaci do vzdálených umístění nebo cloudu pro obnovu po havárii.
- Multiple Application Recovery Kit (ARKs): S automatizovanými konfiguračními a ověřovacími nástroji zabudovanými do produktu, které chrání vaše kritické obchodní aplikace a data před výpadky a katastrofami.
Je to hloubka znalostí týmu SIOS v oblasti obnovy aplikací a automatizace řešení pro monitorování a obnovu aplikací, která usnadňuje používání a je lepší a levnější volbou ve srovnání s linuxovými clusterovými řešeními nabízenými SUSE, Red Hat a Oracle.
Kromě toho SIOS LifeKeeper podporuje všechny hlavní linuxové distribuce, včetně Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS a Oracle Linux a podporuje širokou škálu architektur úložiště. Software SIOS byl přizpůsoben a optimalizován pro provoz na těchto operačních systémech a komponenty jsou testovány, aby bylo zajištěno, že clusterové řešení SANless bude fungovat na každém OS.
A konečně, se sadou SIOS Protection Suite pro Linux můžete provozovat své důležité podnikové aplikace ve flexibilním, škálovatelném cloudovém prostředí, jako je Amazon Web Services (AWS), aniž byste museli obětovat výkon, vysokou dostupnost nebo ochranu před katastrofami.
Linux Clustering v AWS
I když poskytovatelé cloudu, jako je AWS, poskytují možnosti vysoké dostupnosti, neposkytují úroveň vysoké dostupnosti a šíři ochrany v celé aplikační infrastruktuře, kterou zákazníci požadují a kterou jste kdysi dosáhli pomocí clusterů před cloud computingem. To je důvod, proč AWS spolupracuje se SIOS. SIOS Protection Suite pro Linux dosahuje těchto požadovaných úrovní vysoké dostupnosti pro naše společné zákazníky a kritické aplikace, které přesouvají do cloudu AWS.
SIOS Protection Suite pro Linux na AWS poskytuje všechny prvky, které potřebujete k vytvoření vysoce dostupného linuxového clusteru ve virtuálním privátním cloudu (VPC) v rámci jedné oblasti AWS ve dvou zónách dostupnosti. Podporuje také okamžitou ochranu pro systémy SAP, databáze Oracle a další kritické obchodní aplikace.
SIOS a AWS nabízejí rychlý start SIOS Protection Suite na AWS, který vám pomůže vytvořit plně nakonfigurovaný a funkční cluster s vysokou dostupností Linuxu v několika krátkých krocích. Nastaví architekturu AWS pro sadu SIOS Protection Suite pro Linux a nasadí ji do vašeho účtu AWS přibližně za půl hodiny. Tento Rychlý start, dostupný na AWS Marketplace, je určen pro podnikové uživatele, kteří chtějí nasadit SIOS Protection Suite pro Linux na AWS do svého testovacího nebo produkčního prostředí.
Služba SIOS Clustering pro Linux
SIOS je společnost s vysokou dostupností, která se posledních 20 let soustředila na poskytování HA, která je speciálně navržena pro SAP, SQL, Linux, Oracle a další aplikace. Jeho zkušenosti jsou zabudovány do jeho produktu a instalace a konfigurace zabere zlomek času a nákladů ve srovnání s vlastním skriptováním v distribucích Linuxu. Kromě toho SIOS testuje a ověřuje nové verze operačních systémů a aplikací, takže jeho zákazníci to dělat nemusí. Když zákazník zavolá na SIOS podporu, je spojen s odborníkem na vysokou dostupnost – s někým, kdo se zaměřuje pouze na HA a věnuje se tomu již velmi dlouho.
V Linuxu je nejpoužívanějším softwarem Pacemaker
Přehled kardiostimulátorů
Infrastruktura klastru High Availability Add-On poskytuje základní funkce pro skupinu počítačů (nazývané uzly nebo členové), aby spolupracovaly jako klastr. Jakmile je klastr vytvořen pomocí klastrové infrastruktury, můžete použít další komponenty, aby vyhovovaly vašim potřebám klastrování (například nastavení klastru pro sdílení souborů v systému souborů GFS2 nebo nastavení převzetí služeb při selhání). Clusterová infrastruktura provádí následující funkce:
- Správa clusteru.
- Správa zámku.
- Oplocení.
- Správa konfigurace clusteru.
Architektura kardiostimulátoru
Cluster nakonfigurovaný pomocí Pacemaker obsahuje samostatné démony komponent, které monitorují členství v clusteru, skripty, které spravují služby, a podsystémy správy prostředků, které monitorují různorodé zdroje. Následující komponenty tvoří architekturu Pacemaker:
Cluster Information Base (CIB)
Informační démon Pacemaker, který interně používá XML k distribuci a synchronizaci aktuálních konfiguračních a stavových informací z Designated Coordinator (DC), což je uzel přiřazený Pacemakerem k ukládání a distribuci stavu a akcí clusteru pomocí CIB do všech ostatních uzlů clusteru.
Démon CRMd (Cluster Resource Management Daemon)
Akce prostředků clusteru Pacemaker jsou směrovány přes tohoto démona. Prostředky spravované CRMd mohou být dotazovány klientskými systémy, přesouvány, konkretizovány a v případě potřeby změněny.
Každý uzel klastru také obsahuje démona místního správce prostředků (LRMd), který funguje jako rozhraní mezi CRMd a prostředky. LRMd předává příkazy z CRMd agentům, jako je spouštění a zastavování a předávání stavových informací.
Zastřelte druhý uzel do hlavy (STONITH)
STONITH, často nasazovaný ve spojení s vypínačem napájení, funguje jako klastrový prostředek v Pacemakeru, který zpracovává požadavky oplocení, násilně vypíná uzly a odstraňuje je z klastru, aby byla zajištěna integrita dat. STONITH je konfigurován v CIB a lze jej monitorovat jako běžný prostředek clusteru.
corosync je komponenta – a stejnojmenný démon – která slouží základním potřebám členství a komunikace mezi členy pro clustery s vysokou dostupností. Je vyžadován pro funkci doplňku High Availability Add-On.
Kromě těchto funkcí členství a zasílání zpráv, corosync také:
Spravuje pravidla a určování kvora.
Poskytuje možnosti zasílání zpráv pro aplikace, které koordinují nebo pracují napříč více členy clusteru, a proto musí mezi instancemi předávat stavové nebo jiné informace.
Nástroje pro konfiguraci a správu kardiostimulátorů
Pacemaker obsahuje dva konfigurační nástroje pro nasazení, monitorování a správu clusteru.
PCS může ovládat všechny aspekty Pacemakeru a démona srdečního tepu Corosync. Programy založené na příkazovém řádku mohou počítače provádět následující úlohy správy clusteru:
- Vytvořte a nakonfigurujte cluster Pacemaker/Corosync.
- Upravte konfiguraci clusteru, když je spuštěný.
- Vzdáleně konfigurujte Pacemaker i Corosync a také spouštějte, zastavujte a zobrazujte informace o stavu clusteru.
Webové uživatelské rozhraní pcsd
Grafické uživatelské rozhraní pro vytváření a konfiguraci clusterů Pacemaker/Corosync se stejnými funkcemi a schopnostmi jako obslužný program pro počítače z příkazového řádku.
Aby byla zachována integrita a dostupnost clusteru, používají klastrové systémy koncept známý jako kvorum, aby se zabránilo poškození a ztrátě dat. Cluster má kvorum, když je více než polovina uzlů clusteru online. Aby se zmírnila možnost poškození dat v důsledku selhání, Pacemaker ve výchozím nastavení zastaví všechny prostředky, pokud cluster nemá kvorum.
V klastrovém systému může být mnoho uzlů pracujících na několika důležitých produkčních datech. Uzly v zaneprázdněném clusteru s více uzly by se mohly začít chovat nevyzpytatelně nebo se stát nedostupnými, což by ze strany administrátorů vyžadovalo akci. Problémy způsobené chybnými uzly clusteru lze zmírnit vytvořením politiky oplocení.
Když Pacemaker zjistí, že uzel selhal, sdělí ostatním komponentám klastrové infrastruktury, že uzel selhal. STONITH oplotí neúspěšný uzel, když je upozorněn na poruchu. Další součásti infrastruktury clusteru určují, jaké akce mají být provedeny, což zahrnuje provedení jakékoli obnovy, kterou je třeba provést. Například DLM a GFS2, když jsou upozorněni na selhání uzlu, pozastaví aktivitu, dokud nezjistí, že STONITH dokončil oplocení neúspěšného uzlu. Po potvrzení, že je neúspěšný uzel chráněn, provedou DLM a GFS2 obnovu. DLM uvolní zámky uzlu, který selhal; GFS2 obnoví žurnál neúspěšného uzlu.
Oplocení na úrovni uzlů prostřednictvím STONITH lze konfigurovat s řadou podporovaných oplocení, včetně:
- Uninterruptible Power Supply (UPS): Zařízení obsahující baterii, kterou lze použít k ochraně zařízení v případě výpadku napájení.
- Power Distribution Unit (PDU): Zařízení s více elektrickými zásuvkami používané v datových centrech pro čistou distribuci energie a také služby oplocení a izolace napájení.
- Zařízení pro ovládání výkonu nožů: Vyhrazené systémy nainstalované v datovém centru konfigurovaném tak, aby chránily uzly clusteru v případě selhání.
- Zařízení s vypnutým osvětlením: Zařízení připojená k síti, která spravují dostupnost uzlu clusteru a mohou provádět oplocení, zapínání a vypínání a další služby správci místně nebo vzdáleně.
Třídy vysoce dostupných doplňkových zdrojů Red Hat
Existuje několik tříd agentů zdrojů podporovaných doplňkem Red Hat High Availability Add-On:
- LSB: Agent Linux Standards Base abstrahuje vyhovující služby podporované LSB, jmenovitě ty služby v /etc/init.d a související návratové kódy pro úspěšné a neúspěšné stavy služby (spuštěno, zastaveno, stav spuštěno).
- OCF: Open Cluster Framework je nadmnožinou LSB (Linux Standards Base), která nastavuje standardy pro vytváření a provádění inicializačních skriptů serveru, vstupní parametry pro skripty pomocí proměnných prostředí a další.
- systemd: Nejnovější správce systémových služeb pro systémy založené na Linuxu systemd používá sady souborů jednotek spíše než inicializační skripty, stejně jako LSB a OCF. Tyto jednotky mohou být vytvořeny ručně správci nebo je dokonce mohou vytvářet a spravovat samotné služby. Pacemaker spravuje tyto jednotky podobným způsobem, jakým spravuje iniciační skripty OCF nebo LSB.
- Začátek: Podobně jako systemd je Upstart alternativní správce inicializace systému pro Linux. Upstart používá úlohy, na rozdíl od jednotek ve skriptech systemd nebo init.
- STONITH: Zdrojový agent výhradně pro šermířské služby a plotové agenty používající STONITH.
- Nagios: Agenti, kteří abstrahují zásuvné moduly pro nástroj pro monitorování systému Nagios a infrastruktury.
Sledování zdrojů
Chcete-li zajistit, aby prostředky zůstaly zdravé, můžete do definice zdroje přidat operaci monitorování. Pokud pro zdroj neurčíte operaci monitorování, ve výchozím nastavení příkaz pcs vytvoří operaci monitorování s intervalem, který je určen agentem zdroje.
Omezení zdrojů
Chování prostředku v klastru můžete určit konfigurací omezení. Můžete nakonfigurovat následující kategorie omezení:
- Omezení umístění: Omezení umístění určuje, na kterých uzlech může prostředek běžet.
- Omezení objednávky: Omezení pořadí určuje pořadí, ve kterém budou zdroje spuštěny.
- omezení umístění: Omezení kolokace určuje, kam budou zdroje umístěny vzhledem k ostatním zdrojům.
Jako zkratka pro konfiguraci sady omezení, která naleznou sadu zdrojů společně a zajistí, že se zdroje spustí postupně a zastaví se v opačném pořadí, podporuje Pacemaker koncept skupin zdrojů.
Skupiny prostředků
Jedním z nejběžnějších prvků clusteru je sada prostředků, které je třeba umístit společně, spustit postupně a zastavit v opačném pořadí. Pro zjednodušení této konfigurace podporuje Pacemaker koncept skupin.
Skupinu prostředků vytvoříte pomocí příkazu pcs resource s uvedením prostředků, které se mají do skupiny zahrnout. Pokud skupina neexistuje, tento příkaz skupinu vytvoří. Pokud skupina existuje, tento příkaz přidá do skupiny další prostředky. Prostředky se spustí v pořadí, v jakém je určíte pomocí tohoto příkazu, a zastaví se v opačném pořadí, než je jejich počáteční pořadí.
Odkazy
- Komponenty clusteru – Clusterlabs
- Syndrom rozděleného mozku – Techtarget
- Linux Clustering – SIOS
- Shlukování – fy
- Linux Cluster – Linux.org
- Úvod do clusterů – Linux Blimp
- Přehled kardiostimulátoru – Red Hat
Pomocí karty Zpětná vazba můžete přidat komentáře nebo položit otázky. Můžete s námi také zahájit konverzaci.