GNU/Linux >> Znalost Linux >  >> Linux

RAID pro ty, kteří se mu vyhýbají

Veškerý hardware nakonec selže. To je jeden z bolestivých vedlejších účinků entropie v našem vesmíru. U většiny typů hardwaru používaného v moderní infrastruktuře obvykle ztráta jediné součásti způsobí určité prostoje. Kromě času potřebného k výměně něčeho, jako je špatný procesor nebo paměť RAM, systémoví správci nebo uživatelé jen zřídka vidí mnoho dlouhodobých škodlivých účinků. Pokud však administrátor nebude dávat zvláštní pozor na úložiště, ztráta dat v důsledku selhání disku může mít okamžité a trvalé následky.

Vezměte si jako příklad pracovní plochu uživatele:Pokud ukládají svá data lokálně na jeden disk, pak když disk nevyhnutelně selže, jejich data budou ztracena. Totéž platí bez ohledu na kvalitu, značku nebo typ pohonu. Samozřejmě existují jednotky pro obnovu dat, které by rády přijaly těžce vydělané peníze výměnou za možnost vzkřísit bity z mrtvých disků. Bohužel se náklady rychle stanou přemrštěnými a dokonce i tito specialisté v určitém okamžiku zaostávají.

Správci mají k dispozici řadu možností, jak odrazit hrozící katastrofu:RAID, zálohy, clustery síťových úložišť atd. Tyto možnosti se často používají ve spojení k zajištění vrstev ochrany dat a mnoha příležitostí k zastavení problému, než se stane příliš pozdě. Vytváření redundantních polí disků a abstrahování úložiště od jednotlivých jednotek je nejjednodušší a nejlepší způsob, jak odstranit tyto jednotlivé body selhání. Cílem je vyhnout se pozdním nocím a prodlouženým víkendům obnovování ze záloh (které, doufejme, někdo dělal), nebo placení extrémních poplatků firmám pro obnovu.

Co je RAID?

Redundant Arrays of Inexpensive Disks (RAID) je jednou z nejpoužívanějších a nejúčinnějších technologií úložiště, se kterou se správce systému setká. Být spokojen s jeho nejběžnějšími implementacemi je životně důležitý. RAID lze nabídnout jako softwarové řešení prostřednictvím nástroje operačního systému, jako je mdadm v Linuxu hardwarový řadič RAID, jako je řada karet MegaRAID, nebo dokonce čipové sady, které poskytují schopnosti pseudo-RAID. Hardwarové řadiče, jako jsou ty v řadě MegaRAID, by se neměly zaměňovat s adaptéry hostitelské sběrnice (HBA), jsou však navrženy pro jednoduchý a přímý přístup k diskům. HBA existují jako způsob poskytování konektivity bez inteligence řadiče RAID a následně jsou mnohem levnější.

Na vysoké úrovni je koncept RAID seskupením kolekce disků do pole, aby se přes ně zapisovala data. V závislosti na konfiguraci budou data zapsána různými způsoby, s různým množstvím paritních informací, které pomohou znovu sestavit data v případě selhání disku. I když je možné použít různé typy, rychlosti, velikosti nebo připojení pro disky v poli, je nejlepší, aby se co nejvíce shodovaly. Různě velké disky téměř vždy skončí s nejnižším společným jmenovatelem a disky s různými rychlostmi musí čekat na nejpomalejší.

Mnoho správců však raději kupuje disky od různých výrobců, aby se vyhnuli tomu, že špatné dávky disků způsobí souběžné poruchy napříč členy polí.

Úrovně RAID

Vzhledem k tomu, že konfigurace RAID jsou pojmenovány v úrovních, schéma číslování implikuje lineární stupnici postupu od jedné konfigurace ke druhé, i když mnoho úrovní spolu nesouvisí. Každá úroveň RAID má své klady a zápory a některé úrovně jsou užitečnější než jiné. V reálném světě jsou nejběžnější úrovně 0, 1, 5, 6, 10, 50 a 60. Úrovně RAID 2, 3, 4 a několik dalších také existují, ale jsou proprietární, zastaralé nebo zřídkakdy používané. Může to znít jako hodně, ale když se tato informace rozebere, bude snáze stravitelná.

RAID 0

Většina úrovní RAID odpovídá určitému případu použití. Počínaje polem RAID 0 jsme zjistili, že je vytvořen bez ohledu na interní redundanci, protože každý disk poskytuje poli svou plnou kapacitu jako použitelné úložiště. Protože jsou data rozdělena a zapisována na všechny disky paralelně, vidíme výhodu. Když jsou čtení a zápisy prováděny na takto nakonfigurovaném poli, mohou být velmi rychlé, protože se lineárně škáluje podle počtu disků zahrnutých v poli.

Technicky vzato, ačkoli můžete z jednoho disku vytvořit pole RAID 0, ve skutečnosti byste to dělali s alespoň jedním párem disků. Hlavní nevýhodou RAID 0 je obecně to, že pokud některý disk zmizí, celé pole selže a data budou ztracena. Tato konfigurace není vhodná pro produkční použití, kde data nežijí v jiném snadno dostupném systému. RAID 0 může být naprosto rozumné nastavení pro pracovní stanici koncového uživatele, která potřebuje vysoký výkon, kde však tato pracovní stanice není jediným domovem pro data, na kterých se pracuje.

RAID 1

RAID 1 byl navržen se zcela odlišným cílem než RAID 0. Místo prokládání dat přes sadu disků pro rychlost bez jakékoli ochrany poskytuje RAID 1 správci možnost zrcadlit data přes dva nebo více disků pro zajištění odolnosti. Tato úroveň RAID poskytuje lokální kopii (nebo kopie) dat, která pomáhá proti selhání jednoho disku, a využívá data ze zdravých disků k obnově dat po výměně.

Obvykle se zrcadla RAID 1 skládají z páru disků, ale mohou obsahovat tři nebo více, v závislosti na tom, kolik kopií bloků musí správce mít online. Je důležité zdůraznit, že to není záloha. Tato data existují jako živá kopie disku v systému a neposkytují ochranu běžného zálohovacího systému. Tato zrcadla jsou klony 1:1, takže disky musí mít stejnou velikost, jinak ztratí prostor pro umístění nejmenšího disku v sadě.

Bez ohledu na počet disků přidaných do pole RAID 1 zůstává celková kapacita stejná. Tato kapacita je velikost jednoho disku v poli (nejmenší, pokud nejsou identické), ale počet kopií dat se zvyšuje s každým dalším diskem bez zvýšení celkové kapacity. Každý disk je dalším klonem dat, který poskytuje další ochranu před selháním jednotlivých disků.

Počet disků, které lze do pole přidat, je omezen na základě používaného softwaru a/nebo řadiče, ke kterému jsou připojeny.

RAID 2 až 4

Úrovně RAID 2, 3 a 4 jsou zastaralé, proprietární nebo velmi vzácné. Je nepravděpodobné, že mnoho sysadminů poběží na systémech s některou z těchto tří konfigurací a za normálních okolností je lze efektivně ignorovat. Pokud zjistíte, že pracujete na systému, na kterém běží některý z těchto systémů, nejlepším řešením je přečíst si dokumentaci dodavatele a zjistit, jak jej nejlépe spravovat.

RAID 5

Kromě použití RAID 0 k prokládání dat napříč sbírkou disků bez ochrany nebo použití RAID 1 k získání určité redundance, ale omezující kapacity, nabízí RAID 5 skvělý střed se zápisem dat na více disků a zároveň poskytuje poli určitou úroveň redundance. . RAID 5 to dělá tak, že zapisuje informace o paritě na každý disk, takže může znovu sestavit data z libovolného jednotlivého disku.

Při použití RAID 5 přichází do hry nový požadavek, že pole musí obsahovat minimálně tři disky. Kapacita se pak rovná součtu disků mínus velikost jednoho z nich. Například RAID 5 se sedmi 2TB disky má nakonec 12 TB (7 x 2 je 14 a mínus disk je 12).

Když jeden z těchto disků skončí v poruše, správce jej může vyměnit a nechat systém znovu sestavit náhradu s daty ze zbytku pole pomocí výše zmíněných informací o paritě. Tato konfigurace má dvě hlavní nevýhody. Zaprvé je zde zásah do výkonu zápisu (při zápisu skutečných dat existuje režie při zápisu všech těch extra bitů paritních informací). Za druhé, během přestavby je pole zranitelné vůči úplné ztrátě, pokud selže také jeden ze zdravých disků. V závislosti na pracovním vytížení stroje by přestavba mohla způsobit náhlý nárůst aktivity těchto disků a skončit tak, že by selhal i jeden ze zdravých disků. Tato obava je důvodem, proč se v současnosti mnoho správců rozhoduje pro RAID 6.

RAID 6

Přirozený vývoj RAID 5, RAID 6, přebírá stejný základní koncept a rozšiřuje „jediný disk“ paritních informací na pár disků. I když se pro paritu nepoužívá celá kapacita jednotlivých disků, celková kapacita disků se využívá napříč polem a RAID 6 využívá k udržení paritních bitů prostor v hodnotě dvou disků.

Použití dalšího místa na disku následně znamená, že minimální počet disků pro pole RAID 6 vzroste na čtyři. Tato zdánlivě jednoduchá změna může znamenat svět dobra, pokud jde o přestavbu neúspěšného disku a stále provozování pole. Můžete mít pocit, že další selhání nebude znamenat úplnou ztrátu dat uložených lokálně na počítači.

Vnořený RAID

Za úrovněmi 0, 1, 5 a 6 se ocitáme v myšlence vnořit úrovně RAID dohromady, abychom vytvořili nové konfigurace, které nabízejí nové možnosti úložiště. Nejběžnější a nejpřínosnější jsou 10, 50 a 60; každá je kombinací 1, 5 a 6 plus 0.

RAID 10

Kombinace 1 a 0 může znít, jako by to měl být znovu RAID 5, ale nejlepší způsob, jak si tyto vnořené úrovně představit, je ve dvou dimenzích. Pro RAID 10 bereme více Pole RAID 1 a prokládejte je, jako by tato pole byly disky, čímž z nich vytvoříte pole RAID 0. Kvůli tomuto faktoru vyžaduje RAID 10 alespoň čtyři disky:dva pro zrcadlení a pár těchto zrcadel. Dostáváme pole s rychlostí jako RAID 0, ale těží z vnitřní redundance RAID 1. Pole RAID 10 by selhalo pouze tehdy, když selže jedno z interních polí RAID 1.

V každém páru RAID 1 (nebo vícenásobném zrcadle, pokud se tak rozhodne správce) je obnova možná, když je třeba vyměnit disky, takže celá sada členů RAID 1 by musela selhat, aby samotný RAID 10 podlehl ztrátě dat. . Přestavby jsou také různé. V RAID 5 musí být data načtena ze všech disků v poli, aby bylo možné vypočítat nové bity z parity, která byla dříve zapsána. RAID 10, protože používá RAID 1, čte z klonu(ů) neúspěšného disku, aby jej znovu sestavil.

RAID 50

Stejně jako RAID 10 nám RAID 50 dává možnost vytvořit rychlé pole z nadbytečných. Skončíme u RAID 0 zahrnujícího řadu polí RAID 5, podobně jako RAID 10 byla sada polí RAID 1. Zde začínáme vidět, jak do obrazu vstupuje spousta disků i pro ty nejjednodušší nastavení. Vzhledem k tomu, že základní RAID 5 vyžaduje tři disky, RAID 50 by jich vyžadovalo celkem alespoň šest, protože se jedná o minimálně dvojici polí RAID 5.

Opět, podobně jako u RAID 10, je tato možnost nejlepší ze dvou světů. RAID 50 nám poskytuje extra rychlost díky přidání více disků přidaných paralelně, přičemž nám stále poskytuje informace o vnitřní paritě z konfigurace RAID 5. RAID 50 může odolat selhání více disků, pokud nejsou ve stejném vnořeném poli RAID 5.

RAID 60

V tuto chvíli by RAID 60 neměl být žádným překvapením, protože jde o stejné logické rozšíření RAID 6 až 60 jako byl RAID 5 až 50. Největší přidanou výhodou je zvýšení rychlosti, kterého lze dosáhnout, v kombinaci s masivním zvýšením redundance poskytované ve více kopiích paritních informací a úzkým rozsahem selhání pro každé vnořené pole. Pole RAID 60 začínají na osmi jednotkách, protože každý RAID 6 je alespoň čtyři, v násobcích alespoň dvou polí.

RAID vs. zálohy

Zdá se, že jedním z nejčastěji zastávaných výroků v oblasti správy systému je:"RAID není záloha." Pro nové administrátory nebo ty, kteří netráví mnoho času přemýšlením o úložišti, nemusí být tato skutečnost hned zřejmá. Může se to dokonce zdát antagonistické nebo zcela nesprávné.

Problém vychází ze skutečnosti, že redundance zabudovaná do konfigurací RAID je vytvořena se stejnými cíli jako zálohování:Boj proti ztrátě dat. Důvodem, proč je tak důležité mluvit o rozdílu, není hnidopišství, ale připomenutí si, že tyto nástroje existují proto, aby nám poskytly vrstvy ochrany, a když je spojíme dohromady, uděláme si medvědí službu.

RAID existuje proto, aby poskytoval okamžitou živou kopii dat, která pomáhá běžícímu stroji jako berlička, když se po klopýtnutí zvedne zpět. Na druhou stranu zálohy nabízejí příležitost otestovat naši schopnost obnovit stroj do funkčního stavu nebo obnovit data, aniž bychom potřebovali, aby stroj běžel. Zálohy nám poskytují další výhody, které RAID tak dobře nemá, včetně možnosti přenést kopie na více míst na více typech médií a uložit více verzí.

RAID a zálohy plní různé role, ale obě jsou důležité a ani jedna by neměla být opomíjena.


Linux
  1. MySQL – Převod na data podle tabulky pro InnoDB

  2. Top 5 nástrojů pro migraci dat pro Linux

  3. Pseudo soubory pro dočasná data?

  1. Prostředí podobné shellu pro binární zpracování?

  2. Použití souborů pro sdílenou paměť IPC

  3. Jak sledovat raid souborového systému BTRFS na chyby?

  1. Top 5 softwaru pro zálohování dat pro Linux

  2. Alternativa pro Mendeley pro Ubuntu?

  3. Soulad s GDPR pro globální poskytovatele spravovaných služeb