GNU/Linux >> Znalost Linux >  >> Linux

Příběhy Linuxu:Když zálohy zachránily den

Tento článek je příběhem z mé minulosti. Kdysi jsem pracoval jako správce systému pro společnost, která provozovala internetový obchod, který prodával počítačový hardware a software.

V zadní části desítky zaměstnanců využívaly terminálový server k práci s ERP softwarem, který spravoval veškeré zboží a obchod. Terminálové servery a databáze byly rozhodující pro obchodní proces prodeje našich produktů. Když jeden z těchto systémů selhal, desítky zaměstnanců nemohly dělat svou práci a zákazníci si už nemohli nic koupit.

Jak dlouho máme?

Sedli jsme si tedy s majitelem obchodního procesu a zeptali jsme se:„Přemýšlejte o situaci, kdy je systém rozbitý a již není použitelný. Jak dlouho se musíte zotavovat, než by škoda na společnosti byla zničující?“ Manažer o tom nějakou dobu přemýšlel a řekl:"Dvě hodiny, max!"

Posadili jsme se s lidmi, kteří provozovali ERP aplikaci, a zeptali jsme se jich:"Jak dlouho by trvalo přeinstalovat aplikaci a nakonfigurovat terminálový server, kdybychom se museli zotavit z fatálního selhání systému?" Odpověď byla:"Minimálně dva dny!" Myslím, že tu mezeru vidíte.

Pro mě bylo první prioritou zkrátit dobu obnovy ze dvou dnů pod dvě hodiny. Přeinstalování operačního systému, aplikací a obnovení záloh dat nebylo možné, protože to trvá příliš dlouho. Vybral jsem si aplikaci pro zálohování bitové kopie, která dokáže provést kompletní zálohu systému, tedy operačního systému, nainstalovaných aplikací, knihoven a dat. Pomocí tohoto softwaru bych byl schopen obnovit systém bez nutnosti ruční instalace.

Co potřebujeme?

Klasickým nastavením je spouštět zálohování v noci, když nikdo nepracuje. V případě selhání bychom museli obnovit obraz ze včerejší noci nebo možná ještě starší verzi. V tomto scénáři test ukázal, že potřebujeme pět hodin na úplné obnovení. To je lepší než dva dny, ale pořád to není dost dobré. A v tomto přístupu se skrývá ještě jeden problém. Pokud se systém zhroutil večer a my musíme obnovit ze zálohy minulé noci, ztratíme všechny změny z aktuálního dne. To nebylo pro náš internetový obchod přijatelné. No, naše první myšlenka byla spustit přírůstkovou zálohu každou hodinu. V takovém případě bychom přišli jen o poslední hodinu dat. Ale co se stane, když problém, který narušuje náš systém, je již v záložním obrazu, když problém objevíme? No, tady je to, co jsme udělali.

Znovu jsme se posadili a probrali, jak dlouho trvá, než objevíme zničující problém, který by vedl k obnovení systému. Dohodli jsme se na časovém rámci čtyř hodin. Stručně řečeno, chtěli jsme ztratit co nejméně práce, obnovit maximálně dvě hodiny a ujistit se, že problém nebude již v záloze, když jsme jej objevili. Na základě těchto informací jsem nastavil přístup k zálohování, který dodavatelé softwaru označují jako okamžité obnovení, stínové obnovení, preemptivní obnovení nebo podobný termín. Každou hodinu jsme spouštěli úlohy přírůstkového zálohování a obnovovali jsme zálohy na pozadí na nový virtuální počítač. Každou celou hodinu jsme měli připravený systém, který byl čtyři hodiny zpět v čase a jen bylo potřeba ho dokončit. Pokud se tedy rozhodnu obnovit přírůstek z doby před jednou hodinou, zabere to méně času než úplné obnovení systému, protože do téměř připraveného virtuálního počítače bylo třeba obnovit pouze malé přírůstky.

A vynaložené úsilí se vyplatilo

Jednoho dne jsem byl na dovolené, griloval a u piva, když mi zavolal můj kolega, že terminálový server s aplikací ERP byl nefunkční kvůli neúspěšné aktualizaci a ten, kdo aktualizaci prováděl, si zapomněl vzít nejprve snímek.

Jediné, co jsem svému kolegovi potřeboval říct, bylo vypnout poškozený počítač, najít uživatelské rozhraní našeho systému zálohování/obnovy a poté identifikovat úlohu obnovy. Nakonec jsem mu řekl, jak vybrat časové razítko z posledních čtyř hodin, kdy má obnovení skončit. Obnovení bylo dokončeno o 30 minut později a systém byl připraven k opětovnému použití. Po celkem 30 minutách jsme byli zpět v akci a ztratili jsme pouze práci z posledních zhruba dvou hodin! Úžasný! Nyní zpět k dovolené.

Zabalit

Mějte tedy na paměti, že pokud jde o nouzové obnovení, čas a peníze na vhodné řešení zálohování a obnovy jsou dobře vynaložené.

[ Bezplatný online kurz:Technický přehled Red Hat Enterprise Linux. ]


Linux
  1. Linux – Jak změřit čas, kdy dorazí paket?

  2. Linux – jak přimět Sar, aby se ukazovala za předchozí den?

  3. Linux – přiměřená hodnota Vm.swappiness při použití Zram?

  1. Zrychlete rsync při migraci linuxového serveru z příkazového řádku

  2. Vyhledejte příkaz v Linuxu

  3. Jak zjistit, kdy byl soubor Spfile vytvořen na serveru Linux

  1. Zabránění probuzení notebooku při otevření víka na linuxu

  2. Obnovení velikosti USB disku (Linux)

  3. Jak automaticky spustit skript, když se v Linuxu změní obsah adresáře?