Tento článek je příběhem z mé minulosti. Kdysi jsem pracoval jako správce systému pro společnost, která provozovala internetový obchod, který prodával počítačový hardware a software.
V zadní části desítky zaměstnanců využívaly terminálový server k práci s ERP softwarem, který spravoval veškeré zboží a obchod. Terminálové servery a databáze byly rozhodující pro obchodní proces prodeje našich produktů. Když jeden z těchto systémů selhal, desítky zaměstnanců nemohly dělat svou práci a zákazníci si už nemohli nic koupit.
Jak dlouho máme?
Sedli jsme si tedy s majitelem obchodního procesu a zeptali jsme se:„Přemýšlejte o situaci, kdy je systém rozbitý a již není použitelný. Jak dlouho se musíte zotavovat, než by škoda na společnosti byla zničující?“ Manažer o tom nějakou dobu přemýšlel a řekl:"Dvě hodiny, max!"
Posadili jsme se s lidmi, kteří provozovali ERP aplikaci, a zeptali jsme se jich:"Jak dlouho by trvalo přeinstalovat aplikaci a nakonfigurovat terminálový server, kdybychom se museli zotavit z fatálního selhání systému?" Odpověď byla:"Minimálně dva dny!" Myslím, že tu mezeru vidíte.
Pro mě bylo první prioritou zkrátit dobu obnovy ze dvou dnů pod dvě hodiny. Přeinstalování operačního systému, aplikací a obnovení záloh dat nebylo možné, protože to trvá příliš dlouho. Vybral jsem si aplikaci pro zálohování bitové kopie, která dokáže provést kompletní zálohu systému, tedy operačního systému, nainstalovaných aplikací, knihoven a dat. Pomocí tohoto softwaru bych byl schopen obnovit systém bez nutnosti ruční instalace.
Co potřebujeme?
Klasickým nastavením je spouštět zálohování v noci, když nikdo nepracuje. V případě selhání bychom museli obnovit obraz ze včerejší noci nebo možná ještě starší verzi. V tomto scénáři test ukázal, že potřebujeme pět hodin na úplné obnovení. To je lepší než dva dny, ale pořád to není dost dobré. A v tomto přístupu se skrývá ještě jeden problém. Pokud se systém zhroutil večer a my musíme obnovit ze zálohy minulé noci, ztratíme všechny změny z aktuálního dne. To nebylo pro náš internetový obchod přijatelné. No, naše první myšlenka byla spustit přírůstkovou zálohu každou hodinu. V takovém případě bychom přišli jen o poslední hodinu dat. Ale co se stane, když problém, který narušuje náš systém, je již v záložním obrazu, když problém objevíme? No, tady je to, co jsme udělali.
Znovu jsme se posadili a probrali, jak dlouho trvá, než objevíme zničující problém, který by vedl k obnovení systému. Dohodli jsme se na časovém rámci čtyř hodin. Stručně řečeno, chtěli jsme ztratit co nejméně práce, obnovit maximálně dvě hodiny a ujistit se, že problém nebude již v záloze, když jsme jej objevili. Na základě těchto informací jsem nastavil přístup k zálohování, který dodavatelé softwaru označují jako okamžité obnovení, stínové obnovení, preemptivní obnovení nebo podobný termín. Každou hodinu jsme spouštěli úlohy přírůstkového zálohování a obnovovali jsme zálohy na pozadí na nový virtuální počítač. Každou celou hodinu jsme měli připravený systém, který byl čtyři hodiny zpět v čase a jen bylo potřeba ho dokončit. Pokud se tedy rozhodnu obnovit přírůstek z doby před jednou hodinou, zabere to méně času než úplné obnovení systému, protože do téměř připraveného virtuálního počítače bylo třeba obnovit pouze malé přírůstky.
A vynaložené úsilí se vyplatilo
Jednoho dne jsem byl na dovolené, griloval a u piva, když mi zavolal můj kolega, že terminálový server s aplikací ERP byl nefunkční kvůli neúspěšné aktualizaci a ten, kdo aktualizaci prováděl, si zapomněl vzít nejprve snímek.
Jediné, co jsem svému kolegovi potřeboval říct, bylo vypnout poškozený počítač, najít uživatelské rozhraní našeho systému zálohování/obnovy a poté identifikovat úlohu obnovy. Nakonec jsem mu řekl, jak vybrat časové razítko z posledních čtyř hodin, kdy má obnovení skončit. Obnovení bylo dokončeno o 30 minut později a systém byl připraven k opětovnému použití. Po celkem 30 minutách jsme byli zpět v akci a ztratili jsme pouze práci z posledních zhruba dvou hodin! Úžasný! Nyní zpět k dovolené.
Zabalit
Mějte tedy na paměti, že pokud jde o nouzové obnovení, čas a peníze na vhodné řešení zálohování a obnovy jsou dobře vynaložené.
[ Bezplatný online kurz:Technický přehled Red Hat Enterprise Linux. ]