GNU/Linux >> Znalost Linux >  >> Linux

Triky a dárky pro systémové správce a ops

Vypískat! Halloween je konečně tady. Už jste si připravili svůj oblíbený halloweenský kostým? Nebo se možná vaše děti připravují na trik nebo léčbu. Je rok 2020 a tato pandemie koronaviru je pravděpodobně ta nejděsivější věc – ještě děsivější než duchové a zombie klepající na vaše dveře.

Když jste sysadmin, můžete se setkat s opravdu děsivými momenty, ze kterých vám naskočí husí kůže a bezesné noci, ale i ten nejděsivější duch, zombie nebo monstrum má nepřítele, před kterým musí utéct, ať už je to koptský kříž, česnekový náhrdelník. , kus Kryptonitu nebo expert sysadmin. V tomto článku představím pár možných děsivých momentů pro systémového správce, jako jste vy. Také vám řeknu, jak s nimi můžete zacházet. Je koneckonců Halloween, takže tento seznam považujte za můj halloweenský dárek pro vás.

Poskytl jsem také tento blog na YouTube, raději se na něj podívejte, než abyste si přečetli další.

Trik #1:Zhroucení cloudového serveru

Jsou 2 hodiny ráno a váš smartphone začne bzučet. Napůl bdělý zvedneš telefon a zíráš na obrazovku. Střílet. Váš e-mail neustále dostává automaticky generovaná upozornění ze systému zpráv Slack/Teams, že váš produkční server je mimo provoz po dobu dvou až tří hodin. Další věc, kterou víte, váš šéf chce, abyste tam byli vy a zbytek provozního týmu co nejdříve. Toto je určitě situace, ve které nechcete být, tak jak tomu můžete zabránit?

[ Také by se vám mohlo líbit: Příkazy Bash bang:Trik, který musíte znát pro příkazový řádek Linuxu ]

Léčba č. 1:Nástroj pro vyrovnávání zatížení a replikace:Prevence selhání serveru

I když je nemožné zcela zabránit pádu běžících serverů, je možné vytvořit systém téměř odolný proti chybám, pokud jej navrhnete správným způsobem. Jedním z řešení je nastavení replikace napříč více prostředími s více clustery a více uzly. Můžete přidat nástroj pro vyrovnávání zatížení, abyste zajistili, že ostatní clustery budou nadále fungovat, i když se jeden cluster vypne. Pokud je příliš velký provoz nebo jiné problémy s výkonem, můžete nakonfigurovat funkci automatického škálování tak, aby se škálovalo nebo škálovalo napříč.

Trik #2:Poškození nebo ztráta dat

K vašemu inženýrskému týmu se připojil nový stážista jménem Mike. Nadšený, že má nástroje, které potřebuje, spouští SQL dotaz bez úmyslu cokoliv poškodit. Ale ouha. Tato malá změna způsobí, že vaše databázová tabulka bude odstraněna a všechna kritická data zákazníků jsou nyní pryč. Co můžete udělat, abyste předešli podobnému problému?

Úprava č. 2:Zálohování a obnova dat:Opravte ztrátu a poškození dat

Ztráta dat je vážným problémem pro jakoukoli živou službu nebo aplikaci. Strategie zálohování a obnovy tedy musí být vždy k dispozici, alespoň pro produkční prostředí. V ideálním případě by postup zálohování a obnovy měl být dostupný ve všech prostředích. Vytvořte také mechanismus pro automatizaci tohoto procesu. Nejjednodušší způsob, jak začít, je vytvořit několik bash skriptů pro spouštění řady příkazů pro zálohování a obnovu.

Trik #3:Pád aplikace

Hurá! Váš server a databáze jsou nyní odolné proti chybám a skálopevné, ale jedna Java aplikace odhalující důležité obchodní koncové body náhle vybuchne. Když zákazník navštíví web, uvidí pouze stránku 404, což vaši společnost stojí milion dolarů za minutu.

Léčba č. 3:Pozorovatelnost – protokolování a monitorování:Rychle identifikujte chybu nebo chybu

Chyby aplikací se stávají neustále a existuje mnoho technik a programovacích návrhových vzorů, jako je vzor jističů, pro řešení problémů. Jakákoli chyba spuštěná uvnitř aplikace však musí být rychle identifikována, než bude možné ji opravit. Proto je protokolování a monitorování absolutní nezbytností pro všechny aplikace. Ujistěte se, že vaše aplikace má povoleny ladicí body v blocích kódu a řádcích. Tyto chyby nebo výstupy by měly být odeslány do monitorovacích panelů, aby vývojáři mohli rychle určit problém.

Trik #4:Pomalá aplikace

Přidali jste protokolování a monitorování pro všechny aplikace. Konečně můžete spokojeně spát a snít o tom, jak vyhrát letošní soutěž o virtuální halloweenský kostým. O několik minut později si však přečtete e-mail od zákazníka, který uvádí, že aplikační služba je opravdu pomalá.

Léčba č. 4:Vývojové nástroje pro identifikaci úzkých míst:Zjistěte, kde dochází ke zpomalení

Stejně jako může vývojář rychle určit úzké místo pomocí monitorování a protokolování povolených v aplikacích, můžete použít vývojářské nástroje jako traceroute /tracert , Vývojářské nástroje prohlížeče Chrome a Wireshark pro odstraňování problémů s aplikacemi a snadnou identifikaci, kde dochází k problémům s výkonem. Znalost nástrojů, jako je tento, může vývojářům pomoci zorientovat se v náročných problémech spojených s cloudovými aplikacemi.

Trik č. 5:Pomalá latence hlášená pouze na jednom místě

Protože jste mistr sysadmin, konečně jste našli příčinu celkové pomalosti aplikace. Opravili jste problém a zákazník vám později pošle děkovný dopis s prohlášením, že je vše v pořádku. O den později však obdržíte e-mail od jiného zákazníka, který se nachází v Sydney v Austrálii, se stížností, že aplikace vaší společnosti je při návštěvě webu pomalá. Co se děje?

Léčba č. 5:Síť pro doručování obsahu (CDN) a přístup do více regionů:Snižte latenci

I když problém může být stále problém s latencí kvůli designu aplikace, problém může spočívat v nedostatečné dostupnosti serveru pro zákazníka v daném městě nebo regionu. Jedním ze způsobů, jak problém vyřešit, je přidat další umístění pro vaše běžící služby, aby bylo možné automaticky vybrat nejbližší server, který zákazníkovi doručí potřebný obsah. Jinými slovy, multiregionální klastr a síť pro doručování obsahu (CDN) mohou pomoci zmírnit problém.

[ Stáhnout nyní:Průvodce systémového administrátora skriptováním v Bash. ] 

Sbalit

To je vše, lidi! Naučili jste se, jak vyřešit pět nejčastějších problémů, se kterými se můžete jako správce systému setkat, když máte aplikace spuštěné na serveru nebo v cloudovém prostředí. K podobným problémům dochází neustále, ale existují způsoby, jak těmto problémům předcházet nebo je vhodně zmírnit pomocí správné architektury a dobrého přístupu správce systému. Doufám, že vám tento článek pomohl stát se lepším správcem systému. Veselý Halloween!


Linux
  1. Tipy a triky pro curl a wget

  2. Kdy je Dd vhodné pro kopírování dat? (neboli, kdy jsou čtení() a zápis() částečné)?

  3. Triky a tipy pro hledání informací v Man Pages?

  1. Tipy a triky pro použití CUPS pro tisk s Linuxem

  2. Úvod do firewallů webových aplikací pro správce systému Linux

  3. copy_to_user() a copy_from_user() pro základní datový typ

  1. Musíte znát příkazy Linuxu, spouštět Podman ve Windows a další tipy pro systémové správce

  2. Postavte si laboratoř za 36 sekund, spusťte Podman na Macu a další tipy pro systémové správce

  3. Nejlepší jednořádkové příkazy Linuxu, přizpůsobení bitových kopií virtuálních počítačů a další tipy pro systémové správce