GNU/Linux >> Znalost Linux >  >> Linux

Co je to distribuovaná databáze a k čemu jsou distribuované datové systémy?

Distribuované databáze nabízejí některé klíčové výhody oproti centralizovaným databázím. Mnoho společností přechází na distribuované databáze (ve kterých je databáze, jak naznačuje její název, distribuována na řadě serverů na různých místech) z různých důvodů. Podívejme se na některé ze základních výhod distribuovaných databází, na typický scénář, ve kterém se používají, a na různé formáty, ve kterých jsou data distribuována v distribuovaném datovém systému.

Proč jsou distribuované databáze stále oblíbenější

Zde jsou základní důvody, proč mnoho organizací opouští centralizovaný model ve prospěch distribuce databází:

  1. Spolehlivost – Budování infrastruktury je podobné jako investování:diverzifikujte, abyste snížili své šance na ztrátu. Konkrétně, pokud dojde k selhání v jedné distribuční oblasti, celá databáze nezaznamená překážku.
  2. Zabezpečení – Můžete udělit oprávnění jednotlivým sekcím celkové databáze pro lepší interní a externí ochranu.
  3. Nákladově efektivní – Ceny šířky pásma klesají, protože uživatelé přistupují ke vzdáleným datům méně často.
  4. Místní přístup – Podobně jako u #1 výše, pokud dojde k selhání v zastřešující síti, stále můžete získat přístup ke své části databáze.
  5. Růst – Pokud do své firmy přidáte nové místo, je snadné vytvořit další uzel v databázi, díky čemuž je distribuce vysoce škálovatelná.
  6. Rychlost a efektivita zdrojů – Většina požadavků a další interaktivity s databází se provádí lokálně, což snižuje vzdálený provoz.
  7. Odpovědnost a omezení – Protože se jakékoli závady nebo selhání vyskytují lokálně, problém je vyřešen. Potenciálně může být zpracována pracovníky IT určenými ke zpracování této části společnosti.

Kdo používá distribuované databáze?

Distribuované databáze často používají organizace, které mají mnoho kanceláří nebo prodejen v různých geografických lokalitách. Jednotlivá pobočka obvykle komunikuje primárně s daty, která se týkají jejích vlastních operací, s mnohem méně častou potřebou obecných firemních dat.
V takovém případě existuje nekonzistentní potřeba jakýchkoli centrálních informací z poboček. Domácí kancelář společnosti však stále musí mít stálý příliv informací ze všech míst.
K vyřešení tohoto problému obvykle funguje distribuovaná databáze tak, že každé pobočce společnosti umožňuje přímou interakci s vlastní databází během pracovní doby. V době mimo špičku dostává celá databáze každý den dávku dat z každé pobočky.

Typy distribuovaných dat

Replikovaná data – Replikace dat se používá k vytvoření dalších instancí dat v různých částech databáze. Pomocí této taktiky se může distribuovaná databáze vyhnout nadměrnému provozu, protože ke stejným datům lze přistupovat lokálně. Distribuovaná data lze rozdělit do pěti základních typů, jak je uvedeno níže:

Tato forma dat se dělí na dva různé typy:data pouze pro čtení a data, do kterých lze zapisovat. Zapisovatelné verze lze upravit, což okamžitě změní první instanci, s různými konfiguracemi pro to, jak a kdy dojde k aktualizaci všech replikací v celém systému. Verze pouze pro čtení také umožňují revize první instance a poté jsou replikace odpovídajícím způsobem upraveny.

V tomto distribuovaném datovém systému lze aktualizace konfigurovat na základě toho, jak důležité je, aby databáze měla správná specifika okamžik za okamžikem (nebo v jakémkoli časovém období). Pamatujte, že replikace je zvláště cenná, když nepotřebujete, aby se revize objevovaly v distribuovaném datovém systému v reálném čase.

Tento typ dat usnadňuje dodávání dat z jakékoli sekce do jakékoli jiné sekce větší databáze, pokud jsou data druhé sekce ohrožena jakoukoli chybou. Uvědomte si však, že při replikaci dochází ke kolizím může dojít. Musí být zavedena ochranná opatření, která jim zabrání/vyřeší je.

Horizontálně fragmentovaná data – Tato kategorie distribuce dat zahrnuje použití primárních klíčů (každý z nich odkazuje na jeden záznam v databázi). Horizontální fragmentace se běžně používá v situacích, kdy konkrétní obchodní místa obvykle potřebují přístup pouze k databázi své konkrétní pobočky.

Vertikálně fragmentovaná data – Při vertikální fragmentaci se opět používají primární klíče. V tomto případě jsou však kopie primárního klíče dostupné v každé sekci databáze (přístupné pro každou pobočku). Tento typ formátu funguje dobře v situacích, kdy pobočka firmy a centrální místo komunikují se stejnými účty, ale možná odlišným způsobem (jako jsou změny kontaktních informací klienta vs. změny finančních údajů).

Reorganizovaná data – Reorganizace znamená, že data byla upravena tak či onak, jak je typické pro databáze na podporu rozhodování. V některých případech existují dva odlišné systémy, které zpracovávají transakce a podporu rozhodování. Zatímco systémy na podporu rozhodování mohou být technicky složitější, zpracování online transakcí (OLTP) často vyžaduje změnu konfigurace, aby bylo možné přijímat velké množství požadavků.

Data samostatného schématu – Tato kategorie rozděluje databázi a software používaný pro přístup k ní tak, aby vyhovovala různým oddělením a situacím – například uživatelská data vs. data produktu. Obvykle dochází k překrývání mezi různými databázemi v rámci tohoto typu distribuce.

Další informace o typech distribuovaných databází a zabezpečení najdete v našem příspěvku na blogu zde. Atlantic.Net se zavázal držet krok s nejlepšími novými pokroky v technologii prostřednictvím naší stránky Zdroje, která obsahuje návody, články a často kladené otázky.

***

Jak vidíte, distribuované databáze představují obrovský technologický pokrok. Není divu, že společnosti odcházejí od centralizovaných databází a přijímají distribuovaný model. Atlantic.net nabízí mnoho možností hostování pro různé společnosti, včetně Windows Private Cloud Hosting, virtuálních privátních serverů, spravovaných cloudových serverů, hostingů v souladu s HIPAA a našich oceněných superrychlých serverů SSD VPS Hosting.


Linux
  1. Kdy je Dd vhodné pro kopírování dat? (neboli, kdy jsou čtení() a zápis() částečné)?

  2. K čemu jsou Inody dobré?

  3. Distribuovaná databáze NoSQL Elasticsearch – co to je a měli byste ji používat?

  1. Co je to relační databáze?

  2. K čemu slouží soubor .la libtool?

  3. Linux top command:What are us, sy, ni, id, wa, hi, si and st (pro využití CPU)?

  1. Co je databáze NoSQL? – Vysvětlení NoSQL

  2. Co je relační databáze?

  3. Co je vdso a vsyscall?