GNU/Linux >> Znalost Linux >  >> Cent OS

Schéma hvězda vs. sněhová vločka

Úvod

Hvězda a sněhová vločka schéma jsou návrhy logických úložišť, které se běžně vyskytují v datových tržištích a architektuře datových skladů. Zatímco běžné typy databází používají ER (Entity-Relationship) diagramy, logická struktura skladů využívá dimenzionální modely ke konceptualizaci úložného systému.

Čtěte dále a zjistěte rozdíly, charakteristiky a nedostatky schémat hvězd a sněhových vloček.

Hvězdné schéma vs. schéma sněhové vločky:hlavní rozdíl

Dva hlavní prvky rozměrového modelu schématu hvězdy a sněhové vločky jsou:

1. Tabulka faktů . Tabulka s největším množstvím dat, známá také jako krychle .

2.Tabulky dimenzí . Odvozená datová struktura poskytuje odpovědi na ad hoc dotazy nebo dimenze, často nazývané vyhledávací tabulky .

Připojení vybraných dimenzí na tabulku faktů tvoří schéma. Schémata hvězdy i sněhové vločky využívají k modelování úložného systému rozměrnost dat.

Hlavní rozdíly mezi těmito dvěma schématy jsou:

Hvězdové schéma Schéma sněhových vloček
Prvky Tabulka faktů Tabulky dimenzí Tabulka faktů Tabulky dimenzí Tabulky subdimenzí
Struktura ve tvaru hvězdy Ve tvaru sněhové vločky
Rozměry Jedna tabulka na dimenzi Více tabulek pro každou dimenzi
Směr modelu Shora dolů Zdola nahoru
Úložný prostor Využívá více úložiště Zabírá méně místa
Normalizace Tabulky denormalizovaných rozměrů Normalizované tabulky rozměrů
Výkon dotazu Rychlý, potřeba méně JOINů kvůli menšímu počtu cizích klíčů Pomalé, kvůli většímu počtu cizích klíčů je potřeba více JOINů
Složitost dotazu Jednoduché a srozumitelnější Složité a náročnější na pochopení
Redundance dat Vysoká Nízká
Případ použití Tabulky dimenzí s několika řádky, typicky s datovými tržišti U datových skladů byly nalezeny tabulky dimenzí s více řádky

Vzhledem ke složitosti schématu sněhových vloček a nižším výkonům je hvězdicové schéma preferovanou možností, kdykoli je to možné. Jedním z typických způsobů, jak obejít problémy ve schématu sněhových vloček, je rozložit vyhrazené úložiště na několik menších entit s hvězdicovým schématem.

Co je hvězdicové schéma?

Hvězdicové schéma je logická struktura pro vývoj datových tržišť a jednodušších datových skladů. Jednoduchý model se skládá z tabulek dimenzí spojených s tabulkou faktů uprostřed.

Tabulka faktů se obvykle skládá z:

  • Kvantifikovatelné číselné údaje, jako jsou hodnoty nebo počty.
  • Odkazy na rozměry prostřednictvím cizích klíčů.

Vyhledávací tabulky představují popisné informace přímo spojené s tabulkou faktů.

Například pro modelování prodeje elektronického obchodu může tabulka faktů pro nákupy obsahovat celkovou cenu nákupu. Na druhou stranu rozměrové tabulky obsahují popisné informace o položkách, zákaznických údajích, čase nebo místě nákupu.

Hvězdicové schéma pro analýzu nákupů v příkladu má čtyři dimenze. Tabulka faktů se propojuje s dimenzionálními tabulkami prostřednictvím konceptu cizího a primárního klíče. Kromě číselných údajů se tedy tabulka faktů skládá také z cizích klíčů pro definování vztahů mezi tabulkami.

Charakteristiky hvězdného schématu

Hlavní charakteristiky hvězdného schématu jsou:

  • Zjednodušené a rychlé dotazy . Méně operací JOIN v důsledku denormalizace činí informace snadněji dostupné.
  • Jednoduché vztahy. Toto schéma funguje skvěle se vztahy typu one-to-one nebo one-to-many.
  • Singulární rozměr . Každý rozměr popisuje jedna tabulka.
  • Ovládá OLAP . Systémy OLAP široce využívají hvězdicové schéma k návrhu datových krychlí.

Nevýhody hvězdicového schématu

Nevýhody použití hvězdicového schématu jsou:

  • Redundance . Dimenzionální tabulky jsou jednorozměrné a je přítomna redundance dat.
  • Nízká integrita . Kvůli denormalizaci je aktualizace informací složitým úkolem.
  • Omezený počet dotazů . Soubor otázek je omezený, což také zužuje analytickou sílu.

Co je schéma sněhové vločky?

Schéma sněhové vločky má rozvětvenou logickou strukturu používanou ve velkých datových skladech. Od středu k okrajům přecházejí informace o entitě od obecných ke konkrétnějším.

Kromě společných prvků dimenzionálního modelu schéma sněhové vločky dále rozkládá dimenzionální tabulky na subdimenze.

Model analýzy prodeje elektronického obchodu z předchozího příkladu dále větví („sněhové vločky“) do menších kategorií a podkategorií zájmu.

Čtyři dimenze se rozkládají na subdimenze. Vyhledávací tabulky se dále normalizují prostřednictvím řady propojených objektů.

Charakteristiky schématu sněhové vločky

Mezi hlavní rysy schématu sněhových vloček patří:

  • Malé úložiště . Schéma sněhové vločky nevyžaduje tolik úložného prostoru.
  • Vysoká podrobnost . Rozdělení tabulek do subdimenzí umožňuje analýzu v různých hloubkách zájmu. Přidávání nových poddimenzí je také jednoduchý proces.
  • Integrita . Díky normalizaci má schéma vyšší úroveň integrity dat a nízkou redundanci.

Nevýhody schématu sněhových vloček

Slabiny schématu sněhových vloček jsou:

  • Složitost . Databázový model je složitý, stejně jako prováděné dotazy. Vícenásobné vícerozměrné tabulky celkově komplikují práci s návrhem.
  • Pomalé zpracování . Mnoho vyhledávacích tabulek vyžaduje více operací JOIN, což zpomaluje získávání informací.
  • Obtížné na údržbu . Vysoká úroveň granularity ztěžuje správu a údržbu schématu.

Cent OS
  1. Jak používat Gsettings, když není uvedeno žádné schéma?

  2. Zrušte tabulky v MySQL

  3. Základy PHP a MySQL:Databáze a tabulky

  1. Jak změnit schéma tabulek Mssql, uložených procedur a zobrazení najednou

  2. Pohybující se tabulky stránek procesu v Linuxu

  3. nebylo vybráno žádné schéma k vytvoření v ... chyba

  1. Jak najít velké tabulky v SQL databázi

  2. Jak upravit pole v databázových tabulkách pomocí phpMyAdmin

  3. Jak odstranit pole z databázových tabulek pomocí phpMyAdmin