Úvod
Hvězda a sněhová vločka schéma jsou návrhy logických úložišť, které se běžně vyskytují v datových tržištích a architektuře datových skladů. Zatímco běžné typy databází používají ER (Entity-Relationship) diagramy, logická struktura skladů využívá dimenzionální modely ke konceptualizaci úložného systému.
Čtěte dále a zjistěte rozdíly, charakteristiky a nedostatky schémat hvězd a sněhových vloček.

Hvězdné schéma vs. schéma sněhové vločky:hlavní rozdíl
Dva hlavní prvky rozměrového modelu schématu hvězdy a sněhové vločky jsou:
1. Tabulka faktů . Tabulka s největším množstvím dat, známá také jako krychle .
2.Tabulky dimenzí . Odvozená datová struktura poskytuje odpovědi na ad hoc dotazy nebo dimenze, často nazývané vyhledávací tabulky .
Připojení vybraných dimenzí na tabulku faktů tvoří schéma. Schémata hvězdy i sněhové vločky využívají k modelování úložného systému rozměrnost dat.
Hlavní rozdíly mezi těmito dvěma schématy jsou:
Hvězdové schéma | Schéma sněhových vloček | |
---|---|---|
Prvky | Tabulka faktů Tabulky dimenzí | Tabulka faktů Tabulky dimenzí Tabulky subdimenzí |
Struktura | ve tvaru hvězdy | Ve tvaru sněhové vločky |
Rozměry | Jedna tabulka na dimenzi | Více tabulek pro každou dimenzi |
Směr modelu | Shora dolů | Zdola nahoru |
Úložný prostor | Využívá více úložiště | Zabírá méně místa |
Normalizace | Tabulky denormalizovaných rozměrů | Normalizované tabulky rozměrů |
Výkon dotazu | Rychlý, potřeba méně JOINů kvůli menšímu počtu cizích klíčů | Pomalé, kvůli většímu počtu cizích klíčů je potřeba více JOINů |
Složitost dotazu | Jednoduché a srozumitelnější | Složité a náročnější na pochopení |
Redundance dat | Vysoká | Nízká |
Případ použití | Tabulky dimenzí s několika řádky, typicky s datovými tržišti | U datových skladů byly nalezeny tabulky dimenzí s více řádky |
Vzhledem ke složitosti schématu sněhových vloček a nižším výkonům je hvězdicové schéma preferovanou možností, kdykoli je to možné. Jedním z typických způsobů, jak obejít problémy ve schématu sněhových vloček, je rozložit vyhrazené úložiště na několik menších entit s hvězdicovým schématem.
Co je hvězdicové schéma?
Hvězdicové schéma je logická struktura pro vývoj datových tržišť a jednodušších datových skladů. Jednoduchý model se skládá z tabulek dimenzí spojených s tabulkou faktů uprostřed.

Tabulka faktů se obvykle skládá z:
- Kvantifikovatelné číselné údaje, jako jsou hodnoty nebo počty.
- Odkazy na rozměry prostřednictvím cizích klíčů.
Vyhledávací tabulky představují popisné informace přímo spojené s tabulkou faktů.
Například pro modelování prodeje elektronického obchodu může tabulka faktů pro nákupy obsahovat celkovou cenu nákupu. Na druhou stranu rozměrové tabulky obsahují popisné informace o položkách, zákaznických údajích, čase nebo místě nákupu.

Hvězdicové schéma pro analýzu nákupů v příkladu má čtyři dimenze. Tabulka faktů se propojuje s dimenzionálními tabulkami prostřednictvím konceptu cizího a primárního klíče. Kromě číselných údajů se tedy tabulka faktů skládá také z cizích klíčů pro definování vztahů mezi tabulkami.
Charakteristiky hvězdného schématu
Hlavní charakteristiky hvězdného schématu jsou:
- Zjednodušené a rychlé dotazy . Méně operací JOIN v důsledku denormalizace činí informace snadněji dostupné.
- Jednoduché vztahy. Toto schéma funguje skvěle se vztahy typu one-to-one nebo one-to-many.
- Singulární rozměr . Každý rozměr popisuje jedna tabulka.
- Ovládá OLAP . Systémy OLAP široce využívají hvězdicové schéma k návrhu datových krychlí.
Nevýhody hvězdicového schématu
Nevýhody použití hvězdicového schématu jsou:
- Redundance . Dimenzionální tabulky jsou jednorozměrné a je přítomna redundance dat.
- Nízká integrita . Kvůli denormalizaci je aktualizace informací složitým úkolem.
- Omezený počet dotazů . Soubor otázek je omezený, což také zužuje analytickou sílu.
Co je schéma sněhové vločky?
Schéma sněhové vločky má rozvětvenou logickou strukturu používanou ve velkých datových skladech. Od středu k okrajům přecházejí informace o entitě od obecných ke konkrétnějším.
Kromě společných prvků dimenzionálního modelu schéma sněhové vločky dále rozkládá dimenzionální tabulky na subdimenze.

Model analýzy prodeje elektronického obchodu z předchozího příkladu dále větví („sněhové vločky“) do menších kategorií a podkategorií zájmu.

Čtyři dimenze se rozkládají na subdimenze. Vyhledávací tabulky se dále normalizují prostřednictvím řady propojených objektů.
Charakteristiky schématu sněhové vločky
Mezi hlavní rysy schématu sněhových vloček patří:
- Malé úložiště . Schéma sněhové vločky nevyžaduje tolik úložného prostoru.
- Vysoká podrobnost . Rozdělení tabulek do subdimenzí umožňuje analýzu v různých hloubkách zájmu. Přidávání nových poddimenzí je také jednoduchý proces.
- Integrita . Díky normalizaci má schéma vyšší úroveň integrity dat a nízkou redundanci.
Nevýhody schématu sněhových vloček
Slabiny schématu sněhových vloček jsou:
- Složitost . Databázový model je složitý, stejně jako prováděné dotazy. Vícenásobné vícerozměrné tabulky celkově komplikují práci s návrhem.
- Pomalé zpracování . Mnoho vyhledávacích tabulek vyžaduje více operací JOIN, což zpomaluje získávání informací.
- Obtížné na údržbu . Vysoká úroveň granularity ztěžuje správu a údržbu schématu.