GNU/Linux >> Znalost Linux >  >> Cent OS

Co je databáze?

Úvod

Databáze jsou páteří všech moderních informačních systémů. Vzhledem k tomu, že počítače ukládají současné databáze, mohou mít data libovolnou velikost a složitost. Existuje mnoho způsobů, jak shromažďovat a uspořádat data v závislosti na použití a typu dat.

Tento článek poskytuje komplexní přehled databází a databázových systémů.

Definice databáze

databáze je organizovaný soubor logicky propojených dat. Informace se promění v užitečné znalosti, strukturované a udržované tak, aby vyhovovaly potřebám uživatele. Kromě ukládání samotných dat databáze také uchovává vztahy mezi datovými body.

V širším slova smyslu je databáze integrovaný soubor informací o systému a postupech údržby a používání. Na rozdíl od tabulek má k úložišti přístup více uživatelů a aplikací najednou.

K čemu se používají databáze?

Databáze mají široké spektrum použití. Mezi typické příklady patří:

  • Bankovní systémy vést databáze klientů, bankovních účtů, úvěrů, transakcí atd.
  • Letecký provoz uchovává informace o letech, rezervacích letenek a podobně. Letecké společnosti jsou prvním sektorem, který používá geograficky distribuované databáze.
  • Univerzity používat databáze k zaznamenávání informací o studentech, přihláškách, známkách, kurzech atd.
  • Transakce kreditní kartou obsahují karty o platbách a generují měsíční přehledy.
  • Telekomunikační společnosti ukládat informace o hovorech, generovat měsíční vyúčtování, sledovat komunikační linku atd.
  • Finanční sektor sleduje prodeje a nákupy finančních nástrojů, jako jsou dluhopisy a akcie.
  • Obchod a elektronický obchod firmy ukládat data o spotřebitelích, produktech a různých cenových katalozích.
  • Výrobní podniky řídit dodavatelské řetězce, výrobní linky, sklady, generovat faktury atd.
  • Lidské zdroje uchovává informace o zaměstnancích, výplatách, daních, benefitech atd.

Výše uvedený seznam ukazuje, jak důležité jsou databáze pro jakýkoli typ podnikání. S moderními uživatelskými rozhraními je backend při přístupu k databázi skrytý, takže mnoho uživatelů neví, že je denně používají.

Stručná historie databází

První automatizovaná databáze se připojuje k Hermanu Hollerithovi, který si patentoval systém pro automatické zpracování dat v roce 1884. Sčítání lidu v USA v roce 1890 využívalo systém počítadla děrných štítků a sbírka karet představuje první automatizovaný databázový systém.

Každá karta měla 80 sloupců a charakterizovala informace o osobě. Zpracování informací ze sčítání by obvykle trvalo dva roky. Systému děrných štítků a mechanismu automatického čtení štítků však trvalo zpracování dat jen asi šest týdnů. Systém děrných štítků se používal po celé 20. století, zejména pro hlasování a přihlašování do práce.

Po druhé světové válce začaly firmy a vládní instituce používat počítače pro jednoduché lineární účetní databáze. První počítačové databáze se používaly pro specifické úkoly a postrádaly flexibilitu.

Databáze v 60. letech 20. století

V 60. letech měly dominantní roli databáze dokumentů. První systémy pro správu databází se objevily v tomto desetiletí a byly použity pro velké a složité projekty, jako je přistání Apolla na Měsíci.

Databáze v 70. letech 20. století

V 70. letech se databáze staly komerční realitou. Hierarchické a síťové systémy pro správu dat se zavádějí hlavně pro manipulaci se složitými datovými strukturami, jako jsou tovární účty, při nákupu surovin.

Toto desetiletí zahrnuje komerční DBMS první generace a některé se používají dodnes. Několik nevýhod:

  • Data bylo obtížné načíst. Společnosti v 70. letech využívaly složité programy pro přístup k jednoduchým datům.
  • Omezená nezávislost na datech ztěžovala změnu a aktualizaci informací.
  • Žádný teoretický základ pro jakékoli databázové modely.

Databáze v 80. letech 20. století

Osmdesátá léta se zabývají nedostatky předchozího desetiletí. Relační datový model se objevuje během 70. let a DBMS druhé generace nachází komerční obchodní využití v 80. letech. Při použití relačního modelu jsou všechna data ve známém tabulkovém formátu. Relativně jednoduchý programovací jazyk (SQL) získává data z databáze.

Nový databázový model umožnil snazší přístup k datům lidem, kteří nebyli programátory, čímž se vyřešil nejvýznamnější problém s předchozími modely. Relační model byl vhodný pro komunikaci klient/server, paralelní přenosy dat a GUI zjednodušilo použití.

Databáze v 90. letech

Devadesátá léta dala vzniknout internetovým aplikacím a systémům pro ukládání dat. Multimediální data (grafika, zvuk, obrázky a videa) se stala běžnější. Standardní bylo obrovské množství strukturovaných i nestrukturovaných dat. Vzhledem k rostoucí složitosti dat se systémy relačních databází obrátily na objektově orientovaný přístup.

Databáze v roce 2000

Objevují se tři nové typy databází:XML, NoSQL a NewSQL databáze.

Databáze XML jsou vysoce strukturovaný typ založený na dokumentech. Dotazování je povoleno prostřednictvím atributů XML s různou mírou flexibility.

Databáze NoSQL odpovídají silné poptávce po vysoce flexibilních distribuovaných databázových systémech, které využívají případnou konzistenci a nevyžadují pevné schéma. Typ NoSQL je vysoce škálovatelný a ukládá denormalizovaná data.

NewSQL si klade za cíl zkombinovat nejlepší atributy z NoSQL databází, jako je škálovatelnost, při použití SQL a zachování souladu s ACID.

Různé typy databází

V současnosti je k dispozici mnoho různých typů databází, z nichž každý má své výhody a nevýhody. Každý typ databáze vytváří specifické prostředí pro ukládání dat a vztah mezi informacemi.

  • Relační databáze ukládají data ve strukturách podobných tabulkám jako řádky a sloupce se zaměřením na konzistenci dat. Tento typ databáze se zaměřuje na vztahy mezi daty a je nejrozšířenějším typem databáze.
  • Objektově orientované databáze kombinují principy objektově orientovaného programování (OOP) se standardy relačních databází.
  • Distribuované databáze se rozprostírají na více místech a horizontálně se škálují.
  • Datové sklady konzistentně integrují data z různých zdrojů do jediného systému pro podporu rozhodování. Sklady se starají o velké objemy dat a běžně se nacházejí na velkých datových serverech.
  • Databáze NoSQL jsou strukturálně různorodé typy databází se zaměřením na vysokou dostupnost. Systémy NoSQL jsou nejvhodnější pro velké objemy nestrukturovaných dat.
  • Grafové databáze jsou typem databáze NoSQL se zaměřením na vztahy mezi datovými body. Díky topografické struktuře sítě jsou databáze grafů tím nejlepším systémem pro zkoumání a objevování vztahů.
  • Databáze OLTP se zaměřují na krátké každodenní transakce a podporují velkou uživatelskou základnu s vysokou integritou dat a efektivitou při simultánních dotazech.
  • Databáze s otevřeným zdrojovým kódem lze upravovat a používat je zdarma. Díky přizpůsobitelným uživatelským preferencím a nízkým nákladům je tento typ databáze široce přijat.
  • Cloudové databáze mají všechny tradiční databázové funkce s flexibilitou cloud computingu.
  • Multimodelové databáze poskytují jediný stroj pro práci s více typy databázových modelů.
  • Databáze dokumentů/JSON je úložný systém NoSQL, který ukládá data v dokumentech JSON.
  • Samořídící cloudové databáze (autonomní databáze) využívají strojové učení k automatizaci různých úloh v DBMS.

Součásti databáze

Databázový systém tvoří pět hlavních komponent.

Hardware

Hardware zahrnuje fyzická zařízení, která spojují počítače s reálným světem. Pokud jde o databáze, servery, úložné disky a různá zařízení pro sběr dat zahrnují hardware potřebný ke spuštění a naplnění databáze.

Software

Software zahrnuje širokou škálu programů používaných pro přístup, manipulaci a ovládání databází. Na nižších úrovních software zahrnuje operační systémy, na kterých jsou databáze umístěny, síť pro komunikaci s databázemi a software pro přístup k datům.

Data

Data jsou základním faktem o položce nebo události, kterou může databáze uložit. Data vyžadují zpracování, aby získala význam a stala se informací. Zpracování navíc z dat získává užitečné detaily a pomáhá při rozhodování.

Postupy

Databázové procedury zahrnují všechny funkce fungující v rámci úložiště. Ať už jde o pravidelné zálohování, generování sestav a další každodenní operace, procedury jsou instrukční sadou spouštěnou v systému správy databází.

Jazyk přístupu k databázi

Jazyk pro přístup k databázi je programovací jazyk používaný k vkládání, aktualizaci, mazání a úpravě dat uložených v databázi. Databáze provádějí dotazy přímo v jazyce pro přístup k databázi.

Co je systém správy databází (DBMS)?

Systém správy databází (DBMS) slouží jako rozhraní mezi uživatelem (nebo aplikacemi) a databází. Program umožňuje přímou komunikaci s databází, umožňuje získávání dat, aktualizace, optimalizaci a celkovou správu informací uložených v databázi.

Co je databázový server?

Databázový server je vyhrazený server, který poskytuje služby klientovi prostřednictvím databázových aplikací. Jedna část serveru ukládá DBMS, zatímco druhá ukládá samotnou databázi. Databázové servery mají obvykle velkou úložnou kapacitu a mnoho paměťových karet.

Proč jsou databáze důležité?

Databázový systém uchovává základní údaje o podniku:data se po analýze stávají cennými informacemi o společnosti a pomáhají v rozhodovacím procesu.

Stejně tak databáze pomáhá budovat archiv o podnikání, díky čemuž je společnost robustnější a uvědomuje si, kam směřuje při rozhodování. Ukládání dat o interakci pomáhá poskytnout vhled do informací, které pomohou společnosti dále se rozvíjet a zvyšovat zisky.

Používání systému s databází má mnoho výhod:

  • Nezávislost mezi programy a daty . Klíčovým atributem je oddělení metadat od aplikací, které data používají. Hlavní charakteristikou databáze je schopnost měnit a přenášet data organizace do jiného počítačového systému beze změny programů, které informace zpracovávají.
  • Minimální redundance dat . Databáze řeší problém opakování dat. Informace se integrují do jedné logické struktury a každý údaj se minimálně opakuje. Databáze však zcela neeliminují nadbytečnost. Systém umožňuje návrháři databází plánovat rozsah redundance v závislosti na případu použití.
  • Vylepšené sdílení dat. Databáze jsou firemním zdrojem, který využívá mnoho zaměstnanců a sektorů. Databázi obsluhují konkrétní interní a externí uživatelé a každá osoba nebo skupina má na data specializovaný pohled.
  • Větší zabezpečení dat. DBMS má administrativní funkce, které pomáhají řídit zabezpečení citlivých informací prostřednictvím oprávnění a uživatelských rolí.
  • Zvýšená produktivita vývoje aplikací. Vývoj nových aplikací je rychlejší díky databázovým systémům. Programátor se může soustředit na funkce potřebné pro novou aplikaci, aniž by musel definovat data. DBMS pomáhá automatizovat činnosti, jako je návrh a implementace databáze.

Běžné databázové výzvy

Databáze obsahují výzvy, rizika a výdaje při budování systému.

Školení personálu Podnik, který se rozhodne pro databázový systém, musí získat nebo vyškolit lidi, aby navrhli, implementovali a udržovali databázi. Vzhledem k neustále se měnící povaze je pro maximalizaci efektivity databázových technologií nezbytné neustálé školení.
Náklady na instalaci a správu a složitosti Multiuser databázové systémy jsou rozsáhlé a složité softwarové architektury, často s ročními náklady na technickou podporu a rozšíření. Softwarová rozšíření s neustálým zlepšováním zabezpečení jsou při práci s daty nutností.
Zálohování, obnova a zabezpečení Pravidelné zálohování zajišťuje konzistenci dat a vysokou dostupnost. Pro moderní databázový systém jsou nezbytné jasné bezpečnostní postupy a obnova databáze.
Konflikty v organizaci Sdílené databáze vyžadují souhlas s definicí a vlastnictvím dat. Kromě toho je vyžadována specializovaná osoba, která data udržuje. Proto je nezbytný schopný správce databáze a smysluplné přístupové role.

Budoucnost databází

Technologie s největším potenciálním dopadem na budoucnost databází jsou autonomní databáze. Strojové učení pomáhá plně automatizovat zřizování, správu, ladění a upgrady databáze. Automatizace navíc pomáhá klást větší důraz na zabezpečení databází, což je největší výzva, které systémy budou v budoucnu čelit.


Cent OS
  1. Co je databáze NoSQL? – Vysvětlení NoSQL

  2. Co je to relační databáze?

  3. Distribuovaná databáze NoSQL Elasticsearch – co to je a měli byste ji používat?

  1. Typy databáze NoSQL

  2. Co je Spark DataFrame?

  3. Co je relační databáze?

  1. Seznam databází NoSQL pro rok 2021

  2. Co je databázový server a k čemu se používá?

  3. Nejlepší software pro správu databáze – Top 25 softwaru