GNU/Linux >> Znalost Linux >  >> Linux

Distribuovaná databáze NoSQL Elasticsearch – co to je a měli byste ji používat?

Pokoušíte se rozhodnout, zda by Elasticsearch mohl být pro vaši společnost to pravé? Zde je pohled na jeho výhody.

  • Co je Elasticsearch?
  • Funkce
  • Pohled jednoho programátora
  • Silný hosting Elasticsearch

Co je Elasticsearch?

Elasticsearch je fulltextová distribuovaná databáze NoSQL. Jinými slovy, používá spíše dokumenty než schéma nebo tabulky. Je to bezplatný nástroj s otevřeným zdrojovým kódem, který umožňuje vyhledávání a analýzu vašich dat v reálném čase. Lidé tento systém oceňují, protože vám umožňuje okamžitě spouštět metriky na vašich datech, takže jim můžete okamžitě a průběžně porozumět.

Obzvláště populární je ve Spojených státech a Spojeném království s 63 % a 21 % uživatelů.

Zde je pohled na silné stránky tohoto nástroje prostřednictvím oficiální stránky a holandského programátora Gabriela Ajabahiana.

Funkce

Zde jsou některé z nejsilnějších funkcí Elasticsearch:

Analýza v reálném čase

Ostatně autor série Sherlock Holmes, Sir Arthur Conan Doyle, to možná řekl nejlépe:„Je velkým omylem teoretizovat, než má člověk data,“ řekl. "Nerozumně se začíná překrucovat fakta, aby vyhovovala teoriím, místo aby teorie vyhovovaly faktům."

Široká distribuce

Škálovatelnost je samozřejmě hlavní součástí výpočetní techniky v roce 2016. S Elasticsearch se můžete horizontálně rozložit, jak se váš systém rozšiřuje. Vše, co musíte udělat, je přidat uzly. Další stroje budou jednoduše začleněny do dosahu softwaru. Svá data můžete distribuovat do značné míry a nástroj i nadále bezproblémově funguje.

Spolehlivost

Cluster Elastisearch určí, kdy uzel nefunguje správně, a přesměruje data na jiná místa, aby byly vaše informace chráněny a snadno spravovatelné.

Více než jedna společnost nebo divize

Nemusíte používat pouze jeden index, ale můžete jich mít několik a můžete z nich sbírat data v kombinaci nebo po jednom. Můžete také vytvořit aliasy, abyste data procházeli filtrem.

Celý text

Distribuce je zajištěna prostřednictvím Apache Lucene, takže máte přístup k silnému fulltextovému vyhledávání s otevřeným zdrojovým kódem. „Výkonné, pro vývojáře přívětivé rozhraní API pro dotazy podporuje vícejazyčné vyhledávání, geolokaci, kontextové návrhy, jak jste to mysleli, automatické doplňování a úryvky výsledků,“ uvádí oficiální stránka.

Dokumenty

V rámci Elasticsearch můžete ukládat sofistikované obchodní informace jako strukturovaný dokument JSON. Vše se automaticky integruje do indexu. Navíc můžete zkontrolovat všechny indexy pomocí jednoho požadavku, takže můžete rychle odpovědět na složité otázky.

Žádné schéma

S Elastisearch můžete téměř okamžitě začít pracovat. Stačí indexovat dokument JSON. Program ví, že identifikuje strukturu a formát dat a vygeneruje index, aby v nich bylo možné vyhledávat.

RESTful API

API je pro Elasticsearch ústředním bodem. Pomocí RESTful API můžete provádět téměř jakýkoli úkol prostřednictvím JSON přes HTTP. Existují knihovny vhodné pro mnoho skriptovacích jazyků.

Trvalost

Integrita vašich dat je pro tento systém zásadní. Jakékoli úpravy, ke kterým dojde, jsou okamžitě zapsány do více než jednoho režimu, takže je vzácné, že ztratíte data nebo neuvidíte, že by se nějaké změny správně projevily.

Licence s otevřeným zdrojovým kódem

Elasticsearch využívá open source licenci Apache 2, která vám umožňuje jej nainstalovat, pracovat s ním a zcela zdarma si jej přizpůsobit. Apache 2 je jednou z uživatelsky nejpřívětivějších licencí dostupných pro aplikace s otevřeným zdrojovým kódem.

Apache Lucene

Název Apache je základem tohoto systému. „Apache Lucene je vysoce výkonná plnohodnotná knihovna pro získávání informací napsaná v Javě,“ vysvětluje oficiální stránka. „Elasticsearch používá Lucene interně k vybudování svých nejmodernějších možností distribuovaného vyhledávání a analýzy.“

Pohled jednoho programátora

Ajabahian vysvětluje, že Elastisearch má různé případy použití. Svůj blog si můžete uložit do programu, aby bylo například snadné vyhledávat. To není okamžitě možné s tradiční SQL databází.

Také chcete mít možnost provádět analýzu vašich dat co nejrychleji. Tento nástroj obsahuje komponenty Logstash a Kibanato, které vám umožňují jít nad rámec hledání toho, co potřebujete, ke kontrole metrik v datech.

Navíc, říká Ajabahian, můžete mít svá data uložená v tomto systému, i když má různé charakteristiky a schémata. „Protože Elasticsearch je bez schématu, nebude záležet na tom, že tam budete ukládat různé dokumenty,“ říká. „[Stále je budete moci prohledávat snadno a rychle."

Kromě toho vám Kibana poskytuje ovládací panel, pomocí kterého mohou lidé, kteří potřebují pracovat s daty, ale nemají technické dovednosti, tak intuitivně as malým zaškolením.

Nakonec Ajabahian poznamenává, že rychlost Elasticsearch je opravdu neuvěřitelná. Můžete indexovat miliony dokumentů a prohledávat je všechny najednou za méně než sekundu.

Silný hosting Elasticsearch

Chcete se posunout vpřed s testováním nebo nasazením Elasticsearch? S Atlantic.Net můžete získat cloudový server světové třídy za pouhých 30 sekund, poháněný podnikovými disky SSD (SSD) pro bleskově rychlý server a aplikace pro hostování VPS jediným kliknutím.


Linux
  1. Co je to jádro Linuxu a měli byste upgradovat na nejnovější jádro?

  2. Jak na to:Co je Git a Github? Jak to mám používat a proč by mě to mělo zajímat?

  3. Co je to relační databáze?

  1. C++:jakou knihovnu regulárních výrazů bych měl použít?

  2. Kdy mám použít TCP_NODELAY a kdy TCP_CORK?

  3. Proč by se měl v Bash vyhnout eval a co bych měl místo toho použít?

  1. Co je databáze NoSQL? – Vysvětlení NoSQL

  2. Co je relační databáze?

  3. Co je kurátorství obsahu a jak byste to měli dělat?