GNU/Linux >> Znalost Linux >  >> Ubuntu

Jak nainstalovat Apache Spark na Ubuntu 18.04 LTS

V tomto tutoriálu vám ukážeme, jak nainstalovat Apache Spark na Ubuntu 18.04 LTS. Pro ty z vás, kteří nevěděli, Apache Spark je rychlý a univerzální clusterový výpočetní systém . Poskytuje API na vysoké úrovni v Javě, Scale a Pythonu a také optimalizovaný engine, který podporuje celkové grafy provádění. Podporuje také bohatou sadu nástrojů vyšší úrovně včetně Spark SQL pro SQL a zpracování strukturovaných informací, MLlib pro stroj učení, GraphX ​​pro zpracování grafů a Spark Streaming.

Tento článek předpokládá, že máte alespoň základní znalosti Linuxu, víte, jak používat shell, a co je nejdůležitější, hostujete svůj web na vlastním VPS. Instalace je poměrně jednoduchá a předpokládá, že běží v účtu root, pokud ne, možná budete muset přidat 'sudo ‘ k příkazům pro získání oprávnění root. Ukážu vám krok za krokem instalaci Apache Spark na server 18.04 LTS (Bionic Beaver).

Nainstalujte Apache Spark na Ubuntu 18.04 LTS Bionic Beaver

Krok 1. Nejprve se ujistěte, že všechny vaše systémové balíčky jsou aktuální spuštěním následujících příkazů apt-get v terminálu.

sudo apt-get update
sudo apt-get upgrade

Krok 2. Instalace Java.

Apache Spark vyžaduje, aby byla na vašem serveru nainstalována Java. Ve výchozím nastavení není Java dostupná v úložišti Ubuntu. Přidejte Oracle Java PPA do Apt pomocí následujícího příkazu:

add-apt-repository ppa:webupd8team/java
apt-get update -y
apt-get install oracle-java8-installer

Ověřte verzi Java spuštěním následujícího příkazu:

java -version

Krok 3. Instalace Apache Spark na Ubuntu 18.04 LTS.

Nainstalujte Apache Spark pomocí následujícího příkazu:

wget https://www.apache.org/dyn/closer.lua/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz
tar xvzf spark-2.3.1-bin-hadoop2.7.tgz
ln -s spark-2.3.1-bin-hadoop2.7 spark

Přidání Sparku do cesty:

nano ~/.bashrc

Dále přidejte tyto řádky na konec souboru .bashrc, aby cesta mohla obsahovat cestu ke spustitelnému souboru Spark:

SPARK_HOME=/idr00t/spark
export PATH=$SPARK_HOME/bin:$PATH

Chcete-li tyto změny aktivovat, spusťte pro soubor bashrc následující příkaz:

source ~/.bashrc

Spouštění Spark Shell:

./spark/bin/spark-shell

Krok 4. Přístup k Apache Spark.

Apache Spark bude ve výchozím nastavení k dispozici na portu HTTP 4040. Otevřete svůj oblíbený prohlížeč a přejděte na http://your-domain.com:4040 nebo http://server-ip:40404 a dokončete požadované kroky k dokončení instalace.

Blahopřejeme! Úspěšně jste nainstalovali Apache Spark. Děkujeme, že jste použili tento návod k instalaci Apache Spark na systém Ubuntu 18.04 LTS (Bionic Beaver). Pro další nápovědu nebo užitečné informace vám doporučujeme zkontrolovat oficiální webové stránky Apache Spark.


Ubuntu
  1. Jak nainstalovat Apache Cordova na Ubuntu 18.04 LTS

  2. Jak nainstalovat Apache Kafka na Ubuntu 18.04 LTS

  3. Jak nainstalovat Apache Hadoop na Ubuntu 18.04 LTS

  1. Jak nainstalovat Apache Maven na Ubuntu 16.04 LTS

  2. Jak nainstalovat Apache Maven na Ubuntu 18.04 LTS

  3. Jak nainstalovat Apache Solr na Ubuntu 20.04 LTS

  1. Jak nainstalovat Apache Spark na Ubuntu 20.04

  2. Jak nainstalovat Apache CouchDB 3.1 na Ubuntu 20.04 LTS

  3. Jak nainstalovat Apache NetBeans na Ubuntu 22.04 LTS