下面的配置默认在Hadoop集群搭建成功的基础上进行搭建,如果没有搭建Hadoop,可以参考另一篇文章Hadoop完全分布式搭建

将spark的安装包下载后解压到指定目录

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module

进入spark安装目录

cd /opt/module

将spark改名

mv spark-3.0.0-bin-hadoop3.2 spark

进入spark的conf目录

cd ./spark/conf

将slaves.template文件和spark-env.sh.template文件的后缀去掉

mv slaves.template salves

mv spark-env.sh.template spark-env.sh

在slaves文件中将三台服务器的名称配置上

hadoop102

hadoop103

hadoop104

配置配置 spark-env.sh 文件

vim spark-env.sh

# 配置各种软件的HOME,一般来说不配置也可以,但是可能会出现问题,还是配上

export JAVA_HOME=/opt/module/jdk

export SCALA_HOME=/opt/module/scala

export HADOOP_HOME=/opt/module/hadoop

export SPARK_HOME=/opt/module/spark

export HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop

# 设置Master的IP

export SPARK_MASTER_IP=192.168.88.102

# 设置Master的主机名

export SPARK_MASTER_HOST=hadoop102

# 设置本节点的IP

export SPARK_LOCAL_IP=192.168.88.102

# 每一个Worker最多可以使用的内存

export SPARK_WORKER_MEMORY=1g

# 每一个Worker最多可以使用的cpu core的个数

export SPARK_WORKER_CORES=1

# 提交Application的端口,默认就是这个,万一要改呢,改这里

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_DIST_CLASSPATH=$(/opt/module/hadoop/etc/hadoop classpath)

配置完成后将主节点的spark分发到其他节点

cd /opt/module

xsync spark

在从节点中将spark中conf/spark-env.sh文件的本节点IP修改一下

vim /opt/module/spark/conf/spark_env.sh

# 修改为本节点IP地址

export SPARK_LOCAL_IP=192.168.88.103

export SPARK_LOCAL_IP=192.168.88.104

启动Spark集群

cd /opt/module/spark

sbin/start-all.sh

查看所有进程 配置成功 !

精彩链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。