下面的配置默认在Hadoop集群搭建成功的基础上进行搭建,如果没有搭建Hadoop,可以参考另一篇文章Hadoop完全分布式搭建
将spark的安装包下载后解压到指定目录
tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module
进入spark安装目录
cd /opt/module
将spark改名
mv spark-3.0.0-bin-hadoop3.2 spark
进入spark的conf目录
cd ./spark/conf
将slaves.template文件和spark-env.sh.template文件的后缀去掉
mv slaves.template salves
mv spark-env.sh.template spark-env.sh
在slaves文件中将三台服务器的名称配置上
hadoop102
hadoop103
hadoop104
配置配置 spark-env.sh 文件
vim spark-env.sh
# 配置各种软件的HOME,一般来说不配置也可以,但是可能会出现问题,还是配上
export JAVA_HOME=/opt/module/jdk
export SCALA_HOME=/opt/module/scala
export HADOOP_HOME=/opt/module/hadoop
export SPARK_HOME=/opt/module/spark
export HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop
# 设置Master的IP
export SPARK_MASTER_IP=192.168.88.102
# 设置Master的主机名
export SPARK_MASTER_HOST=hadoop102
# 设置本节点的IP
export SPARK_LOCAL_IP=192.168.88.102
# 每一个Worker最多可以使用的内存
export SPARK_WORKER_MEMORY=1g
# 每一个Worker最多可以使用的cpu core的个数
export SPARK_WORKER_CORES=1
# 提交Application的端口,默认就是这个,万一要改呢,改这里
export SPARK_MASTER_WEBUI_PORT=8080
export SPARK_DIST_CLASSPATH=$(/opt/module/hadoop/etc/hadoop classpath)
配置完成后将主节点的spark分发到其他节点
cd /opt/module
xsync spark
在从节点中将spark中conf/spark-env.sh文件的本节点IP修改一下
vim /opt/module/spark/conf/spark_env.sh
# 修改为本节点IP地址
export SPARK_LOCAL_IP=192.168.88.103
export SPARK_LOCAL_IP=192.168.88.104
启动Spark集群
cd /opt/module/spark
sbin/start-all.sh
查看所有进程 配置成功 !
精彩链接
发表评论