网站首页 > 博客 > 正文

大数据 linux Spark完全分布式搭建

甜水一博客 2023-11-30 1 0

下面的配置默认在Hadoop集群搭建成功的基础上进行搭建，如果没有搭建Hadoop,可以参考另一篇文章Hadoop完全分布式搭建

将spark的安装包下载后解压到指定目录

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module

进入spark安装目录

cd /opt/module

将spark改名

mv spark-3.0.0-bin-hadoop3.2 spark

进入spark的conf目录

cd ./spark/conf

将slaves.template文件和spark-env.sh.template文件的后缀去掉

mv slaves.template salves

mv spark-env.sh.template spark-env.sh

在slaves文件中将三台服务器的名称配置上

hadoop102

hadoop103

hadoop104

配置配置 spark-env.sh 文件

vim spark-env.sh

# 配置各种软件的HOME，一般来说不配置也可以，但是可能会出现问题，还是配上

export JAVA_HOME=/opt/module/jdk

export SCALA_HOME=/opt/module/scala

export HADOOP_HOME=/opt/module/hadoop

export SPARK_HOME=/opt/module/spark

export HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop

# 设置Master的IP

export SPARK_MASTER_IP=192.168.88.102

# 设置Master的主机名

export SPARK_MASTER_HOST=hadoop102

# 设置本节点的IP

export SPARK_LOCAL_IP=192.168.88.102

# 每一个Worker最多可以使用的内存

export SPARK_WORKER_MEMORY=1g

# 每一个Worker最多可以使用的cpu core的个数

export SPARK_WORKER_CORES=1

# 提交Application的端口，默认就是这个，万一要改呢，改这里

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_DIST_CLASSPATH=$(/opt/module/hadoop/etc/hadoop classpath)

配置完成后将主节点的spark分发到其他节点

cd /opt/module

xsync spark

在从节点中将spark中conf/spark-env.sh文件的本节点IP修改一下

vim /opt/module/spark/conf/spark_env.sh

# 修改为本节点IP地址

export SPARK_LOCAL_IP=192.168.88.103

export SPARK_LOCAL_IP=192.168.88.104

启动Spark集群

cd /opt/module/spark

sbin/start-all.sh

查看所有进程配置成功 !

精彩链接

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

本文由用户于 2023-11-30 发布在夸智网，如有疑问，请联系我们。
本文链接：https://www.kuazhi.com/post/712792430.html

夸智网

大数据 linux Spark完全分布式搭建

react native react.js javascript RN——TextInput 文本框删除最后一个字符，光标移动到组件末尾

python 大数据 pyspark.sql.functions中collect

发表评论取消回复

夸智网

大数据 linux Spark完全分布式搭建

react native react.js javascript RN——TextInput 文本框删除最后一个字符，光标移动到组件末尾

python 大数据 pyspark.sql.functions中collect

相关文章

发表评论取消回复