目录

1.下载安装

2.配置

2.1.启动hadoop

2.2.单机模式

2.3.伪分布式集群

1.下载安装

HBase和Hadoop之间有版本对应关系,之前用的hadoop是3.1.3,选择的HBase的版本是2.2.X。

下载地址:

Index of /dist/hbase

配置环境变量:

之前在PATH中已经配置了JAVA的环境变量,直接用:隔开,追加一个hbase的环境变量

export JAVA_HOME=/jdk/jdk8

export PATH=$JAVA_HOME/bin:$PATH:/hbase/hbase-2.2.2/bin

export CLASSPATH="."

刷新环境变量:

source /etc/profile

查看是否生效:

hbase version

2.配置

HBASE有三种模式:

单机模式 伪分布式模式 分布式模式

分布式模式太吃机器性能了,学习来说的话伪分布式模式就够了。本文将会讲解单机模式和伪分布式模式的配置。

运行HBase的前置环境:

JDK 对应版本的Hadoop SSH

以上环境在我们之前安装hadoop的时候就已经安装过了,此处不再赘述。

2.1.启动hadoop

我用的Windows的wsl版本的ubuntu,所以没有用systemctl命令,而是用service命令来直接启动服务。

hbase依赖于hdfs,所以要先启动hdfs,hdfs依赖于ssh,所以最先启动ssh。

service start ssh

./sbin/start-dfs.sh

2.2.单机模式

在HBase的单机模式下,所有HBase组件(包括HMaster、HRegionServer以及ZooKeeper)都运行在一个JVM进程中,且不依赖于Hadoop的HDFS,而是直接使用本地文件系统来存储数据。

HBase的配置文件所在位置:

vi /hbase/hbase-2.2.2/conf/hbase-env.sh

配置如下内容:

export JAVA_HOME=/jdk/jdk8/ #设置JDK路径

export HBASE_MANAGES_ZK=true #HBASE本身自带一个zookeeper,设置使用自带的zookeeper,而不是外界的

配置

vi /hbase/hbase-2.2.2/conf/hbase-site.xml

设置rootdir,用来存储hbase的数据,不设置数据的存储路径的话,每次重启hbase都会丢数据。

     

              hbase.rootdir

              file:///usr/local/hbase/hbase-tmp

     

启动HBase:

./bin/start-hbase.sh

进入交互式界面:

./bin/hbase shell

在交互式界面可以指向hbase的命令:

list指令查看所有,exit命令退出交互式界面,stop-hbase.sh关闭hbase:

2.3.伪分布式集群

伪分布式模式模拟了分布式环境,但实际上所有HBase组件(包括HMaster、多个HRegionServer以及ZooKeeper)仍然运行在同一台物理机器上,但是每个组件都在各自的JVM进程中运行。此外,伪分布式模式会使用Hadoop的HDFS作为底层存储,这意味着数据会被分布在本地文件系统的不同目录中,模拟了分布式存储的效果。

配置hbase-env.sh:

export HBASE_CLASSPATH=/hadoop/hadoop-3.1.3/etc/hadoop/ #配置hadoop的配置文件路径,挂载到hdfs上

配置hbase-site.xml:

     

              hbase.rootdir

              hdfs://localhost:9000/hbase

     

      #开启分布式模式

     

              hbase.cluster.distributed

              true

     

     

              hbase.unsafe.stream.capability.enforce

              false

     

再启动可以看到:

HBase相关组件启动了

文章链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。