kubernetes 【云原生】Hadoop HA on k8s 环境部署

文章目录

一、概述二、开始部署1）添加 journalNode 编排1、控制器Statefulset2、service

2）修改配置1、修改values.yaml2、修改hadoop/templates/hadoop-configmap.yaml

3）开始安装4）测试验证5）卸载

一、概述

在 Hadoop 2.0.0 之前，一个集群只有一个Namenode，这将面临单点故障问题。如果 Namenode 机器挂掉了，整个集群就用不了了。只有重启 Namenode ，才能恢复集群。另外正常计划维护集群的时候，还必须先停用整个集群，这样没办法达到 7 * 24小时可用状态。Hadoop 2.0 及之后版本增加了 Namenode 高可用机制，这里主要讲Hadoop HA on k8s 环境部署。

非高可用 k8s 环境，可参考我这篇文章：【云原生】Hadoop on k8s 环境部署高可用非 k8s 环境，可参考我这篇文章：大数据Hadoop之——Hadoop 3.3.4 HA（高可用）原理与实现（QJM）

HDFS YARN

二、开始部署

这里是基于非高可用编排的基础上改造。不了解的小伙伴，可以先看我上面的文章。

1）添加 journalNode 编排

1、控制器Statefulset

apiVersion: apps/v1

kind: StatefulSet

metadata:

annotations:

checksum/config: {{ include (print $.Template.BasePath "/hadoop-configmap.yaml") . | sha256sum }}

labels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

helm.sh/chart: {{ include "hadoop.chart" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

spec:

selector:

matchLabels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

serviceName: {{ include "hadoop.fullname" . }}-hdfs-jn

replicas: {{ .Values.hdfs.jounralNode.replicas }}

template:

metadata:

labels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

spec:

affinity:

podAntiAffinity:

requiredDuringSchedulingIgnoredDuringExecution:

- topologyKey: "kubernetes.io/hostname"

labelSelector:

matchLabels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

preferredDuringSchedulingIgnoredDuringExecution:

- weight: 5

podAffinityTerm:

topologyKey: "kubernetes.io/hostname"

labelSelector:

matchLabels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

terminationGracePeriodSeconds: 0

containers:

- name: hdfs-jn

image: "{{ .Values.image.repository }}:{{ .Values.image.tag }}"

imagePullPolicy: {{ .Values.image.pullPolicy | quote }}

command:

- "/bin/bash"

- "/opt/apache/tmp/hadoop-config/bootstrap.sh"

- "-d"

resources:

readinessProbe:

tcpSocket:

port: 8485

initialDelaySeconds: 10

timeoutSeconds: 2

livenessProbe:

tcpSocket:

port: 8485

initialDelaySeconds: 10

timeoutSeconds: 2

volumeMounts:

- name: hadoop-config

mountPath: /opt/apache/tmp/hadoop-config

- name: {{ .name }}

mountPath: {{ .mountPath }}

securityContext:

runAsUser: {{ .Values.securityContext.runAsUser }}

privileged: {{ .Values.securityContext.privileged }}

volumes:

- name: hadoop-config

configMap:

volumeClaimTemplates:

- metadata:

labels:

app.kubernetes.io/name: {{ include "hadoop.name" $ }}

helm.sh/chart: {{ include "hadoop.chart" $ }}

app.kubernetes.io/instance: {{ $.Release.Name }}

app.kubernetes.io/component: hdfs-jn

spec:

accessModes:

- {{ $.Values.persistence.journalNode.accessMode | quote }}

resources:

requests:

storage: {{ $.Values.persistence.journalNode.size | quote }}

storageClassName: ""

storageClassName: "{{ $.Values.persistence.journalNode.storageClass }}"

- name: dfs

emptyDir: {}

2、service

# A headless service to create DNS records

apiVersion: v1

kind: Service

metadata:

labels:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

helm.sh/chart: {{ include "hadoop.chart" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

spec:

ports:

- name: jn

port: {{ .Values.service.journalNode.ports.jn }}

protocol: TCP

{{- if and (eq .Values.service.journalNode.type "NodePort") .Values.service.journalNode.nodePorts.jn }}

nodePort: {{ .Values.service.journalNode.nodePorts.jn }}

type: {{ .Values.service.journalNode.type }}

selector:

app.kubernetes.io/name: {{ include "hadoop.name" . }}

app.kubernetes.io/instance: {{ .Release.Name }}

app.kubernetes.io/component: hdfs-jn

2）修改配置

1、修改values.yaml

image:

repository: myharbor.com/bigdata/hadoop

tag: 3.3.2

pullPolicy: IfNotPresent

# The version of the hadoop libraries being used in the image.

hadoopVersion: 3.3.2

logLevel: INFO

# Select antiAffinity as either hard or soft, default is soft

antiAffinity: "soft"

hdfs:

nameNode:

replicas: 2

pdbMinAvailable: 1

resources:

requests:

memory: "256Mi"

cpu: "10m"

limits:

memory: "2048Mi"

cpu: "1000m"

dataNode:

# Will be used as dfs.datanode.hostname

# You still need to set up services + ingress for every DN

# Datanodes will expect to

externalHostname: example.com

externalDataPortRangeStart: 9866

externalHTTPPortRangeStart: 9864

replicas: 3

pdbMinAvailable: 1

resources:

requests:

memory: "256Mi"

cpu: "10m"

limits:

memory: "2048Mi"

cpu: "1000m"

webhdfs:

enabled: true

jounralNode:

replicas: 3

pdbMinAvailable: 1

resources:

requests:

memory: "256Mi"

cpu: "10m"

limits:

memory: "2048Mi"

cpu: "1000m"

yarn:

resourceManager:

pdbMinAvailable: 1

replicas: 2

resources:

requests:

memory: "256Mi"

cpu: "10m"

limits:

memory: "2048Mi"

cpu: "2000m"

nodeManager:

pdbMinAvailable: 1

# The number of YARN NodeManager instances.

replicas: 1

# Create statefulsets in parallel (K8S 1.7+)

parallelCreate: false

# CPU and memory resources allocated to each node manager pod.

# This should be tuned to fit your workload.

resources:

requests:

memory: "256Mi"

cpu: "500m"

limits:

memory: "2048Mi"

cpu: "1000m"

persistence:

nameNode:

enabled: true

storageClass: "hadoop-ha-nn-local-storage"

accessMode: ReadWriteOnce

size: 1Gi

local:

- name: hadoop-ha-nn-0

host: "local-168-182-110"

path: "/opt/bigdata/servers/hadoop-ha/nn/data/data1"

- name: hadoop-ha-nn-1

host: "local-168-182-111"

path: "/opt/bigdata/servers/hadoop-ha/nn/data/data1"

dataNode:

enabled: true

enabledStorageClass: false

storageClass: "hadoop-ha-dn-local-storage"

accessMode: ReadWriteOnce

size: 1Gi

local:

- name: hadoop-ha-dn-0

host: "local-168-182-110"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data1"

- name: hadoop-ha-dn-1

host: "local-168-182-110"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data2"

- name: hadoop-ha-dn-2

host: "local-168-182-110"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data3"

- name: hadoop-ha-dn-3

host: "local-168-182-111"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data1"

- name: hadoop-ha-dn-4

host: "local-168-182-111"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data2"

- name: hadoop-ha-dn-5

host: "local-168-182-111"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data3"

- name: hadoop-ha-dn-6

host: "local-168-182-112"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data1"

- name: hadoop-ha-dn-7

host: "local-168-182-112"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data2"

- name: hadoop-ha-dn-8

host: "local-168-182-112"

path: "/opt/bigdata/servers/hadoop-ha/dn/data/data3"

volumes:

- name: dfs1

mountPath: /opt/apache/hdfs/datanode1

hostPath: /opt/bigdata/servers/hadoop-ha/dn/data/data1

- name: dfs2

mountPath: /opt/apache/hdfs/datanode2

hostPath: /opt/bigdata/servers/hadoop-ha/dn/data/data2

- name: dfs3

mountPath: /opt/apache/hdfs/datanode3

hostPath: /opt/bigdata/servers/hadoop-ha/dn/data/data3

journalNode:

enabled: true

storageClass: "hadoop-ha-jn-local-storage"

accessMode: ReadWriteOnce

size: 1Gi

local:

- name: hadoop-ha-jn-0

host: "local-168-182-110"

path: "/opt/bigdata/servers/hadoop-ha/jn/data/data1"

- name: hadoop-ha-jn-1

host: "local-168-182-111"

path: "/opt/bigdata/servers/hadoop-ha/jn/data/data1"

- name: hadoop-ha-jn-2

host: "local-168-182-112"

path: "/opt/bigdata/servers/hadoop-ha/jn/data/data1"

volumes:

- name: jn

mountPath: /opt/apache/hdfs/journalnode

service:

nameNode:

type: NodePort

ports:

dfs: 9000

webhdfs: 9870

nodePorts:

dfs: 30900

webhdfs: 30870

dataNode:

type: NodePort

ports:

webhdfs: 9864

nodePorts:

webhdfs: 30864

resourceManager:

type: NodePort

ports:

web: 8088

nodePorts:

web: 30088

journalNode:

type: ClusterIP

ports:

jn: 8485

nodePorts:

jn: ""

securityContext:

runAsUser: 9999

privileged: true

2、修改hadoop/templates/hadoop-configmap.yaml

修改的内容比较多，这里就不贴出来了，最下面会给出git下载地址。

3）开始安装

# 创建存储目录

mkdir -p /opt/bigdata/servers/hadoop-ha/{nn,dn,jn}/data/data{1..3}

chmod -R 777 -R /opt/bigdata/servers/hadoop-ha/{nn,dn,jn}

helm install hadoop-ha ./hadoop -n hadoop-ha --create-namespace

查看

kubectl get pods,svc -n hadoop-ha -owide

HDFS WEB-nn1：http://192.168.182.110:31870/dfshealth.html#tab-overview

HDFS WEB-nn2：http://192.168.182.110:31871/dfshealth.html#tab-overview YARN WEB-rm1：http://192.168.182.110:31088/cluster/cluster YARN WEB-rm2：http://192.168.182.110:31089/cluster/cluster

4）测试验证

kubectl exec -it hadoop-ha-hadoop-hdfs-nn-0 -n hadoop-ha -- bash

5）卸载

helm uninstall hadoop-ha -n hadoop-ha

kubectl delete pod -n hadoop-ha `kubectl get pod -n hadoop-ha|awk 'NR>1{print $1}'` --force

kubectl patch ns hadoop-ha -p '{"metadata":{"finalizers":null}}'

kubectl delete ns hadoop-ha --force

rm -fr /opt/bigdata/servers/hadoop-ha/{nn,dn,jn}/data/data{1..3}/*

git下载地址：https://gitee.com/hadoop-bigdata/hadoop-ha-on-k8s

Hadoop HA on k8s 环境部署就先到这里，这里描述的不是很多，有疑问的小伙伴欢迎给我留言，可能有些地方还不太完善，后续会继续完善并在此基础上添加其它服务进来，会持续分享【大数据+云原生】相关的文章，请小伙伴耐心等待~

好文推荐

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

夸智网

kubernetes 【云原生】Hadoop HA on k8s 环境部署

linux hdfs windows spring cloud 史上最详细的hadoop安装教程

大数据 hdfs hadoop搭建好，启动服务后，无法从web界面访问50070

发表评论取消回复

夸智网

kubernetes 【云原生】Hadoop HA on k8s 环境部署

linux hdfs windows spring cloud 史上最详细的hadoop安装教程

大数据 hdfs hadoop搭建好，启动服务后，无法从web界面访问50070

相关文章

发表评论取消回复