Flink��Ⱥ�

��Ⱥ�滮

�ڵ�	node01	node02	node03
��ɫ	JobManager TaskManager	TaskManager	TaskManager

��ز��ѹ��װ��

wget https://repo.huaweicloud.com/apache/flink/flink-1.17.0/flink-1.17.0-bin-scala_2.12.tgz

��node01�ڵ��flink��װ��ͬʱ��ѹ��
tar  -zxvf flink-1.17.0-bin-scala_2.12.tgz

mv flink-1.17.0 flink

�޸ļ�Ⱥ��

��flink��confĿ¼��޸ļ�Ⱥ��

vim /usr/local/program/flink/conf/flink-conf.yaml

1.�޸�flink-conf.yaml�ļ�

JobManager�ڵ��

# jobmanager.rpc.address: localhost
# jobmanager.bind-host: localhost
jobmanager.rpc.address: node01
jobmanager.bind-host: 0.0.0.0

# rest.address: localhost
# rest.bind-address: localhost
rest.address: node01
rest.bind-address: 0.0.0.0

TaskManager�ڵ��

# taskmanager.host: localhost
# taskmanager.bind-host: localhost

taskmanager.host: node01
taskmanager.bind-host: 0.0.0.0

ע�⣺��Ҫ��/etc/hosts�ļ��ø��ڵ��Ϣ

172.29.234.1    node01    node01
172.29.234.2    node02    node02
172.29.234.3    node03    node03

2.�޸�workers�ļ�

ָ��node01��node02��node03�Ƚڵ�ΪTaskManager

# localhost
node01
node02
node03

3.�޸�masters�ļ�

# localhost:8081
node01:8081

�ַ��װĿ¼

��node01�ڵ㰲װ��úú󣬽�Flink��װĿ¼�ַ��ڵ��

[root@node01 program]# pwd
/usr/local/program
[root@node01 program]# ls
flink                            jdk8

[root@node01 program]# scp -r flink node02:/usr/local/program/flink

[root@node01 program]# scp -r flink node03:/usr/local/program/flink

��node02��node03�ڵ㣬�޸�flink-conf.yaml��

1.node02�ڵ�

# taskmanager.host: localhost

taskmanager.host: node02

2.node03�ڵ�

# taskmanager.host: localhost

taskmanager.host: node03

��Ⱥ

Flink��ص�bash�ű��ֹͣ��Ⱥ��

# ������Ⱥ
./bin/start-cluster.sh

# ֹͣ��Ⱥ
./bin/stop-cluster.sh

��node01�ڵ��ִ��start-cluster.sh�ű��Flink��Ⱥ

[root@node01 bin]# cd /usr/local/program/flink/bin

[root@node01 bin]# ./start-cluster.sh 
Starting cluster.
Starting standalonesession daemon on host node01.
Starting taskexecutor daemon on host node01.
Starting taskexecutor daemon on host node02.
Starting taskexecutor daemon on host node03.

�鿴��

[root@node01 bin]# jps
6788 StandaloneSessionClusterEntrypoint
7256 Jps
7116 TaskManagerRunner

[root@node02 conf]# jps
16884 TaskManagerRunner
16959 Jps

[root@node03 conf]# jps
17139 TaskManagerRunner
17214 Jps

��Web UI

��ʾһ��󣬴��ɹ��ʱ��Է��http://node01:8081��flink��Ⱥ��м�ع��

ע�⣺�رշ��ǽ��޷��ʣ��߼�Ⱥ��TaskManager��Slot��ʾ�쳣

systemctl stop firewalld

Flink��ȺHA�߿��

��

��Ⱥʵ��ֻ��һ��JobManager��Ǵ��ڵ��ϵģ��ٷ��ṩ��Standalone Cluster HAģʽ��ʵ�ּ�Ⱥ�߿��á�

��Ⱥ��ж��JobManager��ֻ��һ��active״̬��ڱ��״̬��Flinkʹ�� ZooKeeper��ѡ�ٳ�Active JobManager��ṩһ��Э��ҪԤ�Ȱ�װ ZooKeeper ��

Flink��ṩ��ZooKeeper��ֱ��޸�conf/zoo.cfg��ʹ��/bin/start-zookeeper-quorum.shֱ��

��Ⱥ�滮

�ڵ�	node01	node02	node03
��ɫ	JobManager TaskManager	JobManager TaskManager	TaskManager

��flink

��Flink��Ⱥ��node01�ڵ��õ��£��޸�conf/flink-conf.yaml�ļ��ã�

# ����ʹ��zookeeper�������߿���ģʽ
high-availability.type: zookeeper

# ����zookeeper�ĵ�ַ������zookeeper��Ⱥʱ������ʹ�ö������ָ�����ڵ��ַ
high-availability.zookeeper.quorum: node01:2181,node02:2181,node03:2181

# ��zookeeper�ϴ洢flink��ȺԪ��Ϣ��·��
high-availability.zookeeper.path.root: /flink

# ��Ⱥid ���ü�Ⱥ�����б���Э������
high-availability.cluster-id: /cluster_one

# �־û��洢JobManagerԪ���ݵĵ�ַ��zookeeper�ϴ洢��ֻ��ָ���Ԫ���ݵ�ָ����Ϣ
high-availability.storageDir: hdfs://node01:9000/flink/recovery

��master��workers

�޸�conf/masters�ļ��master�ڵ�

node01:8081
node02:8081

�޸�conf/workers�ļ��worker�ڵ�

node01
node02
node03

��ZK

�༭vim zoo.cfg�ļ�

server.1=node01:2888:3888
server.2=node02:2888:3888
server.3=node03:2888:3888

�ַ��װĿ¼

��node01�ڵ㰲װ��úú󣬽�Flink��װĿ¼�ַ��ڵ��

[root@node01 program]# pwd
/usr/local/program
[root@node01 program]# ls
flink                            jdk8

[root@node01 program]# scp -r flink node02:/usr/local/program/flink

[root@node01 program]# scp -r flink node03:/usr/local/program/flink

��node02��node03�ڵ㣬�޸�flink-conf.yaml��

1.node02�ڵ�

jobmanager.rpc.address: node02

taskmanager.host: node02

2.node03�ڵ�

taskmanager.host: node03

��HA��Ⱥ

�ַ�Flink��õ��ڵ㣬Ȼ��ȷ��Hadoop��ZooKeeper�Ѿ��ʹ��Ⱥ��

[root@node01 flink]# bin/start-cluster.sh
Starting HA cluster with 2 masters.
Starting standalonesession daemon on host node01.
Starting standalonesession daemon on host node02.
Starting taskexecutor daemon on host node01.
Starting taskexecutor daemon on host node02.
Starting taskexecutor daemon on host node03.

��http://node01:8081

��http://node02:8081

��

�鿴ZK��JobManager�ڵ��Ϣ

kill node01�ڵ��ϵ�JobManager��

[root@node01 flink]# jps
2564 DataNode
3508 NodeManager
18741 Jps
7784 QuorumPeerMain
16666 TaskManagerRunner
2363 NameNode
16300 StandaloneSessionClusterEntrypoint
3117 ResourceManager
[root@node01 flink]# kill -9 16300

�鿴Active JobManager�Ƿ�仯

Flink��

flink-conf.yaml�ļ��д��ò��£�

# jobmanager��ַ    
jobmanager.rpc.address: node01

# JobManager �� JVM ���ڴ��С��Ĭ��Ϊ 1024m 
jobmanager.heap.size: 1024m

# rpcͨ�Ŷ˿�
jobmanager.rpc.port: 6123

# ����ʹ�õ�ȫ���ڴ��С,���Ը��ݼ�Ⱥ��ģ�����ʵ�����
jobmanager.memory.process.size��1600m

# Taskmanager �� JVM ���ڴ��С��Ĭ��Ϊ 1024m 
taskmanager.heap.size: 1024m

# ����ʹ�õ�ȫ���ڴ��С,���Ը��ݼ�Ⱥ��ģ�����ʵ�����
taskmanager.memory.process.size: 1728m

# ÿ��TaskManager�ܹ������Slot�����������ã�Ĭ��Ϊ1 
# ͨ������Ϊ CPU ���ĵ�����������һ��
# Slot����TaskManager�о�������һ������������ļ�����Դ
taskmanager.numberOfTaskSlots: 1

# flink����ִ�еĲ��жȣ�Ĭ��Ϊ1
# ���ȼ����ڴ����н��еĲ��ж����ú������ύʱʹ�ò���ָ���Ĳ��ж�����
parallelism.default: 1

# ��������
jobmanager.execution.failover-strategy: region

# �洢��ʱ�ļ���·�������û�����ã���Ĭ�ϲ��÷���������ʱĿ¼���� LInux �� /tmp Ŀ¼
io.tmp.dirs: /tmp

�ο�Flink�Ĺٷ��ֲ᣺��

��ʷ��

��

��Flink job�ļ�Ⱥһ��ֹͣ��ֻ��ȥyarn�򱾵ش��ϲ鿴��־��Job��Ϣ�Ĳ鿴��쳣��Ų�ǳ��Ѻá�

Flink�ṩ��ʷ��Ӧ��Flink��Ⱥ�رպ��ѯ��ҵ��ͳ��Ϣ��ͨ��History Server��Բ�ѯ��Щ��ҵ��ͳ��Ϣ��˳��쳣�˳��

Flink��ֹͣ��JobManager�Ὣ�Ѿ��ͳ��Ϣ��д浵��History Server��ֹͣ��Զ��ͳ��Ϣ��в�ѯ��

��

��洢Ŀ¼

[root@node01 flink]# hadoop fs -mkdir -p /logs/flink-job

��flink-config.yaml��

#==============================================================================
# HistoryServer
#==============================================================================

# The HistoryServer is started and stopped via bin/historyserver.sh (start|stop)

# Directory to upload completed jobs to. Add this directory to the list of
# monitored directories of the HistoryServer as well (see below).
#jobmanager.archive.fs.dir: hdfs:///completed-jobs/
jobmanager.archive.fs.dir: hdfs://node01:9000/logs/flink-job

# The address under which the web-based HistoryServer listens.
#historyserver.web.address: 0.0.0.0
historyserver.web.address: node01

# The port under which the web-based HistoryServer listens.
#historyserver.web.port: 8082
historyserver.web.port: 8082

# Comma separated list of directories to monitor for completed jobs.
#historyserver.archive.fs.dir: hdfs:///completed-jobs/
historyserver.archive.fs.dir: hdfs://node01:9000/logs/flink-job

# Interval in milliseconds for refreshing the monitored directories.
#historyserver.archive.fs.refresh-interval: 10000
historyserver.archive.fs.refresh-interval: 5000

��ֹͣ��ʷ��

��ʷ��

[root@node01 flink]# bin/historyserver.sh start
Starting historyserver daemon on host node01.

ֹͣ��ʷ��

[root@node01 flink]# bin/historyserver.sh stop
Stopping historyserver daemon (pid: 30749) on host node01.

�ύһ��Job��

[root@node01 flink]# bin/flink run -t yarn-per-job -c com.atguigu.wc.WordCountStreamUnboundedDemo  /root/FlinkTutorial-1.17-1.0-SNAPSHOT.jar

2023-06-12 23:41:00,719 INFO  org.apache.hadoop.hdfs.protocol.datatransfer.sasl.SaslDataTransferClient [] - SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
2023-06-12 23:41:00,742 INFO  org.apache.hadoop.hdfs.protocol.datatransfer.sasl.SaslDataTransferClient [] - SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
2023-06-12 23:41:00,761 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - Cannot use kerberos delegation token manager, no valid kerberos credentials provided.
2023-06-12 23:41:00,766 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - Submitting application master application_1686577483648_0012
2023-06-12 23:41:00,792 INFO  org.apache.hadoop.yarn.client.api.impl.YarnClientImpl        [] - Submitted application application_1686577483648_0012
2023-06-12 23:41:00,792 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - Waiting for the cluster to be allocated
2023-06-12 23:41:00,793 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - Deploying cluster, current state ACCEPTED
2023-06-12 23:41:04,565 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - YARN application has been deployed successfully.
2023-06-12 23:41:04,565 INFO  org.apache.flink.yarn.YarnClusterDescriptor                  [] - Found Web Interface node02:38887 of application 'application_1686577483648_0012'.
Job has been submitted with JobID cd41d983c93d8eb906c9aa899dcdefd0

��http://node01:8088/cluster�鿴Hadoop

��Web UI�鿴�ύ��Ϣ

�鿴��ʷJob��Ϣ

��ַ��룺http://node01:8082 �鿴�Ѿ�ֹͣ�� job ��ͳ��Ϣ

ֹͣ�ύ��

[root@node01 flink]# bin/flink cancel -t yarn-per-job -Dyarn.application.id=application_1686577483648_0012 cd41d983c93d8eb906c9aa899dcdefd0

��http://node01:9870/explorer.html#/logs/flink-job�鿴HDFS�еĹ鵵�ļ�

��һ��ʱ�䣬��Ӻ�鿴��ʷ��

�鿴Job��Ϣ

�Flink��Ⱥ��ȺHA�߿��Լ��ʷ��

Flink��Ⱥ�

��Ⱥ�滮

��ز��ѹ��װ��

�޸ļ�Ⱥ��

�ַ��װĿ¼

��Ⱥ

��Web UI

Flink��ȺHA�߿��

��

��Ⱥ�滮

��flink

��master��workers

��ZK

�ַ��װĿ¼

��HA��Ⱥ

��

Flink��

��ʷ��

��

��

��ֹͣ��ʷ��

�ύһ��Job��

�鿴��ʷJob��Ϣ

��

��

��ؿγ�

��ص��

��ʵ�鳡��

�Flink��Ⱥ����ȺHA�߿����Լ�������ʷ������

Flink��Ⱥ�

��Ⱥ�滮

���ز���ѹ��װ��

�޸ļ�Ⱥ����

�ַ���װĿ¼

������Ⱥ

����Web UI

Flink��ȺHA�߿���

����

��Ⱥ�滮

����flink

����master��workers

����ZK

�ַ���װĿ¼

����HA��Ⱥ

����

Flink��������

������ʷ������

����

����

������ֹͣ��ʷ������

�ύһ��Job����

�鿴��ʷJob��Ϣ

��������

��������

��ؿγ�

��ص�����

���ʵ�鳡��

�Flink��Ⱥ��ȺHA�߿��Լ��ʷ��

��ز��ѹ��װ��

�޸ļ�Ⱥ��

�ַ��װĿ¼

��Ⱥ

��Web UI

Flink��ȺHA�߿��

��

��flink

��master��workers

��ZK

�ַ��װĿ¼

��HA��Ⱥ

��

Flink��

��ʷ��

��

��

��ֹͣ��ʷ��

�ύһ��Job��

��

��

��ص��

��ʵ�鳡��