【Flink】怎么提交的实时任务，有多少Job Manager？-阿里云开发者社区

【Flink】怎么提交的实时任务，有多少Job Manager？

2024-04-19 66

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

服务治理 MSE Sentinel/OpenSergo，Agent数量不受限

简介： 【4月更文挑战第18天】【Flink】怎么提交的实时任务，有多少Job Manager？

2000元阿里云代金券免费领取，2核4G云服务器仅664元/3年，新老用户都有优惠，立即抢购>>>

阿里云采购季（云主机223元/3年）活动入口：请点击进入>>>，

阿里云学生服务器（9.5元/月）购买入口：请点击进入>>>，

在 Flink 中提交实时任务时，通常只有一个 JobManager。JobManager 是 Flink 集群的主节点，负责接收、调度和管理作业的执行。一般情况下，每个 Flink 集群只有一个 JobManager，它是整个集群的控制中心。在某些情况下，可以通过配置高可用性（High Availability, HA）模式来启动多个 JobManager 实例，以提高集群的可靠性和容错性。接下来，我将详细解释提交实时任务时的 JobManager 数量以及相关概念。

1. 单个 JobManager

特点：

控制中心：单个 JobManager 是整个 Flink 集群的控制中心，负责接收和管理作业的执行。
调度器：JobManager 负责调度作业的执行顺序和资源分配，确保作业能够按照预期顺利执行。
状态管理：JobManager 负责管理作业的状态信息，包括作业的运行状态、检查点信息、保存点信息等。
容错保证：JobManager 负责监控作业的执行过程，确保作业能够在发生故障时进行恢复和重新调度。

示例代码片段：

以下是一个简单的 Flink 实时任务的提交代码示例：

import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class RealTimeJob {
   
   
    public static void main(String[] args) throws Exception {
   
   
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 创建实时数据流
        DataStream<String> stream = env.socketTextStream("localhost", 9999);

        // 对数据流进行转换和计算
        DataStream<String> result = stream.map(s -> s.toUpperCase());

        // 输出计算结果
        result.print();

        // 提交实时任务
        env.execute("RealTimeJob");
    }
}

上述代码示例中，通过创建 StreamExecutionEnvironment 对象，构建实时数据流处理任务，并使用 env.execute("RealTimeJob") 方法提交任务到 Flink 集群中。在提交任务时，只需要指定一个 JobManager，即可完成任务的调度和执行。

2. 高可用性（HA）模式下的多个 JobManager

特点：

容错性增强：在高可用性模式下，可以启动多个 JobManager 实例，增强集群的容错性和可靠性。
主备切换：高可用性模式下的多个 JobManager 实例之间会进行主备切换，确保在主 JobManager 故障时能够自动切换到备用 JobManager 上继续作业的执行。
分布式存储：高可用性模式通常需要依赖分布式存储系统，如 ZooKeeper，用于保存作业的元数据信息和状态信息，以实现主备切换和状态同步。

示例代码片段：

以下是一个简单的 Flink 高可用性模式下的任务提交代码示例：

import org.apache.flink.configuration.Configuration;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class HighAvailabilityJob {
   
   
    public static void main(String[] args) throws Exception {
   
   
        Configuration config = new Configuration();
        config.setBoolean(ConfigConstants.HA_ENABLED, true);
        config.setString(ConfigConstants.HA_ZOOKEEPER_QUORUM, "localhost:2181");

        final StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(config);

        // 创建实时数据流
        DataStream<String> stream = env.socketTextStream("localhost", 9999);

        // 对数据流进行转换和计算
        DataStream<String> result = stream.map(s -> s.toUpperCase());

        // 输出计算结果
        result.print();

        // 提交实时任务
        env.execute("HighAvailabilityJob");
    }
}

上述代码示例中，通过配置 ConfigConstants.HA_ENABLED 和 ConfigConstants.HA_ZOOKEEPER_QUORUM 实现了高可用性模式下的任务提交。在这种模式下，Flink 将会启动多个 JobManager 实例，并通过 ZooKeeper 进行主备切换和状态同步，以提高集群的容错性和可靠性。

3. 总结

在 Flink 中提交实时任务时，通常只有一个 JobManager。单个 JobManager 是整个 Flink 集群的控制中心，负责接收、调度和管理作业的执行。在某些情况下，可以通过配置高可用性（HA）模式来启动多个 JobManager 实例，以提高集群的可靠性和容错性。通过示例代码片段的解释，读者可以更好地理解实时任务提交时的 JobManager 数量和相关概念，从而更加灵活地配置和管理 Flink 集群。

【Flink】怎么提交的实时任务，有多少Job Manager？

1. 单个 JobManager

特点：

示例代码片段：

2. 高可用性（HA）模式下的多个 JobManager

特点：

示例代码片段：

3. 总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景