【Flink on Yarn–Per Job 与 Yarn–Session原理及区别】导读：Flink集群部署的方式有多_傻大方

按关键词阅读：

导读：Flink集群部署的方式有多种，如Flink Standalone、Flink on Yarn、Flink on Kubernetes等。其中Flink on Yarn又分为Yarn–Per Job模式与Yarn–Session模式。本文主要讨论关于Flink on Yarn–Per Job 与 Yarn–Session原理及区别，目录如下：

yarn 架构原理-总览
yarn 架构原理-组件
yarn 架构原理-交互
Flink on Yarn–Per Job
Flink on Yarn–Session

Yarn 架构原理–总览首先介绍一下 Yarn 的架构原理，因为只有足够了解 Yarn 的架构原理，才能更好的知道 Flink 是如何在 Yarn 上运行的。
Flink on Yarn–Per Job 与 Yarn–Session原理及区别

文章插图
Yarn 的架构原理如上图所示，最重要的角色是 ResourceManager ，主要用来负责整个资源的管理， Client 端是负责向 ResourceManager 提交任务。
用户在 Client 端提交任务后会先给到 Resource Manager 。 Resource Manager 会启动 Container ，接着进一步启动 Application Master ，即对 Master 节点的启动。当 Master 节点启动之后，会向 Resource Manager 再重新申请资源，当 Resource Manager 将资源分配给 Application Master 之后， Application Master 再将具体的 Task 调度起来去执行。
Yarn 架构原理–组件Yarn 集群中的组件包括：

ResourceManager (RM)：ResourceManager (RM)负责处理客户端请求、启动/监控 ApplicationMaster、监控 NodeManager、资源的分配与调度，包含 Scheduler 和 Applications Manager 。
ApplicationMaster (AM)：ApplicationMaster (AM)运行在 Slave 上，负责数据切分、申请资源和分配、任务监控和容错。
NodeManager (NM)：NodeManager (NM)运行在 Slave 上，用于单节点资源管理、AM/RM通信以及汇报状态。
Container：Container 负责对资源进行抽象，包括内存、CPU、磁盘，网络等资源。

Yarn 架构原理–交互

文章插图
【Flink on Yarn–Per Job 与 Yarn–Session原理及区别】以在 Yarn 上运行 MapReduce 任务为例来讲解下 Yarn 架构的交互原理：

首先，用户编写 MapReduce 代码后，通过 Client 端进行任务提交。
ResourceManager 在接收到客户端的请求后，会分配一个 Container 用来启动 ApplicationMaster ，并通知 NodeManager 在这个 Container 下启动 ApplicationMaster 。
ApplicationMaster 启动后，向 ResourceManager 发起注册请求。接着 ApplicationMaster 向 ResourceManager 申请资源。根据获取到的资源，和相关的 NodeManager 通信，要求其启动程序。
一个或者多个 NodeManager 启动 Map/Reduce Task 。
NodeManager 不断汇报 Map/Reduce Task 状态和进展给 ApplicationMaster 。
当所有 Map/Reduce Task 都完成时， ApplicationMaster 向 ResourceManager 汇报任务完成，并注销自己。

Flink on Yarn–Per Job Flink on Yarn–Per Job 与 Yarn–Session原理及区别

文章插图
Flink on Yarn 中的 Per Job 模式是指每次提交一个任务，然后任务运行完成之后资源就会被释放。在了解了 Yarn 的原理之后， Per Job 的流程也就比较容易理解了，具体如下：

首先 Client 提交 Yarn App ，比如 JobGraph 或者 JARs 。
接下来 Yarn 的 ResourceManager 会申请第一个 Container 。这个 Container 通过 Application Master 启动进程， Application Master 里面运行的是 Flink 程序，即 Flink-Yarn ResourceManager 和 JobManager 。
最后 Flink-Yarn ResourceManager 向 Yarn ResourceManager 申请资源。当分配到资源后，启动 TaskManager 。 TaskManager 启动后向 Flink-Yarn ResourceManager 进行注册，注册成功后 JobManager 就会分配具体的任务给 TaskManager 开始执行。

Flink on Yarn–Session Flink on Yarn–Per Job 与 Yarn–Session原理及区别

文章插图
在 Per Job 模式中，执行完任务后整个资源就会释放，包括 JobManager、TaskManager 都全部退出。而 Session 模式则不一样，它的 Dispatcher 和 ResourceManager 是可以复用的。 Session 模式下，当 Dispatcher 在收到请求之后，会启动 JobManager(A) ，让 JobManager(A) 来完成启动 TaskManager ，接着会启动 JobManager(B) 和对应的 TaskManager 的运行。当 A、B 任务运行完成后，资源并不会释放。 Session 模式也称为多线程模式，其特点是资源会一直存在不会释放，多个 JobManager 共享一个 Dispatcher ，而且还共享 Flink-YARN ResourceManager 。
Session 模式和 Per Job 模式的应用场景不一样。 Per Job 模式比较适合那种对启动时间不敏感，运行时间较长的任务。 Seesion 模式适合短时间运行的任务，一般是批处理任务。若用 Per Job 模式去运行短时间的任务，那就需要频繁的申请资源，运行结束后，还需要资源释放，下次还需再重新申请资源才能运行。显然，这种任务会频繁启停的情况不适用于 Per Job 模式，更适合用 Session 模式。

稿源：(未知)

【傻大方】网址：http://www.shadafang.com/c/111J300322020.html

标题：Flink on Yarn–Per Job 与 Yarn–Session原理及区别

傻大方

Flink on Yarn–Per Job 与 Yarn–Session原理及区别

百年战争英法百年战争是如何爆发的?

为啥有些动画很受欢迎光盘卖的也很好，但就是不出第二季

扬子晚报|墙砖脱落砸坏违停车辆，谁该为6万元修车费“买单”？

『天乐爱游戏』高热度英雄吕布为何胜率不高？提高胜率你需要学会合理开团

每日经济新闻|古鳌科技：董事姜小丹、章祥余减持计划届满，未减持

可爱|抓史莱姆的萝莉来了，看颜值和可爱度，萌王也会答应

「央视」菲律宾驻瑞典名誉总领事因感染新冠肺炎去世

直播|诸暨主播太给力！光一样特产，线上销售就突破了100亿！

盗墓笔记|盗墓笔记秦岭神树剧情解密原著的坑终于填上了

研究人员开发AI国际象棋引擎“玛雅” 可帮棋手识别技能错误