前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系

正文

Azkaban 工作流管理器由 3 个核心部分组成,具体如下

( 1 ) Relational Database (关系数据库 MySQL );

( 2 ) Azkaban Web Server ( Web 服务器);

( 3 ) Azkaban Executor Server (执行服务器)。

这 3 个核心部分的关联关系如图所示。
在这里插入图片描述

接下来,就分别对 Azkaban 工作流管理器中的 3 个核心部分进行说明。

1 . Relational Database ( MySQL )

Azkaban 通常使用 MySQL 关系数据库进行数据存储, Azkaban Web Server 和 Azkaban Executor Server 都会访问该关系数据库。

2 . Azkaban Web Server

Azkaban Web Server 是所有 Azkaban 的主要管理者,它用于处理项目管理、身份验证、调度程序和执行监视,同时还可以用作 UI 。

3 . Azkaban Executor Server

Azkaban Executor Server 主要用于处理工作流和 jobs 作业任务的实际执行。

在最初的 Azkaban 版本中, Azkaban Web Server 和 Azkaban Executor Server 是自动部署在同一服务器中的,后来由于功能需求和扩展,将 Executor 分成了自己独立的服务器。

上一篇 下一篇