加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

Azkaban3.81.x部署过程及遇到的坑

发布时间:2020-05-12 21:55:11 所属栏目:电商 来源:站长网
导读:副标题#e# Azkaban是什么? Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是
副标题[/!--empirenews.page--]

 Azkaban是什么?

Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是无环的,否则会被视为无效的工作流。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

一、前提安装

1.1 Java1.8环境搭建

  1) 下载jdk1.8并解压:

# tar -zxvf jdk-8u201-linux-i586.tar.gz -C /usr/local

2) 添加Java环境变量,在/etc/profile中添加:

export JAVA_HOME=http://www.jb51.net/usr/local/jdk1.8.0_201 export PATH=$PATH:$JAVA_HOME/bin export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib

  3) 保存后刷新环境变量:

# source /etc/profile

  4) 检查Java是否配置成功,成功配置会有如下图所示。

# java -version

1.2 MySQL安装

  Ubuntu可以参考我的MySQL安装博文。

1.3 git安装

# sudo apt-get install git

1.4 下载azkaban

  从github选取版本下载azkaban:

https://github.com/azkaban/azkaban/releases

  在这里我选取了azkaban-3.18.4版本:

# wget https://github.com/azkaban/azkaban/archive/3.84.4.tar.gz

  解压:

# tar -zxvf azkaban-3.84.4.tar.gz -C /mnt/addDisk1/BigData/ # cd /mnt/addDisk1/BigData/azkaban-3.84.4

1.5 编译

  执行gradlew编译命令,跳过测试:

# ./gradlew distTar -x test

  它会一下编译,直到编译成功,运行之后会生成5个压缩包,分别放在在azkaban-*/build/distributions/目录下:

azkaban-db-3.47.0-10-gdd67b02.tar.gz azkaban-exec-server-3.47.0-10-gdd67b02.tar.gz azkaban-hadoop-security-plugin-3.47.0-10-gdd67b02.tar.gz azkaban-solo-server-3.47.0-10-gdd67b02.tar.gz azkaban-web-server-3.47.0-10-gdd67b02.tar.gz

  接着把五个包分别解压在另外的目录下(/mnt/addDisk1/BigData/azkaban),并重命名:

cd /mnt/addDisk1/BigData tar -zxvf ./azkaban-3.81.4/azkaban-db/build/distributions/azkaban-db-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-exec-server/build/distributions/azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-hadoop-security-plugin/build/distributions/azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-solo-server/build/distributions/azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaaban-3.81.4/azkaban-web-server/build/distributions/azkaban-web-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ mv azkaban-solo-server-0.1.0-SNAPSHOT/ azkaban-solo-server mv azkaban-exec-server-0.1.0-SNAPSHOT/ azkaban-exec-server mv azkaban-web-server-0.1.0-SNAPSHOT/ azkaban-web-server mv azkaban-db-0.1.0-SNAPSHOT/ azkaban-db mv azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT/ azkaban-hadoop-security-plugin

二、azkaban部署

2.1在MySQL中创建azkaban数据库:

create database azkaban; grant all privileges on azkaban.* to azkaban@'%' identified by 'azkaban'; flush privileges; use azkaban; # 将azkaban sql表结构导入mysql source /mnt/addDisk1/BigData/azkaban/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql

2.2 创建SSL配置:

# keytool -keystore keystore -alias jetty -genkey -keyalg RSA 运行此命令后,会提示输入当前生成 keystor的密码及相应信息,输入的密码请劳记,信息如下: 输入keystore密码: 再次输入新密码: 您的名字与姓氏是什么? [Unknown]: 您的组织单位名称是什么? [Unknown]: 您的组织名称是什么? [Unknown]: 您所在的城市或区域名称是什么? [Unknown]: 您所在的州或省份名称是什么? [Unknown]: 该单位的两字母国家代码是什么 [Unknown]: CN CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=CN 正确吗? [否]: y 密码在此我输入的是hadoop 输入<jetty>的主密码 (如果和 keystore 密码相同,按回车): 再次输入新密码:

  完成上述工作后,将在当前目录生成 keystore 证书文件,将keystore 考贝到 azkaban web服务器根目:

# sudo mv keystore azkaban/azkaban-web-server

2.3部署 azkaban-web-server

# cd ./azkaban # sudo cp -r ./azkaban-solo-server/conf/ ./azkaban-web-server/ # cd ./azkaban-web-server/conf

  配置azkaban.properties:

# 默认时区,已改为亚洲/上海 默认为美国 default.timezone.id=Asia/Shanghai database.type=mysql #数据库类型 # h2.path=./h2 # h2.create.tables=true mysql.port=3306 #端口号 mysql.host=localhost #数据库连接IP mysql.database=azkaban #数据库实例名 mysql.user=root #数据库用户名 mysql.password=root #数据库密码 jetty.use.ssl=true jetty.maxThreads=25 #最大线程数 jetty.ssl.port=8443 #Jetty SSL端口 jetty.port=8081 #Jetty端口 jetty.keystore=keystore #SSL文件名 jetty.password=hadoop #SSL文件密码 jetty.keypassword=hadoop #Jetty主密码 与 keystore文件相同 jetty.truststore=keystore #SSL文件名 jetty.trustpassword=hadoop # SSL文件密码 # 执行服务器属性 executor.port=12321 #执行服务器端口 # 邮件设置 可不设计 mail.sender=xxxxxxxx@163.com #发送邮箱 mail.host=smtp.163.com #发送邮箱smtp地址 mail.user=xxxxxxxx #发送邮件时显示的名称 mail.password=********** #邮箱密码 job.failure.email=xxxxxxxx@163.com #任务失败时发送邮件的地址 job.success.email=xxxxxxxx@163.com #任务成功时发送邮件的地址 lockdown.create.projects=false # cache.directory=cache #缓存目录

  配置log4j.properties(默认就可以了,如有其他需求可修改):

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读