虚拟化容器,大数据,DBA,中间件,监控。

ambari-Kylin

15 11月
作者:admin|分类:大数据

概述

目前上传至ambari-Kylin上的有两个版本,一个是HDP2.6与Kylin2.5.1集成使用的一版;一个是HDP3.0与Kylin2.6.0集成使用的一版。

上传至github上的仅支持服务的基本使用,如正常启停,超链接Kylin Web UI功能。

但是像服务的启停顺序和服务的自定义告警没有上传至此,需要微信关注公众号大数据实战演练,也可扫描底部二维码,回复ambari-kylin关键词获取云盘链接。云盘链接不仅有两个集成kylin服务的完整版,还有脚本中用到的kylin与nginx的源码

可能有人会想,为什么要这么麻烦?!原因很简单,我的公众号刚刚起步,现在我将耗费了好几天整理出来的心血免费贡献给有需要的人,我就想让大家多多关注我的公众号而已,或者通过公众号还可以交个朋友。内容都是干货,排版也很精美,并且里面的私信都会很快回复大家的!

ambari-kylin部署过程中有什么困难的话,也可以通过微信公众号来联系我。

使用该项目的前提条件

  1. ambari主节点上安装httpd服务并开启,将Kylin和Nginx的源码包放到/var/www/html/kylin目录下。(源码包不需要解压。由于源码包太大,github上传不了,请到文章底部关注我的微信公众号,回复ambari-kylin获取云盘链接。也感谢您的关注!)
  2. ambari集群各主机已安装wget命令
  3. hdp-2.6-kylin-2.5.1适配CentOS-7 64位系统,CentOS-6 64位系统(使用CentOS-6系统,启动nginx时可能会报错,下文会粘出解决方法);hdp-3.0-kylin-2.6.0仅适配于CentOS-7 64位系统。其他系统没有测试。
  4. 适配于ambari2.6 + hdp 2.6.4.0-91 和 ambari2.7 + hdp 3.0.1.0-187,请根据需要选取使用版本。

hdp-2.6-kylin-2.5.1部署步骤:

  1. 将Kylin和Nginx的源码包放到Ambari主节点的/var/www/html/kylin中,不需要解压。

  2. 这里我选择的stack版本是2.6,在Ambari主节点上执行一下命令:

    git clone https://github.com/841809077/ambari-Kylin.git
    cp -r ambari-Kylin/hdp-2.6-kylin-2.5.1/KYLIN/ /var/lib/ambari-server/resources/stacks/HDP/2.6/services

    最终如图所示:

  3. 重启ambari:ambari-server restart

hdp-3.0-kylin-2.6.0部署步骤:

  1. 将Kylin和Nginx的源码包放到Ambari主节点的/var/www/html/kylin中,不需要解压。

  2. 这里我选择的stack版本是3.0,在Ambari主节点上执行一下命令:

    git clone https://github.com/841809077/ambari-Kylin.git
    cp -r ambari-Kylin/hdp-3.0-kylin-2.6.0/KYLIN/ /var/lib/ambari-server/resources/stacks/HDP/3.0/services

    最终如图所示:

  3. 重启ambari:ambari-server restart


Kylin部署方式

目前采用的Kylin部署集群方式相对来说简单,只需要增加Kylin的节点数,因为Kylin的元数据(Metadata)是存储在HBase中,只需要在Kylin中配置,让Kylin的每个节点都能访问同一个Metadata表就形成了Kylin集群(kylin.metadata.url 值相同)。并且Kylin集群中只有一个Kylin实例运行任务引擎(kylin.server.mode=all),其它Kylin实例都是查询引擎(kylin.server.mode=query)模式。 为了实现负载均衡,即将不同用户的访问请求通过Load Balancer(负载均衡器)(比如lvs,nginx等)分发到每个Kylin节点,保证Kylin集群负载均衡。对于负载均衡器可以启用SSL加密,安装防火墙,对外部用户只用暴露负载均衡器的地址和端口号,这样也保证Kylin系统对外部来说是隔离的。 我们的生产环境中使用的LBnginx,用户通过LB的地址访问Kylin时,LB将请求通过负载均衡调度算法分发到Kylin集群的某一个节点,不会出现单点问题,同时如果某一个Kylin节点挂掉了,也不会影响用户的分析。 这种方式也不是完美的,但是比较好配置,一般场景下是可以满足的。


该项目修改如下:

  1. Kylin和Nginx源码修改

    • 修改了Kylin的日志输出为/var/log/kylin/目录下

    • 修改Nginx的日志输出为/var/log/nginx/目录下

    • 修改Nginx的pid文件路径为:/var/run/nginx/nginx.pid

  2. 完善脚本逻辑,优化代码。

  3. 增加并修改kylin.xmlnginx.xml文件内容

  4. 实现在ambari web UI修改配置项,保存后提示重启功能

  5. 由于80端口与httpd端口冲突,所以修改Nginx的端口为81

  6. 解决nginx负载均衡后,需要刷新页面,重复登陆才可以访问到实时数据的问题,实现session会话持久性


项目逻辑说明

  1. 通过wget命令在主节点的本地仓库中下载KylinNginx的源码,源码安装路径分别为:/usr/hdp/2.6.4.0-91(或3.0.1.0-187)/kylin/usr/hdp/2.6.4.0-91(或3.0.1.0-187)/nginx。不要修改nginx的安装目录,否则启动nginx会报错。如果需要更改nginx的安装目录,需要重新编译nginx源码。
  2. 通过该服务脚本能够成功部署Kylin集群,三台主机:一个all模式,两个query模式,nginx节点可安装在任意一台节点上。
  3. 不足或需要注意的地方: 选择Kylin slave的时候,Kylin all所在节点上不能安装Kylin Query,这里在ambari界面上没有做限制。要注意。最终实现效果就是每个节点上都有Kylin服务,只不过模式不同,分工不同。

效果图

HDP3.0-kylin2.5.1:

HDP3.0-kylin2.6.0:


nginx在CentOS-6 64位系统启动失败问题解决方案

点击这里获取解决方案


还拥有的功能

  1. Kylin服务默认配置依赖于hdfs,mapreduce,hive,hbase组件,如何定义ambari集群各服务组件的起停顺序,使Kylin服务组件在hdfs,mapreduce,hive,hbase组件之后启动呢,这是一个知识点。
  2. 添加告警设置,如果某节点的Kylin端口挂掉了,给与用户报警展示。

kylin + nginx 源码包太大,gitgub上传不了,并且上述还拥有的功能已经实现,如果有需要的可以私信我的公众号:回复ambari-kylin获取云盘链接,里面有整个源码包和自定义Kylin安装服务脚本完整版(HDP2.6+与HDP3.0+均支持Kylin集成)

浏览455 评论0
返回
目录
返回
首页
Apache Kylin 2.5.0安装和使用 Hadoop的kerberos的实践部署