虚拟化容器,大数据,DBA,中间件,监控。
15 11月
Spark2.0.1 on yarn with hue 集群安装部署(六)livy安装测试

一、R安装如果未安装R,可以先安装R,用于支持SparkR,如果yum源中没有R语言的安装包,可以从官网下载相应版本进行手动编译安装。sudo yum install R1安装rJava 下载地址: https://cran.r-project.org/w...

作者:admin|分类:大数据|浏览:443
15 11月
flume读取日志数据写入kafka 然后kafka+storm整合

一、flume配置flume要求1.6以上版本flume-conf.properties文件配置内容,sinks的输出作为kafka的product[html] view plain copya1.sources = r1 a1.sinks = k1 ...

作者:admin|分类:大数据|浏览:441
15 11月
记flume部署过程中遇到的问题以及解决方法(持续更新

项目需求是将线上服务器生成的日志信息实时导入kafka,采用agent和collector分层传输,app的数据通过thrift传给agent,agent通过avro sink将数据发给collector,collector将数据汇集后,发送给kafka,...

作者:admin|分类:大数据|浏览:582
15 11月
Hadoop的三种作业调度原理汇总

Hadoop调优方式一个MapRedcue作业是通过JobClient向master的JobTracker提交的(JobTracker一直在等待JobClient通过RPC协议提交作业),JobTracker接到JobClient的请求后把其加入作业队列中...

作者:admin|分类:大数据|浏览:409
15 11月
Hive学习之路 (一)Hive初识

目录Hive 简介 什么是Hive 为什么使用 Hive Hive 特点 Hive 和 RDBMS 的对比 Hive的架构 1、用户接口: shell/CLI, jdbc/odbc, webui Command Line Interface 2、...

作者:admin|分类:大数据|浏览:468
15 11月
Hive学习之路 (二)Hive安装

目录Hive的下载 Hive的安装 1、本人使用MySQL做为Hive的元数据库,所以先安装MySQL。 2、上传Hive安装包 3、解压安装包 4、修改配置文件 5、 一定要记得加入 MySQL 驱动包(mysql-connector-java-...

作者:admin|分类:大数据|浏览:439
15 11月
Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

目录概述 一、存储Hive版本的元数据表(VERSION) 二、Hive数据库相关的元数据表(DBS、DATABASE_PARAMS) 1、DBS 2、DATABASE_PARAMS 三、Hive表和视图相关的元数据表 1、TBLS 2、TABLE_...

作者:admin|分类:大数据|浏览:411
15 11月
Hive学习之路 (四)Hive的连接3种连接方式

目录一、CLI连接 二、HiveServer2/beeline 1、修改 hadoop 集群的 hdfs-site.xml 配置文件 2、修改 hadoop 集群的 core-site.xml 配置文件 三、Web UI 正文回到顶部一、CLI连接进入...

作者:admin|分类:大数据|浏览:373
15 11月
Hive学习之路 (五)DbVisualizer配置连接hive

目录一、安装DbVisualizer 二、配置DbVisualizer里的hive jdbc 1、在DbVisualizer的安装目录jdbc文件夹下新建hive文件夹 2、拷贝Hadoop的相关jar包放入新建的hive文件夹里面 3、拷贝Hive的...

作者:admin|分类:大数据|浏览:496
15 11月
prometheus+grafana 监控hadoop、yarn

主要是以jmx_exporter、prometheus为主导进行对hadoop的metrics进行收集,通过grafana进行展示、预警。1、安装jmx_exporter以及配置文件1、通过https://repo1.maven.org/maven2/io...

作者:admin|分类:大数据|浏览:633