虚拟化容器,大数据,DBA,中间件,监控。
15 11月
利用Flume 汇入数据到HBase:Flume-hbase-sink 使用方法详解

导读:作者在上一篇文章中:https://cloud.tencent.com/developer/article/1025430《Flume-Hbase-Sink针对不同版本flume与HBase的适配研究与经验总结》,详细描述了两大类HBaseSinks...

作者:admin|分类:大数据|浏览:328
15 11月
Flume学习之路 (一)Flume的基础介绍

目录一、背景 二、Flume的简介 三、Flume NG的介绍 3.1 Flume特点 3.2 Flume的一些核心概念 3.3 Flume NG的体系结构 3.4 Source 3.5 Channel 3.6 Sink 四、Flume的部署类...

作者:admin|分类:大数据|浏览:403
15 11月
Flume学习之路 (二)Flume的Source类型

目录一、概述 二、Flume Sources 描述 2.1 Avro Source 2.2 Thrift Source 2.3 Exec Source 2.4 JMS Source 2.5 Spooling Directory Source 2....

作者:admin|分类:大数据|浏览:366
15 11月
Flume NG 学习笔记(四)Source配置

一、Avro Source与Thrift SourceAvro端口监听并接收来自外部的Avro客户流的事件。当内置Avro 去Sinks另一个配对Flume代理,它就可以创建分层采集的拓扑结构。官网说的比较绕,当然我的翻译也很弱,其实就是flume可以多级...

作者:admin|分类:大数据|浏览:453
15 11月
Flume学习之路 (三)Flume的配置方式

目录一、单一代理流配置 1.1 官网介绍 1.2 测试示例(一) 1.3 测试案例(二) 二、单代理多流配置 2.1 官方案例 三、配置多代理流程 3.1 官方案例 3.2 测试案例 四、多路复用流 4.1 官方案例 4.2 测试案例(一)复...

作者:admin|分类:大数据|浏览:454
15 11月
Flume的监控(Monitor)

使用Flume实时收集日志的过程中,尽管有事务机制保证数据不丢失,但仍然需要时刻关注Source、Channel、Sink之间的消息传输是否正常,比如,SouceàChannel传输了多少消息,ChannelàSink又传输了多少,两处的消息量是否偏差过大...

作者:admin|分类:大数据|浏览:447
15 11月
搭建Spark所遇过的坑

一.经验1.Spark Streaming包含三种计算模式:nonstate .stateful .window2.kafka可通过配置文件使用自带的zookeeper集群3.Spark一切操作归根结底是对RDD的操作4.部署Spark任务,不用拷贝整个架...

作者:admin|分类:大数据|浏览:416
15 11月
HBase学习之路 (一)HBase基础介绍

目录产生背景 HBase简介 关系型数据库 和 非关系型数据库的典型代表 HBase 这个 NoSQL 数据库的要点 结构化、半结构化和非结构化 HBase 中的表特点 HBase表结构逻辑视图 名词概念 正文回到顶部产生背景自 1970 年...

作者:admin|分类:大数据|浏览:373
15 11月
HBase学习之路 (二)HBase集群安装

目录前提 版本选择 JDK的选择 Hadoop的选择 安装 1、zookeeper的安装 2、Hadoopd的安装 3、下载安装包 4、上传服务器并解压缩到指定目录 5、修改配置文件 6、将HBase安装包分发到其他节点 7、 同步时间...

作者:admin|分类:大数据|浏览:452
15 11月
HBase学习之路 (三)HBase集群Shell操作

目录进入HBase命令行 HBase表的操作 创建create 查看表列表list 查看表的详细信息desc 修改表的定义alter HBase表中数据的操作 增put 查get + scan 删delete 正文回到顶部进入HBase命令行...

作者:admin|分类:大数据|浏览:436