虚拟化容器,大数据,DBA,中间件,监控。
19 02月
ElasticSearch基本概念

1.简介Elasticsearch是一个基于Lucene的搜索服务器。提供了一个分布式多用户能力的全文搜索引擎基于Restful web接口。Java语言开发的Elasticsearch的功能分布式的文档存储引擎分布式的搜索引擎和分析引擎分布式,支持PB级...

作者:admin|分类:大数据|浏览:699
18 02月
Spark和Hadoop的区别和比较

Spark和Hadoop的区别和比较:1.原理比较:Hadoop和Spark都是并行计算,两者都是用MR模型进行计算Hadoop一个作业称为一个Job,Job里面分为Map Task和Reduce Task阶段,每个Task都在自己的进程中运行,当Task...

作者:admin|分类:大数据|浏览:627
18 02月
最详细的Hadoop环境搭建

最详细的Hadoop环境搭建blog.csdn.net-GitChat大数据 史上最详细的Hadoop环境搭建.pdf...

作者:admin|分类:大数据|浏览:592
18 02月
ES/elasticsearch知识体系

从入门到进阶的知识体系大致归纳如下:...

作者:admin|分类:大数据|浏览:679
09 02月
HCIA-Big Data V3.0大数据学习地图

HCIA-Big Data V3.0介绍:本系列共14课内容,其中第1-8课、第10、12课由重庆邮电大学副教授雷大江老师讲解,剩余4课由华为认证大数据讲师讲解。内容按顺序依次是:大数据发展趋势与鲲鹏大数据,HDFS和ZooKeeper,Hive分布式数据...

作者:admin|分类:大数据|浏览:682
09 02月
Elasticsearch7集群多主高可用配置

前言前面介绍了es7相关的一些用法。这一节我们来实践下集群高可用搭建,以及账号权限的配置。之前看了很多博主介绍的都是从主模式,主节点挂了集群也就不能对外服务了。目前使用的最新版本7.6.0。账号配置需要破解x-pack包。(如果不需要设置密码可以忽略)配置...

作者:admin|分类:大数据|浏览:1352
09 02月
基于 Docker 部署 Flume 应用

本文目的在于通过 flume、zookeeper、kafka、docker 搭建基本的日志采集系统,实现日志的采集并将数据发送至 Kafka。搭建前,需确保已安装以下组件:JDK 8FlumeZookeeperKafkaDocker同时需确保已掌握以下技能...

作者:admin|分类:大数据|浏览:890
09 02月
Cloudera 离线部署

一、版本号system:CentOS 6Cloudera Manager:5.7.0CDH:5.7.0二、环境准备MySQL 5.6Java 8python 2.6三、安装步骤1. 进行集群角色划分,指定 server 与 agent在 Cloudera...

作者:admin|分类:大数据|浏览:733
09 02月
Clickhouse的安装与启动

一、Clickhouse 简介Clickhouse 是一个开源的面向联机分析处理(OLAP, On-Line Analytical Processing)的列式存储数据库管理系统。Clickhouse 的优势:写入快、查询快SQL 支持简单方便,不依赖 H...

作者:admin|分类:大数据|浏览:944
09 02月
大数据平台概念和架构

前言今天为什么来写这个内容了,一是前些天有个非行业内的好朋友想了解下大数据相关概念的内容,搜了下网上平台相关的介绍,对于业内和业外的感觉都不太完善和直观。另外就是自己也想定时归纳下认知。所以今天特意描述下自己的拙见,也欢迎大家指点。问题在开始今天的描述前,...

作者:admin|分类:大数据|浏览:835