虚拟化容器,大数据,DBA,中间件,监控。
06 11月
Spark2.4.8集成并读写hive表数据

Spark2.4.8集成并读写hive表数据1. 本地模式配置2. **远程模式**一、Hive简介二、Hive安装三、Hive的本地模式和远程模式配置四、创建Hive表五、SparkSQL集成Hive一、Hive简介Apache Hive™数据仓库软件通...

作者:admin|分类:大数据|浏览:383
06 11月
kafka3.0集群搭建过程

1.环境说明服务器资源规划如下表:IPhostname部署资源192.168.162.201m162p201zookeeper,kafka192.168.162.202m162p202zookeeper,kafka192.168.162.203m162p2...

作者:admin|分类:大数据|浏览:435
06 11月
《kafka问答100例 -7》如果Topic删除过程中有某台Broker宕机,删除流程会正常进行吗 ? |文末送书

《Kafka运维管控平台》 ️更强大的管控能力️ 更高效的问题定位能力 更便捷的集群运维能力 更专业的资源治理 更友好的运维生态 相关...

作者:admin|分类:大数据|浏览:459
06 11月
Hive 数据迁移与备份

迁移类型同时迁移表及其数据(使用import和export)分步迁移表和数据迁移表(show create table <tab_name>)迁移数据关联表和数据(msck repair)迁移步骤将表和数据从 Hive 导出到 HDFS将表和数...

作者:admin|分类:大数据|浏览:426
06 11月
记一次Kafka消费者频繁分区再均衡bug解决

项目背景:两个Kafka消费者群组,消费同样的主题,一个消费者群组消费数据后,发给mqtt服务,供其他应用接收;另一个消费者群组消费数据后,存入mysql数据库。问题描述:提示:这里描述项目中遇到的问题: 在项目中使用Kafka消费者消费数据,并配置了分区...

作者:admin|分类:大数据|浏览:689
06 11月
Hadoop3.X分布式高可用集群部署

一、部署规划1.1 版本说明软件版本操作系统CentOS Linux release 7.8.2003 (Core hadoophadoop-3.2.2JAVAjdk-8u271-linux-x641.2 集群规划hostnameIP组件master172...

作者:admin|分类:大数据|浏览:507
14 07月
Hadoop3.x 作业提交全过程-尚硅谷资料

Hadoop3.x 作业提交全过程-尚硅谷资料作业提交全过程详解 (1) 作业提交 第 1 步:Client 调用 job.waitForCompletion 方法,向整个集群提交 MapReduce 作业。第 2...

作者:admin|分类:大数据|浏览:481
14 07月
Hadoop3.x DataNode工作机制-尚硅谷资料

Hadoop3.x DataNode工作机制-尚硅谷资料DN 向 NN 汇报当前解读信息的时间间隔,默认 6 小时;<property> <name>dfs.blockreport.in...

作者:admin|分类:大数据|浏览:513
07 07月
CentOS7局域网下安装离线Ambari

CentOS7局域网下安装离线Ambari 1.1 Ambari Ambari 跟 Hadoop 等开源软件一样,也是 Apache Soft...

作者:admin|分类:大数据|浏览:724
06 07月
Centos7安装CDP/CDH7.1.1

Centos7安装CDP/CDH7.1.1安装CDP/CDH7.1.1.pdf...

作者:admin|分类:大数据|浏览:570