虚拟化容器,大数据,DBA,中间件,监控。

ETL-Talend官方入门实战案例

27 08月
作者:admin|分类:大数据

鉴于国内关于Talend文档使用案例相对较少,对初学者相当不友好,所以本文基于官方文档做出的实际的使用例子,全部流程完美复现。对于初学者请耐心作完,将受益匪浅。

文档是省略版,底部有打包上传的代码,并有详细的说明文档,请实际操作并复现比对

  • 使用界面介绍
案例1 :读取本地源文件并结构化输出
构建movie.csv文件元数据结构信息
在Job design添加一个movie的作业
添加fFileInputDelimited、tLogRow组件到作业里面
添加要读入的文件信息、并输出到控制台
  • 执行流程


案例2 :读取本地源文件并按要求过滤
 在Job design添加一个filter_movie的作业
 添加fFileInputDelimited、tMap、tLogRow组件到作业里面
 添加要读入的文件信息、过滤、并输出到控制台
  • 执行流程


案例3 :将过滤的有效和无效的数据分别写入Mysql
 在Job design添加一个mysql_filter_movie的作业
 添加fFileInputDelimited、tMap、tDBOoutput、tLogRow组件到作业里面
 添加要读入的文件信息、过滤、写入数据库
  • 执行流程



案例3 :将Mysql的数据读取写入HDFS
在Job design添加一个mysql_hdfs的作业
添加mysql、tHDFSOoutput、tLogRow组件到作业里面
读取数据,写入HDFS
  • 执行流程



完整代码文档:talend_project

浏览577 评论0
返回
目录
返回
首页
oracle 19c创建/删除/插入/拔出CDB/PDB docker 创建etcd