Flume是一个方便快捷的数据采集系统,作为数据采集端它支持多种数据格式,能把采集的数据存储到HDFS或者kafka等多种数据接收端中,并提供自定义接口用于扩展不同的数据采集和接收需求。课程中讲解了flume的原理、安装、各种source,channel,sink的使用。还增加了拦截器,事务,自定义source与sink扩展开发。并结合hdfs与kafka完成实战练习。
前置知识:
Linux基础、JavaSE基础
课程视频链接:https://www.bilibili.com/video/BV18M4y1Q7fp
配套笔记课件地址:
- flume 介绍,安装,常见 source:http://www.hainiubl.com/topics/76171
- flume 常见 channel、sink:http://www.hainiubl.com/topics/76172
- flume Sink Processors 、Interceptor:http://www.hainiubl.com/topics/76173
- flume 案例实战:http://www.hainiubl.com/topics/76174
- flume 扩展:http://www.hainiubl.com/topics/76183
Word版笔记下载地址:http://www.hainiubl.com/topics/76275
本课程中使用的海汼部落实验室大数据实操云平台使用教程:https://www.bilibili.com/video/BV12W4y1p7Fr
本帖已被设为精华帖!