海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册

薪牛

第 4924 位会员

127 关注者
12 评论
43 话题

  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(12)
  • [公开课直播预告] 可视化数据大屏设计(12月21日)

    新年快乐

  • [公开课直播预告] 可视化数据大屏设计(12月21日)

    要学习找海牛

  • [公开课直播预告] CDH 集群扩容(12月14日)

    云平台棒棒哒

  • flume 实战 2,小手动起来

    flume实战day02镜像地址:http://cloud.hainiubl.com/#/privateImageDetail?id=2605&imageType=private

  • flume 实战 2,小手动起来

    查看hdfs上某一个目录下的文件:hadopo fs -ls /data/hdfssink
    查看hdfs文件的内容:hadoop fs -cat /data/hdfssink/hainiu-.1665836316961.log

  • flume 实战 2,小手动起来

    启动agent的命令,注意,需要替换-f后面的agent脚本:flume-ng agent -n a1 -c /opt/apache-flume-1.10.1-bin/conf/ -f ./filerole.agent -Dflume.root.logger=INFO,console

  • flume 实战 2,小手动起来

    2022-10-14日fluem操作镜像:http://cloud.hainiubl.com/#/privateImageDetail?id=2591&imageType=private

  • flume 实战 2,小手动起来

    课程回顾:
    source:
    1,netcat:用来监听一个tcp发送到指定ip指定端口的数据
    2,spooling directory :监听某一个目录,目录下有文件产生就会被source监听并且收集到
    3,exec: 监听一个命令执行完的结果,结果会作为数据源收集到
    4,taildir:监听某一个目录下指定格式的数据 比如xxx.log,并且支持断点续传
    channel:
    1,memory:将source收集过来的数据暂存到内存中,优点就是快,但是缺点就是不安全
    2,file:将source收集过来的数据暂存到磁盘中,优点就是数据安全,缺点就是速度会略微慢一点。
    sink--今天

  • flume 实战 1,小手动起来

    定义agent

    a1.sources=r1
    a1.sinks=k1
    a1.channels=c1

    定义source

    a1.sources.r1.type=netcat
    a1.sources.r1.bind=11.99.16.111
    a1.sources.r1.port=44444

    定义channel

    a1.channels.c1.type=file
    a1.channels.c1.dataDirs=/root/filechannel

    定义sink

    a1.sinks.k1.type=logger

    绑定sink和channel,source和channel

    a1.sources.r1.channels=c1
    a1.sinks.k1.channel=c1

  • flume 实战 1,小手动起来

    flume-ng agent -n a1 -c /opt/apache-flume-1.10.1-bin/conf/ -f ./spooldir.agent -Dflume.root.logger=INFO,console

  • flume 实战 1,小手动起来

    http://cloud.hainiubl.com/#/privateImageDetail?id=2577&imageType=private

  • flume 实战 1,小手动起来

    动起来

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2