上传的过程中当然不能移动了,不过可以使用flume直接读access日志,然后flume自己实现文件小时切分,这样就不用接住crontab了,你可以问一下潘老师。
公司集群使用flume,以后脚本的方式指定要抛弃。
不同的数据源,可以配置不同的flume-agent实现。
其实你问这3个问题都能用flume解决
- 公司日志采集用 flume 还是用脚本?
- pycharm 导入 MYSQLdb 模块的问题?
- 数据仓库阶段:UDF 函数与字典表该如何抉择?
- 数据仓库阶段:UDF 函数与字典表该如何抉择?
- Mac 本在 PD 中的 Linux 虚拟机配置完静态 IP 后 上不了网 ?
- Mac 本在 PD 中的 Linux 虚拟机配置完静态 IP 后 上不了网 ?
- Mac 本在 PD 中的 Linux 虚拟机配置完静态 IP 后 上不了网 ?
- Mac 本在 PD 中的 Linux 虚拟机配置完静态 IP 后 上不了网 ?
-
信息被删除或无权限查看
- 虚拟机问题?
- IDEA 生成的变量名会与已有的变量名联动?
- 虚拟机问题?
- 虚拟机问题?
- MR 中 Job 提交过程源码分析总结
- 请问虚拟机进入应急模式如何解决?