在项目开发中后台程序是直接访问HDFS中数据还是将HDFS数据同步到数据库中,访问数据库实现功能? 实际工作中hadoop开发的实现流程是怎样的?
不要直接访问HDFS上的数据,那样每次都走网络,把文件get到本地操作,或是导入到mysql中,可以用sqoop
@青牛 hadoop的主要作用是存储数据还是离线分析,我们去用sqoop去导数据,导的是原始数据还是经过分析处理的数据呢
@BigTester 存储数据加上离线分析,一般导出的都是处理过的数据
`单行代码`
关注海汼部落技术社区