在项目开发中后台程序是直接访问HDFS中数据还是将HDFS数据同步到数据库中,访问数据库实现功能?
实际工作中hadoop开发的实现流程是怎样的?
在项目开发中后台程序是直接访问HDFS中数据还是将HDFS数据同步到数据库中,访问数据库实现功能?
实际工作中hadoop开发的实现流程是怎样的?
不要直接访问HDFS上的数据,那样每次都走网络,把文件get到本地操作,或是导入到mysql中,可以用sqoop
@BigTester 存储数据加上离线分析,一般导出的都是处理过的数据