sparksql的应用要比hive on spark更灵活一些吧,可以在代码中使用也可以以服务形式使用。hive on spark是计算引擎的升级,毕竟很多不会写程序的想处理大数据还得用hive。那hive on spark会比原来的hive计算速度更快吧,对于开发spark的人来讲无所谓,对于不会开发spark的那就是厉器,为了让只会写SQL的人也能方便使用spark吧。
- 有 sparkSQL 了为啥还要 hive on spark 呢?
- 怎么对 hbase 中的数据进行清洗?
- spark 处理非结构化数据是怎么处理的?这个非结构化数据是怎么个数据能列举一下吗?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- 用 Linux 中 netcat 命令,客户端和服务端之间无法连接?
- ssm 中 jetty 运行报错?
- CDH 5.13.0 datanode 报错,有谁遇到过这个问题吗?
- hbase 怎么查看行?
- hbase 怎么查看行?
- hbase 怎么查看行?
- hbase 报错 Can't get master address from ZooKeeper; znode data == null?
- 字段变化的表在大数据中如何存储 ?
- 字段变化的表在大数据中如何存储 ?