Kudu表有什么用?
Impala与Kudu表结合使用有什么好处?
Kudu表有什么用?
Impala与Kudu表结合使用有什么好处?
Kudu对比hive性能要高很多且支持数据更新,还有一个好处是c++开发的相比java没有了GC延迟时间。在上层,可以用 Impala 查询,也可以使用其他的 SQL on Hadoop 进行查询,SparkSQL 之类的,能很好地融入 Hadoop 生态。而且接口和hbase很像也有scan等。如果你需要对实时数据做查询,如果需要快速地查询,那么 Kudu 无疑是一个好的选择。
Impala只是操作Kudu的一个终端吧,能操作Kudu的有挺多比如刚才说的spark-sql。好处就是都是Cloudera开发的Impala与Kudu兼容性比较好吧