是自己实现partioner吗?那要先分析join的key的分布情况,再自定义算法
- 请问两张大表进行 join,要求优化,不用 hive 的分桶,用算法实现,怎么实现呢?
- hadoop 启动从机显示 0.0.0.0:50010 端口被占用?求大神解决!!!
- Hadoop 部署集群时节点无法启动问题?
- dataframe 写入 impala 语法错误,怎么解决?
- hbase scan 查询的问题?
- 在 impala 的 shell 命令窗口中修改表的字段类型,查询数据报错?
- hbase scan 查询的问题?
- Spark 对于大量数据 sort 之后,collect 内存不够,怎么将所有排序完的数据有序输出?
- 我在 hive 中建立表,再到 impala-shell 中却找不到该表?
- hbase scan 查询的问题?
- hbase scan 查询的问题?
- spark 连接 impala 可以怎么连接?
- hbase 热点问题不理解?
-
信息被删除或无权限查看
- 在 impala 的 shell 命令窗口中修改表的字段类型,查询数据报错?