mr自定义partitioner均衡key分布,或使用distributecache来mapjoin
hive在group和join的时候容易倾斜,随即key前缀或局部聚合再次聚合
hbase分析rowkey分布,再预分region
- 能不能讲一下数据倾斜问题?
- zookeeper 的 cdh 资源问题?
- 超大数据量(上 T 级纯数据千亿以上条)使用 Solr 引擎是否可行?
- 数据批量分析提取,求指点迷津?
-
信息被删除或无权限查看
-
信息被删除或无权限查看
- spark SQL 如何修改 dataframe 里面的值?
- 请问能否给出 hbase 数据批量导入的 Conent 类出来,教程里面没有找到对应的类?
-
信息被删除或无权限查看
- 在使用 kafka 的时候,接受数据失败?
- 在使用 kafka 的时候,接受数据失败?
- apache drill 连接 hive 遇到错误?
- Hbase 的 Java 操作的 com.hainiu.hadoop.util.utils 这个类的代码能否给出来,资料里面没有找到这个类的代码?
- hbase 启动问题?
- hbase 启动问题?