mr,hive,hbase三个环境的各自解决方法,面试爱问
mr自定义partitioner均衡key分布,或使用distributecache来mapjoin hive在group和join的时候容易倾斜,随即key前缀或局部聚合再次聚合 hbase分析rowkey分布,再预分region
@青牛 谢谢
`单行代码`
关注海汼部落技术社区