求教
数据量上TB以后 传统的数据集性能达到了瓶颈 只能靠扩充硬件来完成很多数据仓库的查询 而且查询速度慢 如果多人共用的话很更慢 ,垂直扩展硬件是有局限性的,比如硬盘由1t缓成2t,但是很快内存不够了128g少了 那就得上256g 但是很快主板插满了 不支持更大了 所以再大的数据量已经不能支持了, hadoop系统的好处可以线性增加机器 而且是廉价的机器 成本很低 也能完成传统数据仓库的查询和统计,费用低,硬件便宜
`单行代码`
关注海汼部落