在实际工作中多少数据量需要用到大数据平台?怎么评估需要多少台机器呢,比如我3台8核CPU,16G内存的机器,大概可以支持多少数据量
在实际工作中多少数据量需要用到大数据平台?怎么评估需要多少台机器呢,比如我3台8核CPU,16G内存的机器,大概可以支持多少数据量
用数据平台根据项目要求,有的项目要求稳定性高就用,因为大数据平台做好了各组件集成就已经把兼容性问题解决了,这样会少很多麻烦。当然公司得额外花钱买这种平台,所以说一般不差钱图省事的公司都会用。当然很多公司都选择剩下这笔钱选择开源的自己去集成,然后再找专业的技术人员去弄。
存储数据量和内存 CPU关系小和硬盘关系大,NameNode节点内存给大点加上大硬盘就可以存储大量数据了,但是你其他节点内存和CPU少会算的慢但是不影响存
总数据量乘以三倍去评估存储空间,总CPU核或内存乘以2倍 取两者最大值去评估算力,所以自己根据单台机器的算力和存储去评估一下
问题不错