按照HDFS默认的三副本机制,HDFS存储1TB数据是不是占用4T硬盘空间?
至少3T的空间 至少是三倍的关系 因为还存在很多中间文件和缓存文件
3T,三个副本不是指除了原本的数据还有三个副本,而是每份数据存储三份,三份数据之间互为副本,每一份数据都看做是一个副本,相当于冗余度是3。这种说法确实挺容易误解的。
如果我的回答对你有帮助的话,可以关注我的公众号”大数据学徒“,一起交流学习。
`单行代码`
关注海汼部落技术社区