3T,三个副本不是指除了原本的数据还有三个副本,而是每份数据存储三份,三份数据之间互为副本,每一份数据都看做是一个副本,相当于冗余度是3。这种说法确实挺容易误解的。
如果我的回答对你有帮助的话,可以关注我的公众号”大数据学徒“,一起交流学习。
看一下HDFS数据目录下的文件结构:
这样看起来的话,hadoop中的block其实在实现上还是对应一个实际的文件,数据块是一个设计上的抽象概念(为了方便HDFS管理文件),这些文件的特殊之处在于元信息被HDFS管理,他们只有在HDFS中才有意义(因为它们只是一个HDFS文件的一部分)
如果觉得有帮助的话,欢迎关注我的公众号”大数据学徒“哈~