本人初学hadoop,请教各位大神,hadoop为什么说block块多个副本便于计算呢,在计算过程中不是就使用一个副本吗? 谢谢!
比如有两个计算任务都要用到 一个文件,多个副本 可以同时在多个结点进行启动计算任务,一个副本的话,需要传输数据 本地化计算率 低
自问自答,哈哈
@天空的思念 自己的答的还可以,有个策略是即使不能本地执行,比如有数据那台机器资源不够了,也会在临近的节点启动任务,这样可以尽可能的减少传输延迟,这个叫机架感知策略。
`单行代码`
关注海汼部落技术社区