1000节点的大数据集群(hadoop,spark)需要做哪些优化?
1.整体集群组件架构大方向上的优化和设计?
2.hdfs,yarn,zookeeper重要指标的调参?
3.你在大集群使用,运维,优化中遇到的大坑有啥?
1、要看承载啥业务,比如空集群 那你优化它有啥用 2、还是要看具体业务,没有最优的系统,只有符合业务的系统 3、大坑太多,其中最核心的坑就是不知道自己不知道
`单行代码`
关注海汼部落