岗位职责:
- 管理公司大数据集群,提供高可用、高性能大数据集群系统,并保障系统稳定运行,包括但不限于Hadoop、Kafka、Redis 、HBase 、Zookeeper、Hdfs、Hive、Spark、Storm、Tidb等系统;
- 负责大数据集群性能监控与优化,故障处理,数据备份及灾难恢复。
- 负责系统安全漏洞修复的工作,包括安全策略的制定、漏洞扫描、安全审计、安全事件响应等工作,确保系统的安全性;
- 深入理解数据平台架构,发现并解决重大故障及性能瓶颈,打造一流的数据平台。
任职要求:
- 本科以上学历,计算机、软件工程等相关专业,3年以上工作经验,具有大型数据平台运维管理经验;
- 熟悉Hadoop、Kafka、Redis 、HBase 、Zookeeper、Hdfs、Hive、Spark、Storm、Tidb等的安装配置和优化;
- 熟悉linux类操作系统,会使用shell/java/python中的一门脚本语言,能够编写脚本开展日常运维工作;
- 具有集群运维经验,以及大负载下的容量评估、问题定位、架构优化等能力优先;有分布式系统(计算/存储)开发经验优先;
- 熟悉zabbix/ganglia/Prometheus/grafana系统的组合构件及使用优先;
- 精通ELK系统,有过大规模ELK配置管理、调优经验,有过ElasticSearch搜索和分析引擎开发经验者优先。