岗位职责:
1. 负责应用监控体系与平台的建设及持续优化;
2. 作为应用监控平台的负责人,利用APM监控平台,主动发现系统存在的性能问题或隐患,与主机、网络、开发团队紧密合作带领合作伙伴(应用Vendor)提出改进措施并推进优化;
3. 负责应用性能及用户体验数据收集与分析,主动提出用户体验改善优化建议与方案,持续改善用户体验;
4. 紧密与测试、开发团队合作,前瞻性进行应用系统容量、能力、用户体感规划,确保支撑业务持续发展目标,将系统隐患定位、处置前移至测试环境,降低故障处置成本;
5. 负责制定应用系统性能、用户体感指标,结合业务发展目标进行持续迭代优化;
6. 负责与架构团队一起研究新的技术与平台,如:AIOps、大数据分析等技术,并将其融入到运维体系中;
岗位要求:
1. 要具备互联网公司思维,勇于打破常规,进行自我变革与转型;
2. 有实际的带领运营团队从传统运维向SRE运营转型的经验;
3. 全日制本科及以上学历,5年及以上应用系统相关开发、运维的经验,金融行业优先;
4. 精通应用监控系统(APM)和日志管理工具运行原理,掌握skywalking、pinpoint、 elk等开源应用监控/日志工具或同类商用软件的实施与持续优化能力;
5. 根据应用系统监控指标,提出相关的优化建议和方案;能对应用系统进行容量规划,保障应用系统可用性和连续性;
6. 能独立进行应用监控指标数据分析,提出用户体验改善优化建议与方案,确保应用各项核心指标正常,保障用户体验;
7. 熟悉Linux、Windows操作系统,掌握操作系统安装配置、安全加固、故障分析处理和系统调优。
8. 熟悉常见数据库备份恢复、高可用、容灾及数据调优技术,包括Oracle、DB2、Mysql。
9. 熟悉商业中间件的工作原理,掌握IHS、IBM Websphere(WAS)、Weblogic的安装部署和故障分析处理,熟悉开源中间件组件技术栈,熟悉JVM工作原理与优化技术,掌握nginx、tomcat、redis、rabbitmq的安装部署、安全加固、故障分析和性能调优;熟悉java应用程序部署、发布。
10. 具有良好的沟通意识、服务意识及强烈的责任心、进取心和团队合作精神;