首页 / 行业
网络运维工程师的工作内容
2019-06-16 11:04:00
工作内容编辑
在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同的作用,因此运维工程师的工作内容和方向非常多:
事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有:
问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。
问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。
变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面主要工作内容有:
配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。
发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。
容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之。在这方面主要工作内容有:
容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。
容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、优化服务部署架构等方法来高效的提升系统容量。
架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
能力要求编辑
基础技能:
精通shell/Python/Perl等1至2种编程语言
熟练掌握常用数据结构和算法,并能灵活运用
熟悉网络基础知识
深入理解Linux操作系统
加分技能:
熟悉开源的监控平台工具,比如:Ganglia、Nagios、Zabbix等
熟练掌握Shell脚本熟悉Awk、Sed等基础工具
熟悉分布式计算或者存储系统,比如Hadoop/Hbase/Storm等
熟悉机器学习原理能付诸实践者更佳
熟悉TCP/IP、HTTP等网络协议,精通socket网络编程
软素质要求编辑
强烈的责任心与主动性,对所负责工作有owner意识,并能自我驱动成长
能承担较大工作压力,有较强独立分析、解决问题的能力
工作中需要胆大心细,具备探索创新精神
最新内容
手机 |
相关内容
什么是热继电器,热继电器的基本结构
什么是热继电器,热继电器的基本结构、技术参数、工作原理、作用、保护功能、选择和安装、日常维护及发展历程,继电器,安装,选择,作电流互感器作用 电流互感器为什么
电流互感器作用 电流互感器为什么一端要接地?,作用,误差,原因,连接,测量,短路故障,电流互感器(Current Transformer,简称CT)是一种用于晶振在激光雷达系统中的作用
晶振在激光雷达系统中的作用,作用,系统,激光雷达,晶振,可靠性,选择,激光雷达(Lidar)是一种利用激光进行测距的技术,广泛应用于自动驾驶人形机器人风起,连接器待势乘时
人形机器人风起,连接器待势乘时,连接器,人形机器人,工作效率,性强,研发,光纤,近年来,人形机器人在人工智能领域取得了巨大的进展。随浅析动力电池熔断器的基础知识及选
浅析动力电池熔断器的基础知识及选型,动力电池,时切,系统安全,作用,产品,系统,BA4558F-E2动力电池熔断器是用于保护动力电池系统安光电液位传感器在实现扫地机液位检
光电液位传感器在实现扫地机液位检测中的作用,检测,传感器,作用,控制,响应,控制系统,AO3403光电液位传感器在扫地机液位检测中起着探讨变压器的作用以及其在改变相位
探讨变压器的作用以及其在改变相位方面的应用,相位,负载,用于,转换,传输,隔离,EPM7064STC100-10N变压器是一种电气设备,主要用于改变芯片制程中常见的介质材料有哪些?都
芯片制程中常见的介质材料有哪些?都有什么作用?,有哪些,常见,程中,作用,芯片,聚二甲基硅氧烷,芯片制程中常见的介质材料包括氧化硅、