聊聊运维管理平台的未来之路

图片[1]-聊聊运维管理平台的未来之路-JieYingAI捷鹰AI

大部分运维工作都会随着公司服务器数量和业务量的增长而增加,运维人数的不足导致单个运维人员所承担的工作任务较为繁重,还会因为运维工作的不标准、无自动化使得运维任务十分复杂,耗费大量的人员成本、时间成本和沟通成本。

运维工作涉及硬件如机房、机柜、网络设备、服务器、存储设备等,软件如安装系统、系统初始化、应用部署、监控报警、日志分析、数据备份、解决故障,资产维护、代码发布等,可能还会有业务层面的事情。在服务器数量较少的情况下,可以第三方工具、shell命令实现操作和管理;服务器数量较多的情况下,尤其是业务复杂度高的情况下需要多个第三方工具协同的时候,第三方工具的问题就会明显暴露出来了,就像打仗一样目前已经是多兵种空天地海联合作战的时代了,你还拿单兵种作战思维去打战那基本就会去送人头了。

由于种种原因现在大部分公司运维整体环境也较为繁乱,服务器上的代码、配置、软件包、脚本等文件没有进行统一的版本管理与配置管理,比如某个产品的代码版本多种多样;代码和文件几乎都是通过一台复制到另一台的方式来实现;由于代码版本、配置版本等问题导致的现网质量事件也并不在少数。

例如运维需要统一的资源管理系统,对服务器资源从业务维度进行资源管理,运维的CMDB系统只在静态资源维度进行了管控,动态的业务数据等资源才是精细化运维管理。

因此,针对上面所述的各种问题,需要一个运维管理系统来解决包括:资源管理、配置管理、任务管理、文件发布等一些列常用的运维跟踪,通过简单高效、自动化的方式将繁琐的应用运维工作通过管控系统来完成,即可以降低运维的难度,也可以提高运维的效率,同时可以提高运维操作的成功率,并实现运维任务的持续跟踪和管理,甚至在不远的将来可以实现移动运维。

图片[2]-聊聊运维管理平台的未来之路-JieYingAI捷鹰AI

任何的平台、工具都是为了实现使用者的目的存在的,而运维平台服务的自然是日常运维工作,有利于在运维管理方面减少成本,提高运维效率及响应速度,协助运维快速排查定位问题。因为运维知识体系过于庞大,有兴趣的童鞋不妨了解一下赵班长写的运维知识体系-v3.1,如果说运维管理平台可以包罗运维所有需求,那几乎是无法完成的。

在我看来运维管理平台不是为了要取代运维人,而是要辅助、协助运维,将日常的重复的运维工作交给平台、将运维痛点问题交给平台。运维人也要提升自己、去做平台做不了的事情、做需要思考才能解决的事情、参与到公司业务中去提升运维自身的价值。

说实话想做一个能适合大部分公司的运维平台还是非常难的事情,需要在各个方面找到平衡点,做好取舍防止掉入功能需求陷阱,需要站在更高维度去俯视运维体系和需求、找到运维需求痛点并找个合适的解决方案。

图片[3]-聊聊运维管理平台的未来之路-JieYingAI捷鹰AI

你理想中的运维管理平台是什么样子的呢?不妨在评论说一下

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
来说点什么吧!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容