大卫公司运行了1年半以后,业绩翻了几倍。服务器数量从50增加到100台。这时候,为了提高服务器的利用率,大卫公司又买了RHEV虚拟化软件,并且将虚拟化整合比设定为1:8左右。也就是说,总共的RHEL操作系统数量在800左右。
这时候,IT顿时感到工作量巨大。此时,操作系统安装就需要从手工安装转化为自动化安全。而补丁管理需要使用yum源。配置方面,则需要使用批量脚本进行批量执行。定期巡检也要搞起来了。安全漏洞则需要定期扫描。
在这个阶段,大卫公司制定的IT标准已经完善,大卫也要求IT运维部门严格执行。
级别4: 关注执行过程中产生记录,统一管理
又过了三年,大卫公司的业绩又翻了几倍。操作系统数量已经突破2000。这时候,开发和生产环境中操作系统的版本已经比较多了,需要做操作系统版本管理。而补丁管理,也需要集中管理。配置管理则需要在级别3的批量脚本执行上,使用git或SVN进行统一管理。告警和日志也需要做集中管理,把操作系统和应用日志做统一收集和分析。安全漏洞方面,也需要做集中管理,以提高效率,避免出错。
级别5.实现开发运维一体化
又过了两年,大卫公司由于业绩太好,决定IPO,并且成功上市。这时候,该公司操作系统数量已经超过5000,应用类型几十种。上市以后,由于竞争非常激烈,老板大卫要求研发部门提升产品的研发速度。新产品的发布速度需要从6个月缩短到1个月。这时候,在大卫的安排下,开发部门和运维部门大佬们坐在一起,研究如何将devops落地。通过不断的学习和探索,devops在该公司实施成功,系统版本使用容器技术进行分层管理。补丁管理、配置管理、日志告警、安全漏洞的管理均实现了自动化。Devops在大卫公司成功落地以后,大卫公司竞争力大幅提升。
红帽卫星对于OS成熟度模型的意义
在OS成熟度模型中,大多数客户处于级别二到级别三的转化中。而红帽卫星,是能帮助客户将OS运维成熟度模型提到到四级(以红帽卫星为主,结合开源工具ELK)。而从四级到最终第五级的Devops,则需要OpenShift解决方案以及Ansible等工具。
红帽卫星
本文前半部分讨论了,如何通过GartnerIT基础架构和运维成熟度模型中的技术维度,引出OS成熟度模型,并且介绍了每一个等级的具体情况。那么,对于一个客户而言,红帽如何帮助客户提升OS运维成熟度级别?
这时候,找红帽卫星啊!(Red Hat satellite)
红帽卫星这个听起来很拉风的名字,除了可以帮助客户提升OS运维成熟度。还是红帽SOE架构的落地工具。SOE全程是Standard OperatingEnvironment,意思是标准操作环境,也就是将生产运维实现标准化。至于标准化的意义和好处,读者应该都比较了解了。
IDC 2014年发布的白皮书The Business Value of Standardizing on Red Hat
Infrastructure Solutions,里面谈到,通过在数据中心实施红帽标准化方案,不仅可以大幅降低IT基础架构的复杂度,还会带来巨大的收益、大幅降低TCO。
Satellite到底是什么?
可能很多读者对VMware的产品解决方案比较熟悉,我们可以大致将它和VMware的方案进行对比,以方便理解。
红帽Satellite=vCenter中的license管理+UpdateManager + VMware Configuration Manager+ vROps中的安全加固手册。
那么在Linux运维管理方面,Satellite具体能做什么?
目前很多客户采用各种开源技术实现了操作系统的批量安装和自动化部署、但是先前的做法可重复利用化程度很低,每当有项目需要进行自动部署时都需要针对该项目重新进行配置,工作量大且效率低下而且没有很好的版本管理和回退机制,也缺乏一个很好的管理界面来进行管理,希望通过有效的管理工具来实现快速部署海量服务器的问题。
目前行里的服务器升级都是去红帽官方网站下载然后手工进行升级操作,实效性、可追溯性差,管理员只是被动接收来自安全部门和红帽的安全建议,希望通过一个集中展示平台,直观的看到行内所有linux服务器目前运行的软件版本和官方版本之间的差异、升级的类型并直接通过统一的展示界面远程直接对需要升级的服务器升级某一个软件的升级程序。
国家现在对开源软件的安全性要求很高,很多行业客户的安全部门以及公安部会定期对所有的Linux服务器进行安全扫描并发布安全整改意见,这些意见和厂商提供的安全更新建议往往有很大的出入,迫切的需要一个工具能提供红帽产品的安全更新以及修复建议并且能结合上述的软件更新功能为系统及时的修补安全漏洞
很多IT规模比较大的客户有自己的操作系统基线,定义了一系列的标准,这些标准需要人工来实现以及更,参与Linux运维的人员也很多,每个人的能力、对操作系统的理解程度以及使用习惯的不同会造成Linux服务器的配置存在很大的差异,有无可能通过一个集中式管理工具结合行里的运行规范来实现自动化部署并且可以根据已有古规范找出个与规范之间的差异并消除
很多客户的开发测试运维的环境都不完全一样,这就有在开发测试环境中可用但到了生产环境会出现问题的风险,希望通过工具来统筹管理开发、测试和运维平台上的Linux环境的部署,应用软件的分发以及合规性一致性的检测。
很多客户基于Linux的系统都是以项目(业务)的方式进行划分的,每个项目都会有相应的软件中心和数据中心的技术人员负责应用软件和操作系统的开发、部署、上线、维护等工作,为了完成这些工作需要给相应的用户赋予相应的权限以避免越权操作,希望解决在大规模Linux使用环境下用户管理和权限划分的问题。
传统的Linux运维管理需要登录到服务器上手工或者通过执行脚本的方式来进行,对于一个项目而言,通常几台甚至几十台服务器的配置和运行环境是完全一样的,希望能实现像操作一台服务器那样操作一组服务器,执行一次操作就可以对该组内所有服务器都生效,即对一组服务器可批量进行升级、部署、管理和维护的工作。
总结:
截止到目前,相信大家对OS成熟度模型的相关概念有了一些了解,在后续的文章里,笔者会根据读者的反馈,做更深一步的介绍。