「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践

图片[1]-「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践-JieYingAI捷鹰AI

图片[2]-「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践-JieYingAI捷鹰AI

中国银行数据中心(上海)总经理 宋立

随着信息技术的蓬勃发展,IT与业务加速融合与促进,大数据、云计算、互联网金融等技术和业务不断创新与发展。从而使得企业IT运维管理范围不断拓展,运维技术难度持续提升,风险隐患日益突出,安全生产要求不断提高。IT运维管理已从传统的信息安全管理升级为全面的科技风险管控。为弥补数字化时代下传统IT运维管理模式的不足,需要不断创新IT运维管理理念,变革IT运维工作方法。本文将“清单”理念引入IT运维管理领域,通过构建简单、可测、高效的清单,保证运维重要环节不被遗漏,有效降低人为差错,捍卫安全生产合规,不断提高安全生产管理水平。

传统IT运维管理面临的问题

IT运维管理是指采用制度、流程、技术等一系列措施,对IT运行环境、业务系统和运维人员进行综合管理,为信息技术服务提供基础保障。IT运维管理在电信、金融等行业应用非常普遍,但传统IT运维管理面临如下问题。

一方面,系统安全、稳定运行的要求与运维难度的矛盾日益突出。企业IT系统不断增长,特别是大型机构,IT系统规模庞大、运维人员数量众多,并随着大数据、云计算等技术的运用,对安全生产提出了更高要求。

另一方面,传统IT运维管理事中监督不足。在传统IT运维管理中,主要靠不断完善规章制度、加强安全意识培训、加大安全生产管理力度等手段进行日常生产安全管理。但传统IT运维管理立足制度架构,侧重于前期规范与后期审计,而事中执行监督相对不足,无法有效规避有章不循、人为的操作失误、含糊不清的无效信息沟通、操作步骤的不完整不准确、复核岗位的有名无实、验证手段简单粗放等问题。这些问题都是引起事件和故障多发、频发的重要原因,且大多数是习惯性违章所引起。

经分析,这些问题的发生一是来自运维压力的增大,自身技能的不足,二是来自运维人员思想和安全意识不强。问题的的根本症结在于人类与生俱来的习惯认知和记忆缺陷,其所掌握的知识量和技术复杂程度超过了个人能正确、安全应对的能力范围。

“清单”理念与企业IT运维管理结合

为弥补传统IT运维管理在数字化时代中的不足,必须探索新的管理理念和管理手段,来应对信息科技风险,防止IT运维中可能出现的错误与失败。“清单”理念正是来源于此,通过建立简单、可测、高效的清单,可以把依靠记忆和经验完成的工作流程,变成可视化的强制约束,保证重要环节不被遗漏,降低人为差错,提高沟通有效性,确保运维人员持续、正确、安全地把事情做好。

“清单”理念简单来说包括以下四点:一是遵守纪律。清单上的流程节点本质是工作纪律,履行清单要求就是恪守纪律。二是全员参与。每个运维人员都应当在相应的清单上发挥好自己的某项职责或作用,要守土有责。三是精诚合作。涉及多职能的清单要点,相关职能单位要据此及时沟通,互相帮助,共同履职。四是融会贯通。清单并不万能,在紧急情况下,要借助清单尽快整理思路,依照相应的原理或精神举一反三,发挥主观能动性,从而解决问题。

清单的建立必须遵循简单、可测和高效三大原则,要求控制长度、检查点清晰、用语精炼,并能经受实践的检验。在清单的建立过程中,要关注如下六个要点:一是设定清晰的检查点。使用者在这些节点根据清单列出的项目执行检查程序。二是选择合适的清单类型。编制者需要在“操作-确认”和“边读边做”这两种清单类型中做一个选择。在使用“操作-确认”清单的时候,使用者先根据记忆和经验完成操作,然后再确认是否均已做好。而在使用“边读边做”清单的时候,使用者一边念出检查项,一边进行检查。三是简明扼要,不宜太长。编制清单时,应该把注意力放在那些一旦跳过就可能会造成严重威胁,但又常常被忽视的步骤上,并做到简单明了,直切要点。四是用语精炼、准确。清单用语应为使用者所熟悉的专业用语,通过最精炼的语言表达准确含义。五是版式整洁,切忌杂乱无章。清单版式很重要,检查项目的长度最好不要超过一页,不要排列得杂乱无章,不要随便使用各种颜色,要便于阅读。六是必须在实践中接受检验。无论在编制清单的过程中多么用心,多么仔细,清单都必须在实践中接受检验,因为现实往往比我们想象得更为复杂。编制人员需要对失败原因进行仔细研究,对清单进行改进,并不断测试,直到在各种现实环境中清单都能顺利使用。

“清单”理念在企业IT运维管理中的实践

将“清单”理念应用于企业IT运维管理中,目标是深挖生产运维中的突出问题和薄弱环节,完善工作流程和工作手册,最终建立适合辅助各项运维工作流程、操作手册的简单、可测、高效的清单,用以复核、验证、提示各操作流程中的重要关键点,切实规避操作风险。

为更好地发挥清单的作用,需要企业管理层、监督层、实施层各司其职、共同推进。管理层负责确定工作方向和内容、指导实施,监督层负责统筹工作安排、沟通协调和监督跟进,实施层负责制订具体实施方案,制订本条线清单,督促清单使用,确保清单落地实施。

在“清单”编制过程中,应与运维流程和操作实践相结合,实现清单的属地化、客户化和定制化。“清单”可分为简单、复杂和极端复杂工作场景三个类别。具体而言:简单工作场景即实施单一工作任务的工作场景,这里的“工作任务”指结构化的工作任务即有明确的目标、方法和步骤的各工作要素的组合,“单一”指不可再切分的最小、最简工作任务;复杂工作场景即实施由多个单一工作任务组合,且相互之间需要保持信息沟通,彼此协作形成的复任务的工作场景;极端复杂工作场景即实施由多个复合工作任务叠加,涉及多个职能单元甚至跨部门的,在子任务和复合任务之间涉及多回合信息确认的工作场景。三个工作场景的“清单”采用不同的新增、维护和监督方式分别实施。

以某企业IT运维工作中需要不同职能团队间信息沟通的某一复杂工作场景清单《小型机故障硬盘更换清单》为例,说明清单建立的方法:首先梳理形成小型机故障硬盘更换流程(如图1所示),并以此为基础,提炼出信息确认、更换实施和事后复查等重要环节,找到关键与必不可少或容易忽视的点,重点关注需要进行复核的工作,同时要确保沟通中信息的对称,从而形成清单内容(如图2所示)。清单内容的每一项均与流程的相应步骤对应。

图片[3]-「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践-JieYingAI捷鹰AI

图1 小型机故障硬盘更换流程

图片[4]-「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践-JieYingAI捷鹰AI

图2 小型机故障硬盘更换清单

在“清单”编制过程中,应广泛梳理各项工作流程,聚焦安全生产运维痛点,从中提炼出起重要作用但又容易被疏忽遗忘的关键步骤、关键点,形成清单,并在生产运维实践中验证、优化,不断提高清单的有效性。

为有效监督、指导“清单革命”的实施,及时解决实施过程中存在的问题,还应由管理层组织召开各类协调会、评审会,对重点清单进行评审、纠错,确保“清单”实施质量。监督层、实施层应每月定期召开例会,通过进度表、项目任务逐一落实到人等方法及时把控项目实施进度;定期组织评审简单场景清单、复杂场景清单,提出改进建议,组织制订改进措施;通过定期重点汇报、定期发布简报等方式及时发布实施进展情况,督促清单使用,促进问题的解决。

“清单”在企业IT运维管理中的效益与价值

“清单”在企业IT运维管理中的实践证明,通过科学划分简单、复杂、极端复杂工作场景,建立并实施覆盖全环境、全领域的清单,能够确保运维重要环节中的信息对称,有效降低人为差错,捍卫安全生产合规,大幅提高安全生产管理水平。

清单的建立与运用,在运维操作、变更管理、应急处置、可用性管理等领域作用显著,实现了安全生产的关键环节不出差错。例如在变更管理中,除了严格审批变更方案、操作手册、风险评估等关键要素,还加强了对变更检查清单的审核,要求所有变更必须附有清单并严格执行,以此确保生产变更正确操作和认真复核,从而显著降低了变更风险,确保变更成功率达到100%;在应急管理中,通过对历年出现过的各类故障进行分析和研究,找准了日常生产运维的薄弱环节。根据应急预案建立配套清单并监督执行,确保应急处置过程中各个角色按照应急预案高效协同,提高了应急处置效率。除此之外,针对日常运维、技术测试、机房巡检等多方面组织建立的检查和协作清单,能够保障IT运维各项工作达到规范化、标准化的管理要求,彻底避免人为原因导致的生产故障。

总结

“清单”理念应用在企业IT运维管理中,强化了事中执行监督,有效解决了人为操作失误问题,大幅降低了生产运维风险。同时,“清单”理念还传递出一种注重合作与纪律的文化,与“严、细、实”的精细化管理理念一脉相承,促使运维人员把能做好的工作做到极致,降低安全风险隐患。通过持续的努力,将“清单”理念演变成一种内化于心、外化于行的工作习惯,从而保证持续正确做事,捍卫安全生产长治久安。

订阅《金融电子化》《金融安防》《金融客服》

可登陆官方淘宝店铺:

有疑问可拔打电话:010-88232440-858进行咨询

图片[5]-「中国银行数据中心(上海)总经理 宋立」“清单”在企业IT运维管理中的实践-JieYingAI捷鹰AI

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享