随着电子政务建设的深入,我国政府的信息化建设已经具备了一定的规模,形成了部、省、市、县四级体系;大型政务服务事项、公文流转、行政审批、费税征缴、信息公开、网格化社会管理、三网融合、智慧城市建设等大量政府核心业务越来越依赖信息化。随着互联网+政务的全面进入建设期,大多数政务信息系统趋于成熟期且大部分进入全面维护阶段,政务信息应用系统的网络安全成为重中之重,互联网+政务的安全生产、运维已经成新战略制高点。
第1章 电子政务网络运维痛点
随着我国政府信息化建设高速发展,智慧城市、政务公开、三网融合、行政审批改革、政务云、民生信息化层出不穷。到目前为止,投资建设的大量基础设施与信息系统已进入应用维护阶段,持续可靠提供应用服务的风险已经凸显,政府机构对本土IT运维管理服务的需求逐渐提高。
具体表现如下:
1.运维工作定位不准确。目前政务运维工作普遍存在“重建设、轻维护”现象,缺乏专业管理人才与运维平台,太过依赖服务外包商。
2.海量设备品牌异构,难以统一管理。政务网内的安全设备、路由交换、服务器、智能终端等网络设备品牌多样化,实行各自管理政策,出现问题难以快速发现定位。
3.设备分布分散,网络覆盖范围大,难以集中管控。政务网延伸至区县镇一级,距离远,设备量大,往往只能维护主干设备,大量的接入设备无法统一监管起来。
4.网络结构复杂,难以可视化管理。政府部门间通过广域网路由器、网关和防火墙等实现相关部门间的信息互联和共享,网络庞大包含各级政府机关,横纵多级网络结构复杂,运维人员难以可视化管理分布式、异构性网络架构。
5.业务系统众多,难以实时进行业务可用性分析。从Web网站到网络系统,从政务职能到网上办公都需要IT系统的有力支撑,随着业务的增加通过网络传输的数据也越来越多,确保应用的可用性成为亟须解决的问题。
6.故障难定位,排障时效低。日常运维工作中多处于“救火”状态,被动地处理各种故障,随着业务不断发展、系统规模不断扩大,故障根因难以定位,用于确定故障及恢复时间越来越长。
7.运维建设不平衡,工具繁多形成数据孤岛。不同局委办规划建设自成一脉,引入了大量不同的国内外工具,包括监控、日志、数据库等,数据冗余复杂,数据资源分散,数据孤岛普遍存在。
8.加速本土替代成为紧要目标。由于政府系统业务的特殊性,亟需实现运维平台的本土化,实现本土化IT技术栈的可监、可管、可控,建立一体化智能运维平台。
9.依赖厂商代运维,运维经验无法沉淀。运维工作多依赖设备厂商和外包厂商,业务异常时难界定根因,同时重复、相似故障经验依赖于运维个人能力,经验知识无法沉淀。
第2章 智和信通电子政务网络运维方案
“三分建设,七分运维”,运维体系的完善程度已经是决定电子政务服务能力的重要因素。新一代数据中心、网络与政务云等数字政府基础设施、政务应用大量上线,系统架构规模迅猛发展,本土化改造替代全面深入推进,对IT运维及运营提出了更高要求,运维厂商需应对更多挑战。北京智和信通电子政务网络运维方案,通过对各类网络场景下的跨域资源整合、数据深度挖掘、异常监测、流量分析、态势感知、自动化运维等能力,保障IT基础设施和业务应用的安全、稳定、可靠运行,并利用运维数据资源对业务运营与决策提供有力支持。
2.1. 内外网隔离架构可视化
政务网络一般分为内部局域网、外部互联网、通信系统和专用线路。在内外网混合的情况下,方案通过内网渗透,打破内外网隔离限制,在拓扑中集中展示双网结构,展现设备实时状态,使用不同颜色、粗细、图标表示被管理对象的状态信息,助力运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。
双网隔离拓扑示意图
2.2. 核心网络架构可视化
政务网络架构中软硬件环境涉及的技术复杂,厂商众多。北京智和信通通过网络架构拓扑可视化能力,将网络数据从离线表格转移至平台内,从静态的网络架构数据转化为动态智能拓扑,通过树形、平面结构联动展示设备间链接关系,通过按片区、按地域、按层级等多种布局方式划分网络,实现全网设备、资源、链接关系、IP等实时更新、快速定位。
电子政务广域网拓扑示意图
2.3. 信息中心 IDC机房架构可视化
以2.5D管理视图对数据中心机房运行情况和机柜及各类设备进行统一、全方位、多层次的综合管理,实时分析资源当前性能和运行状态,直观反映资源的动态变化对支撑业务的影响,清晰直观地掌握机房运营中的有效信息。实现透明化与可视化的信息传递,提升机房资产数据的可用性、实用性和使用效率。
2.5D机房监控示意图
2.4. 实时故障预警,及时洞察异常信息
方案通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个电子政务网中各种事件/日志信息、设备故障、网络异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过多种方式实时传达告警信息,保证落实到指定人员进行处理,为电子政务网络提供主动式的故障解决方案。
2.4.1. 全方位采集告警信息
全面采集电子政务网络内所有联网设备,如存储、服务器、路由器、交换机、防火墙、虚拟化、云、PTN等设备、资源、应用、服务等状态信息,通过对告警机制以及阈值的设置,第一时间获取准确的告警信息,快速定位告警设备,提升告警处理效率,降低因设备故障带来的损失。
2.4.2. 异常事件/日志管理
将事件/日志和告警分离管理,接收设备/服务器主动发送的消息,集中处理后,及时地通知用户,并可以通过集中的管理界面进行管理。接收设备/服务器主动发送的消息,极大地提高了管理的主动性,通过统一界面集中管理事件/日志,降低了管理的难度。
2.4.3. 人工运维与故障自愈结合
将人工运维与故障自愈结合,无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,实现故障自愈。
通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理。
2.5. IP资产监管
政务网络安全一直是其运维工作的重中之重,一旦出现非法接入极易出现严重威胁,因此对接入网络中的IP、终端更需严加管理,本方案支持端到端规划、部署、管理和监控IP 地址。通过智能IP扫描能力,定义多层次子网,可手动、自动获取子网信息,并根据网络结构对子网信息进行管理。总览IP网络全局,掌握“IP容量”薄弱点。
通过黑白名单功能用来检测用户所关心的设备是否在网络中出现及出现时间。支持配置黑名单或白名单,智能划拨规划表中的IP、MAC设置为白名单策略,对非法接入设备进行告警处置。
对全网MAC和IP进行配对绑定,并周期性对MAC-IP进行检测。自动将规划表中的IP-MAC设置为绑定关系,自动扫描在线终端,当IP-MAC的绑定关系发生冲突时产生告警,保证入网终端安全可信。
2.6. 全面覆盖IT资源自动巡检
方案依托平台将以前依赖手工进行的日常巡检转换为自动化、定时执行的巡检策略。制定统一的巡检指标、巡检方式、巡检频度等,保证巡检标准化、巡检范围、巡检深度;通过设计巡检作业、数据采集方式、自动化作业调度等实现日常巡检的自动化,代替手工工作,提高效率的同时,解放管理人员,释放管理人员更多的精力,使更多的精力处理更重要的事项。
2.7. 端到端业务可用性管理
一办四中心同时存在政府办公业务和公众服务业务,业务体系错综复杂,服务对象多元化;访问地点跨越多个办公大楼,公众服务遍布全省、全市,访问方式多样化,用户终端至业务端访问路径差异大。本方案以保障业务可用性为基础,通过对承载业务的IT基础设施构建真实的业务模型,端到端监测业务可用性,规避业务风险,保障业务可用性。
电子政务业务看板示意图
针对业务应用性能与用户体验进行检测分析,无需安装插件即可提供开箱即用的主动拨测试业务监测。直观、便捷地帮助运维人员对电子政务网络内视频会议业务、公务员考试报名灾备系统、行政对外服务门户网站、电子监察系统、舆情系统、行政并联审批系统及其他非固定业务等进行监控,掌握业务的运行状态和健康水平,了解业务动态变化趋势,快速定位故障源,降低运营风险。
2.8. 全网带宽、流量监控与回溯分析
方案基于海量流量数据的存储挖掘,实现对网络流量的侦测分析。通过网络流量分析技术,采集、分析、存储所有网络流量,回溯分析数据包特征、异常网络行为,以多维数据分析和深度挖掘为手段,实现数据包层面的流量追踪,发现潜伏于网络中的未知攻击。
提供设备、接口、IP、服务、应用、会话等层级的带宽监控,实时监控带宽使用趋势与带宽占用分布,并通过图表展示,快速识别网络带宽滥用,分析高带宽使用情况,识别带宽消耗较大的应用程序、服务、协议或 IP 地址,避免网络容量过载,并提升最终用户网络体验。
2.9. 跨厂商设备集中配置管理
政府部门的信息化建设的扩大,不光是基础设施包括软件应用层方面的需求也急剧扩大,网络承载的业务经常发生变更,面对业务的变更运维工程师往往要对大量设备进行操作,而不同批次购置的设备,品牌、型号不尽相同,运维人员需要在多个管理平台来回切换,此时如果依靠工程师逐一登录设备进行命令下发、策略配置,将产生大量重复性的工作,不但导致运维效率低下,也不可避免地产生人为配置错误。
通过批量作业并行处理能力,实现多设备并发批处理操作。通过自动化流程,将简单的设备控制操作在大批量设备进行执行,并对执行过程进行监督,对执行结果进行检查。在安全合规的前提下,将运维人员从整体的变更流程及变更内容的准备中解脱出来,实现网络变更、设备配置自动化。
针对不同类型的设备,支持进行各种控制、配置操作。
n 对服务器/主机/虚拟化,支持一键开关机、进程管理、应用管理、容量管理等
n 对交换机/路由器,支持ACL、QoS、流量策略、端口策略等
n 对安全设备,支持防护管理、认证管理、NAT管理、VPN管理、内容控制等
n 对数据库/中间件,支持空间管理、池管理、会话管理、连接控制等
n 对传输设备,支持终端管理、链路管理、信号控制、功率配置等
n 对其他设备,支持结合用户实际场景,通过拖拽流程的方式实现自定义管控策略
支持不同厂商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、华为、H3C、锐捷、中兴等多家厂商的网络设备。
2.10. 设备策略备份对比
方案通过配置文件批量备份、下载、周期性备份、查看等功能,为用户管理网络做出合理的建议提供数据支撑。
2.11. 全场景自动化运维
方案将电子政务网运维中涉及的服务、命令、操作、执行组件化、策略化,将需要进行的运维服务、操作等以组件、策略的形式托管至平台中进行维护和管理,通过简单灵活的编排能力,使用者可以选择业务场景所需策略,通过可视化拖拽的编排方式进行组合,即可完成应用场景端到端的图形化编排,最后以多种方式触发执行即可完成期望的运维变更任务,从而实现高效、稳定、安全的智能运维。
在电子政务日常网络运维服务中,重复的故障和请求约占到70%,只有30%的故障真正需要专业人员来解决,知识经验对提升重复工作的效率起到了至关重要的作用。
通过智和网管平台自动化运维的能力,将只能有专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识,减少因误操作带来的损失,保障运维效率。以规范的流程进行运维作业,保障关键数据的完整合规。
2.12. 可视化数据分析
利用图形、图表、图表等易于理解的形式,提取和分析大量复杂的电子政务网中各类运维数据,呈现分析结果,从而帮助运维人员在短时间内更好地理解和获得更多的信息,帮助运维部门能够实时了解业务和其所依赖IT资源的运行状况,以及提供系统运维和优化的指示和依据。
电子政务网大屏示意图
2.13. 资产生命周期管理
方案通过资产管理模块将资产实物与运维数据库一一对应,将为政务资产提供更加便捷高效资产生命周期管理,资产跟踪、维护和统计分析。从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有迹可循,从而实现全面的IT资产监管。
2.14. 定制化工单体系
通过方案实现运维工单“无纸化”,支持于设备和故障管理页面快速创建工单,把控故障处理进度,通过工单平台简化故障处理流程,形成自动化故障处理机制,并在每个处理流程的节点上责任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。
通过建立工单服务基准,预设工单在不同优先级、不同状态时,受理人应该响应的时间及未响应时的处理方式,生成工单自动化处理规则,并以多种方式进行通知,避免超时响应提升全流程服务管理质量。
第3章 自主研发安全可控
产业包含了从IT底层的基础软硬件到上层应用软件的全产业链的安全可控,涵盖了应用软件、信息安全、IT基础设置、基础软件四个领域。其中,基础软件是信息系统最核心的部件,是保障信息系统安全的重要阵地和最后一道防线,其创新应用与自主可控关系到国家安全和利益,也是产业自主发展的基础。
本方案支持部署运行在中标麒麟、银河麒麟、红旗Linux等本土操作系统,支持在达梦、金仓、神州等本土数据库进行数据存储,通过东方通等本土中间件提供对外服务[8],支持龙芯、申威等本土CPU架构,并实现对本土化CPU、服务器、数据库、中间件等IT软硬件设备的综合监控与运维管理。
第4章 方案应用价值
北京智和信通电子政务智慧运维方案,通过构建统一的监控运维系统,以智能化的运维手段、规范化的运维过程、可视化的运维场景,汇聚融合全量运维数据,推进运维数据分析,助力各级数字型政府建设,解决其基础设施多、运维误操作风险大、运维自动化程度低,工作时效性差,缺乏统一的操作和维护标准等问题。实现“提升运维质量、降低运维成本、提高运维效率、确保运维安全”,保障政务系统安全、稳定、可靠运行,增强运维对决策和运营的支撑保障作用。
n 设备统一管理
一览掌控全局,全网状态实时监控 ,拓扑图自动发现,透明化管理,以图形化方式呈现网络设备、资源和链路状态、性能、物理连接关系,领导可以从全局对IT 资源使用进行把控。
n 极速故障定位
一键定位故障设备,细化到具体指标,判断设备关联影响,快速定位故障发生原因,提高IT人员故障排查效率
n 运维效率提升
自动化巡检代替人工巡检,提前预警,一键定位,大大降低故障率,缩短故障解决时间,保证业务连续性运行。
n 保障业务高峰
保证关键网络设备及核心网络的带宽,提供服务器状态监控,监控安 全设备运行状态,提供网络拓扑结构图。
(本文不涉密)