电子运维系统

2024-08-26

电子运维系统(精选十篇)

电子运维系统 篇1

在2004年,本馆在Linux系统上采用squid+squid Guard+berkeley DB建立电子阅览室上网黄色网站过滤系统,并将建立此过滤系统工作总结成一篇论文。该系统运行至今已7年,效果很好,但良好效果的取得离不开艰辛的运维工作。本系统三组件都是免费软件,原始资料很少,当遇到问题的时候往往找不到现成的答案,每解决一个问题都要经过艰辛的探索,多年来积累了一些独到的经验,将在本文中作一下总结。

另外,经过7年的时间的运行,原来的系统硬件老化,需要更换一台新的机器作平台,软件系统包括操作系统、过滤系统三个组件模块都需要升级到最新版本,本馆在2011年完成了这项工作。在升级过程中遇到的一些问题的解决办法也将在本文中作一下总结。以下文字要经常提到参考文献,为叙述方便,统称“旧文”。

2 系统升级

2.1 升级准备

首先要购买一台新的双网卡服务器,并安装最新版Linux操作系统。当然,新服务器是否需要购买,及买什么样的配置,可依各馆电子阅览室的规模大小及资金情况定。本过滤系统三剑客,squid+squid Guard+Berkeley DB都有新版本,目前最高版本分别是squid-3.2.0.14,Squid Guard 1.5,Berkeley DB 5.3.15。squid-3.2.0.14.tar.g安装包下载地址:http://ftp.meisei-u.ac.jp/mirror/squid/;Squid Guard version 1.5安装包下载地址:http://www squidguard.org/index.html;Berkeley DB 5.3.15.tar.gz安装包下载地址:http://www.oracle.com/technetwork/database berkeleydb/downloads/index.html。

2.2 具体安装

按旧文中步骤进行安装即可,但有如下变化。其中Berkeley DB安装中下载两个补丁并安装补丁的步骤不需要。从网上下载getlists.sh文件,修改并运行其以从网自动升级黄网黑名单数据的工作不需要,而是改用原来旧系统上的黑名单库,因为在多年的运维工作中,根据新情况不断在充实黄网黑名单,已经形成了一个具有本馆特色的黑名单库,如果从网上升级的话,本馆的特色数据就会被覆盖。Squid配置文件squid.conf及Squid Guard配置文件Squid Guard.conf并不需要从新配置,直接从原系统拷贝过来放在相应的目录下就行。

2.3 从旧系统移黑名单库

首先将原系统黑名单目录整体打包:#cd/var/lib/squid Guard/db/;#tar cvf blacklists.tar blacklists。将生成的blacklists.tar拷贝到新系统的/var/lib/squid Guard/db/下,并进行解包:#cd/var/lib/squid Guard/db/;#tar xvf blacklists.tar,这样就在新系统中生成了blacklists黑名单目录。继续改变该目录的用户及群组属性:#chown–R nobody.nogroup/var/lib/squid Guard/db/blacklists。

2.5 升级

运行命令#cd/usr/local/squid/sbin/,#./squid,#ps ax|grep squid,发现squid及squid Guard均启动成功,至此,升级工作完成。

3 运维工作经验要点

通过本人7年来对该系统的运行维护,谈点体会。本系统虽功能强大,但由于是免费系统,原始资料少,同类经验缺乏,出现问题一般要靠自己去探索解决,所以要做好本系统的运维工作不轻松,管理人员对该系统要有深入的了解,才能应对自如。

(1)本系统牵涉到三个程序模块,分别安装在不同的地方,比较杂,为有效定位相关文件,必须将相关文件作一下归类并记在本子上,以便需要维护的时候迅速查找到,准确定位,归类如下:

(1)安装目录:

squid,/usr/local/squid/;squid Guard,/usr/local/squig Guard/;Berkeley DB,/usr/local/src/db-4.

2.52/;web,/etc/httpd,/var/www/。

(2)配置文件:

squid.conf,/usr/local/squid/etc;squid Guard.conf,/etc/;httpd.conf,/etc/httpd/conf/。

(3)日志文件:

squid日志文件,access.log,cache.log,store.log,/usr/local/squid/var/logs/;squid Guard日志文件,squid Guard.log,stopped.log,ads.log,/var/log/squid Guard/。

(4)黑名单库:

/var/lib/squid Guard/db/blacklists/。

(2)对本过滤系统的各模块之间的功能关系要有了解。Squid是管代理上网的,它本身可以单独做代理服务器用,管着访问协议、端口、缓存、有权限的访问用户。Squid Guard管的是过滤功能,每一个访问请求都要经过它的判断,合法的放行,不合法的禁止。Berkeley DB管的是黑名单数据库,为Squid Guard裁决时提供参考数据。

(3)深入研究配置文件。为对各模块功能有更深入了解,可以仔细研究模块的配置文件,很多功能的实现是通过修改配置文件来完成的。在squid.conf文件中,它控制http、ftp、dns、snmp协议及其相应的端口,如果哪一项没有放开,上网用户就没法使用该项功能,尤其是端口,一般Web网站都使用80端口,但有的网站却使用其他非80端口,如果没有放开该端口,访问就出问题。

在squid Guard.conf文件中,可以设置很多特殊的过滤功能,访问控制功能,可以设好多用户群,分别对其作定制性的限制,也可以分时段限制,比如平常不允许访问娱乐性网站,而在周末可以自动放开。

(4)对日志文件要重视。日志文件和系统的运行状态密切相关,系统各种运行的痕迹都记录在日志文件中。过滤系统存在异常时,更要通过分析日志文件,以找到解决问题的线索,尤其是squid Guard.log文件,其中详细记录了Squid Guard、Squid的每一次启动情况,每一个黑名单数据库的加载情况。

4 疑难问题解决案例总结

网路故障会导致Squid无法启动或从运行状态自动退出运行。Squid无法启动很难想到会是网路故障造成,总会在Squid及Squid Guard本身找原因,当查遍所有地方而问题依然如故,你几乎绝望时,偶然间去端详服务器后面的网络插口,发现一个网卡的运行指示灯未亮,重新插好网线,灯亮了,再去启动Squid,一切正常了。这个故障最具迷惑性,也是我解决过程体会最艰难的一个。这应是软件设计的一个缺陷,说明该软件启动过程首先会去侦听网络端口,当没有回应数据它压根就不启动了。所以,在每次出故障,都得首先检查网路是否通畅。

日志文件太大了会导致Squid不工作,虽然启动着,但一味出现报警信息,用户无法上网。这故障也是让人不可思议,不断增大的日志文件本就是系统工作的一部分,最后却被自己劳动结果压倒。

这个故障应与机器的性能有关,当日志文件大到超过它的处理能力,响应速度变慢,Squid就报警不工作了。解决办法:新建一些空的日志文件存在自建的一个文件夹下,这些文件有access.log、cache.log、store.log、squid Guard.log、stopped.log、ads.log,并将所有创建的文件用户及群组属性改为nobody、nogroup.当出现问题时,用创建的空日志文件替换相应目录下的同名日志文件后,重启Squid即可恢复正常。

缓存目录未建立,或建立之后未将该目录及子目录用户及群组属性改为nobody、nogroup均导致Squid不能启动。这些工作在系统安装的过程中已做过,一般开始是没问题的。但是在后来运行维护过程中安装过别的程序时,或其他误操作,很有可能潜在的将该目录属性更改了,导致出现问题。

问题解决:

运行命令#/usr/local/squid/sbin/squid–z、#chown–R nobody.nogroup/usr/local/squid/cache,重建缓存目录并更改属性。

黑名单库中某文件夹或某一个文件的用户及群组属性变为root、root,导致整个黑名单数据库无法加载,使Squid Guard程序进入应急运行模式,整个过滤功能失效,用户可完全放开上网。

黑名单库中文件众多,很不容易发现,而且在经常使用getlists.sh程序从网上自动下载黑名单数据库时很容易出现。

解决办法:

将问题文件及文件夹的用户及群组属性该回为nobody、nogroup,重启Squid。

在Linux服务器同时启用了Web服务,其使用的端口一定不能与Squid代理服务的端口重复,否则Squid不能启动。

解决办法:

检查目录/etc/httpd/conf/下的文件httpd.conf,看中Listen条目后的端口号是否与目录/usr/local/squid/etc下squid.conf文件中的http_port条目后的端口号一样,若是一样,必须改为不一样,然后重启Squid即可。

当黑名单数据库中各expressions文件,其中的关键字列表如果存在语法错误,比如在关键字列末尾不小心多加了一道竖线,则过滤功能全部失效。

解决办法:

参考旧文中语法格式,检查看是否有不合语法的地方,并改正,重启Squid。

某些网站并未限制,而其中的有些子网页却打不开,可能是这些网站的某些子网站启用了非80端口。解决办法,检查打不开网页,看其域名地址串中是否含有非80端口,若有,则到squid.conf中加入条目“ac Safe_ports port X”,其中X代表要放开的非80端口号。重启Squid问题解决。另外像FTP下载不能使用,也需要按上面的办法放开21、20两端口。

如果不存在端口限制问题,而且网站域名也未被限制,但其中有些网页就是打不开,很可能是遭到关键字限制。

解决办法:

找到黑名单库中各expressions文件,看打不开的网页文件名中某些字母组合是否出现在被限制的关键词列中,如果出现,将该关键词去掉就可以访问了。

要对某网站限制访问,将其域名加入黑名单库中,重启Squid,却发现限制功能不管用。

原因:

除了关键字限制,加完后重启Squid就能生效外,其它加到domaims、urls中的域名,必须重新编译生成domaims.db、urls.db,再重启Squid,限制功能才能生效。比如,在porn库domains文件中加入www.sex.com域名,运行命令#cd/usr/local/squid Guard/bin;#./squid Guard-C/var/lib/squid Guard/db/blacklists/porn/domains;#cd/usr/local/squid/sbin/;#./squid-k reconfigure。这样就可以限制用户对www.sex.com网站的访问了。

参考文献

电子运维系统 篇2

电子运维系统:运维管理体系的全面解决方案

一、背景

未来的电信市场竞争将日趋激烈,新的形势对中国电信的市场响应能力、服务保障能力、业务创新能力、运营管理能力提出了更高的要求。通信网络规模随着业务的需要在不断扩大,多种业务发展迅速。

新的技术、新的运营竞争环境使得电信运营商对运行维护效率、维护水平、维护成本控制提出了更高的要求,运行维护要从面向设备、网络转变为面向市场、业务。因此,必须依靠管理创新和技术进步走综合化、集约化维护之路。实现设备、人力、信息等各类资源的高效配置,使运行维护管理标准化、规范化,加强对市场和业务的支撑作用,建立以市场为导向,客户为中心,效益为目标的生产体系,实行对网络全专业的整合。

电子运维系统的出现为电信运营商的运维管理系统提供了全面的解决方案。所谓电子运维系统,就是通过电子化来确保运维过程的流程化、工单化、自动化和信息化,快速传递并反馈管控信息,实现快速故障定位和业务恢复,从而提高对市场业务的支撑力度,提高电信运营商的服务水平、服务质量。

二、系统设计原则

图1.电子运维系统——统一运维信息平台

进行电子运维管理系统设计中,要充分考虑整体OSS架构的演进规律与实施规划,把电子运维管理系统放在一个大的运维架构中进行整体设计与规划。另外,为体现电子运维管理系统作为一个指挥调度平台的核心作用,必须把信息发布、网络资料管理等功能综合起来,上升到“统一运维信息平台”的高度进行综合管理与规划。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

在此基础上,设计综合运维管理的整体功能架构与系统架构,然后把电子运维管理系统工程的各项需求纳入这个整体架构中进行统一规划与实施。这样,电子运维管理系统就可以很好地配合未来的OSS架构的升级扩展,并从系统底层预留了架构层面及功能层面的大量平台级的功能模块与扩展机制。

电子运维管理系统是一个长期不间断运行的、高可靠性、高处理能力、可扩展性强的环境下的业务支撑系统。因此,系统在应用系统设计和实施等方面应从先进性、稳定性、安全性、开放性和可扩展性等几方面进行综合考虑。

2.1 先进性

采用面向对象的、构件化的系统设计和实现方法进行应用软件的设计和程序开发。

2.2 统一性

采用统一的数据字典,统一的编码体系,统一的文件格式标准和统一的数据接口标准。

2.3 高度的可靠性和稳定性

系统具有很强的容错、容灾能力,完善的系统纠错恢复安全机制和自动诊断告警能力。

2.4 可扩充、扩展性

系统的应用软件设计方案充分考虑可扩展性,数据模型的设计充分考虑系统将来可能的扩展和业务的变动,以适应业务的迅速发展。

2.5 可伸缩性

系统在软件设计时应具有伸缩性很强的体系结构,以能够适应业务的不断发展和用户规模的扩大。

2.6 系统安全性

系统属于企业内部应用系统,从网络和应用系统自身均能确保系统和数据的安全性。

2.7 开放性

系统遵循行业的标准或建议,采用标准的、开放性的技术。

2.8 灵活性

系统能够适应业务的发展,灵活地设计、调整业务处理流程和组织结构,以适应未来的发展变化。

三、系统硬件结构

电子运维管理系统硬件由数据库服务器/WEB服务器、接口服务器、存储设备以及相关网络连接设备组成,系统的网络拓扑图如图2所示。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

图2.系统的网络拓扑图

四、系统软件体系结构

4.1 系统软件体系结构——三层B/W/S模型结构

电子运维管理系统体系架构采用了三层B/W/S模型结构,形成了数据层、业务管理层、业务呈现层,如图3所示。

数据采集层主要完成对电子运维管理系统原始数据动态的采集;业务管理层对数据进行映射、变形、汇总、分析等工作;业务呈现层主要是根据客户前端发出的请求对数据进行相应的处理并呈现。

系统采用程序处理逻辑与处理程序分离技术,每个逻辑层次都提供相应的基础功能模块,使系统条理清晰、性能优化,更具可扩展性,使得系统具有更好的扩展性和易维护性。

4.2 三层B/W/S结构的优势

采用了三层B/W/S模型结构使得在WEB访问下降低了数据库服务器的负担并提高了性能;同时由于在业务管理层实现了业务功能,使得对业务的变化只需调整业务管理层的相关构件,大大提高了系统的可管理性。

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

在系统的安全性方面,三层B/W/S结构也较传统二层C/S结构有重大的提高,使得对权限的管理上升到业务功能级的控制而不是数据级的控制。

另外,三层B/W/S结构更适合在分布式广域网环境下运行,可以更有效地节约传输带宽。

五、系统软件功能模块介绍

电子运维管理系统由个人运维门户、作业计划管理、考核管理、大客户工单管理、工程管理、运维成本管理、综合接口平台等模块组成。

5.1 个人运维门户

个人运维门户相当于电子运行维护系统的“桌面”,主要是采用“以人为本”的理念进行设计,针对个人个性化的服务提供的一个网上工作平台,用户只要进入电子运行维护系统,所有最新的信息,包括待办事宜、已办事宜、公告通知、日程安排等等都一目了然,而且通过个人运维门户就可以办理所有未办的事情,极大地提高系统使用的方便性,所有与自己有关的相关工作通过该模块可以得到统一的处理,同时本模块也是进入其它功能模块的“快捷通道”。

在个人运维门户中,用户可以根据个人的喜好进行设定,如待办事宜、已处理事宜、日程安排、便签、个人信息管理、工作提示等等。

图3.电子运维管理系统软件体系结构

5.2 运维成本费管理

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

主要提供维护成本申请,运维成本相关配置管理,统计报表等功能。

5.3 工程项目管理(含大修理)

该模块主要实现工程项目的管理、流转、查询和统计等功能。包含以下子模块:项目管理、项目建立、项目查询、合同查询、项目统计、KPI和报表管理、维护成本管理和组织架构管理等。

5.4 工作计划管理

工作计划管理主要包括工作计划的制定、审批、分发确认、执行反馈、审核和归档等全过程,是对运维各部门在维护工作计划的制定和实施过程进行监控和管理,同时为考核提供依据。

5.5 大客户工单管理

随着通信市场竞争的日益激烈,对客户的服务水平及客户对运营商的响应速度的满意程度越来越成为拉动企业效益的重要因素。为留住对企业提供更多贡献的大客户,必须加快实现大客户故障处理的响应时限,以提高大客户服务工作的质量和水平。

5.6 考核指标管理

运维管理是对服务开通、服务质量管理等系统的数据进行采集,主要提供各类考核指标和报表的查询、统计功能。应提供灵活、全面的统计方式,满足工作量统计、工单统计等各种考核指标相关信息的统计。

主要提供工作量统计、工单完成情况统计、考核指标和报表等功能。

5.7 系统管理

电子运维管理系统本身是一个大的计算机网络系统,运行了多个功能模块和应用程序。为了保障系统的正常运行,需要确保组成系统的各个子系统、应用程序的性能,因此引入了系统管理功能对系统功能进行管理,同时系统管理功能也是电子运维管理系统中起支撑作用的重要功能。

5.8 系统接口管理

OFweek通信网 – 中国通信行业门户 OFweek通信网 – 中国通信行业门户

图4.电子运维管理系统功能模块

一个系统孤立存在是没有任何价值的,对电子运维管理系统而言,电子运维管理系统主要定位于生产运维的工作管理,作为重要的后台支撑系统之一,必须拥有强大丰富的接口功能,提供开放、标准、规范的接口,除了与当前已经存在的系统接口之外,还能够扩充以便将来与在建、未建的系统接口。

六、结束语

电子运维管理系统提供一个统一的IT基础架构,通过电子运维管理系统和各专业网管系统互联成为跨专业综合网络运行分析、网管系统互通的平台;成为与其他部门沟通联系和数据共享的平台。促进电信运营商基层网络维护人员实现面向运维工作流的生产作业任务的量化管理。可以使管理人员实时掌握网络的运行维护状况,及时指导、组织、协调和督促网络的运行维护工作,使运行维护的工作流程实现端到端的自动化闭环管理。

电子运维管理系统最终实现了运维管理扁平化、运维信息化、工作流程化的目标。

电子政务运维 引入服务总包机制 篇3

1.电子政务往往建设周期长,而IT技术发展速度快、专业性强,导致了电子政务中各类信息技术以及技术标准不统一,全面掌握并应用各类信息技术的综合外包服务商很少,限制了选择外包服务商的范围。

2.甲方往往选择系统建设方承担运维服务,导致系统服务方很多,而且水平参差不齐,可是电子政务往往是网状结构,各种信息流互为共享,某个系统运行良好并不能保证整个电子政务的绩效。

3.风险控制不力,主要体现在技术更新导致的技术风险、人员更换导致的人员风险、公司变更导致的系统风险、运维外包导致的安全风险等。

在电子政务建设阶段,项目总包已经得到了广泛的实践,特别是那些关系国计民生、规模巨大、复杂的电子政务建设项目。电子政务进入运维和应用阶段后,是否可以采用服务总包的工作机制呢?答案是肯定的。

服务总包与

相关各方的关系

所谓的“服务总包”,就是甲方选择具有专业资质、技术水平和管理能力的外包服务提供商作为总包方,协助甲方负责电子政务运维规划、体系建立、过程监控和持续发展,协助甲方整合、管理服务资源,提高服务效率和质量,协助甲方管理好电子政务绩效。

服务总包的工作机制,是现阶段我国电子政务现状下组织利用外包资源的有效工作机制之一,它既可以帮助甲方应对电子政务运维管理的专业化、规范化问题,又可以解决乙方在运维执行层面的流程和效率问题,给电子政务运维管理带来了深刻变化。

服务总包工作机制的建立首先需要在甲方、乙方(服务总包和服务分包)之间重新分配和调整运维职责。运维工作中,服务总包处于甲方和服务提供者之间,需要处理好与其他各个方面的关系。

1.服务总包与甲方之间的关系。甲方是电子政务运维管理体系的决策者,服务总包是为甲方提供决策的“智囊团”和运维决策落地的规划者、组织者,二者之间的关系类似于股份公司的“董事会”和“总经理”。甲方制订工作范围,授权服务总包在职责范围内展现自己的规划能力、管理能力、监控能力和持续改进能力,为甲方整合相关资源,确保电子政务的绩效。甲方负责对服务总包进行管理和考核,不再直接管理各个服务分包方,而是通过服务总包实现对服务分包进行管理和考核。

2.服务总包和服务分包之间的关系。在运维决策、运维管理、运维执行三层的管理体系中,服务总包工作在运维管理层,服务分包工作在运维执行层,二者之间的关系类似于一个企业中的“总经理”和“事业部”。在服务总包工作机制中,服务总包与服务分包之间是管理与被管理、指导与被指导、培训与被培训、考核与被考核的关系。服务总包制订服务流程和规范,服务分包按照服务流程和规范执行运维工作任务,同时接受服务总包的监控和指导。

3.服务总包和第三方服务提供商之间的关系。在为甲方提供服务的各方中,除了服务总包和服务分包外,还存在一些第三方的服务提供者,主要是专业服务或者产品的提供商,如软件开发商、设备供应商等。在服务总包工作机制下,针对第三方提供的服务和产品,由服务分包负责直接管理,服务总包通过建立统一的供应商管理流程和规范,制订统一的服务质量标准来确保这些服务提供商提供的服务是客户需要的,但不对这些服务提供者直接管理。同时,在对服务分包的考核中,将第三方提供服务的有效性纳入对服务分包的考核内容中。

服务总包的定位和职责

“站在甲方的视角管理好乙方的运维工作”是服务总包的基本定位,“以服务甲方取得电子政务绩效为工作目标,以所有外包服务资源管理对象,以整个信息网络系统为管理内容”,实现电子政务运维管理的科学化、规范化是服务总包的工作目标。在具体的运维工作中,服务总包需要承担以下三个角色:

1.运维业务咨询者。服务总包需要精通甲方业务,能够熟练应用各类信息技术,并与甲方的业务进行深度“融合”;服务总包需要精通IT服务管理的相关管理理论和方法,协助甲方用科学的方法管理电子政务运维。服务总包需要有足够的服务管理实践和经验,能够根据甲方的需要“量身定制”并构建运维管理体系。

2.运维执行的管控者。服务总包是整个运维管理体系的“桥梁”和“纽带”,是运维管理信息从上到下、从下到上的“传递者”,甲方的运维决策如何得到有效的执行,需要服务总包方进行详细的任务分解,制订详细的工作计划,建立完善的沟通协作机制,同时针对运维过程,服务总包要承担管控的职能,在了解业务需求的基础上整合、协调各方资源,制订服务流程和规范,确保工作效率和服务质量。

3.运维绩效的监督者。展现并监控运维绩效,是服务总包的主要工作内容。

根据服务总包的定位和角色,在电子政务运维工作中,服务总包的具体职责应该包括运维需求规划、运维管理体系构建、运维过程管控和运维持续改进等几个方面。

1.运维需求规划。主要工作内容有:按照甲方的工作要求,详细梳理运维服务需求,并制订完整的电子政务运维规划;协助甲方明确运维服务范围;协助甲方制订服务质量标准等。

2.运维体系构建。主要工作内容有:运维管理组织机构的建立和运维服务人员分级、定岗定责;制订和完善运维服务流程和规范;开发或选择运维管理工具等;制订完善各项运维管理制度,如沟通制度、考勤制度、协作制度等。

3.运维过程管控。主要工作内容有:服务台的构建和管理;服务事件跟踪、反馈和回访;运维服务流程监控;服务质量监控;运维管理体系运行监控等。

4.运维持续改进。主要工作内容有:运维人员技能、业务培训和提高;服务流程的改进和完善;服务工具的开发和推广;服务制度的建立和改进;服务质量的完善和修订等。

运维需求规划

“服务产品化”的运维管理理念是整个运维管理的主线,是电子政务运维需求规划的主要内容,也是服务总包方的主要职责。

总体上看,运维需求可以分成两个层面,一是业务运维需求,一是运维管理需求。业务运维需求的服务对象是整个信息系统,包括物理环境、网络、系统、数据、信息安全等各个方面,属于技术运维范畴;运维管理需求的服务对象是整个管理体系,包括体系建立、服务流程、服务规范、管理制度、绩效管理等,属于技术管理范畴。具体工作包括如下几个方面:

首先,将运维需求分类。一般情况下IT运维服务主要有IT基础设施运维类、应用系统运维类、内容信息运维类、网络接入服务类和安全管理服务类等。IT基础设施运维类以信息化资产为基础,其工作目标是保证设备完好;应用系统运维类是以提供的信息服务为基础,其工作目标是确保业务应用;内容信息运维类以信息内容为基础,其工作目标是确保信息可用;网络接入类以提供网络或者带宽为基础,其工作目标是确保网络畅通;安全管理类是以信息安全为对象,其工作目标是实现网络信息安全。

其次,根据各类运维需求进行服务产品化封装,形成完整的信息服务产品清单(服务目录)。IT基础设施运维以信息化资产为依据,封装成一个独立的信息服务产品,资产同时也是应用系统运维的“实体”依据;结合运维实际,应用系统运维类一般分为运维管理、业务支撑、系统保障、应用支持、安全运维、终端管理等六个细类,整个信息系统从物理环境到业务应用软件,按照技术特点封装成一个个信息服务产品,并归属于上述各个产品细类中,同时针对运维管理相关的内容(包括服务总包的职责)也封装成信息服务产品,归属于运维管理细类中;内容信息运维类单独一类,由信息内容相关的信息服务产品构成。网络接入和安全管理类可以独立封装成信息服务产品。

最后,以信息服务产品为基础,确定每个信息服务产品的运维目标和业务目标,在及时性、准确性、安全性等几个方面设定量化的质量指标,作为服务质量的考评标准和依据(SLA)。IT基础设施和应用系统运维服务有监控类服务如异常报告及时率等;日常维护类服务如维护作业计划的即使完成率、故障隐患发现率、问题解决率等;维修保障类服务如服务响应及时率、故障修复及时率等;内容信息服务如检索成功率、响应及时率等;网络接入服务如平均响应时间、问题解决率等;安全管理服务如漏洞扫描覆盖率、安全报告呈报及时率、安全事件次数等。

构建运维体系

以甲方电子政务运维目标为核心,整合甲方、服务总包方、服务分包方、第三方服务提供者等各方的服务资源,构建统一的运维管理体系是服务总包的核心职责。在运维决策、运维管理和运维执行体系三层设计中,运维管理委员会和服务台的组建是非常重要的。

1.运维管理委员会。由甲方授权服务总包组建,成员是各个服务分包方的项目经理,服务总包的项目经理为运维管理委员会主任,可采用每周一次例会方式的工作沟通机制。在运维管理体系的三层结构中,运维管理委员会是运维管理层面的“枢纽”,采用服务总包负责制。

2.服务台。由运维管理委员会决定是否组建,由各个服务分包方的一线工程师构成,由服务总包方负责管理,并安排人员出任服务台台长。服务台既是运维执行层面的信息“枢纽”,也是面向服务对象的“窗口”。

运维管理委员会和服务台工作机制是整个运维管理体系的两个“驱动器”,是运维决策与运维管理、运维管理与运维执行之间的协调、合作和沟通机制。

运维过程管控

运维过程管理的科学化、规范化,是服务总包管控能力的体现,也是电子政务运维控制风险、提高效率、实现绩效的重要保障。服务总包需要在资产、监控、安全、流程、综合、外包六个维度加强对运维过程的管控。

1.资产管理:确保实现甲方的信息化资产安全。在资产核查、资产标识、资产置换、资产保管、资产质保等各个方面加强监控,实现“账账相符、账物相符”的工作目标。

2.监控管理:及时了解目前信息系统的运行状态。需要借助专业的管理工具对信息系统运行状态的实时监控,在核心节点、核心应用、核心设备、核心数据等几个方面加强监控,确保信息系统安全、稳定运行。

3.安全管理:确保甲方的网络信息安全,包括物理安全、网络安全、系统安全、应用安全和数据安全。

4.流程管理:确保服务过程提高工作效率。基于ITIL等科学的方法论设计服务流程,也包括甲方应用信息技术支撑业务的相关流程,如视频会议、数据修正、业务交流等。

5.综合管理:支持甲方的管理决策。在资产管理、监控管理、安全管理、流程管理和外包管理的基础上,监控IT整体运维信息统计分析。

6.外包管理:实现运维过程和运维结果的“透明”,加强对运维结果和过程的监控。

运维持续改进

建立电子政务可持续发展的工作机制是服务总包的工作目标,也是甲方电子政务运维外包的基本目标。为确保这一目标的实现,构建全方位、多层次的绩效管理体系是必不可少的。

甲方对服务总包的绩效考核、服务总包对服务分包的绩效考核层级递进的绩效管理体系的建立是整个运维管理体系中的重要组成部分。总体上看,电子政务运维绩效管理体系指标可以设定为三个部分:

1.运维体系运行指标。这是站在整体运维体系运行质量角度进行考核,反映运维体系的效果,包括资产、应用、安全、知识、数据等各个层面,总体上展现运维的绩效情况、技术为业务提供支撑情况、技术与业务的融合情况等。

2.服务流程绩效指标。这是站在服务流程的角度,针对运维执行进行绩效考核,反映运维体系的效率。流程设定和运行的科学性,直接影响了运维体系的效率。

电子智能数据中心的设计和运维 篇4

1 电子智能数据中心的设计原则

1.1 实用性

实用性是电子智能数据中心相关功能设计的最主要特性, 电子智能数据中心的相关设备设计, 包括存储设备、主机以及服务器等众多设备的设计, 都应该满足实用性的基本要求, 并适应企业的使用需求。同时, 还应该考虑最新技术的稳定性与实用性, 保证系统在应用过程中不仅要实现性能的提升与功能的拓展, 还要实现稳定的运行。

1.2 安全性

对于电子智能数据中心安全性的实现主要包括三大方面, 分别为硬件设施的安装、数据信息的安全以及系统应用性能的安全。数据中心要严格遵守安全性的相关原则, 在最大程度上降低设备故障而造成的系统停机现象, 降低企业为此付出的经济损失。与此同时, 在数据中心的设计过程中, 还应该增强信息安全制度的建立, 提升企业内部数据信息的安全性。

1.3 可靠性

电子智能数据中心相关设备的运行应该是稳定、可靠的, 其不仅需要满足企业运行过程中对于数据中心的工作要求, 还要实现自身运行的可靠性。对于电子智能数据中心业务处理功能的设计不应该具有独立性, 而是要保证系统整体功能的可靠性, 例如:系统能否支持大容量的数据输入、能否处理复杂的业务工作以及在特殊环境下能够实现自身的运维与风险规避等, 这是数据中心可靠性的具体表现。

1.4 可拓展性

电子智能数据中心的建设应该顺应时代发展的潮流与方向, 在设计工作中, 应该保证功能的可拓展性以满足业务变化的需求。例如在数据中心需要处理更多业务的时候, 其可以在原有的基础上增加必要的内存与CPU等, 还可以通过增加处理节点以提升数据中心的性能, 而不需要对系统的整体结构进行调整, 保证系统的稳定运行。

2 电子智能数据中心的设备运维措施

2.1 实现设备运维的精细化管理

要想实现对设备运维的精细化管理, 就需要通过必要的先进技术对数据中心的全部环境、设备以及软件的运行情况有一个清楚的了解, 即实时掌握电子智能数据中心运行的全部参数, 实现企业日常业务处理的自动化与智能化, 尽可能做到在危机发生前具有一定的预报, 在危机发生时能够具有必要的预案, 在危机发生后能够进行相关的记录与分析。而要想做到这些, 就需要做到对数据中心的全面、集中控制, 实现对数据中心全体设备的精细化管理。电子智能数据中心的精细化管理需要的运营数据包括环境参数、设备数据以及安全指数等。环境参数的种类数量不多, 包括大气温度、空气湿度、风速以及风向等环境数据。而设备参数则是指中央空调系统、冷风机以及水塔等电网企业基本设备的相关数据, 这些数据具有很大的复杂性, 就以中央空调系统来说, 其包括的空调设备数量就高达几十个, 因此设备参数的管理数量是十分巨大的。安全参数则主要包括外来入侵监测、消防控制以及视频监视等。对于电子智能数据中心设备的精细化管理, 就要实现对这些参数的全面掌握。

2.2 构建数据中心全寿命周期的管理模式

在一般情况下, 电子智能数据中心的使用时间都较长, 在不同周期数据中心的管理内容与管理要求也大不相同。因此, 对数据中心管理阶段的划分与管理模式的确定, 是管理工作开展的前提与基础。在对数据中心寿命周期进行分析时, 可以适当参考国外具有丰富管理经验国家的数据中心管理模式, 然后根据我国数据中心的实际发展情况, 进行合理的调整与修改, 以满足我国数据中心的管理需求, 达到更好的设计效果。目前, 我国的数据中心寿命周期的管理模式主要是从工程的设计阶段开始, 到运营维护阶段结束。该种类型的管理模式相较于传统的管理模式而言具有很大的进步, 传统的管理模式并未对项目使用期间的设备运维进行必要的管理, 因此不具备对于设备运维的全面性。而新型的管理模式囊括了工程的全部阶段, 实现了对于设备运维工作的全面管理。因此, 构建数据中心全寿命周期的管理模式对于企业发展而言具有不可忽视的重要作用。

2.3 增强对于设备运维工作的整体统筹规划

电子智能数据中心是企业运行的基础, 是企业日常工作的支持, 能够满足企业发展的实际需求。近些年来, 企业的相关部门只重视对于电子智能数据中心功能的拓展与实际问题的解决, 却从未从整体角度对数据中心运维工作的质量进行必要的研究。而在日常的设备运维工作中, 不仅可以利用成熟的技术、智能化的监控设备实现对电子智能数据中心的全面管理, 并且对于数据中心的容量管理也可以进行一定的监控。对于容量的管理, 需要对设备的数量、使用情况以及性能等数据进行全面的掌握, 只有掌握了这些基础的设备数据, 才能为设备运维工作的整体统筹规划奠定一定的基础。除此之外, 长期的设备监控与数据搜集能够为后期的数据中心管理以及运行情况评估提供必要的数据, 保证运维工作筹划的可靠性与科学性。总而言之, 增强对于设备运维工作的整体统筹规划对于设备运维工作质量的提升具有不可忽视的重要作用。

3 结束语

随着电网业务的复杂化, 对电子智能数据中心的设计和设备运维工作提出了更高的要求, 其已经引起了电网企业相关部门与社会各界的密切关注。我们应当加大对其的研究力度, 做到科学设计, 保证设计的实用性、安全性、可靠性及可拓展性, 并在日常的设备运维工作中, 加大管理力度, 做好电子智能数据中心的设备运维工作, 使电子智能数据中心更好的发挥其应有的作用。

摘要:本文主要针对当下电子智能数据中心的设计原则, 对增强其设计的实用性、安全性、可靠性以及可拓展性进行了简单的介绍, 并提出了相关的电子智能数据中心的设备运维措施, 其中包括实现设备运维的精细化管理、构建数据中心全寿命周期的管理模式以及增强对于设备运维工作的整体统筹规划等, 希望能为我国电网企业的发展提供一定的参考作用。

关键词:电子智能数据中心,设计,设备运维

参考文献

[1]盖卫东.国网某数据中心机房智能化系统工程的实施应用[J].智能建筑, 2010 (06) .

电子运维系统 篇5

维管理体系研究

1,杨龙频○1,何祺○1,杨慧清○1,矫涌本○1赵 飞○

△摘要:

在分析国内外电子政务运维现状、实践与发展趋势的基础上,结合ITIL理论的全球最佳实践和卫生部电子政务建设现状,探索基于ITIL的卫生部机关电子政务运维服务管理体系模式设计、基于ITIL的电子政务运维服务体系设计和基于ITIL的卫生部运维费用管理评估方法。

关键词: ITIL , 电子政务, 运维管理体系

中图分类号 :TP399-C

2文献标识码:A

Abstract: On the basis of analysis of the operation and maintenance of the status quo, practice and development trends of e-government at home and abroad, combined with global best practices of itil theory and e-government construction situation of the Ministry of Health, we explore the system and mode of operation and maintenance service management of the Ministry of Health and design a evaluation method of operation and maintenance expense management of the Ministry of Health.Keywords: ITIL, E-government, System Operation And Maintenance

1引言

“电子政务”是政府在国民经济和社会信息化的背景下,以提高政府办公效率、改善决策和投资环境为目标,将政府的信息发布、管理、服务、沟通功能向互联网上迁移的系统解决方案。同时也提供了结合政府管理流程再造、构建和优化政府内部管理系统、决策支持系统、办公自动化系统,为政府信息管理、服务水平的提高提供强大的技术和咨询支持。发展以政府为主导的电子政务,将给政府管理体制和管理方式带来深刻变革,具有积极的现实意义和深远的历史意义。

随着卫生信息化近20年的发展,卫生部电子政务也已具有一定的规模,形成良好的软 硬件基础,发展环境逐步完善,部机关建立了与互联网逻辑隔离的局域网网络和与互联网物理隔离的涉密网络。在应用系统方面,建设了应急指挥、网络直报、数字认证、门户网站、基金项目:2011年卫生统计与信息化课题研究项目“卫生部信息系统运维服务管理体系研究”(项目编号:2011-01-04-8)1中华人民共和国卫生部统计信息中心,北京市,100044 ○作者简介:赵飞(1982-),男,硕士学位,研究方向:卫生信息化;E-mail:zhaofei@moh.gov.cn 通讯作者:矫涌本(1965-),男,硕士学位,处长;研究方向:卫生信息化管理,信息安全。△通讯作者 医疗救治、财务管理、公文运转、档案管理和内部OA等一批业务应用系统。在安全方面,严格按照国家有关信息安全等级保护的要求,全面实现信息数据在使用、传输、存储等方面 的安全保护及业务系统的持续运行,达到等级保护的安全防护要求。

随着信息化对电子政务支撑工作需求的日益迫切,安全、有效的业务系统运维任务日益艰巨,业务系统的运维管理,不仅要及时检测与发现业务支撑系统中存在的各种问题或潜在 的问题,保证系统正常运行和业务的正常开展;更重要的是通过对业务系统的运维,能够发 现、总结和挖掘业务管理过程中存在的问题,明确管理重点、优化管理流程、明确管理岗位与职责,使业务系统、管理与人员通过流程有机结合。如何更好解决政府部门对电子政务运维管理要求与运维管理普遍存在问题的矛盾,成为当前重点研究的课题。

本文在对ITIL理论研究的基础上,结合卫生部电子政务运维管理的现状,提出了基于ITIL的卫生部机关电子政务运维服务管理体系和模式设计、基于ITIL的卫生部运维费用管理评估方法。

本文的组织结构为:第二部分描述了ITIL的基本理论,第三部分阐述了基于ITIL的卫生部机关电子政务运维服务管理体系和模式设计,第四部分阐述了基于ITIL的卫生部运维费用管理评估方法,第五部分为结论及展望。2 ITIL理论概述

ITIL(IT Infrastructure Library)是CCTA(英国国家计算机和电信局)于20世纪80年代末开发的一套IT服务管理标准库,它把英国各个行业在IT管理方面的最佳实践归纳起来变成规范,旨在提高IT资源的利用率和服务质量。2.1 ITIL核心框架描述

ITIL是根据实践而不是根据理论开发的,ITIL开发的过程实际上就是CCTA组织收集和分析各种组织解决服务管理问题方面的信息,并找出那些最有益的做法的过程。

ITIL2.0的主体框架被扩充为6个主要的模块(图一),即服务管理(Service Management)、业务管理(TheBusiness Perspective)、ICT(信息与通信技术)基础设施管理(ICT InfrastructureManagement)、应用管理(Application Management)、IT服务管理实施规划(Planning to Implement Service Management)和安全管理(SecurityManagement)。

组织业务目标IT定位及运维目标管理目标层管理方式组织人员组织模式层运维评估管理管理制度管理流程制度规范层资产管理业务服务管理服务展示集中服务管理技术支撑层

图一 ITIL体系结构图

图二 电子政务运维管理体系模型图

2.2 ITIL的特点和作用

ITIL并不是一个方法,而是一套通用框架体系,该框架体系可以指导我们规划流程、定义角色、职责和各流程间的关系,以及应使用什么样的术语进行沟通等。ITIL并不是一个告诉你如何实际运用最佳实践的指南,每个组织必须根据ITIL的原则和自己的实际情况来设计适合该组织自己的流程。

ITIL的主要特点有:一套IT组织用来计划、研发、实施、运维高质量IT服务的最佳实践方法,而非抽象的理论;人员、技术和流程的和谐统一;与技术、行业无关,具有普适性;强调量化管理和持续性改进。基于ITIL的卫生部机关电子政务运维服务管理体系和模式设计 3.1 综述

在深入研究ITIL理论体系和对大量电子政务实践的基础上,我们提出一套基于ITIL的电子政务运维管理体系四层架构模型(图二)。电子政务运维管理体系四层架构模型涵盖管理目标、组织管理模式、制度规范体系、技术支撑体系等四个层面的内容。

3.2 管理目标层

电子政务运维管理体系的建立要面向业务,以业务需求和目标为出发点,确保在目标层面,IT与业务的融合。应对卫生部现有四大重要信息系统(卫生部突发公共卫生事件应急指挥与决策系统、卫生统计网络直报系统、卫生部数字证书认证信息管理系统和卫生部网站系统)进行了调研,明确相应业务需求,制定运维管理策略。3.3 组织模式层

在集中统一的电子政务运维管理模式下,按照电子政务运维管理任务科学设置或调整组织机构,划分任务、角色、岗位,合理配置电子政务运维管理资源,达到人、工具、流程的有机融合。现卫生部电子政务运维服务由卫生部统计信息中心网络与应用处统一决策规划,划分人员任务角色岗位,合理配置电子政务运维管理资源。3.3 制度规范层

从管理角度制定的用来规范电子政务运维和服务工作的准则,建立电子政务运维管理过程中各个参与要素(人、流程、工具)的《信息安全方针》、《信息系统等级测评管理规定》等管理制度等,建立了工程师事件管理流程图、用户事件管理流程图、服务请求流程图、配置管理流程图等工作流程图,初步探讨了运维管理评估方法,实现精细化管理。3.4 技术支撑层

技术支撑体系是IT运维管理的实现手段,制度规范体系的具体落实有赖于技术支撑体系的技术支持。我们完成了以完善外网机房拓扑为核心的资产梳理工作,建立基础设施的集中管理平台。加强对系统的设备情况、性能指标、应用进程、系统缺陷等方面的监控,引入了包括锐捷网管平台及网神安管平台的业务服务管理平台,可以监控业务服务状态,安全设备、网络设备及服务器状态等信息。基于ITIL的电子政务运维服务体系设计

电子政务运维服务包括电子政务基础设施运维服务、电子政务应用系统运维服务、安全管理服务、网络接入服务、内容信息服务以及综合管理服务。

电子政务运维服务管理流程是指为了支持电子政务运维服务的实现和提供,以确定的方式执行或发生的一系列有规律的行动或活动。参与电子政务运维的各方为支持电子政务运维服务目标所使用的信息化工具,是支撑电子政务运维服务实施的平台。4.1 电子政务运维服务模型

电子政务运维服务模型由电子政务运维管理对象、电子政务运维服务提供者和电子政务运维服务使用者三个层面组成。电子政务运维管理对象主要包括电子政务资源和使用电子政务服务的电子政务用户两类元素;电子政务运维服务提供者由电子政务运维服务支撑系统和电子政务运维人员构成;电子政务运维服务使用者主要是指电子政务运维服务的使用和管理人员。构建电子政务运维服务模型如图三所示。

图三 电子政务运维服务模型

4.2 电子政务运维服务模式

在实际的运维过程中,由于参与电子政务运维活动的往往是多个单位或者部门,而且这些单位或者部门往往承担模型中的一个或者几个角色,这就构成了多种多样的电子政务运维服务模式。典型的电子政务运维服务模式存在如下几种形式:

(1)自运维模式:电子政务资产拥有单位自行负责对所拥有的所有电子政务资源的运维工作。

(2)完全外包运维模式:电子政务资产拥有单位通过与其他单位签署运维外包协议,将所拥有的全部电子政务资源的运维工作外包给其他单位,即外包单位为本单位提供电子政务运维服务。

(3)混合运维模式:电子政务资产拥有单位对所拥有的一部分电子政务资源自行运维;同时,通过与其他单位签署运维外包协议,将所拥有的另一部分电子政务资源的运维工作外包给其他单位。

根据电子政务网自身的管理特点,以及电子政务基础设施和应用系统的实际特点、自身组织机构设置情况,卫生部电子政务运维采用混合运维模式。在该运维模式下,根据运维服务是否涉及各单位的核心业务、关键任务等因素,对外包服务管理的具体要求各不相同。对涉及核心业务或关键任务的外包服务,需要对外包服务的过程和结果进行精细化管理;对只涉及非核心业务和非关键任务的外包服务,只对外包服务的结果进行粗放型管理。5 基于ITIL的卫生部运维费用管理评估方法研究

电子政务运维费是指为保证预算单位的信息技术基础设施和业务应用系统安全运行以及信息资源共享利用,而必须支付的硬件运维、软件运维、耗材与工具、系统管理和信息资源开发利用等方面的支出。

根据卫生部电子政务部署的现状,为了更好的做好电子政务运维费用预算与管理,构建了构建了卫生部电子政务运维经费管理流程(图四),从而使电子政务经费管理更精细化与科学化,进一步提升运维管理能力。

图四 电子政务经费预算标准模型图

图五 电子政务经费预算标准模型图 卫生部电子政务运维经费管理流程主要由运维预算标准、运维经费申请、运维经费执行、运维工作总结等组成,其中确定运维预算标准是其核心。

我们构建的卫生部电子政务运维预算参考标准模型(图五)由以下六个部分构成:电子政务运维费用标准、电子政务运维服务内容标准(预算口径分类)、电子政务运维服务工作量核算标准、电子政务运维备件工具采购费用标准、电子政务运维人工成本核算标准、电子政务运维其他因素预测标准。5.1 电子政务运维费用标准

信息化运维费用由备品备件等软硬件采购费用和提供日常巡检、终端维护、硬件维护、软件升级、系统相关、安全管理、网络维护、资产管理等技术维护服务所发生的技术运维人工费用两大类费用构成。

5.2 电子政务运维服务内容标准

电子政务信息化运维服务内容分为如下十大类:备品备件采购类;日常巡检类;终端维护类;硬件相关类;软件相关类;系统相关类;安全管理服务类;网络管理类;资产管理类、综合事务类。

5.3 电子政务运维服务工作量核算标准

根据上述对运维对象的分类,标准细化分解了各运维对象具体的运维任务,并针对具体的任务明确应提供的(最大)工作量。

各单项任务工作量根据完成该任务的运维人员级别、周期、运维次数、要求作业时间汇总计算得出,再结合该级别运维人员的人工费用标准,计算出完成该任务的运维费用。

根据卫生部机关2011年3月——2011年12月期间9个月的日常运维的工作内容数据统计得出,日常运维的工作时间为60小时。5.4 电子政务运维备件工具采购费用标准

备品备件采购费用按照信息资产比例系数法计算,可以根据历史经验数据以及实际发展需要,确定备品备件采购费用占信息资产的比例标准(可给出统一的比例,也可根据不同类型的资产分别给出备品备件采购费用比例)。

运维备品备件总采购费用由各类对象的备品备件采购费用加总得出,两项费用和为运维服务总费用。

5.5 电子政务运维人工成本核算标准

由于不同的运维任务对运维人员的要求不同,运维服务人工成本费用同具体任务一一对应,而且多数运维任务需要初中级人员完成,因此,年工资是主要的度量标准,以年工资为基准,根据工资转换系数,明确月工资和小时工资。

按照运维总人工费用的计算方法,运维任务、运维对象、模块、大类逐级加总,最后得出运维总人工费用。

5.6 电子政务运维其他因素预测标准

其他因素主要是指因设备故障、环境变化等因素导致的额外支出。如机房精明空调发生故障,会导致机房环境温度过高,从而会导致其他应用设备因高温而损失,将会产生预算外的软件数据恢复及维修费用支出;在预算中,需设定一定的资金比例作为该项预算经费。6 结束语

在本文中,我们对电子政务的发展过程进行了阐述,特别是对卫生信息化,卫生部电子政务系统的现状、发展进行了说明。根据卫生部电子政务现状,提出了在ITIL框架基础上构建电子政务运维管理体系模型、运维服务体系模型、运维预算管理评估模型,不断优化部机关信息系统运维流程,从而加强电子政务运维管理能力,实现部机关信息系统运维管理从粗放型向科学化方向转变。

为了更好的利用本论文的研究成果,后期将重点做好以下工作:将电子政务运维管理体系四层架构模型、电子政务运维经费管理流程和日常的运维工作结合起来,更好的发挥理论对实际工作的指导作用;结合卫生部电子政务现状,进一步完善电子政务运维管理制度,规范运维流程管理。在资产管理、流程管理、人员管理规范化的基础上,加强对各业务系统进行梳理,并进行精细化管理;加强对运维业务人员的培训和检查,打造一支理论基础扎实、动手能力强的运维管理团队和运维实施队伍。

参考文献 宁家骏,周民,杨帆.创新模式以构建服务型政府公共网络平台——关于国家政务外网建设的几点思考[J].电子政务,2008(6):7-10.2 杜波,余益民,孙荣燕,侯刚,屠本伟.政府数据中心的起源、定位和运维外包模式的探讨[J].电子政务,2011(8):97-102.3 夏西平,龙朝阳.基于ITIL的电子政务运维管理研究[J].图书情报工作,2009(19):117-120.4冯汀.基于ITIL的业务支撑系统运维管理研究[M].北京:北京邮电大学硕士学位论文,2007.5 刘颖.我国电子政务建设发展现状与预测[J].当代通信,2005(9):103-105.6 李长征.中国电子政务运维管理现状与发展趋势[J].电子政务,2008(12):17-25.7 王岚生.在电子政务运维工作中实现科学化和规范化管理[J].2009(1):75-84.8 赵雪芹,叶晶.中国电子政务运维服务现状分析[J].2008(7):1081-1084.9 罗彦玮

周剑.电子政务中面向业务的运维管理与实践[J].2010(11):43-52.10皮人伟.ITIL电子政务服务系统的设计与实现[M].上海:华东师范大学硕士学位论文,2010.11 蒋昱瑜

王楠

电子政务甲方运维管理的全生命周期 篇6

电子政务甲方运维管理是指各政府信息化部门对本单位电子政务运维从运维规划设计、运维实施到运维绩效评价整个过程的管理活动。

各政府部门的电子政务运维应包括运维规划设计、运维实施、运维绩效评价三个阶段,在运维的整个生命周期中,应持续改进运维管理水平和能力。电子政务运维管理全生命周期模型如下图所示。

全生命周期运维管理的主要内容包括:

1、运维规划设计

编制运维方案与运维预算:各政府部门在运维规划设计阶段主要完成运维方案和运维预算的编制工作,根据运维方案和运维预算向财政申请下一年度的运维资金。运维方案应包括本单位运维现状分析,建立运维管理领导组与工作组等组织机构,确定各项运维内容、运维需求、运维目标、运维资金需求和运维绩效考核指标。信息化主管部门和财政部门分别对运维方案和运维预算进行审核批复。

运维招标管理:在得到信息化主管部门和财政部门的审批之后,各政府部门若需将本单位的电子政务运维外包,还需根据各项法律法规进行运维招标,选择合适的运维服务供应商,并与运维服务供应商签订运维服务合同。

2、运维实施

各政府部门应参照国际运维服务标准,结合实际情况,建立一系列符合电子政务运维特色的规范化服务流程和规范,监督运维工作执行情况,协调处理运维工作中的重大问题。运维实施阶段的管理主要包括服务台管理、系统运行管理、重大故障应急预案管理、重大和紧急变更管理、合同执行管理、人员管理和资产管理。

3、运维绩效评价

为保障运维目标的实现以及促进运维管理持续改进,各政府部门每年应定期进行运维绩效评价。各政府部门可聘请第三方咨询机构参与的方式组建运维绩效评价工作组,开展电子政务运维绩效评价工作。运维绩效评价主要内容包括:业务目标的实现情况,业务部门及服务对象(如公众用户)的满意度,应用服务推广情况,运维费预算执行情况,运维的组织管理情况,运维过程的规范化、标准化及改进情况等。

在运维绩效评价工作完成后,要形成評价报告,评价报告作为对单位运维部门及人员绩效考核的依据,以及单位运维预算、管理改善和绩效监管的参考依据。运维外包的单位,其评价报告作为外包商绩效考核以及外包进入、退出的主要依据。

4、运维持续改进

各政府部门运维管理部门应根据绩效评价报告,制定明确的改进方案,经主管领导审核确认,作为下一年度运维规划的一部分,主管领导应监督改进方案的落实。

电子运维系统 篇7

1、目前电子政务运维中存在的主要问题

近年来, 随着信息化建设的深入, 业务应用逐步增加网上运行计算机机房设备和网络基础设施, 服务器、大型主机和客户端等硬件平台, 政务服务器、系统、数据库、中间件等软件平台日益复杂, 用户服务的越来越多, 维护好日益增多的网络和系统等各类设备, 要保证各个应用系统安全顺畅地运行, 加强用户提供良好的服务, 并及时解决出现的问题和故障, 做到网络和用户之所及和管理和服务之所及是电子政务业务能否可靠运行的关键所在。

当前对电子政务运维工作的职责有待进一步清晰。我们狭义上解释“运维”似乎就是纯粹负责信息系统的“运行和维护”, 工作范围仅负责到设备故障维修、系统能够运行的层面不涉及对信息的内容管理, 更涉及不到信息技术与业务工作融合的问题。我们这篇文章所谈论广义上的“运维”应该是在保障信息系统正常运行的前提下, 以服务信息应用为目标, 促进信息技术与业务工作深度融合, 推进信息资源共享。通过电子政务实现“提高行政效率, 降低行政成本, 改进政府工作, 方便人民群众”的根本目的。目前电子政务运维中存在的主要问题主要表现为:一是仅从硬件故障的角度考虑运维问题, 认为处于保修期内的设备损毁由承建公司承担不需要运维工作; 二是认为建设了信息系统就实现了电子政务信息应用意识不强;三是缺乏科学规范的信息化运维管理体系运维工作处于无序状态; 四是缺少信息化运维费预算科目运维费用难以审核;五是没有建立统一运维管理平台体系的理念和设计目标。

2、电子政务运维体系建设需求与目标

2.1 建设需求

各地经过几年大规模的电子政务建设后电子政务公共平台已基本形成, 由于我们前期主要忙于信息系统建设工作, 当有大量软硬件设备和业务应用系统超过原厂商保修期, 需要自己进行运行维护管理时, 才发现运维管理人才缺乏, 现有人员也缺乏电子政务运维管理的经验和知识。所以说当前还处于初级阶段的IT服务管理状态, 应组织规范、管理结构、管理流程和技术支撑方面, 与没有构建一个综合的IT服务管理体系。而网络、用户、设备、系统等的管理和服务分散不关联, 没有实现规范化和流程化, 也没有实现数据信息和知识库的共享。因此, 管理和服务是粗粒度、低效率的, 这种管理模式将越来越难以适应政务信息化的发展要求。因此, 需要梳理服务管理需求、规范服务管理流程, 开发和建设一套科学有效的, 融合组织、制度、流程、技术的IT服务管理体系, 从粗放和分散型管理, 逐步过渡到规范化、精细化和主动式IT服务管理, 使IT服务管理体系成为中心日常工作的重要组成部分, 这不仅对政务核心应用系统顺利运行和应用有重要意义, 也将为支持和推进政务改革提供管理和服务保障。

在面临的新挑战和新任务面前, 电子政务在运维管理、运维流程和运维外包在如下三个方面急需优化提升。

第一, 急需构建集中统一的信息技术服务管理模式和机制。

第二, 急需构建规范化、精细化、主动式的运维管理体系和流程。

第三, 急需在科学方法论的指导下, 运维管理及运维外包的绩效考评工作。

2.2 总体目标

IT服务管理体系建设的总体目标是:树立面向业务服务的IT服务管理理念, 科学合理建立的绩效考核指标, 原来粗放管理向精细管理转变;集中统一实行的IT服务管理模式向集中管理转变;加强建立统一高效灵敏有序服务的IT服务管理平台;加强建立管理服务流程规范标准IT, 职能管理转变流程管理;实用、高效、应用先进的IT服务管理工具, 由被动管理转变主动管理。

一般而言, 制定科学有序的管理流程和规章制度, 加强建立统一的运行维护、客户服务模式和规范, 实施先进的技术工具, 统一搭建高效的IT服务管理平台。管理平台IT服务包括信息展示、服务流程管理、服务台、知识库、集中管理与监控 (网络管理、安全管理、系统管理、存储备份管理、应用系统管理、客户端管理、机房环境管理) 等模块功能和子系统的内容建设。

3、构建电子政务运维体系

3.1 建立信息资产基础数据

建立信息资产基础数据、梳理业务流程, 既是电子政务运行维护预算编制的基础, 也是开展电子政务运行维护管理的前提。按照业务部门、项目来源、信息资产要素等内容指导客户建立了信息资产分类目录和信息资产基础数据库。在业务流程上结合运行维护管理工作要求, 开展业务流程梳理工作, 明确了各业务流程的岗位及职责。同时, 从业务对IT服务需求出发, 梳理运维需求和目标, 细化运维服务内容, 并形成运维服务目录, 明确运维服务级别, 从源头上平衡业务部门对IT服务需求和服务供给之间的平衡。另外, 结合客户的组织架构, 重新建立科学的运维组织架构、以及自行运维和运维外包相结合的管理模式, 做到职责清晰和任务明确。信息资产分类目录和信息资产基础数据库的建立, 以及业务流程的梳理, 为电子政务运行维护预算编制提供了重要的支撑。

3.2 梳理服务管理系统需求, 降低服务成本

根据实际情况制定IT服务管理系统需求说明书, 针对流程平台产品和体系架构各功能点进行详细的定义与说明, 对目前业内流行的平台产品进行评测分析提供分析数据, 并对产品选型决策提供支持;而且对项目的各个功能点的技术和开发风险进行评估和提供相应的解决措施, 也降低实施过程中的风险。别外, 对集成实施和产品选型进行专家审定和把关, 并对各项投资进行预期的绩效评估, 保证把资金用于项目的关键点上, 降低实施成本。

3.3 规范服务管理流程

管理流程是指为达到既定的IT服务管理目的而组织起来的逻辑上有关的有规律性并可重复的活动, 借鉴IT服务管理最佳实践ITIL, 将IT服务管理分为服务支持和服务交付两大部分。通过规范服务管理流程, 可建立快速反应, 优质服务的长效工作机制。

3.4 加强运维外包管理的认识

近几年, 政府信息化建设一般能够得到资金支持但由此增加的机构和人员受到了相关编制的限制, 难以配套落实。纵观发达国家电子政务运维服务外包已成为发展趋势。中办发〔2 0 0 6 ) 1 8号文 ( 关于推进国家电子政务网络建设的意见》) 中指出, 技术支持和运行维护要坚持社会化专业化的方向。实践证明, 服务外包是促进应用的有效途径, 随着信息需求不断增长, 业务融合不断深入. 电子政务运维服务外包也是我国电子政务由发展阶段进入成熟阶段的必然选择。

信息化运维服务外包具有多种组合模式。总体上分为部分服务外包和全服务外包两种方式前者是基于被动式的服务. 后者是基于职责的主动式服务。两者的区别在于前者主要是利用了人力资源后者是人力资源与智力资源并用。

3.5 运维管理系统平台的模块化、分层次设计

借助监控工具和流程管理软件, 建立统一高效的运维管理平台, 运维管理平台的设计采用模块化、分层次的结构。系统采用多层架构、信息总线技术, 具备良好的性能和扩展性, 系统为用户提供了C/S和B/S的两种展现模式, 为不同关注层面的用户服务, 以方便管理人员使用C/S对网络进行专业管理, 运维人员使用B/S对网络进行值班监控。

在组织管理技术上IT基础构架管理是单位内部已存在的各种监控管理工具, 全面向网络一体化管理, 采集IT基础构架中各种管理对象的配置、性能、事件信息, 再这些信息按统一格式处理并分类, 信息统一后的被发送给业务转换管理平台。

管理平台对来自IT基础构架平台的信息进行分析、过滤、筛选, 在转化成IT运维的业务信息发送给流程管理平台。流程管理平台接收来自用户或客户的事件报告信息, 对这类信息自动转化为业务信息, 并和来自IT基础构架的业务信息一起传送给上一级请求处理。

流程管理平台会判别业务信息类别, 不同类别转入相应的流程管理。流程管理平台根据ITIL服务支持管理提供了主要流程模块的功能。网络监控管理包括与资源监测管理、告警监测管理、统一监控展现、报表管理。实现每个流程管理的功能遵照了ITIL服务支持管理的要求。

4、总结

通过建立 符合国际 最佳实践I T I L和国际标 准ISO20000的IT服务管理体系, 持续优化服务流程和服务水平, 解决了系统运维滞后于系统建设、运维管理滞后于业务需求等问题。针对电子政务运维服务管理主体的能力建设, 笔者有以下几个建议:

一是树立电子政务规划、建设和运维服务集约化原则。形成同一部门和地区电子政务运维服务集约管理的局面, 分层次、分角色地开展好电子政务运维服务管理工作。

二是加强电子政务运维服务人力资源管理, 尤其是考核和激励工作。加强运维服务管理人员的培训工作, 统一IT人员服务管理的意识, 培养服务管理的文化。建立面向业务的运维服务管理报告制度, 建立分层次、定量、长效的考核激励机制。

三是合理制定电子政务运维服务管理预算。建立运维成本核算体系, 了解自身资源情况和能力水平。结合实际运维服务需求、业务流程和岗位等因素编制科学细化的电子政务运维服务管理预算。

四是完善运维外包的管理方法。在采取科学成熟的外包管理方法的同时, 考虑外援和外联等多种方法, 克服人力和资金不足的问题, 降低外包风险。促进服务的持续改进。

五、优化运维管理系统平台。运维管理系统平台的总体目标是实现对IT资源的可视、可控、可管理, 从根本上提高运维管理水平, 为业务系统提供有力保障, 加强对IT系统和IT资源的监控和维护能力, 提高维护工作效率, 改善维护工作的质量, 进而保证个系统维护水平的可持续性提升。

参考文献

[1]张友生.信息系统项目管理师辅导教程 (第三版) [Z]2012, 237~245.

[2]IT运维因需而变[Z].http://blog.vsharing.com/riil_itsm/A1425872.html

[3]孙强.电子政务需不需要IT治理[Z].http://www.itgov.org.cn/Item/3977.aspx.1~2.

[4]加强电子政务管理, 提升组织绩效[Z].http://www.itgov.org.cn/Item/3613.aspx.1~2.

[5]探索有中国特色的IT管理之路[Z].http://www.itgov.org.cn/Item/2690.aspx.1~2.

[6]刘晓光, 宁家俊.关于提升我国电子政务运维服务管理成熟度的初步思考[J].电子政务, 2010, (2-3) :42.

[7]董惠亚, 薄剑勇.政务云计算中心运维管理系统的架构研究[J].宁波大学学报, 2012, (03) :25.

[8]谷和启.江苏省电子政务运维管理的思考[J].电子政务, 2010, (2-3) :50.

信息系统运维浅谈 篇8

关键词:运维,信息技术,信息等级保护

0 引言

运维, 是运行维护的简称, 一般是指对一个组织内部已经建成或正在建设的某一套系统 (如空调系统、电路系统、广播系统等) 中的设备、环境、软件、人员、操作等各种要素, 按照一套标准的方法流程、技术手段和制度文档进行日常的操作/维修和综合管理, 确保它们能够正常运作。针对信息系统的运维就被称为信息系统运维, 亦被简称为IT运维。

IT运维诞生于信息化建设中, 且会与之相生相伴, 共同发展。无论单位规模大小, IT运维都会经历一个“运维内容从无到有, 运维对象从单一到混合, 运维广度从简单到复杂”的成长历程。

(1) 起步阶段:台式计算机的使用标志着IT运维工作的萌芽

我国绝大部分单位的信息化建设工作开始于20世纪90年代初, 在这之前对信息化知识的了解一片空白, 对信息化的认知是从认识台式计算机开始的。当时此类设备价格不菲, 所以购买数量稀少 (一般是一到两台, 极少有超过两位数的) , 用途也较单一 (主要用于文件资料打印) 。会操作该设备的员工极其有限, 而真正了解、熟悉计算机的就更少。一般由一名兼职 (由计算机操作员兼) 或专职 (外招计算机专业人士) 的员工负责该计算机及其配套设备的日常维护工作———主要是日常使用和故障维修。此时会相应拟定一个基本的管理制度, 作为确保该计算机及其配套设备平稳运行的依据和保障。

(2) 发展阶段:应用软件的部署开启了IT运维工作的成长之路

信息技术的发展推动了信息技术知识和信息产品的推广普及, 也促进了各单位开展信息化建设的需求和愿望。于是纷纷部署单个应用软件 (采购或委托研发) 使用, 拉开了正式的信息化建设工作。

这些应用软件是对单位内部某个业务流程进行信息化改造, 涉及该流程上的所有岗位和人员, 需要使用的设备和参与的人员都有较大增加, 依靠单个人员进行日常运维管理难度较大, 也不现实。成立一个由多名信息化专业人士组成的专职信息化管理部门来负责成为必然, 这个专职部门的核心工作就是对所有部署的应用软件及其附属设备进行日常维护管理。此时的IT运维工作, 不但管理对象从台式计算机扩展到服务器及交换机等设备, 而且工作内容从单台计算机使用扩展到应用软件操作、数据存储备份、设备维修保养、操作人员管理等方面, 管理难度和广度有了质的变化。

(3) 壮大阶段:全面网络化推动着IT运维工作走向成熟

随着越来越多的应用软件推广, 单位自身的信息化建设工作得到了进一步发展, 被覆盖的部门和员工在逐渐扩大, 甚至出现相互重叠的情况。为减少重复投资, 提高工作效率, 消除信息孤岛, 实现网络化成为必然———建立一个覆盖全部业务流程的内部局域网络。

这个内部网络的建立实现了信息的自动汇聚、数据的自动流通, 促进企业生产效率和经济利益的提升。但是同时也进一步增大了IT运维管理的难度和压力———扩充了如信息安全、网络管理等诸多运维内容和对象。

1 存在的问题

经过多年的持续建设, 截至目前, 绝大部分单位均已建立了一套基本的IT运维管理规范。这套规范从制度、设备、安全、数据、人员、网络等方面指导日常的IT运维工作。运行效果总体上是良好的, 但一些具有普遍性的“通病”依然存在, 未得到较好的解决。

1.1 信息化建设投入“不足”

信息化建设是一个循序渐进的、长期发展的过程, 需要不间断的、持续的投入 (包括知识技术、专业人才、专项资金等) 。但是这种投入不会产生“直接”效益, 只能通过其他部门的“收益”来间接体现, 直观上几乎感觉不到信息化投入带来的“好处”所在, 这就在很大程度上制约了对信息化投入的积极性和主动性。同时降低管理成本的压力始终存在, 使得信息化投入滞后的情况从信息化建设伊始就一直存在且从未彻底解决, 这在一定程度上影响了对IT运维建设的投入, 也妨碍了IT运维管理水平的提高。

1.2 信息化制度建设“不足”

众所周知, “没有规矩不成方圆”。所谓规矩, 就是为确保某一个事情能做成功而制定的规定、规则、做法, 进而演变成相应的制度规章来规范管理。信息化制度就是针对信息化工作制定的“规矩”。每个单位都会制定相应的信息化管理制度, 但执行效果不太理想, 仍存以下不足:

1.2.1 信息化制度执行力方面

由于我国自古以来的“人情社会”的特殊国情, “人情大于法治”思想还普遍存在, “法规遵从”意识还未完全建立起来。加之管理体制和机制的因素 (这点在行政事业单位和国有企业中表现特别显著) , 使得制定的信息化制度在实际执行过程中效果不佳, 特别是有关IT运维管理方面的规章制度执行到位程度不高。

1.2.2 信息化制度更新方面

信息化制度涉及面很广, 内容较多, 制定过程繁琐不易。而信息化人员的能力水平和时间精力是有限的, 已经制定完成的信息化制度普遍存在“高挂上墙、无人问津”的情况。与信息化技术的新发展、信息化管理的新要求同步程度不高, 更新不及时, 甚至出现“一个制度用终身”的情况, 使得制度的“有效”性存在不小的缺陷。

1.3 运维知识分享能力“不足”

基于成本等因素考虑, 单位内部的信息化工作人员鲜有按职数要求配备齐全的, 一人兼多岗的情况很普遍。日常IT运维工作内容较多, 而个人的精力和能力是有限的, 将工作内容分割成不同块, 交由不同人员分别管理是必然的。每个人的知识水平和工作方法各有千秋, 获得的运维知识和经验也不尽相同, 将这些运维知识汇总融合不仅有助于提高IT运维工作效率, 还有利于提升IT运维整体水平。但是由于认识不到位, 以及缺乏必要的投入, 运维知识共享能力建设未能及时开展, 造成了数量众多的“知识孤岛”。

1.4 信息数据备份校验建设“不足”

信息数据包括软件系统 (操作系统和应用系统) 自身的配置数据及其运行的数据, 硬件系统 (服务器、网络设备、计算机终端等) 自身的配置数据, 以及用户的私有数据。这些数据是一笔无形的财富, 它的重要性和价值与日俱增。任何单位的信息部门都应采取必要措施保证它们 (用户自身数据一般除外) 安全。除了采取措施确保存储这些重要数据的介质安全, 一般还会购置专业备份软件 (或利用最新备份技术) 实现对这些重要数据的自动备份。

这种自动备份机制的有效性和可靠性只有通过将备份的数据进行还原才能验证, 但这项验证工作开展情况不太理想, 主要是因为备份数据需要还原到一个与现行应用系统完全一致的环境中才能进行有效性校验, 而搭建这样一个环境所需的投入 (包括软硬件成本、现场环境等) 与建设它的成本相差无几, 这不是每个单位都能承受得了的。如果同时存在多个信息系统, 一旦它们的部署环境和硬件条件不相同, 则由此产生的投入将会是极其巨大的。

2 解决之道

IT运维管理作为保障IT系统业务正常、安全、有效运行的重要工具, 担负着“IT保护伞”的重任。只有及时完善IT运维管理, 才能有效保证信息系统平稳运行、安全有效。

2.1 增加信息化投入

信息化项目从建设开始到“消亡”结束的全生命周期内都需要不停的投入, 交付前是建设投入, 交付后则是运维投入, 而运维投入一般会占整个总额的60%以上。信息化建设是一把手工程, 用通俗易懂的文字、简洁直白的语言向高层领导介绍每一个信息化项目的必要性和必需性, 让他们听懂才会得到支持。有了充足的、充分的投入才能确保日常运维的效率和效果。

2.2 抓好制度建设

一个好的制度, 不仅要体现在内容文字上, 更要反映在执行效果上, 只有真正“落地”的制度才能激励员工的工作积极性。

要使制度真正落地, 可以:一则通过培训、交流等形式宣贯制度内容, 反复“潜移默化”每位员工, 促使制度内容入心入脑, 人人熟知;再则要建立切实可行的奖惩机制, 将奖励和惩罚措施明列于制度中, 并与员工个人的业绩考核挂钩, 通过经济杠杆来促进制度的落实;最后要根据信息化发展的现状, 通过修改稿等形式实时修订各项制度条款, 使其内容体现最新要求, 文字更加严谨, 操作更加规范, 管理更加严格。

2.3 建立知识分享体系

信息化工作人员在日常进行IT运维过程中所获得的知识其实是属于单位的“财产”。但由于人的个体独立性, 使得这份“财产”是保存在员工自己身上, 如不加以集中, 则会变成员工的“私有财产”, 造成单位“资产流失”。建立一个面向全体信息化工作人员的共享知识库可以将员工“私有”的知识转变成“共有”的, 进而成为企业的“知识财富”。

2.4 完善数据管理

数据是存储在介质上的, 故而对数据的管理包括对数据本身和存储介质两方面。日常运维中既要确保数据本身在产生过程中是“干净”的、有效的、真实的, 又要确保存储介质运行状态是稳定的、正常的、安全的。而保护数据安全最有效办法就是“安全防护+数据备份”, “安全防护”是前提和基础, “数据备份”是重点和核心。

“安全防护”通过部署信息安全产品和安全防护措施可以实现, “数据备份”则需借助自动备份机制完成。对于备份的数据进行有效性校验可以采取诸如虚拟化技术等最新信息化技术来实现。

2.5 用好信息等级保护制度

信息安全等级保护制度是一项以信息安全等级保护为核心的国家制度。信息安全等级保护是指对国家秘密信息、法人和其他组织及公民的专有信息以及公开信息和存储、传输、处理这些信息的信息系统分等级实行安全保护, 对信息系统中使用的信息安全产品实行按等级管理, 对信息系统中发生的信息安全事件分等级响应、处置。

信息等级保护从技术和管理两个方面提出了具体的措施要求。技术类安全要求, 主要是通过在信息系统中部署软硬件并正确地配置其安全功能来实现。包括物理安全、网络安全、主机系统安全、应用安全和数据安全及备份恢复等几个层面。管理类安全要求, 主要是通过控制各种角色的活动, 从政策、制度、规范、流程以及记录等方面作出规定来实现。包括安全管理机构、安全管理制度、人员安全管理、系统建设管理和系统运行维护管理等几个方面。

信息等级保护制度具有国家强制性的特点, 全国所有符合条件的单位都要遵照执行。参照制度规定中的技术和管理要求, 能弥补IT运维管理中的不足, 修正IT运维管理中的错误, 完善IT运维管理中的瑕疵, 有效地提升IT运维水平及运维管理能力。

3 结束语

信息技术仍在不断的更新和发展, 各单位自身的信息化建设仍处在不断推进发展的过程中, 伴随信息化的全生命周期的IT运维的好坏, 直接影响着信息系统的运行状态, 需要高度重视。

参考文献

[1]王仰富, 刘继承.中国企业的IT治理之道[M].北京:清华大学出版社, 2010.

[2]庞南.信息安全管理教程[M].北京:中国人民公安大学出版社, 2007.

[3]荆继武.信息安全技术教程[M].北京:中国人民公安大学出版社, 2007.

智能网络运维监控系统 篇9

目前比较流行的网络管理软件有IBM公司的Net View, HP公司的Open View, 以及Cisco公司的Cisco Works等。但这些软件以管理主干路由器为主, 或者是建立在独立厂商各自设备的基础之上, 对于我台网络结构并不能完全适用。而网络设备正常运行与否, 直接关系到发射机的播出情况, 进一步导致不良的政治后果。为了解决目前的困难, 实现一个高效的、实时的、智能的、合适的网络设备监控系统, 已经被提到了一个空前的高度上。

因此, 我台计划建设信息化IT运维管理平台, 实现对网络系统、服务器、数据库、机房环境等信息基础的设施的全程自动监控;改变以往被动的、孤立的、分散的管理模式, 主动及全面发现系统中存在的问题[1], 以流程贯穿整个运维管理过程;减少运维人员的劳动强度, 提高效率, 切实保障各业务系统可靠、稳定、高效的运行, 进一步信息化为全台的服务质量。

1 基于ICMP和SNMP协议网络运维系统设计

ICMP是 (Internet Control Message Protocol) Internet控制报文协议。它是TCP/IP协议族的一个子协议, 用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息[2]。本系统正是利用了“是否可达”功能来检测目标主机是否处于联网状态。

SNMP, Simple Network Management Protocol, 即简单网络管理协议[3], 是有IETF定义的一套基于SGMP (简单网关监视协议) 的网络管理协议。在SNMP为技术的网络管理系统中, 管理工作站利用SNMP进行远程监控管理网络上的所有支持这种协议的设备:如计算机工作站、终端、路由器、Hub、网络打印机等, 主要负责监视设备状态、修改设备配置、接受事件警告等。本系统正是利用了这些功能, 对网络中的设备进行各设备状态的实时监视。

本次系统开发, 结合我台实际应用, 采用SNMP及ICMP (PING) 两种方式, 实时采集网络中设备的相关数据, 比对预设阈值, 进行告警管理, 并实时保存数据等功能。由于两种协议都会一定程度上增加网络带宽, 所以系统在设计之初就提出了时间间隔的概念, 即两次执行PING和SNMP的时间间隔。

本系统的ICMP协议采用了PING方式实现。管理主机向目标主机执行一次PING命令时, 在预设的时间内没有完成本次PING, 则系统会认为管理主机与目标主机之间的链路出现了问题, 将会产生语音、文字及图像报警信息, 通知维护人员前往处理故障。表若PING成功, 表示目标主机可达, 即主机处于正常联网状态, 系统将继续执行SNMP协议相关功能。

SNMP协议在PING成功后执行, 获取相应设备的参数信息, 与预先设置的阈值进行比对, 若超出阈值, 同样的会生成语音、文字及图像的报警信息来通知维护人员。两种协议实现流程如图1所示。

2 网络运维系统结构和功能

建立网络设备监测系统[4], 实现传统的被动式故障处理方式向前瞻式管理方式的转变, 既要使网络中出现的危险和漏洞降到最低, 防范于未然;又要减轻我台面临着巨大的运维压力, 降低信息管理的难度。因此, 整个系统以事件为核心, 将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统, 对整个系统内的所有事件进行收集、关联分析和处理。

通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控, 并以类visio图形化的方式直观地展现出来。对于系统运行的异常表现及时采用文字、图形及语音的方式报警。

本网络运维系统主要是应对我台现有的网络设备, 而我台需要监测对象有:服务器、交换机、路由器、防火墙、存储设备、终端主机、UPS等终端, 所以此次系统设计也主要针对这此设备展开。根据我台维护人员历来的经验, 在故障处理过程中, 主要针对设备ICMP (PING) 延迟, 内存利用率, 硬盘利用率, CPU利用率, 网口流量, 设备持续运行时间, 会话数, 电压状态等参数信息判断网络运行情况, 所以软件功能也由此展开。图2显示出了本系统的主要监测对象及功能:

3 软件系统设计与实现

网络运维系统软件采用了微软visual stdio 2010开发平台, 使用Win SNMP API实现SNMP协议[5]及ACE网络库实现ICMP (PING) 协议, 并结合人交互较好的ribbon控件 (图3, 图4) 及类visio控件 (图5) 进行开发。现简单介绍此系统的几个功能:

3.1 系统管理模块

“开始运行”:系统从数据库中加载已保存的设备数据到类visio主视图内 (图4) , 然后启动检测线程, 执行图1所示的检测流程进行检测;

“停止运行”:用来关闭系统检测;

“系统配置”:配置软件的启动项, 报警语音, 管理系统作为服务器端时的TCP/IP配置及数据库连接字符串配置 (图6) 。

3.2 布防管理模块

“解除警报”:解除当前发生的警报事件;

“布防选中”:使选中的设备进入布防状态, 即系统将实时进行检测;

“撤防选中”:使选中设备进入撤防状态, 即检修状态, 系统将不进行检测;

“布防所有”:使所有加载的设备都进入布防状态;

“撤防所有”:使所有加载的设备都进入撤防状态;

3.3 设备管理模块

此块功能区主要功能是用来添加设备、删除设备、修改设备属性及保存数据等功能。

3.4 视图管理模块

此功能区主要功能是显示和隐藏相应的视图窗口, 用户可根据自己的需求来自定显示方案。

3.5 标题栏模块

系统运行时, 此模块 (图4) 会显示出整个系统当前运行状态:正常、异常、未启动等信息。

3.6 类visio主视图模块

此模块 (图5) 显示了当前系统所有等检测的设备, 当处于编辑状态时, 使用人员可随意在此区域增加、删除、修改元素等功能。当处于检测状态时, 以不同的颜色和图片显示出设备检测结果 (正常、异常、检修等状态) 。当鼠标移动到指定设备上时, 会显示出当前检测的结果值, 用户可以根据提示信息判断设备运行情况。

3.7 状态栏模块

显示作为服务器端TCP/IP状态, 数据库连接状态, 客户端连接数量, 当前登入用户权限及类visio控件的缩放功能;

软件日志 (图8) :显示软件运行调试日志信息;

报警日志管理 (图9) :用户操作日志信息和设备异常日志, 这些日志都保存于数据库中, 用户可根据需要进行历史查询;

3.8 选中设备历史数据查询模块

用户通过右击设备, 在弹出菜单中选中“查看历史”操作, 可以得到如图10窗口, 并可指定周期及端口号, 得到此设备指定端口和时间段的历史流量、内存利用率、CPU利用率。当鼠标进行曲线控件时, 会有显示的提示信息显示当前值, 并可对曲线图进行左右拖动查看其它结果值。

4 结束语

本系统已在我台网络机房投入使用, 网络维护人员使用后反应良好。本系统目前已实现主机是否可达及设备参数监测的功能, 但网络的自动拓扑功能还未实现, 因此, 我们下一步工作将围绕此块功能加以展开, 开发出一套更人性化的系统, 更好的为安全播出提供技术支持。

参考文献

[1]宋光慧, 魏海平.一种将主动网络技术应用于网络管理的方案[J].计算机应用, 2003.

[2]刘杰, 王清贤, 罗军勇.一种基于ICMP的逻辑层网络拓扑发现与分析方面[J].计算机应用, 2008, 6, 2 (6) .

[3]William Stallings.SNMP网络管理[M].胡成松, 汪凯, 译.北京:中国电力出版社, 2001.

[4]马瑞芳, 王会燃.基于MIB的远程监测系统信息模型的研究[J].微电子学与计算机, 2006.

信息系统运维探索与实践 篇10

1. 规范管理制度先行

为保证信息系统的稳定运行, 首先需要建立一整套的规章制度来规范运维工作, 并为运维工作的开展提供依据, 主要包括应急处置、需求变更、数据修改等管理规定。

1.1 应急处置规定

主要解决系统无法提供服务时, 用户如何办理业务;系统恢复后, 如何将业务数据补录到系统中;以及修复系统故障时导致的数据错误等。主要流程如下:接收故障报告—判定故障原因—确定修复时间—启动应急预案—手工办理业务—恢复系统故障—关闭应急预案—补录业务数据—编写处置报告。

1.2 数据修改规定。

所谓数据修改是指对系统基础数据和业务数据进行的修改;其中基础数据是指系统运行的基本数据参数, 基础数据的准确是保障系统正常使用的前提, 业务数据是指系统运行过程中产生的业务操作记录, 业务数据的准确是进行数据统计、数据分析和数据挖掘的前提。本规定首先明确各部门的数据维护权限和责任, 由责任部门负责对数据实施修改, 对未提供修改功能的数据, 由业务人员提交信息服务申请, 交由信息部门在数据库层面实施修改, 并记录备查;对于多次出现的数据修改需求, 需开发维护功能, 分配给业务部门权限进行修改, 以保证系统数据的有效性和数据质量。

1.3 需求变更规定。

所谓需求变更是指业务部门对已有系统增加、修改、删除某些功能的需求调整;随着系统应用的增加和业务模式的调整优化, 系统功能也需要随之进行修改和完善。为保证需求变更的及时准确, 防止频繁变更和需求膨胀, 需要信息部门做好对需求的把握和控制。“运维平台”为数据修改、需求变更等信息服务提供了有效的运维服务平台, 主要流程如下:业务人员提交信息服务申请—主管领导审批—信息办审批—业务部门会签—信息办实施—反馈业务人员。

2. 建立运维辅助系统, 完善运维体系建设

广义的系统运维不仅包括咨询答复、问题处理、运行保障, 还包括系统功能完善、系统开发等技术支持, 这是保证系统生命力的重要环节之一。所谓运维辅助系统, 是指除系统运维平台以外的相关功能系统, 如呼叫中心、问题反馈平台、运行监控平台等, 运维辅助系统的建立, 旨在进行问题收集、答复处理、问题反馈及系统监控等, 并实现与运维平台的有效对接, 实现运维体系的完整化。

2.1 呼叫中心

呼叫中心是直接面向用户的最直接、也是最快捷的咨询方式, 是进行问题收集的主要途径。建立呼叫中心, 让用户在使用系统遇到问题时, 及时得到帮助和解决, 给用户提供良好的使用体验。主要流程如下:接收问题咨询—问题分析—问题处理—答复反馈。其中对于简单的操作不熟等问题可直接进行答复, 并将咨询问题记入“问题反馈平台”备查和分析;对于复杂的问题需要在“问题反馈平台”上填写问题记录, 提交技术人员处理反馈。

2.2 问题反馈平台

问题反馈平台是收集问题的另一途径, 是对电话咨询的有效补充, 为用户提供多方式、多途径的帮助平台, 特别是对于一些非必须立即得到答复和相对复杂的问题, 可以通过问题反馈平台给用户提供更实用的问题提交和反馈方式, 减少电话咨询的压力。建立问题反馈平台一是搜集系统BUG, 解决用户使用遇到的问题;二是搜集改进意见, 为完善系统功能提供需求支撑, 确保系统功能准确、有效;三是对问题进行分类, 便于对问题进行统计分析, 进而为系统优化和服务优化提供数据参考。

2.3 系统监控平台

系统监控平台是信息部门内部加强系统监控管理的有效手段, 即针对应用系统的不同特点, 提出相应的监控方式, 开发系统监控流程, 并通过短信平台功能, 将系统问题以短信的方式发送至系统管理员手中, 使系统管理员第一时间收到问题信息, 进行问题处理和解决, 提高系统运维速度和效率。

3. 建立运维平台, 实现运维管理规范化、系统化

完整的运维体系不仅包括咨询答复、问题处理, 还包括需求变更、系统升级等运维管理全过程。建立运维平台, 实现对运维工作的持续跟踪与管理, 包括需求提交、需求分析、制定任务、开发管理等。

3.1 信息服务申请

由业务人员提出信息服务申请, 由主管部门领导审批, 再提交信息管理部门, 信息管理部门根据业务需要提请相关业务部门会签, 审批通过后交由技术部门实施。

3.2 需求分析管理

需求分析是把握需求的关键环节。随着系统的不断推广使用, 以及业务模式、业务流程的调整优化, 用户的需求会不断增加, 这其中包括对原有需求的调整以及新需求的提出, 为防止需求的盲目变更, 必须组织相关部门对需求进行评审, 把相关部门的意见进行整合, 避免需求不成熟或频繁变更的现象, 同时防止需求膨胀。

3.3 制定并下达任务

信息部门把需求内容转化为工作任务, 下达给技术部门 (或外协开发公司) , 对于权限调整、数据修改、简单的程序修改等任务, 由技术部门及时实施并反馈, 对于需要进行系统开发的需求, 由技术部门编写计划组织相关部门实施调研开发。

3.4 开发部署管理

对于通过审批的需求, 技术部门需重新进行需求调研和需求确认, 编写需求规格说明和详细设计, 分析工作量, 制定开发计划, 并组织开发人员按计划实施开发, 同时根据工作需要, 及时调整开发计划, 确保计划的有效性。

开发完成后, 由开发人员提出发版申请, 提交相关测试文档、发版说明、操作指南等技术文档, 由信息部门进行测试, 测试及审核通过后, 发布发版通知, 进行系统升级。

4. 结束语

上一篇:仪器原理下一篇:投资案例分析