IT运维服务管理支撑系统的设计与实现

2024-08-06

IT运维服务管理支撑系统的设计与实现(通用8篇)

篇1:IT运维服务管理支撑系统的设计与实现

(三)监控功能

图1传统IT运维模式与IT运维模式的比较

图2服务管理的基本原理

此功能设计的作用是监管和控制每个用户在使用时各项功能的实时运行情况与数据。在此平台日常的运行中,对硬件、软件设备配置的管理是负责软、硬件能否顺利运行、功能特点是否完全运行、出现问题时能否自我修复等,以及负责对下指令的发放与管理。还包含对软、硬件设备在运行时各种数据的搜集、整合、管理与分析,另外就是在出现问题时要能够

及时自我报警、提示问题出现在哪里并发出警报,如能完成对出现问题位置的准确定位是效果最好的。最后,还要能实现对系统运行时占用并使用了那些资源能够及时显示,为用户合理分配资源进行数据参考。

(四)对系统平台安全性进行监管

在现在人人都懂一些互联网技术的时代,对于网络安全的管理亦是同等重要,它主要是保障整个系统能够平稳、流畅、安全的使用,它的主要任务之一就是对计算机病毒的拦截与删除,利用此功能,使系统在接触陌生用户或者外来数据的传入时能够自我有效的阻拦陌生文件或病毒的入侵,从而保障整个系统的安全。二是要对系统内每天登陆、录入用户操作等行的数据形成日志文件保存起来并进行有效的管理。三是对用户的管控,主要指新用户的增加、无效用户的删除、对用户详细信息的查询、用户自我修正个人信息等操作。

二、对系统配置、管理、信息发布的管控

(一)对系统配置的管控

此功能的作用是整个系统的运行中所有硬件之间的配合、相互之间的运行进行保护与分别识认,以便能够更有效的管理日子信息的修改与公开。另外也会保证基本设备、基本服务建立的模式进行一个初步的建设。建立它的主要任务就是为我们的目标客户提供一种管控数据的方式、展示出整个系统真实的配制数据,使硬件系统的质量能够更好的相互配合,发挥其最大的效能,合理的分配各个存储设备的资源运用。

(二)对系统变更的管理

在整个系统的运行有效期中,不论是硬件设备,还是软件的配置都有其一定的运行周期,不可能一直无限的运行下去,或者是有时整个系统的为之服务的对象也会有变化,因此对于服务系统的资产和软、硬件配置的改变是必须要依靠相关系统功能来实现的。在系统的设计与搭建过程中,尤其要注意对各种变更操作的记录,每一次变更可能引起的风险评估,以及最重要的就是对于更重变更操作应当建立起相应规范的、合理的审批和操作程序。这一项中就应该包含对系统物理环境的管控、维修、操作有关的硬件配置、日志文件记录。

(三)对信息的发布管理

在这一项系统功能的实现中,主要是包含每个功能模块、操作程序、系统测试数据的公布和整理。在程序的生产环境情况下,对于何种信息、如何审批、如何公布进行安排。在信息发布过程中,不仅要在生产环境中进行提前的安排,同时要对系统的服务进行合理有效的安排,将安排的信息能够切实的运用起来。

三、整个系统功能的有效实现

在IT运维服务系统整个运行过程中,对一些良好的数据库开发工具亦有着很好的运用,也进一步对于整个系统的流畅运行提供了优秀的数据支持。这在系统的真是运行过程中,不仅涉及到软、硬件的配置、系统变更的管控、日志文件的发布等各个方面。在系统的开发过程中,在数据库中保存的程序运行结构图一般都是放在系统界面的右侧,在整个流程的设计中,已经包括了对各个子功能模块流程的显示。基于此,在对系统中的一些字段、数据库内表格的设置进行进一步的管理与配置。在我们对系统进行整体测试运行时,这种技术的应用,能够使整个系统发挥出其最好的效果,并且能够同时保持住整个系统在运行时保持稳定、维护系统的安全。同时也会使用户在使用系统的时候能够及时了解各个功能的实现与具体的操作流程没从而更好的发挥整个系统的最大效用。

四、结语

在现在这个互联网技术飞速发展的时代,软、硬件不断更新、IT技术不断创新,而且我们的社会生活中也越来越多的融入了互联网技术,使我们的生活品质和工作环境登发极大地改善,最重要的是提高了我们生活与工作的效率。但是IT系统要想能够发挥最大的效用,就需要有良好的运维服务系统做支撑,因此只有把服务管理支撑系统做的合理、有效,才能够有效的对IT系统和IT资源进行合理、有效的运用。参考文献

[1]尚云云.IT运维服务管理支撑系统的设计与实现[D].北京交通大学,2009.[2]张伟俊.成飞所IT运维管理系统的设计与实现[D].电子科技大学,2013.[3]姚国旺.信息系统运维服务支撑平台设计与实现[D].华南理工大学,2013.[4]商秀杰.某电商云平台业务运营支撑系统的设计与实现[D].中国科学院大学(工程管理与信息技术学院),2014.

篇2:IT运维服务管理支撑系统的设计与实现

【摘 要】随着我国通信技术的迅猛发展,逐渐有了越来越大的通信行业的发展规模,也会增大覆盖的范围。另外,在实际的生产活动当中有了越来越复杂以及庞大的需要交换的信息和数据,这已经在很大程度上超出了传统方式能够处理的实际范围。将通信技术引入到现代化的生产活动当中,能够有效促进信息的交换,进而提高数据处理的效率。在这样的形式之下,应该设计并开发出基于通信技术业务流程的一个管理系统,该系统应该有效保证企业当中信息交换的准确、方便以及快速。在本文中,简单描述了电力通信运维管理当中存在的一些主要问题,阐述了系统设计的目标和原则,并分析了管理系统的实现。

【关键词】电力通信 运维管理 系统设计 原则 实现

在电力系统当中,系统通信是非常重要的一个组成部分,它包含的主要业务有电网的生产、营销以及调度,属于保证电网经济、稳定、安全、高效运行的一个非常重要的技术方面的支撑。随着电网建设的不断信息化和智能化,在很大程度上壮大了电力通信网的实际规模,也增加了结构的复杂性。为了能够对电力通信网的稳定发展进行更好的适应,对电力通信网的整体质量进行提高,优化管理运作的实际水平,应该对电力通信运维的管理进行足够的重视,有效保证通信运维工作的高效性、可靠性、规范性以及有效性,保证电网业务当中具有的综合能力。

1分析电力通信运维工作管理当中存在的问题

现阶段,电力通信的相关运维工作管理正在逐渐摆脱人工管理的阶段,向着电子化管理阶段发展,然而,在实际的工作管理当中仍存在着一定的问题。

1.1没有足够完善的运维部门工作的管理

通常情况下,运维部门的日常工作管理主要包括对相关的工作管理进行工作方面的计划以及通知。现阶段,没有非常标准的记录填写格式,没有极其严格的规范,有着各种口语化的描述,对运行状况的查询很难及时快速的进行;有着比较落后的数据统计方法,同时也有着比较低的工作效率,根本就不能为报告提供科学、有效以及全面的依据。应该对值班工作的相关记录进行规范统一,同时对工作记录进行集中性的管理,对日常的运维工作进行更加高效、规范以及快捷的完成,进而保证运维的基础工作。

1.2 不能有效实现运维工作的全过程管理

一般来讲,运维部门的调度管理在一定程度上要求有效实现故障业务的处理以及及时检修的工作方面的闭环管理,在实际的调度管理过程中,需要多个协作的部门来进行故障的处理,同时完成检修的相关工作,并对实际的过程进行跟踪记录。现阶段,相关的业务流程对逐渐发展变化的情况根本不能完全的适应,常常会产生跟随流程的反复性的工作,根本不能对工作效率的实际情形进行有效的提高,这会在很大程度上限制相关工作的协调调度,应该在一定意义上提供全面完善的,同时能够有效支持变更的控制以及管理,有效实现全程新流程的管理,方便日后的相关工作总结,对同类的故障时延进行一定的降低,进而提高网络运维的管理水平。

1.3运维管理和其它的通信管理系统之间没有足够强大的互联互通

通信资源管理与运维工作管理的发展以及监控水平有着一定的差异,各个系统之间严重缺乏整合、数据的交互、资源的共享以及系统之间的联动。因为通信网有了逐渐广泛的发展范围以及逐渐多元化的业务需求,这就导致运维管理工作根本不能跟随其快速发展的脚步,在及时性以及效率方面有着些许问题。

1.4 没有非常强的运维工作的经验交流与分析总结

众所周知,运维管理当中的工作分析、工作总结、工作经验以及报告能够为运维工作有效的积累经验,为处理故障提供有效的建议来逐渐完善以及优化已经形成的相关运维部门当中的经验库和专家库,能够有效共享知识以及经验。

2系统设计的目标与原则

2.1系统设计的相关目标

经过对电力通信运维管理工作当中的基本工作流程进行探讨,得出了系统设计的具体目标,具体表现为:运用该电力通信的运维管理系统能够有效管理相关的日常工作,这在很大程度上能够有效推进所有部门工作的信息化、系统化、办公自动化以及规范化的程度,利用软件系统能够实现在线完成电力通信的运维管理工作,进而来实现管理、通信效率的最终目的。

2.2系统设计的相关原则

(1)稳定性与安全性。在整个系统当中,稳定性与安全性是保证稳定运行以及满足实践需要的非常重要的因素。数据安全属于系统运行的一个重要的支撑以及关键,为了有效保证系统数据的安全性,应该数据进行存储加密,利用身份验证以及权限控制来对用户数据的访问权限进行控制,避免泄漏比较重要的数据,另外建立起健全完善的实时备份的相关策略,避免数据由于硬件故障或者软件错误而损坏或丢失。系统的稳定性是能够正常运行的根本,所以,在设计系统时,应该保证较高的容错性以及较强的兼容性,对比较重要的数据进行二次的校验,进而有效保证系统的稳定运行。

(2)可用性与易用性。通常情况下,可用性指的主要是系统可以对当前的业务需求进行最大限度的满足,并且还应该兼顾未来的实际发展需要,并对相关的接口进行预留。在进行了反复的对比之后,最终决定使用总体设计以及分步进行实施的方案来确定系统的技术路线。首先应该对总体的设计方案进行确定,并根据总体方案的相关指导来实现日常工作和具有现实意义的功能模块,在实际的实现过程当中应该特别考虑模块的可用性与可靠性。除此之外,应该运用硬件的容错处理来对系统底层进行管理,进而有效保障硬件以及软件的可靠稳定。之后依靠螺旋模型安全稳步过渡到更高权限的管理功能以及更多功能的功能模块。根据上面提及的操作步骤来进行具体的实施,能够在很大程度上让整个系统紧密联系硬件环境以及使用者的实际需求,同时还能够及时的得到试验以及调试,另外,还能有效保障系统在未来具有一定的平滑性、扩充性以及连贯性。

另外,易用性指的主要是对于直接的用户来讲,系统当中的易于学习与使用、可以有效减轻记忆负担、方便操作等特点。对系统的直接用户不同的计算机操作水平以及熟悉业务程序的实际程度进行充分的考虑,因此,应该设计友好简洁的系统用户界面。为了更加方便不同权限用户来操作以及运行软件,利用界面将系统当中的大多数功能及具体的操作方法清晰的传达给用户,并有效配置健全完善的帮助系统,能够更好的方便对系统问题进行及时的处理,对系统操作更快速的掌握。

(3)独立性与协作性。其中,独立性主要是指系统当中的各个功能模块独立的基础上,可以很好的完成所属业务部门的相关工作流程,可以对输入的数据进行正确接收并处理,进而构造出符合相关要求的数据来输出。而协作性指的主要是各个模块间可以按照工作的处理步骤和数据约束,根据系统接口来组成完整层次的系统。

3电力通信运维管理系统的具体实现

建设完成系统的结构以及数据库后,接下来就需要来实现系统的相关功能。首先来讲,应该对数据实现建模,记录电力通信运维管理当中的工作,组织并管理相应的数据资料,进而有效保证数据与调度值班的一致性,当实现该功能时,应该做好业务模型、告警数据模型、表单模型以及设备资源模型等,当录入数据库当中的数据时,能够按照工作当中记录的数据,在数据表当中进行分别的录入,对现实工作当中的事件进行模拟,运用系统来进行实施。在数据的选取时,应该运用统一的采集数据的标准,有效保证业务的相关性以及资源的相关性。

其次,应该严格规范业务流程,实现系统和工作之间的有机结合,当对流程进行规范之后,应该保持系统与业务流程的标准化,进而实现业务工作自动化处理的有效促进,因为完成系统功能的相关设计之后,那么在各个功能模块当中就包含着相关的处理业务的功能键,系统能够完全完成日常的维护工作,例如现场的作业管理等,在相应的功能模块当中对执行方式进行了一定的保护,消除了缺陷、验收生产、设备的清扫以及巡视等,对相应的功能键进行点击,那么就能够进入到相应的子功能的模块当中,在该模块当中,包含着比较常用的修改、删除以及添加的功能键,同时还包含着基本的网络维护的信息,例如,执行方式单、工作位置、仪器仪表、耗材使用等,当出现维护站点时,那么相关的工作人员就能够在系统当中查询以及维护,并做记录。

4结语

经过探讨电力通信运维管理的相关系统设计以及实现,对该系统进行设计与实现所需要的基础工作有了一定的了解,要想很好的实现相应的功能应该依赖基础数据,因此,应该根据基本的数据来有效保证数据资源的准确性以及唯一性。为了保证电力通信运行的安全性和稳定性的提高,那么必须将信息化管理渗入到运维管理工作当中,进而来适应相关的运行要求,保证企业的社会效益以及经济效益。

参考文献:

篇3:IT运维服务管理支撑系统的设计与实现

广东邮电职业技术学院目前具有较大规模的在职培训、继续教育及技术服务。每年接待企业的培训员工超过50万人。在如此庞大的人员规模面前,使用电子信息手段取代传统的纸质记录手段解决培训人员的考勤、就餐记录问题,是本系统的出发点。

2 平台的选择

移动互联网应用时代,系统开发者选用系统开发平台的选择变得多样化起来,比如手机原生APP开发、手机混合式APP开发、微信开发等。根据项目实际需要的差异,选用的平台也会有所差异。针对本次项目“培训服务系统”这一主题,同时考虑企业学员的可接受度,最终决定使用腾讯公司的微信作为本系统依托的平台。表1列出了几个待选平台的一些参数的横向对比结果。

根据表1可知,微信具有无可比拟的用户接受度和庞大的用户基数,用户只需要扫二维码就可以完成系统的关注和绑定,无需像其他APP那样要用户承担一些病毒软件的风险。从技术角度来看,微信和混合型APP的客户端开发难度都比较低,传统的网页前端工程师就可以完全胜任这一工作,不像原生APP,还要分别针对Android平台和iOS平台开发两套客户端系统。从开发基础成本来看,不计算人工成本的话,还需要为微信公众号的运营缴纳每年300元人民币的认证费用。但是,如果使用原生APP或者混合APP的话,为了照顾IOS用户群体,则需要每年缴纳99美元的开发者账号费用。最后从软件安全角度来看,原生APP拥有最好的系统安全性,因为软件都封装成为了二进制代码,黑客较难进行反编译;微信由于是基于动态网页技术开发的,所以,程序源代码在服务端,也是较难破解的;而目前的混合APP技术主要通过HTML5网页的方式来实现,由于将部分甚至全部前端业务放到JavaScript里面执行,而JavaScript是不能预先编译成二进制代码的,所以,最多只能进行混淆或者压缩,而黑客可以通过一些手段获取到系统的源代码,甚至可以对其进行修改然后再次封装。综合以上各种因素,微信平台较为适合本项目的应用场景,微信唯一较其他APP不足的地方就是不能离线使用,由于鉴权等机制的存在,基于微信平台开发的系统必须在线使用,不能完全脱离互联网使用。

3 系统的功能

系统通过微信服务号“邮院培训圈”来提供综合性服务支撑,满足了信息时代的信息快速传递需求,实现了无纸化服务模式。考虑培训客户比较重视单次的培训流程的体验,得出图1的几个角色用例,而培训学员角色的微信端主要包括了以下功能。

签到用餐:将特定的二维码发送到客户手机端,工作人员对其进行扫描达到上课签到、就餐签到的目的。

WiFi:提供接入学院WiFi的账号和密码,每位学员都不一样。

课程简介:提供当前培训学员所参与培训课程的简介、讲师资料等信息。

资料下载:提供当前培训学员所参与培训课程的文件资料的下载。

满意度调查:对接第三方问卷系统(问卷星等)完成培训质量反馈,为课程改进方案提供数据支撑。

单位管理人员角色可以通过前端平台查询当天即时的签到和用餐情况,也可以直接获得满意度调查的统计结果。系统管理员主要任务是系统的设定及基础数据管理。

培训学员以外的其他几个用户角色(管理人员、市场/工作人员)的功能界面不在微信端里面体现,而是在网页后台实现,这样做能够缩短开发周期,而且直接编写网页后台比微信端更易于调试。

4 系统的实现

系统前端主要基于HTML5和jQuery技术的BootStrap实现。BootStrap是由Twitter公司开发的一套遵从HTML5和CSS3标准的开源前端框架,有简洁、灵活、易上手、便于扩展等优点,基于这套框架,开发者甚至可以在没有专业美工人员的情况下,也能够做出标准、美观的网页程序,在国内外都很受开发者欢迎。

系统的后端程序主要使用PHP作为后台语言,并且使用了国内较为流行的ThinkPHP框架。作为一个整体开发解决方案,ThinkPHP能够满足应用开发中的大多数需要,因为其自身包含了底层架构、兼容处理、基类库、数据库访问层、模板引擎、缓存机制、插件机制、角色认证和表单处理等常用组件,并且对于跨版本、跨平台和跨数据库移植都比较方便。应用开发过程仅仅需要关注业务逻辑。数据库方面使用MySQL 5.5,和PHP能够很好地配合使用。

本系统首先要解决的问题就是微信用户系统和培训班报名系统的对接,笔者使用了账号绑定机制,培训学员关注到微信服务号以后,须凭借个人信息(姓名、电话)进行匹配,如果匹配命中,则可以成功绑定。

绑定好账号后,系统最核心的业务就是出勤签到和就餐记录。系统会通过个人身份信息生成每个学员独立的二维码,发送到其微信端上,负责考勤和负责协助就餐的工作人员使用二维码扫描仪对学员提供的二维码进行扫描以确认身份,并检测其是否已就过餐。该流程的设备拓扑图如图2所示。

其中“微信管理服务器”是一台用于搭载Apache和MySQL服务的Linux服务器,根据微信的要求,必须使用顶级地址和80端口,一般的做法是租用阿里云服务器或者新浪云服务器,是与校内相应系统对接及对微信管理的重要服务器。“学院服务器”里面搭载着学员报名系统等固有系统,两个系统之间由于使用不同的架构和语言,之前的数据交换通过返回JSON格式数据的HTTP请求来实现。

5 结语

该系统优化了培训后勤流程,减少了人力成本的支出及纸质材料的浪费。通过在微信公众平台上绑定个人信息,进一步获取入住房号、课室地点、上课时间等基本信息,大大减少了培训学员的时间消耗,提高了整体效率。参培期间为培训人员提供各种后勤服务信息及即时的反馈,优化培训课堂环节,提高了培训课堂质量,并提供基于大数据的优化建议。搭建了培训单位与参培人员建立紧密联系的一个平台,并为用户数据的后续利用提供可能性。

参考文献

篇4:IT运维服务管理支撑系统的设计与实现

摘要:随着平板电脑、智能手机等智能终端设备的快速普及,通过智能手机和平板电脑来访问电子邮件、文档和应用程序的用户已形成规模,同时移动办公也使得IT运维更自动、便捷,正如企业一样,随着高校管理、教学的信息化、互联化,师生对可以用各种移动终端接入学校应用的诉求将越来越强烈,也给高校IT运维服务提供可拓展到移动互联设备的机遇,本文通过研究高校IT运维的成功案例,提出了基于移动互联网的高校IT运维服务(平台)设计框架,助力高校IT运维服务。

关键词:移动互联;IT运维

随着高校信息化建设的不断深入、各种应用的不断增加,如何保障各业务系统的高效运行,如何让师生更高效快捷的获取各种校内资讯及各种应用服务,服务于广大师生,实现更好的IT运维,成为大多数高校的当务之急。在此介绍下清华大学借力锐捷网络提供的RIIL综合监控运维平台,及由此分析高校即将要面对的移动互联网下的运维服务。

清华大学的信息部门共有三个中心,此次实施IT运维管理项目的是计算中心。经由锐捷网络与计算中心的工程师携手完成RIIL-RMC产品中的配置管理、事件管理和项目管理模块的建设后,经过对现有基础设备的统一监控,计算中心利用RIIL-RMC服务请求管理中心,可以将IT运维管理流程与日常信息工作管理真正实现了电子化、自动化。而通过与RIIL监控类系统对接的实施,在自动获取IT监控事件的同时,计算中心现在已经可以通过先进的CMDB (配置管理数据库)管理每一个运维对象,包括运维配置上的每一次修改和变更历史,极大地提高了排除故障的效率。

第1章 业务价值分析

1.1 服务存在的必要

清华大学计算中心力借力锐捷网络提供的RIIL综合监控运维平台成功实现IT运维管理质的改进,极大地提高工作效率和管理水平,是高校IT运维一个成功的案例,同时,可以预见的是,随着高校的管理及教学的信息化、互联化,正如企业不可避免要面对的是,师生对可以用各种移动终端接入学校应用的诉求将越来越强烈,高校的各种应用将接入移动互联网,这是高校IT运维所要考虑的新课题。

1.2 服务存在的可能性

基于移动互联网的IT运维服务在技术上是可以实现的,业界已经有先知先觉的IT运维管理服务商在运维平台上提供了相应的支持,国际知名IT运维服务提供商Kaseya已经率先推出了整合移动客户端的IT运维解决方案,通过该方案,管理员可以通过相应的管理功能来实时跟踪、更新和保护部署该方案的移动设备,卡西亚(Kaseya)在融合了移动客户端的同时把备份和恢复功能功能也拓展到了移动设备上。通过远程管理可以在中央服务器上备份通讯录,在出现问题时可以及时回复联系人数据。而一旦出现不慎遗失客户端的情况,通过移动管理可以实现消除手机数据,禁用手机等操作,及时将损失降低到最小。

第2章 服务(平台)产品设计

通过构建基于移动互联网的高校IT运维服务平台,实时跟踪管理师生各类接入应用的移动设备,更新和保护部署接入应用的移动设备,保证接入应用的移动设备能及时更新各应用终端及排除各种非法的访问操作,同时运维人员的移动设备进行相应的管理,保证运维的合法性及便捷。通过系统平台日常相关运维服务工作实现自动化管理,同时实现运维人员与师生互评绩效管理。框架如下:

2.1 服务台管理

服务台作为运维的主要的联络点,分为人工、语音、自动这几种交互方式,进行故障记录、任务分派、任务跟进等操作。

2.2 事件管理

事件管理是创建、处理事件的模块,一个事件的生命周期全部会在此模块内,在设计时,需要考虑以下的信息:

2.2.1 事件的类型

分为故障请求、咨询、新需求、投诉等。

2.2.2 事件的分类

分为硬件、应用、软件、网络、安全、业务这几个大类。

2.2.3 事件的等级

5个等级,默认情况,等级越高的事件,是表示越严重,表示要优先处理。

2.2.4 事件的状态

分为创建、分派中、处理中、等待中、解决、关闭。

2.2.5 事件与CMDB的关联

事件与CI的关联, CMDB所有的信息与事件的信息可以交叉进行统计分析。

2.2.6 事件与其它流程的接口

事件处理过程中可以直接发起变更申请,也可以发起问题申请与知识库申请。

2.2.7 事件的时长与工作量

事件的处理周期时长是为了SLA的计算,事件的花费的资源量,即工作量时长为了运维资源的分析。

2.3 问题管理

问题管理处理逻辑类似事件,许多信息继承事件,比如等级与类型等。

2.4 变更管理

在ITIL中变更与发布是两个独立的流程,可以把变更与发布流程合并为一个,变更的实施就是发布流程,即发布可以理解为是变更的一个子流程, CMDB精确度如何,很大程度上取决于变更的执行情况。让CMDB的信息更新得到真正有效的控制,变更的主要目的是授权与控制对基础架构或其它的服务的改变,这里的更新是指现实的服务或物理上的基础架构,而不是系统中数据的更新,要对一段网络做调整等操作,但是有可能会影响到几个系统项目,这时需要发起变更申请等。

2.5 配置管理

配置管理模块,核心的是CMDB,这里就配置管理流程层面简单说明下:

2.5.1 CMDB的审计

CMDB审计需要规划好,根据各种条件审计,比如根据某一类的组件,某一个项目的组件,还可以确定一定的数量进行审计(随机抽取)也可以决定一定的比率(随机抽取),审计的目的是为了检查CMDB的数据正确情况,找出问题并修正。

2.6 操作管理

2.7 知识库管理

2.8 调查管理

第3章 技术解决方案

采用B/S系统架构,开发平台是J2EE,数据库采用Oracle。

第4章 总结

鉴于当前高校系统构建的复杂度越来越大,系统故障发生概率和潜在隐患变多,持续可靠提供应用服务、保障业务畅行无阻的风险已经凸显。如何更加有效地管理 IT 资产,积极回应业务部门事业发展和广大师生个人成长的信息化应用诉求,提供稳定优质的IT 服务,已成为学校各级组织和人员的普遍关切,也迫使信息化建设部门的角色从单纯的信息技术提供者向信息服务提供者的角色转换,发展机制由“技术驱动”向“业务驱动”转变。因此,构建科学化、规范化、标准化、流程化的 IT 服务管理体系已势在必行。只有通过沟通提学校领导层面对IT运维的重视及应用落地上述所提到的合适运维平台,才会达到以下的价值:

篇5:IT运维管理系统规划

MIS网络信息运维管理系统规划(征求意见稿)作者:张鹏 二〇一〇年一月 前言

托电信息化发展历经八年,从只有一个OA办公系统、数十台终端到如今拥有包括小型机在内的服务器五十余台、交换机等网络设备百余台、终端上千台。信息化工作的重点已经从信息系统建设向运维管理和系统应用的深度整合等转移。

目前,信息中心每天的工作量,多数都属于运维管理的范畴。信息中心从机组四期工程结束后就着手开始运维管理方面的建设工作,几年间相继上了蓝带思科桌面管理系统、东华的IT运维系统、青鸟桌面管理系统。这些系统的应用情况都不尽如人意,原因是多方面的,个人认为主要有以下几点:

1.运维管理的理念形成需要逐步成熟的过程。2.受到与运维相关的信息技术发展制约。3.现有运维相关的产品有各自的侧重或局限性。

信息中心正在实施的两个项目NETIQ和机房环境监测系统为我们提供了一个契机,我们可以建设一个真正适合自己的网络运维管理系统,这个时机已经基本成熟。

一、运维管理系统建设的可行性

信息中心运维工作主要来自网络设备、系统应用、机房设备、终端。NETIQ服务器监控系统可以对服务器、数据库进行集中监控管理。机房环境监测系统可以对机房温湿度、空调、UPS等指标进行集中监控管理。终端管理方面,可以考虑购置更好的产品加上二次开发或者在现有桌面管理系统的基础上进行二次开发。相对于以上,网络设备的管理使用SNMP基本可以满足运维需求,NETIQ可以实现,也可以在运维管理中心开发相应的管理模块。这些系统的建设,本身就是具有针对性的综合管理系统,而且可以为运维管理中心系统提供运维信息的采集平台,是运维管理系统建设的基础。

二、运维管理系统的构想

运维管理系统由外围管理系统群和运维管理中心两部分组成。外围管理系统群包括网络设备管理模块、NETIQ系统、机房环境监测系统、终端管理系统,外围系统群为运维管理中心提供运维信息采集平台。运维信息采集包括网络设备运维信息采集、服务器组运维信息采集、机房环境运维信息采集、终端运维信息采集。

运维管理中心主要包括以下几个部分:运维任务的生成、运维任务的处理、完成确认、知识库、运维统计分析、运维报告、绩效评价、违规处理、维护商管理、应急预案管理、系统权限等。㈠生成运维任务

运维任务的生成有两个途径,一个是从信息采集获得,另外可以手动生成。运维任务分为运行管理任务和维护管理任务两类,运行任务管理是指系统、设备在正常运行状态下的监控管理或操作,主要包括定期巡检任务、正常的配置操作、补丁管理、用户管理、升级操作等,巡检任务由系统按规定自动生成,包括信息中心人员的日常巡检和维护商的定期巡检。维护管理任务是指当设备、系统出现异常或故障时的处理过程。运维任务的生成包括的信息有:设备或系统名称、IP地址、报警信息、时间、运维编码等等,由终端直接发起的运维信息应该包含联系人的电话等,以便于运维人员接手任务后与发起人主动取得联系。生成的运维任务包括网络设备、应用系统、机房操作、终端运维等几种任务。运行管理和维护管理并没有严格的界限,往往是你中有我我中有你。㈡运维任务的处理

运维任务生成后,由管理人员按照各自的职责分工,领取相应的运维任务进行处理,运维任务处理过程及信息分类:

运维类别 网络设备包括:交换机、路由器、防火墙、VPN设备、行为管理设备、其他 应用系统包括:操作系统、应用服务、数据库、接口、其他

机房运维包括服务器、网络设备、空调系统、供电系统、消防系统、环境监控系统 终端运维包括:终端、外设 运维内容

网络设备包括配置操作:增加、更改、删除,其他操作:版本升级、设备更换、其他 应用系统包括:配置变更、软件安装、升级、用户管理、数据管理、日志管理、补丁管理、策略管理、其他

机房运维包括具体的设备信息

终端运维包括:电脑硬件、操作系统、应用程序、打印机、其他 处理过程

处理结果

原因分析 影响情况 对用户的影响情况(时间范围)

运维任务在处理过程中包含以下几个状态,分别是: 等待处理: 等待运维人员接手 执行状态:运维人员正在处理任务

挂起状态:运维过程中出现其他急需办理的事物或其他原因暂停执行 提交状态:任务处理完毕,等待完成确认 完成状态:一个任务完全结束后的状态

驳回状态:任务处理过程中信息有待补充等原因被驳回。

当任务处理人员发现需要维护商来处理的时候,将任务转给维护商,由维护商接手任务,相关人员配合共同完成运维任务并填写相应的记录,最后由运维人员给予维护商相应的评价。㈢运维任务的完成确认

对已经完成并提交的运维任务进行确认、评价,对于运维内容是否放入知识库给予确认,对于运维过程中存在的违规情况根据相关规定给予处罚确定等。㈣知识库

知识库的信息积累来自于运维管理系统和平时的手工录入,应做好信息的分类、查询功能。当运维任务生成后,系统会把相关的信息在知识库中进行检索,并把结果显示在任务中,供运维人员参考。㈤运维统计分析

当某些问题经常出现的时候,信息中心必须运用统计分析对设备、系统产生的问题或故障协同相关维护商,进行深入分析,找出原因,解决问题。另外运用统计分析可以为今后的运维工作提供指导方向,制定下一步运维计划。㈥运维报告

通过运维管理中心,对运维数据有选择的筛选、汇总,定期生成信息系统运维报告,以便于工作总结、分析、计划。运维报告应具有针对性,例如呈送公司领导的、呈送各部门的以及信息中心的整体报告。㈦绩效评价

运维系统内的各方包括终端用户、维护商、运维人员都是可以评价的对象。终端用户可以给打印机维护商评价;也可以给信息中心运维人员给予评价;维护商可以给维护人员评价;运维人员可以给维护商的工作给予评价;运维人员可以对终端用户使用计算机的情况给予评价。㈧违规处理 对于运维过程中发现违反信息系统相关制度的行为应予以必要的处理。需要做两方面工作:涉及这个内容的制度条款应该拿到系统中来,处理的方式方法有待确定;对于违规行为,在运维处理过程中应该做相应的证据记录。㈨维护商的管理

对维护商的信息集中管理,运维工作予以记录、评价,运维合同的到期提醒等,如何对维护商产生实际的约束力,发挥其在运维工作中应有的作用,是我们需要考虑的问题。

(十)应急预案管理

当设备或系统的故障达到规定程度时,启动应急预案,并对整个处理过程实现系统化管理,以及预案的演练等其他工作进行记录。

三、终端管理系统

目前通行的终端管理系统所包含的功能主要有:硬件信息的提取(CPU、内存、硬盘等)、操作系统基本信息(操作系统版本、安装的应用程序等)、软件分发、补丁管理、外设管理、远程管理、主机防护等。有的产品还具有接入认证、内外网隔离、硬盘加密、网络行为管理等功能。360安全套件在终端健康状况、插件管理、实时防护、木马查杀、垃圾清理等方面做的比较好。瑞星网络版则是着重防病毒。将这些软件的功能加以综合利用,建设终端管理系统平台(组),为运维管理中心提供数据。

厂区终端使用最多的是OFFICE办公软件和浏览器,出现问题最多的是浏览器,所以应当把对浏览器的运维作为终端运维的重点之一。此外终端管理系统收集的终端硬件信息可以与信息中心现有的资产管理系统建立联系,可以实现较为准确的资产定位,协同各部门信息员及时掌握资产的变动情况。

客户端的二次开发要求:客户端既属于终端管理系统,又可以和运维管理中心通信,同时可以对于我们所需的现有产品没有涉及到的进程或指标进行检测。

1、实时交互性

当运维人员需要远程维护时与终端用户进行询问、控制申请等信息交互,当运维任务结束后,终端用户可以给维护人员以相应的评价。运维管理中心收集到的终端健康情况也可以发送到目的终端,给使用者以相关的提醒。

2、人性化

终端使用人提交运维申请后,可以看到运维管理中心当前的运维状况,谁接手了自己提交的申请,自己排在第几位等信息。客户端运行应尽量避免对终端用户的正常工作形成干扰,如果能做到让使用者感觉很舒服又实用那是最好了。

3、资源占用率 客户端运行时,进程的大小,CPU占用率可以参考较为成熟的软件如360及瑞星运行时的情况。

4、定制化安装

对于信息中心维护范围内和维护范围外的终端,应该采取不同的安装策略。比如对维护范围外采用接入认证、监控健康状态、信息提醒等,但不启用维护功能。用户在安装客户端时,填写相应的信息以便系统管理。

四、运维系统建设工作重点 1.运维管理中心的开发 2.终端管理系统的建设

3.NETIQ系统所涉及监测指标的调整,与运维管理中心的接口准备 4.机房环境监测系统所涉及监测指标的调整,与运维管理中心的接口准备

5.对于特定应用系统的运行监测,NETIQ能否开发出对应的监测服务模块,或者应用系统的开发商可以开发出对自身运行状况的监测功能。6.与运维工作相关制度的完善、建立。

五、总结

篇6:IT运维服务管理支撑系统的设计与实现

1 ITIL服务管理概述

1.1 ITIL的内容结构

ITIL主要分为业务管理、服务管理、IT基础架构管理、应用管理、安全管理以及IT服务管理规划与实施六个部分, 这六个部分的内容是整个系统的重要组成部分, 任何一个部分出现问题都会造成系统的瘫痪, 所以要加强各部分的管理。服务管理是ITIL系统中的核心部分, 在进行管理的时候没有按照功能管理, 而采取了按照流程来组织的方式进行管理, 这种管理方式主要是通过相关流程的划分, 一般分为核心流程和辅助流程两个方面, 而且可以将核心流程再次划分, 分为服务提供和服务支持两个部分, 其中服务管理是由IT服务财务管理、持续性管理、能力管理等多个部分组成, 服务支持是由事故管理、问题管理、变更管理等多个部分组成, 由此可见ITIL系统的服务管理主要是通过层层流程划分的方式进行管理, 不仅保证了管理的有效性, 还在很大程度上避免出现管理漏洞。

1.2 ITIL的特点

1.2.1 免费性

免费性主要体现在企业、政府等各部门在使用的过程中不需要支付相关费用, 具有公共性的特点;并且任何公司都可以将ITIL作为基础进行优化和升级, 开发新的软件, 不需要支付费用。

1.2.2 最佳实践框架

首先, ITIL是各部分信息的汇集系统, 能够有效的储存各方面的信息, 其次ITIIL来源于实践, 通过实验来合理的提炼相关信息和系统, 从而也可以利用ITIL对实验进行有效的指导, 而且ITIL将上述服务管理的各部分流程之间的关系进行了有效地结合, 能够更加全面的了解信息, 从而保证流程的可持续运作, 由此可见ITIL是一种最佳的实践框架。

1.2.3 良好的质量保证

首先ITIL是以质量为重中之重的, 树立了质量思想, IT服务不管是在理念上还是方法上都以质量为前提, 通过制定各种协议加强管理的合理性, 包括就服务级别协议、监督协议等, 使IT信息系统的运行控制在合理的范围内, 在允许的范围内对数据进行分析处理, 从而保证其安全稳定的运行。

2 IT系统运维事件管理应用

2.1 结构设计

首先要加强事前的管理, 系统事件具有多样性的特点, 对系统的顺利运行造成了一定的影响, 多以要对常态事件进行检查, 根据检查的结果进行详细的分析, 包括事件发生的原因、时间、地点等各方面的情况都要进行详细的分析;对于常态事件应该制定相应的解决方案, 在出现问题时能够及时的解决, 避免造成更大的损失;其次要加强事后的管理, 事后的管理主要包括常态时间和突发事件的管理, 对于突发事件要尽可能的将其转化为常态事件, 能够更好的出现问题的原因进行分析, 并且采取常态事件的解决方式及时处理, 从而避免系统运行的故障。

2.2 信息采集

信息采集是整个系统的重要组成部分, 主要是对运行状态的相关信息进行采集, 包括网络设备、服务器、应用系统以及终端计算机等运行状态的信息都需要采集。这些都是IT系统中的重要组成部分, 对这些信息的采集在很大程度上保证了服务管理的效果, 对事件进行了有效的处理, 能够很好的发挥其价值。

2.3 建立运行维护指标体系

运行维护指标体系的建立主要是对系统运行的状态进行正确的判断, 运行维护指标体系的建立要跟随IT系统的不断发展进行适当的调整, 其次IT信息具有一定的复杂性, 包括上述所提到的网络设备、服务器、应用系统以及终端计算机等, 这些对象之间的运行数据具有一定的差异, 在建立指标体系时应该根据不同的运行状态建立合理的指标体系, 在发生事件时能够及时的找到出现问题的原因和地方, 并且及时的采取解决措施, 为服务管理的正确性提供一定的保障。

3 结束语

综上所述, 随着社会的不断发展和进步, IT系统的运用逐渐渗透到各行业的发展中, 但是随之而来的运维管理问题逐渐暴露, 对企业的发展造成了严重影响, 所以要充分掌握IT系统运行的重点和难点, 使IT运维事件管理系统更加符合IT信息系统的相关要求。笔者提出, IT服务管理理念是一种现代化的管理理念, 在实际的应用中还不够成熟, 需要不断的研究和探索, 尤其是面对计算机系统的复杂性, IT系统运维事件管理也就显得格外重要了, 比如说上文所提到了为IT运维人员奠定良好的基础, 从而提高整个系统运行维护的质量和效率;在自我探索的同时学习国外的先进技术和丰富经验, 使其在IT信息系统中能够得到广泛应用和普遍推广。希望通过本文的简单分析, 能够帮助相关工作人员更好的开展工作。

参考文献

[1]王惠畅.IT运维审计管理系统研究与应用[J].中国电子商务, 2011, 26 (10) :152-153.

[2]禹东山.面向持续服务改进的IT系统运维事件管理应用研究[J].南京理工大学, 2012, 13 (9) :161-162.

[3]哈传喜.基于ITIL的电网IT服务管理系统的研究与实现[J].北京交通大学, 2011, 25 (12) :256-258.

[4]吴国川.联软公司安全运维管理系统在企业中的应用[J].办公自动化 (学术版) , 2013, 31 (12) :32-34.

篇7:电力通信运维管理系统设计与实现

在电力系统中, 电力通信是比较重要的一个组成部分, 它包括了电网的生产与销售和各种调度工作, 能有效地实现电力企业的经济价值与社会价值。为了加强对电力通信运行的维护与管理, 提出了电力通信运维管理系统的说法。通过该系统的使用, 希望能够有效地对电力通信日常工作进行管理, 并使各部门工作保持系统化、规范化, 从而最终实现信息化与智能化办公方式;同时希望在使用该系统后, 能有效提高管理水平与管理质量, 保证电力通信运行的稳定性、安全性。在系统设计初期, 对电力通信企业领导与员工进行了调查与分析, 从而有效了解客户的需求与需要;针对该系统进行了经济可行性分析, 技术可行性分析和系统操作可行性分析, 这将为电力通信运维管理系统具体设计与实现做出基础准备, 保证设计的有效性。

1 电力通信运维管理系统的设计分析

1.1 电力通信运维管理系统的设计原则。

在对电力通信运维管理系统进行设计的时候主要的原则就包括易用性和可用性原则、安全性和稳定性原则、独立性和协作性原则、开放性和可扩展性原则等。

1.2 电力通信运维管理系统的总体框架设计。

本系统主要是采用微软的Window Form的C/S模式来作为相应的主体, 同时也预留了B/S模式的访问端口。系统物理结构主要的作用就是实现采集、统计数据以及分离业务管理;逻辑结构则是采用了比较常见的三层体系结构, 也就是用户表示层、数据访问层以及业务逻辑层;系统的开发环境则是选择比较成熟而且也方便进行团队协作的Visual Studio Team System 2008, 而开发的主要语言则是原则的C#, 在有些前台则是选择使用Ajax和Java Script;对于后台底层的数据库来说则是选择采用的Microsoft SQL Server2005。首先是功能结构的设计, 在对电力通信运维管理系统的功能结构进行设计的时候, 主要是通过电力通信运维管理工作的实际业务需求和系统的用例设计来对整个系统的功能进行设计, 电力通信运维管理系统中的核心部分是数据库管理系统, 而数据库管理系统又分成服务器端子系统和客户端子系统, 在服务器端子系统中主要的功能就包括:现场的作业管理、规程规定、系统维护、机构管理、资源管理、统计分析、数据库管理以及事务关系管理;在客户端子系统中主要的功能包括:现场的作业管理、规程规定、统计分析以及资源管理。其次是逻辑结构, 系统用户以及管理员在经过系统的验证之后, 就可以调用表示层的功能;而系统的中间层则主要是对表示层进行操作;最后在底层数据库中所有的操作都能够得到保存和体现。

1.3 电力通信运维管理系统的数据库设计。

在进行各种系统运用时, 都需要有相应的数据支撑, 这样才能有效保证系统的真正实现。针对电力通信运维管理系统的数据库设计, 具体如下:首先, 需要对数据库设计语言进行分析与选择。电力通信运维系统的底层数据设计时, 采用ADO.NET数据进行操作, 它包含了大量的组件, 能有效的提高数据设计的工作效率;同时由于其组件的不连续性, 在数据被访问与运用时能够单独调用或者协同调用, 增强了数据的灵活性。根据电力通信运维管理部门的工作分析, 数据库采用微软公司开发的MS SQL Server 2005进行。因为该部门工作的数据要求量不大, 使用大型数据库在系统上要求不仅高, 同时操作也比较的麻烦;而SQL server 2005进行操作比较的方便简单, 安全性比较高, 数据报表功能也比较的强大。最后在设计中, 也需要运用XML语言, 有效实现数据交换的规范化与标准化。其次, 数据库的设计。通过对电力通信运维管理部门的分析, 大概对其设计了五十个的数据表和相应的视图, 有设备信息数据表、工作信息数据表、厂商信息表、员工信息表、角色表、操作员表、权限表等;针对这些表, 建立起相关的关系视图。针对每张图, 对其相关字段进行设计, 字段名称、字段类型和字段长度进行了定义, 保证数据的可控性。字段名称中的ID号, 必须是唯一的, 这样才能数据在调用过程的一一对应关系。为了对数据表中的数据进行有效的连接, 可以通过公共配置文件实现, 如

///<summary>

///建立数据库的连接

///</summary>

///<returns>返回数据库连接对象</returns>当数据连接做好后, 就可以使用ADO.NET来对数据进行访问, 通过SQL Connection、SQL Command、等来完成。

2 电力通信运维管理系统的实现

当系统结构与数据库搭建好以后, 就需要对系统功能进行实现。首先, 需要对数据进行建模。电力通信运维管理在工作中会对相应的工作进行记录、对相关资料的组织与管理, 从而保证调度值班与数据描述的一致性。在对功能进行实现时, 需要做好告警数据模型、设备资源模型、业务模型和表单模型等。在对数据库中的数据进行录入的时候, 可以根据日常工作记录中的数据, 分别录入到相应的数据表中, 模拟现实工作中的事件, 使用系统来实施工作。在选取数据的时候, 需要采用统一的数据采集标准, 保证资源相关性和业务相关性。其次, 需要对业务流程进行规范, 这样才能保证系统与工作有效的结合。流程得到规范后, 将能保证业务流程和系统一起保持标准化, 从而促进业务工作的自动化处理。由于系统功能设计完成后, 在各功能模块中就含有相关的业务处理功能键, 日常维护工作可以就通过系统来完成。如现场作业管理, 在功能模块中保护了执行方式、缺陷消除、生产验收、大修技改、设备的巡视与清扫等。点击相应的功能键, 就会进入其对应的子功能模块中。其子功能模块中含有常用的添加、删除与修改功能键, 同时有对维护网络的基本信息描述, 如工作位置、耗材使用、仪器仪表、执行方式单等。当有维护站点出现时, 相关工作人员就可以在系统中进行查询然后进行相应的维护, 并做出相应的记录。

3 结束语

通过对电力通信运维管理系统设计与实现的探讨, 了解到了设计与实现该系统功能需要做好相关的基础工作准备。而功能实现主要依赖于基础数据, 所以针对基础数据一定要做到资源编码统一、各种模型规整, 这样才能有效的保证资源数据的唯一性和准确性。为了有效的提高电力通信运行的稳定性和安全性, 运维管理工作必须采用信息化管理水平, 这样才能有效的适应运行要求, 才能有效的对各种工作进行规划化, 为企业带去更多的经济价值与社会价值。

摘要:目前电力通信管理压力越来越大, 电力通信运行维护管理系统, 将能有效改变电管理困难的局面, 运用该技术将提高电力通信运行的质量, 提高管理的水平, 提高企业经济效益。所以有必要对电力通信运行维护管理系统进行设计与实现, 从而真正实现管理水平的提高。

关键词:电力通信,运行维护管理系统,设计,实现

参考文献

[1]闫舒怡.电力通信运维流程管理系统的应用改造[J].宁夏电力, 2010 (S1) :162-166.

[2]李欣.IT运维管理系统的设计与实现[D].华北电力大学, 2011.

[3]周里涛.四川省电力公司运维管理系统设计与实现[D].电子科技大学, 2011.

篇8:IT运维服务管理支撑系统的设计与实现

近些年,中国企业的信息化建设工作经历了以IT建设为重心的快速大发展时期。如今这部分企业中,大多数IT建设工作已经完成,多数信息系统渐渐趋于平稳。如何在IT建设过程中更多的考虑IT运维工作,已逐渐成为企业信息化部门亟需思考和面对的工作。企业通过学习IT服务的国际标准及成熟的信息技术治理理论,借鉴国内、外企业中IT运行维护的最佳实践和先进管理经验,综合自身IT运行维护现状,构建合理、高效的IT运维模式。

1 企业IT运维现状

现代企业内部拥有的信息化系统规模越来越大、功能越来越多、基础设施的升级更新也很快速,这些特点决定了企业信息化运维所面临的困境会越来越明显。

1)企业信息化进程的不断加速,促使企业内部的硬件、软件、网络以及各类业务应用系统不断升级更新及扩充。随着企业硬件设备的增多、业务系统的大量上线,导致运维过程中暴露出的问题越来越突出。由于硬件设备种类不同、品牌不同,系统结构、平台、数据、网络及应用的异构性,导致发生故障时定位问题会有所困难。运维人员长期处于“救火状态”,与此同时,业务部门却不甚满意。

2)IT运维管理并没有专人负责,IT人员在解决完各自的问题之后,往往就要投入其他工作中,导致问题背后隐藏的深层次原因不能被及时发现和处理。如果发生与运维相关问题时,业务人员正在处理其他更重要的业务,还可能会导致运维工作不能及时被相应,影响运维的效率。这样的结果,会导致运维处理问题周期短、质量低、效率不高、用户意见大等问题。

依据以上情况可知,IT部门目前的运维管理信息系统存在下述问题:

(1)运行监控的广度和深度不够

现有运维系统侧重于对硬件资源进行监控管理,对软件资源的管理较弱。由于对企业的软件资源监控支持能力不足,导致对用户的运维需求无法提供及时有效的支持。

(2)内容展现不够全面

现有运维系统运行展现内容不够全面,缺少预警信息统计和展现,缺少对设备性能信息的直观展现界面,无法满足及时监控的管理要求。

(3)缺少基于ITIL规范的服务流程

现有运维管理信息系统的设计,与ITIL(信息技术基础架构库)的运维管理理念存在很大差距。缺少事件管理、问题管理、变更管理、配置管理、发布管理等关键流程管理功能,无法满足现阶段服务管理流程要求,同时缺少运维管理制度建设和执行考核方面的功能。

由以上论述可知,企业IT部门的运行维护管理工作将迎接下述三类挑战:

(1)如何保证企业现有IT资源(软、硬件)在业务活动中长期稳定运行。企业内部需要7*24小时不间断保障的生产系统日益增多,大量业务访问量对系统性能的要求也不断增加;

(2)各类业务信息系统的复杂性越来越高,如何确保IT系统的运行效率满足业务要求是运行维护的关键问题。需要运行维护的业务信息系统数量激增,业务信息系统的架构日无复杂,业务信息系统的数据量持续增多;

(3)企业安全保密任务越来越艰巨,如何确保业务信息数据的安全系数与企业安全等级要求相匹配,也是我们面临解决的问题。信息安全体系的建设以及应急处理机制,数据中心的预警、检测、应急处理及自我恢复能力日趋重要。

2 IT运行维护管理方法论-ITSM

IT运维服务,作为IT服务中最主要也是最基本的服务,是由企业内部IT部门,根据企业自身的管理制度和业务流程,借助信息化手段和技术,对企业现有IT硬件资源、软件资源、业务系统进行整体维护以及对运维人员管理的过程。大量数据统计显示,在IT项目的整个生命周期,IT的运行维护管工作几乎占用了百分之80的时间。权威咨询公司Gartner Group的统计结果显示,由产品自身和应用技术引发的问题只占了所有问题的20%,与流程有关的失误造成的问题占了总数40%,而与人员有关的失误造成40%的问题。这就说明,IT运行维护中出现的大部分问题并非是由技术能力欠缺造成,绝大部分问题的源头来自管理。大部分问题源自流程和人员的失误,流程失误包括管理程序的变更、程序调试过程中的疏漏,人员失误包括因人员主观上的知识错误、能力缺陷和主动或被动误操作所导致的问题。为此,世界上很多企业和部门都对此进行探索,通过大量的实践和对统计数据的分析,以实践经验和成果为基础,总结出一种新的IT运维管理方法论,就是ITSM(IT Service Management,IT服务管理)。

IT服务管理,顾名思义,是面向IT服务的管理,其管理核心是管理用户对IT的需求。ITSMF(国际IT服务管理论坛)任务,ITSM是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与组织业务,提高组织IT服务提供和服务支持的能力和水平[1]。因此,ITSM又被描述成IT管理的“ERP解决方案”。

总体而言,ITSM是服务于IT的管理方法集合,是系统化的、有序的、完整的协同流程集合,其工作重心是保证IT的服务质量,其管理对象是用户的IT需求,其目的是保证IT服务质量,其依据是控制服务级别协议(SLA),其管理内容涵盖了问题管理、变更管理、配置管理等主要流程管理。

3 基于ITSM的企业IT运维管理信息系统初步设计

目前,企业IT整体运行维护工作划分为两类:IT技术人员主动发起的运行维护和IT技术人员被动受理的运行维护。主动运行维护多属于例行检查,是IT人员每天都要完成的工作,重复性较多;被动运行维护来自于用户的各种需求,运维人员需要针对用户的需求去作出快速响应,确保服务及时有效。企业信息中心技术人员按照现有的运行维护流程,借助运维管信息系统,对日常的IT业务进行维护管理其维护范围主要涵盖机房环境监控、基础设施监控、业务应用系统运维等。

传统的IT运行维护模式一般具有以技术为导向、IT人员多充当“救火队”角色、被动、不可重复&混乱、流程不标准、偏向从IT部门内部考虑等特点。ITSM则具有流程为导向、预防为主、主动、可重复&职责明确、正式流程、从业务角度考虑等特点。

实现IT运行维护管理的流程化、规范化,对IT部门而言意义重大。运行维护人员可以及时梳理、分析、归纳和总结发生的问题,使工作安排更加合理,避免相关人员因陷入杂乱琐碎的问题处理过程而无法脱身,能够极大提高工作效率。

流程是IT服务管理的基础,IT服务管理的流程建设需要与企业业务相结合,同时遵循PDCA循环过程,不断对现有流程进行改进和完善。企业的业务流程取决于企业的战略规划目标,IT服务来源于企业的业务流程,而IT服务能力最终又将对企业的战略规划产生影响。这一过程遵循PDCA(戴明环)模型,是一个不断循环、互动的正反馈。

企业目前正在大力实施AOS体系建设,AOS是质量、成本、效率三要素并重。AOS业务流程梳理及优化,能够使各类业务流程显性化,促进各类要素的提升。利用AOS梳理过的标准化、规范化的业务流程,利用信息化平台完成对标准化、最优化的业务流程的固化,更快、更好的形成符合自身特点,具有自身特色特点,反应敏捷、高效可靠的IT运行维护管理模式,实现以ITSM为基础的企业IT运行维护流程化和自动化。

通过对目前IT管理的各个方面如服务器管理、网络管理、系统软件管理、应用系统管理、数据库管理等多方面进行调研,生成了符合IT部门运行维护需求的流程,并将这些流程整合为特定的IT服务。

面向服务的IT运行维护管理可初步设计如图3所示。

基于ITSM的IT运行维护管理信息系统,可以将IT运行维护服务管理分为六大功能模块,初步可设计为资产管理、监控管理、应用管理、安全管理、流程管理和运维综合分析六大功能模块。

基于ITSM的企业IT运维管理信息系统功能模块的划分及构成如图4所示。

其中,各个业务模块的具体功能描述如下:

1)资产管理模块:资产管理模块可以实现对I T系统各类软、硬件资产的使用、成本等信息的维护和统计;

2)监控管理模块:监控管理模块可以实现对IT基础设施的监控管理。IT基础设施管理包括存储、备份系统管理、主机系统如服务器、小型机等管理、安全系统如安全设备及安全软件管理、网络系统如交换机、路由器等管理、桌面系统如PC终端等管理,以及机房动力及环境如空调、电力等管理;

3)应用管理模块:应用管理模块包括对各类核心业务应用系统的监控,实现对应用系统进行日常应用问题处理、应用集成以及应用改进等功能;

4)安全管理模块:安全管理模块包括对企业内部大量PC终端的安全维护,以及对主机、网络设备、安全设备等资源的安全监控;

5)流程管理模块:流程管理模块涉及服务台、事件管理、问题管理、变更管理、配置管理、服务级别管理、知识管理等业务;

6)运维综合分析模块:运维综合分析模块可以在各个管理功能的基础上,实现企业IT环境整体运行情况的分析,帮助管理人员了解运维现状,制定或修订运维计划。

结合上述IT运行维护流程及对应的IT运行维护管理系统,企业可以提供给用户更快更好的运行维护服务,为用户提供便利的工作条件,提升用户满意度。

4 结束语

企业通过建立合理的IT运维流程和管理系统,在确保系统的安全性、稳定性、运维的可靠性的同时,能够为用户提供更好的服务,及时解决信息化系统使用过程中出现的各种问题和故障,做到想用户所想,急用户所急,就能更好实现IT运行维护服务管理的目标和主要任务。

摘要:随着企业各类信息系统的建设完成和大量投入应用,系统的安全性、稳定性以及运行维护的可靠性越来越被人们关注。文章基于对ITSM及相关标准的研究,通过对现行IT运维工作的实际情况进行研究,初步设计了适用于企业当前信息化信息系统运行维护特点的IT运维管理信息系统。

关键词:IT运维,ITSM

参考文献

上一篇:老年大学教师得奖心得感悟下一篇:一年级语文期末试卷分析(2015.1.)