IT运维系统标准篇---桌面管理

2024-08-18

IT运维系统标准篇---桌面管理(通用10篇)

篇1:IT运维系统标准篇---桌面管理

http://

现在,随着电脑在企业中的普及,大部分企业的硬件和网络环境已初具规模,企业中的联网电脑多则数百上千台,这些电脑往往运行着从办公系统到业务系统的各种前端应用,它们的稳定性、可靠性、安全性以及性能等方面的因素,不仅直接影响着电脑使用者的工作效率,而且对整个企业的IT应用效率和管理成本以及安全性产生重要影响。

企业在桌面和设备管理领域,通常遇到什么方面的问题和挑战呢?电脑感染病毒、被安装木马,有些不明程序不断抢占IP地址造成其他机器无法正常工作,还有部分员工使用BT、电驴等下载工具时有发生。如果同时有多台计算机感染网络病毒或者进行非法操作,非常容易导致网络阻塞,从而致使其他正常网络业务无法使用。企业桌面管理解决方面已经成为企业网络运行管理系统不可缺少的重要组成部分,越来越受到网管人员和企业领导的普遍重视。

概括起来,这些问题即是IT资产的统计和追踪、软件和操作系统的安装、日常维护、安全监控和管理、应用监控等。由于桌面设备经常更新,对企业到底有多少设备,每台设备的配置情况如何,各台设备是否按规定安装了安全产品、是否及时打上了补丁?对这些信息很难有一个实时的掌握,致使IT管理常常处于被动状态。这些问题完全可以通过桌面管理软件得到解决。

新一代桌面管理平台标准

新一代桌面管理平台可以相互高集成度、支持多种平台、支持异构网络、功能完善、易于部署,应用灵活、方便,从而能够帮助企业用户实现桌面设备配置和安全管理。支持多级级联安全设计,采用“集中管理、分布部署”方式,可以支持大规模客户端的统一管理,确保安全策略实施的有效性,分布式部署体系满足了大型企业用户服务的需求。

新一代桌面管理平台不仅能够自动显示网络中的所有节点信息以及软硬件信息,而且能够将这些信息与组织人事信息合理组合在一起,从而方便网络中的所有资源得到统一管理和配置。另外,桌面管理平台能够通过控制管理客户端用户安装的软件以及运行的程序来对其行为进行控制,从而达到一个网络和主机的统一管理,极大地提高了安全管理力度。

新一代桌面管理平台可以提供了客户很方便的像可执行程序、MSI安装包或者文档数据文件自动下发与安装的功能。支持参数方式增加软件分发时安装选项,可以使得IT管理员很方便快速部署软件,极大地降低了IT管理员的工作强度,提高工作效率。并且可以按照部署范围进行分发,不会影响企业整体网络带宽。

新一代桌面管理平台具有完备的IT资产管理、员工行为审计、桌面终端安全管理、终端网络准入控制等主要功能,与国内外同类产品相比较,具有非常高的性能价格比,同时能实现对企业所有终端设备的远程支持及软件分发,不仅大幅度减少了IT人员现场支持的次数,同时能够确保软件和应用升级的顺利进行。桌面管理平台采用WEB方式,自动补丁模块最基本的功能就是按照即定的策略对桌面终端进行补丁的自动检测、服务器对所需的补丁下载和自动安装。

http://

新一代桌面管理平台解决方案

新一代桌面管理平台解决方案是为企业管理者量身定做的联网桌面终端综合管理平台,其在设计时就遵循了ITIL/ITSM规范及国家信息安全标准等原则,定位桌面管理系统的架构、性能、功能和管理界面。因此,桌面管理解决平台方案具有符合国内企业IT架构和管理模式,且真正适合用户最迫切需求的桌面系统管理平台。

新一代桌面管理平台解决方案不仅能够采集到桌面电脑固定的软硬件配置信息,跟踪软硬件配置变动信息,而且能够进一步获取桌面电脑的网络连接信息、用户信息。IT资产管理不应该是孤零零的设备管理,而应该是结合人的管理。帮助企业建立IT资产台帐管理机制,从IT资产采购、维修、报废等全过程进行管理可控。

桌面管理平台可以解决企业大量的桌面安全管理问题,提升IT服务部门的工作效率,解决大部分手工操作工作,对员工行为操作做审计并规范。终端桌面安全管理技术的兴起是伴随着网络管理事务密集度的增加,作为网络管理技术的边缘产物而衍生的,它同传统安全防御体系的缺陷相关联,是传统网络安全防范体系的补充,也是未来网络安全防范体系重要的组成部分。因此,终端桌面安全管理技术无论在现在还是未来都应当归入基础网络安全产品体系之列。

Broadaview广通桌面管理套件是一个完全集成的、跨平台的模块化桌面管理平台解决方案,能够在单一的控制台上对管辖范围内各种终端设备的桌面进行远程控制和管理,方便地对企业复杂而易变的桌面设备资产进行高效跟踪和统计,远程安装和配置操作系统和应用程序,帮助企业解决桌面管理所遇到的各种“难题”,使IT管理人员从大量的重复工作中解放出来。

Broadaview广通桌面管理套件采用模块组件化设计,主要功能模块是全独立,可以分离、可以集成。完全按照用户的网络现状、实际信息化管理需求进行选择组合,真正做到按客户所需提供合适服务。广通桌面管理套件参考BS7799的资产分级管理要求,可以实现非常灵活的资产分组、分级,对不同组别的资产,可以采取不同的安全管理策略,切实保护用户IT投资,提高IT运维效率。

篇2:IT运维系统标准篇---桌面管理

目前,许多品牌电脑专业服务商的售后服务部门,正日益摆脱从属厂家的地位,开始走商业利润最大化之路,发展成为专业服务商。部分技术服务公司从大型企业集团客户服务体系(提供售后维修服务等)的成本服务中心成功转型,成为面对各类行业客户的独立的第三方专业技术服务提供商,大力开展了IT运维外包业务,这类公司的出现逐渐使硬件厂商把服务部门从成本中心转化为利润中心。

IT运维服务业务目标介绍

IT 系统服务和运行维护业务在内的所有业务都是围绕者“技术”、“人”和“业务流程”三个基本元素展开的,这三个要素互相关联、互相制约,共同决定IT运维服务业务目标的成效。对于IT服务和运行维护业务来说,IT运维服务业务目标是保证IT系统正常、可靠、高效、安全运行,为业务部门提供优质服务;“技术”指各种管理监控系统,“人员”是IT支持部门各级员工,“流程”指IT服务和运行维护的各种业务过程,如报警故障处理流程、设备配置修改流程等等。

IT桌面运维服务,指的是员工在工作场所使用的一系列用于信息处理、通信和计算的设备,包括计算机软硬件和其他的相关设备,对它们的管理是每个使用IT桌面的单位机构最日常的工作。具体的说,就是办公环境的维护,详细的工作包括:

1.系统初始检查

对于办公环境刚刚建立或准备建立之时,可提供对全局环境的检查,并得出最佳适合于单位的方案或找出不合理性、出现的问题。

2.硬件故障解决

对PC、笔记本、打印机等办公设备的故障进行定位和处理。

3.硬件扩容升级

升级不满足于办公环境的设备进行升级或更换处理。

4.软件系统支持

对系统软件、一般运用软件进行维护,如选型、安装、使用、优化等进行技术指导和处理,并可实现对系统的监控来实现维护的零距离。

5.防病毒系统的支持

进行防病毒安全方面的技术处理,如查杀病毒、防病毒软件的解决方案、病毒防范安全策略等。

6.网络系统的支持

对简单网络状况进行全局的维护,并做出定制的优化和故障处理。

7.日常维护管理

管理企业中各IT系统的资源资产情况,实现企业的财务部门进行更加方便的数据交互;规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段,实现完善的IT运维管理为企业提高经营水平和服务水平。

8.咨询服务

对于以上的IT桌面运维服务环节提供相应的咨询服务,但在维护合同签署之后依据合同实行。

IT运维管理服务方式介绍

作为IT运维管理,企业在发展过程中都会重视。而对于IT运维管理员来说,必须要掌握IT运维管理服务方式等技巧,才能更好的发挥出运维系统对企业的作用。

IT运维管理服务方式

1.电话支持

2.网络支持

3.现场服务

4.回访支持

5.专人服务支持

6.定制服务支持

提供多方位、多手段的技术支持,以达到解决客户问题的简化和更佳运维的效率化,另也可根据与用户签订的其它服务承诺,以保证提供更加高效的技术支持。

响应、服务时间

根据IT运维管理服务方式将服务分为若干级别,以确定具体的服务的时间和响应时间。

服务购买方式

1.按小时购买支持服务

2.按购买支持服务

3.按项目购买支持服务

4.其它方式

(市场已有方式、仅为参考)

以上就是我们为大家介绍的有关IT运维管理服务方式等技术。

怎样才算是一个合格的IT运维工程师

1、保证服务达到要求的线上标准,如99.9%;保证线上稳定,这是运维工程师的基本责职所在。

2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性、和创新思维。

3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。

4、通过创新思维解决运维效率问题;目前各公司大部份运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。

5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。

6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。

7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。

以上只是技术上的一些层面,当然个人意识也是很重要的。

补充:

个人素质方面:

1、沟通能力、团队协作:运维工作跨部门、跨工种工作很多,需善于沟通、并且团队协作能力要强;这应该是现代企业的基本素质要求了,不多说。

2、工作中需胆大心细:胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;心细,运维工程师是网站admin,最高线上权限者,一不小心就会遗憾终生或打入十八层地狱。

3、主动性、执行力、精力旺盛、抗压能力强:由于IT行业的特性,变化快;往往计划赶不上变化,运维工作就更突出了,比如国内各大公司服务器往往是全国各地,哪里便宜性价比高,就那往搬,进行大规模服务迁移(牵扯的服务器成百上千台),这是一个非常头痛的问题;往往时间非常紧迫,如限1周内完成,这种情况下,运维工程师的主动性及执行力就有很高的要求了:计划、方案、服务无缝迁移、机器搬迁上架、环境准备、安全评估、性能评估、基建、各关联部门扯皮,7X24小紧急事故响应等。

4、其它就是一些基本素质了:头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。

篇3:软件企业IT运维管理系统的设计

在现代工业体系下,软件企业对于IT系统的依赖越来越大,随着企业业务线的不断扩大,用户量业务量的不断增加,已经使IT基础运维的负担变得越来越沉重,有针对性的、全面的IT运维自动化管理系统,不但能保证IT基础设施的稳定性,而且能直接降低企业运营成本,提升IT服务质量。因此,研究和实践IT运维管理理论,并建立可实际运行的管理系统,已成为软件企业面临的共同课题。

1 IT运维管理系统的现状

信息技术基础设施库(ITIL)是基于过程的实践,旨在为企业的IT部门提供一套从策划、研发、实施到运维的标准管理方法。经过几十年的发展,基于ITIL,其它一些IT服务管理流程体系(框架)也已经被开发出来。例如HP公司的IT服务管理参考模型、IBM公司IT流程模型以及微软公司的微软运营框架等 [1]。以ITIL为基础,IBM、BMC、CA、HP、FrontRange等厂商都有全面的服务台解决方案 [2],其中一些还通过了ITIL兼容性认证,这些解决方案以其众多的成功案例向客户证明了它们的价值。

国内现在很多企业的IT运维虽然已经由过去的“手工作坊”式在向计算机管理转变,但仍旧处于半自动化状态。对IT管理软件的应用缺乏一定的深度,同时,相关的管理制度也缺乏及时的梳理、完善和优化。IT部门常常是被动、低效率地手工救火,总是处于“备战”状态,即使这样问题仍旧是层出不穷。所以,我们需要改变IT运维管理的思想,将被动的管理转化为主动监控管理[3],以便防患于未然。

目前,国内的很多软件企业都非常认同IT运维在企业中越来越重要的角色,但与国外尤其是欧洲相比,我国的IT服务管理还处在发展初期,还需要不断地、持续地完善。

2 IT运维管理系统分析

需求确定阶段的任务就是和客户一起确定、分析和协商需求。需求并不意味着会给项目带来额外的负担,只有明确了客户的需求,才能为后续的设计与实现打下良好的基础。

IT运维管理系统的开发,主要目的是对企业的IT运维相关工作进行有效地梳理,使其流程化和规范化,并能够通过系统进行基础数据采集,可以实时地通过报表进行有效地监控和管理。经过认真地调查、分析、总结,以及与企业管理者及企业业务人员的多次沟通,最终确定IT运维管理系统共包括四个子系统,分别为资产管理子系统、License管理子系统、数据采集子系统以及统计查询子系统。其中:

(1)资产管理子系统:主要是对IT运维过程中产生的资产进行管理。主要包括服务器管理、员工设备管理以及知识资产管理。

(2)License管理子系统:主要对产品使用的License许可进行管理。主要包括License申请、License待办及License查询。其中申请部署版的License,需要走审批流程,必须经过管理层同意后才能发放License。

(3)数据采集子系统:主要对运维过程中产生的基础数据进行收集。主要完成对基础数据的增加、删除、修改和查询。基础数据包括产品销售机会信息、实施任务信息、实施日报信息、实施项目及联系人信息等。

(4)统计查询子系统:主要对采集上来的基础数据,根据不同的需求进行不同维度的查询,并最终生成报表样式进行展现。其中,数据填报模块不同于其它几个报表的功能,它主要是实现将使用报表填写的数据回填进数据库功能。

通过对功能分析得到系统用例的主角,如表2.1所示。

3 IT运维管理系统设计

通过对软件需求的分析,已经得出了IT运维管理系统的目标。进入设计阶段后,要把软件系统的逻辑模型变换为物理模型,即着手实现软件的需求,软件设计是一个把软件需求转换为软件表示的过程。

3.1系统功能模块设计

设计的目的是为软件结构图中的每一个模块确定使用的算法和块内数据结构,并用某种选定的表达工具给出清晰的描述。IT运维管理系统主要功能包括:资产管理子系统、License管理子系统、数据采集子系统及统计查询子系统。本系统以模块化的方式进行功能划分,也以模块化的方式开发,虽然各个功能子系统都是独立的模块,但是它们之间还存在业务上的联系。系统总体功能设计,如下图3.2所示。

3.2软件开发平台总体设计

本系统使用UniEAP开发平台进行开发,应用服务器采用Tomcat应用服务器,数据库管理系统采用Oracle。通过UniEAPPlatform平台,可以把独立的业务应用及其数据库、静态的网站等建立和集成到一个可管理的环境中,实现一体化、集成式政务信息化应用,同时利用业务系统构建工具,不需重新开发而快速搭建符合本行业特色的应用系统,并随着应用的深入而及时扩展和调整,以缩短开发周期、避免重复建设、提高维护水平,全面实现业务系统的信息共享和互联互通。在组件、工作流等开发模式下,动态地建立应用模型,依托开发平台,通过定制,实现应用系统的快速搭建和灵活调整,在最短时间内建立符合自身管理特点的应用系统。

IT运维管理系统中的统计查询子系统主要使用UniEAP Report平台完成。UniEAP Report由设计器、引擎及管理控制台组成。其中设计器是类Excel的、图形化的报表制作工具,引擎负责解析设计器的定义文件,管理控制台可以预览报表结果并发布报表模板。对于参与报表计算的数据做必要的预处理。根据报表内容定义中间数据库表(业务开发中常称为“中间表”),然后周期性地同步数据到这个表中,也可以在报表生成前调用存储过程同步数据到中间表。

3.3数据库设计

数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求。数据库设计是系统设计的基础,一个好的数据库设计除了满足软件需求之外,还要满足易维护、易扩充、占用空间小、执行效率高等要求。通过分析IT运维管理系统数据库中设计了八个数据库表,说明如下:

(1)销售机会表主要用于存放产品销售机会的相关信息,主要包括机会名称、客户名称、所属区域、销售类型等。

(2)实施任务表主要用于存放实施任务的相关信息,主要包括任务名称、任务难度、任务的相关工作量信息、任务类型等。由于实施任务有可能也关联销售机会,所以表中也需要预留销售机会相关的字段。

(3)实施任务参与人表主要用于存放实施任务中所涉及到的任务参与人相关信息,主要包括关联的任务ID、任务类型、用户相关信息等。

(4)实施日报表主要用于存放实施任务参与人员所填写的实施日报的相关信息。主要包括人员ID、人员名称、对应的任务ID、任务完成所用的时间等。

(5)实施项目表主要用于存放实施人员所支持的项目相关信息,主要包括项目编号、项目名称、系统名称、客户名称、项目经理相关信息、项目合同额相关信息等。

(6)实施联系人表主要用于存放实施人员所支持的项目所对应的接口联系人的相关信息,主要包括联系人姓名、所属部门、业务方向、联系方式等。

(7)系统角色表主要用于存放系统本身所用到的角色,在第3章需求分析中提到的各种角色,如行业经理、实施助理、实施人员等的属性信息都存储在此表中。主要包括角色ID、角色名称、使用状态及创建和修改角色的相关信息等。

(8)系统用户表主要用于存放使用本系统的用户信息,主要包括用户ID、用户账号、用户姓名、密码、用户的其它基本信息及创建和修改用户的相关信息等。

4 总结

现在,IT运维管理已经越来越受到企业高层的重视,有的甚至直接影响着企业战略决策。本文中的IT运维管理系统只是完成了IT运维管理中极其微小的一部分,IT运维是一项非常庞大的工程,涉及的面非常的广,还需要进行持续地梳理和不断地完善,并逐渐纳入到IT运维管理系统中。

摘要:伴随着计算机应用系统的不断升级,IT运维管理已经成为了当下IT界炙手可热的话题。本文结合企业实际的IT运维管理现状和业务需求,设计了IT运维管理系统,使企业可以通过系统对日常管理的数据进行有效地采集,并通过报表加以分析,以达到不断优化其管理模式的目的。

篇4:浅谈IT运维管理之系统集中监控

【摘 要】随着网络应用技术不断发展,IT系统越来越复杂,业务对IT系统的依赖程度也越来越高。本文从项目背景、需求目标、功能设计、效果分析几方面探讨集中监控系统的建立。

【关键词】IT运维管理; 监控系统 ;数据采集

【中图分类号】C93【文献标识码】A【文章编号】1672-5158(2013)07-0070-01

前言

随着企业信息系统项目的不断建设和应用领域的不断拓展,企业管理运营对信息系统的依赖性越来越大,对IT基础平台的运行可靠性要求也越来越高,企业的信息化工作逐步从项目建设阶段转向以深入应用、提升应用水平的运行维护阶段。提高运维管理水平已成为现阶段企业信息化系统应用的重要保证手段。

一、背景

信息管理部是信息化专业主管部门,负责网络、主机等IT基础设施和应用系统的建设、维护,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,企业应用不断增多,主机服务器、网络实施、操作系统、数据库、应用服务器等软硬件平台日益复杂,服务用户的面不断扩大,如何维护好日益增多的主机网络设备,保证各个应用系统安全顺畅运行,为用户提供良好的服务并及时解决各类问题和故障,是IT运维管理的关键所在。目前IT运维管理还处于初级阶段,还没有构建一个综合的IT运维管理体系。对网络、主机、系统等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化。因此需要建立一套融合组织、制度、流程、技术的IT运维管理体系,从粗放、分散、低效的管理逐步过渡到科学、规范的管理,实现从手工运维到自动化运维。按照IT运维管理理论、方法和标准,结合实际和建设需要,遵循立足需求、统一规划、分步实施原则。根据实际人员和管理情况,当务之急是需要建立集中监控系统,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保网络及信息系统正常、稳定、高效运行。

二、系统架构

2.1 系统架构图

集中监控系统实现对不同服务对象和IT资源的实时监控,包括主机、数据库、中间件、存储备份、网络、安全、机房、业务应用和客户端等,并通过集中监控管理平台对不同被管对象进行综合处理和集中管理,其系统架构如图1所示。

2.2 数据采集层

数据采集层负责基础监控数据的采集、归并、筛选、过滤、关联等处理,同时对数据进行本地存储。数据采集的方式根据被监控对象的不同可分为:

(1)路由交换机及网络安全设备的数据采集方式采用SNMP协议轮询,接收SNMPTRAP以及Sys-log,采集相关的状态、事件信息。

(2)主机服务器针对不同的操作系统类型和监控的要求,采用SNMP协议、WMI、TELNET的方式轮询。对于特殊应用需求,可以采用AGENT的方式采集数据,满足个性化的需求。

2.3 数据分析处理层

数据分析处理层根据系统设定的各项功能模块的具体要求,对数据采集层提供的数据进行进一步组织、分析和存储,并将结果提供给上层的数据呈现层2.4 数据呈现层数据呈现层根据数据分析处理层提供的数据,通过Web界面以视图、报表等方式向用户展现。

三、系统主要功能

3.1 数据采集

数据采集是整个集中监控系统的基础功能。采用SNMP、WMI、TELNET等协议轮询、接收SNMPTrap、Syslog,或者通过安装在主机/服务器上的A-gent上报信息,来获取被监控对象的状态信息、日志信息和告警信息,并作相应处理。

3.2 故障判断集中报警

故障判断根据采集的基础数据和设定的判断基准,对事件进行判定,确定故障是否存在,并生成故障级别信息。集中报警功能根据故障判断提供的故障级别信息,采取不同的报警策略自动触发,驱动不同的报警程序,比如邮件、短信、声光等。

3.3 性能管理

性能管理对设备性能进行实时监控,比如:网络设备的CPU、内存、端口流量,主机系统的CPU、内存、磁盘读写、交换文件等。监控参数管理可以定义监控周期和性能阈值,当性能超过阈值时,系统发出报警信息。

3.4 网络拓扑管理

网络拓扑管理利用直观的图形展示,帮助管理员更好地了解网络系统的联接情况,在网络中出现故障时能够快速定位故障发生的位置,从而更快速恢复故障。网络拓扑管理根据网络连接情况,自动生成和实际情况相符的网络拓扑图,为管理员提供真正的网络视图。通过网络拓扑图管理员可以方便地掌握设备分布情况和每个设备的运行状态。

3.5 报表管理

报表管理用户可以订制资源使用报表、故障统计报表、资源趋势报表、TOPN统计报表、可用性统计报表、综合报告等不同类别的报表,并生成柱状图、曲线图、饼图等直观图表,实现各种信息的统计和分析,全面、宏观地展示网络的运行情况,有助于更细致地分析网络数据,察看网络、系统中可能存在的热点故障、故障多发设备、故障多发时间,性能变化趋势等,从中发现规律和趋势,为决策者和管理人员提供详细的统计分析报表。

3.6 配置管理

配置管理主要反应网络系统中被监控系统配置更新的情况。

3.7 系统管理

系统管理主要包括系统配置、用户管理、监控行状况等的管理。用户管理是实现系统用户的基本信息维护和权限管理。监控策略管理是根据不同的监控对象和应用环境,设置不同的监控策略,比如数据采集周期、报警方式。

四、结束语

篇5:IT运维系统标准篇---桌面管理

目录

运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6

5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8

6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11

6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12

7.1应急准备----------12 7.2应急处置----------13

运维管理规范

1.目的

为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。

2.适用范围

本规范规定了运维管理工作的要求。

本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。

3.规范性引用及参考

◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则

◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求

◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)

◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)

4.本文术语,定义和缩略语

1、IT: Information Technology 信息技术

2、DNS: Domain Name Service 域名服务

3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议

4、VPN: Virtual Private Network 虚拟专用网

5、OA: Office Automation 办公自动化系统

6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:

7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。

8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。

9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。

10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。

5.基本要求

5.1运维管理原则

公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。

计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。

5.2制度和流程管理

运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。

运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。

5.3 文档管理

对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。

文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。

5.4设备和软件管理

建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。

规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。

对外送设备的维修进行严格管理,防止数据泄露。

对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。

5.5供应商管理

对供应商支持运维服务的相关活动进行统一管理。

在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。

应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:

a)明确外包公司应当承担的责任及追究方式;

b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。

5.6督促检查

定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。

指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。

6.运行维护

6.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。

计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络

延时、丢包率等;

c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d)存储:设备运行状态、数据交换延时、存储电池状态等;

e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

6.2 数据与介质管理

配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。

对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

6.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。确保机房环境整洁和安全,包括:

a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。

d)未经审批不得接入其它用电设备。

6.4 网络管理

确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;

b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;

e)应定期检查网络设备的用户、口令及权限设置的正确性;

f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计

算机网络跳线应整齐干净,跳线标识清晰;

h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

权限管理应包括如下要求:

a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。

6.5 弱电管理

严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

6.6桌面维护

日常数据注意事项:

a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。

b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。

c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。

重装系统前注意事项:

a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。

关于账号、权限、密码

a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。

c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。

d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。

f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。

g.妥善保管自己所知的密码。

6.7服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。

6.8 配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

6.9 事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.应急管理

7.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密

切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包

括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c)应建立有效的应急通讯联络系统,确保信息畅通;

7.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

篇6:IT运维系统标准篇---桌面管理

基于ITIL的流程框架的IT运维管理系统,能够快速适应企业业务流程及业务发展变化需求的IT运维管理最佳实践,能够帮助企业从人员、技术和流程三个方面提高IT运维管理能力,本文就来为大家介绍基于ITIL的IT运维管理系统。

基于ITIL的IT运维管理系统可以逐步建立并完善、达到以下目标:

标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维管理流程。

流程化——把大部分的IT运维管理工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。

自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。

基于ITIL的IT运维管理系统为用户解决了哪些问题:

运行维护管理—重要性

事前管理——通过监控系统,及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然,事前管理的目的。

迅即的故障报警—全天候自动检测与及时报警,通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。

ITIL的标榜—IT服务最佳实践

提供灵活的、流程化的IT服务管理,帮助企业完成流程定义、流程执行、流程监控以及流程的优化。将日常操作全部流程化,并通过自动化工具对流程执行情况进行及时追踪。

业务流程化、流程自动化、服务规范化

通过流程管理来简化IT部门繁琐的业务,把维护人员从救火队员中解救出来,规范运营管理。本文叙述的IT运维管理系统以ITIL的流程框架,缔造一个流程化,自动化和规范化的IT运维管理系统。

以CMDB为运维核心,自动发现资源配置项

CMDB有两部分重要内容,一是CI,二是CI之间的关系,这两部分构成了CMDB比较核心的内容,在CMDB初始化方面,很多产品只是提供了手工输入的方式对CI 的初始化,用户需要面对大量的需要手工输入的信息,造成系统使用前的高门槛,而摩卡软件在这里提供了两种方式快速进行CMDB的初始化,第一种是自动发现CI,第二种是从Mocha BSM系统中导入,大大简化了用户管理员的工作,快速搭建ITIL最佳实践平台。

多种渠道新建故障处理请求 为了提交企业各部门所遇到的IT故障处理请求,用户可以通过自助服务台、电话通知服务台、监控系统自动触发等方式发起故障处理请求。通过自助服务台用户可快速新建故障处理请求,并随时追踪该故障请求的状态,如该故障请求是否已经在处理当中,或者已经转为变更流程,需要继续通过变更管理才能解决故障等。

知识库与 FAQ 的紧密结合,IT运维管理经验的积累,IT运维管理经验的积累转入到知识库中

符合ITIL框架,规范IT部门管理

用户实施ITIL的一个重要目的就是要规范IT 部门的管理,让日常运维更加规范化、流程化、自动化,在产品中是通过自动化和流程化来体现管理的规范化的。

客户化的IT运维管理流程,满足不同业务需求

流程必须客户化,产品如何做到呢?两个层面,第一个层面就是可以方便的在用户所需要的范围内进行不同版本流程的切换,第二个层面就是用户可以方便的通过可视化工具对流程进行定制,不需要二次开发的代码,只需要简单的鼠标拖动即可完成流程自定义。

可定制的KPI报表,度量流程执行绩效

系统中提供了很多和报表,来度量各个流程执行的绩效,报表是用来做统计用的,一般用来做各类别数量的统计或者是变化趋势的统计,KPI 是经过计算的,衡量各个模块执行绩效的,在首页上点击后下面列出的黄色边框的是报表,而绿色边框的是KPI。

篇7:IT设备集中运维管理系统研究

随着企业信息化建设的飞速发展,信息系统已成为企业正常运营的重要支撑。在企业信息系统中,包括硬件系统与应用软件系统两部分:硬件系统包括服务器主机、路由器、交换机、存储设备、防火墙等硬件设备;应用软件系统包括OA、ERP、CRM、邮件系统等各种信息化应用系统,这一系列的软硬件系统组成了企业信息化系统的核心,支撑企业业务的正常运转。然而,随着企业规模的扩大和业务的扩充,信息化应用也变得越来越复杂,如何维护这些软硬件系统变得越来越重要,而且难度也越来越大,如何从传统的分散式IT运维管理模式转向集中式IT运维管理,如何从面向机器的IT运维管理转向面向用户感知的IT运维管理,如何从IT运维中获得有效的价值输出,都是亟待解决的重要难题。因此,建立一个系统、科学、高效的面向用户感知的IT运维模式是IT运维的必然趋势。

1 系统需求分析

1.1 监控对象

监控对象包括硬件与软件,以及硬件软件的各项监控指标,具体内容如表1所示。

1.2 监控预警

实现指标预警,指标预警包括上限预警、下限预警、区间预警,系统自动生成告警信息,并实时通知管理员或各专业负责人。

1.3 用户感知

将面向设备的IT运维系统,转向面向用户的IT运维系统,提高用户的使用感知度,可通过手机终端、IPAD等移动终端实时了解设备、系统运行状态,并可通过这些终端设备,进行主动维护功能[1]。

1.4 价值输出

通过IT运维监控中的大量性能数据,进行数据挖掘分析,诸如各设备的趋势分析,有效形成IT运维系统的价值输出。

2 系统总体设计

对于该系统,采用如下技术开发路线:

(1)整个系统以成熟可靠的软件系统为基础,采用先进成熟的面向对象的软件开发工具及第三方软件。为保障系统的可扩展性以及高可靠性,该系统采用目前主流的DWR+SSH框架[2]。

(2)核心服务器的操作系统上,对于数据库服务器,为了保证服务器的安全性、可靠性、稳定性及便捷性,采用主流可靠的AIX操作系统。

(3)数据库采用目前主流的数据库系统———SqlServer作为数据库。

(4)信息数据的存储系统,采用RAID技术保证整个存储系统的可靠性,防止关键数据丢失。

2.1 架构设计

根据需求分析,该系统可分为两大部分:PC服务端与移动终端。

(1)PC服务端。其总体框架分为3层:应用层、核心服务层和接口适配层。(1)应用层。面向用户,提供用户所需各类业务应用,主要功能包括拓扑展示、告警集中监控、性能指标、统计分析、维护通道以及系统配置等;(2)核心服务层。为应用层提供各项后台处理服务:拓扑服务、告警服务、预警服务、报表组件、数据存储策略等;(3)接口适配层。负责采集各系统的数据采集、同步功能,为系统提供原始数据支撑[3]。

(2)移动终端。移动终端功能包括告警监控、重要性能指标监控、维护通道,方便用户随时随地掌握IT设备运行状况[4]。

2.2 组网设计

(1)内部局域网。内部局域网承担业务操作型数据库服务、连接局域网用户、运行相应业务处理应用软件,提供外部移动终端访问和数据交互能力。

(2)广域网互联。主要为移动终端用户提供访问系统的方式。防火墙连接内部局域网核心交换系统,在边界隔离外部网和内部网,提供给内部网访问外部网络,通过规则对外开放部分资源,并通过规则来限制外部不安全的访问。防火墙同时支持VPN,使得外出人员可以访问内部局域网。

2.3 模块设计

该系统主要包括拓扑展示、告警集中监控、性能指标监控、数据分析、维护通道以及移动终端等模块。

(1)拓扑展示。提供基于拓扑形式的信息展现,主要展现区域、机房、设备、性能指标、告警等信息,通过使用不同的拓扑图,用户可以直观地从拓扑图中看到相应的各类资源,可以通过拓扑获取设备之间的关系,以及设备当前状况等信息。

(2)告警集中监控。集中呈现所有设备的实时告警信息,并用不同颜色进行标识。

(3)性能指标监控。对一定范围内的网络性能关键指标进行管理,通过对各类网络设备的性能参数进行监控和分析,向运维人员提供各种直观的性能数据信息,例如性能列表和性能趋势图等。

(4)数据分析。在对历史数据进行深度挖掘分析的基础上,采用拟合算法构建动态基线分析模型,预测未来一段时间内性能指标的正常变化趋势,一旦在相同时间段内实际采集数值与预测数值存在偏离,则产生性能事件告警。该技术弥补了固定阈值分析的缺陷,提高了告警的准确度,减少了误报和漏报的发生。

(5)维护通道。提供维护通道,用户可以通过该功能直接连接网络设备,进行维护操作。

(6)移动终端。实时接收告警信息、各项重要网络指标,并可通过维护通道,在移动终端上实现网络设备的维护操作[5]。

3 结语

本文通过将移动终端应用与传统的IT运维系统相结合,实现用户无论在何时、何地都能实时接收到网络设备告警及重要性能指标,清晰直观地了解到网络设备的运行状态,并能通过移动终端进行网络设备的远程维护工作,实现了面向用户感知的IT设备集中运维管理。

摘要:为了实现对IT系统的所有资源进行先进和有效管理,进一步提高服务效率和管理水平,实现业务和信息技术的高度整合,采用先进的J2EE技术框架,结合流行的移动互联网技术,实现面向用户感知的IT运维系统,从数据采集、告警监控、主动维护、服务管理,到最终的价值输出,形成IT运维的闭环管理,提升用户对IT运维的感知度。

关键词:IT运维管理,用户感知,移动终端应用

参考文献

[1]SHREYA DAS,DEBAPRATIM PANDIT.Importance of user perception in evaluating level of service for bus transit for a developing country like India:a review[J].Transport Reviews,2013,22(4):156-160.

[2]王宝龙,李子扬,李晓辉.基于SSH框架和DWR技术的减灾卫星运行管理系统建设[J].计算机工程与设计,2010,31(23):5096-5099.

[3]宋锋.基于Web的IT服务综合监控系统的设计与实现[D].厦门:厦门大学,2014.

[4]李佳.IT管理系统中采集管理子系统的设计与实现[D].北京:北京邮电大学,2006.

篇8:IT服务运维标准将率先出炉

近日,记者专访了马洪杰及参与IT运维标准制定的相关人员。据马洪杰透露,自今年4月运维工作组成立以来,以神州数码为代表的行业龙头企业便以工作组牵头在北京、上海、广州、武汉、山东等重点省市对运维市场进行了为期1个多月的广泛调研,并听取了30家企业、10家事业单位、8家政府相关部门的意见; 而后在两个月的时间里,历经数次激烈的讨论、三次封闭式编写、两次专家评审,最终完成标准意见征求稿。据透露,目前标准意见征求已接近尾声,“国标”的审批也指日可待。

“运维标准已经编制完成,接下来就是试点和验证。”马洪杰表示。包括北京等多个省市已提出承担运维标准试点的申请。IT服务标准工作组已就运维标准的应用试点与验证方案进行讨论。

“与国际标准比,我国IT服务标准包括的内容更多、更丰富。”据参与标准制定的专家介绍,ISO20000、ISO27000都属于质量管理体系的范畴,ITIL是行业的最佳实践。这些都不涉及到对信息服务企业的综合评价。而作为IT服务标准重要组成部分的运维标准,解决了信息技术服务企业的界定,以及交付过程中应该遵循什么规范等问题。

篇9:IT运维系统标准篇---桌面管理

近些年,中国企业的信息化建设工作经历了以IT建设为重心的快速大发展时期。如今这部分企业中,大多数IT建设工作已经完成,多数信息系统渐渐趋于平稳。如何在IT建设过程中更多的考虑IT运维工作,已逐渐成为企业信息化部门亟需思考和面对的工作。企业通过学习IT服务的国际标准及成熟的信息技术治理理论,借鉴国内、外企业中IT运行维护的最佳实践和先进管理经验,综合自身IT运行维护现状,构建合理、高效的IT运维模式。

1 企业IT运维现状

现代企业内部拥有的信息化系统规模越来越大、功能越来越多、基础设施的升级更新也很快速,这些特点决定了企业信息化运维所面临的困境会越来越明显。

1)企业信息化进程的不断加速,促使企业内部的硬件、软件、网络以及各类业务应用系统不断升级更新及扩充。随着企业硬件设备的增多、业务系统的大量上线,导致运维过程中暴露出的问题越来越突出。由于硬件设备种类不同、品牌不同,系统结构、平台、数据、网络及应用的异构性,导致发生故障时定位问题会有所困难。运维人员长期处于“救火状态”,与此同时,业务部门却不甚满意。

2)IT运维管理并没有专人负责,IT人员在解决完各自的问题之后,往往就要投入其他工作中,导致问题背后隐藏的深层次原因不能被及时发现和处理。如果发生与运维相关问题时,业务人员正在处理其他更重要的业务,还可能会导致运维工作不能及时被相应,影响运维的效率。这样的结果,会导致运维处理问题周期短、质量低、效率不高、用户意见大等问题。

依据以上情况可知,IT部门目前的运维管理信息系统存在下述问题:

(1)运行监控的广度和深度不够

现有运维系统侧重于对硬件资源进行监控管理,对软件资源的管理较弱。由于对企业的软件资源监控支持能力不足,导致对用户的运维需求无法提供及时有效的支持。

(2)内容展现不够全面

现有运维系统运行展现内容不够全面,缺少预警信息统计和展现,缺少对设备性能信息的直观展现界面,无法满足及时监控的管理要求。

(3)缺少基于ITIL规范的服务流程

现有运维管理信息系统的设计,与ITIL(信息技术基础架构库)的运维管理理念存在很大差距。缺少事件管理、问题管理、变更管理、配置管理、发布管理等关键流程管理功能,无法满足现阶段服务管理流程要求,同时缺少运维管理制度建设和执行考核方面的功能。

由以上论述可知,企业IT部门的运行维护管理工作将迎接下述三类挑战:

(1)如何保证企业现有IT资源(软、硬件)在业务活动中长期稳定运行。企业内部需要7*24小时不间断保障的生产系统日益增多,大量业务访问量对系统性能的要求也不断增加;

(2)各类业务信息系统的复杂性越来越高,如何确保IT系统的运行效率满足业务要求是运行维护的关键问题。需要运行维护的业务信息系统数量激增,业务信息系统的架构日无复杂,业务信息系统的数据量持续增多;

(3)企业安全保密任务越来越艰巨,如何确保业务信息数据的安全系数与企业安全等级要求相匹配,也是我们面临解决的问题。信息安全体系的建设以及应急处理机制,数据中心的预警、检测、应急处理及自我恢复能力日趋重要。

2 IT运行维护管理方法论-ITSM

IT运维服务,作为IT服务中最主要也是最基本的服务,是由企业内部IT部门,根据企业自身的管理制度和业务流程,借助信息化手段和技术,对企业现有IT硬件资源、软件资源、业务系统进行整体维护以及对运维人员管理的过程。大量数据统计显示,在IT项目的整个生命周期,IT的运行维护管工作几乎占用了百分之80的时间。权威咨询公司Gartner Group的统计结果显示,由产品自身和应用技术引发的问题只占了所有问题的20%,与流程有关的失误造成的问题占了总数40%,而与人员有关的失误造成40%的问题。这就说明,IT运行维护中出现的大部分问题并非是由技术能力欠缺造成,绝大部分问题的源头来自管理。大部分问题源自流程和人员的失误,流程失误包括管理程序的变更、程序调试过程中的疏漏,人员失误包括因人员主观上的知识错误、能力缺陷和主动或被动误操作所导致的问题。为此,世界上很多企业和部门都对此进行探索,通过大量的实践和对统计数据的分析,以实践经验和成果为基础,总结出一种新的IT运维管理方法论,就是ITSM(IT Service Management,IT服务管理)。

IT服务管理,顾名思义,是面向IT服务的管理,其管理核心是管理用户对IT的需求。ITSMF(国际IT服务管理论坛)任务,ITSM是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与组织业务,提高组织IT服务提供和服务支持的能力和水平[1]。因此,ITSM又被描述成IT管理的“ERP解决方案”。

总体而言,ITSM是服务于IT的管理方法集合,是系统化的、有序的、完整的协同流程集合,其工作重心是保证IT的服务质量,其管理对象是用户的IT需求,其目的是保证IT服务质量,其依据是控制服务级别协议(SLA),其管理内容涵盖了问题管理、变更管理、配置管理等主要流程管理。

3 基于ITSM的企业IT运维管理信息系统初步设计

目前,企业IT整体运行维护工作划分为两类:IT技术人员主动发起的运行维护和IT技术人员被动受理的运行维护。主动运行维护多属于例行检查,是IT人员每天都要完成的工作,重复性较多;被动运行维护来自于用户的各种需求,运维人员需要针对用户的需求去作出快速响应,确保服务及时有效。企业信息中心技术人员按照现有的运行维护流程,借助运维管信息系统,对日常的IT业务进行维护管理其维护范围主要涵盖机房环境监控、基础设施监控、业务应用系统运维等。

传统的IT运行维护模式一般具有以技术为导向、IT人员多充当“救火队”角色、被动、不可重复&混乱、流程不标准、偏向从IT部门内部考虑等特点。ITSM则具有流程为导向、预防为主、主动、可重复&职责明确、正式流程、从业务角度考虑等特点。

实现IT运行维护管理的流程化、规范化,对IT部门而言意义重大。运行维护人员可以及时梳理、分析、归纳和总结发生的问题,使工作安排更加合理,避免相关人员因陷入杂乱琐碎的问题处理过程而无法脱身,能够极大提高工作效率。

流程是IT服务管理的基础,IT服务管理的流程建设需要与企业业务相结合,同时遵循PDCA循环过程,不断对现有流程进行改进和完善。企业的业务流程取决于企业的战略规划目标,IT服务来源于企业的业务流程,而IT服务能力最终又将对企业的战略规划产生影响。这一过程遵循PDCA(戴明环)模型,是一个不断循环、互动的正反馈。

企业目前正在大力实施AOS体系建设,AOS是质量、成本、效率三要素并重。AOS业务流程梳理及优化,能够使各类业务流程显性化,促进各类要素的提升。利用AOS梳理过的标准化、规范化的业务流程,利用信息化平台完成对标准化、最优化的业务流程的固化,更快、更好的形成符合自身特点,具有自身特色特点,反应敏捷、高效可靠的IT运行维护管理模式,实现以ITSM为基础的企业IT运行维护流程化和自动化。

通过对目前IT管理的各个方面如服务器管理、网络管理、系统软件管理、应用系统管理、数据库管理等多方面进行调研,生成了符合IT部门运行维护需求的流程,并将这些流程整合为特定的IT服务。

面向服务的IT运行维护管理可初步设计如图3所示。

基于ITSM的IT运行维护管理信息系统,可以将IT运行维护服务管理分为六大功能模块,初步可设计为资产管理、监控管理、应用管理、安全管理、流程管理和运维综合分析六大功能模块。

基于ITSM的企业IT运维管理信息系统功能模块的划分及构成如图4所示。

其中,各个业务模块的具体功能描述如下:

1)资产管理模块:资产管理模块可以实现对I T系统各类软、硬件资产的使用、成本等信息的维护和统计;

2)监控管理模块:监控管理模块可以实现对IT基础设施的监控管理。IT基础设施管理包括存储、备份系统管理、主机系统如服务器、小型机等管理、安全系统如安全设备及安全软件管理、网络系统如交换机、路由器等管理、桌面系统如PC终端等管理,以及机房动力及环境如空调、电力等管理;

3)应用管理模块:应用管理模块包括对各类核心业务应用系统的监控,实现对应用系统进行日常应用问题处理、应用集成以及应用改进等功能;

4)安全管理模块:安全管理模块包括对企业内部大量PC终端的安全维护,以及对主机、网络设备、安全设备等资源的安全监控;

5)流程管理模块:流程管理模块涉及服务台、事件管理、问题管理、变更管理、配置管理、服务级别管理、知识管理等业务;

6)运维综合分析模块:运维综合分析模块可以在各个管理功能的基础上,实现企业IT环境整体运行情况的分析,帮助管理人员了解运维现状,制定或修订运维计划。

结合上述IT运行维护流程及对应的IT运行维护管理系统,企业可以提供给用户更快更好的运行维护服务,为用户提供便利的工作条件,提升用户满意度。

4 结束语

企业通过建立合理的IT运维流程和管理系统,在确保系统的安全性、稳定性、运维的可靠性的同时,能够为用户提供更好的服务,及时解决信息化系统使用过程中出现的各种问题和故障,做到想用户所想,急用户所急,就能更好实现IT运行维护服务管理的目标和主要任务。

摘要:随着企业各类信息系统的建设完成和大量投入应用,系统的安全性、稳定性以及运行维护的可靠性越来越被人们关注。文章基于对ITSM及相关标准的研究,通过对现行IT运维工作的实际情况进行研究,初步设计了适用于企业当前信息化信息系统运行维护特点的IT运维管理信息系统。

关键词:IT运维,ITSM

参考文献

篇10:IT运维系统标准篇---桌面管理

据IT服务工作组相关负责人介绍,此前IT运维工作组向国家提交了四项标准征求意见稿。其中,最为成熟的《信息技术服务运维通用要求》、《信息技术服务运维应急响应规范》已正式列入国家标准计划,预计今年年内发布。

2009年4月,工业和信息化部在京成立了组建后首个标准化技术组织—“IT服务标准工作组”(下称工作组),以加快我国信息技术服务标准的制订。有60多家企事业单位正式加入,其中包括神州数码等中国IT服务龙头企业,同时得到了14个省市工业和信息化主管部门的大力支持。

工作组成立后,本着“急用现行、成熟先上”指导思想原则,IT运维工作组率先在北京、上海、广州、武汉、山东等重点省市对运维市场进行了为期1个多月的广泛调研,并听取了30家企业、10家事业单位、8家政府相关部门的意见,而后在去年6~8月间,历经三次封闭式编写、两次专家评审,最终形成了标准征求意见稿。

征求意见稿出炉后,在长风联盟标准委员会范围内征求意见,并征询了建设部、公安部、中科院、税务、中国联通等典型行业客户意见。根据专家和典型行业客户提出的意见,9月工作组在北京集中修正草案。

2009年12月18日,信息技术服务标准工作组在北京召开了信息技术服务运维标准在中央部门信息化的应用研讨会。邀请具有代表性的中央部委对IT服务标准工作组前期的部分工作成果征求意见。

据介绍,送审通过的两项标准,主要由IT服务标准工作组副组长、IT运维工作组组长成员单位神州数码牵头,和运维组成员单位共同完成的。《信息技术服务运维通用要求》主要内容是从组织、需方选择、评价供方以及服务评估第三方等方面来规范,作用在为运维资质提供评定依据;而《信息技术服务运维应急响应规范》主要是为运维服务应急响应体系的规划、建设、实施、评估等提供参考和依据,为服务提供方提供最佳实践参考和服务衡量标准。

上一篇:消费者权益保护法形成性考核册作业三答案下一篇:中秋节公司福利