运维支持系统

2024-09-05

运维支持系统(精选三篇)

运维支持系统 篇1

运维管理存在的问题

(1) 在IT运维工作中, 缺乏量化考核工具, 无法对IT运维人员的工作绩效、服务质量进行有效考核和实时监督。

(2) 由于IT运维人员在日常的工作中缺少协作机制, 而一般的IT故障往往都不是单一环节的问题, 需要相关专业部门的通力合作, 共同分析, 才能解决, 这些容易造成职责不清、工作推诿的问题。

(3) IT资产管理缺少工具系统支撑, 硬件设备和软件系统大多采用人工管理, 不能达到有效管理的目的。例如, 目前仍采用人工方式对硬件设备进行排查、巡检, 不能及时发现设备问题;IT设备台帐不能及时更新, 对设备维修工作不能及时记录;不能有效管理硬件、软件的升级、变更等工作, 配置记录与实际不相符合等。

(4) 在信息化建设中, 往往重视硬件投资, 而管理制度流程建设跟不上, 或者贯彻落实不到位, 造成客户满意度低, 这样不但降低了信息系统在业务经营中的支撑作用, 也严重打击了IT运维人员的积极性。

面对着包括人员、网络、主机、存储设备、安全设备、数据库、中间件及应用软件等多种IT资源, 如何有效管理、充分利用?是待解决的首要问题。技术管理考虑如何把IT资源“管好”, 而服务管理则考虑如何把IT资源“用好”。通过建立规范的服务程序, 搭建IT部门与业务部门沟通的平台, 为日常运行维护工作 (或外包业务) 提供一个管理架构。实现IT资源的全面监控, 促进IT运维工作向服务管理方式的转变, 提高企业信息化整体工作水平。

提升IT运维服务能力的对策

IT运维的难题是运维服务管理能力不足造成的, 可从以下几个方面提高IT运维服务能力。

(1) 建立xxxx服务台, 合理安排各专业岗位人员, 明确各专业岗位职责, 充分利用运维资源, 避免各专业部门间的互相推诿。保证故障的快速解决, 及时恢复业务系统运行。

(2) 建立统一的监控平台, 实现信息资源的统一管理、集中展示, 使运维管理人员能实时监控各软硬件系统的运行状态, 快速定位故障点, 有效缩短故障排查时间。应对网络监控系统、日志审计系统等进行集成, 建立统一的管理平台, 实现实时监控、实时分析、实时报警, 充分发挥其应有的技术支撑作用。

(3) “三分技术、七分管理”, 通过制定高效、合理、切实可行的管理制度、工作流程, 使运维过程更加明确、可控, 历史数据和处理过程可追溯, 提升各专业部门间的协调性, 提高运维工作效率。相关的工作流程包括:故障管理流程、问题管理流程、变更管理流程、配置管理流程等。

(4) 落实全生命周期的资产管理, 通过提供准确完整的设备台帐及运行、维检修记录, 可以使管理者及时了解硬件设备所处的运行状态, 适时维修、报废、更新设备, 降低运营成本。另外, 通过一些历史数据的分析, 也可以加快故障原因的确定, 提高运维工作的效率。

(5) 建立知识库, 实现知识转化, 通过运维知识库的建设, 促进隐性知识向显性知识的转化。共享IT运维工作中的实际经验和专业知识, 降低个人依赖度。提高每个IT运维人员的工作效率和解决问题的能力。

(6) 实现IT运维工作的量化绩效考核, 根据工作实际制定运维考核标准, 通过分析IT运维人员的响应时间、问题解决时间等数据, 逐步提高服务水平和服务质量。

通过有针对性地落实改进措施, 有效提高IT运维管理能力, 不仅可降低IT运维人员工作量, 同时可以提高工作效率, 进而提高整体IT运维能力, 提高客户满意度。

服务台建设

提升IT运维服务能力, 可将服务台建设作为突破口, 建立对外沟通平台, 对IT运维工作, 进行统一调度、协调, 监管, 提高信息运维工作的效率。

(1) 服务台建设目的

服务台主要功能, 是尽快解决信息系统在日常运行中出现的问题, 保障业务支撑系统的稳定运行, 保证企业生产经营业务的正常开展。

(2) 体系架构

服务台体系架构由组织人员、流程制度、技术工具、信息管控四个方面组成。组织人员指的是服务台建设的人员、组织保障, 包括组织职能、组织架构、岗位职责、人员构成等内容。流程制度指相关的各类管理流程和保障其落实的管理制度。技术工具指支撑服务台正常运行的各类信息化系统。信息管控指支撑服务台运行所要求的各项管理数据, 包括资源信息、考核指标、管理报告等内容。

(3) 服务台流程

当用户通过电话或其他方式提交了一个故障申请, 服务台工作人员对故障进行详细记录, 生成工单, 并进行初步解决, 如果解决不了, 就将工单派发给一线工作人员, 由一线工作人员进行解决, 一般为现场支持, 一线支持人员在规定的时间内不能解决问题的, 应及时通知服务台进行资源调配, 或申请二三线技术人员的支持。如果三线支持人员, 不能解决问题, 服务台工作人员应及时上报相关管理人员进行协调处理。故障处理完成后, 服务台工作人员进行记录用户评价及关闭工单的工作。

管理人员通过数据分析, 比如故障平均响应时间、平均解决时间、各级支持人员的故障解决率等数据, 可以对运维人员进行工作能力, 工作态度进行量化考核。为了更好地落实服务台流程, 建立支撑服务台正常运行的各类信息化系统是必不可少的工作。运维服务支撑系统包括自动化监控系统、运维服务管理系统等, 例如:呼叫中心、IT服务管理系统、运维人员GPS定位系统、网络监控系统等。

结束语

运维调度系统的应用研究 篇2

[关键词] 运维调度 客户 服务业 系统架构

随着中国企业的不断发展,伴随着企业之间竞争的不断加剧,客户服务已是很多大型企业的主要业务。每个服务性企业都有一支庞大的维护和服务队伍从事现场服务。 以电信为例,随着电信行业技术的高速发展,新技术、新业务、新用户在不断增加,问题也不断出现:运维成本不断增加,VIP客户的响应总是超时,在特定人力资源严重不足的同时却存在大量闲置资源等等。这说明服务业中原有的现场服务作业管理方式已经不能适应当今现场服务所面临的挑战,老的人工方式的劳动力管理方法已经不能适应信息时代的需求了。

运维服务调度系统属于服务优化系统范围,其目的是建立一套完善的网络调度支撑系统,改变老的人工方式的劳动力管理方法,使所有维护、服务人员具备远程接收调度指令的能力,运维资源调度实现高度集中、单级调度,从而构造各层面运维、服务人员集中管理、统一调度的运维支撑体系,保障人员调度使用最优化。

一、运维调度系统的意义

随着大型企业的不断发展,各企业的资源趋向平衡,业务同质化越来越明显。而价格竞争的破坏性将使其不再受宠,服务竞争成为市场竞争中的主要特征,而高质量的服务也就成为了企业的生命线。曾经是高度垄断经营的电信行业,就已是过度竞争的行业。各个竞争对手日益陷入了“同质化竞争”,新业务的大幅投资与传统业务的大幅降价成了行业的主旋律,而这又是两个相互牵制和对立的动作。在这种情况下,加强内部管理,大幅度降低成本,就成了企业惟一可以选择的有效措施。但是,“提高服务质量与降低运营成本”其实是两个相互矛盾的经营目标,是服务行业一直没有解决的一个问题。服务调度优化概念的提出就是针对这个问题的一个成功的解决方案,信息化的运维调度系统的建设便是为了实现这一概念,其意义主要体现在以下几点:

1.运维服务调度系统可以实时反映人力资源的工作量、资源利用率、和劳动生产率;根据这些被精确量化的指标,制定合理有效的薪酬激励机制,对企业员工的绩效进行精确的量化管理,提高企业运营水平。

2.在各个服务行业,客户服务支持部门或运维部门在经营管理上,长期被视为是企业的成本中心。运维部门可以通过转变思路,采用新的管理方法来对服务支持系统进行优化,即提高客户满意度又降低运营成本。这样,尽管在现实层面上看起来依然是成本中心,但在企业的战略高度上,则已经转变为决定企业命运的利润中心,与销售部门一道,同时代表了企业的核心竞争力。

3.由于系统可以将精确的管理延伸到企业运营的最小单位——工程师,所以运维服务优化调度系统为企业实施集中管理和机构扁平化运作,提供了一个有效的工具和保障。

4.通过本系统的建设,管理者能够实时掌握并精确贯彻运营策略和成本控制策略,提供了企业实现核心竞争力指标的支持手段。

5.协助解决销售部门与维护部门之间的矛盾。通过运维服务调度系统的实施,维护部门可以实时地将自己的支持维护力量的状态报告给市场部门和企业的管理者,同时为他们提供有关的资源状态信息,使他们可以及时地与客户签订更加合理和切合实际的服务合同条款,随时调整市场部门活动的部署,使维护部门和市场部门成为一个进退自如的整体。

二、系统架构

运维调度系统是企业整体信息系统的一部分,属于产品和服务类,是将客户信息管理、任务分配管理、客户申告、任务分配管理等功能结合在一起的运维调度管理系统,以实现对运维服务全面综合的管理。运维服务优化调度系统将配合其他系统共同完成产品与服务的提供、服务保证、运行维护、企业发展决策支持等。其在企业的架构IT系统中的定位如下图所示:

其中红色线框所标示的为运维调度系统所处的位置。

运维调度系统的一般架构如下图所示:

三、主要功能

针对运维服务的特点,以及运维服务系统在企业整体信息系统中的地位和作用,运维调度系统的主要功能有以下几个方面:

1.系统接口。实现与外部系统的接口,要求能够通过实时接口随时接收上述系统发来的消息,并能立即触发相应任务派发流程,实现闭环的任务流程。

2.任务管理。创建任务:系统可以通过自动或手工的方式创建任务,包括从外部系统中接收到的任务,或由人为分派人员通过任务输入界面手工创建任务。

任务的分配和调度:系统支持智能化的分派和调度,当产生新任务后,系统应根据现有人员的工作情况和具有的技能自动分配任务,或给出推荐任务分配的人员排序建议,以帮助调度员手工分配任务。

任务的跟踪:系统应具备任务跟踪功能,在任务分配后,系统可以通过移动通信设备通知现场人员。现场人员则可以通过这些移动设备与系统进行交互,随时报告任务的完成进度,并在任务完成后通知系统,完成任务的闭环流程。

3.人员考核。系统可设定各种关键考核指标,可按工作时长、完成任务量、任务完成质量、客户满意度等不同角度对人员工作情况进行评价,并可以以表格、图形等形式报告、展现。

4.统计分析。系统应具备统计分析功能,能够对同类任务的平均完成时间、最耗时任务、人员完成任务情况,人员完成任务平均时间等进行统计,提供报表模板,支持对数据的切片、切块、钻取、旋转等分析操作,支持自定义报表。

四、结语

运维调度在中国的电信行业中一直是一个研究的重点,随着各个服务业的蓬勃发展,运维调度系统将不再局限于电信行业,其应用的广泛拓展是必然的趋势。本文对运维调度系统的应用进行了较全面的介绍,为其发展起一个抛砖引玉的作用。

参考文献:

[1]彭晓辉:利用运维服务优化调度系统进行运维精细化管理,电信技术,2007.01

[2]杨 威:构建面向服务的电信运营支撑系统(OSS),当代通信,2005.15

[3]鲁春丛:电信运维管理发展研究,当代通信,2004.23

基于堡垒主机概念的运维审计系统 篇3

目前,各电力企业纷纷部署了防火墙、IPS、网

络防病毒系统、漏洞扫描系统等安全产品,建立了较为完善的信息安全防护体系,取得了一定效果,但网络安全故障仍时有发生。令人惊奇的是,造成这些不合规、不合法的行为很多来源于内部“合法”的用户操作。防火墙、防病毒、入侵检测系统等常规的安全产品可以解决一部分安全问题,但对于内部人员的违规操作而导致数据误删除、数据破坏、数据泄密等致使企业利益、公众利益和国家利益受损的行为,却无能为力。

针对这一系统性风险,公安部在《信息系统安全等级保护基本要求》中明确要求,对于二级(含)以上的重要信息系统网络安全、主机安全、应用安全均要求具备安全审计功能。国家电网公司也根据自身需要对下属企业IT内控提出了相应的要求。因此,对设备维护行为采取行之有效的控制和审计措施,弥补这一信息化安全管理的盲区,是当前电力企业信息安全建设的当务之急。

从堡垒主机到内控堡垒主机

堡垒主机是一种被强化的可以防御进攻的计算机,作为进入内部网络的一个检查点,以达到把整个网络的安全问题集中在某个主机上解决,从而省时省力,不用考虑其他主机安全的目的。其目标是通过综合采用虚拟化技术、协议代理技术和身份认证、访问控制与操作审计等多种信息安全技术,实现员工和管理人员对内部网络特定资源的安全访问,同时对访问和操作的过程进行完备的审计记录。

目前,各级电力企业均已部署了一系列安全设备,但传统的防护手段中,防火墙只能进行网络层访问控制,无法对系统层访问进行控制,更谈不上操作内容管理;而IDS、IPS侧重于系统层、网络层攻击事件的检测,缺乏对操作的控制能力;传统安全审计类产品无法实现对加密协议SSH、图形访问协议的识别和管理。

信息系统的运行由一系列的人员行为和系统行为组成,信息系统安全审计就是采集、监控、分析信息系统各组成部分的系统行为(日志)和操作行为的过程。 既然传统的安全设备都无法解决运维行为审计的问题,能否另辟蹊径,在维护人员(内部的、外部的)和信息系统(网络、主机、数据库等)之间搭建一个唯一的入口和统一的交互的界面?答案是肯定的。依托堡垒主机的理念,可以构造一种专门应用于信息系统运维行为控制和审计的堡垒主机。它作为一座桥梁,不但能够规范和控制所有维护人员的行为,而且具备强大的输入输出审计功能,能够详细记录用户操作的指令和操作过程,这就是内控堡垒主机,也可以称之为“运维审计系统”。

系统设计

1.系统架构

在电力企业IT 运维过程中,维护人员既有内部人员,也有来自外部的系统集成商、服务外包商、应用开发商、设备原厂商人员。维护对象主要包括:主机、网络设备、安全设备、数据库以及各类应用软件。维护人员主要通过Telnet、SSH、VNC、RDP等方式对维护对象进行维护操作,运维审计系统的功能重点是将这些管理员维护的过程进行记录,并提供客观的审计依据,便于企业对管理员行为进行高效审计,如下图所示。

系统应采用旁路部署方式,对网络原始结构不造成影响,用户只需为运维审计系统分配一个能够接入用户网络的IP地址即可,所有由客户端发起的服务器维护协议均通过运维审计系统进行转发,如SSH、Telnet、RDP等协议,而正常的服务器对外业务则不通过运维审计系统,因此,运维审计系统不会影响服务器的正常对外业务。运维审计系统采用B/S管理架构,管理员可以在远程通过浏览器进行管理。

2.系统自身安全性

内控堡垒主机是信息基础设施(服务器、网络设备等)维护的统一入口,是最容易遭受攻击的主机,其配置与通常的主机相比明显不同,所有不必要的服务、协议、程序和网络接口都将被禁用或删除,以达到“最小化安全”,以强化堡垒主机,极大地限制可能出现的网络攻击。

为此,运维审计系统采用软硬件一体化架构,基于嵌入式开发技术,将定制的64位Linux内核固化至硬件上,操作系统采用最小化安装,除了必要的内核、驱动等程序外,其他组件、程序包尽量去除。同时,关闭不必要的应用、服务、端口,开启自身的防火墙功能,提高堡垒主机自身的安全防护能力。

3.运维账号管理

运维审计系统可以统一管理所有信息系统的运维账号。为了强化安全性,运维审计系统另外为每一位运维人员分配一个运维账号并为其分配权限,这一套帐号并非信息系统真正的管理账号,但与信息系统真正的管理账号相关联。这样,每一位运维人员无须知道也无法知道系统真正的账号。运维审计系统支持多用户管理,企业可以根据自身组织情况设定配置管理员、审计员、操作管理员等角色,并为每个用户设定详细的访问控制规则。运维审计系统权限管理为细粒度控制方式,能够为每个用户分配任意功能模块组合权限,如:查询日志、回放文件查看、规则配置、用户管理、系统自身管理等等。运维审计系统密码策略管理对密码强度、密码使用期限、账号锁定、账号起/停、用户分组等进行管理,能够有效保证运维账号的安全。支持与RSA、安盟动态令牌等第三方认证系统结合,对系统用户进行认证。

4.维护协议支持

运维审计系统支持电力企业内部运维审计所要求的所有协议类型,主要包括:

①基本远程操作协议,如SSH、TELNET、Rlogin、FTP等;

②图形终端操作协议,如RDP(windows远程桌面)、VNC等;

③数据库远程协议,如ORACLE、DB2、MS-SQL SERVER、INFORMIX、MySQL、SYBASE等。

针对上述协议,运维审计系统能够记录整个会话的完整过程,并形成指令日志及回放文件两部分审计数据,指令日志供管理员针对操作指令进行快速审计,回放文件可供管理员针对特定的会话进行完整操作审计。

5.运维审计功能

运维审计系统支持针对Telnet、FTP、SSH、Rlogin各类服务器、网络及数据库操作行为记录并进行查询。运维审计系统查询模块采用了自主研发的强大检索引擎,可以根据上述操作协议中的用户名、IP、端口、时间、操作指令、返回结果等等信息进行多重组合查询。管理员可以通过运维审计系统强大的检索功能对关心的事件进行迅速定位。

6.视频回放功能

运维审计系统支持对各类支持的协议进行视频回放,管理员可以根据IP、时间段等信息查找关心的RDP、VNC等操作的回放文件并进行在线视频回放,也可以根据查询结果直接定位至TELNET、SSH、数据库、FTP等远程维护操作的回放文件直接进行回放审计。回放过程能够还原上述协议中的所有操作行为,就如同对管理员的操作显示器进行监控一样。

运维审计系统回放视频无需客户端安装第三方播放软件,直接内置于运维审计系统管理客户端中,回放系统支持常见的视频播放控制操作,如拖动进度条,播放速度加快/减慢,暂停等等。

7.异常操作阻断及告警

运维审计系统支持通过规则设定异常及非法操作行为,一旦检测到这些异常的操作行为,运维审计系统将直接阻断此操作,并断开该操作的TCP连接,因而能够有效防止各类违规操作事件的发生。同时运维审计系统也支持对危险指令的告警功能,能够通过短信、邮件等方式将告警信息及时发送给管理员。告警及阻断规则支持用户自定义,规则可以根据IP、用户名、指令、返回结果等信息进行。

8.统计报表功能

运维审计系统支持报表生成功能,内置了多种报表模板,同时支持用户自定义报表。报表符合萨班斯SOX法案审计需求,如《账号异常登录情况报表》、《操作系统危险指令报表》、《数据库危险指令报表》、《主机登录合法性审计报表》、《数据库登录合法性审计报表》、《特定用户操作审计报表》等。

实施效果

运维审计系统项目的实施有效地规范了内外部信息管理维护人员对服务器、数据库等IT基础设施的维护行为,弥补了对服务器等重要设施的维护行为的控制、审计的空白,强化了信息安全保护体系,有利于信息系统更好地运行,有利于保证企业运行的连续性和安全性,极大地减少了对信息化设施的误操作和恶意操作的概率,使企业IT基础设施维护行为的审计能力从无到有,节省了大量人力物力,缩短故障和安全事件的定位时间,大大提高了信息系统运行维护能力和效率。

同时,运维审计系统对所有的维护行为进行指令记录和录像,为信息网络故障的追溯提供了有力的技术性保障,为事前防范和事后定位信息系统故障提供可科学、高效的手段,降低了信息系统安全风险,避免了潜在的资产损失。

作为企业信息安全保障体系的重要组成部分之一,运维审计系统创新地采用堡垒主机的设计理念,在运维人员与IT设施之间设置了一道屏障、唯一入口,它可以有效提高服务器等重要信息基础架构的安全级别,辅助对信息安全故障和安全事件的全面记录和事后追溯定位,能够有效帮助电力企业弥补安全漏洞、完善系统安全防护体系,提高信息系统运行的安全性和事件的追溯能力。

(作者单位:浙江省杭州市萧山供电局)

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【运维支持系统】相关文章:

目标支持系统05-04

运行支持系统05-17

资源支持系统07-01

学校支持系统07-30

维护支持系统08-06

技术支持系统06-19

施肥决策支持系统07-28

临床决策支持系统09-15

决策支持系统发展阶段04-15

水灾分析决策支持系统08-01

上一篇:文言文背诵八法下一篇:美术课程性质