监控运维管理制度

2024-06-19

监控运维管理制度(共6篇)

篇1:监控运维管理制度

招标要求.......................................................................................3 1.1 1.2 总体设计要求...................................................................3 项目建设目标与原则.......................................................3 IT运维管理平台功能要求..........................................................6 2.1 网络监控与管理要求.......................................................6

2.1.1 系统工作模式..............................................................6 2.1.2 网络安全设备管理.....................................................6 2.1.3 面向网络的一体化管理.............................................7 2.1.4 网络拓扑管理..............................................................7 2.1.5 设备管理......................................................................9 2.1.6 性能管理....................................................................10 2.1.7 故障管理....................................................................12 2.1.8 流量管理....................................................................13 2.1.9 报表管理....................................................................16 2.1.10 安全边界管理............................................................17 2.2 资源监测管理.................................................................18

2.2.1 服务器系统管理........................................................18 2.2.2 数据库管理................................................................19

2.2.3 中间件管理................................................................23 2.2.4 基础应用平台及通用服务管理...............................24 2.2.5 基础运行环境管理...................................................26 2.3 告警监控管理.................................................................26

2.3.1 告警管理....................................................................26 2.3.2 告警通知....................................................................27 2.4 统一监控展现.................................................................27

2.4.1 灵活拓扑展现............................................................28 2.4.2 网络监控展现............................................................29 2.4.3 业务监控展现............................................................29 2.4.4 资源监测展现............................................................30 2.4.5 节点监测展现............................................................31 2.4.6 告警信息展现............................................................31 2.4.7 灵动可视化平台........................................................32 2.4.8 扩展展现集成接口...................................................32 2.5 报表管理.........................................................................32 招标要求 1.1 总体设计要求

(1)系统平台设计应该符合信息行业和本行业的标准,系统内部数据采用标准的格式,系统构架采用标准开放的应用框架和组件结构。

(2)为保证系统平台的统一性,要求软件/模块必须使用同一品牌,所有软件/模块必须拥有完全自主知识产权,不能依托于其他第三方的平台。支持主流操作系统和ORACLE数据库,全中文界面,提供友好、直观、易懂的图形呈现,提供强大的信息交互与管理能力。

(3)系统要求运行在开放的TCP/IP网络环境下,基于J2EE平台开发,结合C++、CORBA标准和技术,采用B/S + C/S架构,支持IE7,IE8等标准浏览器,实现系统界面、业务逻辑、数据集成等功能,采用标准接口进行系统间的数据交换与数据共享。

(4)监控子系统要求支持远程监控和代理、CLI等多种方式监测。支持对Windows、Linux、Unix(HPUX、AIX、Solaris„)平台系统的监测,支持Syslog安全日志的管理;支持多种告警方式,能够以Email、NetSend、外部命令、Snmp设置、Trap转发、Agent执行脚本、短信等通知方式进行告警;支持对所

有监控范围内IT资源的当前和历史运行情况进行统计,并生成各种分析报表和图表。

(5)平台要求支持统一身份认证的单点登录、统一权限管理和统一界面展现功能;

(6)系统平台要求提供友好的操作管理,能够根据不同管理层次的管理要求灵活定制不同的管理界面。

(7)系统要能够提供良好的集成接口,支持与第三方标准产品的集成部署;

1.2 项目建设目标与原则

IT运维管理系统平台项目建设的总体目标是实现对企业的网络、设备、主机、安全系统、数据库、中间件、应用系统等IT资源的可视、可控、可管理,从根本上提高IT运维管理水平,为企业核心业务系统提供有利保障;加强对IT系统及IT资源的监控与维护能力、提高维护工作效率、改善维护工作的质量,进而保证各系统维护水平的可持续性提升。

IT运维管理平台的建设应遵循开放性、先进性、安全性、可靠性、易用性等原则:

1.战略性原则

a)提供具有针对性、可行性和可靠性的技术解决方案 2.开放性原则

a)采用符合国际国内通用的标准协议

b)支持主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。3.先进性原则

a)采用国内外监控和服务管理领域先进的技术和解决方案

b)在方案中要将监控和服务有机的结合起来,实现无缝集成。4.安全性原则 a)保证数据安全

b)不增加现有应用系统的复杂性,更不会降低现有应用系统的稳定性。

c)有严格的身份认证,实施对用户真实身份鉴别 d)采取分级用户结构,提供用户权限管理,防止未授权的用户访问;

e)有安全审计功能,配置审计时对生产系统不产生影响; f)日志安全存放,并有格式化的输出,便于检索和查询 5.可靠性原则

a)管理系统应该在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够安全无故障运行

b)安装在被监控对象上的代理或探测工具占用被监控对

象的资源在5%以内; 6.易用性原则

a)提供简洁、方便、有效的管理工具和界面,有完整的系统文档。

b)提供可扩充性的接口设计以便于维护人员的日常管理和维护;

c)采用CS+B/S结构;用户界面应有容错能力,所用术语应具有一致性;

d)用户进入系统的相应功能模块后,该模块所涉及的各项功能尽量在统一的一个界面中显示和完成,减少新界面的弹出;

e)系统采用集中、无需代理的方式运行,无需在被监测信息系统、服务器上安装任何代理软件,只需在一台网管机上安装,即可自动对整个信息系统进行监测和管理,不改变现有系统的应用配置,对现有系统性能影响甚微,安装实施、维护使用十分方便。7.知识产权保护原则

a)要求本项目涉及的所有产品符合国家对软件产品的有关规定,并具有相应的产品认证或许可,无版权纠纷。IT运维管理平台功能要求 2.1 网络监控与管理要求 2.1.1 系统工作模式

系统采用多层架构、信息总线技术,具备良好的性能和扩展性,系统为用户提供了C/S和B/S的两种展现模式,为不同关注层面的用户服务。以方便管理人员使用C/S对网络进行专业管理,运维人员使用B/S对网络进行值班监控。

系统具有拥有灵活、高效的网络采集引擎,通过对象识别、采集并发及针对的厂商扩展脚本,可准确、可靠的提供网络设备交互服务。系统利用ICMP、ARP、SNMP、NetBIOS、CLI等标准进行网络探测和信息采集,对发现的网元对象进行识别、分析、保存,形成统一的网管资源库,并在此基础上进行拓扑计算,生成物理、网络等不同层次的拓扑结构。

通过主动(ICMP、SNMP、CLI)与被动(Trap、、NetFlow、SFlow、镜像、NetStream)两种方式,系统可以从设备上获得各类性能指标和流量数据,经过长时间数据的跟踪记录,最终挖掘分析生成各种报表,展现网管部门需要的网络流量与负荷信息,以供对网络状态的合理评估与决策。

在对网络的不间断实时监测中,系统能够收集针对网络、设

备、终端及链路的各种事件,并利用过去在网管过程中学习得到的处理规则,系统可以对这些事件进行智能分析,并关联所有符合故障特征的相关事件,最终在故障发生前、或故障发现时发出正确告警,以便网络管理人员高效、及时的定位并解决问题。2.1.2 网络安全设备管理

全面支持CISCO、华为、中兴、北电、Foundry、Extreme、Avaya、H3C、DLink 等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU / MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。网络设备监测项主要包括:

 设备CPU利用率:监测网络设备的CPU使用率。

 设备内存利用率:监测网络设备的内存使用量、内存使用率。 端口速率监测:监测网络设备中指定端口的入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速。

 端口上下线监测:监测网络设备指定的端口的上下线状态。 自定义SNMP监测:可监测多个SNMP表达式(支持四则运算、时间差值运算等)对应的采集结果。 ICMP连通性监测:监测与网络设备的连通性。

2.1.3 面向网络的一体化管理

管理界面友好,能够提供实时的底层网络、设备、系统、数据库和应用服务运行状态的有效监控和统计、网络边界安全保障、告警事件列表及IP资源管理等功能,每个区域可以把各功能管理项获取的底层数据按照IT基础设施内在的关联关系,根据运维人员的使用习惯进行了人性化的重新整合呈现,改变过去传统网管生硬的专业指标分割罗列的风格。

在支持典型功能外,还可以从管理人员的角度出发,把平时经常关注的设备监测视图进行重新组织显示,从管理人员的角度进行查看。

提供web客户端,管理员在网络的任何位置,甚至是外网,都可以通过浏览器访问网络监控系统的后台服务器,实现随时、随地统揽全局。2.1.4 网络拓扑管理

提供能够提供准确直观的 1.发现的设备种类全面

系统支持多厂商的网络设备,可以支持的厂商包括CISCO、Juniper、Huawei华为、ZXR中兴、H3C、Enterasys凯创、Extreme、Foundry、Harbour港湾、CDRS神州数码、AVAYA、Nortel北电、3COM、ARRAY、D-Link、Maipu迈

普、Red-Giant锐捷、NetScreen、Topsec天融信、Riverstone等。

2.拓扑发现技术手段先进

支持通过SNMP、ICMP、NetBIOS、ARP、Traceroute、Telnet等多种手段自动发现、识别设备。在支持众多国内外设备的基础上,系统还对网络类型有很好的兼容性,可以很好的发现VPN、VLAN网络拓扑,提供拓扑的动态跟踪和更新功能,能够更加有效的反应网络拓扑现状。

提供网络拓扑动态发现和跟踪技术,可以通过单设备拓扑、多设备拓扑、网段拓扑、种子节点拓扑等多种方式的拓扑发现网络拓扑准确地展现出网络的当前拓扑情况。3.拓扑显示视图多样

系统基于Java平台,支持远程管理协议采集,系统对B/S、C/S混合支持。支持大规模的网络管理问题,系统支持将大型网络通过按照地域、部门等划分成多个相对较小的子网实现分级管理、提供远程管理工具辅助用户对大型网络进行监控和管理。用户可以根据自己的使用习惯选择合适的拓扑视图加以监控。能够提供以下拓扑图:

 物理拓扑——反映被管网络的实际连接的二层网络拓扑图,方便用户直观掌控网络的实际连接情况;

 网络拓扑——反映被管网络各个子网之间的连接关系拓扑图,方便用户从IP层逻辑组织网络的管理;  子网拓扑——反映同一网段内终端与二、三层设备的连接关系拓扑,方便用户进行终端设备连接状态的监控及故障诊断;

 Web拓扑——系统支持网络拓扑图基于浏览器的展现,通过浏览器的方式监测网络的运行情况,WEB拓扑图通过3-N级的方式展现网络拓扑、设备状态、端口状态。用户可以通过浏览器访问,通过浏览器来查看网络运行的情况。这种显示方式的好处是方便用户穿过防火墙,随时随地进行拓扑浏览监控。

 全屏拓扑——可以提供全屏拓扑,以便可以更为方便的全局浏览拓扑,同时也方便进行大屏展现

4.拓扑显示信息丰富

在拓扑图上可以浏览网络资源的详细信息,包括:  在拓扑图上集成设备状态、链路带宽流量、告警故障的展现,使用不同颜色、粗细、图标表示被管理对象的状态信息;

 提供快速查找和定位设备功能,可以通过设备名称、IP地址、MAC地址等信息,在拓扑图上准确定位设备,并显示出此设备的网络连接信息;

 自动记录设备的所有活动情况,如接入网络、设备迁移及上下线信息。

 便捷的浮动信息显示,浮动显示各类设备和链路的关键信息;

 集成丰富的右键管理菜单;

 集成一些常用管理工具,如多实例ping、remote ping、traceroute、telnet、MIB浏览器

 拓扑图无级缩放、全屏显示以及背景图设置。 手工修改网络设备的配置信息 2.1.5 设备管理

系统设备管理全面及时,能够提供设备管理的快照,提供管理的设备列表,并能够提供手、自动可选的设备配置备份功能。

1.设备管理的快照

在拓扑中可以轻松点击被监控设备进入设备运行监控界面,以Dashboard的方式浏览网络设备状态的CPU、内存、链路流量等当前运行参数,若设备出现告警事件或阈值告警,则在网络拓扑图上相关网络设备节点图标以不同的颜色显示,提示管理员进行处理。

2.直观清晰的设备列表

设备管理将系统所发现的所有设备以列表形式展现出来,用户可以方便的查看到设备的名称、类型、IP地址、MAC地址。用户即可以查看所有设备,也可以按类型查看或按子网查看。

用户可以查询所管理的各子网网段内IP地址的分配、使用情况,以及占用该IP地址设备的上联设备及端口的详情等。3.手、自可选的设备配置备份

系统集成主流厂商思科、华为、华三和神码等网络设备的配置备份功能,管理员可以设置备份策略,根据管理员配置的策略,系统自动将网络设备的配置信息备份到备份服务器上。减少设备出现故障时进行设备配置恢复的时间。

对于非主流厂商设备,可以通过TCL脚本编写交互工具的方式获取相应设备配置备份来实现兼容性的扩展。

系统提供了手动备份与自动备份两种备份功能。4.详细的设备信息分析统计

系统可以帮助用户统计网络设备及终端设备的详细信息,不仅包括设备名称、别名、厂商、型号等基本信息,也包括设备端口的类型、端口号、IP地址、MAC地址、端口速率、MTU、端口状态以及对端端口的详细信息,此外还支持SNMP

设备的端口各类出入栈二层桢传输统计情况,如丢包率、错包率等。

系统还提供动态的网管信息展现,如端口列表、ARP表、TCP/UDP表、转发表、CDP表、STP表、设备部件表等。2.1.6 性能管理

本系统管理平台提供了完善的被管理网络数据采集,分析,统计和报表功能,能够通过SNMP、ICMP采集方式,对网络设备的CPU、内存、流量等运行性能指标进行轮询采集。系统进行实时采集数据分析,并保持对网络性能和设备性能的跟踪和趋势分析。1.监测指标丰富

系统支持网络性能实时监测,能监测所有网络设备的当前运行负荷状况,包括:当前CPU利用率、当前内存利用率、入流速、出流速、入包速率、出包速率,到网络设备的端口流量、丢包率、错包率、Ping延时和丢包等运行参数超过预设阈值时,并能在拓扑图上根据用户定义阈值以醒目颜色显示。同时,系统提供对主机操作系统CPU、内存和硬盘使用情况的实时监控。此外,系统还提供对典型Web服务的可用性监控,如HTTP/HTTPS、FTP、DNS、DHCP、LDAP等常见应用服务,并且系统同样支持对主机和Web服务监控的阈值告警功能。在实时监测的基础上,系统还提供对历史性能数

据进行统计分析功能。

网管系统提供的实时性能监视可以实时监控网络设备的端口流量和丢包率等性能指标,并可以方便的给出这些指标的趋势、平均值和最大值,为故障的预测提供有力的分析工具。

通过系统能够设置性能的采样周期,能够以图形方式显示性能指标,并可根据用户的需要定义监测的指标。2.多层面性能监测

系统为网络管理员提供多角度的监测。除了提供网络、物理拓扑显示的图形性能提示外、还为网管员提供主动的面向设备的负荷监测、面向链路的流量监测、面向终端的活跃度监测等多层面的性能监测。 面向网络设备的负荷监测

能够监控到网络设备的CPU和内存使用情况,通过监控网络设备的负荷情况,将被动管理化为主动预警,随时可发现网络的隐患。

 面向链路的流量监测

链路性能直接体现网络上数据传输质量。网络上的延迟过长、瓶颈或丢包错包率增高都将会影响网络提供服务的质量。在拓扑图上通过节点的颜色变化、链路的颜色变化、总览列表的带宽占比统计,可以让用户从集成化界面中全面评估网络的整体性能状态,快速定位出网络的瓶颈和隐患。 面向终端的活跃度监测

终端活动快照列表记录了所有终端设备的当前运行状况,内容包括:设备名称、设备IP地址、上联交换机端口、当前在线状态、上次Poll时间、当前流速、当前包速、平均包大小,方便用户进行故障诊断和病毒分析。此外,还提供终端活跃度历史统计。3.监测配置简单

系统配置界面友好、过程简单,且配置完即可生效。同时,系统具有自动评估监测的能力,能够自动生成配置。另外,性能的阈值可在配置时设定,性能达到或超过阈值可触发各种形式的告警,如:邮件、短信、声音等。2.1.7 故障管理

通过系统故障管理,系统能够对故障信息进行搜集、分类、归并、压缩及告警通知,帮助网络管理人员即使定位故障源、故障类型及故障波及范围等,帮助管理员来解决日常出现的各种故障,从而确保在规定的时间期限内使网络重新投入运行。

系统能够自动获得整个IT环境的各种事件,包括网络设备的故障,性能的过载,流量的异常,服务器的异常性能,各类应用的故障,各类终端的变更等等。通过系统故障监控台,用户能

够对整个IT环境的运行情况一目了然。1.统一的故障分析引擎

系统通过内置的事件分析引擎,对获取的事件进行实时的压缩、归并,建立集中化的以故障为导向的集中告警展现。方便运维人员实时查看网内所产生的故障。

 通过对事件进行过滤、归并、相关性分析、传递等分析处理。将处理过的事件保存在数据库中。支持对故障持续时间较长的告警级别自动升级处理,支持用户自定义故障类型。

 对事件的严重级别加以分类,并分别通知相关人员(如:普通故障就只通知网络管理员,重大故障同时通知主管领导和网络管理员);不同的用户可以为自己定义自己的过滤和通知策略。

 故障管理能够实时监视并截获网络运行过程中所出现的故障,确定故障位置,以声音、电子邮件、短消息等多媒体方式通知网络管理员,并给出故障原因。2.多种告警类型

系统根据故障来源及故障信息所属专业将告警信息分为以下几类:

 网络故障告警

监测到链路或设备故障时,尤其是骨干链路Up-Down、核心设备离线等,发出故障告警信息。 网络性能告警

监测到网络设备、服务器的端口流量、丢包率、错包率、Ping延时和丢包、CPU利用率、内存利用率、磁盘利用率等运行参数超过预设阈值时,发出故障预警信息。 网络安全告警

 非法设备接入告警:未经过合法登记的设备接入网络后,系统自动进行告警,并根据配置采取主动拦截等联动处理。

 IP地址变更告警:IP/MAC/PORT地址绑定之后,如果出现用户私自更改IP地址的情况,系统发现将主动发送告警。

 主动接收设备Trap信息

系统能够主动接收网络设备、防火墙等设备发出的Trap故障信息,并在告警台统一展现给用户。3.直观的告警列表

系统把告警事件按节点和严重级别进行排序,并提供包括来源、描述、发生时间、告警名称、告警等级在内的详细列表。4.灵活的告警通知

系统提供了丰富的故障通知方法,包括:声、光、Windows消息、EMAIL、短信等方法,用户也可自己编写处理程序进行处理。

5.集成多种故障诊断工具

系统提供了各种工具帮助用户进一步监测故障的原因,包括:SNMP工具、Telnet、Ping、Tracert、NetBIOS、RemotePing等等,辅助用户排除故障。2.1.8 流量管理

系统为用户提供了细颗粒度的流量分析管理工具Flowmon,实现从端口到应用的广泛流量分析和统计。

通过Flowmon,系统能够实时监控系统流量,而不是历史数据回放;系统无须配置成本高昂的硬件探针即可实现设备实时流量的采集分析,从而避免在网络中引入新的故障点。1.支持多种流量采集手段

系统提供多种流量采集的方式,支持端口镜像流量、sFlow流量、Netflow流量等,Flowmon可以同时支持多个网卡和多种采集并行的流量分析,并为数据分析提供一致的访问界面。

考虑到网络数据流量分析的数据量十分庞大,系统不会保存所有的原始流量数据信息,而是仅仅保存分析加工后的归并

信息,从而降低服务器的存储要求。2.多维度实时流量分析

系统支持对流量实时分析,当流量数据采集到Flowmon之后,系统会对流量数据开始进一步的分析,提取有效的数据信息,主要通过以下处理过程:

 数据过滤:可以通过地址、端口、协议等条件设置数据过滤器,滤去不需要的干扰数据。

 流向分析:对数据包包头或者xFlow的包信息进行解码,获取数据包的流向信息,用于分析数据的来源和目的地,通过分析矩阵获取每个网络节点的流向情况。

 层次分析:系统对数据包进行1-7层的划分,用于分析全局的数据流量。

 协议分析:系统会进行协议级别的数据分析,系统采用了CSPAE分析引擎进行TCP/UDP数据流分析,可以分析大多数的常见TCP/UDP协议,包括:HTTP、POP3、SMTP、FTP、SNMP、DNS等常见协议。

 应用分析:系统会对一些动态协议进行应用级别的7层包头分析,从而可以掌握BitTorrent、eDonkey、MSN等P2P和即时通讯协议的流量情况。3.通过流量分析辅助网络的异常判断

 全局统计

通过对流量的分析,Flowmon可以对采集到的数据进行整体的评估分析,让用户了解网络的整体情况,主要包括:

 全局流量统计:从整体角度对网络流量的数据包情况进行统计,包括数据包的长度、TTL、总体流量、总体协议分布、总体TCP/IP协议分布、TCP/UDP端口分布等。 终端流量统计:从整体对终端流量的进行统计和排序。 协议统计

系统从协议角度对网络数据行为进行分析,并按照终端形成排名,便于管理员掌握网络中协议的分布和重点终端的数据行为。通过协议流量排名分析,可以有效地发现ARP病毒、蠕虫异常流量、BT流量、网络异常流量等行为。

 协议整体分布:从全局协议、TCP/IP协议两个级别提供协议的分布。

 全局协议的排名分析:从终端角度对全局的协议进行排名分析(按照TCP/UDP/ARP/ICMP/IPX/IGMP/OSPF等分类)

 TCP/IP协议排名分析:从终端角度对TCP/IP协议的组成进

(按

照HTTP/FTP/Mail/Telnet/…/SNMP/BitTorrent/eDonkey/Messenger等进行分类)

 会话统计

系统通过对流量的流向进行分析,并对TCP会话进行监测,从而获取各个网络节点的流量和会话统计信息。主要包括:

 终端流量通讯矩阵:以矩阵的方式展现终端之间的通讯关系和通讯流量。

 终端流向统计:本地网络和外部网络,多个VLAN之间各个终端的流量统计排名和总流量。

 终端会话统计:终端TCP建立会话的统计,按照TCP的端口进行展现。 终端统计

系统从单个终端节点的角度,分析单个终端的网络数据行为,主要包括以下几个方面:

 终端总体分析:包括活动时间、总的数据流量和包数、基本协议对比等

 最近24小时的流量统计:每小时的发送、接收流量的统计

 数据包的统计:从TCP会话、TCP 标志包、异常数据包三个方面对数据包进行统计

 终端协议分布:终端使用的各种协议的分布图

 其他统计:包括ICMP协议统计、最后一次的数据通讯统计等。

2.1.9 报表管理

系统能够为用户提供性能、告警、状态、资源多个角度的统计和分析报表。

系统具备报表自定义扩展能力,通过报表设计器,可以定制更符合需求的报表。用户对相应的系统监测数据进行统计后,能够以报表形式展现分析统计结果。报表包括:网络运行统计、节点延时统计、节点端口流量统计、设备CPU负载统计、设备内存占用统计、主机CPU负载统计、主机内存占用统计、Oracle数据库运行统计、服务运行统计等 1.端口I/O流量报表

通过网络设备的端口对流量进行统计,并以报表的形式进行展现统计结果。2.设备故障日/月报表

系统平台提供统一事件管理来解决分割管理的数据融合问题,通过以告警事件为导向,提供了清晰的、集中的事件管理。可以让管理人员对整个IT环境的各种硬件和软件系统的实时事件信息收集,对各类事件信息进行过滤、、压缩、归并等相关性分析与处理,智能化压缩处理海量告警事件,分析出真正的问题所在,实时呈现出完整的事件信息,并将

这些信息分发给负责服务水平监视的操作管理员。

系统支持以日/月为单位实时呈现所有的网络、系统、应用、安全、桌面等被关注的资源。3.设备清单报表

以直观的方式显示设备当前的运行状态。

系统能够根据设定,统计指定的子网内各设备上端口的运行情况。让管理员能够直观的掌握设备上的端口数量以及端口的使用情况,科学有效地分配设备的端口使用,提高网络环境的运行效率。4.性能报表

系统能够根据不同层次管理员设定的不同监测参数组合,自动生成所需的性能分析报告,提供的性能报告能够针对网络所有的被管理资源(服务器、数据库、中间件)的关键性能指标(CPU、内存、磁盘、进程使用情况)进行详细的展现,系统还能根据设定自动将历史报告发送给相关人员,提高决策效率。5.自定义报表

系统提供的内置报表,若无法满足现有需要,可以通过客户化工作。

2.1.10 安全边界管理

系统提供IP地址资源管理,对网络边界的安全和IP地

址的户籍进行管理。系统通过内置的设备合法性监测引擎,在不额外消耗网络带宽的情况下,自动发现和监测网内终端设备的基本属性(IP地址、MAC地址、主机名、连接的交换机端口等),系统能够通过IP/MAC/主机/组织/人等信息绑定,建立IP资源信息库。IP地址使用情况详细列举出系统发现的各子网内IP地址的使用情况,包括IP地址、设备名、端口号、端口名称、IP状态、上联设备、上联设备IP、上联设备端口等。

边界按照IP地址的“户籍表”,监控网络中IP的使用情况,对非法使用的IP地址进行拦截,将非法的IP终端隔离出网络,确保用户不能随意修改IP地址和防止IP地址盗用。

网络边界管理提供了IP地址使用的高级审计功能,方便对IP地址的使用进行历史审计和追查。

系统能自动跟踪终端的变化情况。发现有未经登记的设备、或违反IP/MAC/交换机端口绑定规则的终端设备进行告警。

系统能够通过IP/MAC/PORT绑定实时发现是否有非法设备接入局域网络及是否有用户私自更改IP地址的行为;根据安全策略配置通过手动或者自动的方法将非法接入设备隔离出网络,或者将已被拦截的设备重新开通网络连接。有效保障了网络的安全。

 拦截与放行设备:手动或者自动(根据安全策略配置)将非法设备隔离出网络,或者将已被拦截的设备重新开通网络连接。

 IP/MAC/PORT绑定:IP/MAC/PORT地址绑定之后,能够实时发现是否有非法设备接入网络及是否有用户私自更改IP地址的行为,如果用户私自更改IP地址,系统主动发送告警信息。

 终端合法性监控:系统通过业务监控系统的合法性监测引擎,能在不额外消耗网络带宽的情况下,自动监测网内终端设备的基本属性(IP地址、MAC地址、主机名、连接的交换机端口等),对私自变更设备信息进行告警。2.2 资源监测管理

系统集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX等远程监控手段和Broadview UniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7X24不间断监控。 强大监测插件体系

无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。众多监测器工作独立,互不影响,保证整个监

测体系的稳定运行。

 灵活的监测时间调度机制和智能化的监测阈值模型

自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。

 主机代理Agent监测和远程无代理监测两种监测模式

多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。2.2.1 服务器系统管理

系统能够管理和监测Windows、Linux、IBM AIX、AS/400、HP-UX、SUN Solaris、SCO Unix等不同操作系统的服务器或集群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。帮助用户及早发现服务器系统的性能瓶颈与故障隐患。服务器监测项主要包括:

 主机基本信息采集:主机的基本信息,包括:CPU数目、机器型号、系统名称、系统版本、IP地址、内存大小、总线程数目、磁盘名称等。

 主机CPU使用率:监测主机系统的CPU使用率。

 主机内存使用率:监测主机系统的内存使用量、内存使用率。 主机磁盘使用率:监测主机系统的指定磁盘使用率。 主机磁盘IO监测:监测主机系统的磁盘TPS数、磁盘写操作速率等、每秒完成IO读写次数、每秒读写扇区数、每秒读K字节数、平均I/O队列长度等。

 应用进程监测:监测主机系统中指定应用进程的内存使用量、内存使用率、CPU使用率。

 系统服务监测:监测主机系统中指定服务的运行状态  主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、终端名称

 主机端口速率监测:监测主机系统中指定端口的入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。 主机重要文件监测:监测主机系统中指定的文件大小。 Job基本信息采集(AS/400):监测Job的名称、CPU使用率、类型、状态、所属用户等。

 ICMP连通性监测:监测与主机的连通性。

 HACMP集群状态监测:监测集群的可用状态及子节点的状态。

 自定义指标监测:系统提供了通用监测器,用户可以通过编写shell或者groovy脚本自定义监测指标 2.2.2 数据库管理

根据预定义的监测项目对Oracle、SQL Server、Sybase、DB2、Informix、MySQL等多种数据库,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。 DB2数据库监测

 基础监测:最后一次备份时间、数据库状态、数据库激活时间、当前连接数、连接总次数

 缓冲池信息监测:各缓冲读写次数、命中率  锁监测:死锁数、锁等待率、锁升级率  锁表信息:锁状态、锁模式、表空间、Schema  排序信息监测:应用排序数、排序溢出百分比

 表空间监测:已使用页、表空间类型、页长、总页数、表空间状态、空闲率、空闲页、使用率、预取大小、扩展数据块大小

 表空间容器监测:使用率、总页数、已使用页、容器类型、表空间名称  Oracle数据库监测

 基础监测:表空间使用率、连接会话数

 高级队列监测:ready消息数、错误的消息数、消息平均访问时间、消息总数

 归档目的地监测:归档目的地类型、归档目的地状态、归档目的地可用空间、归档目的地可用空间百分比、归档目的地位置

 基本信息采集:使用spfile启动、只读模式、归档路径、例程开始时间、限制模式、归档模式、例程名、并行状态、位长、DB版本、DB名称、主机名、实例状态  检查点监测:发生检查点数、完成检查点数

 数据文件监测:文件大小、读次数、写次数、读时间、写文件块数、读文件块数、读写文件块数、写时间  全表扫描配置: RSRATIO值、LTSCANRATIO值  资源锁定监测:锁定时长  碎片监测: FSFI值

 PGA配置:PGA内存及各区域大小、实例处理性能等

 进程资源消耗监测:

可用PGA百分比、可用PGA、已分配PGA、已使用PGA  命中率监测:共享区字典缓存区命中率、多次解析(重装)的条目比率、高速缓存区命中率、共享区库缓存区命中率、磁盘排序与内存排序比率、回退段等待次数与获取次数比率

 递归调用信息监测: 递归调用百分比、时间间隔的递归调用百分比、用户调用数、递归调用数、递归-用户调用比率、递归调用速率

 Redo日志配置:重做条目的平台大小、多种请求成功/失败比率、错误次数等

 Rman备份监测: 增量备份大小、全备份大小

 回滚段:大小命中率、等待率、等待次数、活动事务数、翻转次数、扩展次数、一致更改率、收缩次数、用户回滚率

 会话监测:会话ID、用户名、CPU时间、排序次数、缓冲区命中率、读次数、写次数、提交次数、占用游标数、扫描次数

 SGA配置:共享库缓存大小、SQL缓存大小、数据字典缓存大小、共享池大小、重做日志缓冲区大小、高速缓冲

区大小

 SQL监测:使用内存、执行时间、SQL语句、用户  转存空间监测:转储空间使用率

 表空间监测:未使用Extent数量读时间、最大Extent数量、已使用率、已使用量、未使用量、未使用百分率、允许最大空间、是否自动扩展、写时间、Segment管理方式、表空间类型、当前Extent数量、下一个Extent大小  表状态监测:增长速度、索引大小、数据大小、表空间、用户

 撤销空间监测状态监测:快照太旧错误计数、无空间计数  作业队列监测:破损作业数量、过期作业数量、失败作业数量

 MySQL数据库监测

 基础监测:缓存查询数、连接数  数据库大小监测:数据库大小  SQL Serve  基础监测:连接会话数、CPU使用率、数据文件大小、日志文件大小

 基本信息:阻塞进程数、处理器名称、Windows版本、处

理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间

 数据库大小:数据大小、数据库大小、未分配大小、未使用大小、索引大小、保留大小

 文件监测:路径、增长方式、容量、文件组、数据库、大小

 会话监测:最后处理时间、命令、数据库、CPU时间(ms)、内存(KB)、程序、建立时间、用户、状态、主机  Informix数据库监测

 基础监测:回滚数、死锁数、写缓存命中率、读缓存命中率、数据库连接数

 检查点监测:检查点速率、检查点等待速率  DbSpace监测:数据空间使用率

 磁盘读写监测:页写速率、页读速率、物理磁盘写速率、物理磁盘读速率

 锁监测:锁请求速率、锁超时率、锁等待率、死锁率  日志读写监测:物理日志页面写速率、物理日志写速率、逻辑日志页面写速率、逻辑日志写速率、逻辑日志记录写速率

 共享内存监测:块写速率、缓冲区写命中率、缓冲刷新到磁盘速率、Foreground写速、缓冲区等待速率、LRU写速率、顺序扫描速率、Latch等待速率、缓冲区读命中率  排序监测:内存排序速率、磁盘排序速率  事务监测:事务提交速率、事务回滚速率  Sybase数据库监测

 基本信息采集:DBMS名称、DBMS版本、系统信息、产品版本、主版本号、产品名称、次版本号

 数据库监测:使用百分比、已使用大小、数据大小、空间大小、索引大小、未使用段大小、数据段大小、段总大小、索引段大小

 会话监测:数据库、命令、已用内存、CPU时间、IO读写次数、程序、主机、用户、状态

 事务监测:系统事务交易总数、每秒回滚事务数、每秒事务数

 设备监测:属性值

 数据库:CPU使用率、数据库空闲表空间、数据库表空间、连接会话数

2.2.3 中间件管理

产品支持对Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb、等各类不同中间件,提供包括配置信息、连接池、线程队列、负载监测、通道情况监测等多类监测组,分析与监测中间件的各项运行状态参数。中间件监测项主要包括:

 系统信息采集:监测中间件基本信息,包括:操作系统、操作系统版本、当前可用堆栈及大小、当前目录、重启次数、开启线程数。

 JVM使用监测:监测JVM的堆栈大小和使用率。 JDBC链接池监测:监测指定JDBC连接池资源连接情况。 JTA事务监测:监测中间件中数据处理事务的活动情况。 线程池监测:监测指定线程类的线程平均数、空闲线程平均数以及线程吞吐量。

 Servlet监测:监测指定Servlet执行和调用情况。

 EJB监测:监测指定EJB激活次数、钝化次数、缓存个数、事务提交次数、事务回滚次数、事务超时次数、访问次数。 WEB应用监测:监测指定Web应用中Session的当前个数、最大值以及累积个数。

 JMS队列深度监测:监测中间件中JMS消息队列活动情况。 MQ通道情况监测:监测MQ的通道情况,包括:每秒接收字节、每秒发送字节、通道状态、发送间隔、事务数。 MQ队列深度监测:监测MQ服务的消息队列的队列深度。 Tuxedo负荷监测:监测Tuxedo的机器状态是否被激活、每秒处理的队列服务数每秒入队的队列服务数、当前客户端数、当前WorkStation客户端数。

 TongWeb数据连接池监控:监测国产中间件Tongweb数据库连接信息,如最大、最小连接数,可用、创建、关闭、等待连接数等

 TongWeb应用性能监控:主要监测系统线程情况、请求队列情况、吞吐量、发送接收字节数等信息; 2.2.4 基础应用平台及通用服务管理

状态提供对IIS、Apache、-Domino等基础应用平台的基础信息、连接测试、基本负载等重要信息的监测。

有效实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题。 Domino服务器监测

 基础监测:监测Domino服务器的内存占用值、指定数据库的使用率、待发邮件数、僵死邮件。

 基本信息采集:采集Domino服务器的基本信息,包括:Domino版本、数据库存放路径、CPU个数和CPU类型信息。

 负载监测:监测Domino服务器当前负载情况,包括:每分钟交易数、每分钟最大交易数、交易总数、当前用户数、最大用户数、当前任务数。

 复制(Replication)监测:监测Domino服务器复制情况,包括:成功复制次数、失败复制次数、删除文档总数、增加文档总数、修改文档总数。

 邮件服务监测:监测Domino邮件服务情况,包括:死邮件数、路由邮件数、待路由邮件数、已投递邮件数、待投递邮件数、平均邮件大小、最大邮件大小。

 缓冲池监测:监测Domino缓冲池的使用情况,包括:缓冲池大小、缓冲池使用值、缓冲池最大值、扩展管理池使用值、扩展管理池最大值、NSF使用值、NSF最大值。 扩展管理池监测:监测Domino扩展管理池的使用值、最大值。

 Apache负载监测:监测服务器是否连接,采集CPU负载、正

常运行时间、响应时间、累计访问数、累计访问数据处理、每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、空闲作业数等指标。 IIS监测主要包括:

 连接监测:监测IIS服务运行时间、服务运行时间、尝试登陆/秒、尝试连接/秒、当前连接数、最大连接数。 传输字节监测: 发送字节/秒、接收字节/秒、传输字节/秒、服务运行时间、接收文件/秒、发送文件/秒、找不到文件的错误数、服务运行时间、传输文件/秒。

 用户监测:服务运行时间、最大非匿名用户数、非匿名用户/秒、匿名用户/秒、当前非匿名用户数、当前匿名用户数、最大匿名用户数。

 WEB请求监测:post请求/秒、head请求/秒、其他请求/秒、服务运行时间、get请求/秒。

 WEB服务器可用性监测:监测http、https和Web Service服务器是否连接以及是否正常运行,可以监测指定http的URL路径是否包含或者不包含指定内容。

 标准邮件服务器监测:监测pop3、smtp邮件服务器是否连接以及是否正常运行,可以监测具体的邮箱的邮件数以及邮箱使用量。

 基础服务监测主要包括:

 DNS服务监测:监测DNS服务器是否连接以及是否正常运行,可以监测指定域名是否正确解析。

 FTP服务监测:监测FTP服务器是否连接以及是否正常运行,设定已FTP方式登录该资源的阈值,监测指定文件是否存在。

 通用资源监测主要包括:

 TCP端口监测:可监测多个TCP端口,并采集连接时间,可指定端口开启或者关闭时告警。

 通用SNMP监测:可监测多个SNMP表达式(支持四则运算、时间差值运算等)对应的采集结果,并可设定告警阈值。2.2.5 基础运行环境管理

对于IT环境系统,系统支持各种智能设备的快速监测,同时通过SNMP、数据库接口等其他接口方式可以实现客户化的扩展监控,监测内容包括基础运行环境的温度、湿度、漏水、烟感和电源、UPS、智能空调等。2.3 告警监控管理 2.3.1 告警管理  事件分析

系统具有强大灵活的事件分析功能,能够智能识别各类不同来源的原始事件。通过内建的智能事件分析引擎,对标准化后的原始事件进行可靠过滤、重复压缩、对齐归并与依赖关联,自动修正告警记录,最终形成有效告警。 自定义事件解析规则

用户可自定义编辑和导入解析规则库文件,自主制定事件解析规则,同时支持第三方MIB库的装载与自动解析。 基于iBDM的事件关联分析

事件的产生以及其影响都不是独立的。基于业务影响依赖模型iBDM的事件关联分析,自动发现关联,追溯事件影响、定位问题,发现问题根源。 告警台

作为告警管理平台,呈现最新告警信息,并以最近24小时、最近一周、最近一个月等不同区间统计最近的告警记录,提供自定义刷新、告警确认与消除等告警管理操作。 分等级告警

产生的告警信息分为提醒、警告、次要、重要、紧急五个等级,用户可以根据告警等级安排告警处理的优先次序。 分类查询

借助按资源与按节点的分类导航,快速搜索分类告警记录;支持通过告警信息的事件等级、时间、类别、名称、资源等组合条件进行自定义查询。 告警的关联特性

点击具体告警,会列举告警关联的事件,同时展现事件的详细信息、问题资源信息和依赖关系图等,方便分析故障详情。2.3.2 告警通知  多样的通知方式

支持短信、邮件、语音等告警通知手段。

支持外部命令、UniAgent执行脚本、NetSend、Snmp设置、Trap转发等告警处理动作。告警处理动作将按预定义,自动在告警发生后执行,先一步尝试恢复业务正常运行。 灵活的通知策略

根据不同的告警事件来源为它们指定不同的通知和处理方式,组成全面告警通知策略。 强大的扩展功能 2.4 统一监控展现

通过统一监控展现功能,能够将不同类型的设备、系统、应用等资源的监控平台进行集成,避免使用多个系统进行监控管理。通过综合的展现平台来同事展示各种监控视图,以便于运维人员在一套系统上统揽全局。

运维监控通过集成底层监控产品,能够提供从资源、节点、网络、业务等多角度、层次化的监控信息集中展现,并可通过服务台和个人桌面集成底层监控平台的监控界面和数据,以支持上层的运维工作。2.4.1 灵活拓扑展现

IT运维管理系统中的灵动拓扑展现与灵动可视化平台实现同步,系统可以根据运维人员在灵动平台中创建的各类视图来显示资源配置、运行状态等信息。

灵动拓扑展现不仅可以展现IT资源的逻辑物理关系,还可以查看视图中资源的运行状态。拓扑图中的任一设备或者链路都会以浮动框的形式显示其基本信息与运行状态。同时,通过点击节点,可跳转至相关联的视图或相关联资源的详细监控界面。

IT运维管理系统作为运维与监控平台,其自身收集与处理了大量IT部门运维所需要的各方面信息,包括:资源配置库、监控性能与状态等。这些信息需要通过多种方式进行展现,而IT运维管理系统正是通过灵动可视化平台来提供此能力。

灵动可视化平台集模型编辑和模型展现于一体,方便用户绘制网络拓扑、业务拓扑、机房视图及其他结构图。其使用最新的Flex富客户端展现技术实现,可以自由的组合数据源提供的信息,以图形、表格、拓扑等形式,提供于用户,并支持用户的操作交互,以进一步挖掘数据。

2.4.1.1 展现能力

灵动可视化平台提供了超过600个基础模具库,涵盖了普通图形、各种厂商设备图标、设备面板等各类图形组件。通过将这些图形组件组合在一起,并为其关联恰当的业务数据源,按需表现多种逻辑物理环境。如局域网络拓扑图、业务系统图、机房布局图、设备面板图等。2.4.1.2 交互挖掘

系统具有基于Flex展现技术,还具有基于WEB的交互能力,在平台提供的图中,用户可以通过鼠标点击,与图中的元素(图形、表格)等进行交互,可以获取到进一步的资源详情、挖掘数据与切换观察视角。

用户也可自定义图表事件,进一步扩展图形交互,集成其它监控系统的页面功能。2.4.1.3 编辑扩展能力

由于系统的业务架构经常会产生变化,因此系统实施时确定的各种拓扑图也会随之改变。为了提供现场的编辑能力,系统需提供所见即所得的编辑工具,无须使用各种复杂的配置脚本,而通过WEB上的画图工具,完成图形的编辑与创造。

2.4.1.4 数据可视化感知

灵动可视化平台可展现的信息,通过数据源的支持,可以让灵动图形中的各类对象有了灵活生动的展现,平台可以通过数据信息、状态的绑定,实现拓扑可视化的动态展现和交互,灵动平台支持多数据源提供,默认采用CMDB配置资源库,根据CMDB配置库提供的定义信息分类组织数据对象,用户可直接拖动这些数据对象到图中,以完成用户理想的视图。

2.4.2 网络监控展现

IT运维管理系统中的网络运行监测与网络监控平台实现同步,集成网络监控平台的相关功能,系统可以将各种网络监控指标进行统计后分类以视图的方式显示。 网络拓扑

网络拓扑不仅可以展现网络主拓扑图,还可以递进式挖掘多级子拓扑,进行逐层嵌套组织显示。拓扑图中的任一设备或者链路都会以浮动框的形式显示其基本信息与运行状态。同时,通过点击节点或资源链接,可跳转至相关对象的详细监控界面。 网络监控视图

网络监控视图提供了关注网络整体运行表现的全局视角,网络的各类指标均在其中得到体现,如反映管理对象的系统统计信息、反映端口速率排行前10位、CPU使用率前10位、内存使

用率前10位、节点连通延时前10位的列表信息、最新网络告警事件列表及统计排名等。内容的增减与组织方式可根据用户的需要与习惯随意调整。2.4.3 业务监控展现

IT运维管理系统的业务监测视图以业务系统为核心,集成业务监控系统的相关功能,统一展现支持业务系统的网络/安全设备、系统、中间件、数据库、通用服务和基础应用等各类资源,紧贴用户思维,由粗线条到细颗粒度地逐层展现业务系统的运行状况,满足企业或单位以业务为最终服务目标的IT管理思想。2.4.3.1 业务应用拓扑

业务应用拓扑支持有向关联,业务系统各关联资源根据业务影响方向组成业务支撑网络。针对业务网络的告警事件,依靠基于iBDM的事件关联分析,自动分析判断节点间依赖关系,快速定位业务故障根源。2.4.3.2 业务监测视图

业务监测视图提供业务系统的基本信息、资源组成和运行状态,并通过平均修复时间(MTTR)和平均无故障时间(MTBF)等SLA综合指标评估业务服务水平。通过业务监测视图,用户可深入浅出地分析业务系统当前的运行状况,大大降低IT系统管理难度。

2.4.4 资源监测展现

为了便于查找故障,分析故障根本原因,往往需要查看故障产生的具体对象。IT运维管理系统的资源监控视图集成业务监控系统的相关功能,从资源总览、资源汇总和资源详情视图分层分类地细致展现各类资源的性能详细指标。 资源总览

汇总所有监测资源信息,以全局和分类统计其可用状态和健康状态,并列举当前问题资源。 资源汇总

针对具体资源类型,统计展现所有该类资源的运行状态,包括:该类资源的可用性和健康性、可用资源比率与健康资源比率、当前出现问题的具体资源等常规指标和该类自有的其他指标。 资源详情

针对业务应用的具体资源,根据不同的资源分类(如网络设备、服务器、数据库、中间件等),详细展现资源的基本信息、负荷状况、稳定性、响应延时各项关键性能指标和健康度与可用度的状态分析,轻松掌握资源当前的运行状况。2.4.5 节点监测展现

网络中拥有独立IP的网络实体,我们称之为节点。单个节

点可能部署了多项被监测资源,如操作系统、数据库、中间件等。IT运维管理系统通过集成业务监控系统的相关功能,提供了基于节点的整体监测,汇聚节点内各资源的监测数据,从总览视图、详情视图(一级、二级视图),递进式地展现被监测资源的详细参数。

 节点总览视图

节点总览视图从总体上统计各个分类节点的不可用节点数、节点总数、及总资源数等,同时以柱图方式直观显示节点的不可用节点数占节点总数的比例。 一级节点视图

一级节点视图集合了同分类的所有节点,各节点单独展现内部资源健康状态。 二级节点视图

二级节点视图详细给出节点所包括单个资源的详细运行情况,如图所示,此

服务器节点不仅监测了服务器的Windows 操作系统的运行状态,还包括其网络设备、DNS服务和POP3 服务的运行情况。2.4.6 告警信息展现

为了查找发生故障的原因,往往需要查看一段时间内的告警信息来进行分析。告警管理可以对告警信息按资源、按节点的进行查询,并展示了各个时间段的告警信息。2.4.7 灵动可视化平台 2.4.8 扩展展现集成接口

扩展展现集成(SSO)通过Portal技术,以B/S方式实现IT运维管理系统与其他监控产品的融合,为用户提供可扩展、多元化的信息汇聚与功能集成。

借助统一身份登录和权限验证,IT运维管理系统可以深度集成其它监控系统,为不同角色的管理和技术人员提供相应的个性化工作界面,提高IT运维服务效率。2.5 报表管理

 全面的性能与告警报表

依据对监测数据的自动汇聚、抽取、分析,提供基础架构性能与告警、资源比较、指标排名、指标趋势等各类层次化统计分析报表。从业务运行状态到微观性能指标,自定义查询业务应用系统及其关联资源的当前和历史运行情况。 业务运行报表

支持按业务的方式对业务应用可用性、MTTR和MTBF进行统计。 节点报表

支持按节点的方式对其监测数据的进行汇总分析,提供基础架构性能指标趋势等各类层次化统计分析报表,并支持自定义时间段进行查询。

 “所见即所得”的报表

支持报表收藏功能和订阅。支持导出为Excel、PDF文件和立即发送报表到指定Email邮箱,还能够为不同的用户订阅相关报表,自动定时发送到指定Email邮箱,提供系统优化、决策分析和业务规划的量化参考。

篇2:监控运维管理制度

在各级领导的重视和关怀下,在科室领导的正确领导下,经过全体参赛选手的奋勇拼搏和裁判人员、工作人员的共同努力,圆满完成了各项赛程,2012年运维监控人员业务技能比武活动于7月19日圆满结束。

此次技能比武活动,较好的落实了XXx管理处《关于组织开展2012年全省交通运输系统职业技能竞赛的通知》的文件精神,以此次竞赛为契机,XX监控站突出“以赛代练、以赛促学”的活动宗旨,以促进学风、提高岗位技能为目的,比思想,比作风,比技术,充分展现了我站员工善于学习、勤于钻研、敢于攻关和吃苦耐劳、积极向上的良好精神风貌和过硬的技术素养,不仅加强我站人员的专业素养以及岗位职责的驾驭能力,更充分的展现了积极进取、顽强拼搏的精神风貌,为备战省厅、省交通工会组织开展的2012年全省交通运输系统职业技能竞赛打下了坚实的基础。

比赛分监控组、机电维护组、电工组三组分别进行,最终评出各组一、二、三等奖各一名,优秀奖两名。

运维组一等奖与二等奖分别由我站运维班的邢保知和XXX夺得,XXX获得优秀奖;监控组一等奖和三等奖分别由我站监控班的XXX和XXX夺得。配电组一等奖和二等奖分别由我站配电班XXX和XXX夺得。此次比赛取得了圆满的成功,达到了赛前预期效果,成绩是喜人的,根据此次技能比武活动的开展情况做以下总结

一、形式从简,准备工作扎实。

本着求真务实的原则,此次技能比武,我们把主要精力放在日常工作与专业知识学习的扎实落实上。接到比赛通知后,我站全体同志积极响应,广泛动员,制定了相应的措施,充分调动职工的积极性,全员参与,再次掀起了学理论学技术的热潮。

二、积极学习,提高专业技能。

此次比赛分为监控组、机电维护组、配电组三组同时进行,比赛主要围绕日常工作技能和专业设备的操作与维修等内容进行竞技,与以往比赛相比,本次技能比武理论考试按各自的专业不同,在标准命题的基础上,调整了试题结构,增大了题量和难度;实际操作的命题,突出专业特点,在注重基本功考核的基础上,加强了对动手能力的检验。各位参赛选手热情高涨,为参加本次比赛,在完成日常工作的同时,挤时间,查资料,学理论,练操作,作了充分准备。

三、公平竞争,展现自我闪耀风采。

我站参赛选手年龄最大的与最小的相差有15岁,可是不管年龄差距再大,所有参赛人员都是一样的认真,平等竞争,即使是没有取上名次的同志,他们也以实际行动作出了表态。在整个比武过程中,参赛选手严守纪律,规范操作,奋勇拼搏,敢于争先,表现出昂扬的斗志和良好的精神风貌。虽然本次比赛增加了题量、难度,加强了动手和综合能力的考核,但选手们的成绩还是令人满意的。大家互相学习、互相切磋,起到了相互交流共同提高的作用,更展现了自我闪耀的风采。

四、调动学习积极性,提高专业技能。

通过比赛,锻炼了我们的运维监控队伍,涌现出一批技术拔尖人才,取得了可喜成绩。从这次比赛中,我们可以看到自身的一些不足,也看到了他人优于我们的地方,提升了对自己的了解与认知,在提高专业化技能水平的同时,更是提升了我站员工对各自岗位专业知识的学习积极性,对促进登封运维监控站进一步搞好员工培训工作和调动员工个人的学习积极性,将起到良好作用。

五、竞赛中反映出的问题。

通过比赛也反映出一些问题。一是运维与监控班技术水平比较高的尖子人才比较少,离我们要达到人人是尖子的目标还有一定的距离,而我们的技术水平之间也存在有一定的差距。二是从参赛选手的比赛情况看,部分同志的理论知识比较薄弱,个别同志的实际操作水平较差,导致整体发展不平衡。这呢,说明我们的基础培训工作做得不够扎实,虽然对比武较为重视,但是比赛成绩还不够完美。像这样的活动开展不够多,所以在以后要增加这样的技能竞赛活动的开展。在今后的工作生活中,我们也会高度重视这些现象,引以为戒,面对差距找不足,面对问题找办法,采取有效措施,抓出实效,切实的做到各项培训和技能操作的进一步加强。

篇3:智能网络运维监控系统

目前比较流行的网络管理软件有IBM公司的Net View, HP公司的Open View, 以及Cisco公司的Cisco Works等。但这些软件以管理主干路由器为主, 或者是建立在独立厂商各自设备的基础之上, 对于我台网络结构并不能完全适用。而网络设备正常运行与否, 直接关系到发射机的播出情况, 进一步导致不良的政治后果。为了解决目前的困难, 实现一个高效的、实时的、智能的、合适的网络设备监控系统, 已经被提到了一个空前的高度上。

因此, 我台计划建设信息化IT运维管理平台, 实现对网络系统、服务器、数据库、机房环境等信息基础的设施的全程自动监控;改变以往被动的、孤立的、分散的管理模式, 主动及全面发现系统中存在的问题[1], 以流程贯穿整个运维管理过程;减少运维人员的劳动强度, 提高效率, 切实保障各业务系统可靠、稳定、高效的运行, 进一步信息化为全台的服务质量。

1 基于ICMP和SNMP协议网络运维系统设计

ICMP是 (Internet Control Message Protocol) Internet控制报文协议。它是TCP/IP协议族的一个子协议, 用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息[2]。本系统正是利用了“是否可达”功能来检测目标主机是否处于联网状态。

SNMP, Simple Network Management Protocol, 即简单网络管理协议[3], 是有IETF定义的一套基于SGMP (简单网关监视协议) 的网络管理协议。在SNMP为技术的网络管理系统中, 管理工作站利用SNMP进行远程监控管理网络上的所有支持这种协议的设备:如计算机工作站、终端、路由器、Hub、网络打印机等, 主要负责监视设备状态、修改设备配置、接受事件警告等。本系统正是利用了这些功能, 对网络中的设备进行各设备状态的实时监视。

本次系统开发, 结合我台实际应用, 采用SNMP及ICMP (PING) 两种方式, 实时采集网络中设备的相关数据, 比对预设阈值, 进行告警管理, 并实时保存数据等功能。由于两种协议都会一定程度上增加网络带宽, 所以系统在设计之初就提出了时间间隔的概念, 即两次执行PING和SNMP的时间间隔。

本系统的ICMP协议采用了PING方式实现。管理主机向目标主机执行一次PING命令时, 在预设的时间内没有完成本次PING, 则系统会认为管理主机与目标主机之间的链路出现了问题, 将会产生语音、文字及图像报警信息, 通知维护人员前往处理故障。表若PING成功, 表示目标主机可达, 即主机处于正常联网状态, 系统将继续执行SNMP协议相关功能。

SNMP协议在PING成功后执行, 获取相应设备的参数信息, 与预先设置的阈值进行比对, 若超出阈值, 同样的会生成语音、文字及图像的报警信息来通知维护人员。两种协议实现流程如图1所示。

2 网络运维系统结构和功能

建立网络设备监测系统[4], 实现传统的被动式故障处理方式向前瞻式管理方式的转变, 既要使网络中出现的危险和漏洞降到最低, 防范于未然;又要减轻我台面临着巨大的运维压力, 降低信息管理的难度。因此, 整个系统以事件为核心, 将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统, 对整个系统内的所有事件进行收集、关联分析和处理。

通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控, 并以类visio图形化的方式直观地展现出来。对于系统运行的异常表现及时采用文字、图形及语音的方式报警。

本网络运维系统主要是应对我台现有的网络设备, 而我台需要监测对象有:服务器、交换机、路由器、防火墙、存储设备、终端主机、UPS等终端, 所以此次系统设计也主要针对这此设备展开。根据我台维护人员历来的经验, 在故障处理过程中, 主要针对设备ICMP (PING) 延迟, 内存利用率, 硬盘利用率, CPU利用率, 网口流量, 设备持续运行时间, 会话数, 电压状态等参数信息判断网络运行情况, 所以软件功能也由此展开。图2显示出了本系统的主要监测对象及功能:

3 软件系统设计与实现

网络运维系统软件采用了微软visual stdio 2010开发平台, 使用Win SNMP API实现SNMP协议[5]及ACE网络库实现ICMP (PING) 协议, 并结合人交互较好的ribbon控件 (图3, 图4) 及类visio控件 (图5) 进行开发。现简单介绍此系统的几个功能:

3.1 系统管理模块

“开始运行”:系统从数据库中加载已保存的设备数据到类visio主视图内 (图4) , 然后启动检测线程, 执行图1所示的检测流程进行检测;

“停止运行”:用来关闭系统检测;

“系统配置”:配置软件的启动项, 报警语音, 管理系统作为服务器端时的TCP/IP配置及数据库连接字符串配置 (图6) 。

3.2 布防管理模块

“解除警报”:解除当前发生的警报事件;

“布防选中”:使选中的设备进入布防状态, 即系统将实时进行检测;

“撤防选中”:使选中设备进入撤防状态, 即检修状态, 系统将不进行检测;

“布防所有”:使所有加载的设备都进入布防状态;

“撤防所有”:使所有加载的设备都进入撤防状态;

3.3 设备管理模块

此块功能区主要功能是用来添加设备、删除设备、修改设备属性及保存数据等功能。

3.4 视图管理模块

此功能区主要功能是显示和隐藏相应的视图窗口, 用户可根据自己的需求来自定显示方案。

3.5 标题栏模块

系统运行时, 此模块 (图4) 会显示出整个系统当前运行状态:正常、异常、未启动等信息。

3.6 类visio主视图模块

此模块 (图5) 显示了当前系统所有等检测的设备, 当处于编辑状态时, 使用人员可随意在此区域增加、删除、修改元素等功能。当处于检测状态时, 以不同的颜色和图片显示出设备检测结果 (正常、异常、检修等状态) 。当鼠标移动到指定设备上时, 会显示出当前检测的结果值, 用户可以根据提示信息判断设备运行情况。

3.7 状态栏模块

显示作为服务器端TCP/IP状态, 数据库连接状态, 客户端连接数量, 当前登入用户权限及类visio控件的缩放功能;

软件日志 (图8) :显示软件运行调试日志信息;

报警日志管理 (图9) :用户操作日志信息和设备异常日志, 这些日志都保存于数据库中, 用户可根据需要进行历史查询;

3.8 选中设备历史数据查询模块

用户通过右击设备, 在弹出菜单中选中“查看历史”操作, 可以得到如图10窗口, 并可指定周期及端口号, 得到此设备指定端口和时间段的历史流量、内存利用率、CPU利用率。当鼠标进行曲线控件时, 会有显示的提示信息显示当前值, 并可对曲线图进行左右拖动查看其它结果值。

4 结束语

本系统已在我台网络机房投入使用, 网络维护人员使用后反应良好。本系统目前已实现主机是否可达及设备参数监测的功能, 但网络的自动拓扑功能还未实现, 因此, 我们下一步工作将围绕此块功能加以展开, 开发出一套更人性化的系统, 更好的为安全播出提供技术支持。

参考文献

[1]宋光慧, 魏海平.一种将主动网络技术应用于网络管理的方案[J].计算机应用, 2003.

[2]刘杰, 王清贤, 罗军勇.一种基于ICMP的逻辑层网络拓扑发现与分析方面[J].计算机应用, 2008, 6, 2 (6) .

[3]William Stallings.SNMP网络管理[M].胡成松, 汪凯, 译.北京:中国电力出版社, 2001.

[4]马瑞芳, 王会燃.基于MIB的远程监测系统信息模型的研究[J].微电子学与计算机, 2006.

篇4:浅谈IT运维管理之系统集中监控

【摘 要】随着网络应用技术不断发展,IT系统越来越复杂,业务对IT系统的依赖程度也越来越高。本文从项目背景、需求目标、功能设计、效果分析几方面探讨集中监控系统的建立。

【关键词】IT运维管理; 监控系统 ;数据采集

【中图分类号】C93【文献标识码】A【文章编号】1672-5158(2013)07-0070-01

前言

随着企业信息系统项目的不断建设和应用领域的不断拓展,企业管理运营对信息系统的依赖性越来越大,对IT基础平台的运行可靠性要求也越来越高,企业的信息化工作逐步从项目建设阶段转向以深入应用、提升应用水平的运行维护阶段。提高运维管理水平已成为现阶段企业信息化系统应用的重要保证手段。

一、背景

信息管理部是信息化专业主管部门,负责网络、主机等IT基础设施和应用系统的建设、维护,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,企业应用不断增多,主机服务器、网络实施、操作系统、数据库、应用服务器等软硬件平台日益复杂,服务用户的面不断扩大,如何维护好日益增多的主机网络设备,保证各个应用系统安全顺畅运行,为用户提供良好的服务并及时解决各类问题和故障,是IT运维管理的关键所在。目前IT运维管理还处于初级阶段,还没有构建一个综合的IT运维管理体系。对网络、主机、系统等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化。因此需要建立一套融合组织、制度、流程、技术的IT运维管理体系,从粗放、分散、低效的管理逐步过渡到科学、规范的管理,实现从手工运维到自动化运维。按照IT运维管理理论、方法和标准,结合实际和建设需要,遵循立足需求、统一规划、分步实施原则。根据实际人员和管理情况,当务之急是需要建立集中监控系统,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保网络及信息系统正常、稳定、高效运行。

二、系统架构

2.1 系统架构图

集中监控系统实现对不同服务对象和IT资源的实时监控,包括主机、数据库、中间件、存储备份、网络、安全、机房、业务应用和客户端等,并通过集中监控管理平台对不同被管对象进行综合处理和集中管理,其系统架构如图1所示。

2.2 数据采集层

数据采集层负责基础监控数据的采集、归并、筛选、过滤、关联等处理,同时对数据进行本地存储。数据采集的方式根据被监控对象的不同可分为:

(1)路由交换机及网络安全设备的数据采集方式采用SNMP协议轮询,接收SNMPTRAP以及Sys-log,采集相关的状态、事件信息。

(2)主机服务器针对不同的操作系统类型和监控的要求,采用SNMP协议、WMI、TELNET的方式轮询。对于特殊应用需求,可以采用AGENT的方式采集数据,满足个性化的需求。

2.3 数据分析处理层

数据分析处理层根据系统设定的各项功能模块的具体要求,对数据采集层提供的数据进行进一步组织、分析和存储,并将结果提供给上层的数据呈现层2.4 数据呈现层数据呈现层根据数据分析处理层提供的数据,通过Web界面以视图、报表等方式向用户展现。

三、系统主要功能

3.1 数据采集

数据采集是整个集中监控系统的基础功能。采用SNMP、WMI、TELNET等协议轮询、接收SNMPTrap、Syslog,或者通过安装在主机/服务器上的A-gent上报信息,来获取被监控对象的状态信息、日志信息和告警信息,并作相应处理。

3.2 故障判断集中报警

故障判断根据采集的基础数据和设定的判断基准,对事件进行判定,确定故障是否存在,并生成故障级别信息。集中报警功能根据故障判断提供的故障级别信息,采取不同的报警策略自动触发,驱动不同的报警程序,比如邮件、短信、声光等。

3.3 性能管理

性能管理对设备性能进行实时监控,比如:网络设备的CPU、内存、端口流量,主机系统的CPU、内存、磁盘读写、交换文件等。监控参数管理可以定义监控周期和性能阈值,当性能超过阈值时,系统发出报警信息。

3.4 网络拓扑管理

网络拓扑管理利用直观的图形展示,帮助管理员更好地了解网络系统的联接情况,在网络中出现故障时能够快速定位故障发生的位置,从而更快速恢复故障。网络拓扑管理根据网络连接情况,自动生成和实际情况相符的网络拓扑图,为管理员提供真正的网络视图。通过网络拓扑图管理员可以方便地掌握设备分布情况和每个设备的运行状态。

3.5 报表管理

报表管理用户可以订制资源使用报表、故障统计报表、资源趋势报表、TOPN统计报表、可用性统计报表、综合报告等不同类别的报表,并生成柱状图、曲线图、饼图等直观图表,实现各种信息的统计和分析,全面、宏观地展示网络的运行情况,有助于更细致地分析网络数据,察看网络、系统中可能存在的热点故障、故障多发设备、故障多发时间,性能变化趋势等,从中发现规律和趋势,为决策者和管理人员提供详细的统计分析报表。

3.6 配置管理

配置管理主要反应网络系统中被监控系统配置更新的情况。

3.7 系统管理

系统管理主要包括系统配置、用户管理、监控行状况等的管理。用户管理是实现系统用户的基本信息维护和权限管理。监控策略管理是根据不同的监控对象和应用环境,设置不同的监控策略,比如数据采集周期、报警方式。

四、结束语

篇5:运维管理制度

停送电工作直接关系安全生产,做好停送电工作是一项科学的技术管理工作,根据《电气安全工作规程》及集控运行实际情况特制定本制度。

一、严格执行《电气安全工作规程》,在停送电时,应认真填写操作票,操作时必须由两人进行,一人操作,一人监护,操作人员应站在绝缘物上,并戴好绝缘手套方可操作。

二、认真规范地做好线路、配电变压器、大容量设备的停送电工作,并按照“两票三制”的要求和规定,做好详细记录。

三、用户要求部分或全部停电、送电时,应提醒用户书面写明日期、停电时间、停电设备、停电范围、停电原因等内容,提前24小时提交运行操作人员;紧急停、送电时,用户对口专业人员可以直接下令操作,巡视操作人员应记下操作命令,如无录音电话,操作后应及时记录发令人的操作命令并及时签字确认。

四、停电

1、停电时,应先断开断路器(负荷开关),后断开隔离开关,防止带负荷拉闸,产生电弧烧伤工作人员和损坏设备。

2、断路器(负荷开关)、隔离开关拉闸后,应进行检查,无异常情况立即在断路器(负荷开关)、隔离开关把手上挂“严禁合闸,有人工作”的警告牌。

3、配电房(室)的门应加锁,钥匙由操作人员保管。严禁其他人员操作送电。

4、严禁传讯、约时或打信号停电。

5、线路、设备停电后,应先验电,证明确已停电后,立即在检修设备的工作点(段)两端导体上挂好接地线,并设防护遮栏后方可进行工作。

五、送电

1、工作完成后,工作负责人必须检查施工现场,认真检查有无工具、材料等遗留在导线和设备上。

2、查明工作人员确已全部撤离检修的设备后,拆除接地线和防护遮拦,此时即认为线路或设备已经带电,严禁再接触电气设备。

3、由操作人员打开配电房,拆下警告牌,应进行检查,无异常情况即可送电。

4、严禁传讯、约时或打信号送电。

篇6:运维培训管理制度

编号:第1版 起草:詹 晋 审核: 批准:

中心:基层系统运维管理委员会

基层系统运维培训管理制度

基层系统运维培训管理制度

第一章

总则

1.1 目的

为配合基层系统运维管理的发展目标,提升人力绩效,提升运维服务商及技术人员素质,增强其对本职工作的能力,并有计划地充实其知识技能,发挥其潜在能力,建立良好的人际关系,进而发扬本管委会的精神,特制定《基层系统运维培训管理制度》(以下简称本制度),作为各级人员培训实施与管理的依据。

1.2 适用范围

运维服务商及各层级运维技术人员开展的各类培训及相关活动均适用于本制度,运维服务商及各层级运维技术人员参加或组织相关培训的情况,将纳入服务商和个人的绩效考核范畴,作为优质运维服务商及个人评选的依据之一。

第二章

培训机构和职责

2.1 基层系统运维管理委员会(以下简称管委会)的培训工作实行计划由管委会下设运营组负责管理,其他各组配合实施的原则。

2.2 运营组为管委会的培训主管机构,运营组依据运维服务商的人力资源状况、各服务商的培训需求及管委会的全年工作安排制定出管委会总体的和月度培训计划,经批准后组织实施并考核。

2.3 运营组在培训中的主要职责:

2.4.1 管委会培训体系的建立,培训制度的制定与修订;

第1页,共8页 基层系统运维培训管理制度

2.4.2 管委会培训计划的制定与组织实施;

2.4.3 对各运维服务商及运维技术人员的培训计划实施督导、检查和考核; 2.4.4 、月度培训报告的撰写、呈报,培训报表,资料的收集、汇总、整理与归档。

2.4.5 参训人员的出勤管理。

2.5 各组在培训中的主要职责: 2.5.1 本组培训需求计划的制订; 2.5.2 积极配合运营组实施培训工作;

2.5.3 本组、月度培训工作总结与培训资料的汇总、整理及归档;

第三章

培训需求与实施管理

3.1 培训需求的确定

3.1.1 管委会整体培训需求的确定

运营组根据管委会整体经营战略,经较为充分的培训需求调研后,拟定培训需求分析报告,或将相关内容在工作计划中予以体现,报管委会综合管理组审核确认。

3.1.2 各组培训需求的确定

各职能部门在制定工作计划中,应根据运维服务商及运维技术人员现状和未来1年内的工作及岗位需求,提出本组的培训要求。另对于阶段性或临时性培训需求,应及时向运营组反馈或上报管委会综合管理组。

第2页,共8页 基层系统运维培训管理制度

3.2 拟定培训方案或计划

3.2.1 培训计划的拟定

在运维服务商正式投入基层系统运维前前,综合管理组及运营组根据管委会整体经营战略,并结合各组的培训需求,拟定管委会培训计划,计划中应包括全年拟计划实施的培训项目、培训形式、预计开展时间、培训经费等相关细则。

3.2.2 季度培训计划实施方案的拟定

运营组根据培训计划,结合当期各组实际情况,拟定季度培训计划实施方案,在方案中,应体现出本季度拟开展的培训项目、参训对象、项目责任人、开展时间、费用预算、培训目的等相关内容。

3.3 培训方案或计划的审批

3.3.1 培训计划的审批

运营组的培训计划,须报管委会综合管理组会议审议通过,综合管理组组长签字确认后执行。期间如实际情况发生变化,需要对计划内容进行调整,则在季度培训计划实施方案中予以体现。

3.3.2 季度培训计划实施方案的审批

运营组拟定的季度培训计划实施方案,须报综合管理组组长批准后予以实施,如实施过程中需要对有关内容或项目进行调整,须经上级主管领导同意。

3.4 培训方案的实施

3.4.1 运营组负责的培训的实施

对于按季度培训计划开展、以运营组为实施主体的各类培训,由运营组组长

第3页,共8页 基层系统运维培训管理制度

填写《培训项目审批表》,运营组组长和综合管理组组长审核确认。

3.5 培训时间的安排及管理

由运营组组织安排的各类专业技能培训,在时间安排上,尽可能安排在正常工作时间内,并兼顾培训对日常工作的影响降低到最低的程度。

第四章

培训方式与内容

4.1 运营组对员工的培训方式为内训(内部培训和外聘培训)。4.2 依据运维服务商和运维技术人员的不同级别和岗位,培训内容分类如下:

4.2.1 运维服务商:

4.2.1.1 基层系统运维管理目标;

4.2.1.2 基层系统运维管理办法的运维文化;

4.2.1.3 基层系统运维管理办法各项规章制度及奖惩办法; 4.2.1.4 基层系统运维管理日常巡检制度;

4.4.2 运维技术人员的培训:

运维技术人员的培训主要包括理念教育、管理制度、岗位技能、业务知识、作业规范、新技术培训、商务礼仪等内容。

4.4.3 岗前培训的主要内容包括岗位描述、工作程序、工作表单、工作技术规范等。

第4页,共8页 基层系统运维培训管理制度

第五章

培训的实施

5.1 各组提交的培训需求计划应详细、具体,主要包括培训主题、培训目标、培训时间、培训师、参训员工和培训需求等项目。

5.2 负责培训的培训师分为外聘培训师和内部培训师两种。培训师由综合管理组根据培训计划统一确定。

5.3 内部培训师的聘用:对于内部培训师,采用各组或相关部门提供候选人的方式。

5.4 运营组负责员工培训出勤管理。培训期间的出勤作为参训运维服务商及运维技术人员的考核依据之一。

5.5 培训出勤管理要求如下:

5.5.1

自收到培训通知当日起,所有参训人员均应合理安排工作及私人事务,确保准时出勤。

5.5.2

培训期间所有参训人员上课均应自觉遵守公司各项规章制度。5.5.3

参训人员培训前,须在培训记录表上签到。迟到/早退每次罚款50块,培训记录表由运营组存档备查。

5.5.4

参训人员培训期间,不得无故缺席,无故缺席者取消运维上岗资格。

5.5.5

参训人员的课堂纪律:

5.5.5.1 参训人员上课时须将手机等通讯器材关闭或设置为振动状态。5.5.5.2 专业培训若涉及实际操作,员工须严格按照安全操作规范执行。违者后果自负,且视情节予以处罚。

第5页,共8页 基层系统运维培训管理制度

第六章

培训考核

6.1 培训的考核一般就下列几种情况进行:

6.1.1 培训前就培训内容进行课前考核,以了解参训人员的实际知识水平。6.1.2 培训过程当中进行考核,以了解参训人员的掌握情况,利于培训的调整。

6.1.3 培训结束后对培训的全部内容考核,以了解培训效果。6.2 培训考核应根据具体的培训主题采用以下几种方法进行: 6.2.1 现场操作; 6.2.2 书面答卷;

6.3 培训考核由培训师设置考题,综合管理组、运营组组织、督导、协调。6.4 考场纪律:

6.4.1

参训人员参加考试时须提前做好应试准备,不得携带允许应试工具以外的其它物品。

6.4.2

参训人员考试中不得有任何作弊行为,考试作弊者或为作弊行为提供方便者,本次考试成绩无效,并予以取消运维资格的处罚。

6.5 考试结果:

6.4.1对于岗前培训,取得考试通过的参训人员予以颁发培训合格证书,若不合格者则取消运维上岗资格。

6.4.2 对于岗中技能等级培训,对于通过考核者,管委会颁发相应类别的职业技能证书。

6.4.3参训人员的培训考核结果纳入其绩效考核之中,并作为其绩效考核的重要依据之一。

第6页,共8页 基层系统运维培训管理制度

第七章

附则

7.1 本制度由管委会制订并负责解释。

7.2 本制度经管委会综合管理组组长批准后施行,修改时亦同。7.3 本制度自颁布之日起施行,原类似制度终止执行。

基层系统运维管理委员会 二0一六年七月二十六日

上一篇:管理者如何面对员工“职场尊严”下一篇:医院科室用人申请表