运维支撑系统

2024-06-10

运维支撑系统(精选六篇)

运维支撑系统 篇1

一、TIPS运维支撑平台的设计思路

TIPS运维支撑平台是保障重庆辖内TIPS高效运行的有效技术支撑。系统通过建立科学、合理的业务类型分类, 建立TIPS问题库, 帮助各联网业务、技术人员正确地判断和及时处理横向联网系统运行过程中出现的问题, 提高问题处理效率, 实现横向联网有关文件、资料的电子化存储, 为外联机构提供横向联网业务的查询和统计服务。

系统部署在中国人民银行重庆营业管理部主机房, 各外联机构通过现有的金融城域网和金融业网间互联综合前置接入该系统。该接入方式更加方便、经济和安全。系统的物理部署结构如图1所示。

二、TIPS运维支撑平台的技术架构及功能模块

(一) 技术架构

TIPS运维支撑平台基于Java EE技术架构和MVC设计模式进行开发。系统采用Tomcat作为Web和应用服务器软件, 数据库采用Mysql, 通过Freemarker实现表现层, Spring实现业务逻辑层, Hibernate实现数据持久层, Spring Io C容器实现了层与层之间的松散耦合, 其中Freemarker表现层和Spring业务逻辑层是基于视图解析器View Resolver进行整合的。系统技术架构如图2所示。

(二) 功能模块

平台包含用户管理、参数管理、TIPS问题管理、联网文件资料管理、联网商业银行行名行号管理、通知公告等模块。其中参数管理包括单位分类、业务类型分类等功能, 业务分类区分“一级分类”和“二级分类”, 为保留扩展性, 各级分类可由系统管理员随时添加;TIPS问题管理包括TIPS业务问题编辑、导入、导出、查询和分类统计功能;联网商业银行行名行号管理对商业银行按照规定格式报备的行名行号进行整理、编辑并归档, 再发往前台供用户查询使用。系统后台管理界面如图3所示。

三、TIPS运维支撑平台实现的关键技术

TIPS运维支撑平台使用Free Marker框架实现表现层。Free Marker是一个用Java语言编写的强大模板引擎, 它基于模板来生成文本输出。Free Marker与Web容器无关, 它不仅可以用作表现层的实现技术, 而且可以用于生成XML, JSP或Java等。

为了在Spring中整合Free Marker, 须在Spring配置文件中增加相关的bean:

四、总结

运维支撑系统 篇2

【摘要】 随着三网融合的快速发展,网络公司的竞争力不仅体现在网络本身的质量上,更加体现在运维系统对市场、客户以及服务的全面支撑能力上。云计算技术是计算机技术、通信技术融合发展的产物,引领信息产业创新的的关键性技术和关键手段。云计算技术应用于广电网络公司运维支撑系统(OSS)对提高网络运维支撑能力、提升广电客户网络体验、提高网络运维质量有重要作用。

【关键词】 云计算 广电网络 运维支撑系统 应用

OSS系统也就是我们说的运维支撑系统,它是一个自动化以及高性能的业务引导、修复以及开通运行的支撑系统,利用OSS可以给用户提供各种各样并且稳定可靠的业务。随着消费者对网络有了更大的需求,这对于目前的计算构架提出了重大的挑战,而云计算模式不仅仅可以节约很多的成本,而且在系统的快速弹性扩展方面也占有独特的优势。所以,将云计算技术应用到OSS中,这是目前我国IT界研究最热门的问题之一。

一、云计算技术及其特点

维基百科对云计算是这样定义的:云计算就是一种以互联网为基础的计算方式,通过这种方式,共享的软硬件资源以及信息都可以按照所需要的服务提供给计算机或者是其他的设备。云计算描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云计算具备的本质特征,即分布式计算和存储特性,高扩展性,用户友好性,良好的管理性。云计算技术具有以下特点:(1)计算资源集成提高设备计算能力。云计算把大量计算资源集中到一个公共资源池中,通过多主租用的方式共享计算资源。虽然单个用户在云计算平台获得服务水平受到网络带宽等各因素影响,未必获得优于本地主机所提供的服务,但是从整个社会资源的角度而言整体的资源调控降低了部分地区峰值荷载提高了部分荒废的主机的运行率,从而提高资源利用率。(2)分布式数据中心保证系统容灾能力。分布式数据中心可将云端的用户信息备份到地理上相互隔离的数据库主机中,甚至用户自己也无法判断信息的确切备份地点。该特点不仅仅提供了数据恢复的依据,也使得网络病毒和网络黑客的攻击失去目的性而变成徒劳,大大提高系统的安全性和容灾能力。(3)软硬件相互隔离减少设备依赖性。虚拟化层将云平台上方的应用软件和下方的基础设备隔离开来。技术设备的维护者无法看到设备中运行的具体应用。同时对软件层的用户而言基础设备层透明的,用户只能看到虚拟化层中虚拟出来的各类设备。这种架构减少了设备依赖性,也为动态的资源配置提供可能。(4)平台模块化设计体现高可扩展性。目前主流的云计算平台均根据SPI架构在各层集成功能各异的软硬件设备和中间件软件。大量中间件软件和设备提供针对该平台的通用接口,允许用户添加本层的扩展设备。部分云与云之间提供对应接口,允许用户在不同云之间进行数据迁移。类似功能更大程度上满足了用户需求,集成了计算资源,是未来云计算的发展方向之一。(5)虚拟资源池为用户提供弹性服务。云平台管理软件将整合的计算资源根据应用访问的具体情况进行动态调整,包括增大或减少资源的要求。因此云计算对于在非恒定需求的应用,如对需求波动很大、阶段性需求等,具有非常好的应用效果。在云计算环境中,既可以对规律性需求通过事先预测事先分配,也可根据事先设定的规则进行实时公台调整。弹性的云服务可帮助用户在任意时间得到满足需求的计算资源。(6)按需付费降低使用成本。作为云计算的代表按需提供服务按需付费是目前各类云计算服务中不可或缺的一部分。对用户而言,云计算不但省去了基础设备的购置运维费用,而且能根据企业成长的需要不断扩展订购的服务,不断更换更加适合的服务,提高了资金的利用率。

二、OSS系统的理论依据及其系统功能模型

2.1 OSS系统的理论依据

OSS是支撑电信相关网络的网络规划、开通以及运行,并保障网络正常、经济、可靠以及安全的信息系统的总称,包括了设备网络管理系统、综合网络管理系统、资源管理系统、业务开通系统、服务保障系统、运维流程管理系统、网络优化系统以及增值业务网管系统等等。

2.2 OSS的功能模型

1、运维支撑系统的功能模型

OSS的功能视图的设计一般是从网络运维流程的角度来描述运维支撑系统要实现的目标,功能设计是系统设计的基础。

2、OSS系统功能简介

OSS横向继承了资源管理与运营、服务管理与运营以及客户支撑的划分方法,其中包括了四个层次,分别是基础管理,资源管理与运营,服务管理与运营以及客户支撑。

(1)基础管理层:实现对综合事务管理、文档以及案例管理、运维流程的定义、建模以及流程状态的跟踪管理、系统管理、运维管理以及合作伙伴管理。(2)资源管理层:主要是实现面向业务开通的资源就绪功能、资源开通与资源调度功能、资源保障功能、资源分析功能以及资源规划功能等。(3)服务管理与运营层:主要是实现面向服务就绪域、开通域、保障域和和规划域提供覆盖全业务服务的支撑功能,包括服务就绪、服务开通、服务保障、服务分析以及服务规划功能。(4)客户支撑层:这一层次的产品管理与订单管理属于BSS层面功能,OSS层面注重与他们的交互接口。客户保障是提供客户层的保障管理,实现客户的SLA管理;客户分析是从网络视角提供对用户行为、客户特征等阶段性及趋势分析。

三、云计算在广电网络运维支撑系统中的应用

在广电运维支撑系统中引入云计算技术之后,它由原来的独立建设、分散维护模式,发展成为运维支撑系统的集约化运营管理,系统建设也从原来的总部和省分两级换成总部一级统一建设,这样不仅减少了建设成本,实现了效率提高,而且还减少了管理以及建设中的各个环节的成本,提高了运营效率。同时,它还使得管理得到提升,通过系统进行数据集中,实现统一管理,进而能够提升管理能力。

通过云计算,可以实现运维支撑系统的平台统一、提高专业性;还可以将资源统一,并利用虚拟化技术实现资源的“空分、时分”共享,提升资源利用率;并且还可以根据业务需求,实现按需分配,提高管理的水平。而且,由于资源和平台得以统一,所带来的管理以及运维支撑方面的高效率也是不言而喻。

不过,运维支撑系统的升级和改造需要遵循统一的标准、互联互通、保护投资以及充分利旧的原则。我们应该要考虑目前广电的现状,透过引入云存储管理系统、虚拟化改造以及云计算管理平台来实现统一的系统资源管理,逐渐实现从竖井化到统一支撑的过渡,并从原来的独立建设、分散维护模式逐渐发展到集约化的运营管理。

而且,OSS系统的构成非常的复杂,所以我们在将云计算技术引入到OSS系统中的之后,应该引入合适的云平台试验,首先应该选择具有代表性以及有共性的系统,比如电子运维系统和资源管理系统,这两个系统的工作流程中的数据之间会有交互。然后根据试验的结果,再对OSS系统中的其他系统进行改造,进而实现OSS基础平台向云平台的稳步转变。

基于广电网络运维支撑系统的现状以及目前云计算技术的发展情况,目前云计算技术在网络运维支撑系统中的应用可以从两个方面入手:第一个方面是服务器虚拟化,另一个方面是存储虚拟化。

1、服务器虚拟化

服务器虚拟化也就是将服务器上所拥有的物理资源通过虚拟化技术映射成为一种虚拟资源。而且这些虚拟资源从操作系统的使用以及应用的使用上应当是相互独立的。这样,就可以在同一台物理计算机上同时运行多个独立的操作系统以及相互之间独立的应用。而且服务器上所拥有的资源都可以被这些应用环境共享。将服务器配合其他诸如工作负载管理等技术还可以让服务器在满足不同类型的工作负载的服务水平的同时,还能够充分的利用服务器的物理资源。

目前,网络界已经有很多种服务器虚拟化技术。从技术的层面上来讲,各个厂商的服务器虚拟化技术可以划分为硬件物理分区、逻辑分区、虚拟机以及操作系统层面的虚拟化。而且每一种技术都有其自身独有的特点,所以在实际应用的过程中,可以根据具体的需要来进行选择。

在采用云计算技术的过程中,安全策略也是我们要重点考虑的对象,我们可以将功能区分为3个安全区域,分别是应用服务器区、中心采集区、Web服务器区。这三个区域的管理是一致的,为了保证其安全性,还要将其进行物理分开,并通过防火墙进行安全域划分。将不同运维支撑系统中具有相同功能的服务器整合在一个区域内,并且在这三个区域之间形成一种有效并且方面控制的策略限制,加强对核心系统的安全保障。

2、存储虚拟化

存储虚拟化的意思就是将分散的、不同品牌或者是不同级别的存储产品统一到一个或者几个大的存储池下,给用户看见的不再是一个孤立而且分散的系统,而是一个统一的整体。而且用户管理的也是一个统一的整体,不再是一个一个具体的系统。通过这种在物理存储系统以及服务器之间增加一个虚拟层。使用者只需要和逻辑存储打交道,而存储硬件的增减、调换、分拆、合并对使用者来说是完全透明的。对于存储的管理者来说,存储虚拟化的引入,使得存储管理变得更加统一,而且管理效率也得到了大大的提高。

同时,在构建云计算资源池之后,很多的异构设别都被纳入到统一管理域内,需要通过集中的资源池管理平台,优化现有的管理工作,让有限的人力可以通过提高管理效率的方式来支撑更大规模的系统维护。

四、广电网络运维支撑系统中的综合网管系统中云计算技术的应用

针对网络运维支撑中的综合网管系统系统,因为每一个系统涉及到的功能和重点能力都有所不同,所以在引入云计算技术时所采用的方案也有所区别。

(1)综合监控系统。综合监控系统主要实现全专业网络运行时间集中实时监控,实现网络、业务以及客户这三个层面的“看得见”,其重点建设能力包括管理者视图,包括网络概况监控、重点实现应急场景、实时性能监控以及重大活动场景监控等等。综合监控系统中告警数据管理模块并行处理的最小粒度是告警源,这个系统引入云计算技术主要就是考虑到laaS资源池的部署问题。(2)综合资源系统。综合资源系统实现对全网各专业网络资源的有效管理,支撑业务快速开通,网络资源高效调度,实现对网络的可控制性,它重点建设能力包括建立全专业网络资源库,建立跨专业资源关联关系等等。综合资源管理系统硬件主要包括数据库服务器、应用服务器、GIS服务器和磁盘阵列,根据综合资源管理系统要求,可以应用x86平台实现。在存储中,综合资源系统是典型的OLTP应用,没有大量的非结构化文档存储,可以采用传统SAN设备。(3)综合分析系统。综合分析系统中各类网络运行指标数据,进行端到端的业务分析,确保网络质量短板“抓得住”,其重点建设能力包括数据统一收集存储以及业务质量分析等等。它最主要的功能是承载了网络统计数据中心的职责,从数据管理以及数据存储层面设计了数据仓库以及ODM-DB,由这两套数据存储体系共同构成了网络通缉数据中心。对于综合分析系统来说,数据库服务器上主要采用的就是UNIX小型机方案为主。因为综合分析系统中的数据量非常的大,而且针对数据分析通常也是采用OLAP形式,随着数据量的不断持续上升,后续的系统性会慢慢降低,所以要考虑云数据库的并行处理方式进一步提高系统性能。

五、结束语

通过以上的研究,我们可以看出,运维支撑系统对于广电系统的应用是非常关键的,也是非常重要的,通过充分利用云计算的理念和技术,全面的建立起统一的运营服务模式,逐步的实现同一规划、统一建设、统一运营以及统一管理。整合属地分散运营的广电网络,建立开放的业务平台,提供第三方的业务开放接入,在原来的广电业务的管理和控制下,通过对OSS系统引入云计算技术,可以提升广电业务管理水平以及服务水平。而且,云计算是强调集中化、跨系统的优势以及应用平台资源的分层耦合管理,这和传统的烟囱式的系统建设与管理有很大的不同,同时也为系统建设以及运维管理方面带来了很大的挑战。为了能够更好的适应云平台,需要在组织架构等方面进行一定的变革。

总之,云计算的引入不应该影响到目前的运维支撑系统的正常运行,也就是在保证目前网络运维支撑系统质量的前提下再来进行云计算平台的建设。云计算的引入要充分的保护运维支撑系统的现有投资,不能够盲目的追求云计算平台规模,要与支撑系统的现状紧密结合。

参 考 文 献

[1] 陈滢.虚拟化与云计算[M].北京:电子工业出版社,2009.10

[2] 黄舔.高性能计算体系结构下的海量数据处理分析与优化[D].湖南:国防科学技术大学,2011

[3] 林华明,徐青,罗琛.三网融合下新业态电视技术实践[J].广播与电视技术,2012年06期

[4] 裴健丰.云计算在广电媒体中的应用[J].数字技术与应用,2012年04期

[5] 樊华.基于资源池的资源聚合关键技术研究[D].长沙:国防科学技术大学,2008

[6] 王力劭,周毅.云模型与多媒体全业务平台的结构安全特性[J].电视技术,2009年10期

[7] 郝伟.湖南移动网管集中云存储平台搭建与测试[D].湖南:中南大学,2010

运维管理系统平台作用 篇3

关键词 :运维 标签 网络 信息

随着社会的网络信息化覆盖面越来越广,通信机房的设备越来越综合化、多样化,越来越多的远端机房的应用,机房的规模随之增大,面对大面积、远端的通信机房、众多的设备、大量的日志,传统的标签、书面记录、视频、网管系统的应用,传统的运维管理模式已经不能满足目前通信的实际需求,必须寻求一种现代化的软件来代替原有传统的运管模式,使得复杂、多样的运维管理能够简单化,从而提高故障处理、资料管理、数据查询、设备监管等工作效率。由此我们进行一些探索和尝试。

主要功能

1、站点导航

为使得长江沿线通信机房均能使用运维管理系统,软件考虑设计了站点导航功能,通过站点导航的图片,可以轻松地导航到长江沿线的各个机房,实时查看到机房内的资料,以及业务管理情况。

2、运维规范

任何工作都有其规章制度,规范、流程对于运维管理来说更为重要,如果期间出现差错,将会带来很大的损失。规范、流程应及时更新,在功能设计时,应该提供可更新、添加功能。其次,规范应能轻松进行查阅,当运维工作人员遇到紧急业务时,可快速查阅。

3、设备管理

通信机房,最重要的莫过于设备资料的管理,随着设备越来越多,通过原先的标签和文档来注明各种资料已经完全不能满足要求,一方面,资源不能很好地共享,经常出现设备资料只有固定的少数几个人掌握;另一方面,由于设备集成高,体积小,端口多且复杂,电路的来龙去脉比较繁杂;再则综合机房、远端机房温度偏高,随着时间的推移,端口标签经常会出现脱落现象,由此也给设备判断带来困难。

鉴于此,设备资料通过信息化管理更为合适,不仅能够解决上述困难,而且给运维工作人员减轻负担。

4、值班信息

值班信息主要功能是对机房日志资料的管理,通过包括值班记录和基础数据,值班记录是对值班信息的实时电子记录,实现用电子台帐来代替传统的文本台帐。利用电子台帐来进行管理运维日志后,可实现日志的数据库管理,可以轻松进行统计和查询,可方便实现月度、季度、年度或者任意时间段信息的统计,同时也提高值班记录的痕迹管理,加强了值班、维护人员的工作责任性和自觉性。

5、故障处理

维修记录主要实现设备维修的记录历史,各个设备有各指示灯对设备其运行状况、端口属性和特性指导作用,工作人员根据设备技术说明书、对其日常维护和故障处理经验,进行相应的记录,同时系统会自动统计该设备的出现故障的处理方式以及出现次数的多少,根据记录,当日后当再次出现故障时,可根据该系统功能模块进行逐一排查、比对,对其常见故障进行优先检测,从而提高故障的处理效率,缩短故障时间,减轻工作人员的负担。

系统展望

运维管理系统实现以上功能投入使用后将会大大提高运维机房的工作效率,但我们感觉到系统的功能要不断更新,不断适应现代化机房的发展需求,结合我们近期工作的情况,还探索要解决以下三个问题:

设备编码问题。目前通信机房的设备五花八门,新产品越来越多,如何对设备进行科学合理的分类,成为运维系统的一个非常重要的问题,面对沿江全线通信机房成千上万的设备,全部用设备名称加以区别显然不可行。必须通过科学的分类和编码手段进行标准编码。

通信机房的图形化管理。为让更多用户理解和熟练应用软件,界面必须友好、简洁。运维管理系统最能让工作人员快速上手的界面应该以图片导航的方式来实现,但图片实现相对较复杂而且不利于今后升级。

运维支撑系统 篇4

关键词:Web,LightAPP,轻应用,易信,电信业务平台,运维支撑系统

随着运营商转型的深入, 传统业务在运营商收入中的占比不断降低, 包括业务平台在内的新业务构成了运营商收入的新生力军。众多的新产品以业务平台为基础进行构建, 使业务平台的重要性不断提升。

与基础网络不同的是, 业务平台的运维工作不止于系统层面, 还有现有支撑系统往往无法覆盖到业务, 销售支撑等层面。另外, 用户对服务质量的高要求也对业务平台提出了全时空运维的新需求。

1 当前运营商在业务平台运维中普遍存在的问题

1.1 现有系统不能同时满足系统、业务层面的管控需求

随着“降本增效”的战略不断推进, 单个业务平台运维团队需要同时负责多个业务平台的全面支撑工作, 而常用的网管系统往往仅限于系统层面的管控, 其在业务层面功能薄弱或不具备。

1.2 现有系统缺乏对移动环境下运维工作需求的设计

当运维人员在离开工作现场后, 将无法在手机上使用现有的运维支撑系统, 将无法及时获知故障信息并处理, 同样也无法及时获知售前售后支撑请求, 不利于及时响应以提升运维质量。

1.3 现有系统缺乏售前售后技术支撑和其他运维辅助功能的设计

当前客服和销售团队对平台运维团队的技术支撑请求通过电子邮件等方式传达, 流程不规范, 使得支撑请求不能得到及时的响应。运维团队也缺乏知识、经验库等辅助支撑手段, 出现问题时不易向前追溯, 更不利于经验的积累。

在落后的支撑系统与日渐提升的质量要求之间的矛盾愈发突出的情况下, 如何克服上述问题, 提升业务平台维护的效率和质量, 已成为运营商亟待解决的问题。

2 固定端和移动端相结合的综合运维支撑系统解决方案

针对上述各项问题, 本文提出了系统与业务兼顾、固定与移动融合、支撑与辅助得力的业务平台综合运维支撑系统, 其通过以下手段解决上述问题:

(1) 通过固定端信息化手段, 全面加强电信业务平台运维支撑工作的系统、业务支撑等各方面功能, 有效提升运维效率和质量;

(2) 通过移动端信息化手段, 使运维人员能通过手机及时或者业务平台系统状态, 对技术支撑请求进行处理。使销售和客服人员可以通过手机发起技术支撑请求, 接收平台最新通知推送。当今世界已步入移动互联网时代, 业务平台的运维思路也应与时俱进, 积极引入全新的移动运维手段, 从而大幅拓展业务平台运维支撑的时间和空间范围;

(3) 在客服和销售部门技术支撑方面, 利用电子化的工单流程替代原本不规范的流程, 结合移动端和固定端系统的优势, 实现支撑请求的无缝高速流转, 提升处理效率。在配套辅助功能设计方面, 通过建立平台知识库, 提升运维团队运维支撑工作质量。

如图1所示, 本系统由B/S架构的Web系统和以易信公众号为载体的Light APP (轻应用, 以下简称LAPP) 两个子系统构成。两者分别作为系统的固定端和移动端, 共用一套后台数据库, 实现互通协作。

在平台服务器上, 本系统部署Shell Script来定时获取服务器运行状态数据, 并更新到后台数据库中。使用Shell Script来实现轻量级采集Agent功能, 发挥了OS自身功能的实用性、稳定性和安全性。

2.1 基于Web的固定端开发

本系统的固定端是基于B/S架构实现的。B/S架构简化了客户端, 降低了系统的开发维护成本。另外, 当前Web技术发展迅速, 无论是强大的HTML5等前端技术还是PHP等后端技术, 都为实现更为丰富和人性化的功能和界面提供了理想的技术条件。

如图2所示, B/S架构的Web系统, 实现了业务平台的系统运行监控、日常维护管理、人工工单操作日志管理、业务数据统计与报表生成、平台知识库、售前售后支撑工单管理等功能, 为运维人员在固定环境下对平台的全方位管控提供了有力手段。此外, 固定端系统还具备管理本系统移动端的功能, 包括公众号关注权限, 用户绑定, 消息推送, 消息收发管理等。

在业务平台系统运行监控方面, 本系统采用了Web页面展示和Light APP消息推送相结合的固定移动融合新方式, 解决了运维人员在移动环境下无法及时获知系统故障信息的问题。同时, 还采用Apriori算法对故障现象进行关联, 给予运维人员关联故障的提示。在客服和销售支撑工作和知识库等方面, 固定端和移动端结合互相之间的优势, 使运维人员无论身处还是离开工作现场都可以完成支撑工作成为可能。如图3所示为Web固定端系统的业务数据统计功能。

2.2 基于Light APP的移动端开发

LAPP是一种基于平台级APP的开放平台进行开发的应用, 具有开发成本低, 部署更新便捷, 占用终端和服务器资源少, 用户无需安装额外软件的优势。LAPP结合了平台级APP和Web APP的优点, 使其足以实现本系统的各项功能。

易信是中国电信与网易联合推出的一款平台级APP, 其提供了关注权限管理、高级接口开放等功能, 并已有基于易信进行企业应用开发的案例, 以上种种有利因素使得易信较微信更加适合于实现本系统。

如图4所示, 以易信公众平台为载体的LAPP, 为运维人员提供了关键平台运行信息的查询和推送、以及支撑工单接单反馈等功能, 并为运维人员的机房巡检等非现场场景提供了信息上报功能。除此之外, LAPP还为销售和客服人员提供发起技术支撑请求, 推送平台重要通知, 查询经验知识库等功能。

固定移动融合的模式, 为系统实现贯穿移动和固定两端的功能提供了可能。如图5所示为LAPP的机房巡检信息上报功能, 由固移两端协同实现。

3 结束语

本文总结了运营商在业务平台运维中存在的问题, 并针对性提出了基于Web的固定端和基于LAPP的移动端相结合的综合运维支撑系统。两端优势互补, 使本系统满足了运维团队身处或离开工作现场的情况下都可对系统和业务支撑进行管控的需要, 探索了一条拓展平台运维时间和空间范围的新路。目前LAPP正处于迅猛发展期, 不断完善的公众开放平台, 将有利于本系统固定和移动端的后续开发和深入融合。

参考文献

[1]林英志.适应综合信息服务的电信运维管理模式探讨[D].北京邮电大学, 2006.

[2]梁欣, 黎巍, 俞霄靓, 等.基于Shell脚本的气象报文迟发漏发监控程序设计与实现[J].计算机时代, 2015, (3) :46-49.

[3]杨瑞宇.基于Web的远程监控系统研究及软件实现[D].天津理工大学, 2009.

[4]张哲.基于Light APP和Native APP方式建设高校数字图书馆的尝试[J].计算机时代, 2014, (7) :78-80.

IP设备运维支撑平台的探索与实践 篇5

关键词:自动化运维,自动化引擎,定制脚本,运维互联网化

0 引言

随着“互联网+”时代的来临,有线宽带及移动互联网用户总数急剧增长,促进了运营商的收入增长,同时也对网络质量和服务提出更高的要求,必将推动运营商网络结构向IP化、扁平化方向演进。

然而,IP设备点多面广,长期以来,维护质量和效率依赖于人力投入。因此,要降低维护效率和人力投入的紧耦合度,自动化运维支撑平台的能力建设迫在眉睫,而且平台必须适应当前运营商IP设备多层级、多厂商的网络现状,扩大适用面,提高端到端的网络维护质量。

回顾现状,维护人员通常以单项任务的形式完成工作,临时性较强,任务形式也存在多样性。然而,传统的网管支撑平台通常由网络设备厂家统一设计,功能模块相对固化,即使通过软件版本升级来支撑运维需求,也存在开发周期长、响应及时性差的缺陷。

本文基于“自动化运维引擎+定制脚本”的计算架构,利用高效的底层代码构建自动化运维引擎,再利用可配置的指令脚本进行任务定制,实现网元数据的自动采集、处理、存储以及报表输出,从而为网络规划、扩容、调拨及资源提质等工作提供数据支撑和决策参考。

1 实施方案介绍

1.1 整体框架及工作机制

网络设备运维支撑平台流程如图1所示,按照所承担的工作任务,平台可分成两个功能实体:

(1)网络通信计算引擎,主要负责平台底层网络通信、数据I/O操作。首先对主动性维护、设备重要信息检索、障碍定位等日常各类维护任务的特征进行综合分析,归纳出一般规律,通过底层代码固化为一个强有力的网络通信计算引擎,作为网络支撑平台的计算逻辑单元。网络通信计算引擎基于Socket开发,使用C++进行编程实现,支持Telnet(远程登陆服务协议)、SNMP(Simple Network Management Protocol,简单网络管理协议)、FTP(文件传输协议)等常用网络协议。

(2)定制任务脚本,将各类具体的维护任务以脚本形式进行编辑、加载,形成对支撑行为的具体描述,最终通过配置成定时任务,以任务驱动的模型实现运维管理。脚本类型支持Perl、Python等各类传统脚本语言。

平台运作流程和操作步骤如下:

(1)网络维护人员根据自身维护需求编写维护脚本,提交系统管理员审核。

(2)系统管理员审核通过后,将脚本添加入脚本池,并分配相应的执行权限给申请人。

(3)网络通信计算引擎自动加载脚本。

(4)网络设备维护人员获得赋权后,登录平台,配置定时任务,启动自动化运维任务。

(5)网络设备维护人员查看自动化运维平台的执行任务日志,确认任务是否如期完成,检查执行失败任务,重新配置、发起新的定时任务,直至完成维护目标。

1.2 应用场景范例

下面以PON网络(Passive Optical Network,无源光网络)中OLT(Optical Line Terminal,光线路终端)与ONU(Optical Network Unit,光网络单元)设备拓扑关系以及网元信息核查的应用场景为例,对定制脚本进行介绍。现网中的宽带接入网络(PON)结构如图2所示。

PON设备的自动化脚本运行流程如图3所示,主要分为网元交互、日志分析、数据入库等三个主要步骤。以往,在人工操作的维护模式下,需要逐条执行指令,根据反馈信息判断指令执行情况,再进行信息记录,耗时且低效。在批量处理的设备较多时,维护人员容易因疲劳等主观原因导致出错,由此产生的重复劳动加剧疲劳度和出错概率,形成高劳动强度和低效率的恶性循环。因此,定制脚本的方式可以极大地解放人力,提高大规模IP设备的运维效率。

以中兴OLT C220设备的具体脚本为例,维护者只需将编写的脚本通过平台提交管理员审核,并纳入脚本池,等到需要实施批量维护操作时,在平台上配置定时任务。平台自动在预设时间启动脚本,批量执行相应的指令形成日志,分析日志从而获得OLT PON口编码、ONTID(ONU Terminal ID,ONU终端标识)、MAC(Media Access Control,媒体接入控制)、LOID(Logic ID,逻辑标识)、SN(Serial Number,序列号)、ONU IP、ONU型号等信息,并自动存入数据库中,为OLT PON口规划、扩容、调拨,以及资源提质等工作提供数据支撑和决策参考。

2 创新点

(1)基础计算逻辑单元使用双线程同步技术,保证了发送网元指令与接收判断这两个通信主体能够有机协作,极大地提高指令执行的速度和系统自我管理能力。

(2)自动识别网络环境,选择登录模式。在运营商内部网络与互联网之间,通过自动登录代理网关接口(可配置),来完成指令操作,整个过程对使用人员完全透明。

(3)任务脚本按照一定的语法规则进行编辑,无需编译,使用人员可自行定制,在需要的时候加载到平台中执行。通过可定制脚本的形式,大幅提升网络设备及各类网管服务器(如Unix、Linux、MS Server等)运维工作效率。

3 总结

运维支撑系统 篇6

关键词:以服务为中心,运维支撑体系,通信网络

1综合运维支撑系统实现“以服务为中心”的方法

首先, 流程化是提高效率最好的方法。所有业务都以快速、直接的方式解决, 效率最高。建立一个整体的业务界面, 管理部门可以一目了然网络的总体态势, 以区分重要业务、重要用户、重要时段实施重要保障。要实现这一点, 管理部门必须依托业务支撑系统做到对多业务统一的支持、融合的管理, 实现对分散在众多系统和网络上的数据进行实时的保鲜。

其次, 实现端到端的业务管理是基本的手段。只有将业务提供与用户需求两个层面很好地结合起来实现端到端的业务管理, 才能实现提高效率的目标, 最大程度地提高网络运行和保障效益。

2构建综合运维支撑体系的基本思路

构建一套综合各网系业务, 满足各级各类用户需求的运维支撑体系, 需要综合考虑集团-省-区域三级管理机构差异需求、各网系运行管理的不同特点、各厂家设备接口的统一适配。一是要抓好顶层设计。固定通信网采用的设备和技术与运营商具有较好的相通性, 运维系统技术标准要基于行业标准的OSS/BSS解决方案, 尽量使用运营商OSS/BSS系统的过程中所应用的成熟技术、成熟方案, 并充分借鉴运营商运营管理方面的新理念、新功能。例如:公共信息总线技术、公共信息模型、企业级工作流程管理等。二是要合理规划功能模块。具体部署:端到端的业务管理、用户保障信息的统一界面、“一站式” (One Stop Server) 的客服管理、“直通”式 (Flow-Through) 的业务管理, 实现网络资源数据的集中与中心化、运维支撑系统的流程化与集成化、绩效管理和服务评价的指标化和精细化。三是要坚持持续优化完善。据电信研究院报告, 电信运营商每年投入营业收入的10%, 用于集团运维支持系统的升级改造。综合运维支撑系统作为固定通信网的重要组成部分, 需要选择技术实力强的方案解决商, 进行长期的开发研制和各级大量人力物力支持。

3综合运维支撑系统的业务流程

运营商的运维支持系统中, 实现了对电信多业务的支持, 包括传统的固话、无线、数据、光网络业务, 一些关键的业务流程, 对专用通信网运维支撑有一定参考借鉴作用。

业务管理方面实现了流程化的工单管理、端到端的业务管理、一站式的业务受理。无论是通过电话、网络、电子商务还是面对面的方式, 可以通过一个界面得到用户所有想申请的业务, 实现融合的业务、服务、管理理念。

资源管理方面实现了集中式的资源管控。随着新业务的迅猛发展, 大量出现业务调度困难、资源实时更新、策略权限高的复杂业务, 需要同时在局端端和用户边缘设备上做复杂的配置, 对支持人员数量和质量的要求较高, 运营商只能依托大规模部署的运维支撑系统集中维护。专用通信网演进, 将按照大局少站、IP承载、无人值守等方向发展, 资源调控和策略制定需要全网统一实施, 必须依靠网络化的集中运维支撑体系支持。

在服务保障管理方面, 以直通式业务开通、端到端的业务管理、交互式的业务保障三个流程为例, 说明运维支持系统是如何实现用户服务保障。 (1) 直通式业务开通流程。服务受理后, 系统会自动处理业务的受理, 业务订单交给工单调度系统, 同时相关的信息通知到计费营账系统和业务保障系统。业务保障系统开始对用户提出的服务需求提供业务保障。订单调度系统接到业务订单以后, 首先会与资源管理系统进行交互, 实现资源的分配与预占, 然后会驱动相关要素, 实现业务的激活。虚拟计费系统, 按照设定的条件, 开始进行计费处理, 量化使用单位对资源的应用效益。 (2) 端到端的业务管理流程。同样, 用户可以通过各种手段下一个订单, 订单被提交到业务部门的订单调度系统, 同时也提交到业务保障系统和计费系统。这时候, 订单调度系统首先跟资源管理系统进行交互, 实现资源的预占, 通过订单调度系统来驱动网络, 提供这种业务, 当这种业务激活以后, 会确认这种资源的分配状况。之后, 从订单调度系统端到端管理中心, 再通知计费系统, 这个用户所订制的服务开始计费。 (3) 交互式的业务保障流程。系统会随时监控网络的可用性, 当发现故障的时候, 首先会产生一个故障单, 启动故障处理流程和值勤管理流程, 同时也会跟态势呈现和资源管理系统进行交互, 实现对网络运行态势和资源状态的更新。同时, 在维修管理系统里定位故障性质, 启动抢代通流程, 为尽快修复故障, 确保通信畅通提供保障。用户保障资源系统在监测到故障的信息以后, 能够初步判断保障用户影响情况, 主动联络受影响用户, 以便用户及时调整通信策略, 减轻故障影响。故障修复后, 客户服务系统启动回访跟踪流程, 生成服务满意度评价指标。

上一篇:统计目标模式制度下一篇:初中英语教学特点