数据中心运行故障管理

2024-08-13

数据中心运行故障管理(精选十篇)

数据中心运行故障管理 篇1

现代基于计算机的数据中心各系统在运行过程中不可避免地都会发生因故障而失效的时候。硬件故障、软件错误、人工操作失误甚至对系统的恶意破坏,这些都可能导致系统运行的非正常中断,影响系统中数据的正确性或破坏系统的数据库,使部分甚至全部数据丢失。

通过系统的可靠性(或可用率)指标可以预测系统故障的发生。系统的可靠性是指在满足一定条件的应用环境中,系统能够正常工作的能力。由于数据中心各系统在逻辑上是由各个子系统和功能模块构成,因此,可以按照一般工程系统的可靠性研究方法进行单元可靠性和系统可靠性的评价,也可以通过系统平均无故障运行时间、系统可用率和系统平均维修时间等指标来定量衡量。

系统可靠性实际上还包含了对数据安全性的要求,因为不完整的业务数据,必然会导致用户在具体业务应用上的障碍,所以组织必须在保障业务数据安全性的前提下,再来考虑信息系统的可靠性。运用下面所述的策略和手段,可以保证发生故障时业务数据的完整性,并且在一定程度上可以保证系统在较短时间内迅速恢复正常运行。尽管如此,对某些要求业务系统的不间断运行而言,即使是极短时间的运行中断也是无法接受的,这时就需要具有极高的系统可靠性。

在实施故障恢复时可能会非常困难,仅仅简单地找出问题,并在中断处恢复执行常常是不可能的,系统需要大量附加的冗余数据和处理操作。因此系统所采用的恢复技术对系统的可靠性起着决定性的作用,对系统的运行效率也有很大影响,它是衡量信息系统性能优劣的一项重要指标。

2 故障的种类

影响数据中心各系统安全、稳定运行的故障主要有以下几类:

(1)硬件故障:计算机硬件系统是支持信息系统运行的物质基础,硬件故障是指信息系统中所涉及的各种硬件设备发生的故障。如CPU、内存、磁盘、主板、各种板卡插件、显示器、KVM等出现的故障。硬件故障发生的原因有很多种,比如系统各种配件之间的兼容性差、某些硬件产品的质量不过关等。

(2)软件故障:计算机软件系统是实现信息系统运行的支持平台和应用工具,软件故障是指信息系统中所涉及的各种软件程序发生的故障。例如,操作系统崩溃,应用程序运行过程中发生重大错误等。

软件故障发生的原因也有很多种,比如软件参数配置错误、软件使用人员错误操作、系统程序安全漏洞、应用程序设计缺陷、计算机病毒破坏等。

(3)网络故障:现代信息系统一般都是基于计算机网络环境的系统,网络通信的畅通往往是保证整个信息系统正常工作的前提。网络故障是指由于各种原因而导致无法连接到网络或网络通信非正常中断。例如,用户端网络问题、网络连接线路等问题。根据网络故障发生的原因,一般可以把网络故障再细分为两大类。

◆网络硬件故障:例如网线、网卡、集线器和交换机等网络设备本身的故障;网络设备在占用系统资源(如中断请求、I/0地址)时发生冲突;驱动程序、驱动程序与操作系统、驱动程序与主板BIOS之间不兼容问题;

◆网络软件设置故障:例如网络协议配置问题,网络通信服务的安装问题,网络标识的设置问题,网络通信阻塞、广播风暴以及网络密集型应用程序造成的网络阻塞等故障。

(4)外围保障设施故障:包括电源、制冷、安控、布线、环境等设施故障,直接或间接造成的信息系统运行故障。

(5)人为故障:信息系统中人员的因素尤其重要,人为故障是指由于系统管理人员或操作人员的误操作或故意破坏而导致的信息系统运行不正常甚至中断失效。

(6)不可抗力和自然灾害:这里故障主要是指因不可抗拒的自然力以及不可抗拒的社会暴力活动造成的信息系统运行故障。例如地震、火灾、水灾、风暴、雷击、强电磁辐射干扰、战争等。这些因素一般将直接地危害信息系统中硬件实体的安全,进而导致信息系统软件资源和数据资源发生重大损失。

3 故障的预防策略

在新系统上线投入正式运行前的系统测试是检测系统可靠性、预防系统故障的一个主要手段。但是,系统测试不可能发现信息系统中的所有错误,特别是软件系统中的错误。所以,在系统投入正常使用后,还有可能在运行中暴露出隐藏的错误。另一方面,用户、管理体制、信息处理方式等系统应用环境也在发生变化,也可能由于系统不适应环境等因素的变化而发生故障。系统可靠性要求在发生上述问题时,能够使系统尽量不受错误的影响,或把故障的影响降至最低,并能够迅速修正错误或修复故障而恢复正常运行和功能实现。

在系统故障不可避免的情况下,提高系统可靠性,预防系统故障的发生就必须制定适当的故障预防策略,主要有下列四种:

(1)故障约束:就是在信息系统中通过预防性约束措施,防止错误发生或在被检测出来之前,错误的影响范围继续扩大。例如采取故障点自动隔离,强制中断错误的信息处理活动等约束方式。

(2)故障检测:就是对系统的信息处理过程和运行状态进行监控和检测,以使已经发生的错误在一定的范围或步骤之内能够被发现出来。例如,采取基础设施集中监控、数据校验、设备运行状态自动监控与报警等技术手段。

(3)故障恢复:就是将系统从错误状态恢复到某一个已知的正确状态,并为了减小数据损失而尽可能接近发生系统崩溃的时刻。例如,通过更换或修复故障设备、软件系统重新配置、利用备份数据进行数据恢复等技术,将发生故障的系统迅速从故障中恢复,继续正常运行。

(4)针对数据中心的设备、环境等运行情况,充分做好应急事件预想,制定相应的应急预案,通过安全应急预案的落实,保证在发生各种信息安全事件的情况下,能够从容处理事件,缩小影响、减少停运时间、降低损失,确保网络与信息系统运行的安全,确保网络与信息系统内信息的安全,确保网络与信息系统管理控制的安全。

4 预防性维护策略

在问题发生前纠正错误,周期性的维护可以降低运营费用并且保持数据中心高效的运行。

预防性维护虽然常被忽视,但在降低运营成本并且保证数据中心运行能效更高的驱动下却扮演着至关重要的角色。一辆汽车如果定期进行保养,那么相对于只是时不时的进行维护或干脆只是在有部件损坏情况下维修,其运行更高效,维修次数较少,正常运行时间更长。对于数据中心来说,这是同样的道理。

一个预防性维护策略可以让数据中心保持在一个最佳状态下运行,降低意外的修复成本,并且提高数据中心总体层面的可用性。

(1)预防性维护可有效避免问题变成灾难

在系统元件故障发生前主动确认潜在宕机事件,数据中心管理者再也不会在半夜接到有关小问题演变成灾难的电话。这主要归功于他们在数据中心中应用了预防性维护策略。

预防性维护策略可确保供电和制冷系统进行系统性的定期巡检。它包括组件更换、断路器面板的热量检测、组件/系统调整、过滤、润滑相关设备以及升级固件等一系列服务。预先安排定期巡检能有效排除常见的隐患,有效避免问题出现或意外发生所致的紧急情况。等到紧急情况出现时再进行维护是无计划的,成本昂贵且存在很大的破坏性。

预防性维护传统的方法主要保证单个组件的正常状态,但是思想超前的数据中心管理人员正在转向一种整体性策略,那就是将数据中心看成一个整体。不管是发生在UPS断路器、开关或是电路错误,电力事件就是电力事件。

(2)预防性维护将由谁来完成

经过工厂培训并认证过的技术人员知识与经验都非常丰富,与系统设计工程师易于沟通。同时他们在数据中心的供电和制冷问题上有丰富的经验。

生产厂商和授权的第三方服务供应商在全球拥有着充足的保修原厂备件,同时可充分利用其现场经验提高其现场服务的专业水平。

而未经授权的第三方服务商其多余的备件数量有限,另一方面由于他们本身安装量少,他们通常会发现自己碰到以前从未碰到过的问题。而他们对于数据中心的了解也仅限于如何修复单个组件。

宕机所带来的损失是巨大的。如何有效提高系统可用性,关键就是将定期的预防性维护提上日程。对此可提供强有力团队授权第三方技术人员。

5 故障的记录与报告

(1)故障信息搜集与记录

当信息系统运行发生故障或异常情况时,运行管理人员必须对故障或异常进行相关的信息搜集与记录。因为对系统故障进行统计分析,必须依赖大量可靠的故障资料。故障记录的主要内容包括故障时间、故障现象、故障部位、故障原因、故障性质、记录人、故障处理人、处理过程、处理结果、待解决问题、结算费用等。

◆故障时间信息。收集故障停机开始时间、故障处理时间、故障处理完成时间。停机开始时间到故障处理开始时间属于等待时间。从故障处理开始到故障处理完成,这段时间的长短反映了故障特点和故障维护人员的业务能力与技术水平,它既是研究系统可维修性的有用数据,也是对维护人员考核的依据。

◆故障现象信息。故障现象是判断故障原因的主要依据。信息系统在运行过程中,一旦出现异常现象应该立即停止相关操作,要仔细观察,记录故障现象,为故障分析打下基础。

◆故障部位信息。故障部位的记录也是一项重要的内容,确切掌握系统的故障部位,不仅为分析和处理故障提供依据,而且可以直接了解系统各部分的可靠性,为改善系统,提高系统可靠性提供依据。造成系统故障的原因很多,也可能比较复杂,有些故障是单一因素造成,而大多情况下却是多种因素影响的结果。因而只有从故障现象入手,研究工作机理,确定故障部位,才能找出真正的原因并加以解决。

◆故障性质信息。由故障原因可归纳为五类故障:硬件故障即由于设备本身设计,制造质量或磨损、老化等原因导致的故障;软件故障即由于程序参数配置错误等软件因素导致的故障;网络故障即由于各种原因而导致无法连接到网络或网络通信非正常中断;人为故障即由于人员素质或误操作等原因导致的故障;自然灾害即由于自然环境或不可抗拒力而导致的灾难,如火灾、水灾、地震等。将故障性质的记录进行分类,分清故障责任,划归有关部门,使之制定行之有效的措施,防止类似故障的发生。

◆故障处理信息。有些硬件故障可以通过调整、换件、维修等彻底排除,但有些时候因为硬件设计缺陷,设备老化、磨损加剧所造成的精度降低、重复性故障、多发性故障则很难排除,所以需要安排计划检修或设备改造、更新,以彻底消灭故障。大部分的软件故障可以通过重新调整参数,安装补丁程序,升级软件版本,甚至重装系统软件等方式排除。通过加强操作人员的技术技能培训,提高人员业务素质来避免人员因素造成的故障。对于自然灾害,一般通过建立系统整体的容灾容错方案予以预防和应急处理。对故障处理信息的收集,可以为今后处理新故障提供方法和依据,大大提高故障处理的工作效率。

尽管在一些大型数据中心中,一般都有故障自动记录与报警功能的设计,但是,这些信息通常仅仅是对故障现象的简单记载,往往不够精确或不够完整。因此,必须安排专门人员对故障信息进行搜集、整理与详细记录。

(2)故障分析

故障分析是指对故障记录资料进行统计分析,从中发现某些规律,获得有价值的信息,用以指导对系统的合理使用和维护保养,并从故障的原因入手,采取积极措施,尽可能从根本上把握故障机理,最大限度地减少故障,降低故障损失。

故障的统计分析是一项专业技术性较强的工作,既要求有一定的专业理论知识,又要有丰富的实际工作经验。故障统计的目的,在于发现各种设备故障的分布,找出多发故障设备,掌握各类设备的多发故障点。

故障分析的主要内容包括:

◆根据故障的表征,分清故障的类型和性质,找出故障的根源;

◆通过对统计资料的分析,获取有价值的信息。

故障的统计分析作为故障管理的重要一环,是制定故障对策的依据。可对故障记录文档中的各个记录项逐月分别进行统计。

(3)故障报告

◆当系统运行过程中发生故障以后,应该按规定程序报告相关的主管部门,以便派人及时进行故障排除处理。对于硬件故障应该及时报告故障信息给设备责任人或设备制造厂商。对于软件故障,如果是软件本身的问题,应该及时报告故障信息给软件开发部门或软件厂商。对于网络故障,如果是租用的商业网络通信线路,应该及时报告故障信息给相应的网络服务商,以协助解决或获取技术支持;

◆建立数据中心信息安全突发事件信息通报制度:当发生网络与信息安全突发事件时,按要求应立即电话通知信息主管部门和分管领导,并填写《网络与信息安全突发事件报告单》,按照突发事件不同等级的要求,及时上报信息安全信息,不得迟报、漏报或瞒报。

参考文献

[1]甘仞初主编.《信息资源管理》.经济科学出版社. 2000年10月第1版

数据中心运行故障管理 篇2

变电运行是电能进出的关口,它的安全运行影响到整个供电网络。变电运行的主要内容是加强设备管理和避免事故发生。保证整个供电网安全运行的关键就是做好变电运行的安全管理和故障处理工作,是需要有关部门加强落实力度的工作。

一、变电运行的安全管理

1.提高变电操作人员业务素质。

变电运行操作需要工作人员拥有较高的业务素质,因为变电运行设备比较多,所以出现故障的可能性比较高。另外,工作人员在变电运行过程中要严格的遵守操作规定,如果操作不规范,就会影响整个电网的正常运行,引起重大安全事故。

所以,管理部门应该不定时的组织变电知识培训,根据工作的不同需要,结合变电运行的实际情况,进行具体的工作分析,剖析容易出现故障的`地方,强化培训解决故障的练习,解决变电运行设备异常出现的问题。变电操作人员不仅要有很强的专业素质,还需要拥有很强的安全意识,努力做到降低失误、不损害设备、避免造成经济损失和威胁人身安全。对此变电操作人员应该做到:

(1)提高安全操作意识。

对变电运行操作人员进行业务技能培训,培养变电运行工作人员整理工作日志的习惯,方便对工作作出总结,避免同样错误的出现。通过变电运行安全知识竞赛和防范事故演讲比赛的方式,强调变电运行的工作安全和工作重点,强化安全操作意识。

(2)进行安全意识教育。

让变电运行操作人员意识到自己工作的危险性,加强安全教育意识,时刻提高自己安全意识很重要。培训师结合事故,让工作人员深刻意识到变电运行工作存在的危害性,得到教训,提高警惕,预防事故发生。建立有关的监督机制,监督工作人员严格按照操作规范工作。

2.完善技术管理。

变电运用的电网企业应该加强对变电操作人员的技术训练,不定时的组织讲座和规章学习,让变电运行的操作人员在工作职责内熟练掌握设备布置、结构原理、操作程序和性能,具备简单的设备维护和保养能力,开展事故防范和反事故演习,提高电网运行人员对事故的处理和自我防护能力。严格执行安全管理规范制度,加强安全管理工作,落实安全生产责任制度,建立安全责任体系,明确职责分工,确保各个部分的变电运行正常工作,有可执行、可操作的技术管理制度。

二、变电运行常见的故障及处理方法

1.直流系统的故障和处理方法。

直流系统的故障,要确定是哪一级接地,判断原因,按照这个方法进行处理:先停止直流回路的工作进行检查,再进行回路的分、合实验。根据情况判断接地回路,再分合保险或拆除线路。

2.电容器的故障和处理方法。

电容器故障的现象为:外壳漏油或者膨胀、内部声音异常响动、套管破裂发生闪络和外壳温度升高,示温片脱落等。处理方法为:电容器爆炸后,先切断供电电源,用灭火器和其他灭火材料进行灭火,防止范围扩大;电容器保险断了之后,得到调度同意后,切断电容器的断路器,使用电容器放电进行外部检查,看是否有电容器故障现象的发生,用摇表测试电阻值,如果没有故障换上保险后合闸,如果保险再次熔断,就彻底取出故障电容器进行维修。

3.线路跳闸故障和处理方法。

发生线路跳闸故障后,先要马上按照线路保护图检修故障,以线路CT到线路出口为检查范围,如果线路没有问题,就重点检查跳闸开关。如果开关是弹簧结构,主要检查动力保险接触情况;如果开关是液压结构,主要对压力结构进行检查。

三、结语

变电运行的安全管理及故障分析 篇3

[关键词]变电运行;安全保障;设备故障排除;方案设计;管理深化

[中图分类号]V242.3+1

[文献标识码]A

[文章编号]1672-5158(2013)05-0333-01

前言

影响变电环节正常运行的因素是很多的,不仅仅是外部因素,还有其内部因素,比如变电设备的维修保养问题,比如相关员工的操作规范等,只有实行这些内外环节的有效控制,才能有效进行变电系统的维护,有利于电力企业的整体环节的稳定运行,促进电力企业的综合效益的提升,以满足社会经济建设的需要,稳定国家经济环境。变电安全管理模式的更新,离不开电力企业的内部相关环节的协调,离不开相关管理人员的重视。

一、变电运行的安全管理措施的深化

发电厂发电环节与用户用电环节的有效连接,离不开变电站这个枢纽,它的主要作用是进行电能资源的分配,起到变换的作用,为了确保电力系统的稳定运行,需要对其进行安全管理,以满足实际电力企业的发展需要,满足社会经济建设的需要。为了达到这一目的,我们需要进行变动站安全管理的有效控制,以确保电力工作环节的稳定运行。变电运行班组的管理与变电站的有效运行是切身相关的。

为了保证日常用电环节的稳定运行,我们需要对变电站设备进行有效控制,确保其日常的维护、确保相关质量问题的监督,这就需要相关管理人员的具体操作,确保相关操作人员对其的有效监控,进行无人值班模式的有效应用,以实现日常用电环节的有效进行。为此我们需要加强操作人员的自身素质,定期展开培训,以满足变电环节的技术需要。一般来说,变电系统主要由以下几个环节组成,发电厂的运作环节、输电环节、变电环节、配电环节以及电力输送环节。

1.为了确保变电环节的有效运行,我们需要提高变电操作人员的素质,确保其个人工作能力的提升,满足日常变电工作的展开。这就需要变电操作人员的自身相关意识的提升,以满足日常工作的需要,单位也要积极开展培训,提升操纵人员的职业素质。变电管理知识的获取最终要依靠职工的个人自觉,只有确保员工职业素养的提升,才有利于日常变电管理的顺利运行。企业对此要积极进行引导,营造和谐的企业文化,以促进员工自觉工作意识的提升,以利于变动运行管理制度的具体落实,有效提高变电操作人员的个人管理技术水平,有效处理日常生活中的各类变电事故,实现变电设备的有效管理,控制日常变电工作的各个环节的有效运行,以确保企业的输电质量效率的提升。

规范变电管理制度也是很重要的,它有利于安全责任的落实,在日常工作中,企业可以通过思想培训教育,实现员工的工作责任意识的提升。针对日常的变电事故进行安全教育培训,通过安全形势分析讨论会、企业变电安全教育等活动来实现员工工作能力的提升。实现安全生产责任的更新,实行奖罚制度的顺利落实,真正做到对变电系统各个环节的有效控制,以满足安全责任的具体落实。

2.员工变电技术的更新,离不开企业内部的技能培训,企业内部培训是多样性的,需要满足员工个人能力空间的提升,又能保证员工工作素质、职业素质的提升。对于变电管理来说,企业需要加强职工的技术技能,可以通过一系列技术讲座的开展、技能培训班等实行员工个人工作能力的提升,以有效实现对变电环节的系统连接环节、结构原理环节、性能应用环节、操作程序环节的应用,具备基础维护保养能力。

变电设备的有效维护保养,有利于企业变电环节的有效进展,为此我们需要进行变电设备管理系统的更新。确保设备选型工作的开展,选择高性能的电气设备、实现对变电设备的及时监控,保证变电设备的质量,避免出现由于设备不合格而引发的变电事故。与此同时,我们也要提升对运行设备的管理力度,确保其日常工作环节的顺利进行,实现对运行设备的监督管理,确保监控设备的有效运行。对于出现异常事故的电力设备,通过其外在表现进行判断,而后采取合适的处理措施加以解决。我们也要确保设备的监管力度的提升,定期、不定期进行检查。对于存在缺陷的设备应该及时更换,以满足工作环节的稳定运行。对于发生故障的变电设备,及时维修,并且要保证其故障的彻底解除,实现其保护接线、操作机构、压板位置的检查,确保其修试环节的稳定运行。

二、建立健全设备检修系统

1.验电环节是检修系统的重要组成部分,对需要进行检修的线路与设备进行断电,而后进行相关环节的检验。实现装设地线准备工作的验电环节的进行,以明确停电设备的电压问题,有效预防由人为失误而导致的恶性事故。验电时应在检修设备进出线处两侧各相应分别验电。高压验电时必须戴绝缘手套,若因电压高,没有专用验电器时,可用绝缘棒代替,依据绝缘棒有无火花和放电声来判断。

2.我们也要实现装设接地线环节的稳定运行,确保该过程的安全n生,以避免出现人身财产损失。装设接地线的方法:装拆接地线均应使用绝缘棒或戴绝缘手套。装设接地线应由两人进行,用接地隔离开关接地也必须有监护人在场;装设接地线必须先接接地端,再接导体端,连接接触要良好。拆接地线顺序则与此相反。

为了确保验电环节的正常运行,我们需要进行相关警示牌的设立,避免因为电路器的误合等环节引起的电力事故,对于相关环节进行警示牌警示,实现警示牌的安全警示作用。若线路有人工作,应在线路断路器和隔离开关的操作把手上,均应悬挂“禁止合闸,有人工作”的标示牌;在部分停电设备上工作时与未停电设备之间小于安全距离者,应装设临时遮拦。在临时遮拦上应悬挂“止步,高压危险”的标示牌;在工作地点处悬挂“在此工作”的标示牌。

三、关于跳闸故障问题的有效解决

1.在线路跳闸过后,我们要确保保护动作的正常化,实现对故障线路的有效检查,按照线路CT到线路出口环节的进行详细检查。在确认安全后,在进行跳闸开关的检查,确保消弧线圈的正常运行,进行开关位置指示器与三相拐臂的有效检查,如果是电磁机构类型的开关,还要检查开关动力保险接触是否良好,如为弹簧机构要检查弹簧储能是否正常,如为液压机构要检查压力是否正常。检查所有项目均无异常方能强送电。

我们也要确保主变低压开关跳闸环节的正常运行,确保母线故障环节、越级跳闸环节、开关误动环节的有效管理控制,根据具体情况,进行下序环节的开展,具体是哪一种情况要通过对二次侧和一次设备检查来分析判断。当主变低压侧过流保护动作,可通过检查保护动作情况和对所内设备的检查进行初步的判断。检查保护时,不仅要检查主变的保护还要检查线路的保护。

2.一般来说,主变三侧开关跳闸有以下因素引起,主变差动区故障问题、主变内部故障问题,主变低压侧母线故障因故障侧主开关拒动或低压侧过流保护拒动而造成越级。主变低压侧母线所连接线路发生故障,因本线路保护拒动或是保护动作而开关拒动,同时主变低压侧过流保护拒动或是主开关拒动造成二级越级。

四、结束语

供电企业内部系统的各个环节的协调,离不开变电系统的有效运行,这需要引起相关管理者的重视,确保日常变电环节的顺利进行,严格规范日常操作人员的工作行为。

参考文献

[1]张平,吴晓新.浅谈变电运行的安全管理与事故防范[J]科技创新与应用.2012(34)

电网运行故障分析及安全运行管理 篇4

1 电网运行故障分析及安全隐患

1.1 电网运行主要故障

1.1.1 雷击跳闸

雷击跳闸在近来年的电网运行故障中居首位, 其主要原因在于两点:1) 电网运行设计方面;2) 运行维护方面。雷电反击的最主要原因在于接地电阻超过设计值, 由于山坡地形的变化, 会引起山区输电线路保护角的变化, 保护角增大会导致屏蔽失效区域的增大。通过现场调查, 山区线路的雷电绕击跳闸较多, 导致这一现象的直接原因就是由于保护角取值较大或者是输电线路没有随着地形的变化进行改进而造成屏蔽区域失效。另外, 在设计阶段, 没有进行实际调查而造成输电线路不符合实际要求, 导致雷击跳闸率升高。在运行维护中, 绝缘水平的不足导致了输电线耐雷水平降低, 周围缺少防绕击措施, 运行中部分接地装置被腐蚀都可能造成雷击跳闸。

1.1.2 风偏放电

风偏放电是造成电网运行故障的问题之一, 一旦由于风偏放电, 就会导致重合闸困难, 影响整个电网的安全运行。线路故障有以下几个特点:第一, 在放电时段和放电区域, 会有持续的强风, 并盘有雷雨或者冰雹;第二, 在发生风偏放电的地区, 没有明显的地形地貌特征;第三, 杆塔上曲臂构架和导线上有比较明显的电弧烧痕, 并能看清放电路径;第四, 合闸失败几率高, 在强风结束后, 仍合闸失败。造成风偏放电有两个原因, 一是因为强风天气影响, 二是由于线路抗强风能力有待提高。

1.2 电网运行的安全隐患

1.2.1 开关遮断容量不足

随着现代社会用电负荷的逐渐增大, 电网分层的配套设施越来越不能满足高用电量的需求, 给电磁网环带来了极大的压力, 导致220k V系统短路情况增加, 220k V开关遮断容量不足问题日益严重。近些年, 在电网枢纽位置的厂站, 220k V母线短路现象发生率增大, 对电网设备和安全带来了极大的威胁, 假使开关相邻处发生故障, 不仅损害开关, 更给周围相关设备带来严重影响, 如果开关断不开, 存在问题, 必然会引起更大事故, 后果不可想象。

1.2.2 电压高低差幅较大、低谷电压太高

主网电压高低差幅较大、低谷电压太高, 给电网安全运行带来了严重影响。究其原因有以下几点:1) 电网计划设计部门存在工作失误, 未严格认真执行“技术规范”的要求;2) 没有考察当地实际情况, 按照电网固有的客观规律将感性、容性无功补偿容量装够。

2 电网的安全运行管理

2.1 提高继电保护的运行管理

继电保护装置在电网运行中有着两面性, 它可以为电网运行提供安全的保障, 但也可能成为扩大电网事故的源头。只有加强对继电装置的保护, 才能保障电网良好运行。我们要努力做到“三个管好”和“三个检查”。

1) “三个管好”:a.管好控制保护设备;b.管好直流系统及各个分支保险;c.管好保护压板。

2) “三个检查”:a.做好送电后的检查;b.做好停电后的检查;c.做好事故跳闸后的检查。

2.2 提高电网运行人员素质

一方面, 在电网基层的工作人员, 技术水平较差, 不注重培训的重要性, 导致培训流于形式。当电网出现故障时, 一些工作人员不能及时、准确的做出判断, 找不到故障发生的地点和原因, 甚至出现判断失误, 拉错开关等情况, 导致事故造成的停电范围大、时间长;另一方面, 由于从事此行业的人员年龄偏大, 缺乏年轻职工的加入, 文化层次不高, 影响企业现代化进程。通过以下几方面来提高电网运行人员素质:1) 加强对电网运行人员的培训, 让主管领导认识到培训的重要性, 使员工不断加强技能水平。要求工作人员不断学习新技术、新知识, 提高业务技能, 胜任本职工作。要注意培训内容的实用性, 多传授实际操作技能, 注重对实际情况的模拟训练。2) 开展工作指导, 使工作人员掌握相关操作标准, 完善自身业务素质。提高调度人员的安全意识和责任心, 让相关人员了解到误调度、误操作所带来的事故, 提高工作人员的警惕。3) 加强对电网运行人员综合素质的培养, 提高其职业道德水平, 使他们在自己的工作岗位上, 提高电网安全意识, 注重电网故障排查。4) 工作人员要做好事故预想。当天气情况恶劣或者遇到其他突发状况, 要做好事故预想, 早准备, 早预防, 并准备好应对措施, 以便在发生异常时, 能够及时、准确、果断处理同时应做好输电线路的检修工作, 对于有问题的线路, 应及早做出处理, 杜绝事故的发生。5) 注重吸收新鲜“血液”, 发现和培养新员工, 加强人才储备。

2.3 提高处理突发事故的能力

现今, 电网运行的环境不稳定, 还存在着许多意外因素, 主要表现在天气原因, 由于灾害性天气发生的频度与力度均有加剧趋势。在夏季, 会受到强雷暴雨的袭击, 冬季则会受到大面积污闪的影响。电网设计所能承担的程度也不足以承受某些自然灾害。除此之外, 外损和偷盗现象也是日益严重, 有些地方电力公司为了防止外损和防盗现象的发生, 花费了大量人力、物力经费, 仍没有起到本质的作用, 没有从根本上消除这个问题。这就需要做好两个方面:一方面相关部门应制定并不断完善相关法律法规, 从法律角度对不法行为加以约束和制裁;另一方面在公司内部因建立起一套完整的、行之有效的突发事故预警机制, 提高解决突发事件的能力, 以保证电网运行的安全。

3 结语

随着新技术的出现, 供电的可靠性虽然有了明显地提高, 但也存在着一些问题。这就要求相关工作人员对设备进行不断改善, 提高电力系统的可靠性, 以改善供电水平, 减少供电事故的发生。

摘要:现今, 随着电力企业的不断改革和发展, 电网安全越来越受到人们的重视, 电网安全已经成为行业内讨论的话题。分析电网运行的故障及存在的安全隐患, 并根据这些问题提出电网安全运行管理的有效方法。

关键词:电网运行,故障分析,安全运行管理

参考文献

[1]宋太忠.加强调度管理保证电网安全经济运行[J].时代经贸 (中旬刊) , 2007.

[2]董纪军.浅谈如何加强电网的统一调度和安全管理[J].中小企业管理与科技 (下旬刊) , 2010.

医院网络中心运行管理日志制度 篇5

一、为保证信息中心服务器正常运行,信息技术人员对服务器的使用与维护保养必须做好系统运行日志的维护管理工作,发生故障时(包括硬件、软件)要有分析报告。

二、信息技术人员必须做好每天正常维护的操作记录,以防在误操作的情况下,查找原因。

三、对于系统重要数据和服务器配值参数的修改,必须征得信息中心负责人批准,并做好相应记录。

四、对于WINDOWS等操作系统自身生成的运行日志应经常检查、分析,对属于非正常的记录应做好保存,并及时处理,做好防范工作。

五、对用户上网行为的监控日志,应按照要求保留60天,并做到连续24小时不间断监控,同时经常查看,发现异常情况,立即向上级部门通报,并及时处理。

六、系统运行日志要定期备份,以便出现问题时进行查询;重要系统的运行日志要定期异地备份;对系统的操作、使用要进行详细记录。

七、系统中的重要应用程序、数据的备份要有记录,将介质和资料实行两级异地保管。

电气变电运行的安全管理及故障排除 篇6

摘 要:就变电运行的安全保证、设备检修和故障排除进行了分析。

关键词:变电运行;安全保证;设备检修;故障排除

中图分类号:G712 文献标识码:B 文章编号:1002-7661(2016)04-264-01

一、变电运行的安全管理

强化变电操作员的专业素质。根据变电运行实际工作的经验,人员综合素质的提高应以个人主动提高为主,单位组织培训为辅,分层次、结合实际来进行。同时,教育和引导职工学会善于总结、善于吸取教训、加强个人修养。变电运行人员要认真贯彻变电所运行管理制度,提高变电运行管理技术水平,熟练掌握处理各种电气事故的能力,缩短处理事故的时间,并确保变电设备安全运行,认真执行各种规程制度,控制工作中的危险点,避免事故的发生。

二、设备检修是保证安全的技术措施

1、验电。要检修的电器设备和线路停电后,在装设接地线之前必须进行验电,通过验电可以明显地验证停电设备是否确实无电压,以防发生带电装设地线或带电合接地刀闸或误入带电间隔等恶性事故发生,验电时应在检修设备进出线处两侧各相应分别验电。高压验电时必须戴绝缘手套,若因电压高,没有专用验电器时,可用绝缘棒代替,依据绝缘棒有无火花和放电声来判断。

2、装设接地线。①装设接地线的目的:为了防止工作地点突然来电;可以消除停电设备或线路上的静电感应电压和泄放停电设备上的剩余电荷,保证工作人员的安全;接地线应设置在停电设备由可能来电的部位和可能产生感应电压的部分。②装设接地线的方法:装拆接地线均应使用绝缘棒或戴绝缘手套。装设接地线应由两人进行,用接地隔离开关接地也必须有监护人在场;装设接地线必须先接接地端,再接导体端,连接接触要良好。拆接地线顺序则与此相反。③悬挂标示牌和装设遮拦。为了防止工作人员走错位置,误合断路器及隔离开关而造成事故,在一经合闸即可送电到工作地点的断路器和隔离开关的操作把手上,均应悬挂“禁止合闸,有人工作”的标示牌;若线路有人工作,应在线路断路器和隔离开关的操作把手上,均应悬挂“禁止合闸,有人工作”的标示牌;在部分停电设备上工作时与未停电设备之间小于安全距离者,应装设临时遮拦。

三、跳闸故障

1、线路跳闸。线路跳闸后,应检查保护动作情况,检查故障线路检查范围从线路CT至线路出口。若没有异常再重点检查跳闸开关,检查消弧线圈状况,检查三相拐臂和开关位置指示器;如开关为电磁机构,还要检查开关动力保险接触是否良好,如为弹簧机构要检查弹簧储能是否正常,如为液压机构要检查压力是否正常。检查所有项目均无异常方能强送电(强送前前要检查保护掉牌是否已复归)。

2、主变低压侧开关跳闸。主变低压开关跳闸有三种情况:母线故障、越级跳闸(保护拒动和开关拒动)、开关误动。具体是哪一种情况要通过对二次侧和一次设备检查来分析判断。当主变(一般为三卷变)低压侧过流保护动作,可通过检查保护动作情况和对所内设备的检查进行初步的判断。检查保护时,不仅要检查主变的保护还要检查线路的保护。

①只有主变低压侧过流保护动作。首先,应排除主变低压侧开关误动和线路故障开关拒动这两种故障。那么,到底是母线故障还是线路故障因保护拒越级呢?要通过对设备的检查进行判断。检查二次设备时,重点检查所有设备的保护压板是否有漏投的;检查线路开关操作直流保险是否有熔断的。检查一次设备,重点检查所内的主变低压侧过流保护区,即从主变低压侧主CT至母线,至所有母线连接的设备,再至线路出口。②主变低压侧过流保护动作同时伴有线路保护动作。主变保护和线路保护同时动作,线路开关又没有跳闸,通常断定是线路故障。因此,在巡视设备时,除对故障线路CT至线路出口重点检查外,还要对线路进行检查。只有确认主变低压侧CT至线路CT无异常,方可判断为线路故障开关拒动。开关拒动故障的处理较为简单,隔故障点拉开拒动开关的两侧刀闸,恢复其他设备送电,最后用旁路开关代送即可。③没有保护掉牌。若开关跳闸没有保护掉牌,须检查设备故障是因保护动作而没发信号。还是因直流发生两点接地使开关跳闸,或者是开关自由脱扣。

3、主变三侧开关跳闸。主变三侧开关跳闸原因:①主变内部故障;②主变差动区故障;③主变低压侧母线故障因故障侧主开关拒动或低压侧过流保护拒动而造成越级;④主变低压侧母线所连接线路发生故障,因本线路保护拒动或是保护动作而开关拒动,同时主变低压侧过流保护拒动或是主开关拒动造成二级越级。具体故障原因应通过对保护掉牌和一次设备进行检查来分析判断。

①瓦斯保护动作。如果是瓦斯保护动作,可以断定是变压器内部发生故障或二次回路故障,重点检查变压器本身有无着火、变形;检查压力释放阀是否动作、喷油;检查呼吸器是否喷油;检查二次回路有无短路、接地等。

②差动保护动作。如果是差动保护动作,一次设备的检查范围为主变三侧主CT间(差动区),包括主变压器。差动保护能反映主变内部线圈匝间、相间短路(如果是内部故障,还常伴有轻瓦斯或重瓦斯保护动作),因此,当差动保护动作后,应对主变做细致检查,包括油色、油位、瓦斯继电器、套管等。如果瓦斯继电器内有气体还要取气,根据气体的颜色及可燃性判断故障性质;如果检查结果是主变和差动区都无异常,可以判断为保护误动。

数据中心运行故障管理 篇7

1 完善变电运行管理方式

1.1 完善相关的规章制度

[1]在电力企业运行过程中, 相关工作人员应该具有一定会的全局观念, 从整体上对变电工作进行管理。在实际的变电工作中, 相关部门应该制定良好的规章制度, 保证变电工作的顺利运行。在实际的规章制度制定时, 可以从变电设备的检查、设备的维护、设备的巡视等方面, 这样才能保证变电运行的稳定性、安全性。

另一方面, 相关部门应该建立良好的管理中心。主要负责对设备的日常运行状态进行记录, 同时还要对数据进行定期维护, 这样能够保证工作人员对变电设备具有一个明确的了解, 使工作人员能够准确的找出变电运行过程中的问题, 便于及时处理, 保证设备的正常运行。

1.2 加强对于工作人员的培训

在实际的变电工作中, 相关部门应该积极安排工作人员值班, 并且, 还要加强对工作人员的培训, 加强对于相关工作的掌握;另外, 还要加强对工作人员心理素质的培养, 这样才能保证在事故发生的时候, 工作人员能够沉着冷静, 做出正确的决定。一般来说, 事故的出现都具有一定的突发性, 如果相关工作人员在事故出现的时候, 能够在短时间内做出反应, 及时的采取有效措施, 就能够有效降低是估计所造成的损失。

另一方面, 相关部门可以选出相关负责人, 并对其进行培养, 如果出现事故, 相关的负责人能够指挥现场, 保证补救措施顺利进行, 提高事故的处理效率。

1.3 明确变电管理思想

[2]变电工作中, 工作人员的人身安全占据着重要地位。因此, 在变电工作中, 相关部门应该贯彻落实变电工作安全措施, 才能促进变电工作的顺利进行。在日常变电工作中, 应该始终坚持“安全第一”的原则, 如果在工作过程中发现相关工作人员出现违规操作或者操作不当时, 要严格按照相关的规定进行处理。另外, 相关部门应该积极组织安全宣传活动, 让安全观念深入人心。随着科技的不断发展, 相关的变电技术也在不断发展中, 因此, 相关变电安全措施也应该积极的进行变更, 只有这样才能保证变电运行。

2 变电运行中监控措施分析

在电力系统中, 变电运行的质量和变电运行的监控具有直接关系, 良好的变电监控能够保证变电运行的质量以及效率。因此, 应该积极的加强变电运行监控工作, 实际的变电监控工作中, 相关工作人员之间应该积极的加强沟通交流, 能够有效的避免由于工作人员过多所造成的工作混乱, 同时, 还能有效降低变电监控的成本, 促进电力企业的发展。另外, 还能降低变电运行中的风险, 保证工作人员的安全。

3 变电运行故障处理分析

3.1 加强变电设备检修

[3]电力系统中, 变电的良好运行离不开变电设备的正常运转, 因此, 在变电运行过程中应该积极加强变电设备的检修, 并且, 还要对相关的线路进行保护。在对变电设备保住过程中, 应该首先进行停电验电, 这样能够有效的反映出相关的变电设备是否停电, 能够有效避免变电检修过程中事故的出现。在验电的过程中, 相关工作人员应该严格按照相关的操作规范进行, 对相关设备的输入口以及输出口都应该进行检查, 确保没电以后才能进行下一步工作。另外, 在变电设备接地下安装过程中, 相关工作人员应该设置围栏, 并且要悬挂相关的安全警示牌, 能够有效的避免相关工作人员出现工作失误将断路器闭合所造成的事故。

3.2 跳闸故障防护

在变电设备运行过程中, 不能避免跳闸事故的出现。在跳闸事故出现以后, 应该积极对线路保护措施进行检查, 及时排查线路中存在的问题, 另外, 还应会相关的开关进行检查, 如果保险损坏, 相关工作人员应该及时的进行更换。通常来说, 跳闸问题出现的情况有三种, 即由于误会所造成的开关误动、越级跳闸、母线故障, 上述这三种现象都会造成跳闸。如果跳闸发生时, 只是出现了过流保护所引起的跳闸, 就是应该是母线故障所造成的跳闸。如果同时出现了过流保护以及相, 线路保护, 那么发生跳闸的原因就是由线路故障造成的。由此可见, 故障发生的原因具有多样性, 相关工作人员应该积极的提高自身的专业素养, 才能对故障进行合理分析, 保证变电运行的安全、平稳。

4 总结

综上所述, 在电力系统运行过程中, 积极的进行变电维护具有重要作用, 不仅能够保证变电工作的顺利运行, 还能促进电力企业的发展。实际的变电工作中, 相关工作人员应该从管理、监控、故障三方面对变电工作进行加强, 才能保证变电工作运行的效率以及质量, 促进电力企业的发展。

摘要:我国电力水平的不断发展, 对于变电运行过程中出现的问题处理能力也逐渐的提升, 有效的保证了电力系统的平稳运行, 促进了我国经济快速的发展。但是, 在不断发展的社会中, 对于电力的运行有了更高的要求, 因此, 应该积极加强对于电力系统运行过程中问题的处理能力, 才能满足社会发展的需求。本文主要通过对变电运行过程中存在的问题进行分析, 并且, 提出了一些相关的措施, 希望能够促进我国电力系统的发展。

关键词:变电运行,管理,监控,故障,应对措施

参考文献

[1]刘德先.论变电运行故障排除与安全管理[J].科技资讯, 2010 (23) :175-177.

[2]姜楠.刍议变电运行故障处理中维护技术的应用[J].企业技术开发, 2015 (20) :62-63.

浅谈变电运行安全管理及故障检修 篇8

1.1 注重变电操作员的技能提高和素质的培养

在变电运行过程中, 操作人员的专业技能和综合素质对运行的安全具有非常重要的意义。在实际工作中, 操作人员专业技能和综合素质的提高需要企业定期的组织专业技能的培训, 个人在实际工作中不断的总结经验, 努力的提升自己的专业能力。操作人员要在工作中不断的学会总结和吸收教训, 使个人的综合素质得以提升。变电所运行管理制度需要变电运行人员在操作时严格执行, 对于突发的各处电气事故要有灵活的处理能力, 从而不断提升运行管理的技术水平, 确保变电设备的安全运行, 操作时严重遵守各种规章制度, 减少或是杜绝操作中的危险性, 从而有利的避免故障的发生机率, 保证电网的正常运行。

1.2 完善规章制度, 注重安全生产

首先需要加强运行人员的安全意识。运行人员是安全生产过程中非常重要的因素之一, 所以需要其具有较高的安全意识, 这就需要企业在平时工作中, 不断的加强对运行人员的思想教育工作, 采取多种宣传方式和手段进行安全教育;其次, 要落实安全生产责任制和奖惩机制。企业在生产过程中需要建立安全生产责任制, 把责任进行细化和量化, 并具体落实到每一个人, 让每一位运行人员都时刻保持高度的责任感。同时还要制订相应的奖惩机制, 配合安全生产责任制同时实施, 这样不仅可以有效的提高运行人员安全生产的积极性和主动性, 同时对于生产效率的提升, 安全管理的加强具有十分重要的意义。

在电力系统长期以来的安全生产中, 以“安全第一, 预防为主”的方针及“两票三制”的制度来对安全生产责任进行落实, 所以在日常生产过程中, 需要对长期以来以实践检验所形成的经验进行认真的贯彻落实, 从而保证企业的安全生产运行。

1.3 注重培训员工技术, 提高技能

首先, 需要企业提供大力的支持。变电运行人员作为企业安全生产的关键因素, 企业需要加大对运行人员的培训力度, 加大人力、物力和财力上的支持, 定期的开展培训工作, 加强运行人员的技能, 同时还要定期的开展相关的技术讲座和学习, 使变电运行人员对于新设备及自己职责内的设备在运行管理、性能、结构原理、维修和维护等多个方面都能有效的掌握, 定期进行反事故演习, 从而保证运行人员在事故发生时具有及时的反应和应变能力;建立健全运行人员的考核机制, 能定期的绩效考核, 从而对于运行人员的情况采取有针对性计划的培训, 从而使培训的效果得以突显。目前, 科学技术发展的速度特别快, 面对新出现的新产品、新技术和新的管理思路等, 应选派一些综合素质较高的人员去学习, 从而把这些现代化的技术和管理方法应用到自己的工作中来。从而使培训与工作达到很好的统一。

1.4 注重配套设备设施的完善

应加强设备管理, 防止设备事故的发生, 是变电运行工作的重要内容:

首先, 加强设备基建时期的管理, 主要包括: (1) 要仔细认真做好设备选型工作, 选用性能非常优良的电气设备; (2) 要重视对设备的监造和出厂试验, 保证设备各项功能全面、实用; (3) 加强对安装调试质量的监督检查, 严格把好验收关, 防止由于施工质量、设备本身接线错误引起的事故。其次, 加强对运行设备的巡视、检查和维护;加强运行监督检查, 认真对表计、信号等监控设备出现的异常现象进行认真分析:巡视检查中发现电气设备异常时, 要充分利用设备所表现出的声音、颜色、振动、气味、温度等变化状况进行辨析;要合理安排设备的特殊巡视和正常巡视间隔时间, 对已存在缺陷的设备适当增加巡视次数。再次, 要根据设备的运行情况, 制定修试计划, 定期消除设备的隐患;同时要把好设备修试后的质量验收关, 加强操作机构、保护接线、压板位置、整定值的检查, 防止因修试不当引起的设备事故。

2 变电运行故障的检修

2.1 严格按照有关专业规程的法律规定操作

对现行的规程必须采取慎重、科学的分析态度, 既不能照抄照搬, 也不能全盘否定, 要根据历年的试验数据和设备运行情况确定重点项目并作为现阶段试行状态检修的重点。

2.2 提高分析与判断测试数据准确度

将测试数据同规程规定的值比、出厂测试数据比、与历次测试数据比, 看测试数据变化趋势, 还要与同设备的测试数据相比, 最后作出综合分析、判断, 对初始状况良好且运稳定的设备, 适当地延长预试周期, 对运行状况不良的设备, 适当地缩预试周期。

2.3 手段应该多样化的在线监测

随着红外线测温仪、像仪、氧化锌避雷器泄漏电流在线监测仪、主变的油色谱在线分析仪、机保护在线监测等手段的应用, 为随时掌握设备的运行状况提供了科学诊断手段, 通过这些在线监测, 可以对设备的状况作出正确的评估, 并订出相应的测试周期和测试项目。

2.4 要不断提高检修工作人员检修效率

一是加强检修人员责任意识, 利用他们的技术决窍和积累的工经验参与管理并自我负责;二是将本单位的检修力量集中于最关键的检修作业, 其它工作考虑外包;三是成本要足够透明度并和考核制度挂钩, 做到人人都关心成本;四是加强检修力度, 根据条件逐步采用计算机化的检修。

2.5 在变电检修中要注重检修方式多样化

从我国目前的国情及电力企业的实际情况出发, 以现在的条件完全实现状态检修还不太可能, 也不利于企业的持续发展。所以针对变电检修方式上的选择, 可以针对企业的不同情况进行, 如对于一些需要进行改建和扩建的企业来讲, 可以在计划时即把状态检修系统融入到工程当中来, 待一切运行正常后, 可以将一些重要位置的变电站安装上监测和诊断设备。对于一些不重要的变电站或是故障率降低的变电站, 则不需要安装状态检修的设备, 这样在经济上很不划算。对于这种情况可以将一些重要的部件安装一些有实用功能的监测诊断设备, 对于一些不重要的部件可以采用传统的检修方法。所以在目前的电力企业的检修方式上, 可以针对企业的实际情况, 采取多种检修方式结合使用。

3 结束语

数据中心运行故障管理 篇9

1 DCS集散控制系统的简介

DCS集散控制系统以微处理器为基础, 该系统在生产的过程中起到了集中管理、操作、监视以及分散控制的作用。DCS集散控制系统将微处理器应用于过程控制之中, 通过网络通信这一媒介, 将所有的信息输送到上位管理计算机, 由其进行监控。通过使用DCS集散控制系统可以实现最优化的管理控制, 它既实现了计算机集中控制的优点, 也实现了常规仪表分散控制的优点, 从而可以将人与机联系差的缺点, 也可以将常规的仪表功能单一以及单台微型计算机控制系统的危险性高度集中的缺点进行弥补。DCS集散控制系统在显示、操作以及管理三这个方面高度集中, 分散了危险性、负荷以及功能性。DCS集散控制系统对于现代化的企业大规模生产过程中占据着十分重要的地位。DCS集散控制系统已经成为现代工业的主流, 它具有可靠性、灵活性、人机交互的友好性、网络通信的方便性行等优点, 受到了企业界的青睐。只不过, 对于现在的很多中国企业而言, DCS集散控制系统的成本有些过高。但这仍然阻止不了该系统的发展, 它仍然具有很好的发展前景。

2 DCS集散控制系统的特点

2.1 品种繁多。

DCS由操作站、控制站和数据通信总线等构成, 品种繁多。不同的用户可以根据自己企业的具体情况和需要选择不同类型、不同功能以及规模大小的集散控制系统。这样, 既可以节约企业的在这方面的成本, 也可以提高企业的管理效率。

2.2 分布式的结构形式。

DCS集散控制系统主要采用分布式的结构形式, 这样就会使控制和故障比较分散, 从而在根本上可以提高系统的长期且连续的运行能力, 也可以更好地减少故障的发生频率。不易对生产造成较大的影响, 不会影响生产计划的完成。

2.3 可以进行集中操作和管理。

DCS集散控制系统将将检测、操作、监视、管理等部分有机地连成一个整体, 主要是通过高速数据通信总线这个媒介来完成。通过连成一个整体, 就可以集中操作和显示, 大大方便了操作过程, 提高了操作的效率, 也可以减少故障率。

2.4 具有很强的自我诊断功能。

DCS集散控制系统的处理器、电源、控制用输入以及输出设备以及内部总线都是双重配置的, 一旦出现问题, 该系统可以开启自我诊断功能, 提高了该系统的可靠性。如果有些部分出现问题, 备份的部分可以派上用场。这样就在减少出现故障的同时, 也提高了该系统的使用寿命。

3 DCS集散控制系统出现故障的原因

现场控制级、过程控制级、过程管理级以及经营管理级这四个部分组成了DCS集散控制系统。在分析DCS集散控制系统的故障原因时, 要从这四个部分重要考虑。

3.1 过程通道故障。

I/O卡故障是DCS集散控制系统通道故障出现次数最多的。对于I/O卡故障进行处理和断时, 要求我们通过对DCS集散控制系统进行诊断来实现。一般对备用件的处理以及通道进行更换, 然而对于一些内部元件出现老化的现象或是其他原因造成的损坏则很难判断和处理。这就要求热控制人员通过厂家进行处理。现在的厂家在生产I/O的生产已经达到了规模化和标准化的生产, 但是热控检修人员的技术水平和手段还没有达到一定的标准, 无法对常规仪表进行检修。如果I/O卡的故障导致的过程通道故障, 只能选择购买新的备件来修复了。

3.2 由干扰种过成的DCS集散控制系统故障。

备用电源的切换和大功率的无通通信设备都会对DCS集散控制系统造成一定的干扰。对于干扰主要是接地问题, 也涉及到CDS集散控制系统的干扰信号本身存在问题。在大型工业中, 大功率的电器设备在启动和停止的过程中都会产生干扰DCS集散控制系统的控制信号, 往往会种过成不必要的故障。所以对于DCS集散控制系统的接地问题越来越得到人们的关注。为了减少因干扰产生的故障, 要严格执行屏蔽和接地要求以及方式。要使DCS集散控制系统的信号源远离干扰源, 同时要防止电源泉波动。在万不得已的情况下, 才可以人为的更换主/从过程处理机。为了更有效的减少干扰, 还要先将控制切手动。而且在电子设备间或是工程师站等重点的地方, 绝对禁止使用大功率无线电通信设备。尽量减少干扰所带来的损失。

3.3 检查监控画面的数据的波动。

监控画面的数据有时长时间不变, 或是几个数据都不变。或是控制分组画面中, 手动自动都无法切换。或是监控画面中, 多个数据同时波动比较大。都是故障的表现。如果该数据的波动是工艺上的有关参数, 这就要求微机人员对仪表仪器进行检查。如果对于工艺没有任何影响, 可能是DCS集散控制系统的某个元件出现了问题。可以选择检修这些元件或是更换来处理。

4 DCS集散控制系统的运行管理

该系统的运行管理主要是指对DCS集散控制系统进行巡逻检查, 热保护的投退以及对于DCS软件和硬件的监督管理。

4.1 对于各种软件, 尤其是那些重要的, 要进行备份管理。

对于一些微小的改动可以做记录。同时要将这些数据库的修改保存到工程师站, 由工程师站将此修改的记录保存在其他的硬盘或软盘上。对于备份的磁盘要注意使用的期限, 最好不要超期使用, 有可以会导致某些数据丢失, 会给DCS集散控制系统的运行造成一些不必要的麻烦。

4.2 要定期对软件以及功能进行检查和试验。

通常采用计算机设备的通用方法检查, 主要是针对各级权限的设置进行检查。严格禁止未授权人员进行组态, 不能使用除DCS集散控制系统的以外的软件。防止该系统的数据丢失, 以免影响正常工作。

4.3 对于热工保护的投退要严格执行工作票制度。

为了避免故障的发生和减少发生的次数, 还应制定严格的检查、维护制度。对于操作人员, 要不断提高其操作技能, 让其掌握一定的判别方法, 争取及早发现, 及早处理。

结束语

DCS集散控制系统在大型工业有着很大的发展前景。它提高了我国企业的管理水平, 在以后的发展过程中, 我们不要不断总结自身的经验, 发挥主观能动性, 为经济发展寻找新的契机。

参考文献

[1]魏巍, 王锐.PLC、DCS和FCS的特点及在电厂中的应用[J].东北电力技术, 2009 (5) .[1]魏巍, 王锐.PLC、DCS和FCS的特点及在电厂中的应用[J].东北电力技术, 2009 (5) .

数据中心运行故障管理 篇10

1 发电厂故障发生原因

在发电厂正常运行的过程中, 一般不会发生太大的故障和事故, 但是其一旦出现故障和事故, 由此产生的影响必然十分恶劣, 不仅会给发电企业带来经济损失和人员伤亡, 而且还会影响到国民经济的正常发展。就电厂经常发生的各种故障进行分析, 其产生大多都是人为造成的, 比如设备的错误操作、错误指挥以及管理不当等问题, 这些错误的产生轻则影响到设备的正常运行, 造成设备损坏;重则影响到整个电网运行安全, 甚至是引发人员伤亡, 给发电厂带来经济损失不说, 还给社会造成恶劣的影响。另外, 造成发电厂事故的原因主要是因为设备本身缺陷引起的, 比如设备在长期运行的过程中没有得到及时、有效的维护和保养, 这使得设备长期处于带病运行状态, 最终造成设备损坏, 给电厂造成经济损失。但是从长期的运行和管理工作中分析, 在发电的过程中, 发电事故的产生与工作人员工作素质密不可分, 因此在工作中要想处理好这些问题, 就比必须要从根本上入手解决, 从而达到提高工作质量和效率的目的。

2 发电站安全管理分析

2.1 提高工作人员素质

发电厂的工作本身存在着设备数量多、种类多、布局复杂的特点, 因此一旦发生故障, 其后果必然不堪设想, 所以在管理工作中必须要认真对待各个设备的运行性能和要求, 同时要加强工作人员专业知识和工作经验的培训, 只有具备扎实的专业素质和基础, 工作人员才能满足发电工作的运行和管理需要, 才能符合发电系统的发展要求, 从根本上达到电厂设备安全、稳定运行的目的。在实际工作中, 高素质、经济能的电厂管理人员能及时的对电厂设备运行中出现的问题加以处理, 进而及时的处理突发事故, 并且做出合理的判断。所以, 在日常的发电工作中, 要想做到安全管理工作, 我们必须要不断充实管理人员的专业知识, 这也要求工作人员不断提升自身的专业知识和技术水平, 注意理论与实践的结合, 将专业知识不断的应用在实际操作中, 针对那些已经出现的事故正确的判断并解决。

2.2 提高工作人员安全意识

发电厂要不时对电力管理人员进行安全知识培训, 要求管理人员要对各种安全知识了如指掌, 熟练的操作而各种业务技能, 并且能科学的利用各种先进的技术和方法进行考核。在工作中, 将安全考核、专业技能比拼作为目前工作重点, 通过学习、实践等方法来提高管理人员问题解决能力, 从而保证电力生产安全。

2.3 加强发电技术和设备的管理能力

在发电生产过程中, 管理技术能力的加强和设备更新和维护能力的提高, 也是保证发电厂安全生产的重要途径。如加强发电设备绝缘性能检查能力, 通过超声检测、色谱分析的手段, 来及时有效的发现发电设备绝缘性能存在的问题, 以避免设备因绝缘性而产生的运行故障等问题。在采用先进技术来提高发电安全管理的同时, 发电厂还应做好设备日常巡视、运行维护和检修试验的工作, 严格监控设备的运行状态, 保证发电的安全稳定进行。

2.4 完善安全生产管理制度明确管理职责

在发电生产的过程中, 安全管理部门要利用生产管理的章程和规则来不断完善生产管理制度, 通过用安全规则制约生产人员的工作行为, 促使其按照正确的方法进行操作, 同时还要加强对现场工作人员的监督, 及时发现安全隐患并解除。在生产管理过程中, 还可以通过奖优罚略的形式, 来调动工作人员的安全积极性, 提高他们安全生产的意识和警惕性, 从而保证发电厂的安全生产。为了逐步提高发电厂的生产效率, 发电厂在安全管理的基础上还要不断加强对工作人员明确分工的监管能力, 只有让员工明白自己职责所在, 发电的生产才能有条不紊的安全进行, 与此同时, 员工在清楚的明白自己责任的同时, 自身的安全意识才能最大化的发挥出来, 保证发电的安全进行。

3 发电厂安全故障的防范与处理

3.1 认真对待并执行安全管理条例

安全管理条例是发电厂安全运行和管理的基本准则, 是防范电力生产工作中事故发生的重要保障。在实际生产过程中, 必须认真遵守条例中的每一项规定, 加强执行力度, 不能把准则的存在流于形式。同时, 安全管理条例的内容也要全面的明确到每一项任务上, 建立合理的奖罚制度, 调动员工工作的积极性, 促使员工认真对待每一项工作岗位, 牢牢把握安全生产的理念, 把每一项工作都做好。

3.2 提高安全工作的监督考核力度

安全管理条例在落实到生产工作中以后, 还应时刻监督和管理其在实际生产过程当中的效力和效果。定时的考核员工在安全生产上的基本知识和安全操作技能, 时刻监督员工的安全生产, 以防安全管理条例被忽视而造成大大小小的事故。

4 结论

发电工作关乎整个电网系统的安全稳定运行, 是电网系统的核心。在平时的生产过程中只有严格加强管理, 认真抓住生产, 才能很好的预防和控制事故的发生, 真正降低事故发生的几率, 提高发电生产的效率。所以发电部门应该重视安全生产, 从安全管理和事故防范上制定严格的规则, 在生产中认真监督和执行, 从而把事故降到最低, 提高生产效率。

参考文献

[1]张平, 吴晓新.浅谈变电运行的妥全管理与事故防范[J].科技创新与应用, 2012.

上一篇:网页代码下一篇:READY