电源监控系统的可靠性分析

2022-09-10

近几年来, 电源动力监控被广泛的应用到工厂、银行、通信等部门。动力监控系统最根本的目的和意义是对通信网上供电系统的监测和早期预警, 因此监控系统最重要的功能是故障告警和实时监测。其余功能属于从属地位, 主次不能颠倒。监控系统成功与否, 主要是看它能否长年不间断、稳定、可靠、实时地对网上电源空调设备进行监测与预警。一个本身故障不断的监控系统, 统计、报表、组态等其它功能再强, 界面再美观友好, 也不是一个好的可用的系统。

1 可靠性分析的基本概念及指标

可靠性和实用性是监控系统设计中两个最重要的方面。一个系统的可靠性如何, 也往往取决于其设计阶段是否经过了周密详尽的可靠性分析设计。但在实际的设计中, 往往特别强调系统的功能特性和技术特性, 而忽略了系统的可靠性 (或被置于次要的位置) 。这常常会导致系统不能正常工作, 甚至瘫痪, 给用户造成直接或间接的经济损失, 甚至危及设备或人身安全。

一个系统的可靠性通常是指该系统在规定的条件下和规定的时间内, 完成规定功能的能力。其中规定的条件是指系统工作时所处的环境条件、维护条件、使用条件和操作水平等, 规定时间是指考察该系统能否正常工作的一个时间段, 规定功能则是指该系统应当实现的功能。可靠性虽然最集中地反映了一个系统或产品的综合质量指标, 但它只是一个定性的概念, 没有具体的量的定义, 因而难以进行分析和比较。在实际工作中, 往往需要以量的形式具体表示可靠性的高低, 这就需要对可靠性进行定量的分析。常用的可靠性的定量指标有可靠度 (R) 、故障率 (λ) 、维修率 (μ) 、平均故障间隔时间 (MTDF) 、平均故障修复时间 (MT-TR) 以及可用度 (A) 等。

假定某系统投入运行, 工作了一段时间t1, 后出现了故障, 不得不停止运行进行维修。经过了一段时间T 1的维修后, 故障排除, 系统恢复正常运行。又经过了一段时间t2后, 系统再次出现故障, 经过一段时间T2的停机维修后, 系统再次恢复正常运行。这样, 在整个测试时间段内, 系统正常工作的时间段有t1, t2, …, tn, 系统维护维修的时间段有T1, T2, …, Tn

(如图1所示) , 则有:

(1) 故障率 (失效率) λ

故障率也称失效率, 它表示系统在单位工作时间内发生故障的次数。

(2) 维修率μ

维修率μ表示系统在单位维护时间内修复的次数。

(3) 平均故障间隔时间MTB F。

平均故障间隔时间MTBF表示系统发生多次故障的情况下, 平均连续正常工作的时间, 它代表了系统的平均寿命。与该指标意义非常接近的指标是平均无故障时间M9W, 它用来表示不可维修的系统或元件的平均寿命, 其定义为“一批试验样品连续工作, 直到所有样品寿命终了, 它们寿命的算术平均值”。

由于监控系统的故障是可以修复的, 所以一般使用MTBF来代表监控系统的平均寿命。

(4) 平均故障修复时间 (平均故障时间) MTTR。

平均故障修复时间MTTR又称为平均故障时间, 它表示系统进行多次维修中的平均维修所用时间, 即平均故障时间。该值越小, 则表示系统可维护性越好, 越容易修复。

由于MTIR一般远小于MTBF, 是一段很短的时间, 所以通常可以通过试验或经验确定。

(5) 可用度 (有效度) A和不可用度N。

可用度A表示在某一特定的时刻, 系统正常工作的概率。其中λ/μ是系统的重要性能指标。如果λ/μ值较大, 则表明系统不能可靠地工作, 运行不久即会出现故障, 可用度低。

与可用度相对应的另一个指标为不可用度N, 它表示某一特定时刻下系统不能正常工作的概率, 即

(6) 可靠度R与不可靠度F。

可靠度是由可靠性直接演化而来的可靠性指标, 它是指系统在规定的条件下和规定的时向内完成规定功能的概率。按照限定的运行次数计算, 可靠度R表示系统运行n次不发生故障的概率, 即:

R (n) =P{n次运行不发生故障}

更多的情况下是按照限定的时间来计算, 此时可靠度表示在限定的时间内不发生故障的概率, 即:

与可靠度相对应的另一个指标是不可靠度F, 它是指系统在规定的条件下和规定的时间内不能完成规定功能的概率, 即:

通过对上述各种可靠性指标的分析, 可以得出这样一个结论:要提高系统的可靠性, 一方面是尽量使系统在规定的时间内少发生故障和错误, 即提高系统的MTBF;另一方面是一旦发生故障要能够迅速排除, 即尽量减小系统的MT T R。根据标准要求, 监控系统硬件的MTBF应大于100000h, MTTR应小于0.5h, 整个监控系统的MTBF应大于20000h。

2 可靠性指标的计算

一个系统的可靠性指标, 可以通过实验和计算两种方法来获得。只有对已经存在的系统才能使用实验的方法分析其可靠性, 而在系统的设计阶段或制造阶段, 则只能采取计算的方法。由于一个系统总是由若干个子系统或单元组成的, 所以系统的可靠性指标可以根据已知子系统或单元的可靠性指标来求得。有两种基本类型的系统模型, 即串联系统和并联系统。

2.1 串联系统

在串联系统中, 只要有一个子系统失效, 则整个系统即失效, 各子系统的故障之间不存在相关性。例如监控系统的前端数据采集部分主要由传感器、通信线路和采集模块 (SM) 构成, 不论哪一部分发生故障, 监控系统均不能正常采集数据, 从系统可靠性上分析, 这几部分就构成了一个串联系统。串联系统的可靠性受组成系统的可靠性最差的子系统的影响, 其可靠度低于最差子系统的可靠度;所串联的子系统越多, 可靠度越低。

如果用Rs表示串联系统的可靠度, 用入s表示系统的失效率, 用R, R1, R2, …, Rn和入1, 入2, …, 入n分别表示组成串联系统的n个子系统的可靠度和失效率, 则串联系统的可靠度为各子系统可靠度的乘积

其系统失效率为各子系统失效率的代数和

2.2 并联系统

并联系统又称为冗余系统, 该系统中只要有一个子系统能够正常工作, 则整个系统就可以正常工作。例如监控系统中的主备用服务器及主备用通信线路, 主用设备或线路发生故障, 只要备用设备或线路可以正常工作, 则系统依然能够正常工作。并联系统的可靠性比组成它的任何一个子系统都好, 可靠度高于最优子系统的可靠度, 而且所并联的子系统越多, 可靠度越高。

若以Rs表示并联系统的可靠度, 以R, R1, R2, …, Ra表示组成并联系统的n个子系统的可靠度, 则1-R1, 1-R2, …, 1—Rn分别为这n个子系统的不可靠度, 它们的乘积即为并联系统的不可靠度, 即并联系统可靠度为

应当注意的是, 不论是串联系统还是并联系统, 都是为便于分析而建立的一种系统可靠性结构模型, 并不代表任何实际结构;同样的系统在不同的工作条件或故障模式下可能分属于不同的结构模型。

在实际应用中, 大多数计算机系统都是混联系统, 即其中即有串联结构又有并联结构, 其可靠性指标可以通过模型转换, 先部分再全局地转换成简单的串联系统或并联系统来计算。除了直接计算之外, 更多的还采用状态枚举法、路径枚举法和分解法等可靠性分析方法来计算混联系统的可靠性。

3 结语

今后随着设备自动化和智能化程度的提高, 电源设备维护更多的转向设备日常维护、集中监控、系统优化等方面, 电源监控系统将逐步走上电源维护工作的中心位置, 一个稳定的、可靠的监控系统是必不可少的。通过对监控系统的可靠性分析, 可以对监控系统中元器件和设备的选用、软硬件的结构、抗干扰设计、保护设计、容错与诊断设计、可维护性设计等许多方面提供详实的数据, 从而对系统优化提供直接的依据。换而言之, 监控系统的可靠性反映了其在应用中可被信任、依赖的程度。

摘要:通过定量的计算监控网络的可靠性指标, 并对其进行比较分析, 为优化监控网络提供数据依据。

关键词:电源监控系统,可靠性

参考文献

[1] 陈建亚.现代通信网监控与管理[M].北京邮电大学出版社, 2000.

[2] 陆廷孝, 郑鹏洲.可靠性设计与分析[M].国防工业出版社, 2002, 2.

[3] 王静.新编电信小百科[M].北京邮电大学出版社, 2001.

上一篇:当前银行个人理财的现状、问题和出路下一篇:智能硬件与人工智能给产品设计带来的变化