数据传输可靠性

2024-07-31

数据传输可靠性(精选十篇)

数据传输可靠性 篇1

在一些具有破坏性的环境中,任何情况的发生都有可能造成传感器节点的突然死亡,于是,实现快速和准确的消息传输成为了一个无线传感器网络可靠性和服务质量的重要方面。因此,在一些节点失效的情况下,需要一种机制来保证足够的信息收集。换句话说,这种机制需要有一定的容错率,确保网络中出现一个或者一些节点死亡的情况时并不会影响到整个传感器网络所要执行的任务。

以往的一些研究方法主要是通过减少数据传输量或者融合数据来实现能量高效的无线传感器网络,该文提出了一种新的、智能的机制——基于数据补偿的可靠性数据传输机制(PCI),该方案建立在分簇路由的基础上,一方面用以减少不必要的、冗余的信息,另一方面通过补偿信息传输不足来保证传输的可靠性。PCI可以提高网络可靠性、减少传输时延、使网络能量得到高效利用。PCI

1 系统总体设计 1 系统总体设计

1.1 系统模型

PCI包括三个部分:可靠性概率计算模型P,消息分类机制C和智能均衡机制I。可靠性概率计算模型给出了接收方正确接受发送方发送的有效消息的可靠性概率,接着PCI可以由此计算出当前簇头节点(CH)发送的数据包能够被基站(BS)正确接受的概率。基于此可靠性概率值,通过消息分类机制C,PCI可以同步实现对消息的分类和转发。此外,PCI根据智能均衡机制中的补偿判断模块决定是过滤还是补偿信息。根据不同的情况,PCI调用不同的机制。我们将每单位时间内发送相同类消息的数量定义为消息的频率。补偿判断模块判断消息的频率并根据信息的饱和度来调用不同的模块。消息的饱和度是某个阈值。当消息饱和时,智能均衡机制调用冗余过滤模块来过滤那些具有时空相关特性的冗余信息。当消息不饱和时,智能均衡机制通过调用消息补偿模块提高消息的传输率,以此来保证能有足够的有效信息能够被基站准确的接收。

1.2 网络模型

分簇的网络可以有效的减少网络的能耗,延长网络的生命周期。LEACH协议就是一个典型的例子[2],这种协议运用分布式算法使网络中的节点自组织成簇,每个簇由簇内的簇头节点控制,这些簇头节点收集并融合来自其成员节点的信息,之后将这些信息转发至基站。而ECDG协议则是在成簇阶段之后,在这些均匀分布的簇头节点中生成一个路由树,只有作为根节点的簇头节点才负责把自身和其他簇头节点转发过来的融合消息转发至基站。与同类型的LEACH协议相比,ECDG也采用轮换选取簇头节点的方式,不同的是,他采用在簇头节点之间建立路由树的方法将信息通过多跳的方式传输至基站,如图1所示。

考虑到大规模无线传感器网络的适用性,PCI协议是建立在ECDG协议[4]的基础上提出来的,我们假设:1) 一个传感器网络是由一个基站和大量的传感器节点组成,这些节点是自组织成簇的;2) 每个簇内的成员节点由该簇内的簇头节点监控,簇头节点可以广播消息至簇内的所有节点;3) 所有的节点在部署完毕后都是静止不动的。4) 每个簇头节点对于其簇内的成员节点而言,都是消息可达的。如图1所示,簇头节点通过单跳或者多跳的方式将数据转发至基站。簇内的成员节点的主要功能有两点:感知和传输数据。感知模块负责监控周围的环境,之后采集到的数据将被传输至簇内的簇头节点。

1.3 文中所用到的符号解释

A1:接收方能够准确接收到的有效数据量,比如:基站。

Ci:网络中的第i个簇。

A2:Ci发往基站的数据量。

Hab:节点a到节点b的跳数。

Hi:簇头节点到基站的跳数。

P:默认的网络中传输错误的概率值[3]。

Pab:节点a和b之间传输的准确率。

Pt:簇头节点和基站之间传输的准确率。

2 功能模块的实现与测试

在这一节中,我们将重点介绍PCI协议的组成结构和工作原理。如图2所示,PCI协议主要包括三个部分:1) 可靠性概率计算机制;2) 消息分类机制;3) 智能均衡机制。

在簇头节点选取阶段,PCI协议在簇头节点中同步地建立起来。在簇头节点处理消息之前,PCI首先运用概率估计算法计算出当前簇头节点发送的有效数据被基站正确接受的概率。然后,PCI开始处理消息,这个处理过程分为两个阶段:消息分类阶段和智能均衡阶段。在第一个阶段,PCI通过消息分类机制,同步实现对消息的分类和转发;第二阶段,PCI通过智能均衡机制决定是过滤还是补偿信息。其中的补偿判断模块的功能是确定消息的频率并根据信息的饱和度来调用不同的模块。

2.1 可靠性概率计算机制

出于无线传感器网络固有的传输容易出错的特点,一般的网络不能提供良好的可靠性传输。因此,有必要估计有效消息能被基站准确接收的概率。依据此概率值,PCI可以确定能被基站成功接受的数据量。根据ECDG协议可知,ECDG形成了多个簇,其中绝大部分的簇头节点以多跳的方式将消息转发至基站。其中每一跳,消息都将按照同样的可靠性概率来转发。

在这一节,我们提出了一种从簇头节点到基站可靠传输概率的计算方法。我们假定无线传感器网络有默认的传输误码率P。为了简化计算,我们用式子1和2来分别表示数据量和传输概率之间的关系以及两个节点之间传输概率的关系:

根据如上所述,我们可以得到在成簇阶段每个簇头结点到基站的跳数,这个跳数不是固定的,而是节点的空间位置决定的,我们称之为Hi。不失一般性,我们可以根据下式得到可靠性传输的概率:

首先,可以设定默认值p b,b+1 =1-p ,因此式子2可表示为:

为了简化计算,根据泰勒级数理论,可靠性传输概率p t≈1-p(H) i -1。为了保证这个可靠性概率,我们假设Ci至少需要发送A2量的数据至基站。A1则可以由下式得到:

因此,如果要保证作为根节点的簇头节点至少有1bit的数据传输至基站,也就是当A1 =1时,A2可由下式得到:

通过式子5的结果,我们可以实现保证至少1Byte的消息数据可以被基站成功接收。在发送了足够数量的消息之后(比如A2的数据量),各簇头节点会通知其成员节点暂缓发送数据,直到新的一轮开始。通过可靠性概率计算机制,PCI可以减少许多多余的消息数据的发送,因此减少了通信开销。节点可以通过其内部的状态表来抑制冗余消息重发。

在不同的情况下,节点可以适当的调整这些重复消息的发送量以保证数据传输建立在可靠性概率的基础之上。此外,随着网络的运行,各节点的能量逐渐的减少,传输错误的概率逐渐增加。为了解决这一问题,基站会根据其接收的消息数量来调整概率参数值。

2.2 消息分类机制

消息分类机制在消息处理之前建立,负责消息的采集和分类。一般情况下,簇头节点内的消息数据来源主要分为三种:1)节点自己生成的消息数据;2) 来自簇内其他非簇头节点的消息;3) 转发来自其他簇头节点的消息。

簇内的每个节点都有唯一的ID,这些ID均存储在该簇的簇头节点的成员节点ID表中,通过此表,簇头节点可以区分不同的消息类型。为了减少网络的传输时延和能耗,上述第三种类型的消息将被直接转发至基站,因为这些来自其他簇头节点的消息已经被负责转发他们的簇头节点处理过了,因此,无需耗费有限的能量再去处理。对于前两种数据,我们将提出一种合理的融合方案, 这种方案可以进一步的保证网络的可靠性,并且利用概率论的方法在下一个机制中实现数据补偿。

2.3 智能均衡机制

智能均衡机制包括三个部分:1) 补偿判断模块;2) 冗余过滤模块;3) 消息补偿模块。

2.3.1补偿判断模块 J

补偿判断模块负责判断当前状态下是否需要进行数据补偿。我们设计一个名为AList的表来保存各种最新发送的消息数据, 并通过此表来区分和传输消息。AList表内的内容如下:< MT, Fre ,BS >。在这三项中,MT表示消息的类型,BS是一个用来表示消息饱和度状态的布尔型变量。如果BS的值是正的,则表示此种类型的消息发送量已足够,类似的消息数据将暂时延缓发送。然后,冗余过滤模块将发送饱和度反馈信息至补偿判断模块,以决定是否需要调用消息补偿模块。Fre代表某一种类型的消息数据的数量。当它超过某个值时(这个值是基于可靠性概率Pt时需要传输的最小消息数据量Max),我们确定此类消息数据的发送量已足够,此时,布尔型变量的值设为正,并同时更新AList。

此外,在补偿判断模块分类消息数据之前,需要将新接收到的消息与记录在AList中的历史消息进行比较。事实上,无线传感器网络中的节点一般具有时空相关性,我们可以假设同一簇内某一时期产生的消息数据类型是相同的,这表示在正常情况下,同一簇内某一时期产生不同类型消息的概率是非常小的。此外,AList表需要占用一小部分的内存空间,并且这个空间里存储的内容会被不断的更新。

简单来说,令D={(M) i ,W i |(M) 1 ,W 1 ,(M) 2 ,W 2 ,...,(M)} n ,W n表示AList表中最近的消息记录。D是一个根据FIFO准则设定的动态数据集合。M i 代表MT,W i 代表M i 的频率(Fre), 1≤i≤n。当来自成员节点的新消息数据M a到达簇头节点时,补偿判断模块将通过下式来验证它。

其中,M i∈D .此函数表示M a和M i之间的相异度。Ma将和数据集D内的数据一一比对,如果它与某个M i匹配,则此函数的值并不小于某个阈值,这代表M a是和之前发送的消息数据是同类型的,此时增加W i的值并进入下一步的工作。否则,这代表M a是一个新类型的消息,它将被存入AList并更新AList表。

2.3.2冗余过滤模块F

冗余过滤模块用于处理冗余消息。传感网能否以一种高效的方式来转发消息数据是十分关键的。众所周知,节点通过无线链路传输数据所产生的能耗要远大于节点处理同等量消息所产生的能耗。如前文所述,实际上,当监控区域内的事件发生时,同一簇内绝大多数的节点采集和发送的数据中包含的内容是相同的。个别的节点同时发送不同类型的消息数据的可能性很低。因此,并不需要所有的节点都与基站通信。这表示,我们需要将数据进行聚合,并在保证可靠性概率的基础之上只发送一定量的消息数据即可。

根据概率计算的结果可知,在某一阶段,当监测区域有事件发生时,每个簇头节点至少发送Max的数据量以保证此发送的有效消息可以被基站准确的接收。而不同的簇头节点由于其到基站的跳数不同,发送量也不同。为了进一步保证可靠性,基站会发送查询信息到每个簇头节点以告知他们是暂缓发送数据还是增加传输量。在发送了足够多的信息之后,在此轮接下来的时间内即使出现数据采集不足的情况,簇头节点也不会再进行消息补偿,因为基站已经接收到了足够可靠的信息。这样做避免了不必要的补偿措施。随后,簇头节点停止消息数据传输。

2.3.3 消息补偿模块 A

由于无线传感器网络经常被部署在恶劣的环境中,所以整个网络经常会遭受不同程度的损坏。如果发生爆炸,比如出现火山喷发或腐蚀性液体泄露的情况等等,均会损坏传感器节点,这将会导致网络消息数据采集不足。针对此类问题,我们通过消息补偿模块的功能来解决。如图3所示,传感网络一共包含6个簇:簇1~6,从图中可以看出,簇1、4、5内的节点分别遭到了不同程度的破坏,簇1和簇5内节点损坏情况比较严重,簇4相对较轻。一旦簇头节点侦测到此状况,他将通过对簇内成员节点数量的检查来确认此情况。举列来说,在簇5内部,将近70%的节点遭到了破坏,这导致该簇的数据采集量在短时间内急剧下降,此时簇头节点将调用消息补偿模块的功能来增加消息数据的量。另一方面,如果簇头节点遭到破坏,簇内剩余的节点将重新组簇或者加入到相邻的簇中。簇4内的节点由于受损数量较少,并不会出现数据采集不足的情况。

根据上节所述情况,当簇头节点通过冗余消息过滤模块发送的反馈信息得知消息数据量不足时,补偿判断模块将调用补偿机制来增加发送的相关数据量,直到有Max的数据量发送往基站。为了保证传输的可靠性,在下面两种情况下会调用消息补偿模块的功能:1.簇内节点大面积受损,导致消息数据采集发送不足;2.该簇所监控区域某段时间内发生瞬态事件。

3 仿真及结果分析

在这一节,我们通过MATLAB仿真来评估PCI协议的性能。根据PCI协议的要求,我们将此仿真建立在无线传感器网络ECDG协议的基础之上。为了比较PCI、ECDG和LEACH之间的性能,我们在这三种不同的环境下做了仿真。并且为了提高可比性和可行性,在这三种环境下仿真的网络参数都是相同的。网络仿真参数如下表所示。

表中E elec 表示节点内发送或接收电路的能耗;E amp 表示发送放大器的能耗。我们将网络生命周期作为评估标准。网络生命周期是指从网络部署完毕后开始运行到所有节点都死亡的整个过程的时间。

图4表明在网络遭到破坏之后的很长一段时间内,PCI可以通过补偿机制来继续保证网络传输的可靠性。相反的,在同样的情况下,LEACH和ECDG却不能保证有足够的数据量来实现网络可靠性。随着网络受损程度的逐渐增加,使用PCI协议的网络所表现出来的高可靠性也越来越显著。

4 结束语

本文提出了一种新的、智能的机制——基于补偿机制的可靠数据传输协议PCI。该机制一方面可以减少网络的消息数据传输量,另一方面,当网络遭到破坏而出现数据传输量不足的情况时,PCI可以对数据传输进行补偿,以保证网络的可靠性。仿真结果表明,采用PCI协议的网络比采用的LEACH和ECDG的网络可靠性更高,网络能量利用更加高效。

摘要:该文在无线传感器网络分簇路由的基础上,提出了一种基于补偿机制的可靠数据传输协议PCI,该协议可以实现高效、及时、可靠的数据收集和传输。PCI主要包括三个重要部分:1)可靠性概率计算机制;2)消息分类机制;3)智能均衡机制。通过调用这三种机制,PCI协议可以减少冗余信息以提高传输性能,并且可以补偿信息发送量的不足以保证数据传输的可靠性。通过仿真可以发现,PCI协议比LEACH和ECDG有着更快的数据采集速率并且使整个网络具有更好的稳定性。

数据可靠性性解读系列总结 篇2

1.数据可靠性其实并不是一个新的要求,一直是制药行业质量体系的基础,不要一说到数据可靠性,就想到计算机化系统。

2.数据可靠性从企业层面而言,很重要的是企业的文化以及企业的诚信。3.打印出的东西往往并不可靠,企业应该逐渐转变自己的思路与行为方式。

4.做数据可靠性的本源一定要回到对产品质量的关注上,不要单纯为了数据可靠性,花很多无用的精力在系统的升级上。

5.在数据管理上花费的努力和资源应该和产品的质量风险相符合,同时也要平衡其他质量保证要素,任何所谓的零风险从科学角度去讲都是不可能的。

6.关注数据可靠性问题应该更关注宏观系统层面的问题,而不要将偶然的文件记录错误或者不好的文件记录行为上升到数据可靠性的高度。

7.自动化设备的数据可靠性目前似乎还没有引起太大的关注,目前大多数都集中在实验室,从产品质量的角度,自动化设备的数据可靠性问题往往是有可能直接影响产品质量的。8.质量源于设计,数据可靠性也源于设计。

9.数据可靠性的设计体现在两个方面,计算机化系统的设计以及流程的设计。

10.软件升级不是简单的One Click,需要更新你的用户需求,需要通过变更进行评估,需要进行必要的测试,而且这还仅限于项目阶段,正常运维阶段会有更多的要求。

11.没有审计跟踪的软件并不是现在一定就不能用了,但需要进行相应的风险管理。

12.如果已经实施了电子系统或计算机化系统,不要再退回到纸质的模式,数据可靠性的要求同样适用于电子记录和纸质记录。

13.数据有两种产生的形式,一种是人工观察,手工记录在纸质记录上,另一种是设备中的电子记录,电子记录又细分为两种形式,没有相对结构的文件(Flat File)和数据库文件(Database File)。14.于纸质记录修改的要求,同样也适用于电子记录,实现的形式就是审计跟踪。15.在系统需求中就应该明确对审计跟踪有什么样的要求,至少包括修改人、修改时间,修改前后的内容这三个方面,这些适用于纸质记录的要求,同样适用于电子记录的审计跟踪。

16.数据库形式的电子数据系统设计时很容易实现电子记录的审计跟踪,常规的软件实现审计跟踪功能大多是基于数据库形式。

17.对于审计跟踪审核,应该侧重于法规要求的记录变化相关的审计跟踪。

18.在数据产生的阶段,配置的存储路径其实是很关键的一个步骤。如果这个存储的路径可以被随意更改,对于数据的长期保留是不利的,谁也不知道你在归档的时候会不会有数据的遗漏,或者数据是不是随时可以根据检查员的要求快速查找到。

19.千万不要在文件名里用上“Test”、“Try”、“试验样品”之类的关键词,这样会给审计官一个印象,你在测试的时候不是按照规定的测试方法进行的测试,可能进行了一系列的Try Run,得到一些好的结果后再正式进样品。20.数据的保留(Retention)可能包括两个方面的内容归档(Archive)和备份(Backup)。21.归档既然是长期的,永久的保留数据,那么意味着需要定义一个可以进行数据归档的节点。

22.通常对于电子系统而言,备份的工作可以用特定的备份工具,定期执行系统的JOB来实现,系统在进行数据的备份的时候才不会区分你是current data还是data in its final form呢,系统只会按你配置的路径去备份数据,当然可能会是全盘备份也有可能是增量备份。

23.长期的存储数据对于企业而言是一个不可忽略的成本,尤其是纸质的情况,不过电子数据相对好些,IT技术日益发达,TB级别的存储器现在也很便宜,不过数据的长期保留必然会给企业带来额外的法律风险。

24.关于设备确认或者说计算机化系统验证两个最重要的概念就是“按照系统的预期用途进行确认(验证)Validate for Intended Use”和“基于风险的方法Risk Based Approach”。

25.系统的确认(验证)可以做得简单些,但绝对不是说可以用日常的校准代替确认的过程。

26.数据可靠性问题除了蓄意的造假之外,容易出现错误的情况实际上就是在系统和系统之间传输的时候。

27.企业千万不要去造假,这是不能碰的高压线,不要以为你修改了系统时间神不知鬼不觉,在专家眼里,一切都是浮云。28.不要过于相信工艺自动化设备的时间显示功能,在批记录上尽可能从同一个可信的时间源记录时间,尤其要小心上下游工艺设备上的时间,如果有工艺顺序要求的话,千万要小心后道工序设备显示的时间早于前道设备。29.对数据审核人员开放原始数据的权限实际上是说我们要转变我们使用数据的方式,不要再以纸质记录为最终的记录了,如果需要审核数据直接到系统里去看,这长期看来是监管的趋势所向。30.MHRA例举了两种可以代签或倒签的情况,原则是不增加产品的质量风险。

31.原始数据是指数据最初产生的格式,在目前监管的趋势下,不保留原始数据,是有被开数据可靠性观察项的风险的。

32.中国GMP为纸质记录开了一个口子,但并不是说你定义了主数据就可以将主数据认为是原始数据。33.计算机化系统的本质是为了支持业务流程,以满足特定的功能需求;

34.IT部门通常并不是数据所有人,IT部门并不能单独确定你的流程应该如何设计; 35.数据所有人需要真正懂业务和法规要求,要懂一点儿计算机。36.第二人复核是个很有技术含量的活,并不简单是一个签名;

37.GMP的要求执行不严格,深层次的原因在于我们没有认真思考、分解我们的流程,识别出其中的风险点以及控制点,并且没有很好进行风险降低和沟通。

38.系统权限的设置应该确保系统操作人员所扮演的角色与职责相对应,权限控制可以实现数据可靠性要求中的Attibutable的要求;

39.权限的控制通常分为两个方面,操作系统层次的权限管理以及应用软件层次的权限管理;

40.仅采用供应商的验证文件并不算严格意义上的计算机系统验证,保持系统的验证状态少不了企业自己质量体系内的文件做为支撑;

数据传输可靠性 篇3

[摘要]电力调度数据网作为自动化各业务系统的主要传输通道,对自动化实时业务数据传输质量起到关键性作用。调度数据规模的复杂性、众多安全产品的部署、业务系统自身网络的复杂性,构成电力调度数据网、业务系统的连接复杂性,直接提高业务系统的运维难度。因此需要研究如何提高调度数据网承载业务的可靠性。

[关键词]提高;调度数据网络;业务可靠性;

[中图分类号]F407.61 [文献标识码]A [文章编号]1672-5158(2013)06-0092-02

引言

计算机技术与网络通信技术的发展,使得电力系统大部分业务通过网络进行传输,传统的专线通道传输方式已逐渐成为备用方式并逐步退出历史舞台。已建成的电力调度数据网络是传输电力生产实时信息的网络,以江苏为例,已建成省市的三级调度数据网络、市-县-各220kV变电所的四级调度数据网络以及至各110kV、35kV变电所的五级调度数据网。

随着电网结构的扩大,复杂程度的加深,社会对供电质量要求的提高,要求电力企业不断采用新技术提高驾驭大电网的能力,电网实时信息采集的可靠性、实时性是基础。近年来,电力企业也通过实施调度数据网的安全防护以及调度数据网第二平面的建设来不断提高调度数据网的安全性、健壮性,但如何提高电力调度数据网承载业务的可靠性,还需通过分析调度数据网的网络结构,性能特点以及承载其上的各类业务特点,将二者结合起来才能得到解决。以下通过具体分析,并结合实例阐述“如何提高电力调度数据网承载业务可靠性”。

1 调度数据网承载业务及存在问题分析

1.1 调度数据网承载业务分析

电力调度数据网络是电力生产实时信息传输的网络,网络传输的主要信息是电力调度实时数据,是电力指挥、安全生产和调度自动化的重要基础,在协调电力系统发、输、变、配、用电等组成部分的联合运转及保证电网安全、经济、稳定、可靠的运行方面发挥关键的作用。

近年来调度数据网络应用有较快发展,包括保护故障管理、故障录波远传、电量采集系统和调度实时系统等。数据网络是支持调度自动化系统的重要技术平台,一般要求数据网络安全可靠,实时性要求在秒级或数秒级。日志文件的一个问题就是它的内部格式是针对系统用途构建的,必须使用某种技术手段作为日志文件内容输出的接口,因而使用完全依赖于专门的数据库厂商,依赖性太大,不灵活。

1.2 调度数据网及承载其上的业务系统运维问题分析

调度数据网结构庞大,站点较多,品牌不一。以江苏为例,地区级调度数据网含四级、五级数据网,包含核心层设备接入层设备,每个35kV及以上变电站均部署1台(已进行双平面改造的部署了2台)接入层设备,数量大,型号主要包括思科、华三、中兴等,构成庞大的调度数据网络。

业务系统使用的网络设备品种多,数量大,缺乏手段对其监控。应用于调度自动化系统、电能量采集等业务系统中的网络设备(主要指交换机、路由器等)品种多,数量大,当业务系统故障时无法分清是业务系统故障还是网络设备故障。

不同类型、功能、品牌的安全防护产品部署于调度数据网边界。随着政府对调度自动化系统安全性的要求不断提升,网络安全产品如防火墙、纵向加密装置、横向隔离设备等也逐渐增多。

一个典型的业务系统、数据网络分层分区联结示意图如下:

以上可以得出调度数据网接入节点多、安全防护设备部署数量广泛、品牌不一、业务系统本身部署的网络设备也较多,由于随设备配置的软件只能实现同型号设备的配置、维护与简单监测,无法与业务应用系统关联,从而运维人员无法全面、系统地收集业务系统运行的实际工况,当业务系统发生异常时,亦缺乏全面、有效的手段和依据及时对异常进行定位与排查。

2 如何提高调度数据网承载业务的可靠性

针对调度数据网承载业务的现状,可以考虑建立调度数据网实时监测、预警,及时通过与业务相关的告警了解各类应用系统运行的健康水平,做到及时发现系统存在隐患,业务系统故障及时告警并能提供相关的专家知识库帮助解决业务系统问题。为此,可以从以下几个方面着手进行建立:

2.1 研究业务系统数据监控规范

建立《调度数据网自动化系统监测标准》,制定各自动化系统业务模块的网络流量数据标准,作为基础,规范调度自动化系统业务流量数据监测工作。

2.2 研究调度自动化业务与网络设备的关联模型

研究建立调度自动化业务系统与网络设备的逻辑关联,与实时采集的流量数据进行关联分析,实现网络设备与业务应用的统一监控与管理。

2.3 研究调度数据网业务应用的主动运维机制

研究调度数据网业务应用的故障预判方法,制定业务与设备关联的预警策略,采用基于云推理技术架构实现针对自动化系统进行网络流量异常分析的推理引擎,从网络流量层面对自动化系统内部或外部的异常进行分析,采用抑制故障发生的预控技术,实现预判、预警、预控的主动运维机制,提高调度数据网的运行管理水平。

2.4 研究基于网络流量数据辅助决策的分析方法

基于实时流量数据分析网络的动态负载及业务的需求变化趋势,为业务拓展、网络规划提供决策依据,优化业务运行,提高网络性能。

3 具体实例

江苏镇江供电公司依据上述理论,研制开发了“调度数据网业务应用实时监测、预警系统”,简要介绍如下:

1、根据业务系统网络逻辑关系、流量情况制定业务数据监控规范,示例如下:

2、系统物理模型如下:

系统部署于Ⅰ区、Ⅱ区、Ⅲ区。Ⅰ区和Ⅱ区之间有防火墙隔离,Ⅲ区与其他区域之间用物理装置隔离,如上图所示。按照网络规划及流量采集的需要,监测平台系统、数据库、分析预警系统均部署在Ⅱ区,流量采集系统分Ⅰ区、Ⅱ区部署。

3、系统软件模块包括流量数据采集子系统、实时分析预警子系统分析流量数据和实时监测平台管理子系统。

流量数据采集子系统直接与网络设备通信,实现调度数据网流量数据接入应用监测预警系统,是业务应用监测预警的基础。

实时分析预警子系统分析流量数据,识别监测内容,根据预警策略实施预警、预控,实现对业务应用的实时监控,是业务应用监测预警的核心。

实时监测平台管理子系统实现配置监控内容和监控方式,提供多种手段查看监测结果,智能化异常处理过程,集中控制业务应用的运行,是实现业务应用监测预警的工具。

4 结论

通过对各业务系统的历史流量进行分析,掌握各系统业务模块的流量负荷情况,识别出业务系统各模块之间的数据交互关系,建立业务与数据网之间的模型,并根据制定的业务监测规范进行判断,能准确的定位异常并分析受异常影响的业务范围;预警预控联动策略的部署,对预防系统和设备故障的发生起到了良好的预警作用,达到了提高电力调度数据网承载业务可靠性的效果。

参考文献

[1]鲁庭瑞,李斌,崔恒志,丁正阳,鲍丽山,徐春雷,江苏电力数据网络及其应用,电力系统自动化[J],2002,26(2)

数据传输可靠性 篇4

可靠数据传输是无线传感器网络中的一个关键问题,它决定了数据包如何经过多跳路由成功地传输到目的节点Sink,对传感器网络的监测性能有重要影响。而随着无线传感器网络应用的深入,现实需要通过无线传感器网络能更直接、更高质量的感知客观世界,因此不同的业务对无线传感器网络的服务质量(QoS)提出了不同的要求,如:军用监控传感器网络中,对某区域参数(如空气中的含氧度)的周期性测量,由于传感器网络中的节点往往是大规模部署,相邻的多个节点之间感知的数据关联程度高,同时大量冗余节点的存在增强了系统的容错性。因此,此时的报文丢失在一定程度上是可容忍的。这类传感器网络应用并不要求所有报文都成功传输到Sink,只需要满足一定概率的报文能成功传输。而在事件驱动的敌方目标识别和跟踪中,紧急数据(如媒体流)传输则对延迟和抖动非常敏感[1]。在无线传感器网络中,要求提供有保证的差别服务,同时能在全网范围内实现资源的充分有效利用,QoS路由是解决该问题的关键技术之一[2]。

本文针对无线传感器网络的诸多特点和现有研究的不足之处,对可靠数据传输的关键技术和相关问题进行了研究,并提出了相应的解决方法。在多路径数据传输方法中引进网络区分服务的思想,提出一种既能采纳网内普通数据周期性地收集检测数据,又能应对紧急数据的处理、具有区分服务机制的多路径选择算法CBMMA。其核心思想是,在一般情况时,应用对数据传输的紧急性要求并不高,为了节约资源,传感器节点一般采用低速率周期性地报告事件,在簇间多条不相交路径中根据概率选取其中的一条路径进行传输数据;而一旦发生紧急事件,为确保紧急数据传输准确到达Sink节点,源节点将同时启动所有到Sink节点的不相交路由路径,以提高紧急数据的可靠性。

1 簇间多路径路由算法

将网络划分成簇且每个簇都选取一个簇头,下面开始讨论簇间的多路径路由的建立过程。

与常规路由协议一样,多路径簇间路由算法有三个阶段:初始化阶段、路径建立阶段和路径维护阶段。

构建簇间不相交多路径路由的伪码如下:

2 区分服务的路径选择思想

无线传感器网络是面向应用的。“一次部署多种类应用”的多业务无线传感器网络是必然发展趋势,不同业务对网络服务质量(QoS)提出了不同要求[3]。在传感网络中,有些应用要求可靠地传输数据。例如:在矿井瓦斯浓度监测过程中,一般情况下,网络节点只要周期性地传输数据到Sink节点,一定的丢包率是可以容忍的。而一旦瓦斯浓度超过标准值时,就需要将这种数据准确无误地传输给用户,以便用户及时反应,采取措施。

区分服务是IEIF(Internet Engineering Task Force)在QoS领域所做的新尝试。区分服务网络由边界节点和内部节点构成,边界节点对数据流完成分类、标记、测量、整形和丢弃等各种功能,并给数据包的DS域标记不同的DSCP(Differentiated Service Code Point)值;内部节点在调度转发数据包时,根据包头的DSCP选择提供特定质量的调度转发服务。虽然针对IP网络和Ad hoc网络提出了许多针对延时敏感的数据的QoS路由和区分服务机制,但是它们不能直接应用于无线传感器网络[4]。因此,我们需要根据无线传感器网络自身的特点设计新的区分服务方案。

本文提出的CBMMA算法是一种针对紧急业务传输的区分服务方案。该方案既兼顾了对不同业务的QoS ,支持紧急数据的可靠性传输又尽可能地节约了WSNs的能耗。其思想是:传感器节点在监测到数据后,发送Data_Msg消息,这种Data_Msg消息包含事件数据和其它控制数据。节点首先将此数据填充到Data_Msg消息的“数据”域中,然后将该数据值与实际应用设定的阈值进行对比,根据对比的结果确定数据的服务类型,即该数据是普通数据还是紧急数据,超过阈值的即是紧急数据,否则即为普通数据,再将此服务类型填充在Data_Msg消息的“数据类型”域中,最后将数据分组发送给簇头节点;簇头节点接收到Data_Msg消息后,簇头节点根据服务类型来为此数据分组执行相应的区分服务操作。区分服务由充当路由的簇头节点提供。大多数通信流量属于普通流量,由于数据间的关联性大,并且存在大量冗余,所以,最应该注重降低能耗。因此,我们在簇间多条不相交路径中根据概率选取其中的一条路径进行传输数据而不是同时启动所有不相交路径。而一小部分分组属于紧急类别,应该确保紧急类别的数据分组的可靠性,尽可能精确地到达Sink节点。在这种情况下,我们就将启动所有的不相交路径来进行传输,虽然这样会比选择单路径消耗更多的能量,但是由于这样的紧急数据并不多,而且相对于数据的可靠性和紧急性来说,这样的能耗代价也是值得的。本文通过对网络中传输的数据流进行区分服务,可以对网络的关键数据进行可靠性传输,防止重大事故的发生。

3 区分服务数据传输的实现

3.1 普通数据的传输

在数据传输阶段,我们设置Data_Msg消息如表1所示:它的作用是根据监测数据值定义了两种数据类别普通数据和紧急数据。设定该消息类型为“5”。

元数据是指监测到的数据值。数据类型为布尔型变量,当簇内节点监测数据,根据监测的布尔型数据类别字段来判断是普通数据还是紧急数据,如果监测到的数据是普通数据则数据类别字段值为FALSE,否则表示为TRUE。ID_S是指监测到数据的源节点ID,由于是用GAF算法进行分簇头,因此可以根据这个域的值立即得到事件发生地点。ID_R为数据当前所处节点ID;ID_P是指明下一跳节点的ID,簇头节点接收到Data_Msg消息后,若发现其数据类型域为FALSE,则选取自身转发表NT[]中的转发概率最大的下一跳节点进行普通数据传输工作。

当普通数据传输时,直观上来看,如果有多条路径可供选择,我们尽可能采用能量消耗最小的路径,当被选中的路径经过多次数据传输,消耗一定的能源之后,其传输概率可能低于次优路径而暂时不再被选择。为了保证能耗平衡,我们规定,在间隔一定时间Tc后,源节点重新计算各条路径的发送概率,再选取其中的最优路径进行传输数据。这样能平衡多条路径之间的能耗,以延长整个网络的生存期。

3.2 紧急数据的传输

我们引入了紧急数据是考虑到网络对紧急业务的支持,紧急数据对可靠性具有很高的要求。而传感器节点之间通信断接频繁,经常导致通信失败。相邻节点间的信道质量很差,错误率可达30%甚至更高。离基站较远的节点,需要多跳传输才能把数据传到基站,在这种情况下,数据传输成功率更低。这样就可能产生由于某条路径的失效导致网络无法监测到紧急事件的发生。因此,我们利用冗余方式来提高紧急数据的可靠性。虽然,它在一定程度上造成了网络能量的消耗,但却更好地保证了网络对突发事件的及时监测与处理,避免更大的损失。而且,突发事件数目毕竟较少,网络的能耗也不会受太大影响。簇头节点接收到Data_Msg消息后,若发现其数据类型域为TURE,则表示监测到的是紧急数据。该簇头节点向自身转发表NT[]中的所有节点转发Data_Msg消息,这样则同时启用所有通往Sink节点的不相交路径,可靠地传输紧急数据。为了避免长时间的延时,我们把数据传输时间控制在T3范围内。

CBMMA算法中区分服务Path_Choose伪代码如下:

4 仿真结果分析

本文通过仿真实验对基于区分服务的CBMMA算法进行评估,主要考察CBMMA算法在可靠性方面的性能。由于传感器网络与以往的Ad Hoc网络不同,因此目前并没有统一的衡量传感器网络路由协议的标准,根据国防科技大学李姗姗博士在传感器网络可靠性测量中所用的方法,同时借鉴了美国MIT大学教授Francisco J.Ros教授的LEACH协议代码,我们也将CBMMA和LEACH[5]进行比较,从期望可靠性与实际得到的可靠性方面进行评价。

部署区域为90m×90m的正方形,其中均匀散布100个节点。为方便计算,假定信道的出错率在区域内均匀分布,网格(簇)边长设置为30m,每个簇首的工作周期定义为一轮。为了在相同的条件下进行比较,我们改进了LEACH协议。LEACH假定所有簇首都可以和Sink直接通信,这在实际的网络中是不现实的,即使满足通信条件,也会消耗大量的能量。因此,我们将LEACH的簇间路由改成了多跳路由,但使用的是单路径传输,设置LEACH的最佳簇头个数为5。

由于传感器节点通信带宽窄而且经常变化,通信覆盖范围只有几十到几百米。传感器节点之间的通信断接频繁,经常导致通信失败。相邻节点间的信道质量很差,错误率可达30%甚至更高。离基站较远的节点,需要多跳传输才能把数据传到基站,在这种情况下,数据传输成功率更低。比如距离基站5跳的节点,在各跳信道错误率为30%,即相邻节点间的传输成功率为70%的情况下,数据传到基站的成功率仅为16.8%。如此低的数据传输成功率严重影响了WSNs的性能,因此,如何在多跳传输的情况下克服信道质量差的问题,就显得尤为重要了。

图1给出了信道错误率从0到50%时LEACH和CBMMA实际获得的可靠性。由于LEACH以概率的方式选举簇头,为了避免单次簇头选举分布不均引发的偏差,我们取二十次实验的平均值作为评估结果。模拟结果表明,随着信道错误率的增加,由于CBMMA使用了多路径簇间路由,而LEACH使用单路径,CBMMA实际获得的可靠性明显优于LEACH。

可以这样定义数据传输的期望可靠性:数据源产生的数据包经过多跳路由被成功传输到Sink的概率。不同的应用可以通过规定不同的期望可靠性值来满足不同的可靠性要求,采取不同的可靠性控制策略。图2给出了LEACH和CBMMA对应不同期望可靠性下获得的实际可靠性,信道失效率为30%。模拟结果表明,CBMMA实际获得的可靠性与期望可靠性基本一致,而LEACH由于没有考虑可靠性需求,它实际获得的可靠性随着期望可靠性的增加几乎不变。

在能耗指标上,我们分别从簇间能耗对CBMMA和LEACH的性能进行对比。

假设事件源位于网络左下角对应的簇,Sink位于右上方的位置(90,90)。图3给出了平均簇间通信能耗,依然取二十次实验的平均值,信道出错率为30%。实验结果表明,期望可靠性越高,CBMMA相对LEACH的能耗就越多。这是因为随着期望可靠性的增加,需要的路径数也增加,因此,这些能耗是不可避免的。实际上,多路径方法就是利用冗余数据传输来达到期望可靠性。不过,CBMMA有效地控制了簇首的分布,簇间能耗的增加幅度是可以接受的,而且CBMMA每次尽量选择代价小的路径传输数据。相对于平面拓扑结构,如果要获得相同的期望可靠性,CBMMA的能耗要少得多。

5 结束语

本文首先提出不相交多路径思想,然后针对不同的数据类型采用区分服务方法,使得能确保紧急数据的可靠性。在一般情况时,应用对数据传输的紧急性要求并不高,源节点在簇间多条不相交路径中根据概率选取其中的一条路径进行传输数据;而一旦发生紧急事件,为确保紧急数据传输准确到达Sink节点,源节点将同时启动所有到Sink节点的不相交路由路径,以提高紧急数据的可靠性。仿真实验表明,CBMMA比改进后的LEACH虽然在能耗上稍微有所增加,但其能获得更高的数据可靠性,对紧急事件的监测具有重要的意义。

参考文献

[1]Ganesan D,Govindan R,Shenker S,et al.Highly-resilient,energy-effi-cient Multi path Routing in wireless sensor networks[J].Mobile Com-puting and Communications Review(MC2R),2002,1:320-323.

[2] Younis O,Fahmy S.Distributed Clustering in Ad Hoc Sensor Networks:A Hybrid,Energy-Efficient Approach[C]//Proc.IEEE INFOCOM,Hong Kong,Mar.2004:366-379.

[3] Younis O,Krunz M,Ramasubramanian s.Node clustering in wireless sensor networks:Rencent developments and deployment challenges[J].IEEE Network,2006,20(3):6-28.

[4]Chuan-Ming Liu,Chuan-Hsiu Lee,Li-Chun Wang.Distributed cluste-ring algorithms for data-gathering in wireless mobile sensor networks[J].Journal of Parallel and Distributed Computing,2007,67(11):1187-1200.

数据传输可靠性 篇5

RDP:可靠数据协议(RDP:Reliable Data Protocol)

RDP 是一种面向连接的传输协议,其主要设计来为主机监控应用程序的下载/上传以及远程调试支持数据的有效成批传输。RDP 尝试只提供那些必需的服务器,达到操作有效、尺度小的效果。其主要功能如下:

RDP 将在每个传输连接端口提供一个全双工通信信道;

RDP 将尝试可靠发送所有的户信息,一旦发送失败,及时向用户报告错误。RDP 扩展 IP 数据包服务使之包括可靠发送;

RDP 将尝试发现并删除所有损坏的和多重复制的字段,它将在每字段头使用核对和及序列号实现这一过程;

RDP 将会随意地提供字段序列发送,一旦建立连接,字段序列发送必须要被声明;

RDP 将会响应确认字段的非顺序接收,释放发送端的资源。

与 TCP 相比,RDP 支持更为简单的函数集。RDP 的流控制,缓冲以及连接管理模式都是相当简单的。对于一个协议,我们的目标就是它能够既简单又有效地执行并能适合一系列的应用程序。

RDP 函数集也可能是子集从而进一步减小特殊执行的大小,

例如,一台向其它主机请求下载的目标处理器可能执行一个 RDP 模块以支持默认的开放式函数和单连接。这个模块也可能不选择非顺序响应确认。

协议结构

RDP 第二版协议头结构如下:

Control flags ? 8个控制位划分如下:

SYN:SYN 位表示当前为同步段。

ACK:ACK 位表示协议头有效的承认序号。

EACK:EACK 位表示当前为扩展承认字段。.

RST:RST 位表示该数据包为复位字段。

NUL:NUL 位表示该数据包为空字段。

0:表示该字段的值必须设置为0。

Ver no:版本号,当前版本号为2。

Header length ? RDP 协议头长度。

Source Ports ? 源地址,识别通信发生的过程。网络访问协议头中,源地址和目标地址的端口标识符的结合完全限定了连接并形成连接标识符。如此 RDP 可用于区分两台主机间的多连接。

Destination Ports ? 目标地址,识别通信中的目标过程。

Data Length ? 该字段中的数据长度(八位),该数据长度不包括 RDP 协议头。

Sequence number ? 该字段的序列号。

Acknowledgement number ? 如果 ACK 位设置在协议头部,这就是字段序列号,即该字段发送端最后正确按序列接收的顺序。一旦连接成功,就应该发送该字段。

Checksum ? 检验和确保完整性。

Variable Header Area ? 用于传输 SYN 和 EACK 字段的参数。

你的数据中心可靠吗? 篇6

与IDC业务相比,EDC具有更高级别的数据中心可靠性和更加完善的基础设施平台。以高效可靠的供电为例,EDC会提供双路市电,外加柴油发电机的供电保护,其中每一路市电均配有N或者N+1的UPS供电保护,如此一来,任何一路市电供电中断,都不会影响IT系统的供电。即使两路市电同时中断,也还有柴油发电机的供电保护。按照设计要求,柴油发电机通常有不低于72小时的油料储备,同时,这些数据中心还与其附近的加油站签署有油料保障协议,几乎可以做到万无一失。

但这样就真的可靠了吗?我们不幸地看到,不断有高等级数据中心宕机事件见诸报端,如2011年12月,亚马逊旗下英国、法国、德国和西班牙数据中心宕机时间超过一个半小时;在过去的几年间,全球最大的支付平台PayPal、Google gmail系统、微软数据中心、iWeb CL数据中心、Chase.com网上银行、knocked Intuit网站数据中心均发生过严重的宕机事件,有些宕机时间甚至超过了24小时。国内的高等级数据中心也不能幸免,有些具有2(N+1)外加柴油发电机的可靠供电保障的数据中心,也一度发生了电力中断的事件。

究其原因,本人认为,数据中心高可靠性并不仅仅是高等级数据中心设计以及产品设备的简单堆砌,高投入并不一定带来高可靠。数据中心的高可用性需要一整套管理的方法论和指标体系,其中,很多需要进行量化。万国数据为此提出了业界首套IT高可用管理体系方法论,从评估、规划、实施、运行与监控等5个层面实现,并对数据中心的标准作业进行管理,从而为用户提供专业化的指导和安全高可用的保障。

仍以高可靠供电为例,2(N+1)外加柴油发电机的保护只是基础,还需要高可用的管理体系,依靠运行管理,及时发现系统在运行中的隐患。目前很多数据中心还停留在事后告警的阶段,即发生了故障或错误提供告警,根本不具备主动式高可用实时监控服务的能力。如果监管水平到位,将可以有效提高数据中心的可用性,避免数据中心中断给用户带来的损失。

医疗机房网络数据维护与可靠性 篇7

随着信息化建设不断深入, 人们获取医疗信息越来越依赖网络, 以提高医院竞争能力, 更方便快捷地为病人服务, 满足其求医问药的需求。

随着医院业务量快速增长, 医疗业务系统越来越依赖他们的信息技术服务, 可靠性对于医院服务公众越来越重要。当系统投入使用后, 用户逐渐意识到的可靠性往往显得更为重要, 医院信息系统几乎90%以上的停机事件是由于系统/存储/应用程序等方面原因造成的。同时, 随着医院信息化的不断完善, 信息服务管理人员 (信息中心) 开始意识到, 在建设了医院信息系统后, 管理人员开始发现, 尽管在系统建设的时候, 已经充分地考虑的服务器以及存储设备的硬件冗余, 但信息系统还是经常由于种种原因而不得不停止正常的服务。医院机构的信息服务应当基于一个高可用的架构, 以确保信息系统具备在相当长的一段时间内持续执行其功能的能力。

1 定期性停机维护

1.1 对系统的影响分析和技术解决方案。

在系统运行的过程中, 医院需要每年年末空闲时段停止应用系统的服务, 对系统的软硬件以及存储进行一定的调整, 它通常包含以下一些内容:

(1) 由于目前很多机房未能达到国家要求机房标准建设 (温度、湿度、电压等) , 核心业务都是7*24不间断运行的, 长时间运行硬件设备灰尘较多, 会影响设备散热, 需对服务器、数据存储柜等相关核心业务运行设备灰尘清理, 定期除尘能改善硬件设备良好的运行, 保障业务系统稳定运行。

(2) 系统的普遍性检查维护, 定期对硬件设备各个指示灯状态检查, 可判断是否有硬件故障;定期通过服务器管理软件检查, 可判断是否有软件故障;

(3) 硬件Firmware和主机系统的升级, 打补丁等需要重启硬件设备的操作, 或相关可能对系统造成潜在严重影响, 但又必须完成的例行工作 (比如某些安全补丁或固件升级会造成系统的崩溃或运行不正常)

(4) 应用系统或数据库的软件升级, 通常需要停止相应的应用服务, 以保证数据的完整性及一致性;

(5) 存储系统的调整, 比如添加/替换磁盘, 调整存储空间, 调整存储网络。

1.2 但随着医院业务可靠性的要求不断增长, 允许系统管理者进行停机维护的时间越来越短, 甚至要求在进行上述正常定期性维护的时候, 不能停止医疗信息服务, 面对这样的需求, 通常会采用一些高可靠技术方案来满足:

(1) 采用冗余的, 支持热插拔的硬件设备, 当需要进行固件升级的时候, 将硬件插拔到其他系统进行。

(2) 构建共享存储的Cluster群集环境, 包括购买群集软件, 添加冗余的主机设备, 当需要进行系统维护时, 将信息服务系统切换到热备的主机上, 继续提供服务, 待系统维护完成后, 再切换回原系统。

(3) 购买专业的存储管理软件, 升级磁盘阵列系统, 构建弹性的企业存储平台

(4) 对重要业务数据实现本地或异地数据的实时容灾备份。

(5) 对医院部份业务应用 (医保、财务、新农合等) 可采用虚拟化技术, 当生产系统出问题, 这样可快速迁移与布署, 恢复业务运行。

2 意外事件对系统的影响分析和技术解决方案

信息系统的意外事件包含着许多因素:

(1) 人为的错误, 比如误操作或误删除数据造成信息服务的不可用。

(2) OS、应用程序、硬件设备的失效或任何一个环节发生改变后所造成的不兼容问题都会导致信息服务不可用。

(3) 由于软件设计过程的原因, 造成运行一段时间后服务提供能力出现下降, 也会导致信息服务不可用。

(4) 由于软件设计原因, 导致当出现某种特定事件时, 数据发生逻辑上的不一致, 将直接导致该应用的不可用。

(5) 自然灾害、公共设施等非可抗力原因也会造成信息系统长时间甚至永久的不可用。

3 意外事件造成的停机故障

针对上面的意外事件因素, 医院信息管理者需要在2个技术层面来保障系统可靠性:

(1) 在存储上保证应用数据的可靠性, 包括:通过存储快照技术来防范应用逻辑错误以及人为失误带来的数据不可用风险, 通过存储镜像技术来防范磁盘或磁盘阵列失效带来的存储系统不可用风险, 通过存储多路径技术, 防范由于网卡板卡端口故障带来的存储系统不可用风险, 通过数据复制技术, 防范灾难带来的数据损毁风险。

(2) 在应用上保证程序运行的不间断性, 包括:采用并行计算技术提高应用程序的可用性级别, 采用HA群集软件, 让备份系统可以迅速接管不可用的应用系统, 可通过对应用服务器容灾备份, 快速恢复应用数据。

4 结语

医院信息系统的可靠性与利益息息相关, 如何充分利用网络资源, 提高医疗效率, 应是信息系统管理人员需要认真研究探讨的问题, 总之, 随着医疗卫生事业不断深入, 医院信息系统在医院管理中起到越来越重要的作用, 这是医院信息系统今后重点发展的目标。

参考文献

[1]周卫星.医院门户网站建设新探.医学信息, 2009, 22 (4) :388-389

[2]于源, 刘英家.浅淡医院网络安全与数据维护, 医疗卫生装备, 2000, 03

CAN高速环网传输可靠性研究 篇8

CAN总线因其诸多优势在现场数据传输中得到了广泛应用。但如何保证CAN环网在传输介质意外断开时数据的正确传输, 一直是许多科研工作者研究的方向, 本文就如何提高CAN总线系统的工作可靠性进行了讨论与分析。

2. 传统CAN环网可靠性分析

传统的CAN总线环型结构中, 每个节点与两个最近节点相连接以使整个网络形成一个环, 数据沿着环向一个方向发送。当环中的节点不断增加时, 响应时间也就变的越长。单纯的环形结构非常不灵活且不易扩展, 单个节点或一处电缆发生故障将会造成整个网络的瘫痪, 影响网络中数据的正常传输, 所以该环形结构的可靠性有待提高。

3. CAN高速环网传输模型设计与分析

根据CAN环形网络的特点, 为了增加基于CAN总线的环网的可靠性, 本文针对不同应用环境设计了单环双向以及双环单向两种CAN高速环网传输模型。

3.1 单环双向结构

当环形网络中, 节点数不是太多, 数据传输量不是特别大的情况下, 本文设计了单环双向的CAN环形网络模型, 如图1所示。

该传输模型采用单环双向传输的传输模型, 同时配置适合的控制策略, 当环网中任一节点或某处电缆断开时, 整个网络能够正常通信。各信号采集设备采集到的信息通过CAN总线接口发送到环网的CAN总线上, 且数据同时向两个方向传输。系统各节点采用全局广播的通信方式, 各节点在接收到CAN总线发送的数据时, 只解析数据包中的地址, 是发给自己的作进一步处理, 不是发给自己的直接丢弃, 这种通信方式简单易行。系统支持多点同时进行数据传输, 各节点从CAN总线上直接截获数据, 然后接收处理发送给自己的数据, 丢弃发给其他节点的数据, 而不用侦听等待某一节点传输完数据, 待该节点传输结束后才允许其他节点进行数据传输与通信, 提高了系统的实时性与总线利用率。

在该传输模型中, 因为单个节点是同时向两个方向将数据发送到CAN总线上的, 当该节点与监控处理设备相连的CAN总线一个方向的链路断开时, 待发送数据可以通过另一个方向到达监控节点, 避免了单条线路断开时系统瘫痪的危险, 从而提高系统的可靠性。

3.2 双环单向结构

显然, 在双向单环CAN网络中, CAN总线上传送的数据比实际需要传输的数据增加了一倍, 当环形网络中节点数量较多, 数据传输量较大的情况下, 这种网络结构就不能适应数据高速传输的需求, 可能会引起线路拥堵, 从而产生丢帧现象, 影响环网性能。为了提高此时CAN环网的可靠性, 本文设计了单环双向传输的传输模型, 同时配置适合的控制策略。

在双环单向网络中, 当某个节点要发送数据时, 同时通过两条CAN总线发送数据, 一条CAN总线只向一个方向传送数据信息, 且两条CAN总线发送方向相反。系统采用双环结构, 数据沿不同方向传输, 避免了传统CAN环网中单条线路断开时系统瘫痪的危险, 同时可以减少单环双向传输模型中因数据量大而产生的总线冲突, 同时提高系统容量和系统资源利用率。

该模型采用主从结构与多主结构相结合的控制策略, 系统中各节点地位平等, 可以实现对等通信, 同时, 监控处理设备可以收集CAN总线数据信息进行分析处理。在主从结构中加入多主结构中采用的设定节点优先级的调度策略, 当各节点发送到总线的数据发生冲突时, 优先级低的节点主动停止发送, 这种控制策略简单, 容易控制, 且兼具多主结构的灵活。同时, CAN总线组建的监控系统可对丢失的数据帧或出错数据帧进行自动重发, 在节点错误严重的情况下, 可自动切断节点与总线的联系, 确保网络可靠运行。

从以上分析可以看出, 双环单向传输模型可以保证更多节点在数据传输量较大时数据传输的可靠性, 但是因为使用了双条线路成本相对较高。当环网中挂接节点较多或者虽然节点较少, 但是每个节点传送的数据量较大时, 可以采用双环单向结构, 以较高成本换取高速网络环境下、大数据流的可靠传输。

3.3 两种结构的分析比较

从以上分析可以看出, 当系统采用双向单环结构时, CAN总线上的数据沿着两个方向同时传输, 当该节点通向与监控处理设备相连的CAN总线接口一个方向的链路断开时, 数据可以通过另一个方向到达监控节点, 避免了单条线路断开时系统瘫痪的危险, 从而提高系统的可靠性, 但是该结构只适合CAN总线环网中挂接的节点较少, 或者虽然节点比较多, 但是每个节点的数据传输量不是特别大的时候。

4. 结论

本文根据CAN高速环网的特点以及传输介质意外断开带来的严重后果提出了单环双向、双环单向两种CAN环网传输模型, 可以在不同应用中保证CAN高速环网在传输介质意外断开时数据的传输, 从而提高环网的可靠性。

摘要:在现场总线中, CAN高速环网因其诸多优势而得到广泛应用, 由此带来的环网数据传输的可靠性问题也备受关注。本文针对CAN高速环网的特点提出了单环双向、双环单向两种CAN环网传输模型, 可以在不同应用中保证CAN高速环网在传输介质意外断开时数据的传输, 从而提高环网的可靠性。

关键词:CAN总线,环网,数据传输,传输模型

参考文献

[1]贾宝柱, 任光, 王冬捷, 李国新.船舶机舱综合监控系统可靠性分析与设计.大连海事大学学报.2003, 01.

提高数据采集系统可靠性的研究 篇9

随着计算机技术、电磁兼容技术、传感器技术和信息技术的飞速发展和普及, 数据采集与处理系统越来越得到了广泛的应用。数据采集作为微机控制系统之首, 其可靠性和精确度直接影响到系统的控制性能。但由于实际的工作现场环境一般较恶劣, 存在着来自被测信号源本身、传感器、外界干扰等各种各样的噪声和干扰。为了进行准确测量和控制, 必须消除这些不利因素, 在遵守采集的基本原则的情况下, 对采集的数据进行合理的滤波, 采用零电压采集技术防止电网干扰等, 都保证了数据采集的可靠性。

1 数据采集的基本原则

为了排除来自于个方面的干扰, 采集数据在时空上应遵守下面两个基本原则:

1.1 在采集次数上应遵守多次采集的原则

微机控制系统在数据采集中往往遵守多次采集的原则, 以便采用数字滤波技术, 削弱干扰的影响。需要注意的是:数据多次采集再进行滤波处理是行之有效的方法, 但多次采集并不意味着采集的次数越多越好, 采集多少次与参数类型有关, 也和系统的功能要求有关。

1.2 在时间空间上应遵守离散采集的原则

干扰往往是在离散的时间片段中随机发生的, 干扰的时间片段从数微妙到数毫秒甚至到数秒, 因此数据采集应遵守离散采集的原则, 以便减少干扰的概率, 在遵从离散采集的大前提下, 还应遵守"同一参数离散采集, 不同参数连续采集"的原则。一般的微机控制系统要采集的参数从几个到几十个, 一个参数的一次采集时间仅需要几微妙到几十微妙, 最多不超过百微妙的数量级, 而一个离散的采集时间片段大多数是毫秒数量级, 这样采集时间片段有可能全部处于干扰中, 所以同一参数的多次采集应离散到不同的采集时间片段中, 以避免同一参数的多次采集全部是干扰值, 而不同参数则可以连续采集。这样, 离散采集同一参数、连续采集不同参数, 使得参数采集离散在时空中, 降低采集受到干扰的可能性, 产生的干扰分布到不同的参数上。

实际上, 微机控制系统一般都是实时控制系统, 其软件系统通常都是循环结构, 数据大多是采用中断方法采集或定时采集, 采集模块的运行时间在整个大循环周期中只占很小的比例, 因此离散采集是可行的。

2 采用数字滤波削弱干扰

在常见的滤波措施中, 硬件滤波只是提高实时系统数据采集质量的措施之一, 它和其他任何滤波技术一样, 很难彻底抑制各种干扰。而数字滤波则是根据预定的滤波算法编制相应的程序以达到信号滤波的目的, 由于是用程序实现滤波, 因此其稳定性高, 滤波参数修改方便。数字滤波可以对极低频的干扰信号进行有效的抑制;而且在过程控制系统中的各个不同控制回路中, 可以调用同一种滤波子程序, 使用方便, 成本低廉。因此应将数字滤波技术作为提高数据采集系统可靠性的关键技术进行分析和探讨。

经典的数字滤波方法教多, 如算术平均值法、中位值滤波法、加权平均滤波法、惯性滤波法、比较限制法等。前面几种数字滤波方法在很多文献中已有详细介绍, 本文仅对比较限制法加以说明。比较限制法适用于缓慢变化的参数。比较限制法, 即每次将当前的采集值和上次的采集值相比较, 如果当前采集值大于上次采集值, 不管大多少, 只将上次采集值加一个预设的百分数作为当前采集值, 反之则减去一个百分数。这是因为对于缓慢变化的信号变化过大或过小是不可能的, 可以认为这是干扰造成的。如果系统的首次采集值是干扰值, 在经过几次采集后就会趋于正常了。对多次采集采用比较限制法处理后, 再进行适当的数字滤波处理, 其效果是相当不错的, 对于连续的或时间教长的干扰信号尤其有效。

3 采用零电压采集技术防止电网干扰

数字滤波只是对已采集的数据进行的去除噪声干扰的一种技术处理过程。但在微机控制系统的使用现场, 直接来自于外界环境的干扰对系统的工作影响也极为严重, 如电网干扰、电源不稳定、大型电设备的频繁启动等。其中电网干扰是影响微机控制系统工作的关键因素。经过长时间的探索并反复的实践发现, 采用零电压采集技术可较好地解决电网对数据采集的干扰问题。

零电压采集属于离散采集。是需要一个如图1所示的零电压脉冲信号作为采集信号。该信号的脉冲宽度为1ms, 中心对准电压0点, 且可用示波器精确调节。由于我国的电网频率是50HZ, 这样1s内就有100个电压零点, 即每隔10ms电源电压降为0。这样可在电网电压为0时进行数据采集, 基本上排除了因电网波动对数据采集的干扰。

4 结论

要提高数据采集系统的可靠性, 必须从实际出发, 从关键问题入手, 采用相应的技术措施。数字滤波技术相对于过程控制系统中众多的抗干扰措施而言是非常简单且容易实现的一个环节, 但在实际应用中究竟选择哪一种应视具体情况而定, 必须从控制实际中、从信号特点上进行算法的选择、改进以及参数的配备。另外, 文中介绍的零电压采集技术也是根据实际存在的强外界干扰的特点, 经过反复实践而得出并具有突出的抗干扰效果的一种技术措施。因此, 只有理论和实践相结合, 才能达到完美的控制效果。

摘要:本文将数字滤波技术作为保证数据采集可靠性的关键技术进行了分析和探讨, 同时介绍了如何采用零电压采集技术防止空间电磁场干扰, 具有一定的应用价值。

关键词:数据采集,数字滤波,干扰

参考文献

[1]王幸之, 王雷等, 单片机应用系统抗干扰技术[M].北京:北京航空航天大学出版社, 2000.

[2]金孚安, 计算机控制系统中采样周期的选择, 基础自动化, 1995 (3) .

[3]金孚安, 计算机控制系统中的数字滤波[J].微机发展, 2000 (2) .

提高电力数据网运行可靠性研究 篇10

一、数据网现状及运行要求

我国电力数据网络总体结构采用分级、分层、多自治域设计。经过多年的建设与发展, 我国电力系统已经基本形成了分级电力数据网络。以省为分界点设立国家骨干网和省级数据网, 两级网络相对独立, 采用标准IP网络分层设计, 可分为核心层、骨干层和接入层。骨干网为一个自治域, 每个省网分别为各自的独立自治域。

唐山电力数据网分为综合业务数据网、调度数据网和配网数据网。综合业务数据网主要承载了视频、信息管理系统、电能计量、软交换等业务, 调度数据网可分为实时应用 (电力生产类传输数据) 和非实时应用 (管理信息类传输数据) 两大类。根据数据网运行管理规定, 要求数据网络通道月可用率AWLTD≥99.9%。为提高网络的可靠性, 避免通道中断导致的网络故障, 一个通道中断不影响整个网络的数据传输, 即电路的无关性至少应满足N-1原则。

二、提高可靠性的方法研究

通过调查唐山供电公司2012年1月份至2012年12月份的的数据网运行情况进行分析, 发生故障主要有办卡故障、光链路衰耗变大、路由配置、电源故障和环境原因。所以, 为了保证可靠性指标, 需要包含6个方面的内容:通道可靠、设备可靠、网管可靠、人员素质、管理因素、环境因素。

通道问题:过低的光功率会造成网络链路中断, 所以必须保证光纤链路的通道衰耗保持在正常值。通过使用前规范测量, 在临界处的光功率应用较大功率的光模块解决。一般要求接收到的的光功率在-10db到-17db范围, 过小的收光功率会造成链路中断。

设备因素:由于设备本身问题造成的故障, 需要预防并及时处理故障。一是加强设备性能测试通过定期对设备进行性能测试, 了解设备实时情况, 做到及时维护和更换故障板卡, 降低由于设备问题引起的可靠性指标下降。二是做好备品备件准备工作为了有效提高综合业务数据网运行可靠性, 及时处理各种突发事件。按设备类别和重要程度分批补充备品备件, 以便能及时更换故障设备。

网管系统可靠性:为便于对网络进行实时、准确的监视, 数据网一般配置有网管系统。要充分应用系统告警提示功能的使用, 以便及时发现故障。全网实施有效监管。

人员因素:加强在数据网络知识的培训, 杜绝由于人员操作问题引起的系统问题。自农网数据网建设以来, 各种业务需要农网县公司工作人员的密切配合。加强身份认证技术, 用于网络设备和远程用户的身份认证, 防止非授权使用网络资源造成的危害。

管理因素:一是保证可靠接入。一是加强对新增业务和新设备IP规划的审核新增业务和新设备增加到综合业务数据网, 严格控制其应用IP地址必须是系统内规范的IP, 杜绝由于地址冲突引发的各种问题。二是在接入过程中应用VPN技术、VLAN划分、访问控制列表、用户授权划分等技术, 保证数据的可靠接入。三是建立完善的资料机制。实行配置数据定期备份功能。对有问题的设备能够及时按配置备份数据进行数据恢复。

环境因素:温湿度、过低环境和灰尘太多会造成机房设备运行条件复杂。通过定期对设备进行巡视这一问题能够解决。

三、效果检验

通过建立以上设施, 2013年1-7月的综合业务数据网络运行情况进行分析, 故障次数为1次, 杜绝了由于人员配置和光链路问题出现的故障, 可靠性明显提高。

四、结束语

电力数据网络已经在电力系统中得到广泛应用, 承载了多种业务。要使电力数据网络可靠运行, 需要依据其组网和业务特点, 依靠技术和管理手段, 来适应电力企业信息化、数字化发展的需要。本文通过实际工作经验, 总结了提高可靠性的方法, 在系统运维中工作中起到了良好的作用。

摘要:文章根据唐山电力数据网络现状, 分析了电力数据网络的特点, 展开对电力数据网可靠性的讨论, 从多个角度分析了提高其可靠性方法。

关键词:电力,数据网,可靠性

参考文献

[1]付长宁。信号安全数据网的可靠性研究.铁路通信信号工程技术[J].2010, 7 (6) :16-20

上一篇:归类教学下一篇:普法宣传