信号波形特征提取

2024-06-17

信号波形特征提取(精选七篇)

信号波形特征提取 篇1

语言作为传播信息的工具,其最主要的表现形式是语音,语音为交际和思维提供了比文字更为便捷的方式。人类的语言起源于语音,由语音开始逐渐演变为文字,而不是先有文字后有语音。语音是由人类声带发出具有社会功能的特殊声音,语音是语言符号的载体,对信息的传递起着重要的推动作用。如果没有了语言,人们也就失去了交换思想和实施社会活动独特的功能,几千年的人类文明史将难以创造和继承。伴随着科技的发展,人们对信息的传播速度及质量要求越来越高,通过现代语音信号处理技术的研究和探索,可以让人们语音信息的产生、传输、存储、检索更有效率。信号处理的发展让计算机能听到声音,看到图片,还能说话,其中语音在未来人机交互中更具优势,也是最具发展潜力的方向[1]。本文对数字信号处理中所用的原理进行了详细的介绍,运用巴特沃斯型滤波器和切比雪夫滤波器实现了语音信号的提取和去噪滤波。运用Matlab 7.0软件编写语音信号处理的程序实现语音信号处理,包括信号的采集、傅里叶变换、倒谱、滤波等。

1 语音信号的处理设计

Matlab可以方便地实现模拟信号转换为数字信号,快捷地实现傅里叶、倒谱等计算,使设计处理语音的速度更为高效,提取语音的效果更明显易懂。语音信号处理分为三个步骤来进行:第一步是采集语音信号,对其进行傅里叶变换、倒谱;第二步是将采集到的语音通过设计好的巴特沃斯型滤波器和切比雪夫滤波器滤波。第三步根据经过滤波处理后提取到语音信号的质量对滤波器提取信息的有效性进行分析。

1.1 语音信号的提取

首先需要采集到音频信号“啊欧,你有新的消息请注意查收”,同时语音中也包含些许背景噪声,这对信息的提取和传递性产生了一定的影响,获取信号的采样频率为22 500 Hz。

采集数据并画出波形图,整段音频的时域波形高低起伏与录入的声音信号基本一致,由该语音信号波形图可以大致分析出振幅主要分布在0~1之间,声调有高有低,含有高频和低频成分,时长3 s,如图1所示。

1.2 语音信号的倒谱

倒谱分析[2],其可以采集到频谱包络信息用来表现音韵的特征参数,也可以采集到细微的结构信息。声道特性和声门特征可以通过频谱分析得到有效的参数,这些参数的获取可以通过语音来精确地分辨一个人。对语音信号进行频谱分析,可以提取到声道和声门参数,以便通过声音来区分不同的人。倒谱分析在各类信号分析中经常使用,要获取倒谱需要先取得信号的频谱,再对频谱的对数进行快速傅里叶变换,然后可得信号倒谱。

频谱图展示了采集的语音信号在不同频率上所携带的能量的状况,而倒谱是检测采样信号频谱周期性的工具。倒谱图中存在多个峰值表示主要频率成分,通过对语音倒谱的峰值提取得到的共振峰对人的声音具有较高的辨识度。

傅里叶变换:

傅里叶逆变换:

倒频谱函数:

式中:s(f)是信号s(t)的傅里叶变换。

1.3 语音信号的滤波

如图2所示,使用Matlab采集到的语音信号中含有嘈杂的噪声,这些背景噪声频率一般较高。为了进一步提取到有效的语音信息,使用各种滤波器对采集的语音进行滤波,分析利用各个滤波器提取到语音信息的质量。

1.3.1 语音信号的低通滤波

切比雪夫-I型低通滤波器中,设计截止频率为1 000 Hz,其性能指标是:ωp=0.075π,ωs=0.125π,Rp=0.25 dB,As=50 dB。然后采集到信号的图,如图3所示。

切比雪夫滤波器的振幅平方函数为:

式中:Ωc为有效通带截止频率;ε表示与通带波纹有关的参数;VN(x)是N阶切比雪夫多项式,定义为:

式中:N为偶数时,得到最小值;N为奇数,得到最大值,|Ha(jΩ)|2Ω=0=1。

1.3.2 语音信号的高通滤波

为了使采集到的语音信号通过切比雪夫-Ⅱ型数字高通滤波器,设计其性能指标为:ωp=0.6π,ωs=0.975π,Rp=0.25 dB,As=50 dB。然后采集到的信号如图4所示。

1.3.3 语音信号的带通滤波

巴特沃斯带通滤波器幅频特性模平方为:

对所有的N,H||a(jΩ)2Ω=0=1,H||a(jΩ)2Ω=Ωc=0.707,即20 lgH||a(jΩ)2Ω=Ωc=3 d B,H||a(jΩ)2随着阶次N的增大而更接近于理想低通滤波器,H||a(jΩ)2是Ω的单调下降函数。

让采集到的语音信号通过巴特沃斯带通滤波器,带通滤波性能指标为:N=5;ωc=[0.1,0.3];信号通过此滤波器后仿真图如图5所示。

1.3.4 语音信号的带阻滤波

对采集到的语音信号运用巴特沃斯数字带阻滤波器[2]进行过滤提取,结果如图6所示。

在频谱图中此次采集到的语音能量分布比较分散,其中语音也包括背景噪声。由各种数字滤波器提取得到语音信号对比可知,通过低通滤波后,提取到的语音频率更加集中分布在500~1 000 Hz范围内。由于低频分量被低通滤波器保留,高频分量被衰减,语音听起来有些发闷、低沉;但由于背景噪声被滤除,语音中包含的信息仍能被人耳分辨,提取到的语音辨识度较高。通过高通滤波后,人声频率无法达到足够高的频率,不能通过高通滤波器,所以提取到的语音信号听不到人的声音。带通滤波后,大部分语音被滤除,只有部分语音频率可被提取到,滤波后声音有点像儿童发出的声音,提取到的语音信息人耳辨别困难。带阻滤波后,在语音中只有部分频率被滤除,提取到的声音听上去比较混浊。

2 结语

本文构建了一个基本的语音信号处理系统,经过测试运行,完成了对语音信号的采集,通过FFT变换得出了语音信号的频谱图和频谱的分析,并运用滤波、倒谱等数字语音处理技术,最后再对提取到的语音信息进行效果分析和比对。设计主要是从数字滤波器入手来设计滤波器,提取了自定义频段内的语音信号,同时比较各种滤波器对语音信号的影响,为如何有效除噪提供了良好的方法。

注:本文通讯作者为卜庆凯。

摘要:语音作为一种搭载着特定的信息模拟信号,已成为人们社会生活中获取信息和传播信息的重要的手段。语音信号处理的目的就是在复杂的语音环境中提取有效的语音信息。环境干扰在语音传播过程中对信号的影响不容小觑,因此语音信号处理的抗噪声能力已经成为一个重要的研究方向。Matlab的应用有着广泛的领域,在信息处理领域其强大的数据处理能力可以将非平稳时变的语音数据转换为离散的数据,然后可对离散数据进行分析或者做进一步运算处理。它的信号处理工具箱可以迅速、有效地实现语音信号的处理和分析,Matlab是适用于信号处理领域的强大的处理工具。在此运用Matlab对一段包含有环境噪声的语音进行傅里叶变换、时域和频域分析、提取部分语音信号及分析信号的处理。

关键词:Matlab,语音信号,傅里叶变换,信号处理

参考文献

[1]张雄伟,陈量,吉斌,等.现代语音处理技术及应用[M].北京:机械工业出版社,2003.

[2]王京辉.语音信号处理技术研究论[D].济南:山东大学,2008.

[3]任明溪.基于EMD与特征规整的含噪语音特征提取方法研究[D].哈尔滨:哈尔滨工程大学,2012.

[4]王彪.基于EMD法的语音信号特征提取方法研究[D].宝鸡:宝鸡文理学院,2012.

[5]于俊凤.语音信号的识别和转换研究[D].成都:成都理工大学,2004.

[6]王彪.一种改进的语音信号特征参数提取算法研究[D].宝鸡:宝鸡文理学院,2011.

[7]俞翠华.含噪语音信号的基音提取算法的研究[D].南京:南京信息工程大学,2011.

[8]孙广.基于优化语音提取的声纹识别系统[D].西安:西安建筑科技大学,2013.

[9]肖宇锋.基于ISOMAP语音特征提取的研究与DSP实现[D].长沙:湖南大学,2013.

信号波形特征提取 篇2

局部放电是评价在线高压电器绝缘状态的重要技术参数之一。绝缘缺陷和局部放电紧密关联, 在线监测高压电器运行状态, 实时采集绝缘局部放电信号并对其进行数理分析处理和属性分类, 推断、预测绝缘缺陷部位及放电发展程度, 可以预报预防事故发生。因此, 局部放电模式识别技术的研究和理论探讨具有重要的工程应用价值和学术意义。本文在参阅大量国内外现有的局部放电模式识别文献基础上, 从局部放电产生机理出发, 设计了局部放电模型, 运用现代信号采集和数字处理技术, 构建局部放电信号采集系统, 通过DSO-2902数据采集装置将局部放电模拟信号转化为数字信号直接输入到计算机, 提取放电信号的统计特征量, 结合神经网络分类器得到较好的局部放电模式识别方法。

1 局部放电信号的采样

作为电力设备运行过程绝缘状况的评估依据, 局部放电特性对电力设备故障诊断具有重要价值[1]。因此, 可以基于局部放电信号提取放电特征, 再由良好的聚类方法对局部放电模式进行识别, 为电力系统运行中的故障预测和诊断提供重要依据。局部放电实验电路如图1所示, 当电压足够高时试样两端就开始产生局部放电。根据三电容原则, 将有一个脉冲电流通过检测阻抗。示波器 (TDS360) 提取信号, 完成抽样和信号数字化的工作。示波器通过串行端口R232把处理好的信号送到计算机中用于进一步的研究[1]。

实验中用的示波器是TDS360, 它的带宽是200MHz, 采样频率是1G。示波器带有一个八位A/D转换器。

实验中用圆筒电极来模拟产生局部放电信号。具体做法如下:圆筒电极是有两个互相同轴的圆筒组成, 内圆筒的直径是50mm, 外圆筒的直径是150mm, 本实验中内导体的局部放电信号是由在内电极的外表面上安放针尖的模型产生的局部放电而形成的, 外导体的局部放电信号是由在外电极的内表面上安放针的模型产生的局部放电而形成的。针尖的形状如图2所示。

局部放电信号的提取是在大量的噪声中提取微弱的局部放电信号。为屏蔽电磁干扰, 实验中用钢板把实验系统进行六面屏蔽起来;由于电网中电压存在脉动波形, 用一个滤波器把实验变压器和电网相隔离[2,3]。

2 局部放电信号特征值的提取

局部放电波形特征值的提取一直是局部放电模式识别中的一个重要任务。虽然人工神经网络取代了一些工作, 但是一个好局部放电波形的特征值会带来短的训练时间和高的识别率。利用统计方法提取局部放电特征能使局部放电的宏观统计性得到比较好的体现, 有利于识别任务的完成[4,5]。具体过程中, 采取循序渐进的方式提取局部放电的统计特征。通过对一个周期的局部放电信号统计计算可以得到三个基本量:n (放电次数) 、q (放电电量) 、φ (放电相位) , 对这三个量进行更为细致的分析, 将一个周期的局部放电信号等分为N个相位窗, 如图3所示, 对每个相位窗计算其n, q, φ值, 得到{ni}、{qi}、{φi}序列。

一个周期的局部放电信号包括两部分:正半周部分、负半周部分。对于同一种局部放电故障, 由于引起局部放电的主要因素 (绝缘缺陷) 相同, 故期望不同的放电信号在正半周和负半周得到相似的放电特性[6]。由此, 定义局部放电三个统计特征量为:

①放点电量不对称度Q

Q=Qs-/n-Qs+/n+ (1)

式中:

Q+s——正半周各个相位窗放电量q+i的累计和;

Q-s——负半周各个相位窗放电q-i的累计和;

n+——正半周总放电次数;

n-——负半周总放电次数。

②相位不对称度Φ

Φ=φin-φin+ (2)

式中:

φ+in——正半周起始放电相位;

φ-in——负半周起始放电相位。

③相关系数cc

cc=q¯i+q¯j--q¯i+q¯j-/Ν ( (q¯i+) 2- (q¯j+) 2/Ν) ( (q¯i-) 2- (q¯j-) 2/Ν) (3)

式中:

q¯i+——正半周第i个相位窗的平均放电量;

q¯j-——负半周第j个相位窗的平均放电量;

N′——半周相位窗个数。

在对数据处理时, 为了增加数据的收敛性, 把每组数据进行归一化处理。以下是得到的局部放电统计特征图形, 如图4所示。

3 结束语

如图5所示, 选取特征向量后, 以神经网络作为识别工具, 得到以下的网络误差和学习步长与训练次数变化关系, 应用统计特征可以降低误差和提高网络的识别率[7]。

摘要:模式识别中, 特征是决定相似性与分类的关键。对于局部放电模式识别, 如何找到合适的局部放电特征量成为认知与识别的核心问题。在参阅大量国内外现有的局部放电模式识别文献基础上, 依据局部放电产生机理, 设计了电极模型。通过对放电信号进行统计特征提取, 为电力系统运行中的故障预测和诊断提供重要依据。

关键词:局部放电,模式识别,特征提取

参考文献

[1]邱昌容, 曹晓珑.电气绝缘测试技术[M].3版.机械工业出版社, 2004:123-132.

[2]Seow Ming-Jung, Asari Vijayan K.Learning using distance based trai-ning algorithm for pattern recognition[J].pattern Recognition Letters, 2004, 25 (2) :189-196.

[3]模式识别——原理、方法及应用[M].吴逸飞, 译.清华大学出版社, 2003:55-66.

[4]Sergios Theodoridis, Konstantinos Koutroumbas.Pattern Recognition[M].2nd ed.Publishing House of Electronics Industry, 2004:1-5.

[5]Birsen Yazici.Statistical pattern Analysis of partial discharge Measure-ments for Quality Assessment of Insulation Systems in High-VoltageElectrical Machinery[J].IEEE Transactions on Industry Applications, 2004, 40 (6) :1579-1594.

[6]Huang M C.Wave parameters and functions in wavelet analysis[J].Ocean Engineering, 2004, 31 (1) :111-125.

信号波形特征提取 篇3

脉冲涡流检测方法是近几十年发展起来的一种新型无损检测技术[1,2,3]。传统的电涡流检测将正弦电流作为激励,而脉冲涡流的激励电流为具有一定占空比的方波,因此,具有频域宽、信号穿透能力强、精确度高以及无接触、检测成本低、对人身无害、对环境无污染及检测效率高等优点,可准确测量出距离和厚度[4]。脉冲涡流厚度检测的关键工作是脉冲涡流信号特征的提取。脉冲涡流检测技术作为一种时域分析方法,包含有丰富的频谱信息。在脉冲涡流缺陷检测中,常采用峰值、峰值时间、上升时间三个特征量对缺陷进行定量检测与分类识别[5,6,7]。文献[8,9]采用脉冲涡流时域信号峰值、过零时间、上升时间等特征量实现了对缺陷的定量检测与分类识别,并在频域里对脉冲涡流信号展开了研究,主要研究对象为缺陷的分类识别。文献[10]对脉冲涡流缺陷信号进行了频域特征提取,研究了各次谐波分量的频谱幅值,提出基频分量的频谱幅值能够有效检测深层缺陷的结论。Park等[11]提出了功率谱幅度特征量,并证实了该特征量在厚度检测的可行性。本文的主要工作是采用脉冲涡流检测装置在铝合金板上进行厚度实验,针对目前脉冲涡流信号所提取的信号特征进行了灵敏度与线性度分析,给出了最合适的特征值。

1 脉冲涡流厚度检测装置

1.1 脉冲涡流厚度检测原理

脉冲涡流将一个重复的脉冲信号作为激励信号。该激励信号经过功率放大后加载在激励线圈两端,激励线圈就会产生脉冲电流。激励线圈中的脉冲电流感生出一个快速衰减的脉冲磁场,变化的磁场在导体试件中感应出瞬时涡流(脉冲涡流)。此脉冲涡流向导体试件内部传播,又会感应出一个快速衰减的涡流磁场,随着涡流磁场的衰减,检测线圈上就会感应出随时间变化的电压。当被测试件内部结构发生改变时,该变化势必对涡流分布产生影响,从而影响到磁场分布,检测线圈或霍尔传感器就会检测到感应出的电压信号。该电压信号包含很重要的材质信息。所以通过测量瞬态电压信号,就可以得到有关试件的厚度、尺寸、类型和结构参数等信息。

1.2 试验装置

脉冲涡流厚度检测系统如图1所示,该系统由探头(激励线圈和检测传感器)、TRECSCAN系统以及数据采集卡组成。激励信号由MATLAB产生并通过数据采集卡NI PCI-6255转换成模拟电压输出信号。电压输出信号经过TRECSCAN系统输出激励电流,激励信号的复频率为200Hz,占空比为50%,时间常数为100μs。TRECSAN系统的输出激励电流两端与激励线圈两端相接。激励线圈采用圆柱形磁芯。脉冲涡流探头内径为10mm,外径为20mm,由线径0.31mm的漆包线绕制而成(共绕了500匝)。检测传感器采用霍尔传感器UGN3503,霍尔传感器位于激励线圈的底部中心,用来对受缺损扰动而产生的脉冲磁场的垂直分量进行检测。霍尔传感器信号经过TRECSACN系统放大,并被数据采集卡采集,数据采集卡采样频率设置为500kHz。实验将阶梯状铝合金作为试块材料,试验试块厚度为10mm,长度为400mm,宽度为30mm,如图2所示。

2 实验数据处理与分析

2.1 时域信号特征提取

脉冲涡流信号分析主要在时域中进行。在脉冲涡流缺陷检测中,通常采用脉冲涡流差分信号进行信号特征的提取。脉冲涡流差分信号为有缺陷的脉冲涡流响应信号与无缺陷的脉冲涡流响应信号的差值。所提取的特征主要为脉冲涡流差分信号的峰值、峰值时间等。在脉冲涡流厚度检测实验中,试验数据信号采用脉冲涡流厚度检测响应信号,数据处理工作主要是对该脉冲涡流厚度响应信号进行特征提取,图3所示为1mm厚的铝合金脉冲涡流响应信号。图4所示为本文所提取的峰值特征结果。从图4可以看出,脉冲涡流信号峰值特征随着铝合金厚度的增加而减小。根据脉冲涡流检测原理可得

Jeddy(z)=J0exp(-z/2ωσμ)(1)

式中, Jeddy(z)为距离试件表面z处的涡流密度;z为涡流渗透深度;J0为试件表面的涡流密度;ω为激励角频率,ω=2πf;f为激励脉冲信号的重复频率;σ为被测导体电导率;μ为被测导体磁导率。

由式(1)可知,被测导体中感应的涡流密度随着金属厚度的加大而呈指数下降。霍尔传感器所测量的磁场由激励线圈产生磁场与涡流产生磁场组成。因此,脉冲涡流响应信号的峰值特征随着金属厚度的增加而减小。然而,在脉冲涡流检测金属厚度为2mm处,时域噪声影响了检测结果。

2.2 频域特征提取

脉冲涡流将一个重复的宽带脉冲作为激励信号,根据傅里叶级数展开公式,一个脉冲信号可以展开成含有基波和许多谐波成分的组合:

f(t)=4Aπn=11nsin(nω0t)(2)

n=1,3,5,…

式中,A、ω0、t分别为激励脉冲信号的幅值、角频率和时间。

根据式(1)、式(2)可知,激励信号中的不同频率成分引起的涡流渗透深度不同。笔者对脉冲涡流缺陷信号进行了频域特征提取技术的研究,研究了各个谐波分量的频谱幅值,提出脉冲涡流差分信号基频分量的频谱幅值能够有效检测深层缺陷的结论。本文采用快速傅里叶变换对脉冲涡流响应信号进行分析。图5所示为1mm厚度的脉冲涡流响应信号的快速傅里叶变换,从图5以看出,脉冲涡流响应信号的频谱信号非常丰富。根据以前研究结果[10],基频分量的频谱幅值能够有效检测深层缺陷,为此,本文提取了基频分量的频谱幅值。从图6可以看出,基频分量的频谱幅值随着金属厚度的增加而减小,当金属厚度增加到9mm时,基频分量的频谱幅值近似保持常值,这与涡流渗透原理相一致。比较图4与图6可知,基频分量的频谱幅值与时域峰值均显示出随着金属厚度的增加而减小的趋势。然而,基频分量的频谱幅值能够有效消除噪声信号的影响。

2.3 功率谱幅值特征提取

文献[12]通过对激励脉冲的频谱分析,解释了激励脉冲在不同频段的能量分布,并通过实验证实激励脉冲的能量与脉冲涡流的渗透深度密切相关。功率谱幅值作为一种新型脉冲涡流信号提取方法,不同于以上时域峰值与频谱幅值在脉冲涡流厚度检测中应用,可以提高脉冲涡流厚度检测的可靠性。Park等[11]提出了功率谱幅值特征量,指出脉冲涡流信号能量与金属厚度相关,并证实该特征量在厚度检测的可行性。本文采用该方法提取了脉冲涡流响应信号的功率谱幅值并将其作为特征值。从图7可以看出,功率谱幅值随着金属厚度的增加而减小,其变化趋势与基频分量的频谱幅值相同,功率谱幅值也能有效消除噪声信号的影响。

2.4 特征值归一化分析

为了进一步分析与比较上述特征值对金属厚度变化的灵敏度与线性度,选择最合适的脉冲涡流厚度响应信号的特征值。本文对提取的3个特征值(脉冲涡流厚度响应信号的峰值、基频分量的幅值、功率谱幅值)进行了归一化处理。从图8可以看出,功率谱幅值在3个特征值中对厚度变化的灵敏度最高,其次是频谱幅值。从特征值与金属厚度的线性度上分析,可以看出功率谱幅值在金属厚度为1mm到7mm时线性度良好。功率谱幅值比频谱幅值灵敏度高,这是因为功率谱幅值与频谱幅值满足如下关系:

Sf(ω)=|F(ω)|2/N (3)

式中,Sf(ω)、F(ω)、N分别为脉冲涡流响应信号的功率谱幅值、频谱幅值和采样点数。

根据式(3)可以得出,功率谱幅值与频谱幅值都能表示脉冲涡流响应信号的频率结构。然而,脉冲涡流响应信号的功率谱幅值为脉冲涡流响应信号频谱幅值的平方,有利于突出脉冲涡流响应信号的高幅值成分。因此,功率谱幅值在脉冲涡流金属厚度检测中最有效。

3 结论

(1)脉冲涡流厚度响应信号的峰值、基频分量的幅值、功率谱幅值均随着金属厚度的增加而减小,但时域峰值易受噪声影响。

(2)比较脉冲涡流厚度响应信号的峰值、基频分量的幅值、功率谱幅值的灵敏度与线性度可知,功率谱幅值在脉冲涡流厚度检测中灵敏度最高,在金属厚度为1mm到7mm线性度良好。

摘要:介绍了脉冲涡流厚度检测信号及其特征提取的研究现状。采用脉冲涡流检测装置在铝合金板上进行了厚度实验,并对脉冲涡流厚度检测响应信号进行了特征提取,分析了其灵敏度与线性度,给出了最合适的特征值。

关键词:脉冲涡流,厚度测量,特征提取,功率谱

参考文献

[1]杨宾峰,张辉,赵玉峰,等.基于新型脉冲涡流传感器的裂纹定量检测技术[J].空军工程大学学报,2011,12(1):73-77.

[2]郑岗,赵亮.金属厚度的脉冲涡流无损检测研究.[J].传感器与微系统,2006,25(4):35-40.

[3]Sophian Ali,Tian Guiyun,Taylor D,et al.A Fea-ture Extraction Technique Based on Principal Com-ponent Analysis for Pulsed Eddy Current NDT[J].NDT&E International,2003,36(1):37-41.

[4]Tian G Y,Sophian A,Taylor D,et al.Multiple Sen-sors on Pulsed Eddy-current Detection for3-D Subsurface Crack Assessment[J].Sensors Journal,2005,5(1):90-96.

[5]Lebrun B,Jayet Y,Baboux J C.Pulsed Eddy Current Application to the Detection of Deep Cracks[J].Mate-rials Evaluation,1995,53(11):1296-1300.

[6]Bieber J A,Shaligram S K,Rose J H,et al.Time-gating of Pulsed Eddy Current Signals for Defect Characterization and Discrimination in Aircraft Lap-joints[J].Review of Progress in QNDE,1997,16B:1915-1921.

[7]Smith R A,Hugo G R.Deep Corrosion and Crack Detection in Aging Aircraft Using Transient Eddy Current NDE[J].Review of Progress in QNDE,1999,19:1401-1408.

[8]杨宾峰,罗飞路,张玉华,等.飞机多层结构中裂纹的定量检测及分类识别[J].机械工程学报,2006,42(2):63-67.

[9]He Yunze,Pan Mengchun,Luo Feilu,et al.Pulsed Eddy Current Imaging and Frequency Spectrum Analysis for Hidden Defect Nondestructive Testing and Evaluation[J].NDT&E International,2011,44(4):344-352.

[10]周德强,田贵云,尤丽华,等.基于频谱分析的脉冲涡流缺陷检测研究[J].仪器仪表学报,2011,32(9):1948-1953.

[11]Park D G,Angani C S,Kim G D.Evaluation of Pulsed Eddy Current Response and Detection of the Thickness Variation in the Stainless Steel[J].IEEE Transactions on Magnetics,2009,45(10):3893-3896.

信号波形特征提取 篇4

关键词:脑机接口,脑电信号,小波包分析,支持向量机

1 引言

脑机接口(brain-computer interface,BCI)是一种不依赖于人脑的正常输出通路(即外周神经和肌肉),就可以实现人脑与外界(计算机或其他外部装置)通讯的系统。脑机接口的出现使得用人脑信号直接控制外部设备成为可能。对于一些脊髓或外周神经受损而中枢神经系统完好的残疾人可以通过BCI系统利用自己的运动想象实现与外界的直接交流(例如环境控制、轮椅控制、操作计算机等)[1,2]。

正常人的脑电波随人的意识水平呈现不同的节律活动,这些节律受不同的活动和思维影响,其波形很不规则,频率变化范围主要在1~30 Hz。Mu节律(8~12 Hz)产生于人脑的感觉运动皮层,和肢体运动有密切关系,而Mu节律又通常与14~26 Hz的beta节律相关[3]。肢体的真实运动或想象运动中伴随着由大脑运动皮层Mu/Beta节律的事件相关去同步化(event related desynchronization,ERD)和事件相关同步化(even related synchronization,ERS)引起的脑电能量变化[4]。利用Mu/beta节律的能量幅值变化规律对想象左右手运动信号分类,将C3、C4通道4~7 s时间段的信号幅度的平方差作为分类特征值,同时与支持向量机(SVM)相结合,进行运动想象脑电数据的分类,取得了较好的效果。

2 实验数据

实验数据来自“BCI Competition 2003”竞赛数据data seⅢ,采自位于C3、Cz、C4等3个电极的双导联方式记录的脑电信号,采样频率为128 Hz。有想象左手运动和想象右手运动2个类别。每次实验持续时间为9 s,所有实验数据由想象左、右手运动任务各70次的已知类别的训练样本和各70次的未知类别的测试样本组成。实验过程详见文献[5]。

3 EEG信号特征提取及分类

3.1 脑电信号预处理

脑电数据是采自于C3、Cz、C4等3个电极的双导联方式记录的信号,其中C3、C4电极位于大脑的初级感觉运动皮层运动功能区,最能反映受试者在想象左右手运动时大脑状态的变化[5],因此选择C3、C4通道的脑电信号进行想象左右手运动的分类,Cz作为参考电极。

和肢体运动有密切关系的Mu节律(8~12 Hz)产生于人脑的感觉运动皮层,通常Mu节律又与14~26 Hz的beta节律相关。据此对原始EEG数据进行8~28 Hz的数字带通滤波。采用椭圆数字滤波器,通带截止频率为8~28 Hz,阻带截止频率为5 Hz和30 Hz。

3.1.1 信号的频域分析

基于AR模型的功率谱估计是现代谱估计中最常用的一种方法。本文选用Burg算法对滤波后的EEG信号进行AR模型谱估计,其中模型的阶次选取为10。图1为想象左、右手运动实验基于Burg算法的AR模型谱估计图。如图所示,在8~12 Hz频带左右想象左右手运动对应的ERD/ERS现象清晰可见,在大约18~22 Hz左右也显示了想象左右手运动对应的ERD/ERS。因此,对想象左右手运动的脑电信号采用Mu节律和18~22 Hz的beta节律作为分类的频率段。

3.1.2 信号的时域分析

由相关生理知识可知,大脑两侧发生ERD/ERS是对称的,在想象左右手运动过程中,当大脑一侧运动感觉皮层出现ERD,则另一侧同时出现ERS,即两侧信号的能量会出现明显差异[6]。

根据能量的时域计算公式得第q点的能量为:

由实验数据的描述可知,在0~3 s受试者做放松准备工作,3~9 s做想象运动。由图2可得,想象左手运动时C3、C4两通道信号能量在4~6.5 s时间段差别较大,ERD/ERS现象比较明显;想象右手运动时C3、C4两通道信号能量在4~7 s时间段差别较大,ERD/ERS现象比较明显。

3.2 脑电信号特征提取

小波包分析方法是多分辨率小波分析的推广,它能为信号提供更精细的分析方法,将频带进行多层次划分[7]。

通过对信号的频域分析,在8~12 Hz、18~22 Hz的2个频带想象左右手运动对应的ERD/ERS现象较明显。选用Daubechies类db4小波对脑电信号进行2级小波包分解,对应的频带依次为8~13、13~18、18~23、23~28 Hz,分别重构第1、3个频带后叠加即可提取所对应的ERD/ERS现象较明显节律信号。分别对C3、C4通道重构的脑电信号选取其4~7 s内的信号求取其能量,C3、C4通道信号的能量差即为想象左右手运动分类的特征值。

3.3 分类器的选择

支持向量机是Vapnik等人提出的一类新型机器学习方法,它能够非常成功地处理分类和回归问题,在很大程度上解决模型选择与过学习问题、非线性和维数灾难等问题。

支持向量机通过使用非线性映射(核函数)将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,并基于结构风险最小化理论在特征空间中建构最优分割超平面[8]。

对线性可分训练样本:

其中,xi表示特征向量;y∈{-1,1}是类别标号。寻找最优分类面使2类样本正确分开且分类间隔最大,需满足约束条件[9]:

其中,w为分类面的投影向量;b为分类阈值。此时,分类函数为:

对于非线性问题,只需在最优分类超平面中采用适当的核函数,就可以实现某一非线性变换后的线性分类,将问题从原空间变换到一个高维的特征空间,此时相应的判别函数式也应变为:

其中,n为支持向量的个数;αi为拉格朗日乘子;K xiΣ·x≤为核函数。径向基核函数是SVM中常用的核函数,具有参数少、模型复杂度低等特点,有利于训练时参数的确定[10]。

针对想象左右手运动脑电信号的非线性的特点,选择径向基函数作为SVM的核函数实现对提取的测试集脑电信号特征值分类,在4~7 s时间范围内,分类正确率为87.14%,达到了BCI竞赛的水平(BCI竞赛中对此数据处理所得正确率的排名为:第1名89.29%,第2名84.29%)。

线性分类器的目的就是从高维特征空间里提取出最具有判别能力的低维特征,这些特征能帮助将同一个类别的所有样本聚集在一起,不同类别的样本尽量分开,即选择使得样本类间离散度和类内离散度的比值最大的特征。使用同样的特征值结合线性分类器分类,最佳分类正确率为83.57%。

通过比较2类分类器的分类结果可知,较好解决过学习、非线性等问题的支持向量机对处理脑电信号这类非线性信号具有更佳的效果。

表1为选取不同时域范围和不同分类器情况下测试集分类正确率的结果。

4 结束语

通过对滤波后的脑电信号进行时、频域的分析,分析出实验中运动想象脑电信号的ERD/ERS的生理特性的最佳时间和频率段。采用小波包分析法得到最佳节律,以C3、C4通道最佳节律能量差为分类特征值。采用LDA得到最佳分类效果为83.57%,SVM进行分类的准确率为87.14%,因此SVM更适合本实验的想象左右手运动的脑电信号分类。

本研究中的实验受试对象为健康人,因而,上述结果存在一定偏差。下一步将会针对真正的运动障碍患者(思维正常)的BCI问题进行深入研究,同时对基于Mu/beta节律的脑机接口系统对其他类型的脑电信号的分类研究的适用性、BCI在康复工程领域的应用与发展做进一步研究。

参考文献

[1]Virts J.The third international meeting on brain-computer interfacetechnology:making a difference[J].IEEE Trans Neural Syst RehabilEng,2006,14(2):126-127.

[2]高上凯.浅谈脑-机接口的发展现状与挑战[J].中国生物医学工程学报,2007,26(6):801-803.

[3]Pfurtscheller G,Da Silva Lopes F H.Event-related EEG/MEG synchronization and desynchronization:basic priciples[J].ClinicalNeurophysiology,1999,110(11):1 842-1 857.

[4]Birbaumer N.Breaking the silence:Brain-Computer interfaces(BCI)for communication and motor control[J].Psychophysiology,2006,43:517-532.

[5]赵慧.基于左右手运动想象的脑机接口研究[D].广州:华南理工大学,2007.

[6]Naeem M,Brunner C,Leeb R,et al.Seperability of four-class motorimagery data using independent components analysis[J].J NeuralEng,2006,3:208-216.

[7]周伟,桂林,周林,等.Matlab小波分析高级技术[M].西安:西安电子科技大学出版社,2006.

[8]Pfurstcheller G,Muller-Putz G R,Schlogl A,et al.15 years of BCIresearch at Graz university of technology:current projects[J].IEEETrans Neural Syst Rehabil Eng,2006,14(2):205-210.

[9]Penny W D,Roberts S J,Curran E A,et al.EEG-Based Communication:A Pattern Recongintion Approach[J].IEEE Trans Rehab Eng,2000,8:214-215.

信号波形特征提取 篇5

滚动轴承故障诊断主要包括轴承振动信号的特征提取和对提取的特征进行状态识别两个部分。其中, 特征提取是故障诊断的首要前提。机械设备的整体性和联动性, 使得检测到的轴承振动信号成分复杂。传统的时频特征提取方法, 如Fourier变化、时域分析[1]、小波变换[2]、经验模态分解[3,4] (empirical modle decomposition, EMD) 、Wigner-Ville分布等方法均可用于轴承故障诊断中的特征提取, 但这些方法均没有考虑轴承振动信号的稀疏性。采用压缩感知稀疏逼近取代原始数据表示可以从实质上提高系统运行速度, 降低信号处理应用的成本[5]。根据信号特点对振动信号自适应地进行特征提取, 成为目前研究的难点问题。

超完备库下的信号稀疏表示方法由Mallat等[6]于1993年首次提出, 并引入了匹配追踪 (matching pursuit, MP) 算法, 它是一种具有较强自适应性的稀疏表示方法, 可根据信号特点使用特定的时频字典对信号进行稀疏分解, 其中过完备冗余字典库的建立是信号稀疏分解的关键。近年来, 基于压缩感知稀疏表示的机械振动故障特征提取方法得到重视。文献[7]采用压缩感知匹配追踪方法对轴承振动信号进行稀疏逼近, 并对稀疏逼近后的信号时频图进行特征提取从而诊断轴承故障。文献[8]基于机械冲击故障特征构造了时频原子库, 从而提出一种基于冲击时频原子的匹配追踪故障特征信号的特征提取方法, 仿真结果表明采用冲击基元函数原子库比传统的小波基元函数更能反映信号的冲击特征, 但是整体算法的匹配精度不高, 提取有效特征的速度较慢。文献[9]在选择描述机械系统振动冲击响应作为MP的时频原子的基础上, 利用混合粒子群算法来实现匹配追踪算法中最优原子的搜索, 该方法可以更加快速准确地提取信号特征信息, 但是计算较复杂, 处理成本较高。文献[10]提出一种基于信号特征的复合字典多原子匹配算法, 利用遗传算法对符合信号特征的最优原子进行搜索, 缺点是需要人为设定特征原子库的加权系数, 不能自适应提取故障信号的复合特征, 且重构阶段采用传统的阈值降噪方法。上述特征提取方法都存在匹配精度不高, 计算成本高的不足。

综上所述, 本文综合轴承内圈、外圈以及滚动体故障信号特征结构特点, 构建了由傅里叶字典和冲击时频字典相结合的联合字典。将改进的简化粒子群算法引入到寻找最优原子的过程中, 利用改进粒子群算法快速准确地找到冗余原子库中与信号特性最匹配的原子。在信号重构阶段, 则提出一种改进的阈值降噪策略, 进一步提高对实际仿真信号的逼近程度。从而得到一种基于压缩感知弱匹配追踪算法的滚动轴承特征提取方法, 并对滚动轴承故障测试信号和某工厂实测信号进行了仿真验证。

1 压缩感知弱匹配追踪算法 (Weak-MP)

1.1 压缩感知匹配追踪

设研究的信号为f, 长度为N, 过完备冗余原子库集合D={gγ}, γ∈Γ, Γ为过完备原子库, gγ为由参数组γ定义的原子。算法简要过程如下:

计算信号f与过完备原子库中原子gγ的内积〈f, gγ〉, 选择绝对值最大的一个原子, 即从过完备库中选出与待分解信号最为匹配的原子gγ0, 其满足以下条件:

信号分解为在gγ0上的分量和残余两部分, 即

对最佳匹配后的残余R (1) f不断进行同样的分解:

由于MP算法的逼近误差按指数级衰减, 一般而论, 用M个原子就可以表示信号的主要成分, 即

1.2 Weak-MP算法

由于利用MP算法匹配信号, 即使信号长度很有限, 过完备原子库也是巨大的, 因此, 如果信号长度很长, 则式 (1) 代表的最优解问题往往转化为以下的次优解问题:

对MP算法进行以上改进后就得到了Weak-MP算法, 其中α是一个最优性因子。因此该次优解问题可以考虑利用智能优化算法来求解, 从而降低算法的复杂度, 进而降低稀疏分解的成本。

2 改进的压缩感知弱匹配追踪算法

2.1 联合字典的构造

寻找匹配轴承故障信号的最优原子, 关键是准确地匹配信号中含有的故障特征, 为了获得高信噪比的轴承故障冲击脉冲信号, 我们需要最大化地匹配出冲击产生的所有特征信号, 同时剔除其他的干扰信号。研究发现实际轴承故障信号主要是由瞬时冲击信号和周期正弦信号组成的复合特征信号。傅里叶字典基元函数是随时间周期性波动的正弦函数, 可以很好地匹配信号中含有的周期性正弦波信号特征;而冲击时频字典基元函数的特点是包含负指数函数, 因此可以有效地用于分解含有冲击成分的轴承故障振动信号。

文献[10]通过人为设定特征原子库的加权系数, 构造了由傅里叶字典和冲击时频字典线性组合而成的复合字典, 但若设定的系数与实际信号特征结构不相符, 则会对匹配结果的准确性造成严重影响。本文提出将傅里叶字典与冲击时频字典组成联合字典, 其基元函数如下:

式中, p为冲击响应的阻尼衰减特性;u为冲击响应的发生时刻;f0为系统频率参数;θ为系统相位参数;K为归一化系数。

联合字典基函数无论在时域或频域都有良好的局部性:当p=0时, 该函数自动退化为正弦波函数, 用于提取信号固有周期信号特性;当p≠0时, 该基函数组成的字典可用于提取信号的瞬时冲击特性。与文献[10]相比, 联合字典基函数不仅可以较好地匹配滚动轴承故障信息, 且不需要人为设定加权系数。

2.2 基于改进的简化粒子群算法的最优原子搜索

在最优原子搜索过程中, 结合粒子群算法的全局寻优特性, 本文提出了一种改进的简化粒子群算法。

文献[11]证明了粒子群进化过程与速度无关, 提出了去速度项的简化粒子群算法, 避免了人为设定的粒子速度对粒子的收敛速度和精度产生影响。粒子更新公式为

式中, ω为惯性权重;c1、c2为学习因子, 为非负常数, 通常取c1=c2=2;r1、r2为服从U (0, 1) 分布的随机数;pbest为个体最优位置;gbest为整个粒子群的最优位置。

本文提出的简化粒子群算法的改进主要包括以下两方面:

(1) 用所有粒子个体最好位置的平均值pavgbest代替原来的pbest, 以充分利用所有粒子的个体位置所包含的状态信息, 其中

其中, m为种群粒子数, 从而得到去速度项的“位置”更新公式为

(2) 对惯性权重因子ω、个体最优值平均值pavgbest和全局最优值gbest进行自适应校正。为了避免种群粒子陷入局部极值, 采用平均粒距[12]Dt为触发条件, 平均粒距公式为

其中, D′为粒子位置的维数, L为搜索空间最大对角线中长度, pid为第i个粒子第d维坐标, pdavg为所有粒子第d维均值。设定校正因子R和R′为

式中, F (pbest (i) ) 是第i个粒子个体极值所对应的适应度函数值;F (gbest) 是每一次迭代中, 当前信号或信号残差与找到的全局最优原子的内积的绝对值;δ为平均粒距阈值;sigmoid (x) 为一种函数值范围为0~1的非线性双弯曲函数, 由于本文中x的值为正, 由sigmoid函数特性可知, 上述R中的sigmoid函数取值范围为0.5~1。

综上, 得到改进后带有校正因子的粒子状态更新公式为

将式 (6) 中的参数 (p, u, f, θ) 分别作为本文改进简化粒子群优化匹配追踪算法搜索空间中的一维, 整个搜索空间为以上参数代表的4维空间。这样就不用产生整个过完备字典, 而只产生形成原子的参数向量, 进一步减少了所需的内存占有量。并且上述4维参数搜索空间的字典信息量比原字典更大, 搜索得到的原子更能体现信号的结构特点。最终得到改进的弱匹配追踪稀疏分解算法步骤如下:

(1) 参数组 (p, u, f, θ) 作为待寻优的一个4维粒子, 粒子位置及其速度与待分解的信号长度有关, 采用实数编码。将信号或信号残差与原子内积的绝对值|〈R (k) f, gγk〉|作为适应度函数。

(2) 设定种群数为m, 最大迭代次数为n, 执行自适应校正的平均粒距阈值δ=0.001, 设定粒子xid的位置搜索范围为[xd, min, xd, max], 初始位置为 (xi1 (t) , xi2 (t) , …, xid (t) ) ;设每个粒子的初始值为pid, 种群中最好的粒子对应为gbest, 分别对应的个体适应度函数值F (pid) , 种群所有个体的最优适应度函数值为F (gbest) 。

(3) 自适应校正触发条件判定。计算种群粒子间平均粒距Dt, 校正因子R、R′按式 (11) 、式 (12) 进行更新。

(4) 粒子位置更新。利用步骤 (3) 结果, 根据式 (13) 更新粒子的位置。并判断粒子的位置是否在冗余字典中各个参数允许的范围内, 如不满足, 则遵循反射边界法准则:

(5) 个体和全局极值更新。分别计算每个更新粒子的适应度值, 若优于pi best, 则pi best被当前位置替换;从所有的pi best中选择最优粒子, 若优于gbest, 则替换gbest。

(6) 若达到最大迭代次数, 则终止迭代, 输出gbest和相应的原子参数;否则转向步骤 (3) 。

3 信号重构

利用上述弱匹配追踪稀疏分解算法对轴承故障信号进行t′次迭代后, 信号被稀疏分解为

式中, ak为信号投影系数, ak=〈R (k) f, gγk〉。

重构算法是稀疏分解算法的逆过程, 重构公式为

通常情况下, 还需对上述重构信号进行消噪处理。传统的硬阈值降噪和软阈值降噪方法在信号的连续性和重构信号逼近真实信号程度方面都有各自的不足:软阈值算法虽然处理的特征系数整体连续, 光滑性也好, 可是对于大于阈值的特征系数恒定压缩, 会失去一些有用的高频信息, 影响重构信号的精度;硬阈值算法可以避免软阈值的恒定偏差, 然而由于小波系数在±T处是不连续的, 给重构信号带来一些附加振荡, 使重构信号的光滑性变差。文献[13]提出的阈值降噪处理函数, 虽然解决了软阈值函数存在恒定偏差的不足, 但是仍没有解决硬阈值函数在-T处的连续性问题, 且存在不必要的参数。本文对其进行改进和简化, 表达式如下:

其中, 阈值, σ为匹配系数的标准差, M′为迭代次数。当|ak|=T时, , 当|ak|无限趋近于T时, 也无限趋近于0, 从而完全克服了硬阈值函数在±T处不连续的缺陷。随着|ak|的增大与减小, 也相应地增大与减小, 当|ak|趋近于无穷时, 趋近于ak, 从而弥补了软阈值函数存在恒定偏差的不足。改进的阈值函数处理重构信号后的计算公式为

4 仿真研究

选取CWRU (Case Western Reserve University) 轴承数据中心所提供的标准轴承故障信号进行仿真实验, 轴承型号为SKF6205, 其转速为1772r/min, 采样频率为12kHz。设定本文自适应简化粒子群算法搜索空间 (p, u, f, θ) 的最小值为 (0, 0, 0, 0) , 最大值为 (100, 100, 50, 50) ;学习因子c1=c2=2, 惯性权重ω=0.729, 种群数m=50;原始粒子群和混合粒子算法中粒子速度最大值范围为 (15, 10, 5, 5) , 其他参数同上;遗传算法参数设置参考文献[8];本次实验仿真的原始信号取标准轴承故障信号组中的1024维数据。

利用本文算法分别对轴承内圈、外圈和滚动体故障信号进行了信号匹配追踪稀疏分解和重构。并通过小波包特征分析方法分别提取了原始信号和重构信号的8维故障特征向量。具体仿真结果如图1~图3所示。

从仿真结果对比可以看出, 本文方法可以很好地重构出轴承内圈、外圈以及滚动体3种振动信号特征信息, 并且通过小波包提取的原始信号与重构信号中的8维故障特征仿真图结果对比可以看出, 本文的稀疏分解与重构方法可以很好地保留原振动信号的特征信息。

为了进一步验证本文稀疏分解算法具有比传统的MP算法、GA-MP算法以及Hybrid-PSO-MP算法更优越的性能。以原始故障信号特征向量与重建信号特征向量之间的均方误差值eMS来衡量上述各种算法在匹配故障信号关键特征上的精度。eMS计算公式如下:

式中, j为特征提取向量维数, 本文取j=8;为故障重构信号j维特征向量第m个元素;v (m) 为故障原始信号j维特征向量第m个元素。

分别计算内圈、外圈、滚动体的eMS, 具体结果如表1所示。表2对各算法的平均运行速度进行了比较, 由于计算机硬件及仿真软件版本之间有差异, 因此利用相对速度值对各算法进行比较, 即将经典MP算法的运行速度设为1, 作为基准, 其他算法分别与经典MP算法进行对比, 值越大表明算法的运行速度越快。

由表1、表2可见, 利用本文改进的弱匹配追踪算法可以很好地提取出各滚动轴承故障信号特征, 提取精度与穷举全局搜索的MP算法的结果接近, 且本文算法在运行速度上比MP算法有了大幅提高。与其他改进的MP算法相比, 本文算法无论从精度上还是速度上都有较大优势, 同时新算法计算量也要更小, 对系统内存的要求也降低很多, 实用性更强。

在利用本文提出的改进弱匹配追踪算法对原始信号进行稀疏分解的基础上, 为了验证本文提出的阈值降噪方法的优越性, 分别与传统硬阈值处理方法、软阈值处理方法以及文献[13]中的阈值降噪方法进行仿真对比, 分析各种降噪处理方法对重构信号关键特征的影响。选择能够有效反映提取信号关键特征效果的时域特征参数———方均根值、峭度指标和脉冲指标, 作为上述各种降噪算法进行对比的指标参数。3个指标的数值越大, 说明信号的故障特征信息越明显。分别计算原始信号 (S1) 各指标参数值、硬阈值降噪处理重构信号 (S2) 指标参数值、软阈值降噪处理的重构信号 (S3) 指标参数值、文献[13]中的阈值降噪方法处理的重构信号 (S4) 指标参数值以及本文的改进阈值降噪处理的重构信号 (S5) 指标参数值。得到的计算结果如表3所示。

由表3可见, 利用同样的稀疏分解算法对原始信号进行分解后, 在重构时经过本文提出的改进阈值降噪方法处理后得到的各项指标参数都是最大的, 说明本文改进的阈值降噪方法能够更好地保留振动信号的冲击特性, 具有更优越的降噪性能。

5 实例数据验证

对某钢厂1580SP轧机中的调心滚子轴承的实测振动信号进行特征提取测试, 该振动信号是在轧机正常工作情况下采集的, 未包含故障信息。

本文提出的由傅里叶字典和冲击时频字典组成的联合字典, 在未包含冲击信号时自动退化为单一的傅里叶字典, 从而可以匹配正常信号中含有的大量周期性信号。从图4中也可以看出本文方法很好地重构出了实测的轴承信号, 并且重构信号很好地包含了实测信号的特征信息。

同样利用GA-MP算法、Hybrid-PSO-MP算法和本文稀疏分解算法对20组1024维实测轴承信号进行信号的稀疏分解与重构, 通过实测轴承信号及其重构信号的平均eMS值来衡量重构信号的优劣, 通过比较算法运行的平均速度来评价算法的快慢。具体仿真结果如表4、表5所示。

由表4仿真结果可见, 本文提出的算法对实测信号分解和重构后的平均eMS值是0.086, 远远小于GA-MP算法和Hybrid-PSO-MP算法的0.322和0.264, 充分验证了本文提出的算法在实测信号特征提取方面有很强的适应性, 并且在实测信号稀疏分解与重构精度上也更加能够满足实际生产条件中的较高要求。由表5所示的各算法平均速度比较结果可知, GA-MP算法运行时间是63.021s, 这是由于遗传算法虽然能够有效提高原始MP算法的分解速度和精度, 但自身复杂的编码和解码方式以及交叉和变异等操作, 使得其运行时间较长。而Hybrid-PSO-MP算法和本文算法都是在PSO算法的基础上进行改进的, 因此它们的运行时间都要短于GA-MP算法, 分别为24.890s和15.946s。为了更加直观地显示出各算法运行速度之间的差别, 设定GA-MP算法的运行速度为单位1, 则Hybrid-PSO-MP算法和本文算法的运行速度分别是GA-MP算法的2.532和3.952倍。本文算法的运行速度最快, 这是由于本文算法采用了弱匹配追踪算法, 且在PSO算法进化方程中省略了粒子速度项, 使得算法复杂度大大降低, 并在简化粒子群基础上引入了校正因子使得算法可以自适应地根据粒子搜索情况调整自身算法参数, 大大提高了算法的收敛速度和精度。

摘要:针对滚动轴承故障诊断中的特征提取问题, 提出一种基于压缩感知弱匹配追踪算法的特征提取方法。针对轴承故障信号特征特点构建了一个由傅里叶字典和冲击时频字典组成的联合字典, 作为弱匹配追踪算法中的过完备冗余原子库。进而利用改进的简化粒子群寻优算法在联合字典原子库中寻找最能匹配轴承故障信号特征的原子, 实现故障信号的快速高效稀疏分解。在信号重构阶段提出了一种改进的阈值降噪策略, 解决了软阈值降噪存在恒定偏差以及硬阈值降噪的不连续问题。对CWRU (Case Western Reserve University) 轴承数据中心所提供的标准轴承故障信号和某钢厂滚动轴承实测信号进行了仿真, 仿真结果验证了该方法的优越性。

信号波形特征提取 篇6

1 心音信号及其分析方法概述

心音信号是人体最重要的生理信号之一,它是心脏及心血管系统机械运动状况的反映,是在心动周期中由于心肌收缩舒张、瓣膜启闭以及血流冲击心室壁和大动脉等引起的一种机械振动,也是评估心脏功能状态的一种基本方法。心音信号蕴含着心脏各个部分本身及相互之间作用的生理和病理等重要的诊断信息。

正常的心音包括第一、二、三、四心音四个成分,分别采用s1,s2,s3和s4来表示,而在多数情况下只能听到s1和s2,s3和s4几乎听不到[1]。s1发生在心室收缩初期,是由二尖瓣和三尖瓣关闭产生的,是心室收缩期开始的标志。s2发生在心室舒张期,是由主动脉瓣和肺动脉瓣的关闭产生,是心室舒张期开始的标志。一旦心脏功能出现异常,心音中将包含s1和s2以外的杂音,而这些杂音的频率成分、强度、出现的时间等都是研究的重点。

上世纪90年代以来,由于计算机技术和现代数字信号处理技术的发展,大大地提高了对心音的传统分析能力。心音信号的分析与研究主要在对s1和s2的生理病理研究、对心音微弱成份(s3和s4)的分析研究、对人工心脏瓣膜的无创伤检测和心脏杂音的频率变化规律分析等几个方面[3,4,5]。

国外不少研究人员都尝试用不同的方法来分析心音信号。Djebbari等用短时傅里叶变换分析心音信号,B.EL-Asir等用时频分析的方法分析心音信号,发现不同的心脏疾病在心音中体现为不同时刻出现的不同频率的心脏杂音[4,5]。要实现心音对心脏疾病的辅助诊断,就要分析心音的时频分布。国内对心音的分析仍处于初级阶段,并逐渐成为信号分析与处理领域的研究热点。

本文以一种正常心音信号和四种异常心音信号为例,研究心音信号的分析方法,并提取各种特征以区分不同的心音,将为心音信号可视化电子测试综合系统的研究奠定基础。

2 小波分析及其仿真实验

2.1 小波分析原理

根据小波多分辨率原理,可以把空间做逐级二分解,产生一组逐级包含的子空间Vj=Vj+1茌Wj+1,j∈Z。V0中的任意函数f(t)均可表示为{φ(t-k)}k∈Z的线性组合[6]。Pjf(t)代表f(t)在Vj上的投影,即

可以得到以下递推公式

式中,φ(t)和ψ(t)分别为尺度函数和小波函数;dk(j)是第j层的离散细节信号,xk(j)是第j层的离散平滑逼近信号。

本文利用小波分析的子带滤波特性,采用小波分解与重构的方法得到心音的时频特性。根据小波变换的理论,采用Daubechies6小波对心音信号进行5阶分解与重构,根据二进制小波子带滤波的含义,不同的小波分解系数代表不同频段的信号含量,当心音信号数据采样频率为2205Hz时,得到各分解与重构系数与频段对应关系如下:

一阶分解的细节信号d1:551Hz~1102Hz

二阶分解的细节信号d2:275Hz~551Hz

三阶分解的细节信号d3:137Hz~275Hz

四阶分解的细节信号d4:68Hz~137Hz

五阶分解的细节信号d5:34Hz~68Hz

五阶分解的逼近信号a5:0~34Hz

心音信号=d1+d2+d3+d4+d5+a5

2.2 仿真实验及分析

一种正常心音信号和四种异常心音信号小波分析分别如图1~5所示[6,7]。主要分析讨论心音信号的小波5阶分解与重构图,并进行判别和区分,其中d1,d2,d3,d4,d5分别是一到五阶分解的细节信号,a5是五阶分解的逼近信号。

图1正常心音信号主要分布在d4,d5和a5这三个低频段,只包含第一心音和第二心音,而高频段的心外音和杂音的幅值非常小。

图2的第二心音增强信号主要表现为第二心音的幅值等于甚至大于第一心音,而且在其低频段出现了一些杂音。

图3的完全性房室传导阻滞的第一心音亢进信号则表现为第一心音的幅值过高,且在d3中频段比较明显,以及在这一频段出现中频杂音。

图4的舒张早期奔马率或加强的第三心音信号主要是在s2和下一个s1之间(即舒张期)出现了较大幅值的第三心音,属于低频杂音。

图5的收缩中晚期喀拉音信号是在s1与s2之间(即收缩期)出现了杂音,属于中低频杂音。

综上所述,小波分解很好地给出了心音信号的时频关系,异常心音主要表现在不同的频段出现了杂音以及心音的改变。

3 功率谱估计分析及其仿真实验

3.1 We lch功率谱估计原理

心音信号是一种非平稳的随机信号。普通的周期图法估计功率谱密度是通过有限长样本序列的快速傅里叶变换FFT来计算的,当数据长度N太大时,谱曲线起伏加剧;当数据长度N太小时,谱的分辨率又不好。实际应用中,Welch对普通的周期图法做了改进,减小了估计的方差,改善了估计的信噪比。该方法将采样信号分成不相互叠加的几部分,然后进行平均,分割的段数越多,方差越小。

首先,将N点的数据段分成L个小段,每段有M个样本,相邻小段间交叠M/2点,各段数据有一定的重叠是为了增加段数,减小方差[3,6]。

各小段数据加相同的平滑窗w(n),每段数据的功率谱为[6]

式中xi(n)=x[n+(i-1)M]d[n+(i-1)M],矩形窗长为M,为归一化因子,它保证由Welch方法得到的功率谱估计是无偏估计。

由Welch法得到的平均功率谱为

3.2 仿真实验及分析

正常心音信号与其它四种异常心音信号的Welch功率谱估计图的比较如图6所示:

图6反映了心音信号的能量在各个频段的分布特点,正常心音信号的能量主要集中在250Hz以内,250Hz以后的高频段分布越来越少。正常和其它异常心音的主要区别集中在250~300Hz的中频段,其它四种异常心音在这一频段的能量成分明显增强。以第一心音亢进图6(a)为例,在250-300Hz这个中频段,具有第一心音亢进的功率谱成分增加的特别多。

4 归一化香农能量分布及其仿真实验

4.1 归一化香农能量

小波分析能很好的反映心音的时频特性,却不能充分反映心音在时域上的特征,为此要对信号做进一步的归一化香农能量分析。利用上面介绍的小波分解方法,第一心音和第二心音的主要成分集中在a3(0Hz~137Hz)内,所以,对a3求归一化香农能量为[3,6]

式中x(i)表示重构心音信号中的第i个数据;N为所分析信号的长度。

4.2 仿真实验及分析

正常和四种异常心音信号的归一化香农能量图如图7所示:

从归一化香农能量分布图可以求得心动周期hc,s1的时限s1t,s1的强度I1,s2的时限s2t,s2的强度I2等参数,从而得到特征值:心率hr=1/hc,s1的时限s1t与心率的比值s1t/hr,s2的时限s2t与心率的比值s2t/hr,s1的强度I1与s2的强度的比值I1/I2等。

根据小波的分解与重构图得到的各种心音的杂音以及外加音的频率分布,以及由香农能量图得到的特征定量分析对比如表1所示:

5 结束语

本文从现代信号处理的角度出发,利用小波的分解与重构得到心音信号的时频关系,利用归一化香农能量分布得到心音在时域内的各种特征,利用功率谱得到心音能量频率分布关系,从而从不同的角度提取心音的特征并进行全面概括。仿真实验表明该分析方法能有效的区分正、异常心音,有助于器质性心脏病的辅助诊断。同时这些特征值可应用于神经网络,实现对心脏病的自动判断,也为心音信号可视化电子测试综合系统的研究奠定了基础。

参考文献

[1]塔卡安,黄若文.心脏听诊高阶教程——心肺音与杂音[M].北京:世界图书出版公司,2009.

[2]Richard Hatchett,David R.Thompson.Cardiac nursing a comprehensiveguide[M].Elsevier Health Sciences,2002.

[3]陈国强.心音信号的提取与处理研究[D].西安:西安电子科技大学,2009.

[4]Christer Ahlstom,Peter Hult,Per Ask.Detection of the third heart soundusing recurrence time statistics.In:2006 IEEE International Conferenceon Acoustics,Speech and Signal Proceeding[C],2006:1040-1043.

[5]Kumar D,Carvalho P,Antunes M,etal.Third heart sound detection usingwavelet transform-simplicity filter.In:29th Annual International Confer-ence of the IEEE-EMBS[C],2007:1277-1290.

[6]胡广书.现代信号处理教程[M].北京:清华大学出版社,2004.

信号波形特征提取 篇7

植物电信号是与植物生理过程、体内传送信息相关的重要植物生理信号,是植物对环境变化刺激做出的反应。在传导方面,电信号不仅能够迅速地从植物的一点向另一点进行远距离的传递信息,而且对外界环境刺激如光照、温度和烧伤等都会迅速做出反应,其变化远比各种生理和形态变化要早[1,2]。研究植物电信号的重要价值就在于探索绿色生命的火花,破译大量绿色植物在生机盎然的自然界向人们表达出的更多生命信息,由此构建植物电信号自适应控制系统,实现真正意义上的“节能减排”式的农作物、蔬菜工厂化生产自动化控制[3]。

小波变换以良好的时频局部化特性非常适合分析非平稳时变信号,各类小波熵是小波变换和信息熵的结合[4]。其结合了小波变换分析不规则信号的优势和信息熵对信号复杂程度的统计特性。因此,在非平稳时变信号的特征提取方面具有很好的优势[5,6,7]。本文利用多种小波熵和信号熵来提取植物电信号的特征向量,对提取的特征值利用KNN方法进行分类,并通过试验验证了其对植物电信号分类的有效性,具有广阔的应用前景。

1 信号熵特征表示

信息熵描述的是每个信号的平均信息量和信源的平均不确定性,被作为系统紊乱程度的量度[8]。

1.1 信号时间熵

信号时间熵是对信号在时域上信息的一个统计分析,对信号进行时域划分,其分布复杂度用一定量的熵来表示。

设x(n)为实测信号,其中n∈[0,N],N为信号数据的个数。将信号划分为如下L个区间,有

undefined (1)

其中,{Zl=[sl-1,sl],l=1,2,…,L}互不相交。

s0

s0=min[x(n)],sL=max[x(n)] (3)

设p(Zl)表示信号x(n)落于区间Zl的概率,按古典概率分布,即等于x(n)落于Zl的数目与x(n)总数目N之比值,于是定义信号时间熵(signal time entropy),即

Wt=-∑p(Zl)log[p(Zl)] (4)

1.2 信号频率熵

信号频率熵是统计分析信号在频域上的信息,通过傅里叶变换后,划分信号,频域的分布复杂度用一定量的熵表示。

设y(w)为实测信号x(n)的傅里叶变换,将y(w)的绝对值划分为如下K个区间,有

undefined (5)

与信号时间熵类似Zk相当于Zl,p(Zk)相当于p(Zl),即等于y(w)落于Zk的数目与y(w)总数目之比值,于是定义信号频率熵(signal frequency entropy),即

Wf=-∑p(Zk)log(p(Zk)) (6)

2 小波熵特征表示

小波变换具有良好的时频局部化能力,将小波变换与信息熵相结合,可以得到信号的小波熵的定义及其计算方法。若将小波变换的系数矩阵看作为一个概率分布序列,那么其稀疏程度可由计算得到的熵来描述,熵值越大,信号的概率分布就越接近无序[9]。

2.1 小波能量熵

小波能量熵是统计分析信号在各频段上的能量,以其尺度系数划分信号能量;信号能量频域的分布复杂度用一定量的熵来表示。

设信号x(t)在m个尺度上的小波能谱为E=E1,E2,…,Em。根据小波信号的正交特性,某一时间窗口内分量功率Ej之和与总功率E相等,设p=Ej/E(j=1,2,…,m),则∑pj=1。由此可知,小波能量熵(wavelet energy entropy)为

undefined (7)

当pj=0时,pjln(pj)=0。

2.2 小波奇异熵

小波奇异熵是通过奇异值分解(singularity value decomposition, SVD)理论提取信号的小波变换的系数矩阵特征,描述信号的时频分布特征。

信号小波分解为Dj(n),其中j=1,2,…,m。它是m×n矩阵,奇异值分解理论中,对于Dm×n存在矩阵Um×l,Vl×n和Λl×l,可使Dm×n分解为

Dm×n=Um×lΛl×lVundefined (8)

其中,λi(i=1,2,…,l)是小波变换结果Dm×n的奇异值≥0,从大到小排列,即为λ1≥λ2≥…≥λl≥0。为了对信号的频率成分及分布特征进行定量表示,定义小波奇异熵为(wavelet singular entropy),即

undefined (9)

其中,Δpi为第j阶增量。有

undefined (10)

小波奇异熵能定量区别不同时频分布的信号,信号越复杂、随机性越大,其量化的熵值就越大。

2.3 小波方差谱熵

对于给定的信号经小波分解后得到的方差谱undefined。其中,Wj为在尺度j下小波系数的方差谱。定义小波方差谱熵(wavelet variance entropy),即

undefined (11)

其中,undefined表示在尺度j下的方差概率。

3 特征提取与分类

3.1 特征向量的构成

各种信号熵和小波熵从不同方面描述了信号的分布特征,为信号的特征提取提供了基本前提。单一熵对植物电信号进行特征提取,很难处理信号的随机性和多变性,无法确保分类的正确性和可靠性。

如果融合多种熵的优点来分析植物电信号,则可以提取到可信度较高的特征。基于此目的,提出了将小波熵与信号熵结合的植物电信号特征提取模型。本文将小波能量熵we、小波奇异熵ws、小波方差谱熵wv、信号时间熵wt和信号频率熵wf等5种特征参数统一起来,构造特征向量T=[we,ws,wv,wt,wf]。

3.2 KNN分类

KNN是最邻近法(Nearest Neighbors)的推广。该方法是一种非参数的分类技术,在基于统计的模式识别中非常有效,对于未知和非正态分布可以取得较高的分类准确率,具有鲁棒性、概念清晰等诸多优点[10]。算法思想:将所有N个训练样本都作为代表点,计算测试样本x到所有样本点的距离,找出与x最近的训练样本中的k个最近邻,看这k个近邻中的多数属于哪一类,就把x分到哪一类。

假设:数据集是X={x1,x2,…,xn},其中xi是l维的,目标分类是C={c1,c2,…,ct},那么xi与xj的距离为

undefined (12)

待测样本x到样本数据集的距离是D={d1,d2,…,dn}。

令fm=average(∑(di)),di对应的xi属于cm,i=1,2,…,n;m=1,2,…,t。当fm中的最小值fmin所对应的类别为ca,则待测样本就归为类ca。

4 特征提取实例

本文实测信号测定正常生长状况下的君子兰叶片电信号作为对照,然后加入15%的PEG溶液干旱胁迫,通过测定叶片相对含水量,在达到轻度、中度以及重度胁迫时,分别采集得到对应的电信号。将正常生长状况、轻度、中度和重度干旱胁迫下的君子兰叶片电信号分别记为一类、二类、三类和四类。

4.1 特征向量

从每一类君子兰叶片电信号中采样10组实测信号,共40组,通过降噪和重采样后,提取每组信号的特征向量T,结果如表1所示。由于样本较多,所以只列出每类中的2组特征值。

4.2 分类结果

君子兰叶片电信号的特征值,每类10组,共计40组。现在用KNN分类法对提取的特征向量进行分类识别,将每一类中的前3组样本作为训练样本,剩余7组样本为测试样本,分类正确标记为1,分类错误标记为0,所得结果如表2所示。

从表2可看出,每类信号的识别成功率并不完全相同,这是因为各类信号的复杂程度不同。统计所检测的4类君子兰叶片电信号平均识别概率为89.3%。可见,基于多小波熵和信号熵的植物电信号特征提取方法能够有效地提取出植物电信号特征。

5 结论

研究了3种小波熵以及定义的2种信号熵在植物电信号识别中的应用原理和优势,通过融合多小波熵和信号熵的方法提取植物电信号特征,结论为:

1)各类小波熵融合小波变换、信息熵和相关理论在信号处理中的优势,为植物信号识别提供了基础。

2)将小波熵与信号本身熵相结合提取特征向量,利用KNN方法进行分类,可降低分类结果的不确定性,能提高植物电信号识别的可靠性。

摘要:为了有效地对植物电信号进行分类,提出了基于多种小波熵与信号熵的特征提取方法。小波熵由于结合了小波变换和信息熵理论的优势,能够快速、准确地提取植物电信号的特征;但是,由于植物电信号的非平稳性和多样性,依靠单一的小波熵可能出现分类困难和分类不准确等问题,需要结合多种小波熵和信号的熵信息进行特征提取和分类。为此,以4类干旱胁迫下的君子兰叶片信号为对象,对提取的特征向量利用KNN方法进行分类。试验结果表明,该方法能够对君子兰叶片的电信号进行有效识别,为植物电信号的识别提供了一种可行的新方法。

关键词:植物电信号,多小波熵,信号熵,特征提取

参考文献

[1]Gurovich L,Hermosilla P.Electric signaling in fruit trees inresponse to water applications and light-darkness conditions[J].J Plant Physiol,2009,166:290-300.

[2]Xiaofei Yan,Zhongyi Wang,Lan Huang,et al.Researchprogress on electrical signals in higher plants[J].Progressin Natural Science,2009,19(5):531-541.

[3]王兰州,胡安雨.微弱电信号测试计量的植物生长信息传递研究展望[J].中国计量学院学报,2010,21(3):192-200.

[4]Rosson O A,Blanco S,Yordanova J,et al.Wavelet entro-py:a new tool for analysis of short duration brain electricalsignals[J].J Neurosci Meth.,2001,105(1):65-75.

[5]曾庆虎,刘冠军,邱静,等.基于小波相关特征尺度熵的预测特征信息提取方法研究[J].中国机械工程,2008,19(10):1193-1196.

[6]符玲,何正友,麦瑞坤,等.小波熵证据的信息融合在电力系统故障诊断中的应用[J].中国电机工程学报,2008,28(13):64-69.

[7]刘泽华,高亚奎.基于多小波熵灰色理论的故障诊断应用研究[J].计算机测量与控制,2011,19(6):1318-1324.

[8]Rezek IA,Roberts SJ.Stochastic Complexity Measures forPhysiological signal Analysis[J].IEEE Trans Biomed En-gin,1998,45(9):1186-1191.

[9]侯宏花,桂志国.小波熵在心电高频噪声处理和R波检测中应用[J].计算机工程与应用,2010,46(9):116-119.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【信号波形特征提取】相关文章:

信号提取模型05-14

信号曲线特征06-23

波形护栏方案06-20

波形梁护栏07-02

波形护栏施工总结05-22

波形钢护栏施工方案05-26

波形梁护栏施工方案04-23

脉搏波形测量仪05-16

波形相关性分析05-24

脉冲波形产生器07-02

上一篇:改进的中值滤波下一篇:英语写作教学心得