线性代数的应用特征

2024-08-18

线性代数的应用特征(精选八篇)

线性代数的应用特征 篇1

目前, 用传统的定性测试方法即目视法、观色法、酸洗法对磨削烧伤进行检测及评价存在着很大的局限性, 已不能适应现代汽车制造业的需求。磨削烧伤的成因已充分表明工件表面的硬度和残余应力是确切地、定量地反映烧伤程度的二项参数。知名仪器厂商Stresstech公司基于物理学Barkhansen原理提出了可用于探测磨削烧伤的“磁弹法”, 开发了一种能快速地对磨损烧伤的程度进行定量判断的检测仪, 并已在越来越多的企业获得了实际应用。

该仪器通过特殊设计的激磁电路和传感装置, 对铁磁性材料因磨削烧伤造成的晶格结构错位、金相组织变化而引起的表面硬度和残余应力的变化反应灵敏, 所产生的相应电信号的幅值与磨损烧伤的程度相关。图1是磁弹法对磨削烧伤后硬度及残余应力变化的反映。图1a中的横坐标表示硬度HRc值, 而纵坐标表示输出的Barkhansen信号幅值。随着被检工件表面硬度HRc值由高向低变化, 检测仪器输出相应的Barkhansen信号幅值将由小到大, 即硬度低对应的检测信号高, 硬度高对应的检测信号低。仪器对表面残余应力的反应见图1b, 从图1b中可见, 当残余应力由小到大, 即由负 (压应力) 向正 (拉应力) 变化时, 检测仪器输出相应的Barkhansen信号幅值将由低向高变化。将上述信号幅值用作评定指标且命名为特征值 (mp) , 试验表明mp与被检测工件表面的变异状态之间存在着比例关系。

图2是Stresstech检测仪生成的测试报告的一部分, 图2中的曲线形象地反映了被测凸轮轴中的一个凸轮的检测结果, 坐标系的纵坐标是描述工件磨削烧伤程度的特征值mp, 而横坐标则反映了回转角度。从图2可见, 被测凸轮显示在233°位置处有超差情况。

2 基于线性回归分析的特征值定标

2.1 关于定标

磁弹法及其相应的特征值本质上属于比较测量, 为了能真正对磨削烧伤进行有效监控, 就必须解决定标问题。所谓“定标”是指在磨削烧伤程度已量值化的基础上, 通过科学、合理的方法准确地确定合格/不合格的识别值。

2.2 试验数据的获取

将线性回归分析用于特征值定标的前提是仪器特征值与能够真实体现磨削烧伤的表面硬度及残余应力这两项物理量之间的相关性, 因此首先必须获得相应的数据。试验以某新型小排量汽油发动机的凸轮为样本, 试验的第一步是采集样本, 具体操作时遵循“尽量覆盖磨削烧伤程度不同的工件”的原则, 选取一批单个凸轮, 在图3所示的利用磁弹法原理的检测仪上逐个进行测量, 利用多次检测所获得的信息, 可以选出若干个工件及其相应的检测位置, 其检测位置既能分别代表磨削的不同烧伤程度, 又较易于准确测量。

目前, 企业对重要零件的关键部位都有硬度要求, 前述单个凸轮的表面硬度, 相应图纸上的规定为HV (10) 600+200, 即要求负荷为10kg时的维氏硬度值为600�800。迄今只有极少数主流发动机厂在图纸中对上述凸轮的表面残余应力要求为≤500MPa。残余应力的测定均采用X衍射法, 按此原理所研制的仪器也已产品化。X衍射法测定凸轮表面残余应力见图4。测试样本的表面硬度、表面残余应力及特征值的实测结果见表1。

2.3 线性回归分析在特征值定标中的应用

回归分析是通过独立收集的n组试验数据, 分析研究关键质量特征值与原因变量之间的相关关系。在实际中, 既存在着只有1个对随机变量y有影响的自变量 (原因变量) x1的情况, 也往往会遇到有2个甚至于多个自变量x1、x2��xi的情况。此处的质量特征量即为随机变量y。

2.3.1 一元线性回归在特征值定标中的应用

国内、外极大多数发动机厂的试验室都不配备X衍射仪, 德国大众汽车公司的发动机工厂若有轴类零件需要测试残余应力, 都是送往位于狼堡的大众集团总部中心试验室。虽然在图纸上对表面残余应力已有明确的规定, 但只要工艺处于比较稳定的状态, 正常情况下每个发动机型号的检测频次保持在1次/年。一般试验室里都具备硬度测试手段, 因此若能够证明仅利用“硬度”自变量, 通过回归分析方法, 也能确认所获得的特征值的定标结果的可靠性和可用性, 就可以简化和扩大这种方法的应用空间。

首先, 对表1中前二列试验数据进行线性相关关系验证, 并以求得的相关系数r判断两组变量间线性相关的程度。相关系数r的定义为两个随机变量的协方差与它们的标准偏差乘积之比值, 若根据有限次测量所得的数据求得其估计值, 则r可通过下式求得:

上式分子中的分别为自变量x1和随机变量y的算术平均值, 分母则为两变量x1、y的标准偏差的乘积。n为本次试验中的样本数, 从表1可知, n=6。

利用Q_DAS公司的destra软件, 能迅速地按表1的两组测得数据得出相关系数r的值, r是一个绝对值不大于1的常数, 其大小决定了两组数值间线性相关的程度, 在本例中的r=0.980 6。当r=0时, 称两组数据完全不相关;而r=0.980 6时则表明两个变量间呈正强相关。与此同时, destra软件还会生成仪器的检测信号mp和工件表面硬度HV两者之间的定量关系表达式, 即一元线性回归方程:

若按表1的两组数据在直角坐标系中绘制散点图, 则能形象地看到n个点在一条直线附近波动, 而一元线性回归方程便是对这条直线的一种估计, 见图5。将图5与图1进行对比, 可清楚地看出两者完全一致。

对于所求出的一元线性回归方程, 还需对其显著性进行检验。首先, 需查出对应于给定显著性水平α的相关系数的临界值, 再通过与上述已求得的相关系数r的值进行比较来作出判断。对于α=0.05的显著水平, 查检验相关系数临界值表, 可得:

鉴于r=0.980 6大于0.707则表明该回归方程显著, 故有实际应用意义。在求得了有意义的线性回归方程后, 就可以将其用于预测, 即在给定了自变量x1的值后对因变量y的值作出判断。由于在多数情况下, y是随机变量, 因此无法给出其在每次试验中的实际取值。如果给定x1的值为x10, 那么y的预测值就为:

之前已悉, 给定的x10值为凸轮表面硬度名义值HV (10) 600, 将它代入式 (3) 后即可得随机变量y、也就是特征量的预测值y0。计算结果为y0=65.5, 从而获得了工件磨削烧伤的合格/不合格的判别界限值。与此同时, 还可推测在置信概率为95%下特征量mp的预测区间。

设δ为因变量y预测区间的单边宽度, 其值可表达为:

上式中, 是正态分布的分位数, n是样本数量, 而1是自由度。当置信概率为95%时, 查t分布表, 得, 而, 其中SE是残差平方和, 而fE是与残差相联系的自由度。经计算后可得到δ=11.0。最后得到在硬度值HV (10) =600, mp=65.5时的预测区间为 (65.5-10, 65.5+10) , 即 (55.5, 75.5) 。当然, 预测区间δ也可以借助计算机软件求得。

2.3.2 多元线性回归在特征值定标中的应用

如前所述, 事实上对随机变量y、对仪器检测信号mp有影响的自变量, 既有表面硬度x1, 还有表面残余应力x2, 为此仍利用Q_DAS公司的destra软件, 通过对表1中的试验数据的多元线性回归分析来进行磨削烧伤特征值的定标。由软件生成的三者之间的定量关系表达式, 即二元线性回归方程为:

按表1的数据在三维直角坐标系中绘制散点图, 则能形象地看到n个点在回归平面附近波动, 而二元线性回归方程便是对这个平面的一种估计, 见图6。将图6中的回归平面同时投射到与底面相垂直的两相邻面, 分别获得硬度、残余应力与信号mp幅值的关系曲线, 该曲线与概述中表述的变化规律是完全一致的。

为了表明在给定的显著性水平α=0.05上, 上述二元线性回归方程是有意义的, 可利用destra软件的功能对其作显著性检验。判别准则是进行t假设检验。具体做法是先查表得t0.025 (6-2) =2.776, 其中0.025是α/2, 而6是数据数量, 2是自由度。应用destra软件, 可依据试验所得到的x1、x2数据求得对应的t值, 它们分别是42.788和15.218。然后将该值与前面查得的t值相比较, 鉴于求得的t值均明显地大于2.776, 因此通过了显著性检验, 表明上述式 (5) 是有实际应用意义的。这样就可以将其用于预测, 即在给定了自变量x1、x2的值后对因变量y的值作出预测。类似前面的一元线性回归方程, 在同时给定x1的值为x10=600、x2的值为x20=500后, 就能得到y的预测值:

经计算后可得y0=40.18, 即评定工件磨削烧伤合格与否的判别界限。此外, 还可推测出在置信概率为95%情况下, 特征量的预测区间 (y0-δ, y0+δ) 。为此, 既可以沿用之前所采取的计算方法来得到预测区间δ的值, 也可以直接借助相应的计算机软件destra获得δ=7.40。最后可得到在硬度值HV (10) =600, 表面残余应力为500 MPa, 磨削烧伤mp=40.18时的预测区间为 (40.18-7.40, 40.18+7.40) , 即 (32.78, 47.58) 。

3 表面硬度、残余应力两因素对磨削烧伤特征量定标的影响分析

基于一元和多元线性回归方法求得的特征值的定标结果存在着差别。相比之下, 由于一元线性回归方法只考察了一个与磨削烧伤特征值相关的自变量即表面硬度HV (10) , 故其判别合格与否的界限值mp1=65.5比采用多元线性回归方法时还考虑了表面残余应力后所获得的对应界限值mp2=40.18高则完全是可以理解的。因为特征量的界限值较高, 意味着对磨削烧伤的要求较低, 同一被测件若用图6所示检测仪测得mp为50, 那该工件就会在前一种情况下被判为合格, 而在后者则将认为不合格。因此, 执行较低的界限值mp2可以更可靠地监控产品制造质量。由此可见, 极大多数企业既未明确提出残余应力这项指标, 也不具备利用X射线衍射仪进行检测的能力, 因此采用较易取得的判别界限值mp1还是具有实用价值的。

在正常情况下, 磨削工件时其表面硬度有不同程度的下降。对应地, 此时工件表面 (磨削区域) 的残余应力表现为压应力, 而其下的次表层 (非磨削区域) 则表现为拉应力。来自大学基础实验室的相应测试结果表明, 表面的最大 (绝对) 值约为-800 MPa左右, 而次表层的最大值在900 MPa左右。之所以存在表面残余应力为拉应力的隐患, 主要原因是由冷却不当造成的。众所周知, 磨削过程中的冷却有3种型式:风冷即采用干磨时的自然冷却;水基冷却液;油基冷却液。当采取风冷和油基冷却液的冷却方式时, 工件表面将呈现为压应力, 此时可能存在着硬度下降的风险。而长期以来, 由于水基的冷却效果明显地优于油基, 环保处理也简单, 使用成本要比油基低得多, 因此应用十分普遍。但这时也隐含着另一种风险, 即采用水基磨削液后的冷却速度快, 表面产生的二次淬火马氏体组织增多, 晶格变化、体积缩小, 而它的下层则因冷却缓慢成为硬度较低的回火组织, 从而增大了工件表面产生残余拉应力的倾向。当形成的拉应力一旦超过了材料的强度极限, 工件表面则出现裂纹。

随着越来越多的企业在凸轮轴、曲轴等零件的加工中采用CBN磨削技术, 上述隐患正在不断减小。CBN磨具材料与其它磨具材料相比, 有着更高的硬度和强度, 切削锋利且耐磨, 因而具备了优化各种磨削参数的条件。在提升了砂轮线速度后, 不但提高了磨削效率, 还可明显地降低磨削力, 随之也减少了磨削热, 从而工件表面的温度必然会相应下降。另一方面, 自本世纪初起, 一些主流发动机企业在进行轴类零件的磨削加工时已出现了由油基冷却液逐渐取代水基冷却液的趋势, 而执行干磨工艺的企业也在增多。这一切都表明, 在引起工件表面磨削烧伤的两种因素中, 由残余应力带来的风险远低于硬度下降这一因素。凸轮表面残余应力X衍射法测试报告见图7。图7中的纵坐标为应力, 横坐标为自工件表面往下的深度。由图7可见, 工件表面即磨削区呈现为压应力, 而之下的次表层即非磨削区则为拉应力。

目前, 多数企业在对工件表面进行磨削烧伤监测时完全没有考虑到残余应力这一问题, 但只要所采用和实际运行的工艺是稳定的, 并能认真履行所制定的其它日常检测、监控措施, 也还是能较有效地实现相应的质量目标的。再回到前面推导出的二元线性回归方程 (5) , 实际磨削工件时, 工件表面出现500 MPa残余拉应力的机率极小, 虽然也难以保证处于一定的压应力水平, 但至少应确定不能出现拉应力。故在利用该回归方程 (5) 做类似前面磨削烧伤特征量的预测时, 虽仍然给定自变量x1的值为x10=600、x2的值为x20=0后, 经代入计算得y0=441.9一0.634×x10, 从而可得到y的预测值y0=61.5, 即评定工件磨削烧伤合格与否的判别界限。如果将它与只考虑表面硬度一个因素, 即利用一元线性回归方程 (3) 获得的界限值y0=65.5相比, 可以发现两者还是比较接近的, 这就进一步验证了上述结论。从图2中可见其合格品的特征值mp=45。

参考文献

[1]许玲.凸轮轴磨削裂纹分析[J].机械工程师, 2008, (10) :124-125.

[2]彭欣健等.凸轮轴加工中CBN磨削技术的应用和研究[J].装备制造技术南宁2010, (3) :33-36.

浅析中国传统音乐与书法的线性特征 篇2

关键词:音乐;书法;线性;节奏

中国的传统文化博大精深,它独特审美性是其线性的美。这种美体现在华夏民族表达丰富个人情感时,善于将某个特定艺术的艺术语言与线条巧妙糅合,并用线条的特性表现中国的民族气质与特征。其中最突出的是中国的传统音乐与书法艺术。

我国传统音乐与书法艺术的基本共性就是线性特征,具体表现在以下三方面:

一、中国传统音乐的线性特征与书法运笔的线条特性的相似

1.中国传统音乐的线性特征

我国现代音乐学家王光祈将世界音乐分为三大体系——“欧洲乐系”、“中国乐系”、“波斯-阿拉伯乐系”。①与欧洲音乐的纵向展演,具有功能和声的多声乐系相比,“中国乐系”是单声体系,我国少数民族的音乐有支声部,但这种多声部音乐更侧重横向的线性发展。我国传统民族乐器的演奏也是单声部,这种单声结构的外在含义就是整个音乐的发展是以线性展开、横向的展演。音乐是“时间艺术”,它从形成到展演至结束的整个过程是按时间顺序在一条线上完成;在发展的整个过程中,人们会有意使用某些特定的用来表现某种音乐意图的装饰音,即乐音的带腔特性,具体表现在我国的传统戏曲与说唱艺术上,如说唱音乐的腔调,体现为乐句尾部较强的拖腔;戏曲音乐的唱腔特点如润腔,即运用颤音、滑音等装饰润化旋律或是体现在改变句式结构上,即使是一个音,也要在这个音上曲折反复,是为了形成弹性节奏,营造音乐的线条美。

2.书法运笔的线性特征

书法是“空间艺术”,是真正意义上的线性艺术,它通过书法语言的点、线、结构、章法在空间上用单线条呈现。在书法的运笔上,每一个起笔、行笔、收笔的过程都有顿、提、按,其用笔力度、用墨分量会起到戏曲音乐中所提到的“润腔”作用。与戏曲行腔类似,起笔也要注重力度,行笔一气呵成,力求字的饱满方圆,收笔提按结合,完美收笔。

二、中国传统民族乐器的演奏技巧与书法行笔的相似

音乐与书法两者凝聚反映了人们对世界万物的感动与表达。音乐是动态的书法,书法是静态的音乐。音乐和书法二者在某種意义上相互补充、相得益彰,两者分别注重旋律的优美、线条的流畅,节奏的协和,并且都在线上彰显艺术家的创作风格与艺术性。宗白华曾在《美学散步》一书中说过,我国古代乐教失传后,文人们难以借音乐抒发情感,就寄情到书法与绘画中,也就是说,书法在当时是能取代音乐的艺术。

1.传统乐器演奏技法中的线性特征

我国传统民族乐器分为吹管乐、弹拨乐、打击乐与拉弦乐,以拉弦乐中二胡为例,它的演奏分为右手的起弓、运弓与收弓,正如书法中的起笔、行笔与收笔,每一弓都注重音头、音腹与音尾,运弓时要有力度的变化。左手的技巧有揉、颤、滑、按等,这些技巧的使用,则是为了使音呈现波折或线性状态。

2.书法行笔中的线性特征

书法中类似于二胡左手技巧的回锋、逆锋、转锋等笔法技法是使书法更好地表现其线条美。唐代大书法家怀素的草书,通过不复杂的线条变化,将其风神傲骨与博大情怀都凝聚于笔墨,并通过笔墨体现于纸上,有时润含春雨,干湿相得益彰;有时干烈秋风,枯湿相间;有时万马奔腾,顿觉满纸飞动;有时流水潺潺,连绵不断。徐、疾、枯、湿变化自然。他把“无声之乐”凝固在有形的线条中。欣赏一幅好的书法作品犹如聆听一首悦耳动听的乐曲,《琵琶行》中描写琵琶女演奏的琵琶曲,可谓:“大弦嘈嘈如急雨,小弦切切如私语”,用在书法上正是书法中“飞流直下”、“重若崩云”的笔致和“藕断丝连”、“轻若蝉翼”的线条。

三、音乐与书法的线性特征在节奏与情感中的体现

(1)音乐与书法中的节奏线性

音乐包括休止符共八个基本音符,同样,从我国古代流传下来的“永”字八法来看,将汉字笔法分为八个部分,即侧(、),勒(-),弩(|),趯(亅),策(/),掠(ノ),啄(ˊ),磔(ヘ)。音乐是在时间线上呈现给人们听觉上的盛宴,并结合音的长短、强弱,形成线性的音高走向。书法则是在空间里给予人们视觉上的享受。音乐中节奏是其最基本的音乐语言,也是其最重要的表现方法之一,是高低不等的乐音在时间线上有规律的轻重缓急,体现为音的强弱与时值。而将书法与音乐紧密结合在一起的就是节奏。一幅幅书法作品都从字里行间乃至整个画面透露出节奏的存在,它通过点线粗细、墨色浓淡,行笔的缓急、强弱以及章法的疏密、大小的节奏调节,将一幅幅无声的书法作品转化为一首首空灵美妙的音乐作品。我国传统音乐的节奏属于非均分律动型,散板性质,相当自由②,书法中张旭的狂草作品就属于此类型,但无论节奏怎么松散,它都是在一条线上轻重缓急,即上段提及的扯橡皮筋式的弹性节奏,此节奏形成的轨迹就是曲线形线条。虽然书法没有准确的音高、时值概念,但书写中线条的流畅性、笔墨变化和用笔的轻重所体现出的节奏感以及作品完成后整个画面对音乐凝固的时空感,能使欣赏者去从中体会它所包含的有关音乐的节奏与韵味。

此外,音乐与书法都要构成整体的和谐,音乐要注重和谐的韵律感与节奏感;书法要追求墨色、字体间距等形成的整体和谐,若过分地突出节奏等变化,就会让人感觉杂乱无章,好比音乐中不协和音程连续进行而不解决一样,极不舒服。单独的音符不能组成一段完整的音乐作品,而单独的笔画也同样形成不了一幅齐全的书法作品。因此,它们都是要在整体中体现节奏化的线条律动与整体的和谐。

(2)音乐与书法中的情感线性

音乐的强弱、旋律、时值、节拍、曲式结构等在时间线上给音符的定位,都是艺术家用于抒发内心情感的手段。无论是音乐抑或是书法,都始终围绕一个感情线展开,在本质上是为了“达情”。我国传统陕北民歌《兰花花》由简短的4个乐句组成,却将兰花花的故事讲得淋漓尽致,紧紧围绕着兰花花的爱情这条线展开。魏晋南北朝时期音乐与书法是相辅相承的,这一时期的书法家王羲之的《兰亭集序》,用有韵律感线条的书法表达自己内心的喜、怒、哀、乐。几个不相连的字,俯仰相应,姿态连贯,形成了一个波动有致的动态大曲线,组成强

弱对比的韵律感。音乐是通过节奏、速度、力度来抒發情感。譬如《义勇军进行曲》,它的节奏明确,力度较强,使人顿觉铿锵有力、信心百倍;《运动员进行曲》富有朝气,潜于激情的旋律,给人蓬勃向上的乐感;相反,《哀乐》速度较慢,力度稍弱,让欣赏着听后心里泛起沉痛,情绪低落。书法也一样,如颜真卿的《祭侄文稿》由于对亲人的悲痛哀思,对奸臣的愤慨怒斥,不自堪忍,故其书顿挫郁屈;张旭因观公孙大娘舞剑,才形成那种豪放洒脱的狂草性格;品味王羲之的《兰亭集序》,能让人联想到音乐中的《喜洋洋》,相反,《二泉映月》能想起颜真卿的《祭侄文稿》那种悲痛的心情。可见,书法中的情感意识是由音乐的节奏韵律感体验而来。正如,一个有感于艺术美的人,当欣赏一幅幅美的书法作品时便动之以情,他的心底会油然而生不同的乐感。张旭通过静观大自然界中的鱼、鸟、虫、兽、日、月、星,把对其的感触在纸上宣泄出来,酣墨笔畅,笔画狼藉,这不是对事物的刻画,而是用线条将其心中的“乐感”音符与书法紧密联系起来。

总之,尽管音乐与书法分属不同的艺术类别,但却从节奏、平衡、和谐、韵律及创作等方面形成了线条美。音乐是“无形的线条”,书法是“有形的线条”。在书法创作中,可以体会到小篆的严谨,线条上圆润自然;隶书的扁平,点线上稳中有动;楷书的端庄,线条上法度严谨;行书的流畅,节奏韵律感丰富;草书的飞扬,旋律上的狂动,这些在音乐创作中借来的词语突出表明了书法与音乐的共通。书法创作中对于线条曲直、粗细、长短变化以及用墨的轻重、干湿的控制能极大地促进人的音乐功能的发展,反之,对于音乐的旋律、动感的培养也能提升书法创作中的节奏感与韵律感。

将书法与音乐相嫁接以及高度融合,是现代艺术的一种拓展。书法虽无声但有音乐有声的协和性,音乐虽无形但有书法有形的线条感,将二者紧密结合是人类共同追求的艺术的最高境界。两者所体现的线的特征,就是我国传统艺术的乐舞精神,它逐渐渗透融会到其它传统艺术门类中,无论是我国的传统音乐、书法艺术抑或是其它传统艺术都需要我们不断对世界与宇宙进行认识,只有在艺术创作中去寻求、探索,必能找到最佳的契合点。

注释:

①周青青主编:《中国民间音乐概论》,北京,人民音乐出版社,2003年版,第7页

②李艳红:《浅析音乐形式的文化内涵》,载《河南教育学院学报:哲学社会科学版》2011年第5期.

参考文献:

[1]彭吉象.艺术学概论[M].第三版.北京:北京大学出版社,2006.8

[2]李虻.音乐作品曲式分析[M].重庆:西南师范大学出版社,2007.1

[3]周青青.中国民间音乐概论[M].北京:人民音乐出版社,2003.8

[4]王镇远.中国书法理论史[M].上海:上海古籍出版社,2009.5

线性代数的应用特征 篇3

空气污染日益严重, 人们对清洁能源的迫切需求, 而随着电力消耗的多样性、非线性设备迅速增加, 电能质量问题变得日益严重。因此, 必须把保障电能质量作为智能电网建设中的重要组成部分。

这些年来, 在电能质量检测、识别方面已经做了大量的研究, 其大致步骤分为:提取特征和分类识别。特征提取的方法大都基于各种变换如:短时傅里叶变换[1] (STFT) 、S变换[2]、小波变换[3]、HHT[4]等。目前还尚未找到一种适用于全部扰动的方法, 各种新方法仍在不断的探索。而分类识别方法主要以决策树[2]、SVM[4]、人工神经网络[5]等为主。

小波变换具有强大的时频分析特性, 可以获取电能扰动信号的多尺度特征;HHT不受Heisenberg测不准原理的制约, 适用于分析非线性非平稳的信号。文中引入了3个非线性特征参数, 结合小波变换和HHT各自的优点, 提取特征参数, 目的是能找到适合识别各种电能质量扰动信号的特征量, 以便于提高系统的识别率。高斯混合模型 (GMM) 是一种一个结构简单而实用的概率统计工具, 广泛的用于语音、说话人[6]、图像[7,8]等辨识等领域。在识别模型方面, 文中借鉴性的引入了GMM用于电能扰动的识别, 并取得了较好效果。

2 基于非线性特征参数提取

大量的研究揭示:电力系统的分叉与混沌是造成电压骤降的原因之一, 当系统受到较大的周期性负荷扰动时, 系统将出现混沌振荡等现象[9]。虽然目前还未能揭示电力系统存在的所有的混沌现象, 但是混沌是客观存在于电力系统。只要系统存在混沌现象, 就会表现出一些不正常的动力学参数, 如香农熵、Kolmogorov熵、最大Lyapunov指数等, 本文将研究这些参数作为系统识别的特征向量。

2.1 非线性特征参数

2.1.1 香农熵

1948年克劳德·艾尔伍德·香农首次将熵的概念应用于信息论中, 称为信息熵, 或香农熵。系统非线性程度越明显, 香农熵就越大。

其中, Pi表示某一时刻系统第个i事件的概率。

2.1.2Kolmogorov熵[10]

Kolmogorov熵简称K熵, 它是从热力学中引申而来的。

研究表明:K熵可以用于系统混乱程度的度量

2.1.3 最大Lyapunov指数

在实际的应用中, 只要计算最大Lyapunov指数, 当其值为正时就认为系统具备混沌特性。

λ>0, 系统存在混沌特性;

λ>0, 系统存在混沌特性;

λ<0, 系统为确定性系统;

λ=0, 系统出现周期性现象。

本文应用参考文献[11]中的小数据量法计算最大Lyapunov指数。

2.2 特征参数提取

本文特征参数由两部分组成, 一是电能扰动信号先经由小波变换, 将信号分解到不同尺度, 再求解非线性特征参数;再者是电能扰动信号经由EMD分解得到各系数, 再求非线性特征参数。具体过程如下:

1) 对原始扰动信号进行小波3层分解, 选取“db4”作为小波基, 取出小波系数 (低频系数A3+3个高频系数 (D3、D2、D1) ) 分别求香农熵, K熵和最大Lyapunov指数, 得到特征序列分别记为sx1、sx2、sx3、sx4、kx1、kx2、kx3、kx4和lx1、lx2、lx3、Ix4共12个特征。

2) 对原始扰动信号进行EMD分解, 取前3个IMF (电能扰动信号前3阶的IMF包含了大部分的信息) , 然后对每个IMF分别求香农熵, K熵和最大Lyapunov指数, 得到特征序列sh1、sh2、sh3、kh1、kh2、kh3和lh1、lh2、lh3共9个特征。

最后, 组合所有的特征值, 得到共21维特征向量。

3 高斯混合模型

高斯混合模型是单一高斯密度函数的延伸。采用m个高斯函数联合来表示:

通常假设各高斯密度函数的协方差矩阵可以表示为:

此时的高斯混合模型可以表示为:

要求得最佳的θ, 引入后验概率的概念:

最后推导得到各参数:

3 实验结果及分析

本文采用GMM作为识别模型, 按照IEEE规定的电能扰动信号模型及参数要求, 用MATLAB分别随机产生暂降、中断、谐波、振荡、切痕、尖峰、暂升、闪动等8种单一扰动和中断+谐波、暂升+谐波、暂降+谐波、闪动+谐波等4种复合扰动。每类扰动随机产生200个样本, 其中100个作为训练样本, 另外100个作为测试样本, 信号基频为50Hz, 采样频率2k Hz, 取400采样点 (0.2s, 10个周期即每个周期采样40点) 。

实验说明:把3个非线性参数看成整体, 由小波变换提取出4个 (低频分量+3个高频分量) 分别求非线性参数, 共12维特征参数记为X1 (sx1、kx1、lx1) 、X2 (sx2、kx2、lx2) 、X3 (sx3、kx3、lx3) 、X4 (sx4、kx4、lx4) ;由EMD3层分解, 分别求非线性参数得到的9个参数记为H1 (sh1、kh1、lh1) 、H2 (sh2、kh2、lh2) 、H3 (sh3、kh3、lh3) 。实验中, 小波变换各系数选取时, 电能扰动信号多为低频信号, 因此考察特征的贡献时, 每次都以低频分量为基础增加高频分量。EMD分解各系数, 只考虑两个或两个以上特征对识别率的影响情况。

本文首先研究了高斯混合模型的混合数对识别性能的影响, 对现有的数据量, 通过大量的实验验证, 系统混合数选取为8时可取得最好的识别性能。接着, 分别研究了小波各分量对识别性能的影响及EMD分解各系数对识别性能的影响, 识别结果见表1、2;然后选取识别结果较好的特征进行组合分析对系统的识别性能, 识别率见表3。

实验结果分析:表1中小波各系数对识别率的贡献情况来看, X1与X2或X1与X4结合时, 获得了95.83%和93.16%的好成绩, 而X1与X3组合时得到的识别结果相对较低, 说明了小波变换的1、2、4分量中包含了绝大多数有利于识别的信息, 最后当所有特征结合时小波变换取得了最好的识别结果97.67%;

表2中, EMD各系数对识别性能的贡献情况看, 两两结合的最好识别率是89%, 全部结合时获得了最好的识别率94.75%, 说明这些系数对识别性能都有着一定的贡献。

然后, 选取识别率较好的小波系数X1、2, X1、4, X1、2、4及EMD系数H1、2, H1、3, H1、2、3组合, 共得到9种组合分别作为识别系统的特征集, 进行训练和识别, 最后得到识别率如表3所示, 可以看到, 这些组合的特征的最低识别率是92.92%, 最好识别率是X1、4与H1、3结合时的98%。

总体来说, 组合的特征参数都获得了较好的识别率, 这些特征都是包含着信号的某种重要信息。

当H1、2、3和X1、2、4结合时, 不但没有提高识别率, 反而是降低了, 也说明了越多的特征, 信息越杂乱, 越不利于识别性能的提高。

4 总结

本文采样频率2k Hz, 小波3层分解将信号频段大致划分为0~125Hz, 125~250Hz, 250~500Hz, 500~1000Hz分别对应A3、D3、D2、D1的频段范围;而EMD分解将信号划分为由高到低频的若干个单一频率分量及余量。

在信号选择中, 正好选取了, 小波分解的低频分量A3和高频分量D1及EMD分解中的高频信息和中频信息, 大量的实验证明, EMD分解得到的第一个IMF都是信号的高频分量, 基本包括了大部分的突变信息, 而IMF3包含了信号的发展趋势。

因此互相结合后, 这些特征几乎涵盖了信号的主要特征, 最后取得了98%的最好识别率。

与传统统计参数相比, 非线性特征参数能更有效的描述不规则和非周期性的信号, 本文对信号先进行小波分解和EMD分解后各系数再求非线性特征参数, 取得了很好的识别效果, 这将为电力运行部门判断电能扰动类型提供一种新的思路。

参考文献

[1]徐永海.赵燕.基于短时傅里叶变换的电能质量扰动识别与采用奇异值分解的扰动时间定位[J].电网技术, 2011.

[2]GARG R, Singh B, Shahani D T, et al.Recognition of Power Quality Disturbances Using S-Transform Based ANN Classifier and Rule Based Decision Tree[J].IEEE Transactions on Industry Applications, 2013:1.

[3]潘从茂, 李凤婷.基于小波变换的暂态电能质量的检测与识别[J].电测与仪表, 2013.

[4]Liu Z, Cui Y, Li W.A Classification Method for Complex Power Quality Disturbances Using EEMD and Rank Wavelet SVM[J].IEEE Transactions on Smart Grid, 2015:1.

[5]Biswal B, Biswal M, Mishra S, et al.Automatic Classification of Power Quality Events Using Balanced Neural Tree[J].IEEE Transactions on Industrial Electronics, 2014, 61 (1) :521-530.

[6]吴迪, 曹洁, 王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J].光学精密工程, 2013.

[7]朱峰, 罗立民, 宋余庆, 等.基于自适应空间邻域信息高斯混合模型的图像分割[J].计算机研究与发展, 2011.

[8]朱峰, 张晓娜, 陈健美, 等.基于多阶抽样的高斯混合模型彩色图像分割[J].中国图象图形学报, 2011.

[9]王东风, 韩璞, 于朝辉.电力系统中的混沌研究与混沌应用[J].电力科学与工程, 2003.

[10]王平立, 宋斌, 王玲.混沌时间序列的Kolmogorov熵的应用研究[J].计算机工程与应用, 2006.

对于非平衡电桥的非线性特征研究 篇4

关键词:非平衡电桥,非线性特征,电阻测量

测量技术和自动控制应用在日常生活的范围面较广, 非平衡电桥则是测量技术以及自动控制方面的具体措施。在科学实验以及实际的工程中, 较多的场合都会对连续不断的物理量进行测量。虽然许多学者都在非平衡电 桥方面做出了较多的理论验证, 可是通过实验进行验证的数量较少。当下, 研究人员逐渐地通过非线性特征进行了非平衡电桥的研究。

1非平衡电桥的工作原理

在对四个电阻调节的过程中, 会将相对两点的电势相等, 此时电桥能够保持平衡的状态, 基于此会得出公式K=R1/R2 =R3/R4。根据公式能够得出, 若其中所涉及到的任何一个桥臂电阻是传感元件, 例如:R1所具备的阻值会根据待测物理量的更改而相应变化, 像是压力或者温度等变化方面, 电桥处在非平衡状态的时候, 相对两点中的电势差不能够为零, 电势差利用U对其表示, U大或者U小都会直接影响电阻的实际变化状况, 对U进行实际的检测, 就能够了解到待测物理量的变化程度。 [1]若对电源的内阻相应忽略, 此时非平衡电桥中的开路电压则是:

如果所应用的数字电压表是高内阻的, 就需要和电桥输出端连接, 此时的输出电压为:

测量之前的准备阶段中, 需要系统地调制电桥, 直到将其调为平整状态为基准, 在这样的情况下, Rxo=R4, 若电桥失去了平衡的状态, 电阻就更改成为Rx=R4+△R4, 这时, 让δ=△R4/R4 , 就会生成以下公式:

在式 (3) 中能够分析出, 桥臂电阻和不平衡电压的变化量是不能够形成线性的关系的。仅仅在 δ≤ (1+K) 的时候, δ和Ug=Uo才能够展现出近似度极高的线性关系。

2提出问题

在大专院校物理实验科目当中, 非平衡电桥的实验是较为重要的实验部分, 能够对不断更改的物理量进行间接的测量, 例如:压力或者温度方面。此方面的测量过程, 基本上就是将其转变成为电阻方面的系统测量, 可是却缺乏对待测电阻和表头电流之间的函数说明, 其中待测电阻一般用Rx表示, 表头电流一般用Ig表示。以下针对Ig和Rx之间的函数关系进行详细的分析。 [2]

若Rx和Ig以线性的对应关系呈现, 就会在Rx每次增长10Ω的时候, Ig 也对应的有20μA的增加量, 可是在正式测量的结果上显示, 和该规律有着不相符的结果。基本上在实验当中所应用的测量方式, 一般都会将待测电阻Rx和电流Ig在极小的范畴中, 指出是线性的关系, 又或者指出是近似线性的关系。可是通过实践的测量结果证实, 待测电阻Rx和电流Ig不具备线性关系的要素, 同时拥有越大的Rx, 就会产生相应程度的误差。所以, 对于范围面较大的变化电阻进行测量的过程中, 需要细致的分析出待测电阻Rx和电流Ig两者的关系, 是否满足非线性。 [3]

当实验非平衡电桥测电阻温度的系数中, 曾有某学者通过线性定标的方式开展电阻温度系统的测量, 可是, 对电阻测量的更改领域面上只是在20Ω之内。 在电阻的测量范畴在较大的测量领域情况下, 就极易会产生极大程度的误差。具体的实验流程为:首先, 将等待测量的电阻, 也就是Rx转换成为电阻箱, 基本上对电阻的取值范围会在54.5Ω范围内, 54.5Ω这一取值是在实验室当中所给予的20℃铜电阻取值范围, 对Rs有效的调节能够让电桥保证平衡的状态; 然后, 要使△Rx+ Rx=64.5Ω, 其中所涉及到的△Rx=10Ω。对电源电压进行系统的调节能够让检流计正确的进行20格的偏转, 其每一格以0.5Ω为准, 以此来完成线性的定标;最后, 对电阻继续无限的增大, 要力求让10Ω每次都增加在Rx中, 在结论处以Ig的记录为准。 [4]

3分析问题

Rx和Ig之间的关系能够通过基尔霍夫定律推导出来。基尔霍夫定律为Kirchhoff laws, 是在电路当中所涉及到的电流和电压有所遵从的相应规律, 对于繁琐电路是计算和分析的基础, 由于是德国基尔霍夫提出的定律, 所以称之为基尔霍夫定律。它一方面能够分析直流的电路, 另一方面还能够分析交流电路。此外, 还能够分析非线性的电路。通过基尔霍夫定律开展的电路方面的分析过程中, 只是和电路的连接过程有关联, 和电路的元器件构成方面不发生关系。在基尔霍夫定律方面包含着电压定律以及电流 定律, 电压定律用KVL来表示, 电流定律用KCL来表示, 电压定律具体会应用在电路的回路当中, 电流定律具体应用在电力的节点当中。 [5]

在分析中所包含的I5也就是表头中流过的Ig, 以此来求出桥臂四个电阻和Ig之间的关系, 所体现出的公式为: Ig=I5= (-R1Rg+R2Rx) / (R2RsRx+R1RsRx+ rRsRx+R2RgRx+R1RgRx+rRgRx+R1R2Rx+ rR2Rx+R2RgRs+R1RgRs+rRgRs+R1R2Rs+ rR1Rs+rR2Rg+rR1Rg+rR1R2)

公式的测量数 据会合理 地凸显出, 主要是利用待测电阻Rx以及表头电流Ig之间的非线性联系。测量数据和理论曲线无法较为优质的吻合, 其具体的原因就是因为受到接触电阻和导线电阻的影响, 也就是主要的影响因素为附加电阻。

4解决问题

对电阻的测量通过非平衡电桥开展时, 有必要搜寻出和相应的测量值基本符合的优质参考曲线。因为在一定程度上存在着附加的电阻, 若把理论曲线直接设定为参考的曲线, 会存在较大的误差值。因此, 需要利用多点定标的方式将纠偏完善解决。 [6]主要的步骤需要将待测电阻中的阻值进行预测, 具体要针对变化的区间值, 例如:54.5Ω~100Ω之间。 在54.5Ω和100Ω的区间范围内, 需要合理地选择较多的测量点, 对这一系列的测量点开展必要的定标, 例如:测量时需满足每格10Ω对其开展, 将测量点在坐标纸上详细的标出, 同时要用光滑的曲线或者折线对不同点位进行适当连接, 以此来获取和测量值有着较高适应性的定标曲线。

进行实验的实验室中多拥有着充分的条件, 可以通过计算机的协助将定标曲线合理地完成, 从而充分的拟合测量点。其中想要对测量点进行充分的拟合, 需要通过计算机将近似函数运算出来, 例如以下的公式:, 接着按照该公式 , 能够将定标曲线图绘制出来。

根据图表的综合分析, 在产生较大的待测电阻变化范畴, 或者平衡点与测量点有着较远的偏离时, 需要通过多点定标的方式, 也可以通过计算机对曲线的拟合方法开展具体的测量。 并且, 进行实验的过程中, 还能够将非平衡电桥测量系数作为补充形式的实验, 鼓励实验者通过实验的主要现象开展较为细致的分析, 利用相应的解决方法进行不断的探究, 培养实验者通过所学到的知识完善地解决问题。 [7]

5总结

根据以上的论述, 运用系统的实验通过非平衡电压电桥的测量, 针对非线性特征提出了相应的结果。在不同的角度上对非平衡电压电桥特性进 行的验证, 得出拥有越小的非线性误差, 就会拥有较低的电桥灵敏度。

参考文献

[1]李潇云, 颜鹏津, 屠华.基于非平衡电桥的铂电阻温度特性研究[J].河南教育学院学报:自然科学版, 2013, 12 (09) :123-124.

[2]任殿慧, 周巧娣, 章雪挺.一种铂电阻测温电路的非线性校正方法[J].电子器件, 2013, 11 (08) :115-118.

[3]杨达晓, 唐海燕, 杨耀辉.应用Origin软件非平衡电桥实验[J].重庆科技学院学报:自然科学版, 2013, 10 (03) :156-159.

[4]陈国杰, 黄义清, 谢嘉宁.线性非平衡电桥设计及应用[J].实验室研究与探索, 2013, 6 (05) :147-149.

[5]汪建军.用非平衡电桥设计组装铂电阻数字温度计[J].浙江万里学院学报, 2013, 4 (08) :163-165.

[6]王卫星, 冯中营.非平衡电桥温度及设计中串联电阻的研究[J].大学物理实现, 2013, 2 (04) :178-179.

线性代数的应用特征 篇5

一、音色对曲线运动变化的影响

在音乐欣赏的过程中,音色就是指音乐的色彩和特性,这是由于先天音色材质的不同而确立的音色的差异,在与后来的发音与欣赏追求中,民族的声乐艺术的音色会有很大的个性化发展趋势。

(一)传统民族艺术音色的特征

在民族音色发展的过程中,逐渐体现了明亮、清脆、集中的特征,主要表现在音色在“靠前”的属性中所具有的泛音共鸣、声音发音等方面的不同而引起的。在传统民族艺术音色的变化中,其最明显的特征优势是灵活、明亮等,被很好的保留下来,当然这种特点的音色,由于地区的不同而略有差异,甚至与剧种、流派、行当也大有不同,这主要表现在一首歌的不同转换之处,从而会产生音色的差异。例如,在剧种中的旦角,为了展示其良好的声线,可以在京剧与粤剧中采用假唱的手法,表现音色的不同特点,在不同的音色里面能展示更多不同的剧种是河南梆子和河北梆子,这就是剧种不同所引起的音色差别的不同。

(二)音色的调节方式

根据音色代表的意蕴的不同可以进行不同的调节,主要有以下几个方式的调节:

第一个方式是通过共鸣腔体进行调节,这种方式的调节常见于傣族的民族歌曲的演唱中,这种音色的表现很容易形成鼻音的特色,并且在京剧中也很容易在口腔、鼻腔、胸腔内形成共鸣。第二个方式是通过真假声音的转换进行调节。在一般的剧目演奏中,剧种的音色转变多结合真假音的转换实现,在嗓音中内涵着刚劲,演唱中体现着苍茫。第三个方式是通过鼻腔、胸腔、口腔气息进行调节,这种音色的调节方式多体现在比较广阔的音域中,比如,蒙古族的长调音色,需要加强气息的进行衬托,从而演绎出宽厚、饱满的气氛来。第四个是根据发音位置来控制音色,这种方式常见于剧中青衣的发音,通过调节发音位置的不同,展现发音的“亮润”特点,使剧目流派体现一种刚中带柔的特点。第五个方式是通过相应的共鸣焦点对音色形成必要的调节。这种共鸣焦点主要集中在两个方面,一个是鼻腔的共鸣焦点,这个焦点需要声音通过鼻腔发出,在鼻腔的共鸣里达到声音的最高点,另一个是游走的共鸣焦点,这是我国传统特色的共鸣焦点,在表演中,通过字腔、味腔的转变形成的一种特殊共鸣。

二、线性润腔的特点让歌唱曲线更加优美

在传统音色的不断变化中,通过对音色的不断调节,形成了独特的润腔手段,润腔,是指在对曲调的不断修饰和渲染烘托中,从而弥补了曲调的单调乏味的特点,能更好的发挥歌声的主体思想,使曲调更加有韵味。在润腔的形成上,润腔还可以通过歌唱的按拍灵活进行插腔,杂糅各种装饰音与其他音色的功能因素,从而更加明确的表现音乐功能的感染力,在西方的声乐作品中,对于声音乐谱的感觉更加明显,从而保持歌唱曲线的优美,形成不同的民族风情和地区风情。

三、线性歌唱的美学价值分析

在民族声乐艺术中,线性的歌唱形式可能只是民族声乐歌唱的一种外在表现形式,承载着更多的艺术内容和复杂的艺术情感,在歌唱时,通过用声音线条与旋律线条的完美结合,更多的给人以美的感受,在具体的演奏中,可以以传统的线性音调为基础,将歌唱的形式与润腔手段内容灵活应用,在音乐的结构伴奏中,更好的满足歌唱音乐中,音色及音调的变化差别,使歌唱在音乐的结构上给予虚实、扩散、紧缩等各种无限的可能性,并且在声音的制造和传播上,更加注重音色、音调的转换,从而融合为比较合理的线性艺术美学价值。具体主要是通过在歌唱时,对声音的装饰与声音的运动弹性及线条运动产生重要的动感特点,实现歌唱艺术的线性发展,更好的唤醒听觉,体现声线运动的弹性特征,激发曲线歌唱的生机,并且在无意中深化了歌词艺术的延伸意义,抒发了生活的另一种情趣,促进了线性歌唱美学价值的形成发展。

四、结语

随着我国传统艺术的不断现代化发展,我国传统音乐艺术更多的融合了现代艺术线性歌唱特征,将我国传统音乐的线性特征表现的更加流畅,更能体现一种我国传统音乐艺术的美学价值,更能起到震颤人们心灵的作用。

摘要:在我国的传统艺术审美观念里,线性歌唱的特征是最为典型的,这种线性的歌唱中,饱含着丰富的情感意识和理念,成为我国早期人类艺术的主要表达形式,虽然西方的艺术中主要以立体的艺术构造存在,但是,由于其韵律的特征具有极大的线性特点,可以说,西方的艺术也兼具单性的艺术表达形态,因此,这就是线性思维形态的艺术魅力所在,文章通过以民族声乐艺术为主要的构造形态研究分析,在线性歌唱的基础上,对整体的线性歌唱特征及美学价值进行论述。

关键词:民族声乐艺术,线性,歌唱,美学价值

参考文献

[1]王秀丽.民族声乐艺术的线性歌唱特征及其美学价值[J].剑南文学,2011,07:109.

[2]冯亚.民族声乐艺术的线性歌唱特征及其美学价值[J].艺术评论,2012,08:96-98.

人民币与国际汇率的非线性特征研究 篇6

关键词:BDS检验,R/S分析,Hurst指数,分形,非线性特征

近几年, 在汇率时间序列的非线性特征与预测研究方面, 国外研究者运用非线性动力学方法 (如关联维数、Lyapunov指数等) 主要对欧美汇率是否存在混沌特征进行直接检验[1,2,3,4,5,6,7,8,9,10,11]。但这些检验算法通常要求实际数据量非常大 (即希望数据点数N※∞) 和无噪声, 而实际的汇率数据往往只有几千点, 且含有噪声, 故运用这些方法对汇率直接进行混沌检验可能会失效。例如, MikaelBask[1,2]通过计算瑞典克朗对马克、欧洲货币单位、美元和日元汇率等货币的正Lyapunov指数, 发现瑞典克朗对马克、欧洲货币单位、美元和日元汇率四种货币存在正的Lyapunov指数, 即揭示了瑞典克朗对这四种货币存在混沌动力学特征。但是, Jonsson[6]在检验瑞典克朗对美元日汇率时发现该汇率存在负Lyapunov指数, 这与MikaelBask[2]的结果相反。MikaelBask认为两个研究的矛盾在于数据长度的不同所导致的。BrianSchwartz, etal[7]通过估计最大正Lyapunov指数和计算关联维数等方法指出英镑对美元、德国马克对美元、瑞士法郎对美元, 英镑对日元和瑞士法郎对日元等五种汇率不能满足混沌的最主要特性———初始敏感性条件, 因此得出结论认为该五种货币不存在混沌现象。ApostolosSerletis和AsgharShahmoradi[8]使用单位根检验法和稳态性检验以及计算正的Lyapunov指数, 发现加拿大元对美元名义汇率在浮动汇率制下存在混沌特性。LiangyueCao和AbdolS, Soofi[9]发现加拿大元、英镑、德国马克、日元和法国法郎等五种货币具有很高的嵌入维数, 这说明该五种货币汇率时间序列很有可能是由非线性随机系统产生的。因此, 运用这些方法不能对汇率时间序列是随机还是具有相关性特征做出正确判断, 进而也就无法判断汇率序列是否能够预测。而BDS统计检验量法能够探测其他一些统计量所忽视的非平稳性, 非线性相关性特征, 因而能从本质上检验时间序列的非线性依赖特征。

另外, 传统的金融理论基于有效市场理论, 假设收益率序列是布朗运动, 即独立并服从正态分布。然而, 近年来对大量的金融时间序列进行实证分析结果表明绝大多数金融资产的收益率序列不服从正态分布, 并且随时间变化的增量彼此不相互独立, 服从有偏的随机游走, 即分式布朗运动并且呈现非线性特征。因此, 如果某一时间序列证明是服从分式布朗运动, 那么就可以对其进行预测。R/S方法在对时间序列进行分形市场分析方面有着独到的作用。

然而, 国内在汇率的研究方面主要集中在人民币均衡汇率与购买力平价之间的关系上[12,13,14,15], 在人民币汇率的非线性特征方面的研究较少。因此, 现对人民币汇率的非线性相关性和分形特征进行研究。与此同时, 随着全球经济一体化步伐的加快, 我国的经济发展与国际经济的联系进一步增强, 各国外汇市场已经形成了相互联系、相互依赖、相互影响的全球外汇体系, 各国外汇市场成为其中的子系统。各国货币在全球体系中相互作用、相互影响, 国际上几种重要的汇率 (英镑、加拿大元和日元兑美元等等) 都在不同程度上影响着人民币汇率机制的形成。因此, 有必要对国际上这几种重要汇率进行非线性特征研究, 这对人民币汇率非线性机理的形成有着重要的影响。

1 BDS统计检验

BDS统计量是基于Grassberger Procacia相关积分的概念建立起来的一个统计量, 用于检验给定时间序列的内在非线性特征[16,17,18,19,20,21]。BDS统计量定义如下:

根据时间序列{x1, x2, …, xN}构造一个m维嵌入空间xtm={xt, xt+1, …, xt+ (m-1) }, 记Nm=N-m+1。

BDS (m, Νm, ε) =Νm[C (m, Ν, ε) -C (1, Ν, ε) m]/σ (m, ε)

其中:m为嵌入维数;ε是包含时间序列点的m维球的半径;N为样本数目。定义σ (m, ε) 为

σ (m, ε) 2=4 [K (m, Nm, ε) m+2

j=1m-1Κ (m, Νm, ε) m-jC (m, Νm, ε) j+ (m-1) 2C (m, Νm, ε) 2m-m2Κ (m, Νm, ε) C (m, Νm, ε) 2 (m+1) ]

C (m, Νm, ε) =21tsΝmΗ (xtm, xsm) Νm (Νm-1) ,

Κ (m, Νm, ε) =61tsrΝmΗ (xtm, xsm, xrm) Νm (Νm-1) (Νm-2)

其中H (x) 为Heiviside函数,

Η (xtm, xsm) ={1xtm, xsm<ε0

‖•‖表示上确界范数:‖xtm, xsm‖=max{|xt-xs|, …, |xt+ (m-1) -xs+ (m-1) |}。

从理论上, 如果接受独立同分布的零假设, 那么BDS统计量一般只要C (m, N, ε) ≠C (1, N, ε) m且0<BDS (m, Nm, ε) <∞、0<σ (m, ε) <∞, BDS检验将以概率1拒绝独立同分布的零假设。如果结果拒绝零假设, 则意味着原始时间序列在给定的显著水平下是非线性相关的。

在使用BDS统计量进行非线性检验之前须注意的是, 需要消除原始时间序列的自相关的影响, 通常对原始数据序列拟合AR (p) 模型, 在寻找到合适的阶数p后, 计算AR (p) 的残差序列并对该残差序列进行BDS检验。

2 R/S分析

R/S分析法是水文专家H.E.Hurst在20世纪40年代提出的一个无参数时间序列分析方法, 一般的形式为[22,23,24,25,26]:

(R/S) n=cnH。

其中R/S是时间序列x1, x2, …, xn的重标极差值, c是常数, n是序列长度。

一般情况下, R/S值以增加的时间增量而规模变化, H通常称为Hurst指数。Hurst指数可以通过下面的方程, 采用普通最小二乘估计近似取得:

log (R/S) n=log (c) +Hlg (n) 。

通过lg (R/S) n关于lg (n) 的图线, 很容易观察出何处发生突变, 并进一步估计出长期记忆周期长度。Hurst在对一系列时间序列研究的基础之上, 得出了对Hurst指数值的解释:

(1) 当H=0.5时, 序列属于布朗运动, 变量之间是相互独立的, 相应的相关系数是零, 现在不会影响未来, 因而, 时间序列是随机的。

(2) 当0≤H<0.5时, 序列具有反持续性, 存在“均值复归”的现象, 变量之间是负相关的。如果某一时刻, 序列向上 (下) , 那么下一时刻, 它很可能反转向下 (上) , 由于频繁的出现逆转, 反持续性序列具有比随机序列更加激烈的波动性或突变性, 它在特定的时间内所产生的变化跨度比随机序列来得小。

(3) 当0.5<H<1时, 意味着序列具有持续性, 变量之间是正相关的, 存在记忆性的特征, 如果某一时刻, 序列向上 (下) , 那么下一时刻, 它很可能继续该趋势。驱使增强的强度或持久性随H接近于1的相关而增加。H越接近于0.5, 其噪声越大, 趋势越不稳定。从理论上讲, 现在的变化将对后续变化产生持续的影响, 按照混沌动力学的观点, 就是对初始值有敏感性依赖, 不管时间尺度如何, 记忆都会发生, 所有每日的变化会对将来每日变化有影响, 同样每周的变化也会对将来任何一周的变化产生影响, 具有分形时间序列的关键特性。

因此, 对汇率时间序列进行R/S分析, 如果其Hurst指数值大于0.5, 这说明该汇率序列具有记忆特性, 即可以对其进行预测。

3 汇率数据预处理和R/S分析

3.1 汇率的样本选择和平稳化处理

本文采用美国联邦储备银行的数据样本。如表1所示共五种汇率的数据量和研究的时间段。

由于金融时间序列一般不能满足平稳性的要求, 在进行分析之前首先需要对原时间序列进行平稳化处理。在估计和回归过程中, 使用汇率的对数收益率:

E (t) =lnR (t) -lnR (t-1) ,

其中, E (t) 表示t时的汇价对数收益率, R (t) 表示t时的汇价。因为, 对R/S分析而言, 对数收益率比价格百分比变化更为适用, 可以消除或降低线性依赖性程度 (自相关性) , 而百分比变化却不能降低时间序列内部的线性依赖性程度。表2给出了这五种汇率的基本统计学特征描述。

由表2可知, 所有五种汇率都有厚尾的现象。峰度系数都大于标准正态分布的3, 偏度系数都不等于0。所有五种汇率的JB值在1%的显著性水平下拒绝收益率服从正态分布的假定, 且有“尖峰厚尾”特征。ADF检验的结果表明, 收益率序列在1%水平上拒绝存在单位根的原假设, 收益率序列是平稳的。由此可以有把握地拒绝原假设, 即五种汇率日收益率序列不服从正态分布, 这同有效市场假说是相悖的。

3.2 汇率的BDS检验

BDS检验在实际应用中需要适当选取ε。其中ε是判断白噪声的一个标准:ε取值太小会导致过多接受零假设, ε取值太大则会高估嵌入空间中向量间的贴近程度 (Scheinkman & LeBaron, 1989) 。对于大样本 (N>500) 情况, Brock等 (1992) 建议取值为序列标准差的0.5、1.0和1.5倍。在实际研究中, ε取值通常在序列标准差的0.5至2倍之间。本文给出了5种汇率在ε取值为0.5、0.75和1.0以及在嵌入维数为2到10之间的BDS值 (表3) 。

从表3中可以看出, 当ε=0.5、0.75和1.0等3个值时, 随着嵌入维数的不断增大, BDS统计值均不断增加, 人民币兑日元、英镑兑美元、加拿大元兑美元和日元兑美元的BDS统计检验值均大于临界值 (显著性水平α=5%, Zα=1.96) , 表明这四种汇率BDS统计均拒绝汇率时间残差序列是独立同分布序列的IID假设, 汇率序列具有非线性的相关关系。人民币兑欧元汇率在嵌入维数为2和3时, BDS统计检验值均小于临界值, 而嵌入维数为4到10时BDS统计检验值也明显大于临界值, 从而说明该汇率序列也存在非线性的相关关系, 为了正确地描述汇率时间序列的变动, 必须使用非线性模型。

3.3 汇率的R/S分析

进行R/S分析的一个经验法则:一般而言, 计算Hurst指数时, 迭代因子n≥10运用回归。当样本容量小时, n的小值产生不稳定估计。

经过对5种汇率数据的计算, 五种汇率的R/S线性回归方程如表4所示。

上述的参数估计结果表明, 五种汇率的Hurst指数都在 (0.5, 1) 内, 汇率时间序列属于分形的时间序列, 具有持久性和长期相关性 (长期记忆) 。长期记忆性一般指由人们的偏好和市场情绪引起的, 市场情绪是对影响外汇市场时间的一种反映, 这种反应与有效市场假说不同, 不能立即反映在汇率上, 因而会产生偏差且会持续一段时间, 偏差长期积累的效果会导致市场的长期记忆性。各国人们的偏好和市场情况不同在很大程度上是由市场结构和交易的不同导致的, 因此各国汇率的持续性有所不同。人民币/日元的Hurst指数大于其他汇率的Hurst指数, 说明人民币/日元汇率的时间序列具有更长期的记忆过程, 过去的信息对现在和未来的影响随时间衰减, 但其速率却非常慢。

Hurst指数的倒数是分形维数, 五种汇率的分形维数值都介于1和2之间, 也说明5种汇率的收益率具有分形特征, 因而是有偏的随机过程。其原因在于信息以非线性的方式呈现, 人们也以非线性的方式对信息做出反应, 所有这些最终都通过市场活动反映出来, 使得汇率所构成的时间序列呈现出非线性特征。汇率波动的 “有限记忆的功能”的存在使中央银行干预外汇市场只能影响到短期的汇率, 而不能影响汇率的长期变化。

表4也反映出五种汇率波动呈现出波动的集群性, 即大幅度的波动集中在某些时段上, 而小幅度的波动则集中在另一些时段上。这种特征具体表现为汇率价格的连续涨跌, 从而使外汇市场具有了一定的风险性。投资者能否及如何从汇市中获得最大收益, 政策制定者如何依不断变化的汇价而制定相应的经济政策, 取决于对汇率波动幅度的把握和对汇率时间序列内在特征的深刻认识。

根据表4的关联尺度参数可知, 人民币/日元汇率波动关联性最高 (0.217 6) 反映出该汇率波动受历史信息的影响程度最高, 其“长期记忆”特征也越明显。人民币/欧元汇率波动关联性最弱 (0.025 6) 。其他货币兑美元的汇率关联性介于两者之间。

4 结论

通过利用BDS检验和R/S分析法对五种汇率的收益率进行非线性分形特征研究, 研究结果显示:

(1) 对上述五种汇率的基本统计学特征分析表明, 该汇率都呈现出不同程度的尖峰厚尾的特征, JB值和ADF检验表明5种汇率的收益率是平稳序列;

(2) BDS检验结果显示, 在ε取不同值的情况下, 五种汇率的收益率BDS值都大于临界值 (除人民币兑欧元在嵌入维数为2和3时外) , 均拒绝时间残差序列是独立同分布序列的IID假设, 呈现非线性相关性特征, 说明汇率并不是随机过程, 这与相关文献[9]的研究结果并不相同;

(3) 利用R/S分析法对五种汇率的收益率进行非线性分形特征检验, Hurst指数都在 (0.5, 1) 内, 证明五种汇率时间序列属于分形的时间序列, 具有持久性、关联性和长期相关性 (长期记忆) 。这表明五种汇率的收益率都呈现出明显的非线性和分形特征, 不符合有效市场假说。

通过上面的分析可知, 汇率收益率的非线性分形特征是由于外汇市场的多元投资主体对信息反应的非线性引起的, 在进行外汇市场干预时, 中央银行不仅要研究宏观方面的影响因素, 还要对微观主体的投资心理加以研究, 重视微观结构主体在汇率波动中的作用, 同时考虑到汇率变化的这种“长期记忆”效应, 并采取相应举措, 这样才会使外汇市场的干预行为取得更为理想的政策效果。

线性代数的应用特征 篇7

早期的文本帧检测主要针对字幕帧,其技术可分为两种:一种是在镜头分割的基础上根据字幕像素在时间域上的变化和字幕追踪方法来判断字幕出现或消失的帧[[2]];另一种是利用字幕在压缩域内的特征来检测,如DCT系数特征[3]、纹理能量[4]等。但当前字幕帧检测已满足不了人们对视频信息获取的需求。文献[5—8]提出了有效区分文本帧和非文本帧的方法,其中文献[5,6]在帧图像分块的基础上分别利用相互近邻对称原则、边缘距离来判断文本块和非文本块,进而确定文本帧。文献[7]提出基于分段线性分析的文本帧分类方法,利用字符之间大小、距离近似均匀的规律定义线性原则判断文本帧,这种方法效率高,但其在定义线性原则时没有考虑中文字符的特性。文献[8]对比了HOG和SIFT特征分别与SVM、KNN、Ada Boost方法结合在数据集上进行文本帧分类,发现SIFT特征和AdaBoost相结合效果更佳,但这种算法需要依靠大量样本特征提取和训练,时间成本较高。

借鉴分段线性分析的思想,文章提出一种基于边缘特征分析和线性判断的文本帧检测算法。算法首先通过视频预处理提取视频帧,利用sobel算子对其进行边缘检测,根据文本字符的几何结构特征和启发式规则得到候选文本连通分量并构建候选文本行,结合中英文字符之间的规律性定义新的线性准则,对候选文本行抽样进行线性检测,只要存在任意一组文本行满足线性准则即判定文本帧。通过实验结果表明所提算法适用范围广,与同类算法相比检测准确率更高。

1 帧图像边缘处理与分析

1.1 视频预处理

主要对视频进行镜头边界检测与分割,文章采用鲁棒性强的基于ORB的镜头边界检测算法[9]。对于视频中的渐变、消隐类镜头由于其在视频序列中的视觉效果,很难在此类镜头中获取视频文本信息[10],因此将其去除,只保留切变镜头。

普通视频的帧率一般为23~30 fps,视频文本为了保证能被人眼感知,其出现时间往往在1~3 s,即同一文本区域出现连续23~90帧不等。为确保不错过任何文本帧,同时也为了减少计算量保证检测效率,对剩余视频帧序列每隔9帧提取一帧,并按顺序逐帧编号。

1.2 边缘检测

文本字符具有丰富的边缘信息,为方便人眼辨析,与图像背景有较明显的对比度。因此基于边缘特征的文本区域检测是使用较早、较多的方法。这种方法易于实现且运算速度快,可以满足实时处理的要求,但当背景复杂时检测精度是一大障碍,考虑到文章目的并非是确定所有文本区域,所以通过边缘检测得到文本候选区域。经典的边缘检测方法往往利用梯度算子,sobel算子[11]是一种一阶梯度算子,它利用像素邻近区域的梯度值来计算像素的梯度。若直接对灰度图像sobel算子滤波,如图1(a-2)所示,发现文本部分梯度并不明显。为充分利用帧图像的颜色信息来增强文本像素点与非文本像素点的对比度,用sobel算子对帧图像RGB空间各颜色分量像素进行梯度遍历,选择像素点在三个颜色分量中最大的幅值作为该像素点的梯度值,形成间接梯度图,如图1(a-3)、图1(b-3)所示。为避免二值化最佳阈值选择的困扰并考虑便捷性,采用无监督的k-means算法[12]对融合梯度图中文本像素点和非文本像素点进行聚类,实验过程中发现k=2效果最佳,结果如图1(a-4)、图1(b-4)所示。

1.3 候选文本连通分量

所得到的边缘图像含有文本边缘的同时存在大量非文本边缘的干扰,需要对其进行筛选。首先利用连通分量质心位置是否与分量重叠快速滤除直线成分[13];利用文献[7]提及的基于分量短轴的启发式规则滤除不规则的边缘;通过观察,文本字符边缘通常是排序规律的、闭合或近似闭合的包围盒,所以提出基于边缘特征的规则来滤除非文本边缘。方法在像素点层面进行处理,采用扫描像素点的8邻域判断边缘连通分量。具体规则:

(1)文本连通分量像素点数目有限。当连通分量像素点数目低于3时通常不会构成文本字符,即视为噪点滤除;视频中的文本字符边缘,其连续长度应该有限,即连通分量像素点数目多于一定数目则被滤除。

式(1)中,Num_CCi表示连通分量CCi像素点总数目,W、H分别是原始帧图像的宽度和高度。

(2)文本字符宽高比有限。文本行中的文本字符样式鲜有突变,通常符合一定的宽高比,所以限制连通分量的宽高比,去除过于狭长的非文本连通分量。

式(2)中,W_CCi、H_CCi分别是连通分量最小外接矩形的宽度和高度。考虑中文、英文以及阿拉伯数字这三种文本中的字符“一”、“i”、“1”是比值最高的,通过计算其比值一般不超过8。特殊情况下字符排列紧密造成多个文本边缘粘连,但数量通常不超过5个字符,所以该比值大小也有限。基于此,通过测试,选取阈值为10。

(3)文本连通分量面积有限。视频文本部分(包括人工文本和场景文本)通常都会包含两个或两个以上文字,占据帧面积有限,因此字符上限设为帧图像尺寸的1/4;考虑到字符面积小于9像素时,识别系统很难进行正确识别[14],所以设定字符最小面积为10像素。即:

式(3)中,S_CCi=W_CCiH_CCi。考虑到当字符边缘断裂时则无法计算连通分量的面积,所以利用最小外接矩形面积近似于连通分量面积。

通过上述所有规则可以滤除非文本帧中大部分非文本成分,保留文本帧中大部分文本成分,形成候选文本连通分量,如图2(a)、图2(b)所示。

当然,受视频质量的影响,这些严格的规则也会将一些文本边缘滤除,但文章目的是甄别出文本帧,而非如文本检测那样要求标注所有的文本区域,部分文本边缘的滤除不会对整体算法检测效果产生实际影响。

2 线性判断

文本帧中的文本成分通常有一定的规律性,比如同一文本行的字符在大小、间距、方向、颜色等方面保持一致性。相反,非文本帧中的成分则没有这些规律特征。为了利用文本行的这种特征来区分文本帧与非文本帧,需要将同一排列方向上、相邻的候选文本连通分量进行组合,形成候选文本行,对候选文本行进行线性检测,判断是否为文本帧。

2.1 候选文本行

文献[7]中认为同一文本行中两个相邻字符边缘分量,其质心距离比相邻文本行间的距离要小,利用这一特征以及文本字符大小近似规律对邻近的候选连通成分进行分组。这种算法对英文字符以及阿拉伯数字效果很好,但部分中文文本是由互不连通的结构独立体组成,笔划分散、内边界明显,造成单个字符内多个连通分量出现,仅依据连通成分质心距离构造候选文本行显然不够准确。文章利用质心位置和最小外接矩形集合邻近的文本连通分量,构建候选文本行。

假设连通分量CCi的质心Cen_CCi坐标为(cxi,cyi),最小外接矩形为Bi,取左上角、右下角坐标确定Bi位置。

(1)连通分量的外接矩形会出现近邻、包含、相交三种情况,如图3所示。

这三种情况中字符近邻情况是最佳分析处理的环境,但单个字符因内部包含、相交情况而被重复或不准确定位,特别是中文字符,这会影响后续候选文本行生成的准确度,因此添加限制条件。

(1)连通分量的外接矩形互相包含时,将被包含部分删除,此时不会有损失。即:

式(4)中,B1是里层分量的外接矩形,B2是外层分量的外接矩形。

(2)当连通分量CCi、CCj的外接矩形相交时,经过大量样本观察发现,单个字符内相交分量间的质心距离不超过相交分量的最长边。为了避免将两个相邻单个字符分量外接矩形出现相交情况包括在内,结合文献[15]关于文本块融合的算法,规定(这里以水平方向为例,其他直线方向的过程与此类似):

式(5)中

(3)对上述(1)、(2)整合后得到新的连通分量外接矩形,若同时满足:

则判定CCi、CCj为近邻。

(2)判断近邻的连通分量CCi、CCi+1、CCi+2、…、CCi+k(k≥1)是否构成候选文本行。在同一文本行中,相邻字符间距有限,质心间的夹角幅度很小,且字符大小几乎一致,因此规则如下:

式(10)中,

,Fi=W_CCi+H_CCi,阈值根据经验设定,。

若满足公式(10),则判定CCi、CCi+1、CCi+2、…、CCi+k为候选文本行。为防止重复遍历,对满足规则的连通分量进行标记,不再参与判断规则。遍历完成后形成候选文本行的集合Xi。

2.2 线性检测

对于候选文本行X1,若其中至少含有三个连续的连通分量,则:

(1)计算每个连通分量CCi与其最邻近连通分量CCj间的质心距离Di=D(CCi,CCj)。

(2)计算每个连通分量CCi的特征尺度Fi,Fi=W_CCi+H_CCi。

对文本帧和非文本帧中各候选文本分量CCi的特征Di、Fi进行标记,图4(a)~图4(c)从左至右显示文本帧的原图、候选文本行以及标记的折线图,图4(d)显示非文本帧的相应结果,从折线图发现文本帧中文本分量各点坐标差异有限,呈某种线性关系;而非文本帧中各点则没有这种规律,差异较大。

(3)为快速判断线性关系,定义:X1中的第一个、第二个连通分量形成差值V1;第一、二、三个连通分量形成差值V2;X1中所有分量以相同的方式形成差值并构成差值集合V={V1,V2,…,Vn-1},其中n为X1的所有连通分量数目。即:

(4)若集合中的差值的方差有限,小于阈值T,则各连通分量呈线性关系,X1被认为是一个文本行或文本块,由此标记该帧为文本帧;若差值方差超出阈值T,则X1中分量不符合线性要求,并选取下一候选文本行计算;若帧中所有候选文本行中没有一个满足线性要求,则标记该帧为非文本帧。阈值T在实验基础上获得。

利用线性判断检测文本帧的优势:

(1)构建候选文本行有助于找到相同排列方向上的连续候选文本分量进行线性检测,便于文本帧的确定。

(2)因为算法目的是检测文本帧,而并非检查所有文本区域,所以选取满足条件的候选文本行即可线性检测,这能减小构建候选文本行时产生误差的后续影响。

(3)当帧中包含多文本行且方向不同时,算法一旦找到一组连续分量满足线性要求,则输入帧被标记为文本帧,不需要验证其他文本行中的分量,这很大程度上能提高了检测效率。

3 实验结果与分析

实验先确定阈值T的最佳取值,再分析文本帧检测算法的性能。性能指标采用常用的召回率(R)、准确率(P)、F指数(F)[16]。由于目前国内外还没有公开的包含中文文本的视频图像数据库,所以实验素材由两部分组成:一、图像数据集:从自然场景文本图像库ICDAR2003、MSRA-TD500选取部分图像以及不同种类视频中选取单帧图像,共计600个文本帧、600个非文本帧和300幅含场景文本的静态图像;二、视频数据集:4个时长短的不同类型视频。

3.1 阈值T选择

从300个文本帧中选取了319个文本行,对每一文本行进行处理和计算得到其连通分量的差值方差范围在0.9~5.2之间。设定T范围在0.5~6之间,选取300个文本帧和300个非文本帧,用不同的T值得到文本帧检测准确率,如图5所示,当T=4.5时获得相对较好的检测精度。

3.2 所提算法的性能分析

当处理含有多文本行的视频帧时,如图6所示,所提算法只需找出符合条件的候选文本行即可判断,并不需要确定所有文本区域,这在时效上有明显优势;结合图4、图6(a)和图6(b)可知所提算法对视频中包含人工文本、场景文本、中文文本、英文文本的视频帧都能有很好的检测效果。但在处理文本字符数量过少、背景存在重复模式物体时会出现漏检和误检,分别如图6(c)和图6(d)所示。

将文献[5]中文本帧分类算法、文献[17]中最大稳定极值区域(maximally stable extremal regions,MSER)文本检测算法与文章所提算法进行对比实验。实验中均采用相同的预处理方式提取帧图像。表1给出了四个不同测试视频的具体数据,其中总帧数是剔除渐变和消隐类镜头后的数目,文本帧数是人工标记基础上所得数据。表2给出了三种不同算法处理四个测试视频的实验结果,其中m表示返回总帧数,n表示返回文本帧数。

从表2中可知所提算法的性能要优于文献[5,17]中的算法。原因分析:1、文献[5]算法将视频帧分割成固定大小的图像块,这会导致文本成分被切割分散开,丢失原有的文本属性,降低了文本帧判断时的准确率。2、文献[17]中文本检测算法会受到非文本帧的干扰,影响检测性能。这同时也反映出文本检测方法不适用于文本帧检测。

4 结束语

线性代数的应用特征 篇8

近20年来,非线性动力学研究在理论和应用两个方面均取得了突破性进展。这促使越来越多的专家学者从不同的角度对基于非线性动力学的应用进行了深入的研究与探讨。采用非线性动力学理论和方法,对工程科学、生命科学、社会科学等领域中的非线性系统建立数学模型[1],一系列成功的实践使人们认识到:许多过去无法解决的难题源于系统的非线性,而解决难题的关键在于对问题所呈现的分岔、混沌、分形、孤立等复杂非线性动力学现象具有正确的认识和理解[2]。

由于人类语音的产生是一个非线性的过程,这包括了非线性生物力学、空气动力学、声学、以及生理学的因素,同时说话人语音信号中包含了准周期(浊音)、非线性以及噪声(清音)等基本特征信号,研究表明,在说话人的语音信号中具有类混沌的特性[3],因此,对语音信号进行非线性分析是非常必要的。但是,尽管出现了一些理论来证实这些声学非线性特征的有效性。目前还没有广泛应用于说话人识别,主要是因为其高维计算的复杂和非线性系统分析的困难。目前,基于非线性动力学的混沌、分形数学在许多物理现象以及语音信号中得到了应用,已有部分学者提出采用动力系统模型分析语音信号,例如基于非线性动力学提取广义维数描述语音信号,并且将这些特征应用于说话人辨认,研究结果表明,在与文本无关的实验中,正确识别率仅有56%,表明广义维数这组参数对区别不同人的声音是有用的但是效果不佳[4]。本文试图从非线性动力学理论入手,提取说话人语音信号更加完整、有效的特征,以提高识别系统的识别率。

1918年,Duffing在经典力学中引入了一个具有摆动的非线性振动方程,现称为Duffing方程,该方程是混沌现象的一个典型例子[5]。 本文从duffing方程着手,同时结合人耳的听觉特性,建立非线性系统的数学模型,实现对说话人语音信号的非线性分析。

1 基本原理

Duffing方程的一般形式为[6]:

d2xdt2+γdxdt+κx+ζx3=FcosΩt(1)

式(1)中γ是阻尼系数;κζ为常数,一般取κ=1,-1;ζ=1;FcosΩt是系统的外力项; Ω是外力项频率。

在方程(1)中,令γ=0.1,κ=-1;ζ=1,F=1,Ω=0.5,在matlab里面进行求解,可以得到其时序图和相位图如图1所示。

从图1中看出,方程的解是一无界函数(或无解),表明系统的振动极不稳定;同时其相位轨道也是极不稳定的,稳定轨道被嵌在一个混沌吸引子之中,表明系统在做混沌振动,证明方程( 1)存在混沌解。由于语音信号的类混沌特性,完全可以考虑构建Duffing模型来获取语音信号的特征。为了简化系统,我们考虑采用无阻尼情况的下的Duffing系统。

无阻尼情况下duffing方程为[7]:

d2xdt2-x+x3=0(2)

文献[8]中采用逐次近似法和格林函数法,得到了方程(2)的近似解为

x(t)=Acosωt-A332cos3ωt(3)

其中A为待定常数。

将式(3)进行拉氏变换得:

Χ(S)=ASS2+ω2-A332SS2+9ω2(4)

A2=32,式(4)简化为:

Χ(S)=bSS4+10S2+9ω4(5)

式(5)中b=322ω2

如图2为当ω=100 时X(S)的幅频曲线。从图2可以看出,信号经过该系统,可以识别出频率为1002πHz的信号,进而获取信号在该频率的特征。通过调整常数ω的值,可以获得一系列不同中心频率的带通滤波器组,从而获得信号的多属性特征参数。

2 特征提取过程

基于上述原理及推导,将非线性振动Duffing模型运用到提取说话人语音信号特征的提取过程中,流程图如图3所示。

(1)防混叠滤波是指滤除高于1/2采样频率的信号成分或噪声,一般采用低通滤波器实现。

(2)为了提升高频部分,使信号的频谱变得平坦,将语音信号经过预加重数字滤波器H(z)=1-0.9375z-1。

(3)根据人耳的基底膜特性,可以认为人耳基底膜的振动实质上是由多个duffing模型的线性叠加组合而成。每一个duffing模型,构成一个听觉共振点,其输出就是该共振点的频率,所以非线性共振系统是由一个滤波器组实现的。其中单个滤波器的传输函数为:

Η(S)=bSS4+10S2+9ω4,其中b为待定常数,滤波器的中心频率f0=aω2πHz,其中a为待定常数。

同时考虑到人耳的听觉特性,若要使人耳的听感呈均匀的线性变化,那么声音强度必须按照指数变化[9]。图4为32个Duffing 模型叠加而成的滤波器组幅频曲线,其中横轴是对数化频率,纵轴为各个滤波器频率响应的峰值。由于说话人语音的基音频率一般为40—500 Hz, 在40—500 Hz范围内,每隔20 Hz应有一点,即应由23个滤波器组成,且是线性的;500—1 000 Hz(第一共振峰),应是在第一段中所检测到的某一点乘2倍,再选取相邻的4个点(左右各2个点,共5个滤波器组成);1 000—1 500 Hz(第二共振峰),应是在第一段中所检测到的某一点乘3倍,再选取相邻的2个点(左右各1个点,共3个滤波器组成);1 500 Hz以上,应是在第一段中所检测到的某一点乘4倍,由一个滤波器组成;所以滤波器组数的维数为32。

(4)将经过系统后的信号,进行分帧,帧长256点,帧移100点,加哈明窗;再经过离散傅里叶变换(DFT)得到频谱特性,求出频谱平方,即能量。

(5)将能量取对数,即得到特征参数的输出了。

3 仿真结果

仿真实验的语料库来源于,(1)贵州省公安厅提供的语料;(2)学校部分学生随机利用MP4所得的录音,语料时间各不相同。识别模型采用高斯混合模型(GMM),进行与文本无关的说话人识别实验。

在与文本无关的说话人识别实验中,说话人语音信号经过幅频特性如图4的系统所得的特征在识别系统中的识别率高达84%,识别率明显高于基于动力系统模型的广义维数特征在识别系统中的识别率。

同时,典型的MFCC参数提取的核心技术,是利用三角滤波器组,实现频谱的转化。基于非线性共振Duffing模型则是一组非线性的滤波器组,更能够符合人耳的听觉特性。我们这两种特征参数在识别系统中进行了比较。图5为某男生发音“开门”的语音信号经过特征提取过程(非线性共振系统的幅频曲线如图4所示)所得到的特征参数曲线输出。图6为同一语音信号的MFCC参数输出曲线。

对比图5、图6,可以从直观上看出,同一语音信号经过非线性共振系统所得的特征信息量更加丰富。

图7所示是不同时间长度的语音信号,时间长度分别为5 s、20 s、50 s,其在32维非线性共振系统所得到的特征参数与MFCC(Mel滤波器组维数为24)在识别系统中进行了识别率的对比。

从图7中可以看出,当非线性共振系统的滤波器组为32维的情况下,相同时间长度的语音信号较MFCC特征,均具有较高的识别率,原因是在相同的均值下,Duffing模型比MFCC具有更小的均方差;且语音信号时间长度越长,识别率越高。

4 结束语

本文所提出的特征提取方法所得的特征,通过实验验证了优于基于动力系统模型的广义维数特征,同时在语音信号较长的情况下,具有较高的识别率。与MFCC特征提取方法相比,更能符合人耳的听觉特性。在以后的研究过程中,将通过调整滤波器组维数的方法,来提高特征在系统中的识别率;同时也考虑在不影响系统识别率的情况下,将滤波器组降维的算法,以降低计算的复杂度。

摘要:针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。

关键词:非线性共振,语音信号,特征提取,识别率

参考文献

[1]曹军义,谢航,蒋庄德.分数阶阻尼Duffing系统的非线性动力学特征.西安交通大学学报,2009;43(3):50—54

[2] Zhang Ying,Xu Wei,Zhang Tianshu,et al.Stochastic Chaos withIts Control and Synchronization.西北工业大学学报,2008;26(6):659—667

[3]黄仲.基于混沌系统分析的非线性语音编码研究.长沙:中南大学硕士论文,2008

[4]侯丽敏.基于非线性理论和信息融合的说话人识别.上海:上海大学博士论文,2005

[5]陈艳锋,郑建华,吴新跃,等.无阻尼Duffing方程高精度近似解研究.机械科学与技术,2008;27(12):1591—1594

[6] Hu Jin,Wang Keren.Carrier detection method of binary-phase-shift-keyed and direct-sequence-spread spectrum signals based on duffingoscillator.Proceedings of ITS/IEEE Telecommunications.Haikou,China:IEEE,2006:1338—1341

[7]杨国海,夏清华.无阻尼Duffing方程的多值共振解的稳定性研究.湖北大学学报(自然科学版),2008;30(1):46—49

[8]孙国耀,黄迺本.非线性振动方程的格林函数解.中山大学学报:自然科学版,2003;42(2):165—167

上一篇:工作面顺槽下一篇:初中语文教师