语音效果

2024-08-22

语音效果(精选七篇)

语音效果 篇1

每种语言都有一个复杂的语音系统,小学英语的教学大纲明确强调要让小学生打好语音基础。词汇和语法都是需要语音表现出来的,语言如果没有了语音,就是死的语言,它的交际作用也会受到极大的影响。一个人如果发音不准确、语调不流畅的话,那他就很难与人正常地交流。吉姆森教授说过:“无论说哪一种语言,你都必须懂得接近百分之百的语音,只要懂得百分之一的词汇和百分之五十的语法就够了。”可以看出学好语音对英语的学习多么重要,所以语音教学是小学英语教学人们阶段的重点内容。

二、小学英语入门语音教学概述

语音就像连接砖与砖之间的粘合剂,将词汇和语法联合起来形成语言,是语言存在的基本形式。教好小学英语,语音教学是关键。做好语音教学,就要先清楚语音教学的一系列内容。

1.小学英语语音教学内容。小学英语入门语音教学即包括基础语音知识教学也包括基本语音能力的教学。基础语音知识是形成基本语音能力的基础,帮助学好基础的语音知识,形成语音能力是小学英语教师要完成的教学目标。小学英语基础语音知识包括字母、单词、句子这些元素的重音、节奏、语调等内容,而基本语音能力包括小学生英语学习的听音、辨音、读音的能力。也就是说,教师要在传授学生基础语音知识的基础上,培养学生听、读的能力。

2.小学英语人们语音教学的教学原则。这一阶段的小学生的思维方式较具体形象,抽象思维能力较弱,记忆与模仿能力较强。教师可以根据小学生的这一特性,遵循一定的原则,引导小学生对语音知识的识记和练习,从而提高英语入门语音教学的有效性。

(1)示范与模仿原则:教师在小学英语语音教学中进行有效的示范,让学生通过观察教师的示范进行模仿。教师可以对发音进行示范,小学生根据教师所示范的口型和发音,掌握正确的发音并进行模仿。

(2)对比原则:小学英语的学习与汉语的学习存在着巨大的差异,在小学入门英语语音教学中,教师可以引导学生将英语语音学习与汉语进行对比,让他们体会英语语音独有的特点。

(3)整体原则:单词的学习可以促进音标的学习,句子的学习可以促进单词的学习,音标、单词、句子是一个有机的整体,仅仅进行语音教学是不能真正完成英语的教学目的的,因此,小学英语语音教学应该把握字母、音标以及句子的语法的整体性原则。

三、提升小学英语语音教学的有效性策略

良好的开端为成功创造了一半条件,语音学习是小学生学习英语的重要开端,因此,在小学英语语音教学中,采取有效的方法提升小学英语语音的教学效果至关重要。

1.营造语音学习语境,提升学生语言的感受能力。流利说话是天天实践的结果,要说一口流利、地道的英语,正确地发音,需要经过长期的实践运用,所以教师要努力为学生营造一个语言实践环境。我们可以尽量给他们创设英语学习环境,让学生开口说英语,通过不断的对话来加强语音的练习。在小学英语语音教学中,教师要充分利用示范与模仿这个突破口,尽可能地结合配套的教学录音磁带。但教师在向学生播放教学录音带时不能给学生讲解过多,更不能读出来给学生听,可以引导学生脱离课本,多次细听。直到他们能够流利地说出来时, 才要求学生模仿录音的语调、语速、语气试着将所听到的内容说出来。

2.提高学生单词的拼读能力。每个单词的音素构成不同, 教师要全面掌握每一个音素的读音,清楚每个单词的音素构成,采用有效的教学方法,帮助学生读准每一个单词。

学习是一个循序渐进的过程,小学生对48个音素的学习、 吸收是一个渐进的过程,不能要求学生一下将这48个音素全盘吸收,合理地安排每节课音素学习的数量,让学生在轻松的状态下习得音素知识,可以增强他们学习的自信心。

英语发音有很多的规律,当然教师不可能让学生在短时间内掌握所有的规律,但可以先将一些简单、容易被学生接受的规律逐步传授给学生。例如,在学习China时,教师可以引出another,woman,breakfast等单词,让学生领会元音字母a在非重读音节中的读音。

英语单词中会有相同发音的单词,让学生根据已归纳出的字母或字母组发音的共性与规则,独立地解决这些发音规则相同英文单词的拼读问题。

四、结论

学生在模仿语音时,会注意自己的发音动作,自觉地控制自己的发音器官,因此,教师有必要向学生介绍发音的方法和发音器官的动作。虽然英语有些语音室汉语中所没有的,但经过正确的指导,反复地训练也是不难学会的。学生的发音很大程度上是受教师的影响,所以,小学英语教师要本着高度负责的态度,认真做好小学英语的语音教学,全面掌握语音教学的有效策略,不断为祖国培养更多高素质的英语人才。

摘要:语言的学习是从学习发音开始的,小学是学习英语的入门阶段,所以,学好基础的语音知识是学好英语的基础。小学是我国小学生接受正规英语教育的起始阶段,在这个阶段里,学好英语语音知识将有利于其将来更好地学习英语。对小学英语教师来说,根据小学生的特点,采用有效的教学手段来提高小学英语语音教学效果,帮助学生打好学习英语的基础具有深远的意义。

语音效果 篇2

一、音素

英语的音素有两大类:元音和辅音。分别有20个元音和28个辅音。它们在音阶中各司其职。每个音节多以一个元音为中心并常常配以辅音。在听力训练中首要任务便是正确地掌握每个元音和辅音的读音。如比较容易混淆的|ei|、|e|、|i|和|w|、|t|,还有比较容易出错的|s|、|z|、|v|、|dz|、|ts|等。熟练地掌握这些音素,是保证听力训练效果的基础要素,学生在听力训练中才会清晰地分辨听到的信息而不会混淆和迷惑。

二、音节

英语中音素可以形成不同的组合,叫作音节。单音节是由一个元音(或再加上前后一个辅音)构成,如I|ai|、by|bai|。双音节是由两个元音(或再加上前后一个辅音)构成,如answer。多音节是由三个或三个以上的音节构成,如education。开音节有两种,元音字母后没有辅音字母时为绝对开音节,元音字母+辅音字母(r除外)+不发音的字母e时为相对开音节,如绝对开音节no,相对开音节like。闭音节是指元音字母后有辅音字母时的音节,如hot。响亮的辅音|l|、|m|、|n|称作成音节,在词尾非重读的情况下,与前面的辅音结合可构成音节,如cotton。以上音节知识直接关系到听力训练时对语句结构的整体认识和理解,在听力训练时要求学习者要用心分辨,做到灵活有效地掌握。

三、音的连续读

以英语作为母语的人使用语言时,常将属于同一意群的词连在一起说,词与词间不留空隙。换一种说法就是:一是有时在关系相当密切的一组词中,如果前一个词以辅音结尾,后一个词以元音开头,这两个音常常连在一起读,这就是所说的音的连读,如look at it;二是有时一个音受到另一个邻近的音的影响而改变了发音,这就是所说的音的同化,如meet you。如果英语学习者不懂得这些语音知识,就很容易错误地理解所听到的语音信号。所以,在听力训练中学生要总结此类语音规律,培养语感,不断改善自己音的连续读技巧,从而提高听力理解能力。

四、单词的重音

英语的多音节词中往往其中一个音节显得重要一些,响亮一些,音素听起来清晰一些,此为重音。单词重音是词汇意义的重要组成部分。单词的重音认识错了,不但会误辨单词,甚至听者听不懂说话人想说的内容。单词的重音也有规律可循,一般情况下,有五个音节构成的单词在第三个音节重读,如university;三个或两个音节构成的单词在第一个音节重读,如difficult和cover。所以,学生在听标准读音时,要专心记忆、反复跟读,以培养正确辨别重音的能力,提高听力质量。

五、弱读

弱读主要取决于上下文和句子所表达的意思。单词在句中可能重读,也可能弱读。有些英语单词本身具有两种或两种以上不同的发音。以单词some为例,some在重读或单独出现时,其元音的发音与单词sum一样。但当some在句中作为弱读单词时,其元音就显得短些、模糊一些。弱读音节中最常见的音是中元音,一个单词在重读或弱读具有不同的发音时,这些不同的形式就是单词的弱读或重读,这一点也是学生在听力训练过程中要格外注意的。

六、句子重音

为了更好地表达话语的含义,在一个句子中,往往某个单词被刻意强调或淡化。一些代表重要信息的单词多被重读,这就是所说的句子重音。在讲到话语节奏时,句中的实义词多重读,如名词、形容词、数词、动词等;虚义词多弱读,如冠词、连词、感叹词等。但学生不能肤浅地看这一规则,更应了解其精髓。有时实义词在句中不代表什么重要信息,而某些虚词反而包含着重要意义,此时句子重音就可能放在虚词上了。一些学生经常忽略句子重音的常识,造成了听力理解上的错误。

七、语调

语调对于表达主语的意图极为重要,说话人可以通过语调来表示他在了解情况还是在确认某一事实,是在寻求看法还是在发表评论,是同意还是反对某一观点,是态度坚决还是犹豫不决等。语调的变化虽然不影响词汇含义,但是会直接从内在含义上影响语言交际和听力理解。学生只有在反复听力训练中逐渐提高对语调的把握和控制能力,才能深层次理解语音材料的信息。

八、结束语

总之,学生充分掌握了以上的语音知识,就像是一台电脑有了中央处理器,可以在大量的听力训练积累的过程中对积累的材料和经验进行加工处理,从而使英语听力的训练效果事半功倍。

摘要:语音可细化为音素、音节、音的连续读、单词重音、弱读、句子的重音和语调,学生只有充分掌握以上的语音知识,才能对积累的材料和经验进行加工处理,使英语听力训练达到事半功倍的效果。

关键词:语音知识,听力训练,英语教学,综合能力

参考文献

[1]赵锦凌.谈运用英语语音知识训练来提高学生听力能力[J].辽宁师专学报:社会科学版,2008(02).

语音效果 篇3

1 资料与方法

1.1 软件系统开发

系统硬件部分采用计算机板载声卡,多媒体音箱(或病区广播系统)。软件运行环境为Windows XP以上的平台,开发工具为VB 6.0,采用医院HIS系统的SQL Server数据库作为数据源。选用Neo Speech语音库的Lily语音引擎。该语音引擎为汉语普通话女声,可朗读简体、繁体中文,支持中英文混读,音质极好,具有接近播音员水准的声音效果。

编制相应的软件程序,调用Microsoft Speech SDK 5.1的动态链接库,利用Windows XP或更高版本系统中安装的TTS引擎将需要提醒的事件,由文本转换为语音进行播报提醒[3]。该软件既可从HIS数据库中直接读取有明确执行时间的医嘱信息,完成自动定时,也可临时输入需定时提醒的时间(支持定时或延时)及需提醒的事务。当一个或多个患者的定时时间到了以后,系统及时调用MS SAPI进行语音合成播报,通过多媒体音箱(或与计算机相连接的病区广播系统)会发出如“某某号床患者某项治疗时间到”的提示声音,并在电脑屏幕上闪动显示提醒医护人员。

1.2 一般资料

因神经内科患者意识模糊者居多,可将患者主动提醒护士执行的影响因素大大减少。因此,提醒系统开发完成后,选取湖北医药学院附属襄阳医院神经内科作为试验病区进行效果验证。该病区定编床位60张,护理人员25人,其中高级职称2人,中级职称6人,初级职称17人。选取该科2010年10月~2011年1月的资料作为统计资料来源,其中2010年10~11月为使用语音提醒系统前,该时段出院患者262人次,其中脑梗死146人次,脑出血62人次,蛛网膜下腔出血26人次,其他病种28人次。2010年12月~2011年1月为使用语音提醒系统后,该时段出院患者259人次,其中脑梗死140人次,脑出血61次,蛛网膜下腔出血28人次,其他病种30人次。使用提醒系统前后护理人员未发生变动,患者的出院人次、病种分布及医嘱情况差异均无统计学意义(P>0.05)。

1.3 方法

对使用提醒系统前后(2010年10~11月为使用前,2010年12月~2011年1月为使用后)的执行医嘱遗漏数量、执行医嘱延迟时间(min)进行统计。同时,对护理人员使用提醒系统前后不同的提醒方式进行便利性和满意度的调查。其中,执行医嘱遗漏是指当天医嘱因疏忽遗忘而完全未被执行。执行医嘱延迟是指当天医嘱虽然执行,但未按医嘱规定的时间及时执行。

1.4 统计学方法

统计采用SPSS 11.0统计软件进行分析。计量资料采用均数±标准差(x±s)表示,组间比较采用t检验,计数资料采用百分率表示,组间对比采用χ2检验。以P<0.05为差异有统计学意义。

2 结果

语音提醒系统使用前后所发生的医嘱遗漏执行、延迟执行及护理人员对不同提醒系统的满意度情况见表1。提醒系统使用后医嘱遗漏执行较使用前大大减少(P<0.05),医嘱延迟执行时间也明显缩短,使用前后的差异有高度统计学意义(P<0.01)。护理人员对使用语音提醒系统的便利性及满意度的评价方面,也给予较高评价,使用后较使用前的评价差异有统计学意义(P<0.05)。

3 讨论

临床上医生根据不同病情的患者制订了不同的医嘱,每个患者的治疗方式、治疗项目及治疗时间均不同。医疗活动中出现的需定时执行的工作,可采用治疗卡记录方式来进行记录提醒,这种方式很容易遗漏或错过时间。也可采用石英定时钟进行定时提醒,它可以多点定时,能准确将1 h内任意时间预报给操作人员[4]。但该方式的不足之处有:只能限制在1 h内,提醒声音单调刺耳,增加了病房的噪音污染[5],降低了护理人员对报警音的敏感性。各种报警音和提示音容易混肴,甚至掩盖医疗设备发出的报警声而导致医疗差错。使用传统的石英钟等普通的定时器进行提醒服务时,护理人员需返回护士站查看到底是哪个患者的什么治疗时间到了,再去进一步处理,否则很容易造成误操作。

TTS技术是将文本转化为语音的技术,涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是信息处理领域的一项前沿技术。利用TTS技术合成清晰的语音,通过多媒体音箱或病区广播系统播放出“某床某个治疗时间已到”的人声语音报警提示,从根本上区别了定时提示音和仪器报警音,使各种提示报警音易于辨识,大大提高护理人员对各种报警音的敏感性,确保100%的报警处理率。

从表1可以看出,人声语音提醒系统使用后,医嘱遗漏执行情况明显减少(P<0.05)。使用后发生的1例遗漏执行,是因为当天接连收治危重患者工作过于繁忙而导致遗漏。医嘱延迟执行时间显著缩短(P<0.01),所有延迟执行的医嘱护理人员均已听到语音提醒,但迫于正在抢救患者等特殊情况而无法立即执行医嘱导致延迟执行。护理人员对语音提醒系统使用上的便利性及满意度评价也较传统方式高(P<0.05)。有部分人员(主要是高年资护理人员)觉得不太便利,其原因可能是这部分人员年龄偏大,对电脑操作不是太熟练。

“人声语音定时提醒”系统已广泛运用到临床护理工作中。如留置导尿患者为锻炼膀胱功能要求定期需夹闭及开放尿管、膀胱冲洗、药物皮试,甘露醇等需定时分次给药及糖耐量、皮质醇等需特殊时间的标本采集等。所有诸如此类只要对时间要求准确的都可以应用。护士只要将需定时执行的医嘱录入电脑,便可放心地做其他治疗和护理。定时一到,人声语音提醒直接明了地指出需要进行处理的护理操作[6],护理人员可直接进行处理,极大提高了工作效率,使工作有序而不杂乱。该系统运用到护理工作后明显减少了患者的不满,体现了“以人为本,以病人为中心”的服务理念。

该系统利用现有的电脑硬件,无须专门投入其他硬件设备,经济性好。该提醒系统根据不同的患者和需求可按时提醒医护人员完成各项医疗护理操作,避免了护理工作中的差错和遗漏发生,从而对患者的治疗更加到位,得到了操作人员的一致好评。

参考文献

[1]张秀英,张继红.治疗卡及输液瓶签上签名预防差错事故的发生[J].全科护理,2007,5(17):67.

[2]程艳敏,刘岩,林静,等.英国医疗不良事件报告系统及其对我国的启示[J].卫生软科学,2010,24(1):93-95.

[3]韩雨峰,陈武鑫,杨毕辉,等.基于TTs药房取药排队系统设计[J].医学信息,2009,22(12):2628-2629.

[4]蒋建利.计时器在门诊输液室的应用[J].护理研究,2009,11(23):3007-3008.

[5]施峭春.用语音电路改进病房传呼系统的报警提醒功能[J].医疗设备信息,2001,6:18-19.

语音效果 篇4

关键词:AMR-WB,语音合成,LPC

0 引言

目前, 线性预测 (LPC) 参数合成法作为语音合成中一种比较简单和实用的方法, 以其低数据率、低复杂度、低成本, 受到特别的重视[1], 但由于原有模型所提取的参数过于简单, 尤其在基音周期的提取算法和激励源的构建上都使得合成阶段很难得到高质量的合成语音, 所以人们在应用的过程中往往将多种技术有机地结合在一起, 或者将一种技术的优点运用到另一种技术上, 以克服一种技术的不足[2]。AMR-WB即自适应多速率的宽带语音编码技术, 是一种高品质的数字宽带语音编码系统, 采用的是代数码激励线性预测 (ACELP) 技术, 在参数提取阶段运用闭环和开环相结合的方法计算基音延时, 运用自适应码本和固定码本结合的方式还原激励, 这些都使合成的语音效果大大提高, 本文将AMR-WB的这些相关技术运用到LPC的语音合成技术中, 用以改善语音合成的效果。

1 运用AMR-WB算法提取LPC合成参数

AMR-WB所处理的是采样频率为16kHz, 16位的数字语音信号, 其信号带宽为50Hz~7000Hz, 相对于传统的200Hz~3400Hz带宽、8kHz取样频率、8位的处理信号, AMR-WB算法的输入语音具有更高的质量, 而计算基音延时运用闭环和开环相结合的方法, 以自适应码本和固定码本结合的方式还原激励, 这些都为改善LPC的合成效果提供了很好的思路。

根据ITU-T公布的AMR-WB标准G722.2, 本文选用传输速率最高的23.85kbit/s模式算法且根据实际需要做了适当的选取修改以得到程序代码来完成合成语音所需的LPC参数的提取, 并在Windows环境下利用MinGW软件完成编译工作并形成可执行文件, 修改后的算法主要处理过程可分为:预处理、LP系数的提取及量化, 基音周期的提取以及激励源构建。

1.1 输入语音的预处理

预处理包括下采样、高通滤波和预加重。编码器所有处理都是在12.8kHz采样率下进行的, 为降低数据处理量, 输入信号首先由16kHz下采样到12.8kHz。在编码处理之前要进行信号的缩放和高通滤波, 以避免计算过程发生不必要的溢出并滤出不必要的低频成分, 该过程是通过一个截止频率为31Hz、分子除2的二阶极点/零点高通滤波器来实现的。预加重是为了克服传统感觉加权滤波在宽带信号中由于高低频动态范围大而引起的频谱倾斜加大的缺点, 预加重滤波器为Hpre-emph=1-0.68z-1。

1.2 LP系数的提取及量化

预处理之后的信号经过加窗和自相关运算后就可以利用传统的Levinson-Durbin递归算法来求解出预测系数ai (i=0, …, 16) , 再将LP系数ai转化为ISP (电抗谱对) 系数的频域表示ISF, 以便量化和内插所用。量化时用一个一阶滑动平均 (MA) 预测器, ISF残差矢量γ用分裂多阶矢量量化器 (S-MSVQ) [3]量化。通过对误差残差矢量γi (i=1, 2) 以及索引值为k的矢量量化值γ^k, 寻找使式E=Ι=mn[γi-γ^ik]2最小值的k值即为所求索引值。

合成时通过索引值得到量化的LP系数, 并将其用于第四子帧, 其它三个子帧的对应参数由线性内插得到。

1.3 基音周期的提取以及激励源的构建

在23.85kbit/s速率模式, 开环基音分析每帧 (20ms) 计算两次以得到每帧的两个基音延迟估计值, 这可以简化基音分析并把闭环基音搜索限制在开环基音估计延迟附近。开环基音估计是以输入信号经过加权滤波器滤波的信号为基础进行的, 分析时对加权语音[3]二倍抽取信号计算分析, 用四阶FIR滤波器滤波, 然后对其两倍下采样获得抽取信号, 再对抽取信号进行加权语音相关性运算, 而使相关性运算最大值的延时值即为基音延迟估计值Top, 加权语音加重了低基音延迟值, 减小了误将基音周期的整数倍作为基音周期的可能性。

自适应码本的搜索是每一子帧 (5ms) 搜索一次。它包括闭环基音搜索和自适应码本矢量计算 (通过在基音分数延时处内插过去的激励来得到) 。闭环基音分析在子帧基础上, 在开环基音估计附近搜索计算。对第一/第三子帧的搜索范围是Top±7, 取值为[34 231], 在第二/第四子帧, 基音延时总在[T1-8, T1+7]范围内, 分辨率为1/4分数延时, 这里T1是最接近前一子帧 (第一或第三子帧) 的分数基音延迟值的整数值。闭环基音搜索准则是使原始语音和重构语音之间的均方加权误差最小, 一旦最佳整数基音延时确定, 在最佳整数延时附近的分数从-3/4到3/4以步长为1/4作测试, 内插归一化相关系数, 并搜索其最大值得到分数基音周期。分数延时确定后, 在给定段内插过去激励信号u (n) 计算得到自适应码本v (n) 。

代数码本结构采用正负号脉冲交错设计 (ISSP) [3], 码矢量中的64个位置被分为位置交错的4个轨道, 每个轨道含16个位置。代数码本的搜索是用加权输入语音和加重重构语音之间的均方误差最小化准则来进行的。固定码本和自适应码本增益 (gpgc) 确定后, 就可以得到当前子帧的激励信号u (n) :

u (n) =gpv (n) +gcc (n) , n=0, …, 63 (1)

v (n) 是自适应码本矢量, c (n) 是固定码本矢量。

这样语音样本的主要LPC参数就已经提取出来即可进行存储, 合成时调用相应文件读出参数通过合成滤波器即可得到合成语音。

2 合成结果验证

为了观察合成结果, 并将其与语音样本进行对比分析, 本文制作了符合要求的语音样本, 利用MinGW软件编译生成的可执行文件完成参数提取和合成工作, 并利用Matlab软件对语音样本和合成语音进行仿真。

2.1 语音样本的制作

对于线性预测语音合成系统, 需要录制一个语音库, 在完成语音样本参数的提取以及存储后, 合成阶段就可以调用相应的参数文件得到语音输出, 所以语音样本需要有较好的质量, 应尽可能排除噪声的干扰。利用Cool Edit软件完成取样频率为16kHz、16位的语音样本录制工作并进行了降噪处理, 处理前后波形如图1所示。

由图1可以观察到原始语音样本存在着较强的噪音干扰, 而在语音间歇处则体现得更为明显;经过降噪处理后, 整个语音的噪音都得到了很好的消除。

由于Cool Edit录制处理后的文件是wav格式的语音文件, 而AMR-WB编码器的输入要求为PCM文件, 根据wav文件格式说明[4]得知, wav文件前面的字节均是文件说明, 只需通过UltraEdit软件, 将录制好的wav文件中的文件头删除, 就可以得到这段语音的PCM数据即需要的语音样本文件。

2.2 合成结果分析

本文利用Cool Edit软件实现对录制语音的进一步截取, 将制作的“中”字PCM文件作为测试文件, 利用MinGW软件编译生成的可执行文件来完成参数的提取和合成工作, 并用Matlab7.1软件分别对测试语音和合成语音的时域、频域波形图进行了对比仿真, 见图2和图3所示。

由图2的时域波形可知, 合成语音同语音样本在包络上具有极强的相似性, 确保了合成语音在语义上很好地还原语音样本的内容。

由图3可以看出, 合成语音同样体现出语音样本在200Hz, 400Hz, 600Hz上具有较强幅值的特点, 仅仅在数值上有较小的差别, 而更为重要的是合成语音并没有其他频率分量的产生, 避免了不必要的杂音出现, 这些都确保了高质量语音的合成。

此外, 通过对测试语音和合成语音的对比试听, 可以得知二者并无明显差别, 这也同样说明合成语音具有很高的合成质量。

3 算法复杂度分析

评估算法运算的复杂度, 对于其技术改进效果和实用性的评估, 都具有重要意义。

广义的运算复杂度应该包括“计算量”和“DSP生成目标代码的复用效率”两个指标。林奕琳等人[5]用“计算量”的测算法来评价AMR-WB所用模式编码和解码的复杂度, 采用了WMOPS (Weighted Million Operations Per Second) 即加权百万操作每秒的测算标准, 其参数提取算法的测算复杂度为27.797WMOPS, 合成语音算法的测算复杂度为6.465WMOPS。

从数值上来看, 参数提取算法具有很高的复杂度, 而在合成语音时复杂度则较低。因为对于一个好的语音合成系统来讲, 系统的实时性是一个很重要的参数, 所以设计时要求在合成语音阶段算法的复杂度要较低, 而对参数提取的复杂度并没有苛刻要求。因此从算法的复杂度上来讲, 将AMR-WB中23.85kbit/s模式的算法应用到LPC语音合成中是切实可行的。

4 结束语

本文采用AMR-WB中23.85kbit/s模式的改进算法完成对语音样本的LPC参数的提取, 用来在LPC语音合成时作为参数调用合成输出语音。通过对测试语音和合成语音的对比试听, 合成语音具有很高的合成质量, 与测试语音并无明显差别;二者时域波形和频域波形具有极强的相似性, 合成语音没有产生其他频率分量, 合成效果好, 算法符合复杂度的要求, 该算法作为LPC语音合成的改进算法是可行的。

参考文献

[1]Atal, Bishnu S.The history of linear prediction[J].IEEE SignalProcessing Magazine, 2006, 23:154-157.

[2]吕声, 王炳锡.一种改进的混合激励线性预测的基音周期估计算法[J].信号处理, 2001, 1:56-59.

[3]CCITT.Recommendation G.722.2, Wideband coding of speech ataround 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB) [S].2003.

[4]张庆华, 韩吉韬, 王宁生.XBASE数据库WAV音频信息提取批处理[J].南京航空航天大学学报, 2003, 6:676-681.

[5]林奕琳, 李巧玲, 李江源.AMR-WB语音编码算法及仿真[J].计算机工程与应用, 2003, 29:67-74.

语音效果 篇5

随着计算机技术和网络技术的飞速高展和应用, 这些信息化技术也被广泛地应用到了高校多媒体语音实验室的发展中。较之传统多媒体语音试验的耳机、话筒等陈旧的教学模式, 快速地被计算机、投影仪、摄像头、服务器等高科技数字化设备所代替。

现代化的多媒体语音实验室从根本上改变了传统语音实验室功能单一、条件简陋和教学效果、教学模式落后等缺点, 为教师和学生提供了多功能、智能化、自动化和强大的操作界面、更多人性化的设置和更好的教学效果。但现实中也应清醒地认识到, 现代多媒体语音实验室在使用和管理过程中也存在着不少问题, 应引起高校的足够重视。如何科学有效地做好多媒体语音实验室的管理工作、保证教学质量和教学任务的顺利实施并充分利用和发挥出多媒体语音实验室的教学价值, 是目前广大多媒体语音实验室工作人员应当努力研究和解决的问题。

1 多媒体语音实验室的特点与作用

1.1 多媒体语音实验室以网络数据传输为基础, 通过标准化的

网络协议实现教学终端和网络终端之间的数字信号传递, 并嵌入DSP技术和基于以太网的数据交换技术, 使教学内容能够以数字信号和数字画面的形式体现出来, 具有功能强大、运行稳定和高效、高质量等特点, 为教学模式的改革和进步起到了重要推动作用。

1.2 在设备功能上, 多媒体语音实验室能够以网络数据为基础,

可以利用非常丰富的网络资源, 不仅使用率高, 信息质量能够保证, 并且在教学效果上有明显优势, 拓展了教学空间, 增进了师生与数字化信息的互动, 提高了教学质量。

1.3 在运行构架上, 由于多媒体语音实验室是由多个终端机共

同支持于网络数据和网络技术上的, 也就不存在传统语音实验室使用过程中机械故障、教学资料丢失、损坏等现象。多媒体语音实验室使用了计算机技术、DSP等先进技术, 因此其运行稳定、安全可靠性得到了保证, 其教学效果也远胜过传统的语音实验室。

1.4 顺应时代发展和现代化高新技术的应用, 促使了现代化教

学事业实现了现代化的发展理念。现代信息技术和计算机技术的大面积应用, 又促使现代教学工作的方式方法和教学理念出现多样化, 面对高速发展的现代化科学技术, 如何将现有电教人员与高新技术相结合, 提高多媒体语音实验室的教学水平和管理水平, 是当前高校广大教育工作者应重视的问题。

2 多媒体数字语音实验室在教学工作中的应用及效果分析

多媒体语音实验室是通过数字化的教学设备来进行教学任务实施的教学场所, 因此数字化设备是多媒体语音实验室的基础。多媒体语音实验室主要应用于以下几个方面:

2.1 在外语教学中的应用和分析。

2.1.1 实际应用

外语课程是我国教育工作的重点之一, 当前我国各类高校都很重视对学生外语学科培养。而多媒体技术的普及, 使得传统的教育模式不得不顺应时代的发展。广大高校在建设多媒体语音实验室的过程中, 应总结外语教学的特点并与多媒体技术的应用相结合, 如增加相应的语音设施、外语教学资源、教学课件等。同时还应加大对外语教师对熟练操作多媒体语音试验室的培训, 提高广大电教人员的多媒体技能, 使其能够更好地将教学理念与多媒体语音实验室利用起来。

2.1.2 效果分析

高校在外语教学中采用多媒体语音实验室, 不仅丰富了教学方法, 还能增进师生互动, 同时能让学生在新的教育理念下提高学习热情, 增长学习兴趣。换言之, 采用多媒体数字化语音实验室能有效提高教学质量, 保证教学任务的顺利进行。

2.2 在计算机教学中的应用和分析

2.2.1 实际应用

计算机课程是我国自计算机应用普及以来, 在各类高校广泛实施的一门教育课程。随着信息化时代的来临, 计算机成为了当前人们学习、生活和工作中必不可少的重要工具之一, 因此, 利用多媒体技术的优势与计算机技术相结合, 可以更好地发挥多媒体语音实验室的教学效果, 也能进一步推广计算机教学的新方法、新理念。高校在建设多媒体语音实验室时可以找出多媒体技术与计算机技术的共同点, 充分挖掘其中有助于提高教学质量的办法;还应加大对计算机教师人员的岗位培训, 充分发挥其效能。

2.2.2 效果分析

由于多媒体数字化语音实验室本身就以计算机技术为基础, 为师生提供数字化和智能化的教学资源, 因此, 在多媒体语音实验室中实施计算机教学, 可以将两者的优势进行结合, 对提高计算机教学的质量有重要推动作用。

2.3 在高校科研项目中的应用

2.3.1 实际应用

利用多媒体数字化语音实验室, 除了为教学工作做出贡献、发挥优势作用, 还能为高校科研项目提供新型的科研平台。

2.3.2 效果分析

多媒体语音实验室是一种基于网络技术和信息交换技术的高科技教学平台, 因此对于高校科研项目, 除了能利用极其丰富的网络资源, 还能利用多媒体语音实验室的多功能、智能化和自动化为科研项目提供动态的、即时的信息计算, 如科研项目的筹划、科研数据的模拟和科研实验的辅助计算等。

3 加强管理人员的培训与日常维护

3.1 高校应加大对多媒体语音实验室广大电教工作人员的业

务培训的投入, 加强对多媒体语音实验室的管理制度, 这样不仅能促进现代化设备的维护保养, 也能提高广大电教人员的整体业务水平, 同时还能提高高校语音实验室教学质量。

提高多媒体语音实验室电教人员的业务水平, 可以从以下三个方面实施:

一是通过长期的教学工作和科研实践中不断积累经验以提高业务水平;二是通过广大电教人员利用利用空余时间进行自我学习, 不断进行知识拓展和提高;三是高校组织广大电教人员进行统一培训或通过多媒体专业技术的锦绣和学习。

3.2 日常维护与定期检查

日常维护是语言教学设备正常运行的保障, 它的维护原则是以主动维护为主, 应急维护为辅。设备技术维护, 直接关系到设备为教学服务的效率。要在每个实验室配备设备使用日志, 该日志要由任课教师在使用实验室时填写。可记录使用状况、使用时间、故障现象等, 以方便技术人员及时进行维护。

4 结束语

随着时代的进步和现代计算机技术的广泛应用, 我国高校多媒体教学工作的发展取得了长足进步, 为我国教育事业的进步起到了重要的推动作用。同时, 面对教育事业信息化数字化的高速发展, 要求广大教育工作者顺应时代潮流, 紧跟发展形势, 努力提高自身适应现代化多媒体教学的工作能力和业务水平, 以保证多媒体语音实验室更好地为教育事业做贡献。

摘要:随着社会的进步和教育领域的不断发展, 多媒体语音实验室在我国各类高校教育中广泛应用。如何通过科学合理的管理制度使多媒体语音实验室充分发挥其应有的教学效果和教学价值, 是保证教学质量的关键, 也是当前我国高校共同重视的问题。本文通过当前多媒体语音实验室的实际应用, 对高校多媒体语音实验室建立的作用及实际效果进行分析。

英汉语音对比与英语语音教学 篇6

一、英语元音与汉语韵母的对比

(一) 英语元音

英语里一共有48个音素, 其中20个是元音, 28个是辅音。元音又可分为单元音 (12个) 和双元音 (8个) 。这12个单元音又可以分为以下几种。

1.前元音:/i://i//e//%/。前元音是指发音时要使用舌前部, 也就是说舌前部要向硬腭抬起, 舌尖要抵住下齿, 口形扁平, 不要收圆。

2.后元音:/ɑ://%//%://u//u:/。后元音是指发音时要使用舌的后部, 也就是说舌后部要向软腭抬起。发后元音时舌尖可以不抵下齿。

3.中元音:/%:/%/%/。中元音是指发音时要使用舌的中部, 也就是说舌的中部要稍稍抬起, 舌尖可以轻抵下齿, 口形扁平或中常。

(二) 汉语韵母

按汉语语音学的传统分析方法划分, 汉语音节中声母以后的部分叫韵母。普通话中有39个韵母。这39个韵母, 按照不同的条件可以进行不同的分类。根据论述需要, 本文主要根据语音结构进行分类, 将韵母分为单韵母、复韵母和鼻韵母三类。

1.单韵母, 即单元音韵母, 指单独由一个元音构成的韵母, 简称单韵母。普通话中有10个单韵母, 。

2.复韵母, 即复合元音韵母, 由两个或三个元音组合而成, 简称复韵母。复韵母共有13个, 其中由两个元音组成的复韵母叫二合复韵母, 由三个元音组成的复韵母叫三合复韵母。

3.鼻韵母, 带鼻尾音的韵母, 即元音音素———单个或两个元音后面附带一个鼻辅音作韵尾的韵母, 简称鼻韵母。普通话中只有两个辅音韵尾[n]和[ng], 它们都是鼻音。普通话里带鼻音的韵母共16个, 分为两类。其中带舌尖鼻音[n]的有8个, 带舌根鼻音[ng]的有8个。

二、英语辅音与汉语声母的对比

声母和辅音是两个不同的概念。声母是从分析音节结构的角度划分出来的, 而辅音是从分析音素性质的角度提出来的。与元音比较, 辅音的主要特征是:气流在发音器官中受到一定程度的阻碍或阻塞, 气流较强, 发音器官参与节制气流的部分肌肉紧张。

(一) 英语辅音

气流在口腔或咽头受到阻碍而形成的音叫做辅音。按照不同的分类方法, 可以有不同的分类。

1.按发音时是否震动声带, 可以分为清辅音和浊辅音。发音时声带不震动、送气的叫清辅音:/p/、/t/、/k/、/f/、/θ/、/s/、/∫/、/t∫/、/ts/、/tr/, 再加上/r/、/h/, 合计12个。发音时声带震动、不送气的叫浊辅音:/b/、/d/、/g/、/v/、/e/、/z/、/%/、/d%/、/dz/、/dr/再加上/m/、/n/、/%/、/l/、/j/、/w/合计16个。

2.按发音部位来分, 辅音可以分为爆破音/p/、/b/、/t/、/d/、/k/、/g/。摩擦音/f/、/v/、/∫/、/%/、/s/、/z/、/θ/、/e/、/h/、/r/。破擦音/t∫/、/d%/、/tr/、/dr/、/ts/、/dz/。鼻音/m/、/n/、/%/。边音/l/、/%/和半元音/j/、/w/。

(二) 汉语声母

声母指音节中位于元音前面的部分, 普通话中辅音声母21个, 算“零声母”22个。声母可以从不同个角度分类。

1.从发音部位看, 普通话21个声母可分为六类, 这六类从前往后依次是:唇音 (b、p、m、f) 、舌尖前音 (z、c、s) 、舌尖中音 (d、t、n、l) 、舌尖后音 (zh、ch、sh、r) 、舌面前音 (j、q、x) 和舌面后音 (g、k、h)

2.从发音方法看, 普通话声母可以分为五类:塞音 (b、p、d、t、g、k) 、擦音 (f、s、sh、r、x、h) 、塞擦音 (z、c、zh、ch、j、q) 、鼻音 (n、m) 和边音 (l) 。

3.根据发音时呼出气流的强弱可分为送气音与不送气音两类, 只有塞音和塞擦音有送气与不送气的分别:送气音是p、t、k、c、ch、q, 不送气音是b、d、g、z、zh、j。

4.根据发音时声带是否颤动, 可把声母分为浊音和清音两类, 普通话只有m、n、l、r四个浊音声母, 其余都是清音。

5.y、w。在汉语的声母表中组成音节有y、w两个声母, 但它们不是真正意义上的声母, 只是i、u两个韵母要组成音节时的变化, 称作“零声母”。

三、语调与声调的对比

(一) 英语语调

语调 (intonation) , 即说话的腔调, 就是一句话里声调 (pitch) 高低抑扬轻重的配制和变化。世界上没有一种语言是用单一的声调说出的。英语有五种基本语调:升调 (↗) 、降调 (↙) 、升降调 (∧) 、降升调 (∨) 以及平调。

(二) 汉语声调

声调是音节音高的变化形式。声调变化是声带松紧调节的结果。声调主要决定于音高。声调要读得准确到位, 应注意音长的变化。没有适当音长的保证, 声调很难读到位。普通话声调的发音特点是:起音高高一路平, 从中到高往上升, 先降后升曲折起, 高起猛降最底层。

1.第一声 高平调 (阴平)

2.第二声 高升调 (阳平)

3.第三声 降升调 (上声)

4.第四声 全降调 (去声)

四、对英语语音教学启示

由于英语语音和汉语语音分属不同的语系且存在很大的差异, 所以在外语学习中, 汉语的干扰是不可避免的。语音是英语学习当中听、说、读、写、译等语言技能和培养这些技能进行有效交际能力的基础。帮助学习者认识和发现发音的基本规律、比较英汉两种语言之间的差异, 才能科学有效地进行语言教学, 积极地促进学习者准确把握英语语音, 达到交流的目的, 从而更好地提高英语语音的教学效果。

摘要:语音是学好英语的基础, 也是英语教学的难点。本文对英汉两种语言中的元音与韵母进行对比、辅音与声母进行对比、语调与声调进行对比, 分析了两种语言在三个方面的差异, 阐述了对英语语音教学的启示, 旨在提高英语语音教学的效果。

关键词:英汉语音,对比,教学

参考文献

[1]胡壮麟.Linguistics.A Course Book[M].北京:北京大学出版社, 2001.

[2]胡裕树.现代汉语[M].上海:上海教育出版社, 1981.

[3]孟宪忠.英语语音学[M].修订版.上海:华东师范大学出版社, 2002.

[4]黄次栋.英语语言学[M].上海:上海译文出版社, 1988.

[5]张凤桐.英国英语语音学与音素学[M].成都:四川大学出版社, 1998.

基于语音低频分量的语音零水印 篇7

目前在时域、空域或频域上提出的数字水印算法是对原始数字作品进行修改来嵌入水印信息,而这些信息的嵌入都会导致一定程度的失真,造成数字水印不可感知性和鲁棒性之间的矛盾。“零数字”水印作为解决这对矛盾的有效方法得到了研究者的广泛关注。但目前对其研究主要集中在图像领域,且“嵌入”的水印大都是无意义的。无意义的水印只能通过统计的方法来判断水印是否存在,不能直观地给出版权标志信息。

针对以上问题,一些学者利用音频信号低频成分不易受到各种攻击的影响这一统计特征[1,2]“嵌入”有意义零水印,得到了良好的效果。在本文中,我们利用这一统计特征嵌入有意义的零水印。算法不修改原始作品的任何数据,并且能够抵抗幅度缩放、重量化和低通滤波等音频信号攻击。

2 基于语音低频分量的语音零水印算法

基于线性预测系数多级矢量量化的零水印算法由两个阶段构成:水印构造阶段和水印提取阶段。

2.1 水印构造阶段

首先,设音频信号为:

S={s(n)|n=0,…,L-1},水印为一副尺寸是M×N的有意义的二值图像,记为:W={w(p,q)|w(p,q)∈{0,1},p=0,…,M-1;q=0,…,N-1}。

将S分割为M×N个互不重叠的等长的帧,记为:F={fi|i=0,…,M×N-1},

每个数据帧由Lf个采样点组成,即:fi={fi(n)|i=0,…,M×N-1;n=0,…,Lf-1}。

对数据帧fi,i=0,…,M×N-1进行二级小波分解得到小波细节分量,记为:di={di(n)|i=0,M×N-1}

然后取出序列di的前m个元素进行离散余弦变换得到混合域系数,记为:Ci={ci(n)|i=0,…M×N-1;n=0,…,m-1}

再次,根据ci(m-1),i=0,…,M×N-1与的关系产生极性向量,记为:Y={y(i)|i=0,…,M×N-1},

即:

并将保存为密钥k1,即

最后,对极性向量Y={y(i)|i=0,…,M×N-1}和原始水印

w={w(p,q)|w(p,q)∈{0,1};p=0,…,M-1;q=0,…,N-1}

进行异或运算获得水印检测密钥,记为k2={k2(i)|i=0,…,M×N-1},即:

K2(i)=y(i)⊕w(p,q),i=p×N+q

2.2 水印提取阶段

首先,将待测音频信号分割成等长的互不重叠的M×N帧,记为:。

最后,对极性向量:

和检测密钥:k2={k2(i)|i=0,…,M×N-1}

进行异或运算,从而获得提取出的水印,记为:

P=0,…,M-1;q=0,…,N-1,

3 仿真实验

原始语音信号为如图1(a)所示的语音信号,其采样率为8kHz、量化精度为16bits/sample、长度为40.96s;原始水印为如图1(b)所示的64x64的二值图像(水印容量为100bpS)首先利用“Haar”小波基对分帧后每一帧的音频数据进行二级小波分解提取其小波细节分量,并对每帧小波细节分量的前10位进行离散余弦变换得到混合域系数。另外,采用原始语音信号和受到攻击的语音信号之间的信噪比,来估计攻击的严重程度。在没有任何攻击的情况下,从原始语音信号中提取出的水印图像如图1(c)所示。

3.1 不可感知性分析

嵌入水印的不可感知性是水印技术需要满足的主要要求之一。对于零水印技术而言,因为并没有将水印真正嵌入到原始语音载体信号中,因此该要求是自然满足的[4]。事实上,“嵌入水印”后的语音信号与原始语音信号完全一致。

3.2 鲁棒性测试

鲁棒性是对水印技术的一个主要要求。水印算法的鲁棒性是用来衡量算法从受到信号处理操作或恶意攻击的嵌有水印的信号中正确检测水印的能力[5]。幅度缩放语音信号在传输的过程中,其幅度很有可能被放大或缩小。在本实验中,载体语音信号的幅度被放大/缩小3dB,然后重新提取水印。图2显示的是在各种缩放比例下所提取的水印图像。

图2从经幅度缩放操作后的语音信号中提取的水印(a)放大3dB;(b)缩小3dB。

如表1所示,幅度缩放操作虽然会使语音信号的信噪比有大幅度降低,但却不会对水印的提取造成大的影响。

另外当分别采用截止频率为10kHz的低通滤波和将语音信号先向上量化到32bits/Sample,再重新向下量化到16bits/sampl的重量化攻击方法时,所提取出的水印如图3所示。

如表2所示,虽然低通滤波和重量化攻击方式会对语音信号的质量造成较大的影响,但却几乎不影响水印的正确提取。

4 结论

本文提出了一种基于线性预测系数多级矢量量化的语音零水印,运用提取音频信号线性预测系数并进行矢量量化,之后与待测水印进行分帧异或的方法得到检测密钥,那么对音频信号编码索引值的任何改变都会影响水印比特的正确提取。仿真实验表明,文中提出的算法通过提取待测密钥中的水印来保护版权并且实现了算法的鲁棒性和不可感知性。然而该算法的水印提取是基于二级矢量量化并通过算法实现,如果待嵌入水印较大的话,水印提取过程将需要较长时间。

参考文献

[1]李坤,刘加,基于小波变换和线性预测的基音提取[J].计算机工程,2010,36(10):276-281.

[2]Juang B H,Gray H.Multiple stage vector quantization for speech coding[C]//Internat ional Conference on A coustics.New York:Speechand Signal Processing,1982:5972600.

[3]李伟,袁一群,李晓强,等.数字音频水印技术综述,通信学报,2005,26(2):100-111.

[4]Cvejic N,Seppanen T.Increasing the capacity of LSB-based audio steganography.In Proceedings of 2002 IEEE Workshop on Multime-dia Signal Processing,2002:336-338.

[5]Cvejic N,Seppanen T.Increasing robustness of LSB audio steganography using a novel embedding method.In Proceedings of Intemation-al Conference on Information Technology:Coding and Computing,2004(2):533-537.

[6]Cvejic N,Seppanen T.A novel scheme for merging digital audio watermarking and authentication.In Proceedings of IEEE 6th Workshopon Multimedia Signal Processing,2004:151-154.

[7]Yin X,Zhang X M.Covert communication audio watermarking algorithm based on LSB.In Proceedings of lntemational Conference onCommunication Technology,2006:1-4.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【语音效果】相关文章:

粤语语音与英语语音的比较探究09-11

歪歪语音(YY语音)详细使用教程04-27

汉语语音07-22

英语语音08-02

中文语音05-01

语音融合05-02

语音阅读05-05

语音控制05-13

标准语音05-29

语音分析06-03

上一篇:城市广电下一篇:玉米推广