语音研究

2024-07-25

语音研究（精选十篇）

语音研究篇1

世界上没有两种完全一样的语言, 每一种语言都会展现出自己独特的语言特征。所有人在学习一种外语的同时都会或多或少带有一些母语的痕迹。Skinner认为对语言学习最好的解释便是刺激与反应。学习一种语言就是形成一种新的语言习惯, 学习者母语和二语之间的差距越大, 学习过程就会越困难。语言迁移有两种类型: 正迁移和负迁移。后者也被称为语言干扰。在语言学习的过程中, 母语的迁移和干扰作用将在语言系统的各个层面都得到体现。Ellis指出在语音及词汇层面的干扰作用最为明显。

本文采用Lado的对比分析方法, 旨在探寻汉语对中国的英语学习者语音方面的干扰作用, 以便帮助中国的英语学习者。对于切分音位的对比研究已经有很多, 因此本文不再赘述, 重点通过重音、节奏、语音语调及连读四方面对比英汉在超切分语音层面上的区别。

二、超切分音位对比分析

1. 重音

英语中的重读不仅仅是超切分结构的一部分, 也是语调和节奏的基础。但是在汉语中, 重读的效果不是如此的明显。单词重音和句子重音在英汉两种语言中都存在, 但是却又不同的作用。

在英语中, 单词重音是区分意义和词性的一个重要标准。一个单词中不同的重音就可以完全的改变一个词。大多数英语单词只有一个重音, 有些也拥有次重音, 但次重音和重音不会离得很近。在汉语中, 字的重音和意义无关, 一个字的意义取决于它的声调。几乎每一个汉子都需要重读。因此, 中国学生很少关注到单词重读, 忽略了英语单词中重音和次重音之间的对比, 将重音放在错误的地方。

句子的重音在英语中也起到了决定性的作用。句子的意义也由句子重音所决定。英语中有许多功能性单词, 例如介词、连词、冠词和助词, 它们在英语中出现的频率极高。除非在特殊情况中, 否则这些单词都是弱读的, 使得英语的句子重音不会离得很近。但是, 在汉语句子中起主导作用的仍然是声调, 句子重音几乎是一个接一个的出现。中国学生习惯将英语句子中的每一个单词都带着重音和响度来读, 并不区分重读和轻读。

2. 节奏

英汉语言中都有节奏。英语的节奏是连奏式, 具有实意的单词被重读, 功能词被弱读, 重读和弱读交替出现。重读音节的发音音高较高, 发声清晰且长, 轻读音节则正相反, 音高较低, 发音模糊且短, 有时带有连读、省略和同化。无论两个重读音节中有多少个轻读音节, 每个节奏单元的发音时间是一致的。两个重读音节之间的轻读音节越多, 发音越快, 因此, 英语被视为是以重音计时的语言。

汉语的节奏是断奏式, 一个音节接着一个音节且每一个音节都有重音, 几乎所有的音节都需要清晰地发音, 并且发音时长相等, 音节之间的界限也很明显, 因此, 汉语被视为以音节计时的语言。中国学习者在母语的干扰作用下, 喜欢将每个音节都分明地读出来, 使用相同的响度、音高和长度, 使他们得英语听起来不自然。

3. 语音语调

英语是语调语言, Geoffrey Leech教授称, 话语的有效沟通在很大程度上取决于语调, 语调能够展示在英语口语中可以展示说话者的情感和意图。英语的语调是属于整个句子的, 而不是某个单词, 因此语调的不同不会导致单词意义的变化。汉语是声调语言, 尽管语调也可以表现出说话者的感受, 但是汉字的意义是由声调决定的, 不是语调。

英语中有超过11种的语调, 但是最基础的只有7种。不同的语调需要听话者予以不同的恢复, 从而形成不同的交流形式。因为英语音节没有固定的声调, 发音的升降和音高的宽度都是自由的。汉语只有4种声调:一声、二声、三声和四声。对比得知, 每一个汉语音节的声调都不能随意改变, 由于此限制, 汉语的语调变得平而稳。这一母语的特征会对中国学习者掌握夸张的英语语调来不小的阻碍。

4. 连读

连读是音系学中的一个术语, 指在音系结构中, 两个发音单元界限之间的停顿和过渡。“连读的意义在于它能使我们区分出音节、单词以及句子之间的界限” (何, 2002, p.71) 。

在英语音节中, 如果一个元音过渡到另一个元音, 必须有明显的舌头滑动过程;如果一个元音和一个辅音连在一起, 必须有一个明显的合成。因为英语是连奏式, 将第一个单词结尾的辅音和第二个单词开头的元音拼在一起的过程是可以通过不间断的滑动实现的。但是汉语音节的结构非常紧凑, 因此两个因素之间的过渡和合成过程快而模糊。正因为汉语是断奏式, 音节自身就是一个清晰的音系组, 很难与周围的音节想连接起来。中国学生习惯将每一个音节都读得清晰响亮, 将音节之间分割出来, 并在元音开头的单词之前加一个声门塞音。

英语中, 连诵现象非常普遍, 例如, it is在实际发音中不会听起来像两个单词, 会被连诵, 听起来像一个单词。但是连诵在汉语中却找不到栖身之地。如果将“西安”连诵, 则变成了“先”, 没有人会理解说话者想要表达的内容。

三、总结

一个语言最明显的特征便是语音, 它能够将两种语言即刻区分开来。因此, 学习一门外语的第一步就是语音的学习, 而对比分析母语和目的语则能够帮助学习者更快更准确地掌握语音。

摘要：本文探讨了英语及汉语超切分语音方面的差异以及中国学生母语迁移对其英语语音学习的影响。文章采用对比研究方法, 结果显示英语及汉语在重音、节奏、语音语调以及连读等方面都有极大的区别, 并且这些区别为学习者的语音带来了一定程度上的干扰, 建议语言学习者们留意英汉语音方面的差异, 并采用对比分析的方法纠正自己的发音。

关键词：语音,重音,节奏,语调,连读

参考文献

[1]Cruttenden, Alan. (2001) .Gimson’s Pronunciation of English.Beijing:Foreign Language Teaching and Research Press.

[2]何善芬 (2002) 。《英汉语言对比研究》。上海:上海外语教育出版社。

英语语音研究观点篇2

主要思路：本项目计划对新乡学院非英语专业大学生及公共英语教学展开调查和研究，从而对大学生英

语语音出现的问题和大学英语语音教学中出现的问题进行归纳、总结，进而提出解决的方案

和策略。本项目研究采用问卷调查、访谈、语音测试、实验对比等方法，通过对学生和教师

进行抽样问卷调查和访谈，以及对学生和教师进行语音测试，掌握本校当前非英语专业大学

生英语语音学习现状和语音水平，同时结合对教师英语语音水平的调查和测试，全面了解当

前本校英语语音教学现状和存在的问题，进而提出适合本校英语语音教学发展的方案和对

策。

研究内容：

一、研究目的二、研究过程

1.对教师进行问卷调查和访谈，同时进行语音测试，然后分析数据

2.对学生进行问卷调查和访谈，同时进行语音测试，然后分析数据

3.设置实验组和控制组，进行实验前和实验后的语音测试和调查问卷，对各种实验条件进行比对，重点落在教学模式的开发应用问题上，对新的教学模式、课型改变及其教学效果进行对比。

四、大学英语语音教学存在的问题（结合实证调查中的数据进行分析）

1、教师方面的问题

2.1教师自身的问题（教师自己的语音语调不规范；对语音教学重视不够；教学方法单一，语音

教学效果不明显）

2.2教师整体的问题（英语教师之间沟通太少；教研活动流于形式；教师在语音教学方面没有发

挥整体合作的优势；语音教学任务主要落在了听说老师的教学上，没有形成整体效应）

2、学生方面的问题

2.1 学生自身问题（受方言影响，受汉语负迁移影响；历史遗留问题，中小学英语语音基础不扎

实，教育体制和考试体制导致中小学，特别是中学对英语语音重视不够；学生受学习动机、学习态度和学习方法的影响，产生负面的心理因素，影响学生的语音学习效果）

2.2 学生整体的问题（受四六级应试教育的影响；整体语音环境不好；学生整体对语音知识的欠

缺和错误模仿；非英语专业学生普遍对英语语音重视不够，认为只有英语专业的学生才应

该系统学习英语语音知识和纠正发音；学生使用英语进行交流的机会太少）

3、教材的问题

大学英语教学采用读写教学和听说教学结合的方式，教材主要是读写教程和听说教程以及

配套的泛读和阅读教程，除了读写教程中的单词表、课文录音，听说教程中的相关语音知识和

练习和语音相关，没有系统规范的语音教程，也由于受学生人数太多、教学硬件和软件设施的不完备、和课时与师资的限制，不能展开大范围的语音教学，对每位学生的英语语音错误就更

不可能及时有效的进行监控和纠正。

4、英语语音学习环境的问题

4.1 教学硬件和软件的问题（学生人数众多和教学设施落后的问题）

4.2 语音教学软件的开发和应用问题（英语教师与相关技术人员的合作问题）

4.3 语音测试的问题（如何测试、相关技术的支持问题，为学生建立语音档案的问题）

4.4 非专业大学英语学生的英语语音选修课的开设问题（如何开设、课型种类、外教的配备等问

题）

4.5 校园英语语音学习环境问题（课外英语活动的开展问题；英语广播的播放时间、频率等问题；

学生接触和应用英语特别是听说表达的机会问题）

五、对上述存在的问题提出解决方案和对策

1.教师方面：提高公共英语教师对语音教学的重视和语音教学的意识；定期培训教师，对教师的语音语调定期测试和修正；组织有效的教研活动，讨论教法和语音教学的实施方法；加强教师的整体合作，积极开展学术讲座，提升英语教师的科研水平；鼓励大学英语教师积极创建语音

教学模式，把语音教学应用到不同课型中；鼓励英语教师申报和开展与英语语音相关的第二课

堂或公选课，以辅助课堂教学。

2.学生方面：在大一新生中开展英语语音知识培训和训练，定期测试学生的语音，为学生建立语

音档案，对学生进行分层教学；开展语音知识讲座，提高学生对语音的重视程度；积极组织和

开展英语演讲比赛和竞赛，给学生提供英语表达的机会；为部分非英语专业学生配备外教，提

高学生与外教接触的机会，促进学生语音和口语能力的提高；积极开展英语角和英语俱乐部活

动，在丰富学生的课外活动的同时也提高了学生使用英语的机会。

3.教材方面：积极引进适合学生学习和培训的语音教材及软件，将其应用在大一新生的入校培训

中或英语语音选修课中；对现有的教材和教法进行科学的分析和探讨，把语音教学融入现有的课型中，积极建立合理有效的语音教学模式。

4.英语语音学习环境方面：除了继续建立和完善大学生英语自主学习系统，更要将英语语音教学

软件和学习系统纳入校园英语软硬件建设项目中来，促进语音教学软件的开发和应用；优化教

学管理模式，积极创新教学和管理方法，使学生的学习和管理更趋人性化；促进英语语音测试的建立和管理，为学生建立语音档案，促进相关技术的成熟和发展；开设诸如英语语音基础入

门与培训、实用英语口语、英语演讲艺术和技巧、英美电影欣赏和英语戏剧艺术欣赏等选修课，提高学生选修英语课程的热情和积极性，引导学生主动培养英语语音和口语能力；提高校园英

语广播的质量和播放频率，鼓励学生参与校园英语广播的节目，可以采取校园英语时事采访、校园明星人物英语访谈节目等，让学生用英语谈发生在自己身边的事，能够更好的促进学生参

与的积极性。

六、研究总结

除了积极促进上述解决方案的实施，选取最容易实现的几项对策进行研究，另外，积极加强语

音教学模式的研讨和建立，促进语音测试的开发和应用，为项目试验做准备，通过实验组和控制组的成效对比，寻求适合本校发展的英语语音教学模式和管理模式。

实施计划进度：（2011年4月——2012年4月）

本课题研究时间预定为一年（2011年4月至2012年4月）

1．前期准备阶段

2011年4月至2011年5月。主要任务是广泛搜集相关资料，了解与本课题有关的理论信息及成果，确立课题实验的理论依据，分析课题研究的目的意义及预期效益。组建课题研究小组，制订方案，做好人员分工工作。在学生和教师中开展问卷调查，分析调查结果。积极，稳妥做好研究前的准备工作。

2．中期实施阶段

2011年6月至2012年1月。启动课题研究，在专家指导下，制订阶段目标，有计划有步骤实施。对新乡学院相关部门和院系的教师、学生利用问卷调查法、访谈法、语音测试法进行调查和研究，了解学校英语教学设施、教学的人力物力投入、教材、英语教师学历、教师培训、教师教学的理念、教学方法、教师的学习和科研意识、教师的语音水平；学生的语音知识水平、学生的学习动机、学习方法、英语课外活动的参与、英语选修课的参与等问题。并针对这些问题找出相应对策。

3．后期总结阶段

语音研究篇3

【关键词】江西方言；语音习得；第二语音；英语语音

在长久的历史发展进程中，英国、美国凭借自身先进的经济、文化、科技等，其国际地位迅速提升，且使用的语言英语也成为一种国际语言，为方便世界人们沟通起到重要作用。但是英语与汉语在语音文字方面都有很多区别，而中国幅员辽阔，民族众多，各地区的语言文化种类繁杂、各有特色，除去目前在全国推广的官方语言普通话外，还有许多具有各自特色的地方方言，这又加大了我们学习英语的阻力。

一、习得的相关概念

习得，指通过学习、练习掌握知识或者能力，可以近似地理解为获得。第二语言习得，指人们在掌握了第一语言后，通过学校、培训机构或者个人自学等途径对除母语外的语言进行的系统学习。这种学习往往缺乏语言环境，尤其是语音方面受到母语的很大影响，更多的需要个人努力练习。所谓语音就是指人们通过自身语音器官发出来的有意义、可区分的声音。语音是语言系统的载体，代表着语言的意义，语音是任何一种语言首要的组成部分和意思表达的最终输出途径，其物理基础主要有音高、音长、音强、音色，而每一种人类语言发音的不同也正是从这四个方面来区分的。

二、江西方言的特点

由于我国悠久的发展历史，语言与其相伴，也有较长的发展历程，江西方言也不例外，由不成熟到成熟，再到西汉时期就已开始初具规模。汉高祖时期，为促进江赣地区经济文化的发展，设置豫章郡和十八县，为江西方言的形成提供了良好的环境。

一般，江西方言主要有六种，即赣语、客家话、江淮官话、西南官话、吴语和徽语。其中赣语的使用范围最广、影响力最强，而赣语下又可以分为具有各类特色的方言，经有关专家研究赣语的共同点是：古代的全浊声在今天都转变为塞音、塞擦音时不讲究平仄，皆读送气的清音。譬如在读“陪伴、停电、存在、沉重、强健”这几个词时，赣语统统都是送气的清声母，和英语的发音特点不同。英语发音注重音律，而且每个音律单位的调子长度一致且仅有一个重读音节。

客家语和赣语在发展过程中既有相似地方，又有区别，相似方面主要表现在古代的全浊声母字，今天读塞音和塞擦音时，为送气的清音。在语音方面，客家语最大的特点是：古代的次浊声母上声字有许多今读阴平调，客家语区很多地方都读阴平调，而赣语区这些字几乎没有读阴平的，这和英语语音也存在很大不同。江西的官话最主要的特征是：古代的全浊声母字，今读塞音、塞擦音时，平声送气，仄声不送气，都是清音。这一点与北京话相同，与赣语、客家语等都不同。

三、江西方言对英语语音习得的影响

由于受地区经济、文化、生活习惯的影响，每一种语言都有属于自身发展特性的语音系统与发音规律。江西方言，因为它具有的地域特色，让那些掌握地域方言的学生久而久之在学习英语语音形成一种难以客服的发音习惯。举例比如在辅音方面影响：江西方言中鼻，边音声母n，l的相混和异读导致学生英语鼻音[n]与边音[l]发音的混淆不分，“脑”与“老”， “难”与“兰”发同音，分别读lao与lan。这种鼻，边音的相混和异读使得赣方言地区不少英语学习者不能很好地区分英语中的鼻音[n]与边音[1]，造成对英语鼻，边音的混淆。有时候学生们也可以发好英语的边音[1]，但发鼻音[n]时，就容易出现用边音代替鼻音的问题。等等一系列方言发音导致人们在学习英语时，往往会将方言的发音习惯迁移到英语学习中，造成英语学习的困扰，以成年学者居多。汉语教学中，老师会要求学生发音字正腔圆，吐字清晰，发音饱满。对于江西方言在音、韵、调等方面具有较大地域特色，英语教学中应有目的地提高江西地区学生英语语音水平，提高英语教学质量。就需要对方言对英语语音的影响有全面的了解，并在此基础上制定合理教学方式，在英语语音学习的重要阶段为英语学习者奠定一个良好的发音基础。

四、结语

语言是人类所独有的、自然界中个体之间交流的最高形式，是人类思想和意识形态的独特载体，同时语言文明也是动人类社会文明前进的重要因素之一。在经济全球化已是不可阻挡的趋势的当今社会，各国之间的经济、政治、文化交流日益频繁。英语作为一门国际交流的官方语言，为各国合作架起了一座国际交流的桥梁，在我国进行的各种国际合作交流过程中起到不可替代的作用。

【参考文献】

[1] 龚亚夫.《语言习得与第二语言习得研究中的几个概念》，《英语教师》，2008年

[2]詹伯慧.《现代汉语方言》，湖北人民出版社，1981年

语音研究篇4

随着计算机图形技术的发展, 虚拟人成为当今虚拟现实研究的热点, 虚拟人语音动画技术是计算机仿真的重要组成部分, 在数字娱乐、人机交互以及远程会议等方面得到了广泛的应用。人脸语音动画是指将人脸动画技术与语音处理技术相结合, 以产生语音和口型、表情同步的动画技术[1]。目前就语音与人脸唇形动画的同步驱动的研究与实现方法可分为2类, 基于文本驱动的和基于语音驱动的。本文主要是采用基于语音驱动的, 直接将语音特征参数映射到人脸动画参数上, 这种方法不仅可以回避语音识别遇到的问题, 同时又能与真人发声有效地实现同步, 增强真实感和逼真度。

语音特征提取是实现语音同步动画的前提和关键所在。众所周知, 语音信号中不仅包含了文本信息, 而且还包含了人们的感情和情绪等信息。这些信息都可以从语音信号的语音特征参数中体现出来。前人在人脸语音动画研究中着重于音视频模型的建立, 而忽略了语音特征提取算法的研究。当前, 人们已经提出了许多特征参数, 如基音周期、共振峰频率、线性预测系数 (LPC) 、线谱对 (LSP) 、倒谱系数等, 目前使用最为广泛的特征参数是基于全声道全极点模型的线性预测倒谱系数 (LPCC) 和基于人耳听觉模型的美尔倒谱系数 (MFCC) [2]。虽然LPCC和MFCC得到了广泛的应用, 但都是基于语音信号短时平稳的假设, 在短时傅里叶变换的基础上提取的, 而实际上语音信号是一种典型的非平稳信号, 它的频谱特性是随时间而改变的。

小波分析能够提供一种更精细的信号分析方法, 将频带划分为多个层次。本文主要分析了基于人耳听觉模型的Mel频率倒谱系数 (MFCC) , 并在小波变换的基础上, 提出了基于离散小波分析的语音特征参数提取算法, 为了表征语音的动态特征, 采用了差分的方法来提取语音的动态参数。识别试验结果表明, 本文提出的特征参数提取算法的到的参数的语音识别率高于传统的Mel频率倒谱系数 (MFCC) 。

1 语音特征参数的提取

1.1 MFCC语音特征参数的提取

MFCC 系数是基于人耳听觉特性提取的特征参数。对人类听觉系统的研究表明, 人耳对不同频率的声音信号的响应是非线性的。不同频率声音形成的波, 在沿着耳蜗基底膜传播的过程中, 峰值出现在耳蜗基底膜的不同位置, 且与声音频率呈对数关系[3]。为模拟人耳的这种非线性特点, 提出了各种频率弯折方法, 其中Mel 频率尺度是目前使用最广泛的语音特征之一[4], 所谓Mel频率尺度, 它的值大体上对应于实际频率的对数关系, 其与实际频率的具体关系如下:

$Μ e l (f) = 2 595 \times \lg (1 + f / 700) (1)$

式中实际频率f的单位为Hz。

MFCC特征参数提取流程如图1所示。

具体实现步骤为:

(1) 对语音信号进行预处理。用滤波器H (z) =1-az-1对语音信号进行预加重滤波处理, 其中0.9<a<1, 本文取a=0.95。

(2) 对语音信号进行分帧 (N) , 并用汉明窗函数 (本文取窗长21.33 ms, 窗移10 ms) 对每帧信号进行加窗处理, 以减少吉布斯效应。

(3) 对加窗后的语音信号进行FFT变换, 使信号由时域变为频域。

$X_{a} (k) = \sum_{n = 0}^{Ν - 1} x (n) e^{- j 2 π n k / Ν} ‚ 0 \leq k \leq Ν - 1 (2)$

式中:x (n) 为输入的语音信号;N为傅里叶变换的点数。

(4) 用一组Mel尺度的三角滤波器组在频域对能量谱进行带通滤波。

在此采用了具有M个三角滤波器组成的滤波器组, 中心频率为f (m) , m=1, 2, …, M, 文中取M=24。三角滤波器的频率响应Hm (k) 如下:

$Η_{m} (k) = {\begin{cases} 0 ‚ k < f (m - 1) \\ \frac{2 (k - f (m - 1))}{(f (m + 1) - f (m - 1)) (f (m) - f (m - 1))} ‚ f (m - 1) \leq k \leq f (m) \\ \frac{2 (f (m + 1) - k)}{(f (m + 1) - f (m - 1)) (f (m + 1) - f (m))} ‚ f (m) < k \leq f (m + 1) \\ 0 ‚ k > f (m + 1) \end{cases} (3)$

三角滤波器组的频率响应波形如图2所示。

(5) 计算各频带的能量, 并对其取对数。

$S (m) = Ι n (\sum_{k = 0}^{Μ - 1} | X_{a} (k) |^{2} Η_{m} (k)), 0 \leq m < Μ (4)$

(6) 对S (m) 进行离散余弦变换 (DCT) , 即得到了MFCC系数。

$C (n) = \sum_{m = 0}^{Μ - 1} S (m) \cos (π n (m - 0.5) / Μ), 0 \leq m < Μ (5)$

1.2 小波变换

小波变换具有时域局部性和频域局部性, 并且其时频窗口可以根据不同频率自适应地调节, 具有多分辨率的特点, 能有效地从语音信号中提取信息[5]。从而能精确地反映非平稳信号的瞬间变化, 解决了傅里叶变换不能解决的许多困难问题。

设函数f (t) 具有有限能量, 即f (t) ∈L2 (R) , 则连续小波变换 (CWT) 表达式为:

$\begin{array}{l} W_{f} (a, b) = \int_{- \infty}^{+ \infty} f (t) Ψ_{a, b} (t) d t = \int_{- \infty}^{+ \infty} f (t) \cdot \\ \frac{1}{\sqrt{a}} Ψ (\frac{t - b}{a}) d t ‚ a > 0 (6) \end{array}$

式中:a为尺度参数;b为定位参数。由于连续小波变换主要用于理论分析, 其尺度参数和定位参数连续取值, 使连续小波变换中含有很多冗余信息, 不利于对信号进行分析和处理[6]。而在计算机处理时往往采用离散小波变换 (DWT) , 它将尺度参数a和定位参数b离散化。如果取a=2m, m∈Z;b=n·2m, m, n∈Z。即可得二进小波:

$Ψ_{m, n} (t) = 2^{- \frac{m}{2}} Ψ (2^{- m} t - n) (7)$

小波系数为:

$C_{m, n} = < f (t), Ψ_{m, n} (t) > (8)$

1.3 基于离散小波变换的语音特征参数提取

在分析了小波变换理论以及MFCC提取过程基础上, 本文提出了将离散小波变化代替MFCC提取过程中的傅里叶变换, 从而能更有效的提取语音信号的特征参数。基于离散小波变化的语音特征提取的流程如图3所示。

参数提取的具体实现过程为:

(1) 首先对输入的语音信号进行预处理。即同MFCCC提取过程一样, 进行预加重、分帧、加窗。

(2) 对处理后的每一帧语音信号进行离散小波分析, 采用二级小波。

实现步骤为:把每一帧语音信号进行离散小波分解 (分解为N层) , 可以得到N+1个频带, 求出每一频带的小波分解系数, 然后把这些频带系数拼接在一起, 计算系数的能量:

$E_{D W Τ} (m) = \sum_{n = 1}^{Κ} C_{m, n}^{2} (9)$

通过Mel滤波器组, 取对数, 则可得到:

$S_{1} (m) = Ι n (\sum_{n = 1}^{k} (C_{m, n})^{2} Η_{m} (k)) ‚ 0 \leq m < Μ (10)$

(3) 经过离散余弦变换即得DWTMFCC系数:

$C_{1} (n) = \sum_{m = 0}^{Μ - 1} S_{1} (m) \cos (π n (m - 0.5) / Μ) ‚ 0 \leq m < Μ (11)$

由此过程可以看出, 新的语音参数是结合MFCC提取算法和离散小波分解理论得到的。由于小波函数的种类很多, 如Daubechies小波, Meyer小波, Coifman小波, 在考虑运算的难以程度, 变换的有效性、通用性和系数的惟一性等后, 本文采用dbN (N取2, 4) 系类进行信号的分析。

2 语音信号的动态特征和特征组合

2.1 差分倒谱参数

差分倒谱参数用于获取语音特征向量的连续动态变化轨迹[4]。为了获得反应语音动态变化的参数, 使用差分倒谱参数来描述这种动态特征, 从而提高只反映静态特征参数的抗噪性能和改善识别性能。对于一段语音特征向量, 一阶差分可以获取特征向量的变化速度, 二阶差分用于提取特征向量的变化加速度。差分倒谱参数的计算公式为:

$d (n) = \frac{1}{\sqrt{\sum_{i - k}^{k} i^{2}}} \sum_{i - k}^{k} i \cdot C (n + i) (12)$

式中:C (n) 为原语音的特征向量;d (n) 为当前语音帧特征向量的一阶差分参数, 其实质就是当前帧的前k帧和后k帧的线性组合, k为常数, 通常取2或者4。同样, 可以用上式对一阶差分参数进行计算就可以就得到了该语音特征向量的二阶差分参数。图4为一阶差分的MFCC特征参数分布图。图中x轴为阶数 (24) , y轴为帧数, z轴为特征参数值。这种差分提取动态参数的算法把一些与个性特征有关的信息丢掉了, 所以使用与作为辅助特征来使用, 若单独使用的话, 其识别性能并不理想。

2.2 特征参数组合

由于单独一种参数难以完全反映语音的全部信息, 因此考虑将多种特征参数组合使用。

由于语音中蕴涵的一些韵律特征与人脸表情也有较强的关联, 如语音能量与表情夸张度之间, 基频与头势之间等[7], 因此可以将用于语音识别的特征与语音段的基音频率、能量等韵律特征结合起来形成语音分析得到的特征矢量[7]。文中, 将语音信号的MFCC参数, 一阶差分MFCC参数, DWTMFCC参数, 一阶差分DWTMFCC参数以及基音频率等特征参数组合构成特征矢量。

3 实验结果

通过实验对说话人的各种语音参数的性能进行评估。语音特征矢量采用多种参数或参数的组合, 说话者模型采用矢量量化模型。

3.1 矢量量化 (VQ) 的识别模型

整个识别的过程分两步[8]:在训练阶段, 从训练语音中提取特征矢量, 得到特征矢量集, 通过LBG算法生成码本, 重复训练不断优化码本;在识别阶段, 首先也是从输入语音中提取特征参数, 再由每个模板依次对特征矢量序列进行矢量量化, 计划各自的平均量化误差, 即:

$D_{i} = \frac{1}{Μ} \sum_{n = 1}^{Μ} \min_{1 \leq l < L} [d (X_{n}, Y_{l}^{i})] ‚ i = 1, 2, \dots, Ν (13)$

式中:Y $_{l}^{i}$ 为第i个码本中的第l个码字;d (Xn, Y $_{l}^{i}$ ) 是待测矢量Xn和码字Y $_{l}^{i}$ 之间的距离。距离测量采用均方欧式距离, 即:

$d (X_{n}, Y_{l}^{i}) = \frac{1}{Ρ} \sum_{k = 1}^{p} (x_{n k} - y_{l k}^{i})^{2} (14)$

选择平均量化误差最小的码本所对应的说话人作为系统识别的结果。

3.2 实验结果分析

实验数据取自10名学生在实验室环境下的录音, 各取25 s, 其中15 s用于训练, 10 s用于识别, 语音数据用16 kHz采样率, 8 b量化精度。其中静态特征参数和一阶差分倒谱系数都采用24维矢量。从表1的实验结果可以看出, 对于不同说话人的语音输入, 基于离散小波分析的语音特征参数DWTMFCC比基于傅里叶变化的语音特征参数MFCC的识别效果好, 加入动态分析的特征参数优于静态分析的特征参数, 组合的特征参数优于一种特征参数。

4 结语

本文主要分析了人脸语音动画中的语音特征参数的提取部分, 在研究了小波变换的理论基础上, 借鉴MFCC特征参数的提取方法, 运用表征语音动态特征的特征差分算法, 提出了一种基于离散小波变换的语音特征参数DWTMFCC提取方法。由于韵律参数能在某种程度上反映语音的音高、音强和音长方面显示出来的抑扬顿挫的特征, 本文提出了特征参数组合的方法, 将提取的DWTMFCC特征参数与语音段韵律特征参数结合起来形成语音分析得到的特征矢量。通过基于LGB算法的VQ模型进行说话人的语音识别, 可以得到组合的特征参数的识别率比较高。下一步研究工作主要是寻找提取出的与唇动相关的语音特征参数与人脸动画参数 (FAP) 的映射关系, 从而实现语音与人脸动画的有效同步。

摘要：人脸语音动画是虚拟现实领域的热点, 语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数, 在小波变换的理论基础上, 借鉴MFCC特征参数的提取方法, 运用表征语音动态特征的特征差分算法, 提出了一种基于离散小波变换的语音特征参数 (DWTMFCC) 提取方法, 并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别, 可以得到组合特征参数的识别率较高。

关键词：人脸语音动画,语音特征提取,小波变换,动态特征,组合特征参数

参考文献

[1]ALEKSIC P S, WILLIAM J J, KATSAGGELOS A K.Speech-to-video synthesis using MPEG-4 compliant visualfeatures[J].IEEE Trans.on Circuits and Systems forVideo Technology, 2004, 14 (5) :13-19.

[2]王金明, 张雄伟.话者识别系统中语音特征参数的研究与仿真[J].系统仿真学报, 2003, 15 (9) :1276-1278.

[3]XIE Lei, LI U Zhi-qiang.Realistic mouth-synching forspeech-driven talking face using articulatory modeling[J].IEEE Trans.on Multi media, 2007, 9 (3) :500-510.

[4]陈益强, 高文, 王兆其, 等.基于机器学习的语音驱动人脸动画方法[J].软件学报, 2003, 14 (2) :215-221.

[5]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社, 2002.

[6]刘颖, 王成儒.用于人脸动画的语音特征提取算法研究[J].语音技术, 2008, 32 (12) :49-53.

[7]GUPTA M, GILBERT A.Robust speech recognition usingwavelet coefficient features[C]//Proceedings of IEEE 2001Workshop on Automatic Speech Recognition and Under-standing.[S.l.]:IEEE Press, 2001:445-448.

[8]JLA Xi-bin, YIN Bao-cai, LI Jing-hua.Survey on speech-synch visual speech synthesizing techniques[J].Journal ofBeijing University of Technology, 2005, 31 (6) :656-661.

[9]叶静, 董兰芳, 王洵.用于语音动画合成的语音特征提取和聚类技术[J].微型机与应用, 2004, 23 (8) :47-49.

小学英语语音教学个案研究篇5

作者：李朔

摘要：作为一门语言学科，英语和语文一样，良好的语音基础以及语言环境可以有效促进学生语言能力的提升，在小学英语的课程教育中，语音教学是其中的重点也是难点，如何做好语音教学对提高学生学习效果和激发学习兴趣都有着积极作用。一方面，英语教师自身须具备良好的语音素质；另一方面，教师可以不拘一格地利用多种教学手段和策略提高学生的英语语音水平。本人结合自己多年的教学经验，对如何提高小学英语语音教学做出自己的浅析，以期能对我国小学英语教育做出微薄贡献。关键词：小学英语语音教学语音水平

引言：在小学阶段，学生的身体发育不成熟、理解和自控能力都比较弱精神、注意力集中程度差，这给小学英语的语音教学带来很大困难，纠错能力也就比较差。学生最先接触英语就是从语音开始的，英语语音的基础只有26个字母，单个字母的发音都很简单；但是语音的学习却又是不简单的，在26个字母的学习之后，学生要开始学习音标，音标的发音相对要难的多，音标学习的好坏，对儿童以后英语的学习十分关键。在小学英语学习中，拥有良好的语音基础对以后的英语学习十分重要，否则学生在进行英语学习时，单词可以读错，发音会不标准，这直接影响到学生英语口语的学习。鉴于英语语音学习的重要性，小学英语教师应在日常的教学实践中，重视对学生语音的教学，并根据当前的语音学习现状，制定出科学合理的教学策略。那么，如何有效地进行小学英语语音教学，让小学生轻松愉快而又顺利地过了语音这一关，成为摆在广大小学英语教师面前的共同问题。所谓万丈高楼平地起，打好基础是每一种语言学习的重中之重。

一、小学英语语音教学的整体现状

语音的重要性，英国语音学家吉姆森曾经有过论述，他认为要想学好一门语言，词汇的记忆并不是重要的，语法也只需掌握五成左右便可，但是语音知识却必须达到百分之百的程度才可以。吉姆森把英语的学习完全归功于语音的学习，固然有其不合理之处，但是语音确实在语言结构中有十分重要的作用，是英语学习的基础。曾经有语音学家说过：“学习任何语言，秩序语言的 50%-90%的语法、1%的词汇就可以使用，但是语音知识必须具备 100%的掌握”。现在的小学英语语音教育，有很多部分比较不尽人意，包括师资、教学环境、教材内容等。

二、目前教学难点、问题 2.1语言环境较差

首先，良好的语言环境可以让人轻松掌握一门语言，因为，由于英语是一门外语语言，并非我们的母语，小学生没有学习英语的语言环境，他们的英语基础学习，只能从简单的机械记忆开始，由于小学生对新知识的接纳能力有限，对于一些音标的发音、单词的发音，只能依赖于机械性的记忆，因而学习效率偏低。

2.2小学英语教师自身语音素质较低

小学英语教师语音素质较低的直接表现为语音和语调不正确。虽然小学英语教师毕业于英语专业，但是他们对英语语音的基本概念不清楚，缺乏必要的语流音变。在教学中没有重音、节奏和连续概念的区分。小学阶段是学生接受语言学习的重要时期，小学生具有较强的辨音能力，善于模仿，这是小学生在学习中的优势表现。但是，英语教师在教学的过程中语调和语音不正确，使得学生在已开始接受英语学习中接受了错误的读音，使得学生在后期的学习中花费大力气也难以纠正错误的发音。2.3教材内容问题

在课上，我们教师一般让孩子们跟读录音带，进行语音教学，在小学的课堂教学中，我发现到孩子们不能准确的把握语调，对于偏难的单词也是会降不会升：cases一词就不会念升把握不了。毕业班的孩子们，课上不愿意模仿录音跟读，在Fun reading这一环节非常明显。读课文时，拖声拖调，非常难听。跟不上录音带，完全背离了我们当初运用录音领读的目的。

三、提高教学质量研究 3.1教会学生独立思考

教师教授语音时应努力让学生学会独立思考，使他们具备获取信息和运用知识解决问题的能力，变被动学习为主动学习，并进而具备应用知识和创新知识的能力。要把激发和培养学生学习英语语音的兴趣放在英语语音教学改革和创新教学的首要位置。兴趣是最好的老师，有了兴趣才会产生学习动力，产生情感的火花，而兴趣的情感是持续发展的内驱力。如能让学生感受到英语语音学习的乐趣，才能使之持续下去，那么对学生语音能力的发展过程以及整个英语素质的提高将产生极大的效应。从我国目前的小学英语语音教学的内容来看，基本包括语音、语调和节奏三个部分，这三部分虽然不是很难，但对于小学生来说，其内容仍旧有些复杂。小学生正处于长身体、增长智力的阶段，老师不能把这些内容一股脑的全部灌输给学生，要循序渐进的进行诱发式教学，让学生慢慢的主动去吸收与消化。3.2寓教于乐

小学生的年龄段，孩子的玩心较强，很难对枯燥的小学内容保持长时间的注意，并对单一的教学内容感兴趣，因此，我们如果能将语音教育融入到孩子们感兴趣的游戏中，让他们自发的、主动的接触、练习、“游戏”语言，那么将会比我们强加、灌输的效果强百倍，例如：教师可以带领学生玩“对牌”的游戏，这个游戏的规则为教师出示一张英语卡牌，学生要准确地抢答出哪一个英语单词和它发音一样，这个游戏可用小组计分的方式进行游戏，游戏结束后，看哪个小组的得分最高，教师在这场游戏结束以后，可以引导学生分析英语发音的规律，教师还可以引导学生玩“找同伴”的游戏，这个游戏为教师把教室的地面分为数个区域，每个区域有一个语素，教师现在举起一个英语单词，该单词的某一个字母上有一个点，学生要限时跑到这个点对应的语素的位置上，如果学生没有在时限内跑到对应语素的位置上，或者跑错了语素的位置，这一轮就算出局。教师可以引导学生玩数轮游戏，最后看哪些学生没有出局，游戏结束以后，教师可以引导这些从来也不出局的学生说自己的感想，让他们和其他的学生又流学习英语语音的经验等。3.3强化学生的发音

当老师在进行字母学习时，可以运用形象法教学，在大小写字母的学习中，例如O和o，可以把他们比喻成一个大胖子和一个小胖子，这些天真的小学生自然就会觉得更加有趣，他们就会积极的参与到学习的过程中来。此外，在具体的语音教学过程中，老师应多多鼓励学生张口做练习，不要对学生进行严苛的批评与教育，只有多多鼓励才不至于打击学生的积极性。对于练习中出错的学生，老师也将对他们进行纠正，不能指责学生，小学生的身心发展不平衡，如果老师的批评太过于严重，就会让他们幼小的心灵产生阴影，因为怕出错而不敢进行练习。英语字母的学习，老师应运用学生的阶段性特点，把他们天性中的模仿与表现欲充分运用，激发学生的学习主动性。

四、结束语

河北晋州方言的语音研究篇6

关键词：晋州方言语音

一、晋州方言中声母及与普通话中声母比较

（一）晋州方言声母有24个（包括零声母在内）

p 八拔把爸 p? 葩爬怕 m 嘛吗马骂 f 发罚法

t 搭打大 t? 他体同秃 n 蔫拿哪那 l 拉来揽烂

? 尊族组置 ?? 粗从草醋 S 三绳伞散

? 渣炸眨榨 ?? 插查产颤 ? 伤勺尚上 ? 扔人然让

? 饥及几记 ?? 七齐起气 ? 西习喜细

K 高盖改告 k? 开壳凯看 ? 岸鹅袄案 x 哈还海害

? 五云用药

（二）与普通话相比晋州方言的声母有以下的特点：

1.部分普通话的零声母开口呼在晋州方言中有声母[?]，有的也可以发作[n]。普通话韵母为开口呼的零声母在晋州方言中，韵母前或增加声母[?]，在一些字中，[n]与[?]为自由变体。如：

鹅[??] 案[??] 俺[n?] 挨[?ai?] 袄[?au/nau]

2.普通话[?]声母合口呼字和少数开口呼字，晋州方言中声母是[l]。如：

（1）合口呼字：软[luan]蕊[luei]如[lu?]若[luo]

（2）少数开口呼字：扔[l??]

3.晋州方言中区分尖团音：

古精组今细音与古见晓组今细音声母的读音有别，但这种区别只限于白读的部分字，文读两类字的声母发音已基本混淆。白读中，部分古精组今细音字声母为[?、??、s]，与古见晓组今细音字声母[????]不同。如：

见组：京[?i?] 击[?i] 旗[??i] 响[?ia?]

精组：晶[?i?] 积[?i] 齐[si] 想[sia?]

还有少数古精组三四等合口字，在普通话里是[?、??、?]的撮口呼字，在晋州方言中韵母已经转为洪音，变成合口呼，声母仍是[?、??、s]如：全[??u?]悬[su?]。

二、晋州方言中韵母及与普通话的韵母比较

（一）晋州方言中有韵母39个

? 资此斯

? 只池事 i 彼批皮 u 府主出 ? 鱼居渠

? 啊娘傻 i? 亚下掐 u? 华挂歘

o 哦噢嚄 uo 破诺锣

? 和蛇河

? 欸 i? 结鞋且 y? 觉确学

? 耳二儿

ai 海台呆 uai 坏拽踹

ei 黑得内 uei 会鬼推

au 好套牢 iau 笑挑条

?u 够愁揉 i?u 就流酒

an 安汉懒 i?n 县见前 uan 换窜钻 y?n 轩员娟 ?n 跟很们 in 新尽音 u?n 吞论尊 yn 寻韵群

a? 康唐脏 ia? 相将强 ua? 黄狂旺

?? 哼奉梦 i? 应亭宁 u?? 翁嗡瓮

u? 红同冲 y? 熊穷炯

（二）与普通话相比晋州方言的韵母系统有如下的特点

1.普通话的[a、ia、ua]在晋州方言中韵腹高化为[?]，分别读作[?、i?、u?]。其中[u?]韵只保留在零声母字里，在辅音声母字里已单化为[?]，与韵[?]合并。

试比较：

爸[p?] 牙[i?] 挖[u?] 瓦[u?] 蛙[u?] 花=哈[x?] 瓜=嘎[k?]

2.普通话中的前鼻尾韵在晋州方言白读中韵尾脱落，已对转为阴声韵（开尾韵或元音尾韵），但[an、?n]两组韵母的演变方向不同。[an]组演变为[?]、[i?]、[u?]、[y?]，韵腹有鼻音色彩；[?n]组演变为[i]尾韵[ei]、[iei]、[uei]、[yei]，没有鼻音色彩，因而，[?n、u?n]两韵已与复韵母[ei、uei]合并，如：

笨=备[pei] 分=飞[fei] 棍=柜[kuei] 温=威[uei]

但是，在文读中除了少量的高频口语词外，[ei]、[iei]、[uei]、[yei]四韵字大部分受普通话影响，又发作“阳声韵”[?n]、[in]、[un]、[yn]，出现了与白读方向逆变的变异。试比较：

针跟民新孙盾云军

白 [?ei] [kei] [miei] [siei] [suei] [tuei] [yei] [?yei]

文 [??n] [k?n] [min] [sin] [su?n] [tu?n] [yn] [?yn]

3.普通话的[uei]韵[t、t?]声母字在晋州方言中，读开口呼[ei]韵。如：对[tei]、推[t?ei]。

4.宕江曾梗摄的一部分古入声字，在晋州方言中韵母有文白两种读法。如：

宕江摄入声字：

落弱约削雀乐学

白 [lau] [?au] [iau] [?iau] [??iau] [iau] [?iau]

文 [luo] [?uo] [y?] [?y?] [??y?] [y?] [?y?]

曾梗摄入声字：

色责册

白 [?ai] [?ai] [??ai]

文 [s?] [??] [???]

5.晋州方言有个别字在某些词语中韵母白读是[uau]。例如“?”字（在《广韵》里属于见母药韵合口三等入声字，义为“大锄”），在晋州方言“大?”一词中音[kuau]。“桌[?uo]”在“桌子”一词中音[?uau]。

6.在晋州话中，[?]这个单韵母，只有“欸”这个例字；[o]为单韵母时，只有“噢、哦、嚄、哦”这四个例字。

7.[??]的主要元音实际音值近于[?]。

8.[u??]韵母与[n]声母、零声母相拼，[u?]韵母与[n]以外的声相拼。

三、晋州方言中声调及与普通话的声调比较

（一）调类描述及例字

阴平213，例字：天屋鸡窗烟优刚节熄

阳平53，例字：甜无急床言油平舌俗

上声55，例字：舔五几闯眼有秒小走草

去声51，例字：去物计创燕右六药袜

（二）晋州方言中声调与普通话的声调比较

1.与普通话一样，晋州话里有4个声调，分别为：阴平、阳平、上声和去声。

2.普通话里的阴平是个高平调，晋州话中的阴平是曲折调，而且调值与普通话里上声相近，记作：213。

3.普通话里的阳平是个升调，晋州话中的阳平是个高降调，记作：53。

4.普通话里的上声是个曲折调，晋州话中的上声是个高平调，而且调值与普通话里阴平一样，记作：55。

5.和普通话一样，晋州话里的去声是个降调，并且也记作：51。

（三）晋州话中轻声两字组中后字的声调变化

晋州话中两字组轻声的变调与普通话一样，都是后字为轻声。它在四种调类后面所呈现的轻重为：在阴平音节后较高，上声音节后次之，阳平后再次之，去声后最低。

1.阴平后的轻声——4 例如：窗户桌子妈妈胳膊风筝猩猩

2.阳平后的轻声——2 例如：苹果孩子爷爷麻烦朋友谈谈

3.上声后的轻声——3 例如：挖苦椅子姐姐眼睛喜欢想想

4.去声后的轻声——1 例如：利索凳子爸爸戒指念想唱唱

古音有平、上、去、入四个声调，今晋州方言的声调是阴平、阳平、上声、去声。古声调的演变与声母的清浊有密切的关系，从这个角度，总结出古音声调与晋州声调的对应关系，如下

古平声清音声母字今读阴平，例如“高低出安开飞三”；古平声浊声字母今读阳平，例如“麻鹅龙云娘陈穷”。

古上声清音和次浊声母字今读上声，例如“古纸走比口草好”；古上声全浊声母字今读去声，例如“父抱淡似社坐厚”。

古去声不论声母清浊，今仍读去声，例如“共阵助大病望用”。

古入声清音声母字今读阴平，例如“角节国急八博嫡”；古入声次浊声母字今读去声，例如“沫药绿六月麦入”；古入声全浊声母今读阳平，例如“白毒食宅合服杂”。

四、声韵拼合规律及特点

1.晋州话的韵母系统，按开、齐、合、撮四呼分类如下：

开口呼韵母共15个，分别是：?、?、?、o、?、?、?、ai、ei、au、?u、an、?n、a?、??。

齐齿呼韵母共9个，分别是：i、i?、i?、iau、i?u、i?n、in、ia?、i?。

合口呼韵母共10个，分别是：u、u?、uo、uai、uei、uan、u?n、ua?、u??、u?。

撮口呼韵母共5个，分别是：y、y?、y?n、yn、y?。

2.从声母的角度出发，得出晋州话声韵配合的主要规律：

a.与普通话相同，双唇音和舌尖中音[t]、[t?]可以跟开口呼、齐齿呼、合口呼韵母拼合，不可以跟撮口呼韵母相拼，双唇音和合口呼韵母相拼限于[u]、[uo]。

b.唇齿音中[f]、舌根音中[k]、[k?]、[x]舌尖后音声母能和开口呼、合口呼韵母相拼，不可以与齐齿呼、撮口呼韵母相拼。[f]和合口呼韵母相拼限于[u]、[uo]。

c.舌尖中音[n]、[l]和舌尖前音均能和四呼韵母相拼，零声母音节在四声中都有。

d.舌根音[?]只能和开口呼韵母相拼。

e.舌面音中[?]、[??]、[?]只能和齐齿呼、撮口呼韵母相拼，不和开口呼、合口呼韵母相拼。

五、结语

晋州方言属于冀鲁官话石济片石衡小片。笔者在实地调查的基础上，对晋州语音系统进行了较为全面准确的描写，其中包括晋州方言声母、韵母、声调、声韵拼合规律。经过调查研究发现，晋州方言语音系统有以下特点：单字音系零声母开口呼中有韵母[?]；[a]组元音高化为[?]，且[u?]韵在与辅音声母相拼的字里音变为[?]，与[?]韵合并；普通话韵母中的[?n]、[in]、[un]、[yn]四个韵母读音转为[ei]、[iei]、[uei]、[yei]单字调有4个。

历史语音声母方面，见晓组洪细分化，精组老派仍未分洪细日母三分疑、影母洪音字大部分为[?]声母字。韵母方面，主要来源于假摄洪音二等韵的[?、i?、u?]发生了元音高化；阳声韵韵类简化，咸山、深臻舒化，正在对转为阴声韵，且深臻对转的完成早于咸山。声调方面，晋州方言中的清入字大多派入阴平和去声，归入阴平的字要多于普通话。

参考文献：

[1]黄伯荣，廖序东.主编现代汉语[M].北京：高等教育出版社，2002.

[2]唐健雄主编.现代汉语[M].石家庄：河北人民出版社，2007.

[3]徐通锵.历史语音学[M].北京：商务印书馆，1996.

[4]唐作藩.音韵学教程[M].北京：北京大学出版社，2002.

[5]胡安顺.音韵学通论[M].北京：中华书局，2002.

[6]申敬敬.藁城话语音研究[D].石家庄：河北师范大学硕士学位论文，2012.

[7]姜巍.河北辛集方言语音调查研究[D].保定：河北大学硕士学位论文，2009.

[8]郑莉.河北中南部方言声调问题研究[D].河北师范大学博士学位论文，2014.

[9]李旭，梁磊.河北方言历史和现状[J].南开语言学刊，2008，（02）：153-157，168.

[10]黄卫静.河北方言的尖团音问题[D].石家庄：河北师范大学硕士学位论文，2004.

[11]王敏.中古知庄章三组声母在河北方言中的读音研究[D].石家庄：河北师范大学硕士学位论文，2010.

[12]郑莉.现代河北方言声调的演变[J].语文研究，2014，（01）：56-60.

[13]陈淑静.古四声在河北方言中的演变[J].河北大学学报（哲学社会科学版），1994，（02）：76-83.

[14]盖云凤.中古日母字在河北方言中的读音研究[D].石家庄：河北师范大学硕士学位论文，2014.

[15]贾俊花.河北方言与普通话发音的主要差异[J].现代语文，2006，（04）：90-91.

[16]张鸿魁.读《中古入声字在河北方言中的读音研究》[J].方言，2002，（01）：93-96.

语音研究篇7

(一) “迁移”的概念

“迁移”理论出现的较晚, 其最早出现在上个世界中后期。迁移理论与一般的教育理论不同, 其是从心理学的角度对第二语言的学习进行分析。具体来说迁移理论主要是指人类在学习非母语的第二语言时, 会受到自身母语的影响, 在发音以及应用等方面都会将母语的习惯融入其中, 造成母语在第二语言中的迁移。

(二) “迁移”的分类

将母语的发音习惯以及应用方式迁移到第二语言的学习中, 对第二语言的学习带有一定的影响。而通过对迁移理论进行研究与分类, 我们可以知道这种影响不一定是负面的, 有时正向的迁移也会对第二语言的学习起到一定的促进作用。因此从这个角度进行考虑, 有关学者对迁移进行了分类, 分为正迁移和负迁移两类。

二、英汉音位之间的差异

(一) 音段之间存在的不同

英语字母与汉语的拼音有着一定的相似性, 但是细化到实际应用方面二者却存在着实质性的区别。在音段方面英语可以分为元音字母、辅音字母等, 而汉语拼音则划分为声母和韵母, 并且在发音上二者也存在着极大的不同。

(二) 辅音音位存在的不同

英语与汉语都存在着辅音音位, 但是从数量上来说汉语的辅音字母要多于英语。从音位的角度来说, 英语辅音字母在进行发音的过程中, 对于清浊十分的重视, 而汉语则对清浊相对不太关注。

三、英汉超音位之间的差异

(一) 重音存在的差异

重音在英语中起着重要的作用, 对于同一个单词运用不同的重音发音其代表的意思也会有所不同。因此在英语学习的过程中, 掌握重音的发音与应用是十分必要的。而与英语不同, 汉语中的重音一般仅代表一定的感情, 而对意思的表达基本没有影响。

(二) 节奏存在的差异

英语与汉语在节奏的表现上有着很大的不同, 英语在发音的过程中侧重节奏的变化与转折, 因此英语朗读一般带有强烈的起伏感。而汉语在发音节奏上则更加侧重于平稳, 因此汉语的朗读带有明显的清晰感。而这种发音上的节奏感是最容易发生迁移的习惯之一。

(三) 声调语调存在的差异

声调在汉语中十分的重要, 并且具有着严格的规范性, 一个汉字的声调是被硬性规定的, 在进行表达的过程中不得对其声调进行改变, 否则其就不能将意思清晰的表达出来。而英语中没有声调, 而是划分出了四种可以随意更换的语调, 人们在交流的过程中, 可以对语调进行自由的变化, 通过语调的变动表达出不同的意思与情感。

四、英语语音的教学优化方案

(一) 打好理论基础, 把握基本知识

通过上文的介绍我们可以知道, 英语与汉语在发音方面的差异主要都体现在基础知识方面。因此在实际的英语语音教学过程中, 英语教师应对基础知识产生重视。首先来说, 英语教师应带领学生打好理论基础。所谓的理论基础就是英语学习过程中一些基本性的概念, 如什么是辅音, 什么是双元音等等, 并在教授理论基础的过程中, 有意识的引导学生将其与汉语语音知识相区分。其次, 教师还应把握基本知识的教学, 只有将学生的基础打好才能有效的帮助学生摆脱母语的负迁移。

(二) 营造语言氛围, 进行标准发音

中国学生的英语发音带有着浓重的中国味道, 这主要是学生在实际的生活中缺乏学习英语的氛围, 因此经常无意识的将汉语的一些习惯迁移至英语中。为了有效的解决这一问题, 英语教师应从以下几个方面入手。首先, 英语教师应注重营造语言的氛围。营造语言的氛围可以从内部以及外部两个方面入手, 就内部而言教师应倡导学生在校期间, 或者在英语课堂上用英语进行交流, 实现课堂交流零汉语, 让学生在学习的过程中逐渐养成好的英语发音习惯。而外部的则是指聘用外教与学生进行交流, 让学生通过与外国人进行对话的方式, 感受英语的发音, 逐渐修正自己的发音。其次, 教师在授课的过程中应重视发音的标准性。这主要是因为教师是学生的主要学习对象, 教师发音的不准确将直接导致学生发音错误。因此在实际的授课过程中, 英语教师应把握学习方向, 强化语言教学。无论是课堂教学还是与学生进行课下交流, 教师都要对自己的发音进行规范。并积极组织学生观看英文电影练习英语听力。

五、总结

综上所述, 汉语语音对英语语音教学有着重要的影响, 并且从迁移的角度讲, 中国学生在进行英语学习的过程中, 经常会出现大量的负迁移现象, 严重影响了英语的学习, 对规范英语发音提高学生英语教学质量造成阻碍。因此英语教师应对汉语语言在英语语音中的迁移问题进行重视, 积极的对其进行研究, 找出二者的不同, 促进英语语音教学的顺利进行。

摘要：迁移理论是语言学习过程中的重要理论基础, 其有效的解释了母语与第二语言之间的关系, 并对第二语言的学习指明了方向。鉴于此, 本文主要对汉语语音对英语语音习得的迁移进行研究, 希望通过笔者的努力找出英语语音教学的发展之路, 对英语语音教学进行有效的启示。

关键词：汉语语音,英语语音,迁移,启示

参考文献

多语种语音学及民族语音学实验研究篇8

1. 语音实验室的发展

语音实验室在国外语言学科的建设可谓如火如荼, 在美国、英国, 上至著名学府, 下到一般高等院校均成立了专门的语音学研究机构。对比国外高度重视语音学实践环节的现象, 我国的语音学研究则相对落后, 尤其是对声学分析方向的研究更是少之又少, 目前仅有部分高校及科研机构成立了语音实验室。由此不难看出语音学在我国的发展缺乏构建完备的实验系统, 缺乏科技创新的设备支持, 很难有所突破与创新。随着市场竞争的日趋激烈, 人们逐步意识到语音学发展的重要性, 因此纷纷加大了研发力度, 构建了自主发展的特色研发中心, 如嵌入式语音系统便是这一时期语音学从抽象的实验转入现实应用的鲜明例证。

2. 现代汉语的语音学研究

语音学的发展自古而今经历了从传统到现代、从人文到自然的蜕变, 改变了以往学科单一、人文色彩浓重的落后模式, 转向了更广泛的现代科学研究领域。先进的信息技术、声乐艺术教学、声纹司法鉴定、口令、金融银行确认应用及公共安全等应用无不在语音学研究的基础上发扬光大, 并发展成为一项衍生出来的科学领域, 构成了生理、声学、发音、认知、发声、仪器、司法及病理等语音学科。基于高科技的语音学研究特点, 现代汉语的语音学发展也早已非同一般, 汉语语音学的研究在先进仪器、科学设备的辅助下得到了长足的进步。

3. 民族语音学研究

与汉语语音学研究领域广泛、成果突出的现状相比, 我国对民族语音学的研究相对落后。目前, 我国将民族语音学研究的重点放在声学参数数据库上是十分科学并具有现实意义的, 能充分适应我国民族语音学构建不完善、研究不彻底的现状。同时, 有效地开展嗓音基础理论研究有利于我国民族语音学数据库的完善、多种类民族语音研究的全面及水平的进一步提高。

二、构建多语种语音学实验室的优势及主要措施

构建多语种语音学实验室理念的提出是科学的、先进的, 针对目前我国民族语音学的研究水平相对落后、领域狭窄、手段单一的现状。依据国外语音学的成功经验构建面向各个领域的多语种语音库, 完善语音实验室的建设, 可为民族语音尤其是少数民族语言的基础研究提供必要的现实依据及科学的技术手段支持。因此我们应在深化重视、加大建设的基础上, 注重对多语种语音学实验室软件及硬件的基础建设, 配备先进的技术设备, 并针对少数民族语音的特点, 分析、采集语音素材, 为多语种语音的识别、合成及翻译构建内容丰富、基础建设扎实、完备的语音资源库, 从而为进一步丰富语音实验、环境分析, 深入多语种语音学研究作出必要的贡献。首先我们可利用良好的语音资源对各语种进行横向与纵向的语音学分析比较, 同时利用现代汉语语音实验的成功经验建立多语种专用的标音符号体系, 使少数民族语音学包罗万象的数据资源库更加丰富, 构建更加完备。为了使多语种语音学实验室的构建更加完备、系统, 我们可通过集成有效语音分析算法的方式, 借助实验室良好的设备配备, 构建完善、清晰、自然、高效、连贯、优质的少数民族语音分析平台, 从而为各类语音识别、合成及翻译环节提供有力的技术支持。

三、语音实验室的仪器、设备配备

随着语音学领域的拓宽及研究需要的进一步提升, 先进的实验室仪器与设备的配备呈现出技术含量高、更新速度快、配置水平先进的特点。首先在语音生理的研究方向, 我们可采用喉头仪、腭位仪等设备检测人们生理发音的细节变化, 规避干扰, 使语音信号的提取更加便利、准确;采用言语发声空气动力学系统通过气流面具及压力传感器来检测人们发音过程中的气流率、肺活量、声门及压力等参数, 可有效地依据提取的参数进行语音产生的生理研究。为了判别与分析鼻音问题的来源我们还可配备鼻流计, 用完备设计的头套装置分离口腔与鼻腔, 从而收集两者的语音信号并计算出鼻音度, 而后依据采集到的语音数据与正常数据的比较作出发音状况的进一步特征分析。呼吸带是一种通过采集人们胸围或腹围在发音过程中的变化来反应语音韵律特性的科学设备, 该设备的引入对个人韵律风格的研究有较好的帮助, 因此在语音教学及朗诵方面有很大的研究价值。

多元化的文化、多种族的语言是悠久历史赋予我们的巨大财富, 如何驾驭好这笔财富, 使之为人类社会学的研究作出重要的贡献, 我们只有完善地构建多语种语音学实验室, 借助统一的语音、语料数据平台分析少数民族语言, 研究民族特色语音, 才能最终使我国现代语音学的发展更加持续、繁荣。

摘要：信息化时代的到来使语音学摆脱了传统模式的禁锢, 朝着现代化、广泛化、多学科的领域不断迈进。目前汉语语音学的发展可谓卓有成就, 而其他语种的语音学发展却仍处于相对落后的局面。本文从多语种语音学的构建优势出发, 结合我国民族语言学的发展特点, 论述了多语种的语音实验环节研究, 对构建完备的多语种语音学实验室, 提高多语种语音学发展水平有重要的实践意义。

语音信号的降噪研究篇9

语音是人们进行思维和沟通的主要工具，从上世纪50年代以来，随着人们生活方式的改变，人们对语音信号数字处理越来越重视。在先进的通信设备中，内部电路因发热以及老化而产生的电干扰，传输媒介导致的噪声，以及周围环境产生的背景噪声。语音编码和识别等其他领域，为了能够得到更加纯净的语音，就需要通过降噪技术来解决这些问题[1]。这也是本文研究的重要意义所在。

将语音信号转换到一个临时的变换域中，在变换域中处理信号后再恢复到时域。关键是能在变换过程中尽量使信噪能量得到分离。这种变换技术有很多，短时傅里叶变换、小波变换和经验模态分解(简称EMD)方法等。其中，小波分析理论已其自身拥有多分辨率分析和多尺度分析等优点，在信号处理方面效果特别明显，用于信号降噪方法有阈值法、模极大值法、系数相关性法等。EMD在降噪方面，主要是基于EMD的滤波特性，已有的降噪方法有尺度滤波法和阈值法。

1 含噪信号去噪模型

语音是一种随机过程，具有时变性、非平稳性，含噪语音数学表达式为:

式(1)中，f(t)表示干净的语音信号，n(t)表示方差为σ的高斯白噪声，服从正态分布N(0，σ2)。如图1是含噪语音信号降噪模型。其中，f表示干净的信号，n表示噪声，x表示含噪信号，y表示处理后信号。

2 小波降噪理论

小波函数定义为[2]:设，则称ψ(t)为一个基本小波或母小波。对母小波做伸缩和平移得到小波函数，简称小波。信号x(t)的小波变换为:

1995年Donohn等人设计了一种基于幅度的阈值的去噪方法，信号在小波域内其能量主要集中在有限的几个系数中，而噪声的能量却分布于整个小波域内。因此经小波分解后，信号的小波变换系数要大于噪声的小波变换系数。于是可以找到一个合适的数作为阈值，当小波系数小于该阈值时，认为这时的小波系数主要是由噪声引起的;当小波系数大于该阈值时，则认为其主要是由信号引起的。选择一个合适的阈值，对小波系数进行阈值处理，就可以达到去除噪声而保留有用信号的目的。具体小波语音降噪如图2所示。

常用的阈值函数[3]有以下两种:

硬阈值函数:

软阈值函数:

其中，表示硬阈值函数处理后的小波系数，表示软阈值函数处理后的小波系数，w表示小波分解系数，λ为阈值。

硬阈值函数优点是保持边缘特性，但是其整体不连续性造成降噪后的语音信号会出现“音乐噪声”。软阈值函数具有续性、平滑性，但是若小波系数数值偏高，经过阈值处理的小波系数与原始语音的小波系数会存在恒定的误差，导致重构的语音信号有较大的失真。所以本文提出一种新阈值函数:

新阈值函数是在软阈值基础上，针对它们的导数不连续，因而提高函数阶次，可以看出新阈值在其他阈值不连续的点附近具有平滑过渡区。而且与以往研究者提出的新阈值不同，此阈值函数在小于阈值的范围内对信号有所保留，属于比较保守的阈值函数。

3 EMD降噪理论

EMD就是自适应地产生一组IMF分量作为基函数来代替原始信号，不使用窗函数，不进行积分，算法直接、高效，在语音信号处理方面发挥了独特的优势。

3.1 EMD算法的经典理论

EMD[4]是一个逐渐筛分(sifting)的过程，对于一个给定的信号x(t)，进行有效的EMD分解步骤如下:

(1)把x(t)作为待处理信号，确定该信号的所有局部极值点(极大值点和极小值点)。

(2)然后用三次样条曲线分别拟合所有极大值点和所有极小值点，得到x(t)的上下包络线u1(t),l1(t)，取上下包络线均值为m1(t),m1(t)=(u1(t)+l1(t))/2。

(3)从x(t)中减去上下包络线均值m1(t)得到准IMF分量h1(t),h1(t)=x(t)-m1(t)。

(4)判断h1(t)是否满足筛分停止准则，检测准IMF分量是否就是一个IMF分量。

(5)如果准IMF不满足条件，则把h1(t)作为待处理信号，循环进行第一至四步的筛分。

(6)如果hk满足条件，成为一个本征模态分量，记为c1。

(7)从x(t)中减去c1，获得剩余值序列r1(t)。把r1(t)作为信号重复上述第1至第6步处理，依次获得第二、第三直至第n个基本模态分量，记为c1,c2，…，cn。分解的停止基于预先设定的分解终止条件，最后剩下原始信号的余项rn。

这样就将原始信号分解为若干基本模态分量和一个余项的和。

3.2 EMD降噪理论

依据对EMD过程的分析可知，经EMD分解得到的IMF的时间尺度由小到大，频率是由高到低的。而通常情况下，噪声大部分的能量处于高频部分，所以噪声大部分处于前几个IMF分量中，而低频部分的IMF分量中则主要是信号的能量，所以没有必要对所有分量都处理。根据EMD的滤波特性，我们可以根据信号的要求，对IMF进行相应取舍，称为基于EMD算法的语音降噪方法。

EMD阈值降噪方法[5]在选定待处理分量时，通过计算含噪信号IMF分量的能量密度和平均周期的关系，根据每个IMF分量的能量密度分布的含噪置信度，将落在置信区间内的IMF分量判定为主噪IMF分量，置信区间以外的判定为主信IMF分量，离置信区间越远，对此分量信号含量的信任度越高。将主噪分量置零，对主信分量使用阈值函数做处理。EMD阈值降噪方法原理框图如图3所示。通过阈值处理后得到的IMF分量ci及余项rn叠加，得到处理后的信号。

阈值函数的选择，考虑如下:

软阈值函数:

折中阈值函数:

另外，本文提出的新阈值函数:

其中，常数0≤a≤1,ci为第i个IMF分量。

4 仿真实验结果及分析

用电脑自带的录音机，录制本人说的语音，含有高斯白噪声的语音信号进行小波分解，当信噪比为5db时，使用coif4小波分解3层获得的小波系数，获得的近似系数和细节系数如图4-5所示。

本仿真中使用Visushrink阈值规则[6]，利用第一层小波细节系数估计噪声标准差。MATLAB调用函数为:sqrtwolog。其中，新阈值函数需要确定参数a=0.8。

误差曲线幅值在0.05之内，从0.15秒开始，误差曲线幅值基本控制在0.01左右，只有两处误差达到0.02，说明，处理后的语音信号的时域波形有所改善。语音信号的主要能量得以保留，但是，小波阈值法处理使语音信号的高频能量也丢失了，使语音失去一些谐波分量，听上去有所失真。

在使用EMD降噪模型中，经过实验，此含噪信号比较适合迭代十次，获得十个IMF分量，一个余项。事实上，吴召华等人的研究已经表明了，EMD分解的滤波特性在迭代十次时表现的最明显。

对信噪比为5dB的含噪信号分解获得如图6所示分量，这样一个含有大量谐波的语音信号，被分解成几个简单、易于处理的分量，从分量图中获得一个直观结论，语音信号能量分布在第三，四，五分量中，第一和第二分量是噪声能量。

判断要进行阈值处理的分量，需要根据各分量的含噪情况。本文仿真将使用之前介绍的方法，按照白噪声的IMF分量的能量密度和平均周期的关系式来确定含噪置信度。对于信噪比为5dB的含噪信号的IMF分量的含噪置信度，经过计算得，第一，第二分量离分布线置信度很小，可以置零。

在此仿真中，新阈值函数中的参数设置为0.8，此时的新阈值和软阈值非常接近，但是，新阈值具有连续性，可以保证语音信号的真实度。

EMD阈值法中使用新阈值函数对5 db含噪信号进行处理。误差曲线幅值保持在0.05之内，相比于之前基于小波变换获得的误差曲线，图7中的误差曲线变动较大，在0秒到0.2秒之间，误差最大值达到0.48，而在0.22秒到0.33秒之间以及0.53到0.63之间误差保持在0.02之内，在0.33秒到0.5秒之间的最大误差为0.12。经过EMD分解的阈值法处理后，信号时域波形的改善情况较好，改善的情况不平均，也就是误差幅值偏离平均值较大。

5 结束语

基于小波阈值的去噪，新阈值函数存在平滑过渡区，保留了语音信号，而用EMD去噪时，信号中在去除噪声能量的同时还保留了一部分高频能量，因而语音听上去比较清晰，保证了语音信号的真实度。相比于小波变换，基于经验模态分解更能体现出新阈值函数的这一特点。

参考文献

[1]孙延奎.小波分析及其应用[M].北京:机械工业出版社,2005.

[2]Luying Sui,et al.An improved Spectral Subtraction Speech Enhancement Algorithm under Non-stationary Noise[J].IEEE Trans.Speech Audio Process,2011,978(1):126-136.

[3]贺晓磊.基于小波变换的语音去噪算法及其应用研究[D].广西:广西师范大学,2012.

[4]于伟凯.EMD时频分析方法的理论研究与应用[M].天津:燕山大学,2006.

[5]孙美玲.基于EMD方法的语音增强的研究[D].哈尔滨:哈尔滨工程大学,2011.

LTE语音技术研究篇10

LTE网络是基于全IP架构, 无法提供传统的CS域语音业务, 只能提供基于PS域的IP语音业务, 且需要通过IMS来提供会话类业务的控制功能。目前, 业界主要形成了SVLTE、CSFB、Vo LTE这三种解决方案。

二、LTE语音技术的专利申请状况

图1 示出了LTE语音相关专利申请的历年分布情况, 2007-2012 年期间的申请量呈现相对较为平稳趋势, 而随着LTE网络的逐步完善覆盖, 对LTE语音通信需求的日趋强烈, 越来越多的企业和科研院所加入到LTE语音领域的研究, 从2012-2013 年期间出现大幅增长。由于发明专利申请通常自申请日起满十八个月即行公布, 2014-2015 年期间的大部分专利申请可能处于未被公开状态而未被统计, 预计2014-2015 年期间的申请量仍为大幅增长。

图2 示出了LTE语音相关专利申请的各申请人分布情况, 国内主要申请人包括华为、中兴、联通、移动、电信、展讯及高校院所, 国外主要申请人包括爱立信、高通、三星、捷迅。

三、LTE语音技术的专利申请主要研究方向

SVLTE方案对现有网络无改造要求, 但多模双待终端采用两套基带芯片进行双收双发, 导致终端体积大、成本高、功耗高, 且存在国际漫游问题;仅适用于在LTE发展初期, 以较小的网络代价更快地提供语音业务。

CSFB方案对现有网络改造要求较少, 支持国际漫游场景下的语音呼叫, 但要求LTE网络与回落的2G/3G网络之间存在重叠、以及多模终端支持CSFB功能, 且呼叫接续时间较长。该方案的专利申请主要研究方向包括:呼叫建立时间长、返回LTE时间长、不支持语音和数据业务并发、以及呼叫建立失败等异常处理。Vo LTE方案可以提升无线频谱利用率、降低网络成本, 提升用户体验, 语音清晰、时延短, 融合视频多媒体等多种业务, 但对现有网络改造要求最高, 且涉及的较多新技术需要进一步的测试和验证。该方案的专利申请主要研究方向包括:SRVCC切换、漫游控制、以及Vo LTE与CSFB共存所涉及的模式选择、通信计费等相关问题。

四、结束语

随着LTE网络的逐步完善覆盖, Vo LTE是LTE语音技术发展的必然趋势, 而运营商需要较为漫长的时间来全面实现Vo LTE, 因此, CSFB与Vo LTE可能在很长一段时间内共存。

参考文献

[1]3GPP TS 23.272 V13.0.0;Circuit Switched fallback in Evolved Packet System;Stage 2;2015.06.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【语音研究】相关文章：