语音信号的采样与分析

2024-07-14

语音信号的采样与分析(精选三篇)

语音信号的采样与分析 篇1

本文简要介绍了语音信号采样与分析的发展史以及语音信号的特征、采样与分析方法。第二节主要介绍语音信号的特点与采集, 仿真主要是验证奈奎斯特定理。第三节主要是对语音信号进行时域、频域上的分析。第四节是对语音信号的综合和分析, 包括语音信号的调制, 叠加, 和滤波。声音信号采集功能的实现是由MATLAB控制计算机声卡将传感器得到的模拟信号转换为数字信号并存储在计算机中;而信号分析功能是将采集得到的数据进行时、频域分析和各项数值分析等。整个系统设计主要包括系统的硬件配置、编制程序实现数据采集、编制程序实现数据分析及系统的界面设计四部分。

二、语音信号的特点与采样

1、语音信号的特点

在频域内, 语音信号的频谱分量主要集中在300~3400Hz的范围内。利用这个特点, 可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出, 然后按8k Hz的采样率对语音信号进行采样, 就可以得到离散的语音信号。

在时域内, 语音信号具有“短时性”的特点, 即在总体上, 语音信号的特征是随着时间而变化的, 但在一段较短的时间间隔内, 语音信号保持平稳。在浊音段表现出周期信号的特征, 在清音段表现出随机噪声的特征。

2、语音信号的采集

在将语音信号进行数字化前, 必须先进行防混叠预滤波, 预滤波的目的有两个: (1) 抑制输入信号各领域分量中频率超出fs/2的所有分量, 以防止混叠干扰。 (2) 抑制50Hz的电源工频干扰。为了将原始模拟语音信号变为数字信号, 必须经过采样和量化两个步骤, 从而得到时间和幅度上均为离散的数字语音信号。采样时必须要注意满足奈奎斯特定理。语音信号经过预滤波和采样后, 由A/D变换器变换为二址制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内, 因此目前来说, 语音信号的数字化的质量还是有保证的。采集到语音信号之后, 需要对语音信号进行分析, 如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。

三、语音信号的分析

1、语音信号分析技术

贯穿于语音分析全过程的是“短时分析技术”。根据所分析出的参数的性质的不同, 可将语音信号分析分为时域分析、频域分析、倒领域分析等。

2、语音信号的时域分析

语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时, 最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号, 这种方法直接利用语音信号的时域波形。语音信号的时域参数有短时能量、短时过零率、短时白相关函数和短时平均幅度差函数等, 这是语音信号的一组最基本的短时参数, 在各种语音信号数字处理技术中都要应用。

(1) 短时能量及短时平均幅度分析

短时能量和短时平均幅度函数的主要用途有: (1) 可以区分浊音段与清音段, 因为浊音时En值比清音时大的多。 (2) 可以用来区分声母与韵母的分界, 无声与有声的分界, 连字的分界等。 (3) 作为一种超音段信息, 用于语音识别中。

(2) 短时过零率分析

短时过零率表示一帧语音中语音信号波形穿过横轴的次数。在实际中求过零率参数时, 需要十分注意的一个问题是如果输入信号中包含有50Hz的工频干扰或者A/D变换器的工作点有偏移, 往往会使计算的过零率参数很不准确。为了解决前一个问题, A/D变换器前的防混叠带通滤波器的低端截频应高于50Hz, 以有效地抑制电源干扰。对于后一个问题除了可以采用低直流漂移器件外, 也可以在软件上加以解决, 这就是算出每一帧的直流分量并予以滤除。

对语音信号进行分析, 发现发浊音时, 其话音能量约集中在3k Hz以下。而发清音时, 多数能量出现在较高频率上。高频就意味着高的平均过零率, 低频意味着低的平均过零率, 所以可以认为浊音时具有较低的过零率, 而清音时具有较高的过零率。利用短时平均过零率还可以从背景噪声中找出语音信号, 可用于判断寂静无声段和有声段的起点和终点位置。在孤立词的语音识别中, 必须要在一连串连续的语音信号中进行适当分割, 用以确定一个一个单词的语音信号, 即找出每一个单词的开始和终止位置。此时, 在背景噪声较小时用平均能量识别较为有效, 而在背景噪声较大时用平均过零率识别较为有效。但在以弱摩擦音、弱燃破音、鼻音为语音开头或结尾时, 只用其中一个参量来判断语音的起点和终点是有困难的, 必须同时使用这两个参数。

3、语音信号的频域分析

语音信号的频域分析就是分析语音信号的频域特征。本文介绍的是语音信号的傅里叶分析法。因为语音波是一个非平稳过程, 因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号, 而应该用短时傅里叶变换对语音信号的频谱进行分析, 相应的频谱称为“短时谱”。

4、语音信号的语谱图

把和时序相关的傅里叶分析的显示图形称为语谱图。语谱图是一种三维频谱, 它是表示语音频谱随时间变化的图形, 其纵轴为频率, 横轴为时间, 任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓谈来表示。

四、语音信号的综合仿真分析

(1) 录制一段自己的语音信号, 并对录制的信号进行采样; (2) 对语音信号进行调制; (3) 用经过调制的信号与原信号叠加; (4) 设计数字滤波器和画出频率响应; (5) 进行低通滤波, 比较滤波前后语音信号的波形及频谱。

五、总结

声音信号的采集与分析处理在工程应用中是经常需要解决的问题, 如何实时采集声音信号并对其分析处理, 从而找出声音信号的特征在科学研究中是一项非常有意义的工作。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。让计算机能听懂人类的语言, 是人类自计算机诞生以来梦寐以求的想法, 用现代手段研究语音信号, 使人们能更加有效地产生、传输、存储、获取和应用语音信息, 这对于促进社会的发展具有十分重要的意义。

摘要:随着现代计算机技术的普及和发展, 数字电子产品的使用越来越深入到人们的日常生活中。人类与数字化产品的交往已经密不可分。语音信号的处理作为新时代的一个课题越来越受到人们的重视。于是通过对自然声音的识别与处理不约而同的产生于许许多多科学研究人员的脑海中, 语音识别处理的出现就孕育而生了。语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科, 是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。本文简要介绍了语音信号采样与分析的发展史以及语音信号的特征、采样与分析方法。

关键词:语音信号,采样与分析

参考文献

[1]刘益成, 孙祥娥.数字信号处理[M].北京:电子工业出版社, 2009.[1]刘益成, 孙祥娥.数字信号处理[M].北京:电子工业出版社, 2009.

[2]邹理和.数字信号处理[M].北京:国防工业出版社, 1985.[2]邹理和.数字信号处理[M].北京:国防工业出版社, 1985.

语音信号的采样与分析 篇2

1.课程设计目的………………………………………………………………(1)

2.课程设计基本要求……………………………………………...………….(1)

3.课程设计内容………………………………………..……………………..(2)

4.课程设计实现……………………………………………………..…..……………(3)

(1)语音信号的采集……………………………………………………..(5)

(2)语音信号的频谱分析………………………………………………..(6)

(3)设计滤波器和画出频率响应………………………………………..(6)

(4)用滤波器对信号进行滤波…………………………………………..(9)

(5)比较滤波前后语音信号的波形及其频谱…………………………..(9)

(6)回放语音信号………………………………………………………..(11)

(7)设计系统界面………………………………………………………..(13)

5、心得体会……………………………………………..……………………..(14)

语音信号的采样与分析 篇3

语音信号的处理是利用语音信号进行科学研究、工程应用的重要一环。而对语音信号进行怎样的处理,用怎么样的方式进行处理则是这项工作的关键所在。本文则在LabVIEW编程软件的基础上,对语音信号进行采集、存储、分析。LabVIEW(Laboratory Virtual Instrument Engineering Workbench)是由美国国家仪器(NI)公司研制开发的一种程序开发环境,是一种用图标代替文本行创建应用程序的图形化编程语言。LabVIEW提供很多外观与传统仪器(如示波器、万用表)类似的控件,可用来方便地创建用户界面,(用户界面在 LabVIEW中被称为前面板)。使用图标和连线,可以通过编程对前面板上的对象进行控制。这就是图形化源代码,又称G代码。LabVIEW的图形化源代码在某种程度上类似于流程图,因此又被称作程序框图代码。LabVIEW大大简化了编程的复杂而繁琐的过程,被广大院校和各科研机构实验室采用。

1 语音信号采集与分析系统

语音信号采集的硬件是:声卡(ATI Function Driver for 高保真音频-ATI AA01)作为。语音信号采集与分析程序的则由LabVIEW声音采集函数VI构成的图形化程序来实现。整个系统分为两大模块:采集并保存实时语音信号,读取历史语音信号。两模块功能分时实现,独立控制其运行、停止,同时由下拉选择菜单控制切换。系统的两功能模块的切换,是通过while循环和条件选择结构来实现的。系统运行后选择相应的功能选项,条件结构做出判断,进入采集语音信号程序或读取语音信号程序。按下确认按键便可执行对应的功能,点击结束布尔控件便可停止运行对应功能。

信号在采集或读取后,交由信号处理类函数对其进行显示、滤波以及功率、幅度、相位频谱分析和失真分析。从而得到功率谱、幅度谱、相位谱以及谐波失真的相关数据。在对数据进行处理时,语音信号采集存储和历史语音信号读取部分都含有相同的信号显示和分析模块,且它们是分时独立运行的,可以共用一套控件,因而采用了局部变量。这样可以大大减少前面板的控件数目。

1.1 语音信号采集存储系统

在系统中设置的功能切换菜单中,选择采集语音信号,切入后点击采集确认按钮,执行语音信号的采集存储和分析功能。语音信号的采集,使用声音采集函数:Sound Input Configure.vi与Sound Input Read.vi。Sound Input Read.vi从声音输入设备读取数据时,必须使用Sound Input Configure.vi配置设备,设置相应的参数。采样率(S/s):通常为44100 S/s,22050 S/s,11025 S/s。本系统中设置为默认值22050 S/s。通道数:指定通道的个数。该输入可接受的通道数与声卡支持的通道数一致。对于多数声卡,1为单声道,2为立体声。设置为2。每采样比特数:有8比特和16比特。设置为16。Sound Input Configure.vi采集到的数据被发送到缓存,使用Sound Input Read.vi从声音输入设备读取数据。语音信号采集程序如图1所示。

当执行采集数据时,可以对信号进行存储和实时地显示、分析。语音信号的存储主要由Sound File Write Open.vi(设置为写入)和Sound File Write.vi实现。Sound File Write Open.vi用于创建待写入的新.wav文件。Sound File Write.vi将来自Sound Input Read.vi的输出数据写入.wav文件。程序中采用数字IIR滤波器:Digital IIR Filter.vi对数据进行处理。根据连接至信号输入和IIR滤波器规范输入端的数据类型可确定要使用的多态实例。由于语音信号的采集是以人的声音作为主要对象,因此将滤波器设置为低通。

数据的分析主要由一个信号分析子程序Sub VI实现。Sub VI的使用简化了程序框图的结构,使其更加简洁便于理解,也提高了VI的运行效率。如图2所示,信号分析子程序.vi有3个输入接线端子,6个输出端子。分析选项连接到“分析菜单”。分析菜单里有两个选项:功频分析、谐波分析。功频分析主要是通过频谱测量得到信号的幅度谱、相位谱、功率谱。谐波分析则对信号进行失真分析,测量谐波。谐波的失真分析是由Harmonic Distortion Analyzer.vi实现的,输入信号,进行完全谐波分析(包括测量基频和谐波),返回基频、所有谐波的幅值电平,以及总谐波失真(THD)。检测出的基频包含搜索频域时检测出的基频。所有谐波的测量结果为基频的整数倍。THD是谐波的均方根总量与基频幅值的比,包含达到最高谐波时测量到的总谐波失真,包括最高谐波。通过信号输入端,可确定要使用的多态实例,也可手动选择实例。

1.2 读取历史语音信号系统

将系统功能切换至读取语音文件模块,执行对历史语音信号的读取、显示、分析。在此程序中设置了一个条件结构,以等待确认是否开始读取历史语音信号,当条件为假时通过反馈接点将路径输入输出连线短接,将不实现程序的预定功能。Sound File Write Open.vi(设置为读取实例)读取文件的路径参数,打开用于读取的.wav文件。Sound File Read.vi接收来自Sound File Write Open.vi的数据,将.wav文件的数据以波形数组形式读出,输入到数字IIR滤波器和信号分析子程。Digital IIR Filter.vi对数据进行滤波处理。信号分析子程序.vi对语音信号的数据进行测量分析。信号的分析模块与采集语音信号的信号分析模块完全相同,通过局部变量分时独立使用。读取历史语音信号系统过程如图3所示。

1.3 前面板

程序的前面板(如图4所示)主要由声音采集函数格式参数和滤波器的参数控件、波形显示控件、 功能切换控件 、确认(读取、采集)控件、停止控件、路径控件组成。功能选择控件由枚举控件生成,通过功能选择控件,操作者可以方便地在前面板上完成功能切换,控制语音信号采集分析系统的运行状态。在前面板上,通过选择不同的功能,点击确认按钮,实现对语音信号的灵活地处理,整个系统变得实时、有序。对处理语音信号之前,需要在两个路径控件分别输入采集和读取语音文件的路径,集语音信号的硬件设备号和采样通道数也需要提前设置好。同时在声音格式控件里设置采用率、采样模式等参数。滤波器参数则在IIR滤波器规范控件里设置。随后便可运行系统程序。

在功能选择控件里包含两个选项:采集语音信号、读取语音信号,默认为采集语音信号。选择采集语言信号,条件结构作出判断,进入采集语言信号程序,该程序实现对语音信号进行采集、存储、滤波、显示、分析。进入程序后,程序运行在一个包含布尔确认控件的While,等待操作人员用鼠标点击采集按键,确认开始采集信号。信号被采集到时被实时输出到显示控件里,同时被保存到由程序新建的为wav格式的音频文件里。这要求事先设置建立一个保存.wav文件的目录。采集到的语音信号被送至语音分析模块,在语音分析子程序里的功能选项里,有两个选项:功频分析和谐波分析,功频分析测量语音信号的功率、幅度、相位,选择该功能就可以得到语音信号的功率谱、幅度谱、相位谱。谐波分析,主要测量分析信号的谐波失真,得到的数据输出到显示控件里。

2 结束语

利用LabVIEW图形化编程软件实现语音信号的采集和处理编程,在大大降低了编程复杂程度的同时保证了程序功能,节省了大量的时间。在设计程序之前,应对系统用到的各硬、软件性能有一定的了解,根据功能需求设置合理的参数。采用合理程序结构和合适的信号处理函数是保证系统功能的关键所在,达到了以最简单的程序框图实现系统功能的目的。本文中图形化的编程界面和人性化的人机交互界面使得程序易懂、系统操作简便。计算机自带的声卡足以实现对大量语音信号的采集,节约了成本。

参考文献

[1]雷振山.LabVIEW7Express实用技术教程[M].北京:中国铁道出版社,2004.

[2]雷振山,肖成勇,魏丽,等.LabVIEW高级编程与虚拟仪器工程应用[M].北京:中国铁道出版社,2012.

[3]肖光华,方勇.一种LabVIEW环境下的语音跟踪系统[J].电声技术,2008,32(12):54-57.

[4]杨洁,华宇宁,张勇.应用小波变换对语音信号消噪处理的研究[J].期刊资讯,2006,32:6-7.

上一篇:高职班干部培养下一篇:做好高中生物教师