语音编解码

2024-07-02

语音编解码（精选八篇）

语音编解码篇1

64 Kb/s的A律或μ律的对数压扩PCM编码在大容量的光纤通信系统和数字微波系统中已得到广泛应用, 但由于占用较大的传输带宽和具有复杂的成帧结构[1]。连续可变斜率增量 (Continuously Variable Slope Delta, CVSD) 调制以其较低的应用难度、成本和编码速率, 较好的语音质量广泛应用于战术通信网、卫星通信、蓝牙等无线语音传输领域。于是不同码制的网络之间的互连对两种码制之间的转换提出了更高的要求[2,3]。针对近年来FPGA、DSP技术的不断发展, 本文提出了一种满足此需求的设计方案, 以适应通信技术日新月异的发展。

1 多路数据信号的收发

1.1 McASP (Multichannel Audio Serial Port)

McASP在C5000系列DSP处理器基础上新增加的一个专门用来实现多通道音频应用的通用串行端口, 它包括收/发两个功能部件, 二者间即可完全同步也可各自采用完全独立的主时钟、位时钟和帧同步时钟, 具备不同的数据传输模式和位码流格式。

支持多种数据协议:I2S, S/PDIF, IEC60958-1, AES-3等格式码流, 支持时分复用 (TDM码流) , 多达32个通道进行收发传输的字长可以是8位/12位/16位/20位/24位/32位等[4]。

1.2 多路数据收发的实现

1.2.1 TDM模式

本文讨论的是音频数据的传输, 当MCASP工作于TDM格式时可以用于DSP和多个ADC及DAC直接相连接。数据的多路传输取决于每一收 (发) 帧多达32个时隙的传输模式。图1显示了6个SLOT的传输模式。

TMS320C6713的多路数据输出/输入需经过一个数据组合和分离的时序控制单元, 这一任务由一块FPGA完成, 其功能是接收所有来自DSP的数据, 将相同的时隙组合在一起后根据相应的连接设备的时序送出, 同时将来自不同的设备的数据组合后以TDM的方式送入DSP, 如图2所示。

1.2.2 时钟和帧同步

通过设置DSP的收发帧同步控制寄存器可以设置TDM的具体模式, 而相应的位时钟、帧同步时钟可由编程控制由外部产生或直接由内部产生, 图3是时钟的相关控制关系。高频时钟AHCLKX可由高频时钟控制寄存器设置为内部产生或外部输入, ACLKX可由时钟控制寄存器设置为内部产生或外部输入[5]。如果采用内部高频时钟, 则由AUXCLK经分频后得到, 分频数值由高频时钟控制寄存器的0～11 b决定;高频时钟分频后得到位时钟, 分频数值由时钟控制寄存器的0～4 b决定。

1.3 AD采样和语音信号的回放

TLV320AIC23B是输入输出模拟音频接口编解码器, 该编解码器采用了Sigma-Delta技术进行数模和模数转换, 并和McBSP直接相连, AIC23还提供了麦克风输入、线性输入、线性输出和耳机输出4个模拟接口。TLV320AIC23B的控制字可通过SPI方式或者I2C方式写入[6]。图4是I2C方式控制字的读写时序图。

设定控制寄存器的工作方式后即可利用TLV320AIC23B对语音信号进行高精度的采样和回放。

2 CVSD编解码

CVSD也叫数字检测音节压扩增量调制, 进入实用阶段已有十多年的历史。数字CVSD编译码器中音节平滑滤波器及编译码器中的主积分器的转移函数如下[7]:

音节平滑滤波器:

$Η_{1} (z) = \frac{G_{1}}{1 - a_{1} z^{- 1}}$

编码器双积分器:

$Η_{2 C} (z) = \frac{G_{2 C} (1 + C_{1} z^{- 1})}{1 - b_{1} z^{- 1} b_{2} z^{- 2}}$

译码器主积分器:

$Η_{2 D} (z) = \frac{G_{2 D}}{1 - b_{1} z^{- 1} - b_{2} z - 2}$

图5是编译码器的流程图。对上述公式做Z的反变换可以得到三个差分方程, 按照相应的差分方程实现相应的编解码器代码编写[8]。

3 PCM码与CVSD码的转换

PCM码采样频率是8 kHz, CVSD编码的采样频率是16 kHz, 把PCM码转化为CVSD码先要把PCM码转换成线性PCM, 然后加2倍内插低通滤波器以使采样频率从8 kHz变换到16 kHz, 之后送入CVSD编码器生成16 Kb/s的CVSD码[9];CVSD码转化成PCM码则是一个相反的过程, 即将CVSD码送入译码器即可得到线性的PCM码, 与此时的PCM码相对应的采样频率为16 kHz, 而不是8 kHz。为使采样频率从16 kHz变换到8 kHz, 需要加2倍抽取低通滤波器, 把线性PCM变换成A律PCM。而滤波器可以选择FIR滤波器[10]。

4 结语

本文提出的多路音频数据的输入/输出设计, 利用了6000系列DSP的高速数据处理功能, 同时处理多路数据的CVSD编解码、PCM码与CVSD码的相互转换, 对于不同码制的网络之间的互连具有重要的应用意义。

摘要：介绍一种对语音信号的实时采样和编码处理的方法。该系统采用高精度可编程芯片TLV320AIC23B对多路原始语音信号进行模数转换后经DSP的片上外设MCBSP送入TMS320C6713进行CVSD编码压缩, 之后又由MCBSP送出, 同时MCBSP接收多路A律PCM信号, 经TMS320C6713转换成CVSD信号后由MCBSP送出, TMS320C6713亦可接收CVSD编码信号转化成A律PCM信号后送出。该系统充分发挥了DSP的高速数字信号处理的性能, 同时处理多路信号收发及数字运算具备非常好的实时性。

关键词：CVSD,编码,解码,语音

参考文献

[1]Greefles J A, Dejager F.Continuous Delta Modulation[J].Philips Research Reports, 1968, 23 (2) :233-246.

[2][美]拉宾纳L R, 谢弗R W.语音信号数字处理[M].北京:科学出版社, 1983.

[3]易克初, 田彬, 付强.语音信号处理[M].北京:国防工业出版社, 2000.

[4]罗闻, 王峻峰, 史铁林.基于McASP的高速串行数据采集系统设计[J].微计算机信息, 2006, 22 (25) :176-178.

[5]任丽香, 冯淑芬.TMS320C6000系列DSPs的原理与应用[M].北京:电子工业出版社, 2001.

[6]徐君毅.单片机微型计算机原理及应用[M].上海:上海科技出版社, 1988.

[7]黄福贵, 朱志国, 孙波.语音编码调制的CVSD算法及实现[J].声学与电子工程, 2005 (4) :19-22.

[8]李欣, 藏笛, 罗程.CVSD编码/译码器在语音系统中的应用[J].电子与自动化, 1999 (3) :32-33.

[9]陈显治.现代通信技术[M].北京:电子工业出版社, 2001.

语音编解码篇2

摘要：AC4830xC-C是美国AudioCodes公司生产的语音专用芯片，它支持多种码率的语音编解码国际标准，同时可提供传真和数据中继功能。而TCM38C17则是美国TI公司的语音PCM编码芯片。文章介绍了两种芯片的基本性能及工作原理，并给出了一种基于这两种芯片设计的四路语音编解码系统的实现方案。

关键词：AC4830xC-C;TCM38C17;语音编解码

1引言

AC4830xC-C系列芯片是美国AudioCodes公司出品的一种语音专用芯片，它可以将PCM语音码流按照需要压缩成多种码率的语音信号，AC4830xC-C具有多通道语音传输功能，各通道的操作相互独立。该芯片在语音通信，特别是IP电话系统中具有广泛的应用。TCM38C17则可提供A律和U律两种不同的PCM编码功能，也具有四路相互独立的信道。本文主要介绍这两种语音芯片的基本性能和工作原理，并给出了基于这两种芯片实现四路语音编解码的系统设计方案。

2AC4830xC-C的功能原理

AC4830xC-C系列器件中包含有AC48301C-C、AC48302C-C和AC48304C-C三种芯片，分别可提供1、2、4个语音通道，而且多通道芯片中的各通道可独立操作，互不干扰。AC4830xC-C的基本工作原理如图1所示。

在进行语音系统设计时，利用AC4830xC-C芯片可以将PCM语音码流根据实际需要压缩成如下多种码率的.语音信号：

(1)G.711PCM码率为64kbps;

(2)G.726ADPCM码率为16kbps～40kbps;

(3)G.727E-ADPCM码率为16～40kbps;

(4)G.729CS-ACELP码率为8.0kbps;

(5)G.723.1MP-MLQ/ACELP码率为6.3/5.3kbps;

(6)NetCoder码率为6.4kbps～9.6kbps。

在接收到语音PCM码流或者传真数据以后，AC4830xC-C首先进行输入增益控制和回波抵消，然后区分具体的业务类型是语音数据还是传真数据，如果是语音数据，则根据具体的要求对语音信号进行编码，并将编码后的数据通过主机接口送出;另一方面，AC4830xC-C也将从主机接口读入数据并加以判断，如果判断其为语音数据，就将其解码成PCM码流并通过PCM接口送出。

AC4830xC-C芯片必须有外围设备的支持才能正常工作。它提供了5个外部接口，即主机接口(HPI)、PCM接口、时钟接口、存储器以及I/O接口和仿真测试接口。AC4830xC-C的主机接口为8位并行接口，可用DSP通过主机接口控制AC4830xC-C?并与其交换数据。

AC4830xC-C的时钟控制部分包括连接在外部的晶体振荡器和内部时钟电路，其工作时钟一般由外部晶体振荡器的振荡频率和内部的PLL值决定。设计时，可以通过改变PLLMUL寄存器的值来改变其工作时钟。

此外，AC4830xC-C还提供了六种可供选择的工作时钟方式，但是要求其工作频率必须控制在98.304～100MHz之间。

3TCM38C17的工作原理

TCM38C17是美国德州仪器公司(TI)生产的PCM语音编码芯片，它可提供模拟语音信号和PCM码流之间的相互转换功能，同时集成有A律和U律两种标准。此外，芯片本身还提供了增益控制等功能。该芯片将4路PCM芯片集成到了一起，相当于4片TCM29C13的功能。该器件在工作时，通常需要外部电路为其提供时钟信号PCMCLK、帧同步信号PCMFS以及每路语音的具体帧同步信号?其四路协同工作的工作时序如图2所示。

4系统硬件设计

基于上述两芯片所提供的功能，下面给出一种四路语音编解码系统的实现方案，图3所示是其系统框图。

在该系统中，当信源发出的模拟语音信号经过TCM38C17实现PCM编码后，该PCM码流将经过AC4830xC-C压缩编码以形成需要的语音码流，然后通过DSP处理器进行控制、调频等后续处理，最终通过串/并转换器送出。另一方面，DSP会将从串/并转换器读入的数据通过主机接口写入AC4830xC-C，并由AC4830xC-C对语音码流进行解码以生成PCM码流，然后再经过TCM38C17恢复成模拟语音信号。由于AC4830xC-C

只提供有一个帧同步信号，因此，本系统中使用了一个计数器来产生TCM38C17芯片所需要的其它三路帧同步信号。

5系统软件设计

该系统软件主要用于对AC4830xC-C进行控制，AudioCodes公司规定了AC4830xC-C的操作方法，并提供了相应的初始化内核程序和工作程序。工作时，应该首先通过DSP对AC4830xC-C进行复位，复位成功后，首先写入内核程序，然后写入工作程序，最后再将这些程序通过AC4830xC-C的主机接口写入到AC4830xC-C。

在下载完工作程序之后，芯片即可开始工作，此时芯片处于初始化模式，其默认的编码码率为32kbps的ADPCM编码，设计者可以对每一路进行单独的模式设置，包括启用哪几路语音通道、调节每一个语音信号的幅度、根据具体的技术要求选择相应的语音编码方式等。AC4830xC-C每30ms读入一帧语音数据，每一帧语音数据均会被压缩编码成一个语音数据包。该数据包中包含有语音数据和编码方式的相关信息，而且传送数据时，这些编码信息也必须同时被传送到接收方。

6结束语

语音编解码篇3

1 系统结构及原理

本系统主要由语音解码和语音合成输出两部分组成,语音解码是对输入的ADPCM 编码格式的语音数据进行解码,使其恢复成PCM编码格式的数据。简单地说,它是语音数字信号编码的逆过程,但又不完全是,它没有编码过程复杂。语音合成输出是将 PCM码的数字信号经脉冲宽度调制(PWM)方式合成输出,并配合其他的D/A转换(如电阻和电容等),将数字信号还原成模拟信号接喇叭发声。

1.1 ADPCM解码算法的原理

ADPCM是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种性能比较好的波形编码技术。该技术首先是计算出每个当前采样与一个预测值之间的差值,然后计算出下一个预测值用于计算下一个差值,并对差值进行编码,所以这种编码需要的位数相对于对整个采样值进行编码所需要的位数要少很多,编码时利用自适应改变量化阶距的大小,并且根据当前值进行预测,用于下次编码,使实际样本值和预测值之间的差值总是最小。ADPCM的编码简化框图如图1所示。

解码是编码的逆过程,是实现解压缩功能,利用输入的信号来确定逆量化器中的量化阶距大小,并且用它来预测下一个输出信号的预测值,从而得到量化差分信号,量化差分信号与预测值相加得到重构信号,然后转换成PCM码。解码简化框图如图2所示。量化器自适应的量化阶距是基于当前量化阶距和量化器前级输入的输出,随着两个顺序表查找完成的同时完成自适应的过程,这两个顺序表是量化阶距表和索引表。量化阶距表是将具体的量化阶距的大小、索引值以常数形式确定下来;索引表则是根据误差的代码值来确定阶距索引值的调节因子,用以量化阶距调整从而调整预测值。

1.2 PWM的原理

由解码输出的数字语音信号不能直接驱动外部的扩声系统,需要对它进行一定的转换,常用的方法是采用权电流D/A方式来实现D/A转换。但是,权电流D/A方式存在一些缺点,为了克服这些缺点,本文采用纯数字的PWM方式来实现合成语音输出。

脉冲宽度调制器的基本思想是依据合成语音样点值的大小,对应调节输出信号的占空比,频率保持不变,再通过低通滤波器滤波,直接恢复出语音信号。根据面积等效原理,冲量相等而形状不同的窄脉冲加在具有惯性的环节上时,其效果基本相同。冲量是指窄脉冲的面积;效果基本相同是指输出响应波形基本相同。由面积等效原理,PWM系统的基本原理框图如图3所示。

该系统由一个数值比较器和一个周期为Ts的锯齿波发生器组成,输出为占空比不同的矩形脉冲序列。如果语音信号x(t)大于锯齿波信号,比较器输出常数A,否则输出0。从图3可以看出,输出的PWM波的脉冲宽度取决于脉冲下降沿时刻的x(t)值,一般第k个矩形脉冲的宽度可以表示为τk=τ0[1+mx(kTs)],式中,x(t)是离散化的语音信号;Ts是采样周期;τ0为未调制宽度;m为调制指数。本文对矩形脉冲作如下近似,脉冲中心在kTs处,Ts在相邻脉冲间变化缓慢,则PWM波可以表示为

undefined

式中,undefined。由式(1)可以看出PWM信号由x(t)加上一个直流成分以及相位调制波构成。当τ0≪Ts时,相位调制部分引起的信号交叠可以忽略,所以PWM波可以直接通过低通滤波器进行解调。

2 系统的现场可编程门阵列(FPGA)设计

ADPCM语音压缩解码算法已能在DSP(数字信号处理器)上实现,但DSP存在硬件结构不可变、处理速度相对较慢等不足。而FPGA具有大容量、高速、高可靠性等明显的优点,可以克服DSP的不足,同时FPGA可重复组态的结构特点,使得在进行复杂系统的设计过程中对系统修改和升级极为方便。根据ADPCM语音解码算法和PWM合成语音输出的基本原理,本文着重研究采用FPGA技术实现ADPCM语音解码输出系统的问题。

2.1 ADPCM语音解码器

解码器主要由一台控制逻辑状态机根据各时刻、各个器件的状态, 发送控制信号给各器件, 使各部分按一定的时序完成信号解码。有限状态机适合时序关系复杂、状态数多的算法及应用系统。基于有限状态机的设计结构严谨, 能有效地减少竞争风险。解码器的结构如图4所示,ADPCM语音压缩编码的低三位经过自适应量化阶距调整部分输出量化阶距,其中自适应量化阶距调整部分由索引调整值存储器、5位加法器、5位寄存器和量化阶距存储器构成。量化阶距经逆量化器得到语音差值,由选通三态门、移位寄存器和差分信号重构器组成逆量化器。然后根据语音差值与前次预测值一起重建当前语音信号即PCM码值。整个ADPCM解码过程都是在控制逻辑状态机控制下进行的,量化阶距的计算、逆量化运算和PCM码的重构, 都是由多个运算模块以并行方式来计算的。

2.2 PWM合成输出语音的设计

在该系统中,调制信号不是模拟的语音信号,而是相应的数字合成语音样点值,为二进制数。根据PWM的原理可以得到实现数字PWM的系统框图,如图5所示。由于语音信号的采样频率是8 kHz,为了使输出信号占空比为256级的变化,采用8位计数器来实现0到256的计数,让输出信号为‘1’的时间维持相应数据大小的长度。而数据的读入是在系统调制时钟(2 MHz)的下降沿来临时开始动作,且循环计数器循环一个周期后,向寄存器发出一个使能信号EN,寄存器送入下一组数据。因为此时正是前一个PWM完成,而下一个调制周期还没开始的时隙,只有在这个时隙开始读入数据才能不影响PWM。最后是将读入的数据和当前8位计数器的计数值进行比较,当计数值小于当前读入的数据值时,输出高电平‘1’,否则输出低电平‘0’,这样让输出信号的占空比随着输入PCM数据的大小而发生变化,从而实现语音输出功能。

3 系统仿真分析

利用Verilog硬件描述语言对系统进行行为级描述后,使用Quartus II进行编译综合及仿真,当系统功能仿真通过后,再进行时序仿真。图6所示为系统整体仿真图,clk为解码器时钟信号,adpcm为解码器输入的4 bit ADPCM编码信号, rst为系统复位信号,clk1为PWM合成语音输出器的时钟信号,pwm为脉宽调制输出信号。从时序仿真图中看输入第一帧为0101(十进制为+5),最初的PCM预测值为0,最初的量化阶距为11,算法得出的PCM值应为13,以二进制表示为00001101,与仿真所示的结果一致。从时序仿真可以看出,脉宽调制输出信号pwm的周期是固定的,只变化pwm的脉冲宽度,pwm脉冲宽度的调节是由解码输出的PCM码值决定的。

在仿真验证正确后,将设计下载到FPGA中进行实时测试,也就是系统验证。本设计的验证主要由PC机通过串口发送ADPCM码给FPGA完成语音解码合成输出,然后由FPGA将语音解码合成输出的脉宽调制信号直接驱动喇叭。通过系统验证,结果表明,可在喇叭端得到所需的音效,通过比较所输入的语音资料和该系统所实现的语音解码合成输出的音效,发现两者基本上没有区别,音质失真度较小,系统运行可靠。

4 结束语

利用Verilog硬件描述语言设计并仿真了ADPCM解码合成输出系统,以完成语音的解码合成输出功能,并用FPGA进行了系统验证。结果表明,ADPCM解码合成输出效果达到了预期目标,系统输出的语音音质较好,失真度小。系统输出的PWM波可以直接驱动喇叭,该系统可以应用在很多电子消费品上。

参考文献

[1]吴家安.语音编码技术及应用[M].北京:机械工业出版社,2005.

[2]王金明.数字系统设计与Verilog HDL[M].北京:电子工业出版社,2005.

[3]ITU-T Recommendation G.711-1989,Pulse code mod-ulation of voice Frequencies.Geneva[S].

[4]陈明义,刘华,刘力.基于FPGA的ADPCM语音编解码器设计实现[J].电子科技,2007,(1):44-47.

[5]余志才,邵志标.PWM方式输出合成语音[J].半导体技术,2001,26(12):37-39.

利用编解码芯片的无线收发电路篇4

无线传输按基带信号的形式可以分模拟信号传输和数字信号传输。模拟信号便于传送, 但它对于干扰信号非常敏感, 容易使传送中的信号的幅值或相位发生畸变, 这样还要对接收到的模拟信号进行零漂修正、数字滤波等处理。数字信号对传输过程中的不完善性 (畸变, 噪声) 不敏感, 所以其抗干扰性强。本文介绍一种利用编解码芯片的无线收发电路中数字信号传输方式。

1电路组成

收发系统由发射单元和接收单元2部分组成。工作原理是:单片机将4位并行数据输出至编码器PT2262, PT2262对4位并行数据进行编码, 转换成串行信号送入发射模块F05C, 通过天线发射出去;接收模块将收到的信号进行解调, 然后送入解码器PT2272解码, 解码出4位并行数据, 经单片机处理后显示, 如图1所示。

2编解码电路

PT2262/2272是一种CMOS工艺制造的低功耗低价位通用编解码电路芯片。PT2262编码器的编码波形如图2所示。

从图2可看出, PT2262编码器对每位地址码和数据码的编码都用宽度不同的脉冲来表示, 2个窄脉冲表示地址和数据码的“0”;2个宽脉冲表示地址和数据码的“1”;1个窄脉冲和1个宽脉冲表示地址码的“f”, 也就是“悬空”。可以看出, PT2262编码的每位地址/数据码的长度为32a (a为2倍的时钟周期) 。

PT2262编码器的8位地址码和4位数据码组成一个码字, 称为一帧, 高8位为地址, 低8位为数据, 发送时以先发高位、后发低位的顺序逐次发送这12位码。所以一组码字的长度为12×32a=384a。PT2262传输一帧信息的格式如图3所示。一帧的开始8位 (第0位到第7位) 为地址, 一帧的后4位为数据。

发送数据时每帧数据中间都由同步码隔开, 同步码的长度为4倍地址/数据码位宽的长度, 其中含一个1/8地址/数据码位宽度的脉冲, 如图4所示。

由图4可看出, PT2262的一个码字周期为384a+128a=512a。因此用单片机软件解码时, 程序只要判断出同步码, 然后对后面的字码进行脉冲宽度识别即可。

PT2262编码的时序如图5所示。

从图5可以看出, 在PT2262编码器的TE端强加一个低电平逻辑, 触发RC振荡器振荡, 地址和输入数据一起被编码, 并通过数据输出引脚DATA OUT串行输出编码后的数据。为保证传输成功, PT2262的一帧数据连续发送4次。当给TE一个持续的低电平时, PT2262就连续发送数据, 每一帧发送4次, 则码周期为2 048a, 本系统中约为30 ms。

解码器PT2272的地址码必须与编码器PT2262的地址码完全相同, 才能对接收到的数据进行解码并输出。PT2262每次发射时至少发射4组字码, PT2272只有在连续2次检测到相同的地址码加数据码时才会把数据码中的“1”驱动相应的数据输出端为高电平和驱动VT端同步为高电平。

在具体的应用中, 外接振荡电阻可根据需要进行适当的调节, 阻值越大, 振荡频率越慢, 编码的宽度越大, 发码一帧的时间就越长。

当PT2262和PT2272配套使用时, 解码器的时钟振荡频率必须是编码器时钟振荡频率的2.5倍～8倍。在本系统中, 为了保持编解码器振荡频率的配套, PT2262编码器的工作电压选择12 V, 振荡电阻选择3.3 MΩ, PT2272解码器的工作电压选择5 V, 振荡电阻选择680 kΩ。

编码电路和单片机的连接如图6 所示。

可以看出, 编码电路PT2262的4位数据端 (D0～D3) 连接到89C51单片机的P0口的低4位, PT2262的发送控制端TE连接到51单片机的P2.0口, 由P2.0口控制。发送过程是:单片机先将4位数据送到P0口的低4位, 由于单片机的P0口有输出锁存的功能, 这个数据将一直保持到下一个数据的到来, 然后给P2.0送入“0”, 使得PT2262的发送控制端TE为低电平, 这时PT2262开始对数据进行编码, 并将编码后的串行数据发送到发射模块。

解码电路和单片机的连接如图7所示。

PT2272和单片机的数据传输采用中断方式进行。由于PT2272的VT引脚 (解码有效确认输出端) 在没有正确接收到数据时处于低电平, 当解码有效时会产生一个宽度为2个码字的高脉冲, 所以可以利用VT引脚产生的脉冲信号作为51单片机的外部中断INT1的中断申请信号。51单片机的外部中断INT1应设置为下降沿触发方式, 所以VT引脚的信号在送INT1前要加一个反相器。

3无线发射和接收电路

目前市场上的无线收发模块种类很多, 我们选择发射模块F05C、接收模块J04E。F05C将基带信号经高频载波电路调制后, 通过天线向空间辐射;J04E接收同频信号后, 进行解调、放大和整形, 恢复出基带信号, 由输出端输出, 发射和接收频率均为315 MHz。

F05C发射模块采用声表谐振器稳频, SMT树脂封装, 频率一致性较好, 免调试, 特别适合多发一收无线遥控及数据传输系统。F05C具有较宽的工作电压范围及低功耗特性, 当发射电压为3 V时, 发射电流约2 mA, 发射功率较小, 12 V为最佳工作电压, 具有较好的发射效果, 发射电流约5 mA～8 mA, 大于12 V直流功耗增大, 有效发射功率不再明显提高。F05C采用AM (幅度调制) 以降低功耗, 数据信号停止, 发射电流降为0, 数据信号与F05C用电阻耦合。数据电平应接近F05C的实际工作电压, 以获得较高的调制效果, F05C对过宽的调制信号易引起调制效率下降, 收发距离变近。当高电平脉冲宽度在0.08 ms～1 ms时发射效果较好, 大于1 ms后效率开始下降;当低电平区大于10 ms, 接收到的数据第1位极易被干扰 (即零电平干扰) 而引起不解码。

F05C 应垂直安装在印制电路板边部, 应离开周围器件5 mm以上, 以免受分布参数影响而停振。F05C发射距离与调制信号频率幅度、发射电压及电池容量、发射天线、接收机灵敏度及收发环境有关。F05C用PT2262编码器加240 mm小拉杆天线, 在开阔区最大发射距离约250 m, 在障碍区相对要近, 由于折射反射会形成一些死区及不稳定区域, 不同的收发环境会有不同的收发距离。

图8为F05C的典型应用电路。编码器采用PT2262, 振荡电阻取3.3 MΩ效果较好, 引脚17无信号输出时, F05C不工作。发射电流为0;当引脚14为低电平时, 引脚17输出已设定的编码脉冲对F05进行调制发射, 通过测试, F05C工作电流可大致判断F05C是否处于正常发射状态, 空码时, 加天线时发射电流约6 mA。

编码芯片PT2262发出的编码信号由地址码、数据码、同步码组成一个完整的码字。当TE端为高电平时, PT2262不工作, 引脚17为低电平, 315 MHz的高频发射电路不工作;当TE端为低电平时, PT2262开始工作, 引脚17输出经编码调制的串行数据信号, 如果TE端一直保持低电平, 编码芯片会连续编码。当引脚17为高电平期间, 315 MHz的高频发射电路F05C起振并发射等幅高频信号;当引脚17为低电平期间, 315 MHz的高频发射电路停止振荡, 所以高频发射电路完全受控于PT2262引脚17输出的数字信号, 从而对高频电路完成ASK (幅移键控) 调制, 相当于调制度为100%的调幅。解码芯片PT2272接收到信号后, 其地址码经过2次比较核对后, VT端才输出高电平。同时, 相应的数据脚也输出高电平。高频调制后的波形如图9所示。

接收模块J04E具有以下特点:采用独特的超再生电路结构, SMT工艺树脂封装, 内含放大整形, 输出数据信号直接至解码器, 是一种性价比较高的超再生模块;无信号时输出为0电平状态 (无噪声干扰) , 可适合与单片机输入端接口;采用条状镀金电感及优化电路, 无需外接天线, 接收灵敏度较好, 采用一定硬度的镀金电感调整接收频点比采用微调电容调频率的接收电路性能稳定, 即使强烈振动也不用担心频点偏离;具有较宽的接收带宽, 出厂时已调在315 MHz, 与F05C配套基本免调试, 只要电源馈电及引线没有太大的分布参数即可处于正常接收状态;具有极低功耗, 工作电压比较低 (2.6 V～4.5 V) , 最佳工作电压为3.5 V, 3 V时只消耗0.2 mA电流, 可长期处于守机状态。

无线接收电路如图10所示。J04E采用 3.5 V供电, 以确保最佳接收灵敏度及输出电平与解码器电平接口。J04E输出可直接与PT2272接口, 再采用单片机译码。

J04E接通电源用示波器在引脚3应能看到一条约50 mV (最大杂波100 mV) 的噪声带, 噪声带应在直流1.5 V即VDD/2处, J04E即处于正常接收状态。接通发射电源, 收发离开2 m, 能看到码信号, 幅度与距离及发射功率有关, 信号幅度只要大于200 mV, 引脚3即可输出整形后的码脉冲, PT2272应解码输出高电平。

解码正常后, 收发离开几十米, 用示波器观察J04E引脚3的信号, 调整J04E顶部条状镀金电感 (与印制电路板间距) 即可调整接收频率, 使信号最大, 即可获得最大收发距离 (注意调整量不宜大于1 mm) 。

4结束语

本文介绍了系统的硬件设计, 和发射、接收电路的实现, 并对可能产生的各种问题进行了验证, 可以利用编解码的一一对应特点更好地处理多点测量中区分不同探点的问题。

本系统成本低, 结构简单, 传输可靠, 应用范围广, 配合相应的传感器, 可以完成无线传输的数据采集系统。实际调试表明, 性能已达到设计要求, 传输距离达到几十米。

参考文献

[1]汪道辉.单片机系统设计与实践[M].北京:电子工业出版社, 2006.

[2]董晓红.单片机原理及接口技术[M].西安:西安电子科技大学出版社, 2004.

[3]王秉钧, 等.现代通信系统原理[M].天津:天津大学出版社, 1999.

[4]王建民.无线局域网技术应用与发展[M].计算机与通信, 1998 (4) :13-16.

[5]郁有文, 等.传感器原理及工程应用[M].西安:西安电子科技大学出版社, 2003.

遥控编解码电路的新应用篇5

关键词：无线通信,编解码电路,数据量拓展

0 引言

遥控编解码集成电路和无线发送、接收模块的技术已经很成熟,在汽车防盗、电控门窗,烟火探测报警,起吊设备,工业控制等领域,以其安全可靠、电路简单、体积小、价格低廉的优势,得到了广泛应用。目前,这项技术的应用已经很成熟,元器件也容易买得到。在一项科研中,究竟选择哪种通信技术,课题组成员拓宽思路,利用遥控编解码电路这套成熟的技术,在无线数据传输中寻求到了新的应用。

在研发采暖测控项目时,为解决数据采集点分散和资金的问题,联想到了无线编解码技术的应用现状,尤其是采用模块化带来的优点,现实中容易买得到等长处,尝试用遥控编解码电路,配合无线收发模块,完成数据通信。经研究试验,在克服了多点通信,并且是同频率通信的技术问题后,成功地实现了无线数据通信,实现了成本低廉、通信稳定可靠的效果。此项目的应用环境是在校园区域内,监测点对多个被监测点进行数据采集,采集的数据最终传输到一个地方,数据经主机统一处理后,再发出控制指令,来完成特定的控制指令和显示信号。这项工作如果采用有线通信,布设线缆工作量很大,且成本较高。综合环境因素和成本因素,采用无线编解码通信方式,满足了使用要求,效果令人满意。经过试验和用仪器测量,对比结果发现HT-12E/D编解码集成电路和315MHz无线发送、接收模块,构成的无线通信系统比较稳定,可靠程度较高,满足使用要求。

1 编解码集成电路

1.1 关于编解码电路

HT-12E/D是内部固化了程序的独立系统,它与常见的MC145026/27/28、PT2262/72、SC2262/72等属于同一类产品,管脚排列也完全一致,所不同的是所发出的串行信号的表达方式有所不同。振荡电阻决定着振荡频率,编码电路和解码电路自身的工作频率是不相同的。编码电路的工作频率远高于解码电路的工作频率。在使用中,编码电路和解码电路要使用同一个生产厂家的产品,并且配对使用。

HT-12E/D的振荡电路采用外接电阻,从而简化了电路的结构。解码电路的振荡频率比编码电路的振荡频率大50倍左右,即foscD≈foscE,从而弥补由于频率偏移带来的误差。振荡电阻的也遵循50倍的倍率选择,即RE≈50RD。

HT-12E/D的共性参数为:

工作电压:2.4～12V

静态电流:0.1μA(VDD=5V时)

1.1.1 编码集成电路

HT-12E是编码电路, DIP18脚封装形式,8条地址线,4条数据线。如图1中左图所示。

HT-12E的8个地址位A1～A8和4个数据位D1～D4之间是相互独立的,互不影响。编码组数212组,在编码过程中,它将A1～A8,D1～D4依次排列,转换成串行数据的方式输出,加上起始位与结束位,共14位。

TE发送允许端,低电平有效。DA串行数据输出端,平时呈低电平,当TE端呈低电平时,DA端连续发出帧数据串。Rosc端为振荡器外接电阻端,为使电路简单和降低成本,没有使用稳频性能较好的晶体振荡器,利用多次分频弥补频率稳定度差的不足,将12个振荡周期经分频作为一个机器周期。2个连续机器周期的“0”代表逻辑“1”,1个机器周期的“0”加1个机器周期的“1”表示逻辑“0”。编码的帧结构是起始位,地址位,数据位,停止位。

1.1.2 解码集成电路

与HT-12E配套的解码电路有HT-12D,也是DIP18脚封装形式,8位地址,4位数据,解码组数28组,如图1中右图所示。解码过程则是编码的逆过程。解码过程中,地址码相同的串行数据,在相对应的数据输出端还原成相同的并行数据。

“IN”为数据输入端,待要解码的串行数据从此端引入。“VT”为数据解码有效指示端,当编解码的地址端完全一致时,译码电路只有收到连续相同的3帧,才认为正确有效,输出高电平,作为驱动其他电路或指示灯的信号,解码过程才完成一个检测循环。解码过程是连续不间断进行的。解码电路的振荡频率比编码电路高很多,编码电路发出的一帧数据,解码电路用高于它几倍的速率查询,作为还原帧结构的依据。

在实际使用过程中发现,与其它公司生产的编解码集成电路相比较,HT-12系列电路在稳定性方面要胜出一筹。但目前在市场上仅见到4个数据位(M4)的编解码集成芯片,而其它生产厂家相同类型的芯片,已经开发出6个数据位(M6)的产品。

1.2 实际应用

HT-12E编码电路只有4个数据端,在使用中满足不了需要。为了增加数据传输的位数,应用中采取了3片编码电路轮流工作,以此来增加其传输量。3片编码电路的输出分别送入3个输出端接在一起的电子开关,3片编码器输出的3个数据流,汇聚在电子开关处,由电子开关控制其轮流导通,由此发送出一个混合的长数据流。数据流送入发射电路进行无线发射。图2所示为水位采集传输原理图。

图2中,左面的容器是检测水位的装置,信号由水位传感器输出。传感器按相同的梯度设置,当水位逐渐上升,相应的电极由低电平跳变为高电平,表明水位已经达到了对应的高度。这样密闭容器内的水位信号就完成了向电信号的转换过程。

图2中,水位信号有7位,用2个编码器的数据端才能完成传送任务。由于使用了3片编码器,这样就使数据位增加到12个,可携带的信息量就更多。要增加信息量,还有一个有效的方法,使用CD4532 8线-4线编码器,把代表7层水位的信息编成8421码,编码后使用3条数据线就能够表征7层水位信号。节省了4条数据线。这里没有使用8421编码,是为了使电路简单,容易理解。

由于发射通道只有一个,3片HT-12E编码器的输出信号,要轮流送入发射通道。3路信号整合成1路信号的工作,由3个通道开关完成。控制电子开关轮流导通的是由CD4022组成的脉冲分配器。由多谐振荡器输出的方波,经多级分频,Q0～Q3依次输出高电平,触发电子开关轮流导通,完成了3进1出的整合过程。

图2给出了简化的原理图。IC1构成自激多谐振荡器,振荡信号经IC2进行分频,控制通道开关轮流导通。实现3片编码器的输出整合成一路。每一通道的开关时间要保证控制在使HT-12E输出4.5～5帧的频率范围之间为宜。少于这个范围,解码电路不能完成一个检测循环,大于这个范围太多,则使传输效率下降。要调整多谐振荡的频率,需要改变6R1的数值。

2 无线发射/接收模块电路

发射和接收模块电路起到传输数据的作用,市场上常见到的遥控发射和接收模块牌号很多,以超再生型和超外差工作方式较常见。本文使用了9012发射模块和9021接收模块,超再生型,实际通信距离200米左右。

2.1 发射电路

9012发射电路调制方式为幅度调制(ASK),工作频率为315MHz,采用声表面波谐振器SAW稳频,频率稳定度极高,当环境温度在-25～+85度之间变化时,频飘仅为3ppm/度,具有较好的频率稳定性。

9012的工作参数为:

工作电压:12V

工作电流:≤5mA

工作频率:315MHz

调制方式:ASK

天线长度:12cm

发射电路具有休眠功能,当输入端没有数据输入时,为低电平状态,发射电路处于休眠状态,达到降低功耗的目的。当有数据输入时,模块停止休眠,处于发射状态,高频电路完成幅度调制,相当于调制度为100%的调幅。数据电平应接近数据模块的实际工作电压,以获得较高的调制效果。

无线发射使用的是一个频率的通道,在有效的范围内,如果多个发射器同时工作,就会造成电磁波的同频叠加,解调出的数据流就会出现紊乱,无法还原出真正的编码。因此,在有效范围内,同一时刻,只能有一个发射器工作。所谓“干扰器”,就是一个发射器长时间工作,另一个发射器在按下锁车开关时,接收器不能正确解码,完不成锁车的指令。

发射电路生产厂家不同,型号也不一致,大同小异。也可以用汽车防盗遥控器或遥控电动门的遥控器,它们都属于同一类型的产品。这一类产品工作在业余频道。振荡频率以315MHz居多,433MHz使用的较少。由于其发射功率受到限制,发射的距离一般达不到其标称的数值。发射模块最好能垂直安装在主板的边缘,应离开周围器件5mm以上,以免受分布参数影晌。

2.2 接收电路

9021接收模块将电磁波经带通滤波器、再生放大、解调、整形等一系列的过程,还原出与发射电路输入端一致的数据信号。

9021的工作参数为:

工作电压:5V

静态电流:≤0.3mA

解调方式:ASK

接收灵敏度:-103dBm

天线长度:12cm

这种电路的优点在于:

(1)天线输入端有选频电路,而不依赖1/4波长天线的选频作用,控制距离较近时可以剪短甚至去掉外接天线

(2)输出端的波形在没有信号比较干净,干扰信号为短暂的针状脉冲,而不象其它超再生接收电路会产生密集的噪声波形,所以抗干扰能力较强。

(3)模块自身辐射极小,加上电路模块背面网状接地铜箔的屏蔽作用,可以减少自身振荡的泄漏和外界干扰信号的侵入。

(4)采用带骨架的铜芯电感将频率调整到315MHz后封固,这与采用可调电容调整接收频率的电路相比,温度、湿度稳定性及抗机械振动性能都有极大改善。

图3是数据接收解码电路。在接收模块的输出端,依然是和编码电路电子开关输出端一致的3组数据串。

解码集成电路与编码的一致,也使用3片,3片解码集成电路的输入端连在一起,共同接受无线接收模块送来的信号。每一片的地址编码不相同,必须与编码集成电路的地址码各自对应一致。如果把地址码相同的编解码芯片作为一对的话,那么此系统即为3组数据占用一个信道,数据则是分时传送。其特点是占用信道资源少,缺点是传输速率慢。

2.3 数据的还原

无线接收模块将解调出来的数据串送给解码电路,3片解码电路同时解码,但在某一时刻,只有一对编解码电路的地址码是相同的,因此3片电路是轮流还原出正确的数据。验证是否正确解码,观察图中的VD1～VD3是否闪亮,因为闪亮表示此片电路解码成功。

无线传输的过程,相当于将并行数据转换成串行数据,通过无线电波传送出去,到达目的地后,再将数据还原成并行数据的方式。它所传送的信号,就在每一片电路的D1～D4端还原出来。

3 调试注意事项

调试过程可以验证电路各个部分的工作状况,要分部分进行调试。

3.1 编码电路的地址设置和解码电路的地址应该一致

3.2 进行无线通信之前,先进行有线通信

将编码电路的输出端17脚,与接收电路的输入端用导线连接起来,查看解码电路的指示灯有否闪烁。如果闪烁说明说明编解码电路工作正常;如果不闪,要检查编解码电路是否工作。有条件的话,用示波器查看编码电路的输出端有否方波输出。

3.3 上面一步正常,接下来可以验证通道开关

将导线接通道开关的输出端,看解码电路的指示灯是否闪烁。

3.4 上一步调试正常后,可以试验无线收发模块的工作状况

用电池给接收电路供电,在靠近发射电路的地方向安放接收电路的地点行走,边走边观察接收指示灯的闪烁情况。指示灯闪烁,说明接收无线电波的场强满足要求;如果指示灯时而闪烁时而不闪,说明场强已经达到最低临界值。

参考文献

[1]蔡凡弟.多路无线遥控电路[M].无线电杂志.北京:人民邮电出版社,2001.

[2]李全利.单片机原理及应用技术[M].北京:高等教育出版社,2008.

面向视频监控的视频编解码技术篇6

目前,国内外的模拟监控系统逐渐被数字监控系统取代。视频监控数字化后,网络化监控技术得到了大规模的应用,初级的智能视频监控很快也得到初步的应用。在这一背景下,国内外可以用于安防监控的视频处理技术的研究主要集中在高效压缩编码、网络适应性、智能分析这3个方面。如图1所示,这3个方面的研究重点不同,但又互相联系、互相制约和促进。高效压缩编码技术的研究起源最早,网络适应性技术在其研究成果上发展而来,而智能分析技术是将计算机视觉技术和编解码技术相结合产生的。反过来,网络适应性技术和智能分析技术的需求或成果又为高效压缩编码提供了新的思路,极大的促进了高效压缩编码的发展。

2 现存问题及发展趋势

目前,视频监控已经成为了一门蓬勃发展的学科,因此应该致力于开发各种技术和设计不同的系统来满足各种特殊环境的视频处理需求。

自从911事件以后,西方各国更加注重国内的安全防范,加速了视频监控技术的研究,促进了视频监控市场的飞速增长。但是,由于网络视频处理技术和智能视频分析技术尚未完全发展成熟,所以目前普遍应用于视频监控系统中的视频处理技术主要是视频数据的压缩、传输和存储,只有少数的监控系统具有初步的智能分析功能。在这样的系统中,视频数据到达终端以后还是需要人为实时观测分析,尤其是比较复杂的场景和活动。另外,视频在网络上的质量保证和安全性方面的研究也尚在进行中。因此,目前的视频监控系统中还存在着响应时间长、联动性能差、数据分析困难、误报和漏报等方面的问题。总的来说,视频编解码技术仍然是视频监控系统的核心和基础部分,无论是在现阶段,还是在网络化、智能化的阶段。因此,在视频编解码技术领域,对编码算法或者框架进行调整,以实现对网络传输、图像理解等安防的特殊需求进行必要的支持,这方面的研究是整个安防领域的视频技术研究的关键问题,具有非常重要的研究意义。

综上所述,制定面向安防监控领域的视频编解码技术,规范安防视频监控核心技术、推动安防监控产业的健康可持续性发展将具有非常重要的现实意义和历史意义。

3 AVS-S规范视频监控编码技术

AVS-S是完全针对安防视频监控的需求而设计的。视频监控系统经历了模拟信号监控系统、数模结合方式的视频监控系统、全数字化的远程联网视频监控系统3个发展阶段。目前,全数字化的网络化视频监控系统开始得到广泛应用。视频从前端图像采集设备输出时即为数字信号,并以网络为传输媒介,基于TCP/IP协议,采用流媒体技术实现视频在网上的多路复用传输,并通过设在网上的网络虚拟(数字)矩阵控制主机来实现对整个监控系统的指挥、调度、存储、授权控制等功能。如目前中国公安部正式启动的城市联网报警与监控系统建设“平安城市”工程,将在全国范围内的省、市、县3级开展报警与监控系统建设试点工程。公交、电力、银行、水利等行业监控的联网需求中,也都是采用了以视频网络传输,集中存储为中心的视频监控联网系统框架。

3.1 编码技术框架

图2所示为AVS-S视频编解码框架,与以往视频编解码技术相比,其主要技术特色为:多码流实现、基于区域编码、全天候信号编码和篡改感知能力。编码框架的选择必须以满足以上应用需求为目标,尽量同时兼顾技术优势和经济优势。

为了适应安防监控的特殊需求,国家多媒体软件工程技术研究中心研究了一种视频编解码体系结构。其所要解决的主要技术问题包括一种视频序列编解码体系结构的提出,与传统编码方式的兼容问题的解决,异构网络的传输问题,如何保证感兴趣区域图像质量的问题,如何适应不同光照条件和天气状况下的图像编码问题,以及编码信息的安全性问题。

该视频编解码体系结构包括基本层编码模块、编码控制模块、增强层编码模块3部分。其中,基本层编码模块的图像通过上采样作为增强层参考帧或层间预测削除基本层与增强层之间的信息冗余;编码控制模块根据感兴趣区域策略控制基本层与增强层中感兴趣区域的编码方式,通过光线模式判断控制基本层和增强层中支持全天候编码模块;增强层编码模块采用分层技术在以上各编码模块的基础上实现对增强层输入视频流的编码。

该视频编解码体系结构既能实现基本层对现有视频编码标准的兼容,又可以满足安防监控应用对视频编码的特殊要求。

3.2 核心技术

3.2.1 基于区域的变质量视频编码算法

在视频监控应用中,重点监控区域的图像细节对于调查取证至关重要。然而传统的编码方法对整体图像进行无差异性的编码,造成了存储空间和传输带宽的浪费。针对这一特殊需求,国家多媒体软件工程技术研究中心研究了基于区域的变质量视频编码算法,采用了使不同权重区域具有不同的质量的分级量化机制,防止了量化系数剧烈跳变的过渡带机制,并使用了提升感兴趣区域率失真斜率的“棋盘格式”算法。

“棋盘格式”算法在传输带宽或者存储容量一定的情况下,优先保证感兴趣区域(RoI)的编码质量,同等码率下,感兴趣区域的主客观质量都得到大幅提升,并且通过过渡带和感兴趣区域内部的优先级设定,使得感兴趣区域和背景区域之间的质量控制更加精细。具体的技术方案如图3所示。将编码图像分为背景区域、感兴趣区域和过渡带区域3个部分,可分别采用不同的量化机制,并且背景区域和RoI的量化值是由用户手动设置的,其余区域可以通过该算法的量化参数计算得到。在RoI采用类似国际象棋棋盘的区域分块方法,使区域中每个小块的量化参数与相邻的纵向和横向的小块不同,但与斜方向上的小块相同。

实验结果如图4所示,图4a为原始的编码结果,图4b为集成了基于区域的变质量视频编码算法后的编码结果。感兴趣区域图像细节质量的优劣显而易见。

该算法主要具有以下优点:1)在传输带宽和存储空间有限的情况下,可优先保证RoI的图像质量;2)算法复杂度不大,没有增加任何高复杂度的编码模块,复杂度与传统编码方式相当。

3.2.2 基于区域的变解析度视频编码算法

在某些安防应用情况下,特定监控对象需要具备不同的采样清晰度,然而现有的编解码方法无法基于区域提供不同的采样清晰度。AVS-S设计了基于区域的变解析度视频编码算法,其技术方案是:从基本层载入感兴趣区域信息,并根据感兴趣区域信息对增强层的原始输入图像进行剪切,对剪切后得到的感兴趣区域编码。针对安防监控的特殊需求,本算法从增强层提取感兴趣区域进行编码,而忽略其他非关键区域的图像,从而减小空域增强层码率,保证空域增强层感兴趣区域视频信息的质量。

实验结果如图5所示,图5a采用的是一般方法的A VS P2编码效果,图5b采用了融合了基于区域的变解析度视频编码算法后改进的方法。对比这两幅图像,当两者所使用的比特率基本相当时,图5b的人脸区域明显具备更加清晰的采样解析度,能提供更多的细节信息,从而提高RoI部分的质量。

上述两种算法与一般视频编码器相比,在充分节省带宽的条件下,能提供更高的局部质量清晰度,充分满足安防调查取证以及智能分析的需求。

3.2.3 超分辨力后处理算法

随着视频应用需求的发展,视频分辨力增强逐渐被人们关注。相对于前两种针对重点监控区域的编码技术,超分辨力技术可以突破采样获取的图像分辨力限制,是一种视频后处理技术,可以得到更高的分辨力。因此,可以将重点监控区域进行编码方法质量和分辨力变化之后,再使用超分辨力技术进行增强。

AVS-S研究了一种超分辨力算法,解决了图像模糊等系列问题。该算法的基本原理是使用信号处理技术从多幅低分辨力图像来获得一幅高分辨力图像或者高分辨力图像序列,这样的分辨力增强方法被称为超分辨力图像重建。超分辨力技术的目标就是要从多幅退化的、混叠的低分辨力图像中复原一幅高分辨力的图像。

实验结果如图6所示,利用相邻两帧辅助修正,得到一个较高分辨力的图像。图6a为低分辨力帧,图6b为分辨力增强后的效果。可以看到,图6b比图6a更清晰且包含更多细节信息。

3.2.4 实现帧率可调算法

对于传输带宽减少时的情况,AVS-S进行了对时域分级编码算法的研究,通过调整帧率来适应传输网络状况。可分级算法能提供灵活的分辨力、帧率和质量的码流结构,能更好地满足大型视频监控系统的要求。图7所示为该算法利用层次B帧的编码示意图。

本算法所要解决的技术问题是针对安防领域的特殊需求,制定一种针对双帧参考视频流的快速时域可伸缩编码实现方法。该方法能够与非可伸缩视频编码标准相兼容,并且能够明显提高编码效率。

该算法的技术方案是:基本层采用I帧或P帧图像编码类型,增强层采用的是B帧图像编码类型,通过对图像组中的各编码帧进行时域层次标注,并且在编码B帧过程中根据时域层次级别来搜索获取当前编码B帧的两个参考帧,参考帧可以是I帧或P帧,也可以是B帧,这样就使码流帧率按照2的整数次幂的倍数伸缩。实现结果如图8所示。

该算法提供的是一种快速实现双帧参考视频流的时域可伸缩编码的方法。该双帧参考视频流是基于B帧的双帧参考视频编码标准,利用这种方法编解码后生成的码流具有时域可分级性,其帧率能够适时调整,与一般丢弃B帧的做法相比,具备更好的编码性能。

3.2.5 面向全天候环境的优化编码技术

夜间视频图像和普通监控图像相比噪点很多,压缩后的码率非常大,需要采用不同于普通的编码模式。AVS-S可根据光线环境,自适应地调节编码模式。其特殊的夜间编码模式,可大大提高编码压缩效率、节约带宽和存储空间。

图9是夜间的监控图像,图9a是采用普通编码技术后的解码图像,图9b是AVS-S的解码图像。两幅图像主观质量相近,而图9b即AVS-S的夜间模式技术可以节省40%以上的带宽,同时也可以节省40%以上的存储空间。

4 总结和展望

综上所述,面向安防的视频编码技术AVS-S克服了针对媒体市场开发的视频压缩标准的不足,完全构架于IP网络之上,彻底摆脱了传统视频监控系统,视频流可以在整个系统范围内自由地被调度、使用和管理,具备了前所未有的灵活性。面向安防的视频编码技术不但知识产权清晰、许可价格合理,还具备和AVS完全兼容的特点,有利于我国安防视频监控相关产业的健康、持续发展。

摘要：通过分析安防系统中视频编码的特殊需求，深入介绍了面向安防的音视频标准AVS-S的核心技术，希望有助于安防自身视频编码技术的进一步发展。

H.264视频编解码标准及其应用篇7

H.264是一种高性能的视频编解码技术, 是由ITU-T和ISO/IEC联合开发的, 定位于覆盖整个视频应用领域, 包括:低码率的无线应用、标准清晰度和高清晰度的电视广播应用、Internet上的视频流应用, 传输高清晰度的DVD视频以及应用于数码相机的高质量视频应用等等。

相对先前的标准, H.264/AVC无论在压缩效率、还是在网络适应性方面都有明显的提高, 因此, 业界普遍预测其将在未来的视频应用中替代现有的视频压缩标准。从标准制定到颁布, H.264 一直是ITU、MPEG、DVD、DVB、3GPP 等工业化组织共同推进的视频编码国际标准, 可以想见, 在众多行业巨擘的推动下, H.264 技术的应用将迅速进入到视频服务、媒体制作发行、固定及移动运营网络、平台开发、设备终端制造、芯片开发等多个领域。

H.264标准可分为三类:

(1) 基本类 (简单版本, 应用面广) ;

(2) 主类 (采用了多项提高图像质量和增加压缩比的技术措施, 可用于SDTV、HDTV和DVD等) ;

(3) 扩展类 (可用于各种网络的视频流传输) 。

1H.264标准的技术特色

H.264最大的优势是具有很高的数据压缩比率, 在同等图像质量的条件下, H.264的压缩比是MPEG-2的2倍以上, 是MPEG-4的1.5~2倍。举个例子, 原始文件的大小如果为88GB, 采用MPEG-2压缩标准压缩后变成3.5GB, 压缩比为25∶1, 而采用H.264压缩标准压缩后变为879MB, 从88GB到879MB, H.264的压缩比达到惊人的102∶1。之所以H.264有那么高的压缩比, 低码率 (Low Bit Rate) 起了重要的作用, 与MPEG-2和MPEG-4 ASP等压缩技术相比, H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是, H.264在具有高压缩比的同时还拥有高质量流畅的图像。

(1) 更高的编码效率:

同H.263等标准的特率效率相比, 能够平均节省大于50%的码率。

(2) 高质量的视频画面:

H.264能够在低码率情况下提供高质量的视频图像, 在较低带宽上提供高质量的图像传输是H.264的应用亮点。

(3) 提高网络适应能力:

H.264可以工作在实时通信应用 (如视频会议) 低延时模式下, 也可以工作在没有延时的视频存储或视频流服务器中。

(4) 采用混合编码结构:

同H.263相同, H.264也使用采用DCT变换编码加DPCM的差分编码的混合编码结构, 还增加了如多模式运动估计、帧内预测、多帧预测、基于内容的变长编码、4×4二维整数变换等新的编码方式, 提高了编码效率。

(5) H.264的编码选项较少:

在H.263中编码时往往需要设置相当多选项, 增加了编码的难度, 而H.264做到了力求简洁的“回归基本”, 降低了编码时复杂度。

(6) H.264可以应用在不同场合:

H.264可以根据不同的环境使用不同的传输和播放速率, 并且提供了丰富的错误处理工具, 可以很好地控制或消除丢包和误码。

(7) 错误恢复功能:

H.264提供了解决网络传输包丢失问题的工具, 适用在高误码率传输的无线网络中传输视频数据。

(8) 较高的复杂度:

H.264性能的改进是以增加复杂性为代价而获得的。据估计, H.264编码的计算复杂度大约相当于H.263的3倍, 解码复杂度大约相当于H.263的2倍。

H.264不仅比H.263和MPEG-4节约了50%的码率, 而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制, 有利于网络中的分组传输, 支持网络中视频的流媒体传输。H.264具有较强的抗误码特性, 可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输, 从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输, 网络亲和性好。

2H.264标准的关键技术

H.264是在MPEG-4技术的基础之上建立起来的, 其编解码流程主要包括5个部分:帧间预测和帧内预测 (Estimation) 、变换 (Transform) 和反变换、量化 (Quantization) 和反量化、环路滤波 (Loop Filter) 、熵编码 (Entropy Coding) 。

(1) 帧间预测:

帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿。H.264的运动补偿支持以往的视频编码标准中的大部分关键特性, 而且灵活地添加了更多的功能, 除了支持P帧、B帧外, H.264还支持一种新的流间传送帧——SP帧。码流中包含SP帧后, 能在有类似内容但有不同码率的码流之间快速切换, 同时支持随机接入和快速回放模式。

(2) 帧内预测:

帧内编码用来缩减图像的空间冗余。为了提高H.264帧内编码的效率, 在给定帧中充分利用相邻宏块的空间相关性, 相邻的宏块通常含有相似的属性。因此, 在对一给定宏块编码时, 首先可以根据周围的宏块预测 (典型的是根据左上角的宏块, 因为此宏块已经被编码处理) , 然后对预测值与实际值的差值进行编码, 这样, 相对直接对该帧编码而言, 可以大大减小码率。

(3) 变换与反变换:

H.264使用了基于4×4像素块的类似DCT的变换, 但使用的是以整数为基础的空间变换, 不存在反变换, 因为取舍而存在误差的问题。与浮点运算相比, 整数DCT变换会引起一些额外的误差, 但因为DCT变换后的量化也存在量化误差, 与之相比, 整数DCT变换引起的量化误差影响并不大。此外, 整数DCT变换还具有减少运算量和复杂度, 有利于向定点DSP移植的优点。

(4) 量化:

H.264中可选32种不同的量化步长, 这与H.263中有31个量化步长很相似, 但是在H.264中, 步长是以12.5%的复合率递进的, 而不是一个固定常数。在H.264中, 变换系数的读出方式也有两种, 之字形 (Zigzag) 扫描和双扫描。大多数情况下使用简单的之字形扫描;双扫描仅用于使用较小量化级的块内, 有助于提高编码效率。

(5) 熵编码:

视频编码处理的最后一步就是熵编码, 在H.264中采用了两种不同的熵编码方法, 通用可变长编码 (UVLC) 和基于文本的自适应二进制算术编码 (CABAC) 。不管符号表述什么类型的数据, 都使用统一变字长编码表, 其优点是简单; CABAC方法是在建立基本概率模型时通过内容建模, 提高算术编码的效率[1]。

3H.264标准的新发展

H.264标准发布之后, 为了将视频源从娱乐级视频源扩大到高分辨率视频源, 进一步提高编码效率及保真度, ISO/IEC与ITU-T组成的联合视频组 (JVT) 对H.264标准作出了改善。

(1) 进一步引入一些先进的编码工具, 提高了压缩效率, 其中大部分是在取样点比特深度和色度格式方面;而在提高编码效率方面, 主要是利用8×8的亮度帧内预测、4×4变换及8×8变换、量化矩阵等技术。

(2) 视频源的每个样值均可超过8b, 最高可达12b, 最初的标准仅支持源图像为每像素8b。

(3) 增加了4∶2∶2与4∶4∶4的采样格式, 最初的H.264标准支持的采样方式仅限于4∶2∶0。

(4) 更高的比特率, 更高的图像分辨率。

(5) 可达到图像高保真的要求, 支持无损压缩, 为满足视频信号高保真的要求, H.264/AVC引入了无损压缩编码方案。第一个是PCM方案, 它没有预测、变换和量化, 直接传送取样点的值以达到无损编码的目的;第二个是无变换的无损编码方案, 运用预测与熵编码技术来表示图像高效无损, 相对第一个方案提高了编码效率。

(6) 支持RGB格式的压缩, 同时避免了色度空间转换的舍入误差, RGB与YCbCr相互之间的颜色转换使用的都是浮点运算, 这必将引入舍入误差。为了消除在浮点运算中引入的舍入误差, H.264/AVC在支持RGB的同时引入了新的彩色空间YCgCo。

Y=1/2 (G+ (R+B) /2) , Cg=1/2 (G- (R+B) /2) , Co= (R-B) /2

上面的公式减小了色彩空间转换的复杂度;但是, 为了避免舍入误差, 要求增加额外的比特以保持精确性。为了把这个额外比特降到1b, 使用下面的公式:

Co=R-B, Cg=G- (B+ (Co≫1) ) , Y= (B+ (Co≫1) ) +Cg≫1) [2]

4H.264标准的应用前景

据国外媒体报道, 视频搜索网站MeFeedia最新调查研究报告显示, 自今年1月份以来, H.264格式越来越多地被采用, 增长了160%。MeFeedia网站的索引目录包含3万项源视频网站地址, 例如, Hulu, CBS, ABC, CNN, MTV, YouTube等等。据MeFeedia网站5月份的数据显示, 26%的视频采用H.264编码格式。而在1月份时, 只有10%的视频采用H.264编码格式。MeFeedia网站的研究报告显示许多旧格式视频 (比如新闻和电视节目) 没有改用H.264编码格式, 而大多数新的视频都采用了这一标准。多家媒体公司宣布计划采用H.264编码格式, 放弃原先的Flash播放器。

与此同时, 微软日前正式宣布, 下一代Web浏览器IE9将支持H.264视频格式, 而不支持Flash。

此外, 视频编码服务商Encoding.com 的消息也证实, 今年第一季度2/3的视频以H.264格式编码, 相较去年同期增长了两倍多。视频搜索引擎blinkx和Encoding.com的数据显示, H.264已经成为主流的网络视频编码技术。blinkx称, 在该公司目前索引的网络视频中, 85%~90%采用H.264编码技术。

鉴于H.264作为全球通用标准的优势, 国内大部分企业在部署新的视频应用时都有可能采用H.264, 并且, 正因为应用的广泛性, H.264的相关设备价格将会迅速下降, 部署成本也将因此得以降低。

我国的广电系统和电信运营商曾经将H.264作为主要的推动方向, 并取得了一系列的成绩。在目前电信已经实行运营的IPTV项目中, 几乎全部采用了H.264; 广电系统的各大电视台在进行从模拟向数字转换, 以及网络双向改造中, 也大量采用了H.264技术标准。

国内在H.264标准产品化方面比较领先的是上海富翰微电子的编解码芯片和深圳海思半导体的编解码芯片, 投入研究的单位主要包括清华大学、上海交通大学、暨南大学等。上海富翰微电子已经发布了基于H.264标准的高清网络摄像机和多通道网络视频服务器解决方案。

H.264的应用, 能够促进以下几个方面的发展:

(1) 视频监控的全IP化和高清化;

(2) 蓝光DVD及上下游硬件设备的发展;

(3) 局域网容量需求的上升, 以及由此带动的网络存储容量升级;

(4) 数字电视、IPTV发展的提速, 以及上下游产品和容源质量提升;

(5) 网络带宽的进一步升级等。

由于H.264标准能在较低的码率下实现更高的画质, 并且编码工具较为简单, 适应性强 (高低码率、各种分辨率) , 适合于各类网络 (宽带、窄带) 与系统 (组播、DVD存储、RTP/IP包网络、ITU-T多媒体电话系统) 应用。H.264/MPEG-4AVC视频编码技术已经得到了BD蓝光光盘、数字电视、通讯与多媒体组织及厂商的普遍支持。

结论

总体而言, H.264标准制定以来, 使运动图像压缩技术上升到了一个更高的阶段, 能在较低带宽上提供高质量的图像传输, 被视做下一代视频编解码应用的最佳实现之一, 普遍认为其会是将来更具竞争力的标准。

摘要：对H.264视频编解码技术标准的发展、技术特色、关键技术作了简要介绍, 并介绍了H.264标准的新发展与其在网络、广播电视领域的应用。H.264视频编解码标准是一种低码率、高压缩率、高适应性的视频技术, 在全球具有非常广阔的发展和应用前景。

关键词：H.264标准,视频,编码

参考文献

[1]Thomas Wiegand, Gary J.Sullivan, Gisle Bjontegaard, Ajay Luthra.Overview of the H.264/AVC Video Coding Standard.IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, JULY2003.

网络电视视频编解码主流标准对比篇8

关键词：网络电视,视频,编解码,计算机

网络电视 (IPTV) 又称为交互网络电视, 是电视与现代计算机互联网技术相互融合的产物。它以宽带有线电视网为基础, 融合多种技术 (通讯技术、多媒体技术、互联网技术等) 为一体, 使家庭用户可在因特网传输协议的许可下享受多类别的交互式服务。相比于传统电视, 网络电视具备实时性和交互性等特点, 能满足人们对娱乐、文化的需求。就目前的情况看, 人们对实时传输视频图像的质量要求日趋提高。因此, 相关研究人员必须加强对网络电视视频编解码技术的研究。

1 网络电视的发展背景

网络电视主要采用高效视频压缩技术。当传输视频通信信号的速度为786 kbit/s时, 网络电视视频的播放效果可与DVD一致。网络电视能按照用户的选择需求, 提供多种类型的多媒体服务, 比如可视IP电话、数字电视等。

近年来, 网络电视的发展深受视频编解码技术的影响。视频编解码技术通过多种编码工具集, 以编码图像为单位对网络电视进行精细化处理, 从而提供高清图像。

2 AVS、H.264、MPEG-4的基本概念

2.1 AVS

AVS是由我国自主研发的视频编解码主流标准, 属于第二代信源编码类型, 也被称为数字视频、音频编解码技术。采用信源编码技术能有效解决数字视频、音频等的初始数据、信源的压缩问题。由此可见, AVS标准具有数字音频共性基础。

2.2 H.264

H.264属于数字视频编解码的标准类型, 由ISO/IEC的运动式图像编码组 (MPEG) 与ITU-T的视频编码专家组 (VCEG) 共同组成。与传统编解码标准相比, H.264属于DPCM的混合编码类型, 具有变换编码的功能;在设计方面, H.264更具简洁性, 且基于“回归基本”的设计原理, 增强了其对不同信号通道的适应性;在语法结构方面, H.264所用的语法结构具有“网络友好”特性, 能及时找回处理错误的编码和丢包;在目标应用范围方面, H.264具有相对较大的应用范围, 能适应各类传输场合, 可满足各类解析度和传输速率的需求。

2.3 MPEG-4

MPEG-4是国际标准之一, 也是运动图像专家组采用的通用性开放标准。该视频编解码标准既能编、解特定比率下的音频、视频码, 还能突出多媒体系统的灵活性和交互性。目前, MPEG-4标准被广泛应用于电子新闻、视像电子邮件和视频电话中, 其对传输的速率、分辨率要求不高, 分别为4 800~6 400bit/s、176×144.MPEG-4, 在使用过程中能通过较少的数据来获取较高质量的图像。因此, 相关人员只需利用帧重建技术对数据进行压缩和传输处理即可。

3 技术特征方面的差异性分析

3.1 MPEG-4的技术特征

MPEG-4的技术核心为第一代视频编码技术, 比如运动补偿编码、转变编码、运动估计编码和量化编码等。此外, 该编解码标准还提出了部分核心技术, 比如运动补偿技术、视频编码分级技术、VOP视频编码技术和视频对象提取技术等。MPEG-4的技术优点为:能提供以视觉内容为基础的交互功能和多媒体访问工具, 分辨率输入的上限和下限分别为1 280×1024、320×240, 且具有强大的视频分辨功能;具有强大的压缩功能, 解压缩方式为Object Based, 压缩倍数可达450倍。

3.2 AVS的技术特征

AVS的编、解码效率较高, 运行速度快, 且宽带占用率较低, 约为MEPG-4的1/3.

3.3 H.264的技术特征

与MEPG-4相比, H.264的压缩功能更加强大, 可有效节省用户的数据流量和缩短下载时间。此外, H.264能通过像素构成视频分离帧, 从而提升视频帧编、解码的处理速率;采用临时存放法处理连续帧, 有利于提升编、解码的速率。

4 应用差异性分析

AVS、H.264、MPEG-4标准在具体应用时均有其侧重点。其中, AVS标准的应用方案相对简单, 适用于电视、通信、广播等领域;H.264标准适用于电视会议等, 这是因为其不同层面的编码速率、清晰度取值有所区别;MPEG-4标准的应用类别较为广泛, 比如移动多媒体、计算机图形、静止图像的压缩、数字电视的机顶盒、因特网视频、音频广播、数字广播等。

5 结束语

综上所述, MPEG-4标准和H.264标准起步较早, 其技术和产业链的发展相对成熟, 但MPEG-4标准的使用专利费用较高、H.264标准的适用范围较小。因此, 相关单位可积极研究、发展AVS标准, 从而推动网络电视基础建设工作的全面开展。

参考文献

[1]冯传岗.论我国AVS及第二代数字音视频信源编码标准[J].卫星电视与宽带多媒体, 2013 (03) .

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【语音编解码】相关文章：

数字编解码05-13

网络音视频编解码器讲解04-25

PT2262PT2272编解码IC在视频切换矩阵中的应用04-19

解码05-01

“编码—解码”理论05-25

解码情感危机06-04