专业音频

2024-06-17

专业音频(精选十篇)

专业音频 篇1

1.专业足球赛事概述

专业体育赛事,是指某一项体育运动的专业性赛事。如国际田联钻石联赛、ATPI000大师杯、FIVB国际沙滩排球锦标赛等。这类赛事无论是在赛事组织、竞技水平、电视转播和赛事周边等都具有其运动领域内的顶尖水平。

从这方面来讲,专业足球赛事就应该是专门针对足球所举办的赛事。针对足球的特点,专业足球赛事的赛事组织、竞技水平、电视转播更具专业化。2013年,上海广播电视台配合上海市体育局,致力于将中超联赛打造成为一项专业足球赛事。

2.专业足球赛事的特点

与电视转播相关的,专业体育赛事有如下几个特点:

●收视群体素质较高,对足球的专业知识较为丰富,信息需求量较大。转播中,不仅要给出正常的比赛画面,还要结合高科技,采用超高速慢动作、虚拟跟踪、在线数据统计等方式,第一时间提供观众有用的信息,给予大家一定的分析数据;

●赛场的互动性较好。专业足球赛事转播往往是现场与直播同等重要的。在主队的球迷往往会配合现场的大屏幕做出一些鼓励球队的表现,使得整个足球赛事的参与度更高;

●临场感要求高。当今的足球赛事转播,秉承着要电视机成为赛场的最佳位置的理念。提供赛场最佳的观赏位置的赛事信号,成为专业足球赛事转播的标准之一。

二专业足球赛事视频质量的控制

1.专业足球赛事视频质量主观评价要求

专业足球赛事的转播对于主观评价的要求极其苛刻。2013年,SMG电视转播部参考国外先进的转播模式,结合近几年的经验,提出了以下几点要求;

●画面通透、清晰、明亮。必须要合理地控制好光圈、黑电平、杂散光校正、GAMMA等参数值,使整场足球比赛画面通透,清晰,比赛过程中要保持主亮度电平一致、误差小于1%;

●多机位一致性好。专业足球赛事的转播中,各个转播机位的色彩差异必须小于2%。在各个景别中,注意实时调节光圈、黑电平、饱和度、色温、平衡等值,保持这一标准

●能够通过画面来渲染现场气氛。画面色温的调整,要求能够根据制作要求,来渲染现场气氛.传播“文明观赛”的正能量,体现“足球底蕴”的主队色彩。

2.体育场光照分析

根据专业足球赛事的视频质量主观评价要求.笔者特意于2013年赛事开始之初,对上海的三个中超联赛比赛场(虹口足球场、源深体育场、上海体育场)进行了下午与晚间的光照测试。

图1是虹口足球场夜间的灯光照度分布图。从图中可以看出,场地里的主要照度分布在760至8001ux之间,上下仅有5%的差别。那么,对应在WFM波形60%为主亮度的光圈值大约在F4.0~F4,2之间。

这里我们需要关注的,则是看台上的照度。由于虹口足球场的构造关系,南北看台仅有1层,并且上面没有遮挡物,所以照度大约在4301ux之间,大约光圈值为F2.6~F2.7之间。那么东西看台则相对较暗,照度约为2701ux,特别是客队看台,是在二层的,照度仅为2211ux,并且与大部分的机位相隔一个球场,所以画面往往较灰,并且景深小。

图2是源深体育场下午比赛的灯光照度分布图。从数据上可以看出,由于是自然光的照射,无论是球场还是看台,其照度特性比较均匀,大约在3201ux~3401ux之间。相对应的,光圈值就比较大,在F2.0~F2.2左右,景深就相对较小。

由于上海赛区的三个体育场经纬度相差在小数点后3位,几乎可以忽略不计,那么,通过分析,我们得出以下特性:

●下午时间段的比赛,光照较均匀。需要注意的是球场上主观评价的感受,重点是让受阳面和背阳面在主观评价上趋于一致;

●晚间时间段的比赛,场地光照均匀。需要注意的是当摄像机需要来回拍摄场地和球迷的时候,必须要快速调整光圈和黑电平,以保证主观评价的一致性。

3.摄像机的参数调整

根据灯光的分析和2012年全年中超场次的数据记录情况,我们大致对摄像机进行以下步骤的调整:

(1)Marttix

由于是外场拍摄,色彩矩阵是必不可少的元素。根据2012年中超联赛的数据,色彩矩阵的打开与关闭,会对色彩饱和度产生25%的影响,对于色彩色度的准确性也有着一定的影响。如图3所示。

图3上半部分是打开摄像机仅仅做好初始化的摄像机画面,下半部分是打开色彩矩阵后的摄像机画面。仅仅从主观评价上,我们就能分出两幅画面的高下。在波形监视器上看,则更为明显,尤其是箭型图的部分,其饱满程度的差异是非常明显的。

(2)Flare

打开色彩矩阵后,我们就要想着如何做到通透,明亮了。我们时常会发现,体育场地灯光像一层雾帘一般,使得人眼看上去不怎么灰的画面,在摄像机里呈现出来却灰得非常明显。这时候,黑电平的降低往往会十分剧烈,我们就必须要多管齐下,进行杂散光的校正。

图4就是杂散光校正之后的结果。我们可以很明显地看到球场部分和看台的灰度层次减少了。同时,看台的色饱和度也有大约7%~8%的提升。

(3)WHITE RGB

做好了前面两项的基础准备工作,紧接着就是调整色温了。借助波形监视器,我们可以将现场的景物与示波器上的波形对应起来。借助分离钻石图,我们将绿色部分的主场地调整在一条直线上。这就意味着R-G和B-G的比例是一致的,摄像机所呈现的绿色也是最适合人眼观看的色彩。再微调看台和横幅部分的颜色,就基本完成RGB的调整了,效果如图5所示。

(4)GAMMA

按照文艺节目来说,这已经是差不多了。但对于专业的足球赛事还不够。由于我们必须要突出场地的绿色,主队的蓝色(上海申花主色调)这两个基本色。我们还需要调整GAMMA。根据PAL制的色域特性,将主GAMMA调整向上,压缩高亮度部分的色彩,展开低亮度部分的色彩。那么、相对应的,绿色的部分层次更改不大、而蓝色部分的层次明显拉开。这时,才能够真正地做到拍摄球迷的效果与拍摄球场的效果相同,如图6。

(5)KNEE

由于高亮度部分的色彩被压缩,那么更容易造成死白的产生。所以我们要通过拐点进行动态范围的扩容。如7图所示,亮度超过93%,部分的景物已趋于柔和,不是特别耀眼、让眼球的注意力全部关注到死白上面去了。

(6)DETAIL

最后,为了安全播出方面的考虑,特意增加轮廓电平。一是可以增加画面的质感,做到“十分清晰”的要求。二是可以间接地加大景深,大约轮廓电平提升10、从画面上看,景深增加约6%。同时,也是一种气氛的渲染,在清晰的画面中,听到逼真的现场声,让球迷们一下子就血脉膨胀了起来,如图8。

此外,还需要根据不同的镜头,调整参数。特别是大倍率镜头与标镜之间的差异,不可忽略。表1是2012年上海金山体育场的摄像机数据。

三专业足球赛事音频质量的控制

1.专业足球赛事音频质量主观评价要求

与画面相同的,专业足球赛事对于音频质量也有着很高的要求。尤其是主观评价方面,这对于音频来说是核心。SMG电视转播部也就2013中超联赛的音频提出了以下几点要求:

●舒适、自然,给予观众美的享受。观众观看足球赛事直播,是希望看到一场高水平的、能够让自己愉悦的比赛。必须要调整声音的响度和动态范围,使得整场比赛既有效果,又让观众听起来舒适;

●比例恰当。对于观众来说,观看电视直播并不想把现场的气氛完全地带到家里来。合理地处理好球迷加油声和踢球效果声的比例,对于一场足球比赛的好坏是十分重要的;

●适当渲染气氛。现场还需要专门设置两对话筒,用来拾取主队和客队球迷具有代表性的声音。在适当的时候播放出来,能够增加画面的临场感;

●实现部分跟随视频技术。对于球员进场,唱国歌,教练寒暄等画面,要采用音频跟随视频技术,更好地将现场的情况呈现出来。

2.体育场频响分析

根据专业足球赛事的音频质量主观评价要求,笔者于2013年赛事开始之初,对上海的三个中超联赛比赛场(虹口足球场,源深体育场、上海体育场)进行频响的测定,如图9所示。

从图9中我们可以明显看出一个以800Hz为中心频点,630Hz到1kHz为频带的波峰。经过现场声音相比对,确认为现场球迷的欢呼声。800Hz的最值为球迷的敲鼓声。经过观众调研,我们发现,其实这部分的声音并不是球迷们最愿意听到的声音。由于人耳可以根据每个人不同的思想来确定听音环境,就是类似于生物滤波器的功能,那么,我们也必须将这部分波进行衰减,以模仿人耳的真实感受。

从图10中我们也不难发现,以8kHz为中心频点,6.3kHz至10kHz为频带的声音为次波峰。经过对现场麦克风的仔细校对,确认此声音为现场的踢球效果声。这部分其实在现场,人耳是听不到的,理论上应该不予以加强。不过,这却是渲染现场气氛的极好材料。特别是射门时,脚面与足球的撞击声,以及足球击打在门框上的撞击声,能够对听觉神经做出极大的刺激,给予观众超乎寻常的临场感。

3.话筒架设策略

根据以上的分析,并结合2012中超联赛的经验,拟定了2013的场地话筒架设策略,如图11所示。

从图11中我们可以看到,MIC1~MIC12是分别拾取球场上的各种声音.采用强指向性的Sony416话筒。MIC1~MIC8主要拾取球场上的踢球声,MIC1和MIC2还兼顾拾取球门球的踢球声的任务。MIC9-MIC12主要拾取主罚角球时的踢球声。而MIC13~MIC16采用的是全向性Sony418话筒,主要分布在四个看台周围、通过看台上的四台101倍摄像机传输信号。主要拾取主客两队球迷的加油呐喊声。

四总结

通过以上的调整,我们成功地将中超联赛包装为具有一定水准的专业足球赛事。但是,应该看到虽然我们做出了不少努力,依然和欧洲五大联赛的转播存在着不小的差距。2013年亚冠联赛的转播中,国内已经出现了持续性的蜘蛛眼,斯坦尼康的使用;在节目的制作过程中,也进行了在线数据统计的应用。在足球赛事转播日趋艺术化的今天,如何为观众奉献出一场画面精美,现场感强、信息量大的精彩转播,在这个课题上我们依然有很长的路要走。

专业音频 篇2

【关键词】专业音频产品;发展趋势;对比;指向性可控扬声器;相控技术;调音台;多学科结合;发展建议

文章编号:10.3969/j.issn.1674-8239.2015.02.004

【Abstract】According to the present technology situation of professional audio products and its application requirements in the future, and referring to the the latest and newest products of the famous manufacturers which have been exhibited in the most important exhibitions worldwide , the author presents some development trends of professional audio products , and after comparing with the abroad and the domestic related industry , gives some proposals and important points which should be focused on.

【Key Words】professional audio products;development trend; comparison;coverage adjustable loudspeaker, phase control; console; combination of multi-subjects; development proposals

3.2 目标需求的细分及产品的精确对应

随着竞争的不断加剧,各相关专业音频扩声产品生产厂商不得不对市场需求进行进一步细分,并反映到自身的产品线设置中,推出更加细化的、与市场需求更加对应的系列产品,尤其是扬声器和调音台环节。

3.2.1 扬声器系统

在扬声器系统的实际使用中,由于扩声需求已经遍布于社会各个场所,因此对其要求也是多样性的,不同的使用环境和音乐播放类型都可能对扬声器系统的声压大小、音色表现有着不同的要求,所以单一型号或系列的扬声器已经不能满足当代设计的要求,根据这一情况,世界各著名厂商纷纷依照目标市场和客户,不断丰富自己的产品线,从而使扬声器系统产品与市场需求的对应更加精准,笔者在此仅以美国JBL扬声器为例予以简单说明。

JBL公司是美国著名的扬声器生产厂商,并于30年前进入中国,是最早进入中国市场的为数不多的几个品牌之一。近年来,随着中国经济的飞速发展以及相关产业需求的急剧提升,JBL也逐年加大对中国市场的重视度,为扩大特定目标客户、占领市场,不断地依据市场需求,在电影院、大型户外演出、剧场剧院、小型流动、会议厅堂、夜场CLUB(俱乐部)以及专业音频制作等方面,推出相应的产品,使其产品线越来越丰富,主要包括:ScreenArray/SCS系列影院扬声器、VTX/ VT系列大中型演出用扬声器、PRX/EON便携式流动演出用扬声器、AE/VP系列多用途固定安装扬声器、VRX/JRX系列多用途流动扬声器、M2/LSR系列专业制作监听扬声器、CWT/CBT系列会议扬声器以及Control/8100/CSS系列吸顶扬声器等,除此之外,JBL公司甚至还根据中国和亚洲市场的特殊需求,推出了KP/Ki/KS系列KTV专用扬声器(见图13),来满足特定使用环境和特定使用者听音习惯的需要。

3.2.2 调音台系统

调音台产品线细化的趋势也很明显,这里先以英国Soundcraft调音台为例予以简要说明。该品牌从最早研发的大型分体式调音台Vi6开始,提出了相应的调音台系统架构,并以此架构为基础,陆续推出Vi4(见图14)、Vi2和Vi1,与此同时,又研发出Si系列,用以填补比Vi系列更低端的市场需求。Si家族的产品与Vi系列的分体化架构不同,是一体化的数字调音台,与传统的模拟调音台更加接近,也更容易理解。这个系列也是从最大的Si3入手,逐步向下拓展至Si2、Si1、Si Compact、Si Performer和Si Expression(见图15),尺寸一个比一个小,造价一个比一个低,从而将系列产品的价格下拉至2万元左右,以适应不同场合的需要并充分挤占传统模拟调音台的市场份额。而对于高端市场,则通过属同一集团公司的Studer Vista系列予以占领。

这样,通过两个品牌三大系列覆盖了包括广播电视、专业剧场、流动演出、会议厅堂、体育场馆、夜总会俱乐部等在内的整个高、中、低端市场,实现了公司的战略布局。同时,Soundcraft公司还做了三件事来推进其数字调音台的推广,首先停产所有的中大型模拟调音台,让市场客户没有产品可用,逼迫市场转型;其次,共用Soundcraft Vi系列和Studer Vista系列的平台,使得相互之间可以互换,从而在满足用户多样化需求的前提下降低一部分成本,更有利于抢占市场,例如,可以用Vi系列的调音台面搭配Vista系列的机箱,从而在获得更好A/D、D/A以及DSP质量的同时,降低调音台控制台面的成本;除此之外,Sundcraft还对中低端产品进行了大幅降价,这当然也是市场营销策略、前期研发成本的逐年分摊及元器件降价等多方面因素平衡的结果。

nlc202309031906

数字调音台的发展,近年来还有一个很有趣的现象,即大型分体化调音台逐渐推出一体化产品;而小型一体化调音台则提供分体化的选择。这是什么意思呢?以德国著名的高端大型数字网络调音台LAWO为例,这家工厂最早筹划这个调音台及网络系统的时候,就确定了双星化的分体结构,即将调音台系统划分为三大块,包括调音台台面、主核心矩阵和处理机箱以及普通接口机箱,三者之间通过互为备份的网络互通互联,模块化的结构使得每个部分内部也可以通过双星结构实现互为备份,每个部分都可以根据需要进行模块组合后提供不同产品进行选择。这样,极大地提高了系统的灵活性和安全性,产品确实很有特点,而且通过多年努力,早在几年前就实现了8 192×8 192的矩阵路由和处理能力,相信这个规模能满足目前世界上各种不同场所的需要。但实际情况表明,虽然LAWO在高端市场的表现非常出色,但毕竟市场规模有限,因此,近年来它不得不放低姿态,研发能够更加普及使用的产品,如MC256等,但仍然坚守分体化的结构。这种思路一直延续到2013年后半年,情况发生了重大变化,首先在2013年底正式宣布停产最高端的MC290调音台(见图16),其次在2014年9月的荷兰IBC展上正式推出了一体化的MC236调音台(见图17)。它在自身具有DSP能力以及物理接口,在能够独立工作的同时,还可以外接扩展机箱,从而提供了更好的性能价格比和灵活性。

那么,所谓小型调音台分体化,则与上述大型调音台的演化发展相反,即原来以小型调音台为主的厂商也在尝试将16路、24路、32路这样的一体化小台子在保持其能独立工作的同时,进行分体化功能扩展,这样就能实现信号远端传输的需要,从而满足一部分客户的需求。如英国ALLEN&HENTH 公司的GLD系列(见图18)以及日本YAMAHA公司的 CL系列等。

3.3 信息处理及网络技术与音频产品的加速融合

如前所述,信息处理及网络技术很早就已经开始影响到专业音频产品的发展,但这种影响从来没有像近5年这样深刻和高速,从而使得专业音频产业在产品构成形式和操作使用方法等方面可以纳入IT行业。当然这里有个前提,就是音质,任何专业音频产品,其声音质量仍然是基础、是本质,仍是音频专业工程师牢牢坚守的阵地;除此之外,在产品功能、结构、操作等方面,今后必定会以IT工程师为主进行研发。

正是基于上述原因,目前所有的大型专业音频控制设备厂商基本都提供方便快捷、功能完备的计算机操作界面,甚至会与最流行的苹果iPad(苹果平板电脑)和苹果手机相结合,提供相应的APP(APPlication,应用程序),用于远程遥控或离线编辑,使得音频系统的操作更像是一种随时随地可以拿出来玩的电子游戏。图19即为QSC Qsys音频矩阵系统及Soundcraft Vi系列调音台的iPad控制界面。

此外还有一个非常典型的例子可以充分说明信息化、网络化的趋势,那就是目前笔者主持的武汉“汉Show”(汉秀)大型演出的音视频项目,这套系统已经完全将所有专业设备(包括音频、视频、内部通信、控制等等)构建在不同的网络之上。因为系统比较复杂,具体细节在此不再赘述,但这套系统总共使用了90余台高端的EXETREME网络路由交换机,共计敷设了12×104 m的六类网线及6.5×104 m的万兆光纤,用以传输各类音频、视频、控制等信号。通过这些数据可见,该套系统是完全基于信息网络而建设的。除此之外,由于“汉Show”是单一驻场节目的反复演出,所以其音频控制也与常规的演出略有不同,这套系统中共使用了377只Meyersound专业扬声器,通过三套(效果声、监听、主扩声)各288×288通道的D-mitri大型音频处理矩阵,与现场乐队以及事先存储的大量多通道效果节目源相互配合实现对观众席和表演区域的多重环绕扩声,但其对音频信号的主控设备却没有采用严格意义上的专业调音台,而是模块化组合的矩阵物理控制界面,说白了有点像计算机的键盘和鼠标,或者说是游戏机的手柄,通过简单的钮键和推杆经由网络交换机对D-mitri大型音频处理矩阵进行控制(见图20)。这也从另一个侧面说明专业音频产品发展的趋势。

3.4 多学科在专业音频产品的交叉应用

在数字与网络技术、绿色与节能理念的带动下,专业音频产品呈现向数字化、绿色节能发展的趋势;同时,为了给艺术创意提供更多的表现手段,需要应用技术不断进行创新;此外,随着信息处理技术的发展,IT技术已成为一个良好的共同平台和载体,各种学科通过这个平台或载体迅速融合,形成很多极具特色的新兴产品,以满足顾客多样化的需求。在这一方面比较有特点的产品当属Powersoft公司推出的DEVA(见图21),它融合了LED照明、扩声、拾音、摄像、红外探测、视音频监控、Wifi路由及无线传输、太阳能供电等多种技术,并配备了多种感应器,包括传声器感应器、光感应开关、存在探测器、温度/湿度/压力探测器等,可以通过iPad或智能手机、个人计算机等,以有线(通过以太网)或无线方式连接控制,实现信息的双向沟通。从背景音乐到寻呼及业务广播,从照明、图像摄取到具备红外探测功能的音视频监视,均可得以应用。在主题公园、酒店、社区、城市广场及商业街道、高尔夫球场、大型企业等等都有着很好的应用前景,其一体化整合的多功能可以给业界同仁极大的启发,相信以后必定成为相关产业发展的方向。

3.5 数字化传输的无线传声器系统

基于使用便利性的需要及相关技术的发展和稳定性的提高,数字化传输的无线传声器产品越来越得到更多的应用,数字化传输的无线传声器与此前存在的数字无线传声器是有区别的,后者在接收机之后进行A/D转换,而此处所提到的产品则将数字化的过程提前至无线发射设备内,即在无线发射之前完成音频信号的A/D转换,这样做比以前有什么好处呢?

(1)射频传输的是0、1组成的数字编码流,易于接收识别,抗干扰能力更强,所以信号更稳定,音质也容易得到保证。

nlc202309031906

(2)数字编码后音频信号的大小通过不同码流表示,避免了模拟系统中为降低最大调制频偏、提高频带利用率而迫不得已进行的动态压缩及扩张处理环节,其动态范围更大,音质更好。

(3)传输过程中更容易加密,安全性远高于模拟无线信号。

(4)所占传输带宽很窄,因此在同样带宽中,数字系统的利用率会远高于模拟系统。据有关资料显示,目前的欧洲歌唱大赛对无线传声器的使用已经到了登峰造极的120个通道以上,如果采用模拟系统,那么对频宽的要求就非常大,而采用数字系统,则能有效地减低对无线频率资源的占用。

基于上述诸多优点,世界著名的无线传声器厂商都在近期推出了相应的数字化传输产品,例如SENNHEISER 公司的Digital 9000系统(见图22)、SHURE的ULXD系统等。Digital 9000系统使用极其陡峭的滤波器,允许使用者在可用频率范围中对各个通道频率进行非常狭窄的设置,而不会发生互调现象,不仅保持了SENNHEISER独有的声音品质,也使得系统的频谱利用率大为提高,在未来UHF频谱资源日趋减少的情况下,可以保证系统的长期可用性及适用性。

4 对国内相关产业发展的建议

在这种行业发展的大前提下,由于世界范围内信息交流更加便捷以及世界一体化贸易体系的建立和发展,国内相关行业从业者的眼界得到了拓宽,同时国内相关领域也随着国内经济形势的飞速发展,得到了相对充足的资金支持,因此,近年来,尤其是后奥运时代五年以来,国内专业音频领域的发展势头非常迅猛,以LAX、β3、音王等为代表的民族品牌已迅速崛起、壮大,但依据笔者现场考察以及其他业界同仁和实际应用所反映的结果,民族工业还有很多不足,需要大家共同努力,因此,特对国内相关行业的发展提出如下建议。

(1)在产品研发生产的过程中,一定要注意理论研究与主观试听的有机结合,一方面要在基础理论的指导下,加强对国内外最新技术的借鉴;另一方面要真正重视主观试听对产品研发及定型的指导作用,建立良好的试听环境和试听系统,确保系统的其他环节不会对被试听的产品造成影响,然后通过乐队指挥、录音师、调音师以及乐手等专业人员的试听,总结共性意见,这样可以发现很多客观测量所无法反映的问题,从而用于产品在音质方面的改进。笔者一直坚持认为,音频产品(尤其是扬声器)的最终效果应以主观试听结果为准。

(2)各从业技术人员一定要通过各种手段加强研发人员的音响美学修养,使之形成良好的音响美学标准。音响美学是一个见仁见智的领域,但在满足人类绝大多数听觉感受的条件下会有一个基础标准,专业技术人员可以通过观看高水平现场音乐会、大量及长期的优秀节目试听(一定要注意建立良好的还音系统和听音环境)等工作接受优秀音质的熏陶,从而培养出对音质优劣的相对准确的辨别能力。

(3)如前所述,市场需求在进一步细分,因此,中国相关音频产业由量变到质变的发展过程中,不可能一味地追求高大上,应该首先做专、做精。相关企业应该首先根据自身能力和兴趣,找准市场定位,在某一目标市场或档次层面专注发展,形成自己的专业方向;其次要静下心来,放远眼光,在此专业方向上,根据国际上的技术发展现状,投入一定的人力物力,潜心研究,拿出精品,并以点带面,力争成为该专业方向上的世界领先者。

(4)一定要重视产品研发过程中的理论研究,以科学理论支撑创新,不能脱离技术依据而想当然,所以,企业要加强与高校及科研单位的合作,而各高校和各科研单位的研究也应以市场为导向,从而形成企业出题、高校答卷的局面。笔者认为,现有条件下可以从模仿做起,但要知其然,更要知其所以然,并以此为基础,再进行二次创新,形成自身的知识产权,并演化成为本公司的核心技术和核心竞争力。

(5)要紧跟信息处理和网络技术的发展,充分地进行头脑风暴,展望未来可能的应用模式,将多种学科综合应用于专业音频领域,从而在某些层面实现与国际产品的同步发展,并充分利用国内的人力资源优势,迅速占领相关领域的至高点,在迎头赶上传统产品模式的同时,积极创新并引领新兴产品模式,这似乎是一条民族企业迅速成长的捷径。

5 结语

纵观整个音频行业的发展,可以感觉到近年来的创新和质变越来越多、越来越快,这与信息处理及网络技术的迅速融入有着极大的关联度,因此,要正确认识这种大趋势。同时,在经历了多年的坎坷和努力之后,中国的本土音频企业实现了从无到有、从有到大的突破,逐渐完成了最初的资本积累,并奠定了快速发展的物质基础。但是,绝不可以骄傲自大,因为单纯的资本不足以改变国内专业技术上与世界领先水平的巨大差距;也绝不能妄自菲薄,而要正确认识自身的发展,要增强自信。只要全体从业者能够认真审视不足,心怀高远,卧薪尝胆,重视科技和创新的力量,潜心研究,必将迎来由量变到质变、从大到强的蜕变,像家电等其他行业一样,在专业音频领域的世界之巅占据一席之地。

鉴于笔者知识和眼界的局限性,欢迎业界同仁批评指正。

(续完)

(编辑 杜 青)

参考文献:

[1]李宏虹. 现代电视照明[M]. 北京:中国广播电视出版社,2005.

[2]王京池. 电视灯光技术与应用[M]. 北京:中国广播电视出版社,2010.

作者简介:

薛建博,二级舞美设计师。1996年毕业于北京广播学院电视照明专业。参与陕西电视台多个节目、历年春节晚会等。2006年获中国电影电视技术学会电视美术灯光设计工程奖;在多个专业杂志发表论文十余篇。

周闻,高级工程师。1990年毕业于山东大学电子工程系无线电电子学专业,曾获2008年、2010年中国广播电视协会电视灯光奖新闻类一等奖;2008年参加北京奥运会手球项目转播,2010年参加广州亚运会摔跤、柔道项目转播。

(编辑 张冠华)

专业音频 篇3

如今, 计算机多媒体网络技术在教育教学中的全面应用, 促进了教学方法和教学结构的改革、教学思想教学理论的发展, 为探索新的教学模式、教学法和教学手段提供了机会, 而对于英语听力教学更起到积极的作用。而目前, 英语听力课程的一个突出的问题是教学形式需要多样化。

以录音磁带为主的传统媒体日益显示出其局限性和落后性, 如果将之转换成音频在电脑控制台上播放, 不仅容易控制, 而且容易节选素材。而英语听力课程中, 除听教材录音、运用软件进行人机对话外, 收听外国英语节目和、收看网络上原声英语电影也是很好的选择。它们不仅具有实用性、时效性, 而且撰稿及播音均为native speakers, 对学生学习语言大有裨益。但由于其在内容上未加甄选, 因此, 有的或内容与我国政策相左, 或录音、影像长度过长, 只需要摘录其中几段即可满足课堂使用。因此, 教师需要从中精选出有用的内容, 让学生最大限度地从中受益。

另外, 英语听力教师在期末考试时, 不仅要出纸质试卷, 而且要录制相对应的听力考试题。所以, 音频素材的制作处理, 尤其是音频文件格式的转换与剪辑, 在英语听力课件制作及期末考试音频制作中是经常性的工作。笔者结合自身英语听力教学的工作经验, 与读者分享一下常见的音频剪辑和制作技巧, 希望对英语听力教学方法的改进起到一点作用。

二、音频制作技巧

1.常见的音频文件的剪辑

(1) 音频文件的编辑。

除了教科书材料外, 听力教师可能要常给学生补充一些必要的听力知识。有时, 可能已有的音频文件长度过长, 只需要从中跳跃式截取部分内容以满足实际教学需要, 这就涉及到对音频文件进行编辑。此处主要介绍WAV与MP3这两种最常用的音频格式文件的剪辑工具及剪辑方法。

WAV、MP3格式音频文件的剪辑常用工具是Premiere, 可以下载一个中文版本的软件。安装后打开界面, 可以看到三个窗口, 换句话说, 其编辑方式有三种:时间线上的编辑、监视器窗口上的编辑、故事板编辑 (工程无标题栏) 。找到故事板编辑 (即工程无标题) 窗口, 在其框中空白处右键单击, 右键单击, 选择“导入”, 进而选择所要导入的文件或者文件夹, 比如, 某个英语音频。然后找到时间线编辑窗口, 在时间线编辑窗口中可以看到五行, 前两行是视频栏, 后三行是音频栏, 把希望编辑的那个文件用鼠标拖动到音频1中, 然后, 找到监视器编辑窗口。其中, 有两个一样的框, 一般用右边的那个框就足够了。用鼠标左键单击右边那个框中标有向右箭头的开始按钮, 即可播放音频1中的录音, 然后, 点击右边那个框中标有正方形的停止按钮, 即可停止播放, 在时间线编辑窗口的左边有几个图标, 其中, 那个像刀片的图标就是截取音频图标, 使用时需要先用鼠标点击一下该图标, 然后可在打算截取的音频处点击一下, 此处音频处就会出现一个短竖线, 把鼠标移到两个短竖线之间的音频段落上, 右键单击, 就可以选择剪贴或者删除此段, 如果有其他需要插入的音频段落可以用鼠标拖至此空白段落中, 完成剪辑与合成。

(2) 另外一款很实用的软件是Total Recorder。

使用步骤为:打开Total Recorder应用程序, 点击“文件”菜单, 选择“打开”, 然后, 选择拟编辑的音频文件的位置和名字, 接着在应用程序下方的选择目录下通过和键进行所需文件前后时段的选择, 最后, 将选定的那部分音频文件在“文件”的菜单下选“保存选择为”目录下进行命名保存。

2.不同形式的音频转换

(1) 磁带转录成MP3。

如今, 许多学校使用多媒体进行英语教学, 但一些听力素材是以磁带形式出现, 无法在电脑上播放, 这需要将磁带转换成MP3格式。如果采取外录的形式, 即一边用录音机播放录音, 一边用电脑录音软件或者是录音笔来录制, 常常会有外界噪音干扰, 录制结果往往不令人满意。为避免这类情况的发生, 我们可以用内录的形式, 设备与步骤很简单。首先, 需要从市场上买一根双头音频线, 两边的音频插头都是一样的那一种, 然后, 从网上下载一个没有录制时间限制的录音软件。比如, Total Recorder (而一般电脑自带的录音机软件有60秒时间限制, 不太符合要求) 。需要注意的是, 电脑作为录音的设备, 需要设置一下。以Windows XP为例, 在控制面板中, 打开“声音和音频设备”, 在“音量”选项卡中设备音量中, 打开“高级” 按键, 在弹出的主音量窗口中, 在菜单“选项”下选“属性”, 在“属性”对话框中, 更改“混音器”为“input”, 然后, 勾选“线路音量”, 确定后退出。最后, 在“录音控制”对话框中勾选“线路音量”。然后, 准备好录音机, 放好磁带, 就可以开始准备录音了。

具体的操作步骤为:首先, 将一根双头音频线, 一头插入录音机的Phone插孔, 一头插到台式电脑声卡的Line in (线性输入) 插孔, 一般来说, 这个插口原来的插头线的颜色标志是黄色的。其次, 运行total recorder应用程序。在“选项→录音源及参数设置”菜单中, 将音源设为“声卡→线路输入”;在“录音参数”选项点击“更改”, 将“格式”改为“MPEG Layer-3”, 属性可以采用默认设置, 然后点击“确定”, 退出参数设置。第三, 用录音机把要录制的歌曲调整好, 按下录音机上Play (播放) 键的同时, 用鼠标单击应用程序的“录制”按钮。结束录制时, 用鼠标单击“停止”按钮。然后起个名字把录制的声音文件保存起来即可。

(2) 视频文件转换成音频文件。

在听力教学中, 有时, 教师需要将收集到的视频文件转换成音频格式。可用千千静听软件打开视频文件 (注意这一软件只能出声音, 无法显出图像) 然后点击其右下角的pl (播放列表) , 在弹出的对话框中可以看到正在收看的视频名称, 右键单击这个视频名称, 在列出的对话框中点击转换格式。然后, 在下一个弹出的对话框中进行设置。具体如下:在输出格式中选择MP3编码器, 音效处理一栏中, 把启动回放增益、启用当前均衡器设置、启用当前杜比环绕器设置三栏都打上勾。在选项栏中, 自己设一下转换文档放置的地址 (如E盘根目录下等) , 把转换后自动添加至播放列表一栏打上勾。然后, 点击立即转换按钮, 就开始实行音频转换了。通常一部两个半小时的视频用20分钟就可以转换成音频。而转换后的音频文件不仅可以在电脑上, 而且可以在MP4上播放。

3.网络英语听力素材转换成音频文件

多媒体网络资源非常丰富, 可以轻松下载。拥有了多媒体网络就等于拥有了一个听力资源库。可以用Total Recorder应用软件进行网络录音, 把网络英语听力资源转换成音频文件。

操作步骤为:首先, 按Total Recorder主界面上的“录音源及其参数设置”按钮, 将录音源选择为“软件”, 然后“确定”。然后, 打开IE到目标网站, 打开想录制的声音档, 接着会弹出新闻在线收听播放器Realplayer, 迅速点击Total Recorder的录音键, 录音开始。录完按停止键即可。想听录好的声音, 按播放钮即可 (如果看录音是否正在正常运行, 只要看录音电平表上的那两个条形的绿色水平柱是否在左右闪动) 。

三、英语听力考试之音频剪辑制作

在英语听力考试中, 教师需要出纸质试卷, 并根据纸质试卷内容录制对应的听力考试题。这涉及到音频剪辑、教师自录麦克风里的声音或者各种外接音源, 比如, CD、碟机的录制, 磁带的录制等。Premiere软件是一款很实用的音频制作软件, 也较易于操作。具体步骤分为剪辑其他音频内容、教师自主录音、音频合成、效果调试四步。

1.剪辑其他音频内容

这部分内容与音频文件的编辑相同, 在此不再赘述。

2.教师自主录音

(1) 教师自录麦克风里的声音。

教师可以用耳麦进行自录, 这需要事先设置好录音方式。以Windows XP为例, 在控制面板中, 打开“声音和音频设备”, 在“音量”选项卡中设备音量中, 打开“高级” 按键, 在弹出的主音量窗口中, 在菜单“选项”下选“属性”, 在“属性”对话框中, 更改“混音器”为“input”, 然后勾选“麦克风输入音量”, 确定后退出。最后, 在“录音控制”对话框中勾选“麦克风输入音量”。准备好麦克风, 调节音量大小, 然后, 就可以用我们上文中讲的录音软件来录音了。

(2) 外接音源的录音。

有时, 则可能会从各种外接音源, 比如, CD、碟机, 甚至磁带的录制等。此时, 可选择“声卡”录音模式。先按Total Recorder主界面上的“录音源及其参数设置”按钮, 将录音源从“软件”改成“声卡”, 然后“确定”。回到主界面后按录音钮即可开始录音, 如需停止录音按停止钮。录音完毕, 可点取保存按钮来保存文件。可将文件保存成*.wav (默认) 格式, 也可以将文件保存成*.mp3甚至*.wma等其他格式。

3.合成

因为教师的素材是零散的, 需要把这些零散的素材在Premiere中组合起来。可以打开Premiere软件, 按照出试题时的音频顺序逐个导入音频文档, 依次拖至时间线上的编辑窗口的音频轨道中, 可以使用多个音频轨道, 可在各音频轨道上叠加音频素材, 最终输出的声音是各音频轨道在时间线上的合成。每拖一个音频, 都用监视器编辑窗口上的播放按钮播放一下, 看看是否内容正确, 确保与前后音频衔接得当。在时间线上的编辑窗口底部, 是时间帧的相关设置, 可以设为1秒、12帧、1帧等形式。帧数越少, 则精确度越高。根据内容, 可以使用刀片工具 (即时间线上的编辑窗口中左方的刀片形按钮) 对音频轨道上的音频素材进行分割及剪切、删除、复制、粘贴等操作。还可以使用音频滤镜对音频进行修饰, 以满足实际使用的需要。最后, 将工作区的各音频轨道进行合成输出, 输出格式可以根据需要选择*.wma、*.wav或*.mp3等文件格式。

计算机多媒体网络辅助教学用于英语教学, 能使“教学形式更加活泼, 教学质量进一步提高, 能变被动接受信息为主动接受信息, 从而激发学生的主动性和创造性” (项国雄, 2000) 。它符合当今国际上外语教学手段更新与发展的趋势, 有助于提高学生的学习兴趣, 有效训练学生的听力理解能力, 优化听力教学效果。而音频剪辑与制作技巧则可以充分发挥计算机多媒体网络的作用, 为英语听力课程教学及其他相关课程教学提供必要的支持。

参考文献

[1]仇如慧.音频制作技巧在大学英语听力课程中的应用.科技信息, 2007, (15) .

[2]项国雄.多媒体课件设计基础[M].北京:高等教育出版社, 2000.

心声音频馆 篇4

[关键词]场景化内容产品;心声音频馆 ;移动互联; 用户体验

[作者简介]陈嫦娥,天闻数媒科技有限公司内容产品部。

一、引言

场景化数字内容产品,是基于移动互联环境下用户需求分析定义出来,在某种特定场景下用户所需要的数字内容服务,及其对内容服务所需涵盖或提供的功能服务产品。如老师的数字课堂需要的富媒体、交互式备课资源产品;TOFEL学生考前需要模拟测评产品等,就是特定场景的内容产品及服务。

“心声音频馆”是笔者在公司业务中做的第一款“场景化数字内容产品”,它成功推出后成为数字内容开发部门的常态化思路。接下来我们又推出了好几款内容产品,譬如“数字图书馆、背单词、分级阅读、虚拟实验”等,在这个过程中,有诸多经验值得分享,供业界探讨和专家批评指正。

二、“心声音频馆”产品规划与设计

移动互联的特点是抓准小众用户群体,“心声音频馆”的定位就是特定的视障人群。“文化共享工程”是国家文化部下的一个惠民工程,服务于全中国13亿用户,但要面向所有人做一个普适性文化产品是完全不可能。因此,我們首先就从用户群体分析入手,通过多种形式的基层走访,把“文化共享工程”惠及的人群总结为几大类型:留守儿童、失独老人、边防战士、务工人群等;而各种调研数据反馈,全国1700多万视障人群是容易被文化服务惠及不到的小众群体。因为盲文、导盲设备及措施在公共场所的普及性较差。

其次,我们通过走访中国残联、北京市盲人学校、各基层文化共享服务点等,了解视障人群的文化需求、文化教育的特点,并因此定义出产品的特性、功能、内容架构,形成一套“心声音频馆”的产品方案: 以构建声音文化服务云平台为基础,提供丰富的声音文化资源以及专为视障人群无障碍听书的技术,辅以听书辅助专用设备,形成一个为视障人群打造的文化服务平台。

找准目标用户,以他们为中心,站在用户的角度来审视产品,产品才有生命力。

1. 产品使用场景设计:根据视障人群使用文化产品的场景来定义内容及功能特性

按照数字内容产品出版流程,产品经理要定义好产品的概念及功能,而后才能去做相应设计、内容建设、开发等工作。笔者一行去到盲校、社区、图书馆等观察视障孩子、成人如何上课,如何学习,如何阅读;了解他们的兴趣爱好、行为习惯等;去拜访中国盲协、中国残联的专家以获取支持和指导。

经过一系列的调研之后,笔者及其团队将各类信息汇总、分析,将用户产品用PPT概述出来,将内容需求和功能按用户满意度的高低排序出来,最终形成“心声音频馆”的产品定义:在视力障碍情况下,阅读用耳朵、用心灵、用手指;内容要多元、丰富,满足视障人群不同层次的需求;操作要简单,人性化帮助视障人群记忆阅读记录,等等。

核心场景设计,是让视障用户真正无障碍阅读,既可以网络在线收听,又可以云端下载随时随地收听;通过指纹一次性登录个人信息后,不同平台使用“心声音频馆”,均能同步用户的私有信息和阅读内容;系统也可以通过读取各个地域用户的阅读信息进行资源推送等。

2. 产品内容规划与技术设计

进入开发前,笔者及团队对“心声音频馆”从设计、技术、内容、终端阅读设备四个层面进行了规划与设计:(1)产品以清新简约的界面设计为主;(2)进行无障碍技术专业机构证书认证,打造视障人群完全无障碍浏览阅读平台;(3)打造三大类内容特色(经典名家作品多、热门畅销作品多、节目门类齐全); (4)开发两个专业的视障人群辅助阅读设备,以满足对“心声音频馆”的支持与服务需要。

图1 “心声音频馆”云平台页面

基于以上四点,“心声音频馆”选择了清新绿色的简约设计风格,从技术上突破了平台及产品无障碍技术难关。视障人群可以简易地通过鼠标、语音提示,点击登录网站,轻松在页面上找到自己想要的内容……

产品在北京盲人学校试点使用,孩子们随机接受媒体采访的回答就是最有力的验证:“这个平台用起来十分简单,语音提示非常简洁,鼠标移动语音提示跟随,感觉到手指和声音的同步,操作起来容易且不会出错。”

图2 北京市盲校音频馆使用现场

“心声音频馆”在内容建设上保持名家精品、门类齐全、持续更新、专题推送等几个特点,深受用户的喜爱。如“聆听经典系列、名著系列、中外古典音乐系列”,适合各个年龄层对艺术类声音节目的需求;而评书、相声等节目,则非常适合成人休闲赏析。内容的受众面既优先考虑了特定年龄层次读者的需求,又考虑到了内容覆盖的普适性需求。

“心声音频馆”还专门开发了智能终端型产品:包括专为视障人群服务的指纹登录设备,能够准确记录用户的基本信息,并能将用户信息注册到平台,把用户的阅读喜好、浏览记录等一一记录下来,方便用户使用;也包括智能听书设备,一方面各类普通听书设备可以直接从平台下载资源进行快捷使用,另一方面也研制了具备盲文向导的专用听书机,方便视障人群更便捷听书。

图3 指纹辅助登录设备

三、数字内容产品开发模式分析

“心声音频馆”自2013年年中试点上线以来,截至今年3月,单日PV破10万,单日服务人次超3万,累积PV流量近500万,累积服务100多万人次,这样的效果与产品严谨的开发流程密不可分。

数字内容产品的开发流程与传统出版物的出版流程,有着较大差异。数字内容的开发除内容策划外,还需要增加技术功能策划、运营服务策划等。流程包括产品概述方案的策划、原型设计、平台测试版开发及发布、资源开发与测试发布、产品实验点建立及产品商用测试等。

nlc202309041707

这些标准化开发流程的每个环节实施都是面向用户需求满足的反复实践。譬如内容模块设计,是通过专业官方机构指导、专家指导和一线走访统计,归纳最受大众视障人群喜爱的内容进行组合开发的。栏目体例设计,看似和传统产品很相似,但因为放在移动互联平台和设备上使用,以前一本书要设计合理的版心、行距、字體字号等,使用户阅读体验舒适,而音频读物的设计则要考虑在平台上阅读怎么无障碍听、怎么便捷指导下载,单个节目时长不超过20分钟,同一系列节目如何自动跳转播放等问题。

“心声音频馆”以经典、权威的内容,技术体验流畅便捷等较好的用户体验深受好评,是产品开发流程科学的结果。

四、产品运营与服务

移动互联下的数字内容产品,运营与服务是产品生命力的长效机制。为了“心声音频馆”持续长久地成长,我们按照移动互联的特点做了诸多运营工作。

1. 平台日常运营

为保持平台的稳定和产品的新鲜感,日常的运营主要有以下三项工作:

运营事项具体内容

专题制作每月1~4期专题,兼顾热点和用户喜好推送原则

新作推荐每月推荐2次;确保最新作品最快让读者找到

功能升级每月刷新1次功能补丁;

2. 用户及产品运营

在产品设计时,充分考虑到互联网运营的特点,产品针对用户设计了一系列的功能,旨在解决面向用户的运营问题。常用的运营功能有:页面流量情况统计、访问地域分布情况统计分析、资源点播及下载情况排名等。

表1 页面流量情况统计功能(2014年3月统计数据)

时间总PV流量总访客数日均流量最高日流量

近半年≥460万≥100万14721103924

近1月100745039621935980103924

表2 访问地域分布情况统计分析功能(2014年2月统计数据)

这些功能主要帮助产品开发人员了解产品在页面设计中内在逻辑关联性是否合理,是否需要优化。同时通过近期访问流量及访客数量的统计及对比功能,产品人员能及时掌握“心声音频馆”在全国的用户及其各机构使用情况。

根据数据统计,还能及时发现用户活跃以及不活跃的地域,以便产品人员进行产品改进。

资源点播及下载情况排名有总榜和近期热度榜、分类榜等多个数据维度。这些数据是产品人员长期为各个区域打造地域特色的指向性内容服务提供依据。

图3 资源点播总排名(2014年3月统计数据)

3. 运维服务

(1)指纹辅助登录设备技术服务

专属指纹辅助登录设备,它便于记录用户的真正信息,并且通过用户设备提交的各类语音咨询、意见反馈等,产品服务团队可以点对点地将解决方案及则回复反馈给用户。

(2)开通电话服务热线、邮件及QQ服务

“心声音频馆”同时服务于机构,使得如图书馆这类政府管辖机构,更好地为视障人群服务,“心声音频馆”为用户提供及时电话服务、专属服务邮箱和QQ服务,及时处理各类用户反馈及投诉问题等。

五、小结

“心声音频馆”成为一款适用于移动互联环境下受用户欢迎的数字内容产品。从这个案例来看,数字内容产品开发是一个需要一步一步接近用户个性化需求的产品改进与提升过程。换言之,数字内容产品开发是一个互联网思维下产品开发的过程。“心声音频馆”致力于实现多终端、随时随地使用、最大的声音门户平台的愿景,还需要更精心地持续耕耘和努力。

专业音频 篇5

1 音频信号处理基本概念

1.1 模拟音频与数字化音频

自然的声音是连续变化的,它是一种模拟量。比如当人们对麦克风讲话时,麦克风能根据它周围空气压力的不同变化而输出相应连续变化的电压值,这种变化的电压值是对人讲话声音的一种模拟,称为模拟音频。要将模拟音频变为计算机能存储和处理的对象,必须将模拟音频数字化。

数字化音频的获得是通过每隔一定的时间测一次模拟音频的值并将其数字化,通常包括采样、量化和编码。每秒钟采样的次数称为采样频率。根据采样定理,只要采样频率等于或大于模拟音频信号中最高频率成分的两倍,信息量就不会丢失,即可以由采样后的离散信号不失真地重建原始连续的模拟音频信号,否则就会产生不同程度的失真。采样定律用公式表示为:fs≥2f或Ts≤T/2,其中f为被采样信号的最高频率。

我们将由模拟量转变为数字量的过程称为模-数转换。计算机要利用数字音频信息驱动扬声器发声,还需要将离散的数字量再转变为连续的模拟量,该过程称之为数-模转换。在大多数计算机中,这些功能是通过声卡来完成的。音频信号的一般处理如图1所示。

1.2 数字化音频信号的压缩编码

1.2.1 数字化音频信号压缩编码简介

数字化的音频信号必须经过压缩编码处理才能适应存储和传输要求,才能在再生时得到最好音质的声音听觉。音频信号压缩编码主要依据人耳的听觉特性。人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到,可以不必保留这部分信号;当几个强弱不同的声音同时存在时,强声使弱声难以听到,当声音在不同时间先后发生时,强声使其周围弱声难以听见。声音编码算法就是通过这些特性来去掉冗余数据,从而达到压缩数据的目的。

1.2.2 常见音频压缩编码方式

常见的音频压缩编码有MPEG-1音频压缩编码、MPEG-2音频压缩编码、杜比数字AC-3音频压缩编码等。

1)MPEG-1音频压缩编码

ISO/IEC的MPEG音频编码的标准化采用了2种编码算法:MUSICAM和ASPEC。以这两种算法为基础形成了三个不同层次的音频压缩算法,对应不同的应用要求并具有不同的编码复杂度。在MPEG-1的音频编码标准中,按复杂度规定了三种模式:层1、层2、层3。层1采用MUSICAM算法,典型码流为384kbps,典型码流为256kbps~192kbps。层3是综合了层2和ASPEC的优点提出的混合压缩技术,它的复杂度相对较高,编码不利于实时。如今流行的MP3音乐就是一种采用MPEG-1层3编码的高质量的数字音乐,它能以10倍左右的压缩比降低高保真数字声音的存储量,使一张普通的CD光盘上可以存储大约100首MP3歌曲。层3是MUSICA和ASPEC两个算法的结合,典型码流为64kbps。

MPEG压缩等级与压缩比率如表1所示。

ISO/MPEG音频编码(层3)结构图如图2所示。

MPEG-1层3中采用改进余弦变换MDCT。MDCT的表达式为:,其中(固定时间偏移量)。余弦变换在边界处存在固有的不连续性,导致在块边界处产生较大噪声,MDCT采用时域混叠抵消TDAC技术,有利于消除这种噪声。做MDCT前要进行加窗处理:ω(n)是窗函数,它的长度等于变换块N的长度),从而降低边界效应对谱分析的影响,提高频率选择性。窗函数ω(n)的选择必须满足窗函数越长,编码效率就越高,但是过长会使时域分辨率下降,选择窗函数应该兼顾编码效率和时域分辨率。

PCM数据输入经过分析滤波组被分割成若干子频带信号,同时数据流经过FFT变换模块,动态求出每个编码频带的掩码阈值。MDCT对滤波器组的不足作了一定的补偿,把子带的输出在频域里进一步细分以达到更高的频域分辨率。比例设置和量化器模块根据掩码阈值对子频带信号进行量化,量化后得到的数据分别经过Huffman编码模块和边信号编码器模块进行编码,再经过多路复用器MUX得到码流。

2)MPEG-2音频压缩编码

MPEG-2的音频压缩编码采用与MPEG-1相同的编译码器,层1、层2、层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。

MPEG-2 BC是一种类似MP3的音频压缩算法。MPEG-2 BC压缩编码主要是在MPEG-1和CCIR Rec.755的基础上发展起来的。与MPEG-1相比较,MPEG-2主要在两方面做了重大改进,一是支持多声道声音形式;二是为某些低码率应用场合,进行低采样率扩展。同时,标准规定的码流形式还可与MPEG-1的第1和第2层前、后向兼容,并可依据CCIR Rec.755与双声道、单声道形式的向下兼容,还能够与Dolby Surround形式兼容。

3)杜比数字AC-3音频压缩编码

杜比数字AC-3是美国杜比实验室开发的多声道全频带声音编码系统,采用第三代ATC技术,被称为感觉编码系统,它将特殊的心理音响知识、人耳效应的最新研究成果与先进的数码信号处理技术很好地结合起来,形成了这种数字多声道音频处理技术。它提供的环绕立体声系统由5个(或7个)全频带声道加一个超低音声道组成,所有声道的信息在制作和还原过程中全部数字化,信息损失很少,细节十分丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中被广泛使用。

AC-3编码原理结构图如图3所示。

1.3 声音的重构

模拟音频要经过采样、量化和编码,就能得到便于计算机处理的数字语音信息,如果要重新播放数字化语音,必须经过解码、D/A转换和插值,其中解码是编码的逆过程,又称解压缩。以ISO/MPEG音频解码(层3)为例,结构图如图4所示。D/A转换是将数字量再转换为模拟量便于驱动扬声器发声;而插值是为了弥补在采样过程中引起的语音信2音频播放器简介:

本文中介绍的音频播放器如图6所示,该音频播放器能实现mp3、wav、mid、wma等格式音频文件的播放。

2 音频播放器制作过程简介

2.1 音频播放器制作中所需控件及变量设置介绍

1)所需控件:

TMediaPlayer控件(可以通过MCI播放多种多媒体文件,如MID、MP3、WAV、CD音乐文件和AVI、WMV文件等)、三个TEdit控件(分别显示正在播放文件的时间进度、正在播放文件的信息、重复播放区域的设置)、若干TBitBtn控件(用于对文件进行操作)、TListBox控件(用于显示播放列表)、TTrackBar控件(用于控制播放的音量和播放的进度)、以及TTimer控件和TOpenDialog控件。

2)设置变量(说明:在程序代码中出现的其它变量为控件中的局部变量):

在Form中设置全局变量:

SongDir:array[0..999]of Variant;//播放的文件的路径(不包括播放的文件名)

mode:integer;//播放的模式,是正常播放还是重复播放指定区域

sound_sign:integer;//静音的标志

startpos,endpos:integer;//正常播放时播放的起始位置和结束位置

startpos1,endpos1:integer;//重复播放指定区域的起始位置和结束位置

flag:integer;//暂停的标志

addfileflag:integer;//是否第一次添加播放文件的标志

2.2 音频播放器各功能模块介绍(在此仅介绍较为复杂的功能)

1)文件打开功能模块:该模块的功能是打开若干需要播放的文件,并把这些文件加载到ListBox当中,形成播放列表。若列表框中无任何文件,则直接将打开的文件加载到列表框中;若列表框中已有文件,则将打开的文件与列表框中已有的文件逐个进行比对,判断文件是否已经加载过,若已经加载过,则不加载。在此功能模块中,需要利用数组变量SongDir记录加载进去的文件的路径(不包括文件名),并利用变量addfileflag判断是否为第一次添加播放文件,如果是则自动选中播放列表中的第一首歌曲并显示该文件的信息,同时改变变量addfileflag的值,保证以后添加进去的播放文件不影响正在播放的文件。文件打开功能模块处理流程如图7所示。

2)静音功能模块:该模块的功能是在播放文件时,按下此按钮,则产生静音效果,再次按下时,声音恢复。从而实现静音的功能。实现此功能需要在该模块程序中控制变量sound_sign的变化。该功能是通过Windows API函数waveoutsetvolume来实现,在使用该函数之前,必须引用mmsystem单元。并且为该按钮在静音和非静音时加载不同的图片,从而清楚地显示声音处于何种状态。

3)设置重复播放的开始位置功能,设置重复播放的结束位置功能,清除重复播放区域,播放重复区域功能:

(1)设置重复播放的开始位置主要需要将TrackBar2.Position即播放的当前位置记录在变量startpos1中,并将开始时间点显示在Edit3当中。部分程序代码及说明如下:

startpos1:=TrackBar2.Position;//记录开始位置

Edit3.Text:='重复播放:'+calculate(startpos1)+'->'+'结束点'+'请设置';//显示开始时间点

设置重复播放的结束位置主要需要将TrackBar2.Position即播放的当前位置记录在变量endpos1中,并将结束时间点显示在Edit3当中。部分程序代码及说明如下:

endpos1:=TrackBar2.Position;//记录结束位置

Edit3.Text:='重复播放:'+calculate(startpos1)+'->'+calculate(endpos1);//显示结束时间点

运行时设置好的重复播放区域如图1中A所示。

(2)在显示设置的开始时间点和结束时间点时,需要用到自定义函数calculate(),该函数的功能主要是根据提供的播放进度,将其转换为时间格式的字符串,以方便显示。播放进度是以毫秒(Milliseconds)为计数单位的。输入播放进度,返回字符串类型的时间数。该自定义函数calculate()在后面讲述的歌曲信息的显示以及文件播放时间进度的显示中也有重要的应用。

(3)清除重复播放区域主要需要将变量startpos1、endpos1设置为0,并将播放模式变量mode设置为0,即正常播放模式。

(4)播放重复区域主要用到TMediaPlayer控件的StartPos、EndPos、Position属性以及Play方法。StartPos属性设置为StartPos1,EndPos属性设置为EndPos1,Position属性设置为StartPos1,并将播放模式变量mode设置为1,即重复播放指定区域模式。

3)逐个删除歌曲播放列表中歌曲的功能,全部删除歌曲播放列表中歌曲的功能:

实现逐个删除功能需要判断ListBox1中的歌曲条目是否处于选中状态,如处于选中状态,则调用ListBox1的Delete方法来完成选中歌曲的删除。实现全部删除功能只需要利用ListBox1.Clear即可。

4)歌曲信息的显示功能:

歌曲信息的显示主要是通过调用自定义过程ShowInfo(Sender)来实现的。自定义过程ShowInfo(Sender)主要需要设置TMediaPlayer控件的FileName属性、调用TMediaPlayer控件的Open方法、在窗体的标题栏上显示完整的文件路径、调用自定义函数calculate()在Edit2中显示文件的时间长度及文件名、设置全局变量startpos和endpos的值、设置TrackBar2的min和max属性。歌曲信息的显示如图1中B所示。

5)自动加载历史播放记录功能:

在实际情况中,媒体播放器都是应该有记忆功能的,即保存文件播放列表,在下次打开播放器的时候自动加载该列表。要想实现这一功能,需要在退出程序的时候,将文件播放列表保存到INI文件当中,当再次运行程序时,从INI文件中读取信息即可。在Delphi中提供了TIniFile类用于操作INI文件,该类在inifiles单元文件中,在使用该类文件时,需要引用inifiles单元。

在窗体关闭过程FormClose(FormClose过程需要映射为OnClose)中,需要在该项目生成的可执行文件目录下创建名为———recentplay.ini的文件,用于存放播放列表。并将每首歌曲的文件路径(不包括文件名)、每首歌曲的文件名、播放列表中文件的总数记录在recentplay.ini文件中。保存文件播放列表处理流程如图8所示。

3 结束语

随着经济与科技的飞速发展,促使计算机技术和电子技术的发展突飞猛进。音频信号的处理做为多媒体处理的一个重要分支,已经深入到人们的工作、学习、生活当中。我们根据不同的应用场合或者不同的技术要求,可以采用不同的数字音频压缩编码技术。我们在音频信号处理方面的研究仍待继续深入,提出新的数字音频压缩编码方法或者改进现行的压缩编码方法以适应实际应用的需求。本文中利用应用软件Delphi设计的音频播放器,经过调试和测试,实现各种音频文件的播放和文中所述的各种功能,具有一定实际应用价值。

参考文献

[1]陈洪光,林嘉宇,易波.数字音频压缩技术研究[J].通信技术,2000(2):68-71.

专业音频 篇6

功能手机、智能手机、PDA以及其它许多手机派生产品正在取代许多便携式电子设备的地位。这种功能融合,在减少消费者携带设备数量的同时,扩大对系统的音频要求,并增加了设计人员解决音频难题的负担。

随着音频需求的增加,系统设计人员可以选择使用分立音频功能模块的方法。然而,在混合信号系统中采用这种方法是多线作战。在数字领域,提供多种采样率、格式和数字式电平会使复杂性呈指数级增长。在模拟领域,信号偏置于不同的电平水准,同时需要混合和切换、放大和衰减,且容易拾取噪音。事实上,目前便携式媒体设备具有10~20条不同的音频信号路径非常普遍。在这种迷宫中找到一条道路是一项艰巨的任务。混合信号子系统通过集成多种有效要素,帮助解决这类问题。

信号路由

混合信号子系统的最显著的特点是它能够将许多信号路由到多个地方。凭借使用路由信号,便携式媒体设备或手机能够执行许多任务。混合信号音频子系统的示例如图1所示。

例如,考虑一个同时具备手机和数字音频播放器功能的系统。来自手机基带的脉冲编码调制 (PCM) 数字信号需要连接到数模转换器 (DAC) ,继而连接到耳机放大器供耳机使用。同一耳机放大器也适用于数字音频播放器,这是一个I2S数据流,通过DAC播放然后连接到耳机。具有双数字音频端口的混合信号子系统可以轻松完成此任务。

具备多路复用能力的混合信号音频子系统的另一个优点是能够处理模拟FM收音机信号。虽然调频收音机信号电平通常是受到控制的,但它们常常超出规格。这些超出规格的电平通常比预期大得多,这可能会导致扬声器损坏。混合信号音频子系统可以将FM信号数字化,使用DSP从而提供自动电平控制 (ALC) 和均衡,然后转换回模拟信号以便放大给扬声器或耳机。此外,混合信号子系统可以将数字化的信号传递给基带处理器,以便进行更多DSP处理。

除了音频路由和处理之外,混合信号子系统还可以混合多个音频流。通过将来自麦克风的信号混合到耳机中,由此产生侧音。同样,可以在听音乐的同时播放铃声,而无需使音乐静音。

拥有两个数字音频端口可以使混合信号音频子系统成为在系统内连接数字音频的强大工具。例如,I2S数字音频流可转换为PCM并发送到基带。或者,可以使用相同方法将48k Hz的I2S接口数据流转换为44.1k Hz信号。

受益于双数字音频端口和采样率转换的一种应用是蓝牙桥。混合信号音频子系统提供从蓝牙收发器到基带的连接桥。如果需要,可以执行采样率转换,以及数字均衡。这种连接的示例如图2所示。

通过混合信号音频子系统连接到蓝牙收发器使许多案例成为可能。显然, 电话机能够处理双向语音。蓝牙收到的音频信号能够发送到扬声器或耳机中。FM收音机信号在混合信号子系统中进行数字化并发送到蓝牙耳机。基带处理器可以将来自闪存的数字音频通过混合信号子系统发送到耳机或放大器, 如具有蓝牙功能且能够帮助实现汽车中立体声效果的扩充口或耳机。

D类输出功率

D类扬声器放大器凭借其高效率正在成为智能手机和多功能手机的业界标准。D类放大器的优势在于输出功率。高输出功率的D类放大器能够实现手机扬声器达到响亮清晰的水准。在环境噪音较大的区域 (如火车站和机场) ,通常需要迅速分辨铃声。

功能手机或智能手机也常常用于媒体资源共享。比如,与朋友分享一首歌或与同事共享信息。

混合信号音频子系统拥有高功率的D类放大器。例如,LM49352通常可用4.2V信号将970mW传递到8Ω负载,总谐波失真及噪音 (THD+N) 仅为1%。这样出众的输出功率确保在较高的音量水平下清晰传递消息。

一项最新应用在手机中的功能是微型投影仪。微型投影仪在高输出功率标准下,可以实现与一群人共享视频。

PSRR

移动电话凭借开关模式电源 (SMPS) 高效提供多种电源电压。除了SMPS电源产出高频噪音之外,手机本身也会借助RF功率放大器 (PA) 循环供电。这种PA循环频率发生在音频频带中,通常为217Hz。

所有这些噪音源会降低手机的音频质量,有时会非常严重。混合信号音频子系统中一个最主要的特性是对这些噪音具有高抵抗力。混合信号音频子系统的电源抑制比 (PSRR) 可达90dB或更高,最大限度地减少了这些来源导致的任何噪音。例如,混合信号音频子系统LM49350的耳机放大器的PSRR测试结果表明,该器件在217Hz时的PSRR为95dB,且在较高频率区域的保持高音频质量。

高P S R R对系统具有巨大的价值。混合信号音频子系统的模拟电源可以直接连接到电池,源自SMPS的数字电源可用于产生其它数字核心电压。由于混合信号音频子系统本身能抑制噪音,因此不需要额外的低压降稳压器 (LDO) 或被动式滤波器来消除噪音。

单独的耳机电源

几乎所有便携式媒体设备具有的通用功能是其立体声耳机连接。与耳机的连接一般采用标准的3.5mm插孔、专用连接器或迷你USB接口的变形。在所有这些情况下,耳机阻抗通常约为32Ω。一个充电泵产生负电压的真正接地的耳机放大器,只需施加1V电压到32Ω负载,即可提供16mW的功率。对大多数用户来说,16mW已非常响亮,所以实际所需的电压要低得多。

因为耳机放大器是下转68上接64AB类,所以单独及较低电源电压的耳机需要具备显著的功率优势。在图3中,两条曲线显示具有AB类输出的单通道理想放大器。只需将耳机电源从3.3V降低到1.8V,即可节省能耗45%。虽然D类放大器在理论上将节省更多能源,但它需要体积较大且比较昂贵的LC输出滤波器。而且,未知的耳机线长度和负载阻抗也会使滤波器的设计变得非常困难。

高SNR数据转换器

高性能的数据转换器是使几何处理技术水平日益下降的一个因素。遗憾的是,手机中的基带IC凭借先进的处理技术,可以在最小尺寸和最低功耗水平下提供较高的性能。虽然它实现了这些优点,但是在基带DAC和ADC中维持较高的信噪比 (SNR) 变得越来越难。

手机的多功能融合加剧了这种性能的下降。如果它们只是用作手机,就没有太大的问题。然而,对许多人来说,手机也是他们的便携式音乐播放器。这使信噪比要求特别是在使用高品质耳机的时候,从电信质量提高到高保真。

有人可能会提出异议,认为S N R超过9 0 d B将造成浪费,但实际上这是不正确的。的确,绝大多数音频便携式媒体设备起源于CD音质 (44.1kHz采样,16位分辨率) ,且使用MP3之类的算法压缩至更低的分辨率和保真度。然而,对于正常听力水平,大多数耳机对2mW左右的功率具有足够的灵敏度。针对SNR设定的标准是40mW或更高的满载输出,因此设计人员只损失了大约26dB SNR。

由数模转换移出基带的另外一个优点是可以让DAC更贴近负载。与模拟信号相比,数字信号具有更高的抗噪能力。混合信号子系统消除了从基带DAC到外部放大器的布线,从而消除了这种噪音来源。

结语

与分立电路模块实现方法相比,混合信号音频子系统具备许多无法比拟的优势。这些优势包括:节省空间、降低功耗、增加功能和提高性能。随着市场上消费者对多种功能需求的日益增加,系统设计人员通过采用混合信号音频子系统能够节省大量时间。

摘要:个人移动设备中的音频系统能够将多种功能集成为一体, 不过由于选择众多, 满足这些需求比较困难。一种有效的解决方案是使用音频子系统, 该子系统可以使系统便捷互连并且提供出色的音频性能。性能改善的主要领域是扬声器的输出功率、电源抑制和高动态范围编解码器。

关键词:混合信号,音频,子系统,便携式,路由

参考文献

[1]National Semiconductor Extends Family of Low-Power, Premium Quality Audio Subsystems for Handheld Devices[R/OL]. (2009-3-31) .http://www.national.com/news/item/0, 1735, 1390, 00.html

[2]Guy J.Class D Amplifier[R/OL]. (2008-12) .http://www.national.com/vcm/NSC_Content/Files/en_US/Audio/ClassDAmplifierFAQ.pdf

[3]Guy J.Headphone Amplifiers:Choose the right topology for your application[R/OL]. (2008-2) .http://www.audiodesignline.com/howto/206503144

[4]Boyce K.Cellular Handset Audio Evolution pt2[R/OL]. (2005-9) .http://www.audiodesignline.com/showArticle.jhtml articleID=169400984

音频文件处理方法 篇7

一、Gold Wave软件界面介绍

这一款软件的安装过程很简单。安装时直接运行安装文件,下面介绍Gold Wave的界面。

1、软件主界面

安装完成后,双击快捷图标,打开Gold Wave界面,如图1所示。

进入Gold Wave时,窗口是空白的,而且Gold Wave窗口上的大多数按钮、菜单均不能使用,需要先建立一个新的声音文件或打开一个声音文件。Gold Wave窗口右下方的小窗口是设备控制窗口。

2、设备控制窗口

设备控制窗口的作用是播放声音以及录制声音,窗口各部分的作用如图2所示。

二、使用Gold Wave剪切音频

在办公活动中,比如在PPT演示文稿中经常需要插入音频文件,有时不需要整个音频,而是需要歌曲或乐曲的一个片断;再比如手机铃声的制作,只需要一首歌曲的高潮部分,此类情形用Gold Wave来操作非常方便。

步骤1:启动Gold Wave,在如图1中点击“打开”按钮,选择需要编辑的mp3格式的音乐文件,将选择的mp3文件载入到Gold Wave中。

步骤2:载入mp3文件后的Gold Wave,在图3中可以看到,中间(绿色和红色)波形代表mp3文件,几个工具按钮功能说明如下:

●撤消:当编辑mp3文件时,不小心操作失误,按这个可以返回上一步操作。

●重复:如果执行了“撤消”操作后,发现刚才做的操作是正确的,无须撤消,就可以用这个操作。

●删除:将选中的部分删除掉。

●剪裁:这个操作将是本例重点要用到的操作。

●选示:显示mp3所有波形。

●全选:同上选示。

●绿色播放按钮:从mp3最开始播放。

●黄色播放按钮:从选择区域播放。

步骤3:按住鼠标左键,在mp3波形区域选择歌曲的高潮部分(按绿色播放按钮听一遍记下高潮部分位置),然后按黄色的播放按钮试听一下所选区域是否满意。如果不满意,可以将鼠标试到所选区域边上的青色线上调整一下所选区域(参考图4、图5)。

步骤4:选择好所剪裁的区域后,然后点击“剪裁”即可将刚才选择的区域剪裁下来。然后点击菜单“文件”-“另存为…”给音频文件取个名字。这样一首只包括片断的mp3音乐就剪切好了。

三、使用Gold Wave合并音频

1、启动Gold Wave;

2、在图6中执行“工具”—“文件合并器”命令,在图7中依次添加需要合并的文件,若需要改变文件的顺序,可以通过直接拖动文件名的方式进行调整。右侧的采样率可以选择,也可以使用默认,它影响文件的大小和音质;

3、单击“合并”按钮,在弹出的对话框中输入保存的新文件名即可。

四、使用Gold Wave调整音量

用Gold Wave修改mp3格式的声音大小有几种方法可以达到相同效果。

方法1:

步骤1:用Gold Wave打开需要修改音量的mp3文件

步骤2;点击菜单“效果”-“音量”-“更改音量…”用鼠标拖动音量上面的滑动块就可以修改音量。建议后面的数值不要超过10,如图8。修改过程中可以按上面的绿色播放按钮试听。修改好后点确定就完成了mp3音量的增大。

方法2:

步骤1:用Gold Wave打开需要增加音量的mp3文件

步骤2:点击菜单“效果”-“动态”在“预置”里选择“巨响”即可很快修改mp3音量大小。推荐使用“放大明亮度”,如图9。

方法3:

步骤1:用Gold Wave打开需要修改音量的mp3文件

步骤2:选择菜单“效果”-“滤波器”-“均衡器…”移动滑动块,数值越高代表调整的音量越高,如图10。

摘要:在现代化数字化办公事务中,办公人员经常会使用音频文件。本文介绍用GoldWave软件进行音频剪切、合并及调整音频音量方法。

关键词:办公自动化,音频处理,剪切,合并,音量调整

参考文献

[1]缪亮.计算机常用工具软件[M].北京:清华大学出版社,2009.

[2]庄洪林等.常用工具软件应用[M].北京:清华大家出版社,2011.

音频技术的新发展 篇8

会议系统根据各行各业不同的使用需求不断推陈出新,例如:目前,会议系统中增加了很多智能控制系统,并可根据逻辑关系进行联动编程,达到智能控制、一键切换。同时,随着人工智能技术的迅速发展,智能语音技术已在各行业领域得到广泛应用,智能控制系统直接由语音来控制,更加方便、简单、快速,从而可实现自适应语控智能会议系统。如今,“自适应语控智能会议系统”第一个样板将在科大讯飞公司建成,其凭借领先的会议系统设计理念和一站式解决方案得到业界关注。

本期以“音频技术的新发展”为主题,介绍了“自适应语控智能会议系统”的研究,先进的声音控制和传输技术、精品产品及改造效果良好的工程项目,如:SSA音频功率放大新技术、智能语音技术、数字网络技术及超薄平板阵列音箱等,旨在为智能会议室的建设提供参考和借鉴。由此还可以看到会议系统业界人士的不懈努力、勇于创新的精神。

便携音频DAC 篇9

Fraser Macdonald为你讲解为什么便携DAC是你在移动状态下获得高质音乐的关键。

电脑和智能手机就像唱片之于黄金年代的立体声一样,是现代Hi-Fi(高保真音响)的基石,是数字音乐革命的基础。但话要说回来,它们依然只是电脑和手机——因此比起像立体声音响那样的专业音乐播放设备来,音质方面无疑是要做妥协的。

这并不是说它们毫无希望。在你的内容方面猛下功夫,逐步改善,哪怕使用现在特别便宜的电脑或者手机,你也可能获得理想的音质。甚至真的并不需要花多大功夫:采用无损或者未压缩格式存储你的音乐,然后使用精确转录的纠错软件,如Max(支持Mac)或者EAC(PC),你会见到立竿见影的音质提升效果。如果你想有更大的惊喜,高分辨率的音乐文件——24位/96千赫或者24位/192千赫品质——将会把你的数字音乐欣赏带入更高的境界。

但在这一链条中依然存在一个薄弱点:你笔记本电脑的声卡或者智能手机的DAC(数模转换器)。在家的话这不成什么问题,你可以将乐曲放进高端流媒体播放器或者外置的DAC上,可如果你在火车上听音乐该怎么办呢?

嗯,如果你意识到这一问题的话,可以购置一个便携DAC。是的,它会让你听音乐的时候平添一点麻烦,但是音质的回馈非常值得。只需把你的DAC通过USB接口插入你的电脑或者便携音乐播放器,在设备上的3.5毫米输入插孔中接上你的耳机,你就可以仰坐着聆听升级版的音乐旋律了。你甚至根本不会注意到某个超小元件的存在,例如AudioQuest DragonFly——直到你第一次播放乐曲的时候。结果怎样?你听到的大为改善的声音是那么清晰、细节丰富,那么充满活力又广阔无垠……另外,你的耳机越好,你感受到的音质改善效果就越好。

听起来不错?确实如此。此外,来自其他着迷DAC的同伴会意的点头微笑,以及来自以为你同时在听两台MP3播放器的人们疑惑不解的表情,会让你更加得意。当然,大多数USB DAC也能连接你家里的高保真音响设备,所以你可以花一个设备的钱让两个装备获得音质提升。如今的极客们理应知道这些技巧。

Fiio e17 Alpen + AKGK 451

约950元 + 约760元 | fiil.com.cn + uk.akg.com

Fiio的耳机放大器和USB DAC做工都颇精美,附带一个内置显示器,调换音源非常方便。电池充足电后能持续使用八小时。声音方面,E17能通过USB支持最高24位/96千赫的文件,同AKG的K451耳机搭配使用很是理想。这副便携耳机播放低比特率音乐时效果还过得去,而播放更高质量文件时则显示了深厚实力,为潜在的音频鉴赏家们提供了便宜的、面面俱到的基础性解决方案。

Audio Quest Dragon Fly + Philips Fidelio M1

约2040元 + 约1500元 | audioquest.co + Philips.com

DragonFly是USB DAC中最便利的。它与U盘差不多大,却搭载了24位ESS Sabre DAC,这通常见于高端蓝光播放器中。它支持异步传送,播放高达24位/96千赫的文件效果很好,并且DragonFly的Logo会以不同颜色亮起,指示当下的采样频率。配上优质的Fidelio M1耳机,你能得到近乎完美的配置:舒服的M1耳机声音紧致,高音精炼,低音形象、有力,足以完美演绎任何音乐。

Furutech ADL Cruise + AKG K3003i + Vertere Pluse D-Fi USB线

约4400元 + 约9470元 + 约660元 | furutech.com + ukakg.com + vertereacoustics.com

Cruise是美的体现。富于曲线美的碳纤维和毫无瑕疵的钢质密封盖使它超凡出众,内置一块可让你持续听80个小时的电池,还有表现音乐的令人难以置信的清晰度——它有这么多优点,值得为它配上一根超级纯净、超级兼容的Vertere USB线,从而提升更佳音质的传送水平。Cruise拥有强大的扩大器,与像AKG K300is这样的高端耳机搭配使用会有出色效果。将它们用在iPhone上是一种浪费,但是若同DAC搭配,它们就会焕发出勃勃活力。

DAC

数模转换器,能够将一系列二进制码解开,并把信号翻译成模拟声音输出。

24位

CD质量的文件为16位、44.1千赫采样率。24位/96千赫高分辨率文件能提供多得多的数据,音质也好得多,至于极稀有的24位/192千赫文件则是高保真发烧友心中的圣杯。

异步传送

DAC超越电脑的数据“时钟”,掌控音频传送过程,从而减少数字计时的错误。

无损编码

如果你想证明DAC的意义,这是音频存储的最低标准。

音乐的耳朵:寻找高分辨率音乐下载地

Qobuz

Qobuz.com

这个法国网站的声音大餐包含CD品质的无损音乐下载和24位音乐专辑杰作。它在其他不少国家受到限制,不过给他们的客服发一封邮件也许就能起作用。

Bandcamp

Bandcamp.com

直接从高保真品质的音源中获取你的音乐吧,这个商店拥有真正的独立音乐家的作品。除了320kbps MP3音乐以外,它还提供无损FLAC音乐,以及一个名为“发现”的部分,让你比别人抢先发现潜在的音乐天才。

Internet Archive

Archive.org/details/etree

这个非盈利的网站以“永远的音乐档案库”为主旨,将音乐会录音这份无价之宝以FLAC格式存放以供下载,它的目录并不完整,但拥有Grateful Dead和Ryan Adams这样的珍稀品种。

Pono

Mypono.com

数字音频信号接口技术 篇10

在采用电缆连接不同的电视设备传输数字音频信号时, 有两种接口类型。第一种双绞线的平衡方式传输信号, 电缆连接头是XLR型, 由AES/EBU (Audio Engineering Society即美国音频工程协会和European Broadcast Union即欧洲广播联盟) 规定;第二种是使用同轴电缆的非平衡方式传输信号, 电缆连接头是BNC型, 由SMPTE 276M建议规定。

我国广电总局行业标准GY/T 158-2000《演播室数字音频信号接口》 (Digital audio signal interface for broadcasting studios) 是参照AES/EBU标准制定的。

1 数字音频接口

1.1 AES/EBU数字音频接口

如图所示为一个AES/EBU编码器对数据样值进行编码的简单框图 (图1)。

AES/EBU数字音频接口标准时传输和接收数字音频信号的数字设备接口协议。标准中规定, 音频数据必须以2的补码编码, 传输介质是电缆, 在串行传输16bit-20bit的并行字节时先传输最低有效位, 必须加入字节时钟标志以表明每个样值的开始, 最后的数据流为双相标志码编码等。

1.2 接口信号格式

接口可以对取样频率为48Khz, 44Khz和32Khz, 量化比特数位24, 20, 16的数字音频信号进行实时传输, 并能提供辅助信息, 这些辅助信息可以向接收端提供所传输数据的各种重要参数, 如误码检测和同步信息等。

2 数字音频数据的结构

2.1 数字音频数据的帧结构

一个音频帧包括两个32比特的子帧 (子帧1和子帧2) , 一个子帧只包括一个音频声道的一个样值数据:20比特同步数据和4个附加比特。如 (图2) 所示。

4个附加比特:

有效比特 (V) :样值数据是音频且可进行D/A转换, 则此比特置0。否则样值有问题, 接收设备将输出静音。

用户比特 (U) :送至一个28×8bit的存储器。一个音频块中每个声道有192个子帧, 因而该存储器中有192个用户比特。

通道比特 (C) :送到一个28×8bit的通道状态存储器。此比特对于音频数据内容的标识非常重要。

通道状态存储器描述了在AES/EBU数据流通道中比特分配及其含义。例如的字节0的比特0表示是家用级还是专业级, 如果通道用于消费, 字节0中比特0置0;用于专业时置1。

奇偶校验比特 (P) :通常为偶校验。偶校验确保在一个子帧的64个双相标志码元中1的数目是偶数。奇偶校验比特可以检测在传输中发生的奇数个错误。一些设备忽略此比特或者没有正确地处理这种标识。

2.2 数字音频的块结构 (Block Structure)

每192个音频帧构成一个块。在数据流中用标志符Z标识每个块的开始。在一个48kHz抽样的系统中每个音频帧的时间是20.83s。一个AES/EBU块的时间为20.83s×192=4000s。

三种4比特的同步数据的意义:Z:表示每个音频块第一帧的开始。X:表示一个块内其余每帧的开始。Y:表示每个帧的子帧2开始。

这些同步数据长度均为4比特, 与子帧中其它数据结构不同, 不用双相标志码编码。

3 AES/EBU数据特性

抽样频率为48Khz时总数据率为32×2×48000=3.072Mbps。在双相标志码编码后, 数据传输率提高到两倍为6.144Mbps。双相标志码的频谱能量在6.144MHz的倍频处为0。

同步字包括三个低单元和随之而来的三个连续的高单元。在AES/EBU信号频谱中占据一个低的基频, 3.072/3=1.024MHz。

每个音频帧包括64bit, 每20.83s发出一帧。帧中的一个数据比特持续时间为325.5ns, 一个双相标志码比特单元时间为163ns。由一些数据流比特叠加产生的眼图眼宽时间为163ns

3.1 通道编码

为了减少传输线上的直流分量, 利于数据流中恢复时钟, 并使接口不易受连接极性的影响, 每个子帧32个bit的后28个bit (4~31) 采用双标志编码。双标志编码的编码特点是在码元“0”或“1”的边沿都有电平跳变, 而对于码元“1”, 在每个比特周期的中央又有一次跳变, 这种码的数据信号内没有直流分量, 因而可用变压器耦合, 而且不怕相位反转, 有容易从输入数据流中根据跳变提取时钟。

3.2 前置码

前置码是个特定的格式, 用于子帧、帧和块的同步和识别。

为了能够在一个取样周期内实现同步, 并使这种处理完全可靠, 前置码采用与双相位标志码不同的规则, 从而避免出现与前置码相似的数据状态。

有三种前置码, 前置码分配在每个子帧的前4个比特传输, 并用8个连续的状态表示。前置码的第一个状态总是不同与前一个比特 (奇偶校验比特) 的第二个状态。根据这个状态限定方法, 前置码如 (表1) 。

4 平衡传输接口电特性

连接电缆应采用屏蔽层的平衡电缆, 在0.1MHZ~6.0MHZ频率上电缆标称特性阻抗为110欧姆。从结构上看, 接插件使用了常见的XLR型接插件。平衡信号由平衡的双绞线和带屏蔽层的传声器型电缆传送。输入和输出都规定为变压器耦合, 而且不接地。双绞线特性阻抗为110欧姆, 发收两端必须有110欧姆匹配电阻。这种连接的电缆长度可达到100米, 不致对信号造成过分的劣化。

AES/EBU专业格式接口特性如(表5) :

5 数字音频嵌入数字视频频数据流

数字音频数据可以嵌入数字音频SDI流得每一行的HBI (行逆程) 中的辅助数据空间中传送。对于如何将音频和视频在同一条信号中传输, ITU-R BT.1305号建议书对此作出了规定。我国广电总局的行业标准GY/T 161—2000《数字电视附属数据空间内数字音频和辅助数据的传输规范》等效采用了ITU-R BT.1305号建议书。

按HBI计算, 一行中可容纳的辅助数据为:144-8-6=130B或1040bit (按8bit计算)

公式中的8B为EAV和SAV占用, 6B为紧随EAV之后固定的定时基准码占用。由此可以计算出数字视频HBI期间可以传送的辅助数据码率为:1040×625×25=16.25Mbit/s

由于一路立体声的码率为:48000×20×2=1.92Mbit/s

由此可以计算出在数字视频SDI流最多可以嵌入8路无压缩的数字立体声音频信号。

标准规定, 除了第7, 320, 5, 318行外, 音频数据可以出现在大多数行的HBI期间, 并应在整个帧内平均分布。当一路48khz取样的音频信号嵌入一帧内时, 相当于H B I内传送该路声音的4 8 0 0 0/15625=3.072个样值, 具体是在多数行内传3个样值, 在少数行内传4个样值。

6 其他接口协议格式

除了占极大优势地位的AES/EBU协议外, 其他3种接口格式也被广泛使用, 他们是MADI (多通道音频数字互联) 、SDIF2 (SONY数字接口格式) 和SPDIF (SONY Philips数字接口) 。

6.1 MADI格式

MADI格式在标准文件《AES 10-1991》中规定。它可以容纳直到56个符合AES3-1992标准的32位信号。最初开发的MADI是作为点对点操作系统, 用以将多道录音机到数字音频控制台或处理。其他的应用包括数字路径选择系统和演播室之间的互联。

MADI信号可以容易地转换为AES/EBU子帧, 因为只有开始的前4位不同。56个子帧被串行化以组成MADI帧, 然后4/5方案编码, 该方案在串行数据流中采用4位的组并通过检查表将其转换为5位字, 这样可以减少编码数据的直流含量。于是每个编码的子帧的长度为32+8=40位。使用±12.5%的可能变化支持32~48KHz的抽样频率, 这样可以允许对录音机进行变换操作。数据传输率则被固定为125Mbit/s, 用以为编码数据流提供足够的带宽 (56通道×40位48KHz×1.125=121Mbit/s) 。

传输介质可以使宽带宽的同轴电缆 (长达50m) 或光纤链路 (超过50m) 。

6.2 SDIF2格式

这种格式是由Sony开发的, 用于专业和半专业的原版片制作和记录。它用于互连44.1KHzK和48KHz的单通道链路, 并且由32比特长的音频字组成。开始的20bit专留作音频样本值。紧接的9bit用于创建控制字, 剩余的3bit将同步信息添加到32bit字。控制字提供有关预加重、正常音频或非音频数据、禁止复制、SDIF音频块同步信息 (每256音频字) 和用户数据信息的音频通道信息。

传输介质为75欧姆同轴电缆, 在晶体管-晶体管逻辑 (TTL) 电平上工作且数据传输速率为1.54Mbit/s。它是点对点操作互连系统。需要3条同轴电缆分别用于传送左通道数据、右通道数据和字时钟信号。

6.3 SPDIF格式

这种格式是一家厂商的专利商品名, 用于AES/EBU格式协议的消费者模式。开发这种格式用于在半专业和消费者设备间进行数字音频数据的串行传输。在AES3专业模式和AES3消耗模式设备之间需要有格式转换器 (用于数据和电平转换) 。

参考文献

[1]李栋.数字声音广播[M].北京广播学院出版社, 2001.

[2]曹志刚, 钱亚生.现代通信原理[M].清华大学出版社, 1992.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【专业音频】相关文章:

音频资源05-16

音频管理06-03

音频嵌入07-02

传媒音频范文05-16

音频励志演讲04-15

音频信息隐藏05-11

实时音频采集05-17

音频切换矩阵06-01

音频内容认证06-03

音频比对系统06-15

上一篇:新生代农民工的渴望下一篇:分析预测系统