标准编码

2024-06-09

标准编码(精选八篇)

标准编码 篇1

关键词:H.26x,MPEG,混合编码,可伸缩编码,多视点视频编码

0 引言

在计算机中以位图记录、处理和保存图像,其特点在于适合表现大量的图像细节,很好地反映明暗的变化、复杂的场景和颜色,逼真地表现图像的效果。但是位图图像在缩放时会降低图像质量,若不压缩处理其庞大的数据信息在文件存储及有限带宽传输中多有不便,因此迫切需要一种可靠有效的方法对数据进行压缩处理。

图像数据压缩技术的基本思想就是删除原始图像中因视觉图像数据存在各种形式的相关性带来的数据冗余或是不需要的信息,保留不确定的信息,去掉确定的信息,用尽可能少的数据量来表达尽可能完整的图像信息。根据图像编码压缩过程中是否存在信息丢失可分为无损编码压缩算法和有损编码压缩算法。

基于统计特性的运动补偿结合变换编码的混合编码框架在数据压缩方面取得了很大的成功,国内外的通用视频压缩标准大多基于此框架,比如H.26x系列、MPEG系列以及我国的AVS1-P2标准。在文献[1]中,将混合编码归类于有损编码压缩方法,如图一所示。

1 基于混合编码的数字图像编码标准

1.1 H.26x系列编码标准

H.26x系列标准[2]最早起始于1984年,并且在1989年完成第一个标准———H.261,这是ITU-T针对视频电话和可视会议而制定的标准。H.261主要采取16×16子块的运动补偿、8×8 DCT、标量量化、Z-Z扫描、行程编码和变长编码的编码结构,虽然只能支持CIF和QCIF两种图像格式,但它适应了有限的硬件和软件处理器性能,获得了里程碑式的成功,此混合编码方法和编码结构也在之后的编码标准中得到沿袭。然而,它的缺点是低压缩比和缺乏灵活性。

在1995年制定的H.263标准中,使用了半像素运动矢量和重新设计的可变长编码表,并且编码模式的可选择性使其应用更加灵活。与H.261相比较大地提高了编码性能,支持多种格式的图像。

H.264/AVC标准是ITU-T的视频编码专家组联合MPEG共同开发的一个新的数字视频编码标准。它主要采取帧间预测编码和帧间变换编码的混合编码方式,并且采用可变尺寸的运动估计、4×4块的整数变换、统一的可变长编码表、多种帧内预测等技术,因此具有更高的数据压缩比和更好的信道适应性。在网络传输过程中所需要的带宽更少,也更加经济。

1.2 MPEG系列编码标准

H.26x系列标准主要针对多媒体通信而制定,而MPEG系列标准[3]多为数字电视采用。MPEG-1沿袭了H.261标准的编码结构,采用缩减时间冗余度的16×16子块的运动补偿及减少空间冗余度的DCT两个基础技术,平均压缩比可达到50:1,码率可达到1.5Mbps。

MPEG-1针对CD-ROM制定,而MPEG-2则较大地提高了码率,支持高低四种级别的分辨率格式,并且在系统和传送方面作了更加详细的规定和进一步的完善,它特别适用于广播级的数字电视的编码和传送。

MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准。MPEG-4标准具有基于内容的交互性、高效的压缩性、互联网视音频广播等广泛应用性的众多独特的优点。

1.3 AVS编码标准

AVS标准[4]是我国于2002年开始制定的、第一个具有自主知识产权、达到国际先进水平的数字音视频编解码标准,是高清晰度数字电视、高清晰度激光视盘机、网络电视、视频通信等重大音视频应用所共同采用的基础性标准。其中AVS1-P2部分主要针对高清晰数字电视广播和高密度存储媒体应用,采用混合编码的方法,应用了8×8整数变换量化、帧内预测、帧间预测运动补偿、1/4精度像素插值、二维熵编码等核心技术。因此在编码效率上与H.264/AVC相当,但在算法复杂度上明显占优,对硬件和带宽的需求也较低,并且这是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系。

混合编码技术以运动补偿、预测编码、变换编码以及熵编码等编码为框架,采用整数变换量化、多种帧内预测、多参考帧运动补偿、1/4精度像素插值和基于上下文的熵编码等技术,在数据压缩方面取得了很大的成果。但是随着计算机网络的不断发展和应用需求的多样化,视频编码技术的研究逐渐摆脱压缩特性的局限,渐渐向网络适应性和用户交互性等方面倾斜,以此特性为特点的可伸缩编码、多视点视频编码得到了越来越多的关注。

2 可伸缩视频编码

可伸缩视频编码(Scalable Video Coding,SVC)[5]技术考虑了更多的网络适应性和灵活性,作为H.264/AVC的扩展集方案,实现了时域、空域和质量/信噪比等三个维度上的可伸缩性,可以让视频编码器提供既有较高压缩率、又有良好的伸缩性和容错性的视频码流,适用于不同的网络环境和用户的需求。编码器分别通过空域滤波和时域分解形成不同空域及时域分辨率的图像序列,然后按不同时域分辨率进行基本层编码,再在每一基本层上进行精细编码形成SNR增强层。图二是一个具有两个空域层的编码器。

时域的可伸缩,每个空间层通过时域分解来实现时域的可伸缩性[6]。在H.264/AVC扩展集方案中,是通过层级B帧图像实现的。图三所描述的GOP为8,以相邻帧为参考帧的3级时域分解B帧图像编码结构。首先以I帧或P帧的模式编码,第0帧和第8帧作为关键帧,其余以B帧模式进行编码。先编码第4帧,然后编码第2、6帧,最后编码第1、3、5、7帧,通过这样的金字塔式的编码顺序实现了时间的分级。

空域的可伸缩性,为了满足不同用户的需求,将原始尺寸的输入视频序列进行下采样,在给定帧的基础上产生较低的空域分辨率码流序列,每个空域分辨率在各自独立的层内编码。为了去除各空间层之间的冗余信息,采用了层间预测。由于低层是由高层通过下采样得到的,因此在相同的时域分辨率情况下,高层帧和与之相对应的低层帧之间存在着一定的相关性,通过对低层帧的纹理信息和运动信息进行插值来作为高层帧的预测参考信息,可以去除层间冗余信息。

质量/信噪比(SNR)可伸缩性,在SNR可伸缩技术中[7],使用传统的混合编码技术,经过整数变换、量化和编码得到基本层。增强层位于基本层之上,它是由基本层和原始子带图像之间的残差信息经过变换和量化而来,不同的是采用渐进细化(progressive refinement)的纹理编码方法,使用较小的量化步长进行重新量化来减小量化误差,从而生成精细度由大到小的SNR增强层。最后基本层系数和增强层系数再使用位平面编码和行程编码相结合的方式进行熵编码,分别形成基本层码流和增强层码流输出。

此外,在时域的可伸缩技术上,有一种混合框架结合MCTF(基于运动补偿的时间滤波)技术具有一定的优势,能获得较高的编码效率和较好的兼容效果。

3 多视点视频编码

多视点视频(Multi-view Video)是针对交互式媒体提出的,它主要解决3D交互视频的表现、交互以及存储、传输等。其通过在场景中放置多台摄像机,记录下多个视点数据,提供给用户以视点选择和场景漫游的交互能力。然而多视点则必然引起多倍的数据量,因此多视点视频编码成为多视点视频应用迫切需要解决的问题之一,而高效的编码、灵活的视点切换机制以及降低视点切换所导致的解码代价是多视点视频编码的价值所在。

实现多视点视频编码(MVC)可以基于传统混合编码框架,也可基于小波编码以及分布式编码等新一代视频编码工具。视点间相关性是多视点视频序列的重要特性,因此编码中的一个重要问题是如何消除多视点画面由于其内在的相关性而引起的数据冗余,而且不仅是空间上的,还有时间上的冗余。

目前存在着多种MVC方案[8]:Simulcast编码结构,该结构在H.264/AVC视频编码标准的基础上实现多视点视频编码框架,方案对各视点视频独立编码,但是没有考虑视点间的相关性,编码效率较低;Sequential View Prediction编码结构,该结构在率失真性能和计算复杂度方面有一定优势;Multi-direction Prediction编码结构对于视点间相关性较高的视频序列有着较为优越的编码效率,该方案更适合稠密相机拍摄的视频序列;Group-of-GOP(GoGOP)Prediction编码结构更适合随机访问,视点切换,但是在其他方面稍逊一筹。

文献[9]提出一种面向交互应用的多视点视频编码方案,在Simulcast的基础上,通过修改GOP结构将顺序帧间预测方式改变为所有的P帧均以I帧作为参考帧进行预测编码,使I帧成为GOP内唯一的参考帧,从而消除帧间相关性,提高交互性能;将视点内与视点间预测编码结合起来,预测帧可将本视点及其它视点帧作为参考帧,同时在空间和时间上进行预测编码,形成Sequential View Prediction编码结构,在时间预测编码的基础上,引入空间预测,同时降低时间和空间上的冗余,从而提高压缩效率。该方案改善了系统的交互性能,同时提高压缩效率和降低了视点切换引起的解码代价,满足交互式多视点视频的应用需求。其缺陷是修改GOP结构不适用于运动剧烈的场景,因为GOP结构中P帧和I帧距离较大时容易引起预测误差的增大,导致压缩效率下降。

4 结束语

视频编码技术是视频产业的关键技术。计算机网络的不断发展和应用需求的多样化要求视频编码技术一方面继续以混合编码为框架研究如何进一步提高压缩特性,另一方面不断的向可伸缩编码、多视点编码等分支方向发展。追求更高的压缩效率需要对传统的“整数变换、运动补偿、基于视觉的量化、熵编码”混合结构有所突破,才能为视频编码性能带来新的提升。可伸缩编码以其独特的适应性在当前的网络环境下会获得越来越多的应用,而多视点视频编码在自由视点电视、立体电视和沉浸感视频会议等应用方面有巨大的潜力。

参考文献

[1]张瑜,吴勇,左玉梅.多媒体技术[M].北京:清华大学出版社;北京交通大学出版社,2004.

[2]乔轩.H.26X系列的算法研究[D].杭州:浙江大学,2005.

[3]向健勇,朱学涛.MPEG系列标准的比较及最新进展[J].电子工程师,2004,(7):37-40.

[4]国家数字音视频编解码技术标准工作组.视频编码标准AVS技术介绍[J].电子产品世界,2005,(10):58-62.

[5]Draft ITU-T recommendation and final draft internation-al standard of joint video specification(ITU-T Rec.H.264/ISO/IEC14496-10AVC).Joint Video Team of ISO/IEC MPEG and ITU-T VCEG[S].JVTG050,2003.

[6]费伟,朱善安.基于H.264的自适应可伸缩编码研究[J].光电工程,2008,(3):102-107.

[7]胡瑞敏,刘琼.视音频编解码技术发展现状和展望[J].中国安防,2007,(3):56-64.

[8]徐秋敏,张云,郁梅等.多视点视频编码方法研究[J].宁波大学学报,2006,(9):296-301.

信息分类与编码标准化应用探讨 篇2

关键词:信息分类;编码;标准化;信息化

中图分类号:TP391 文献标识码:A 文章编号:1006-8937(2016)20-0087-03

1 概 述

信息分类和编码标准化是实现信息表达、交换与集成的基础,并且一直是困扰企业信息化的一个重要问题。随着数字化设计制造和企业信息化建设的发展,首要的问题就是进行信息的分类编码。信息分类编码已成为产品数据管理(PDM)、资源计划管理(ERP)和现代集成制造系统(CIMS)等系统的重要基础支撑。离开了信息的分类编码,各信息系统就难以实施,信息系统的集成、数据的共享和交换就难以实现。并且,信息分类编码的优劣直接关系到企业信息系统的运行质量和运行寿命。在数字化设计制造环境下,信息表达对象(如产品设计、工艺、制造及管理信息)的表达、存储、获取、传递均以数字化方式,通过CAD、CAPP、PDM、ERP 、MES等应用系统实现,信息编码系统已经成为信息共享与集成的核心要素之一。可以说,企业的设计、制造、生产、管理工作都需要统一编码体系的支持,离开了信息编码,各信息系统就无法有效工作。

2 国内外编码工作情况及我国航空工业编码遇到的 问题

美国新兴管理开创者莫里斯L提出:“只有我们学会了分类和编码,做好简化和标准化工作,才会出现真正的、科学的管理。”由此可见,信息分类编码是信息社会的管理基石。

2.1 美军代码建设情况

北约的NSN(NATO仓库代码)是对军方供应系统中所有装备、组件、部件进行统一命名、描述、分类和赋予NSN,由国际编码局编目,是为了统一北约国家及相关协助国家后勤补给问题,实施的北约编目系统。美国的UID是美国国防部20世纪90年代开始在军用物资中使用的唯一标识技术,对超过一定价值或比较关键的资产进行唯一性编号,通过自动识别技术标注,确保整个周期内标识数据的完整性,并通过计算机处理支持应用系统。近期,F35在研制中形成完备的信息分类和编码体系,并使用RFID标签技术,在武器装备快速研制、全生命周期管理等方面取得了相当显著的效益。基于统一编码和物联网技术实现现代化军事物流管理进行新型战斗机研制,提高空中全纵精确打击能力,从而打赢现代化战争。基于统一表示和RFID技术的应用,促使军队物流管理的信息化,实现“储备式后勤”到“配送式后勤”的转变。

2.2 全球物品唯一编码建设情况

EAN/UCC系统(目前改名为GSI全球第一商务标准化组织)是由EAN(国际物品编码协会)和UCC(美国统一代码委员会)共同开放、管理和维护的有关贸易项目、物流单元、资产、位置及服务关系等全球统一的标识系统及相关的商务标准。主要包括三方面的内容:编码系统、数据载体(如条码、电子标签)和数据交换协议(如电子数据交换系统--EDI)。在EAN/UCC系统中,编码系统是核心。编码系统保证了在全球范围内,对贸易项目、物流单元、资产和位置,以及特殊应用领域等,提供唯一性的标识。许多国际协会和国外大的军工集团都建立或引用了相关领域较为完整的标准体系框架,制定了一系列具体的标准。

2.3 国内现状和发展趋势

从1985年原国家标准局信息分类编码研究所成立,1988年组建国家技术监督局中国标准化与信息分类编码研究所,至今,我国已在人事管理、区域场所和机构、时间和日期、字符集、语言文字和文献管理、交通运输、财政金融和贸易、资源和环境等方面广泛开展了信息分类编码标准的编制工作。我国的信息分类编码标准化工作,经历了从单一标准发展到体系标准、系列标准,从一个研究领域发展到多个领域,从基础标准向高新技术领域开拓的过程,逐步建立了一个较为完整的信息分类编码标准体系。我国已制定出100多项信息分类编码国家标准,制定出的这些标准主要集中在术语、方法、综合通用、事物特征分类、数据元基本定义等方面,但服务于产品研制、生产、使用维护的产品技术信息分类与编码标准却很少。我国统一的代码有商品条码(GS1)、全国组织机构代码、RFID标签芯片厂商代码。

我国在石油行业、军队和国防工业也建立了相关的编码体系。如GJB 7000《军用物资和装备分类》、GJB7001《军用物资和装备品种标识代码编制规则》等。从2005-2007年,原“国防科技工业信息技术应用标准化研究中心”组织开展了《国防科技工业信息分类与编码标准化研究》。五大行业的标准化研究所、主机设计所、制造厂以及航空院校等24家单位参与了该项目,子课题研究9项,制定GJB/HB等编码标准41项,很多成果已应用实施。

中航工业集团公司及其下属单位作为国家航空产品研制的核心力量,承担众多大型的科研生产任务,单一的研究所或制造厂难以独立承担,需要各单位间的设计、制造协同,并保证产品交付用户后的质量追踪。因此,信息的分类及编码标准化工作就显得尤为在重要。

中航工业在多年的编码工作实践中遇到了以下问题:①不同型号间重复编码;②设计与制造单位编码不兼容;③同型号制造协调中编码不统一;④主机厂与辅机厂的编码矛盾;⑤产品研制与交付使用的编码矛盾,等等。导致飞机产品在制造厂、航材、部队的问题难以追踪定位,因此迫切需要在集团层面进行编码的统一规划和部署。

3 统一编码的作用

信息分类编码目的是进行统一编码、统一规划、集中建设、共建共享,支撑集团公司和成员单位的信息化建设,达到各单位对同一对象编码的一致,形成信息交流中对物品的“共同语言”,形成工业部门与军方对物品的一致标识,这是型号协同研制生产的需要,也是军地一体化保障模式的需要。

对各军工单位来说,使用集团统一编码标准及其编码数据,能有效减少各单位的编码工作量、提高编码工作效率、节省编码工作成本,加快企业信息化建设进程,支撑产品全寿命周期管理。在协同研制中,做到各单位对信息标识与表达方法的一致,避免由于代码不统一带来信息交流障碍,支撑企业信息化建设,有效提高企业编码工作的效率和质量,避免企业重复投入,为信息系统集成奠定基础,是装备使用保障信息化的需要,准确及时掌握装备的状态,提高武器装备的调配能力,保证装备的质量可追溯性。

进行集团级的统一编码工作策略,需要具备以下方面的条件才能顺利推进:①统一编码的工作制度和流程;②有力的组织保障、落实各级责任;③打牢技术基础(标准化、信息化);④信息代码管理系统作为工具;⑤有型号或实际应用作为需求拉动;⑥有使用的考评指标;⑦在企业信息化建设中应用;⑧有具体的强制实施要求或应用试点场景。

信息编码是特定事物或概念的一个或一组字符,其根本作用是标识,以指名信息主体在一定范围内采用简单、明确、不易产生歧义的代码作为标识代码,以便在管理上建立共同认可的一致标识,作为信息处理和交换的基础。随着信息技术在装备科研生产、使用保障、管理中的广泛应用,信息编码的作用越来越体现在以下方面:实现信息表达、交换、集成的基础;提高劳动生产率和科学管理水平的重要资源;武器装备全生命周期信息化建设的基石。

企业信息数据的70%来源于产品图纸,被称之为“元数据”。信息数据的正向流程应该是:在设计过程中,系统对产品数据进行编码,通过“信息分类编码管理系统”与CATIA系统的集成,PDM对基于MBD(Model-Based Defination)的CATIA数模上的结构化信息进行提取,建立产品结构树和其它相关信息,然后将产品数据传给CAPP,工艺人员添加工艺数据并调整产品结构,编制工艺路线、构建BOM及AO/FO等工艺文件,再传递给ERP,由ERP实施生产计划及生产资源的全面管理。整个过程全部在信息系统上运行。信息分类编码这一基础工作是制约企业实施信息化的瓶颈。制定一套完善、可确保信息系统长期高效运行且可随企业的发展而扩展的信息分类编码规则难度很大,根据编码规则建立包含企业所有“物料”代码的编码数据库更是需要耗费巨大的人力,同时也拖延了企业信息化实施的进度。

信息分类与编码不是信息化的产物,但突出地为信息化所使用。军工企业信息编码的迫切需求同样来源于信息化建设,是信息化建设中重要的基础性工作。现代企业信息化要对客户关系、订单、产品设计、工艺设计、生产制造、产品总装、交付及客户服务进行一系列管理,所涉及的软件系统包括CRM、SCM、CAD/CAM/CAE、CAPP、ERP、PLM、MES、HCM、TEM等,各系统进行数据传输,实现互联、互通、互操作的基础就是信息编码的一致和统一。信息分类和编码标准化为信息交换和资源共享提供统一语言,是搞好信息化建设必须重视的基础性工作。信息编码工作是信息资源规划(IPT)的关键组成部分,是企业IT治理的重要内容。如果急于求成,先做应用系统实施,后规划编码标准化管理,必然会导致信息孤岛,带来返工、系统集成困难、反复对照数据、信息系统重复建设等。信息编码能最大限度避免对信息的命名、描述、分类和代码不一致造成的误解和歧义,减少一物多码、一码多物、同一名称的分类和描述不同,保证信息表述的唯一性、可靠性和可比性。

4 信息分类与编码标准化工作实践及建议

4.1 工作实践

分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。

类目是侧重于分类的结果形式(含多个属性)。

代码是表示特性事物或概念的一个或一组字符,可以是字母、数字、字符或文字等,在识别与利用信息的过程中,人与人之间,人与机器之间,以及机器与机器之间需要信息交换,共享信息资源,必须对具有相同内容的信息有统一的识别标准,也就是统一的编码。

编码是给事物或概念赋予代码的过程,信息编码是将表示信息的某种符号体系(如文字、图像)转换成便于人或计算机识别或处理的符号体系的过程。

分类是为了对事物有效地进行研究、管理,分类的结果是分类对象有序化。基本原则是:科学性、系统性、可扩展性、兼容性、综合实用性。

分类时要注意做到:①分类的依据要与目的一致;②确定一个依据,坚决执行下去,切忌中途变换分类;③分类的颗粒度要适宜,维度要一致;④分类的共性问题做同样的处理原则;⑤特殊情况或需要提示信息的说明;⑥空出代码要说明;⑦为了减少由于分类体系与信息管理需求的不协调所造成的矛盾,在建立分类体系时,应充分考虑各个相关单位对信息分类的共性需求。分类的方法有线分类法和面分类法。

信息的编码与分类是两项相对独立的工作,代码并不总是与分类相关,如果把信息分类和信息编码混为一谈,将会对信息化的相关工作造成误导,给企业信息化造成混乱。分类的作用是对信息易于管理、统计、分组,但不是要将统计与管理需求反映在代码里。现代主流编码理论是将分类作为一个信息属性来看待,要简化分类,将分类信息在数据库中体现,而不是在代码中体现。

在进行编码时,要考虑:①唯一性;②稳定性;③可扩展性;④简洁性。重点是考虑唯一性,如何确保编码的唯一是关键。

在进行信息编码时,要区分有含义码和无含义码,注意二者的平衡。不要依赖代码进行信息检索、统计,对于复杂的检索、统计功能应通过对存有特征信息的数据库操作来实现,也不要在代码中加入过多的管理信息。代码的作用仅是对编码对象进行标识,为兼顾人们对编码对象的了解,可加入特征描述码段,但这些描述码对信息主体必须是稳定的。

在不同的场合所使用的代码体系不同时,为了不同场合进行数据传递,需要进行代码转换,由于不同分类系统的类目不可能完全一一对应,所以代码不可能实现一对一的转换。无含义代码所对应的信息主体没有层次之分,因为对同一个信息主题集合,不同的无含义代码体系件可以进行一对一的代码转换。这在实际工作中具有十分重要的意义。

4.2 建 议

目前各科研院所和制造企业都计划或已在开展编码标准化的工作,大多是伴随着ERP、PDM或MES系统的建设进行的,取得了一定的成就,也积累了丰富经验。总结在企业信息化建设过程中编码工作的经验,提出信息分类和编码的以下建议:

①要站在信息化建设全局的角度,定制总体规划。基于信息化建设的全局优化角度来开展编码工作。坚持“统筹规划、统一标准”的方针,通过标准化的协调和优化功能,保证信息化建设和基础数据建设少走弯路,提高效率。

②编码工作要在信息化工作先期或同期建设,做信息化必须重视基础性工作,如果急于求成,“先应用,后基础”,必然会导致信息系统的“信息孤岛”。至少要做到“四同”,即同计划、同设计、同建设、同验收。

③对物品的编码是最核心的工作,重点是贯彻物品的集团统一代码。物品种类多、描述属性复杂、数据量庞大、涉及的部门多,与型号产品的设计生产交付直接相关,贯彻集团统一代码是企业编码工作的重要组成部分。集团现有编码成果直接为企业应用,能有效提高企业编码工作效率。

④多个部门要密切配合,推进编码工作。标准化、信息化和业务部门要密切配合,各负其责,共同推进编码工作。

⑤要充分重视数据规范化整理工作,并组织实施。由于以往没有有效的代码管理工具、数据规范性不够或执行不彻底造成企业基础数据问题很多。只编标准和管好新代码是不够的,不对已有基础数据进行规范化和排查,反而会加剧一物多码的情况。

⑥建立长效工作机制,将编码标准化和编码管理平台建设纳入信息化工作规划,形成代码申请和应用的常态化工作机制,指定专门机构和人来负责编码工作。

5 结 语

信息分类和编码是企业之间设计协同和制造协同的基础,是企业内部规划信息化资源开发与实施、统一IT架构的必要前提和基础。企业对信息编码的进行统一部署和协调,是整合和规范企业各类基础数据资源、为企业信息化奠定标准和规范化数据的基础。同时,对军工企业来说,信息分类和编码的重要意义还在于,以解决信息集成和共享为目标,在军工企业型号产品研制中,对产品质量进行跟踪和追溯。

参考文献:

[1] 王丙义.信息分类与编码[M].北京:国防工业出版社,2003.

[2] 耿坤瑛,姚作勋.信息分类编码在企业信息化中的作用[J].CAD/CAM与 制造业信息化,2003,(12).

[3] 蒋建军,王俊彪,姜澄宇,等.制造企业信息分类.编码体系[M].西安:西北 工业大学出版社,2010.

[4] 吴超,宫磊.浅谈军工企业信息编码管理平台的开发与实施[J].信息技 术与标准化,2011,(1).

[5] 蒋建军,王俊彪.航空企业信息统一编码结构模型[J].航空制造技术,

EVS音频编码器标准介绍 篇3

关键词:EVS编码器,3GPP编码器,编码器

随着IP网络迅速 发展 , 多媒体业 务日益增 长 , 而现有3GPP语音编码器AMR和AMR-WB提供的语音频质量 , 已经无法满足用户的要求。 3GPP为了保持其无线通信话音业务的高水平和与Skype等网络电话系统的竞争力, 需要有自己的新一代的语音频编码器。

1 概述

3GPP EVS编码器标准化工作启动于2008年初 , 2014年12月完成标准发布 。 在2010年1月召开的3GPP SA4第57次会议上, 完成了3GPP EVS编码器的技术报告 “Study of Use Cases and Requirements for Enhanced Voice Codecs in the Evolved Packet System (EPS) ” (3GPP Technical Report 22.813)[1]的制订工作。 EVS编码器旨在为移动电话提供显著增强的话音质量; 此外, 改善传输效率和优化在IP环境下的工作情况将是进一步的目标。 EVS编码器也将能够增强非话音信号的质量, 如: 音乐信号和混合内容 (包括: 电影和电视节目的预告片 、 新闻 、 广告 、 等等 )。 图1是EVS编码器应 用于MTSI(Multimedia Telephony Service for IMS) 的例子[1]。

从图1可以看出, EVS编码器并非将取代现有的3GPP语音频编码器 (如: AMR和AMR-WB等), 而是除了提供更高的音频带宽 (至超宽带以及全带) 外, 还将进一步增强现有的话音业务的质量, 其中包括一种与AMR-WB比特反向兼容的工作模式。

EVS编码器的 主要应用 场景是Vo LTE, 也可以用 于CS(3G UMTS) 网络以及其他移动和无线 (Wi Fi) 网络 。 EVS编码器能够为用户提供 “Being-there” 的质量体验, 适用的通信业务种类包括:

(1) 传统的电话通信

(2) 高质量的多方电话会议

(3) Music on hold, ring-back tones

(4) 网真 (Telepresence)

(5) Downloading 和 Streaming

2 EVS 编码器设计指标

2.1 信号采样率和音频带宽

EVS编码器支 持要支持8, 16, 32, 48 k Hz的采样率 。对于一个给定的采样率, 编码器要支持选择编码频率带宽。

(1) 窄带 (NB): 100–3500 Hz, 采样率为8/16/32/48 k Hz

(2) 宽带 (WB): 50–7000 Hz, 采样率为16/32/48 k Hz

(3) 超宽带 (SWB): 50–14000 Hz, 采样率为32/48 k Hz

(4) 全带 (FB): 20–20000Hz, 采样率为48 k Hz

在上述所有带宽模式下, 解码器要支持全部4种要求的输出采样率。

2.2 声道数

编码器要支持单声道输入和输出编码。

编码器可以支持双声道立体声输入和输出编码。 如果支持, 则解码器要能从接收到的立体声信号中回放降混的单声道信号。

2.3 比特率

总比特率定义为: 源编码比特率 (Payload) + 0.4kbps的倍数 (Header)。

非AMR -WB兼容模式 的固定码 率编码的 比特率为 :7.2, 8, 9.6, 13.2, 16.4, 24.4 kbps ( 总比特率 ) 和32, 48, 64, 96, 128 kbps (源编码比特率 )。

非AMR-WB兼容模式 的可变码 率编码的 平均总比 特率为: 5.9 kbps。

非AMR-WB兼容模式SID (Silence Insertion Descriptor)帧的总比特率为: ≤ 56比特/帧。

AMR-WB兼容模式的编码的比特率为 : AMR-WB的全部9种模式的比特率 。

AMR -WB兼容模式SID帧的源信 息比特率 为 : 40比特/帧。

2.4 算法时延

单声道模式: ≤ 32 ms

双声道立体声模式: ≤ 50 ms

2.5 算法复杂度 (不含 Jitter Buffer Management 部分)

(1) 单声道模式 : ≤ 88 WMOPS

(2) 立体声模式 : ≤ 135 WMOPS

* WMOPS: Weighted Million Operators Per Second

2.6 帧长

帧长为20ms。

2.7 Jitter Buffer Management (JBM)[3]

EVS编码器要有一个符合3GPP TS 26.114[4]要求的JBM解决方案。

2.8 VAD/DTX/CNG

在非AMR-WB兼容单声道模式:

(1) 总比特率小于或等于24.4kbps的所有模式都要求支持DTX【5】;

(2) 比特率大于24.4kbps的所有模式可以支持DTX;

(3) SID调整帧的发送间隔不得小于8帧 ;

AMR-WB兼容模式 : 维持原有的DTX参数[6];

2.9 存储复杂度 (不含 Jitter Buffer Management 部分)

单声道模式:

(1) RAM: ≤ 100 k Words

(2) Data ROM: ≤ 100 k Words

( 3) Program ROM: ≤ 10倍AMR -WB所用的Program ROM (即 : 54.26 k Words)

立体声模式:

(1) RAM: ≤ 200 k Words

(2) Data ROM: ≤ 200 k Words

( 3) Program ROM: ≤ 10倍AMR -WB所用的Program ROM (即 : 54.26 k Words)

2.10 与 AMR-WB 编码器的反向兼容性[7]

EVS编码器支持用于3GPP电话业务中的全部AMR-WB编码器格式, 且与现有的AMR-WB编码器保持比特兼容, 支持AMR-WB所有9种码率: 6.6、 8.85、 12.65、 14.25、 15.85、18.25、 19.85、 23.05、 23.85kbps。

3 EVS 编码器涉及的关键技术

在这一小节里, 介绍EVS编码器采用的技术框架以及涉及的一些语音频编码的关键技术。

3.1 EVS 编码器技术框架【8】

EVS编码器采用基于ACELP[5]的线性预测编码技术 、 变换编码技术 (Tansform Coding) 的混合编码方案。 前者主要用于低比特率语音编码, 后者则多用于中高比特率音频编码。 对于非激活音频信号还使用了VAD/DTX/CNG方法, 如图3所示。

3.2 信号采样

输入信号: EVS编码器接收NB、 WB、 SWB、 FB带宽的音频信号, 采样率: 8k、 16、 32、 48kbps。 帧长20ms。

3.3 信号分析和分类

信号分析 (signal analysis) 和闭环判决 (closed loop deci-sion), 用于确定使用哪一种编码方法来编码输入的每一帧音频信号: LP-based Coding (ACELP[9])、 Frequency Domain Coding或Inactive Signal Coding (CNG) 。 每帧音频信号采用的编码方法都是独立的, 可以在3种编码方法中自由切换。 为了保证无缝切换的效果, 在编码方法切换的时候, 两帧之间的编码参数也需要进行交换。 同样地, 对于信用带宽切换、 码率切换的情况下, 也要考虑切换帧之间参数交换。

3.4 线性预测技术

在预测编码方面, ACELP (代数码激励线性预测)[8]是低比特率语音编码中的一项 “革命性” 技术, 已成为大多数低比特率语音编码器的算法核心, 它可以在大约8 kbps的比特率下提供所谓Toll-quality的高质量话音。 ACELP已经广泛地用于各种语音编码的国际标准, 如: ITU-T的G.729系列, G.723.1, G.718; 3GPP的AMR, AMR-WB, AMR-WB+; MPEG的USAC等。 EVS编码器的线性预测技术就是基于ACELP并作了扩展和优化。

如图4所示, 输入信号被分为低频带信号和高频带信号分别进行处理。 线性预测系数估计按照20ms帧长进行处理。对于低频带信号, 根据不同码率和最佳插值方法, 每一帧信号设置若干插值点。 线性预测残差根据残差的特性进行进一步分析和量化。 对于高频信号进行参数化, 采用不同参数来描述 , 如谱包络 、 能量等 。 为了能和AMR-WB后向兼容 ,EVS线性预测 的核心算 法 : 线性系数 估计 、 高频参数 描述(parametric HF representation) 和残差量化 , 和AMR-WB是相似的, 可以配置为AMR-WB相同的码本 (codebooks)

3.5 频域编码

EVS的频域编码技术主要基于MDCT (改进的离散馀弦变换) 的变换编码技术[6]。 MDCT已为当前的绝大部分音频编码器所采用。 这种编码技术, 在中高比特率时可以提供非常好的音乐和语音质量, 在大约128kbps时, 甚至可以提供所谓“透明 ” 质量的音频信号 。 从图5来看 , 频域编码方法分为控制层和信号处理层。 控制层主要执行信号分析并为信号处理层提供配置参数。

3.6 非激活音频编码

当编码器设置为DTX模式, 对于输入的背景噪声信号,每8帧处理一次, 并用频谱包络、 能量等参数来描述 信号 。这些参数传递到解码端后, 解码器根据这些参数在解码端生成舒适噪声 (CNG)。

4 结语

EVS是目前涵盖窄带 、 宽带 、 超宽带以及全带的最先进的语音频编码器, 要求其中的各个单项技术都必须是现有最优秀的技 术 。 EVS编码器的 关键指标 领先于AMR、 AMRWB、 G.722.1C等现有语音频编码器标准 , 与现有语音频编码标准相比具有如下优势:

(1) 扩展了音频带宽 (超宽带 , 全带 )。

(2) 改善了窄带和宽带语音的质量 。 例如 : EVS编码器9.6kbps码率窄带 模式的语 音音质要 明显地好 于AMR的12.2kbps码率模式 (英语4.4 vs. 3.9, 普通话4.2 vs. 3.8, 5分为满分); EVS编码器的16.4kbps码率宽带模式的语音音质要明显地好于AMR-WB的19.85kbps码率模式的语音音质 (英语4.5 vs. 4.1, 斯洛伐克语4.6 vs. 4.3, 5分为满分)。

(3) 改善了EVS编码器对传输错误的抗干扰性 。 例如 :EVS编码器超宽带48kbps码率 、 3%丢包率模式下的音乐音质要明显地好于G.719相同模式下的音乐音质 (4.4 vs 4.0, 5分为满分)。

(4) 降低了EVS编码器的平均传输码率 , 同时提高了编码音质。 例如: EVS编码器宽带24.4kbps码率、 采用VAD模式下的语音音质要明显地好于AMR-WB相同模式下的语音音质 (4.7 vs 3.7, 5分为满分)。

(5) 在所有的工作带宽提供更好的音乐 /混合内容质量 ;例如: EVS编码器的16.4kbps码率模式音乐音质要明显地好于AMR-WB的23.05kbps码率模式的音乐音质 (4.5 vs. 3.4, 5分为满分)。

军事装备信息编码标准化研究 篇4

1、军事装备信息编码标准化工作的意义

人类社会步入信息时代,作战形态正由机械化向信息化转型。如果说以往战争中注重的是物质保障,那么现在则更加注重信息收集、传输、处理、保存、安全等方面的信息保障。在未来信息化条件下的战争中,各类装备保障信息的种类繁多、数量巨大,要确保装备物资流、技术流的顺畅、高效,就必须确保信息的标准化、规范化。

1.1 有利于装备保障指挥建设

信息时代,不仅作战部队、保障部队将联结成一个有机整体,而且各级装备保障力量也将通过信息纽带连接起来。各类装备保障信息的共享,不仅可为上级装备指挥员的集中指挥创造有利条件,而且也可激发下级装备指挥员的主动性和创造性,使其能在准确掌握实时信息的基础上,根据上级装备保障指挥员决心,及时果断地采取保障行动。信息化条件下战争的装备保障指挥,对信息的标准化、规范化提出了更高的要求,只有做好装备信息编码标准化,才能实现更直接和实时的信息传递和处理,确保信息顺畅的流通和最大程度的共享。

1.2 有利于信息的管理使用

信息标准化的程度,直接影响到信息管理使用的效益。要实现信息管理科学化、信息使用的高效化,必须按统一的标准对信息进行编码。通过对装备信息的标准化编码,可以强化信息在部队各部门间的纽带作用,密切各部队间以及相关部门间的关系及合作;信息编码的标准化,还可统一信息采集、加工、存储相关标准,有效避免具体数据信息的命名、描述、分类和编码缺陷,消除诸如一名多物、一物多名等现象的发生,做到实体名称与术语含义以及编码的系统化、规范化,促进信息管理的质量效益。

1.3 有利于信息的综合集成

未来信息化条件下的战争是陆、海、空多军兵种一体化联合作战,要达成统一的保障行动,装备保障信息必须实现高度共享。科学的信息编码,能有效地避免各军种自然语言描述习惯的模糊性,统一装备保障信息相关概念、标准,避免概念不标准、习惯不统一而带来的信息模糊性和不确定性。科学的信息编码是实现信息共享的基础,用一个或一组便于计算机和人识别与处理的符号(如阿拉伯数字、拉丁字母)来描述事物和概念,可以方便地解决信息的存储、表达、交换,促进各类信息系统的互通互联互操作,有利于各军兵种装备保障信息的综合集成。

2、实现装备信息编码标准化的客观要求

装备信息编码标准化,必须充分考虑未来装备建设发展,结合装备保障建设需要,遵循科学合理的信息编码规范。

2.1 唯一性和可靠性

唯一性,是指一个编码只唯一表示一个编码对象。一个编码对象虽然可有很多不同名称,也可按各种不同方式对其进行描述;但在一个编码标准中,每一编码对象仅赋予它一个编码,一个编码只唯一表示一个编码对象,即编码与编码对象只能是一对一的关系(“一物一码”),如果不能保证这种一一对应关系,往往会造成管理系统的混乱。通过编码必须能明确和不可互换地识别一个对象。计算机信息处理是用装备的编码而不是用装备的名称,一个信息的名称可以改变,但编码一旦确定并开始在信息系统使用就不能更改。因此,编码必须符合唯一性要求。

可靠性,是指对可能在记录或传输中发生错误进而导致重大的人员、经济或操作问题的编码,应考虑采用检验码或其它检验技术,以确保信息流动中的信息量的准确传输。同时,各类编码体系既要反映个性特点,更应体现在整个编码体系中的协调性,避免在编码体系发展中发生冲突。

2.2 等长性和扩充性

等长性,是指在同一编码体系中,所有编码对象的编码长度原则上相等,以减少软件处理的复杂性。在编码的编制过程中,应保证同一类信息的编码长度相同,比如应采用0010、1001,而不能采用1、1001来表征同一类装备信息。

扩充性,是指要留有编码空间,便于以后扩充,以满足装备不断发展的要求。编码结构必须能适应同类编码对象不断增加的需要,必须对新的编码对象留有足够的备用码,以适应不断扩充的需要。由于装备发展速度很快,对它的编码应考虑现有装备在规格、品种方面发展的空间,为新装备信息保留足够的备用码,以保持编码的稳定性。因编码空间不适应装备品种发展,而修改编码系统所造成的损失是灾难性的,扩充性是编码系统的重要性能之一。

2.3 规范性和简明性

规范性,是指编码的结构应尽量统一、标准、规范。在一个信息编码标准中,编码的结构、类型以及编写格式必须统一。针对不同特点、不同用途的编码对象,可采用不同的编码方法。对不具备系统性分类特征的编码对象,采用顺序码或分组顺序码;对需要反映分类信息、用于检索、汇总、统计目的的编码,采用层次码或特征组合码;对人机交互编码尽可能采实用义码。

简明性,是指编码在尽可能反映编码对象的主要特征的情况下,结构简洁明了,便于理解、记忆。编码的位数越多,计算机的处理速度和存储要求就越高。编码越长,操作人员就越不容易操作,越容易出现错误。因此,在不影响编码系统的容量和扩充性的情况下,编码的位数应尽可能少。编码的简洁与扩充性是相对的,在具体编码时应该统筹考虑,合理取舍。

2.4 易用性和高效性

易用性,是指编码便于录入和辨识。编码要尽可能地反映分类对象的特点,便于填写、录入和使用。尽可能使用有含义编码,可将信息的种类、形状特征反映在编码的结构中,使编码便于使用和推广应用。

高效性,是指在满足要求的情况下,信息编码简短明确,字符最少,位数最短,以便于各类信息系统进行传递和处理、储存装备信息,提高信息保障效率。

3、装备信息编码标准化需把握的重难点问题

装备信息编码标准化,是一项十分庞大的系统工程,涉及装备全系统全寿命过程。我军装备信息编码工作经过多年探索,取得了许多成绩,发挥了明显的作用,但与外军相比还存在很大差距。当前,做好装备信息分类与编码工作还需着重把握以下问题。

3.1 科学确定装备信息编码空间

对某一具体的信息对象编码时,可以很少考虑编码空间问题;但对多类装备信息进行编码时,如果编码空间划分不当,会使各类信息编码长度差异大,不便于信息的使用管理。在划分编码空间时,数据量大的信息应占据较多编码空间。在确定编码空间时,还应对信息种类的发展留有一定的余地。在已有的种类中,也应根据具体的情况做不同的处理。随着我军装备建设步伐的加快,装备物资将会越来越多,信息量会几倍甚至几十倍的增加。在确定信息编码空间时,应考虑各类信息间的联系,将相近、相似的信息放在相邻编码段内。对采用两位编码来表示信息大类的编码体系中,还应考虑将第一位编码作为层次的大类码,以便于编码的编制和推广。对有些信息,已有国家标准或行业标准的,应作为重要参考依据。但对具体的装备,也不能完全照搬或全部吸收国家或行业标准,要结合装备设计、生产、库存和使用、维修全寿命过程,对各类信息进行统一的编码,以避免出现某一少部分装备占用较多的空间。

3.2 注重系统论证和顶层设计

必须对信息编码体系进行系统论证,对国内外、军内外的编码体系进行深入的调查分析,及时掌握编码技术的发展,确保编码技术的先进性。系统论证工作的关键是确立编码体系结构,拟定每个编码体系的用途,明确各编码体系间的关系和所必须包含的信息要素。论证工作还需要对现行的编码体系进行评价,以便于保留、继承和发展原有编码体系,建立新的编码体系,摒弃过时的编码体系。装备信息编码工作不是一个军种、一个部门能够单独完成的,需要克服各军兵种自成体系、自行其是倾向。搞好装备信息编码工作的顶层设计,要用系统思想作指导,整体考量、整体规划、综合平衡;各个军种部门要相互配合,冲破军兵种之间、部门之间的壁垒,注重相互联互通和接口问题。要确立装备保障信息编码总体框架体系,制定和颁布权威性指导文件和统一的技术标准,保证各个装备信息系统的互操作性和安全性,确保系统的内部诸要素很好地围绕作战装备保障高效运转,有效防止编码体系出现颠覆性问题和体系间的不兼容问题。

3.3 强化组织领导和制度建设

我军装备信息化建设实践说明,强有力的组织领导是大力推进信息编码建设的保证。加强对装备信息编码建设的组织领导和法规建设,把信息编码纳入规范化、法制化轨道,从运行机制上保证装备编码工作的落实,进而保证相关信息系统的可持续发展。作为装备信息化建设中一项重要的基础性工作,编码标准化工作必须紧密结合装备保障需求,编码方案的设置要符合装备特点、现实状况和今后的发展需要。装备编码工作的实施,一方面要以军队的相关条例、条令,尤其是要依据装备条例、条令及其它相关规章制度作为依据;另一方面,在完善和健全组织的基础上,要大力加强信息编码方面的法规建设,确保从制度上保证编码标准化工作的顺利实施。

3.4 加速专业人才队伍培养

信息编码系统作为知识密集、技术密集的高科技系统工程,需要大批高素质专业人才作支撑。培养、造就一支技术精湛、胜任信息编码需要的人才队伍,是当前编码工作的紧迫任务。当前,一方面需要具有很深理论功底和较强开发能力的专家型人才,另一方面要培养造就一支能指挥、懂技术、善管理的复合型人才。要通过健全各类编码人才的培训机制,有重点和针对性的开设相关课程,强化部队、院校、科研院所间的协作,注重对信息编码工作重难点问题的集智攻关。

摘要:武器装备信息编码标准化是装备信息化建设的基础性工作。本文论述了军事装备信息编码标准化工作的意义, 提出了实现装备信息编码标准化的客观要求, 探讨了装备信息编码标准化需把握的重难点问题。

关键词:军事装备,信息编码,标准化,信息化建设

参考文献

[1]程贵秀, 叶延科.企业信息分类与编码问题的研究.电脑开发与应用[J].2003 (5)

[2]赵艳华.我国信息编码标准化的实践.中国标准化[J].2001 (10)

[3]崔玲.管理信息系统中数据编码问题的探讨.机械设计与制造[J].2003 (6)

物品编码及标识标准现状分析 篇5

一、物品编码标准发展现状

物品编码问题一直是社会各界关注的焦点。现有的有关物品编码的标准种类繁多, 但是由于应用的领域、行业各不相同, 因此编码方案之间存在很大的差异。尤其是在现代信息化飞速发展的背景下, 编码之间的兼容问题进一步突显出来。

目前, 国际上针对统计、贸易等方面的需求已有相应的物品编码标准, 例如《产品总分类》 (CPC) 、《商品名称及编码协调制度》 (HS) 、《国际贸易标准分类》 (SITC) 、《联合国标准产品与服务分类代码》 (UNSPSC) 、《欧盟经济活动产品分类体系》 (CPA) 、《联邦物资编码系统》 (FCS) 、《全球统一标识系统》 (GS1) 、《全球产品分类》 (GPC) 等。为了适应社会对单品管理的需求, 目前国际上有关唯一标识的物品编码体系有:EPC编码体系、UID系统、MCODE等。

CPA、FCS、GPC、UID、MCODE的应用主要局限在某些地区或领域, 但是其中UID、MCODE的发展对实现物联网的单品智能管理有着重要的启示和借鉴意义。在众多标准里被广泛采用的主要有CPC、HS、SITC、UNSPSC、GS1、EPC。

1、产品总分类 (CPC) 。《产品总分类》由联合国统计署制定, 联合国统计司分类部为该分类的管理者, 它提供包括经济活动及货物和服务 (产品) 两方面的分类, 为有关货物、服务和资产的统计资料的国际比较提供了一个框架, 是国际统计、国际经济对比的基本工具之一。

2、《商品名称及编码协调制度》 (HS) , 由海关合作理事会 (又名世界海关组织) 主持制定。HS是一种主要供海关统计、进出口管理及国际贸易使用的商品分类编码体系。从1992年1月1日起, 我国进出口税则采用世界海关组织《商品名称及编码协调制度》。

3、国际贸易标准分类 (SI TC) 是由联合国统计司管理。SITC采用经济分类标准, 即按原料、半制品、制成品分类并反映商品的产业部门来源和加工程度。国际贸易标准分类是用于国际贸易商品的统计和对比的标准分类方法。

4、《全球统一标识系统》 (GS1) 是以对贸易项目、物流单元、位置、资产、服务关系等进行编码为核心的集条码、射频等自动数据采集、电子数据交换、全球产品分类、全球数据同步、产品电子代码 (EPC) 等系统为一体的、服务于全球物流供应链的开放的标准体系。《联合国标准产品与服务分类代码》 (UNSPSC) 从2003年5月9日起正式由GS1的成员组织———美国统一代码委员会UCC维护。

5、UI D是日本自行推出的一套RFI D方面的标准化系统。UID技术面向的是人、物体及环境三个要素, 但UID的生产和系统集成厂商只集中在日本, 在国际上响应者较少。

6、MCODE是韩国提出的、是在移动商务领域使用RFI D的编码, 目前主要在韩国移动商务领域应用。

国内在结合我国发展和需求的前提下也制定了各类编码标准, 国家层的编码标准大多属于分类编码标准, 其所占比例大于所有国家物品编码数量的70%。分类编码更多考虑物品的自然属性, 即物品本身是什么便被赋予一个编码来表示物品的种类。典型的分类编码标准有GB/T7635-2002全国主要产品分类与代码第一部分 (可运输产品) , 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会为此标准的制定或管理部门。此代码分六个层次, 各层分别命名为大部类、部类、大类、中类、小类、细类, 其所列产品类目按不同的特征属性再分类或按不同的要求列类, 以满足管理上的特殊需求。本标准由五大部类组成, 分别为农林 (牧) 渔业产品、中药, 矿和矿物、电力、可燃气和水, 加工食品、饮料和烟草、纺织品、服装和皮革制品, 除金属制品、机械和设备外的其他可运输产品, 金属制品、机械和设备。

国家物品编码标准中的属性编码不多, 属性编码考虑物品的某一特定属性, 依据这一属性来编码。如标准GB/T 18127-2000物流单元的编码与符号标记, 这一标准为属性编码标准, 其编码由应用标识符及托运代码组成。托运代码包括厂商识别代码及托运信息, 托运信息由使用者自行处理, 厂商识别代码见GB12904, 托运代码可以作为一个单独的信息处理。由于对托运信息无明确的内容规范, 这就造成信息种类的多样性。从托运代码可能无法识读出托运物品的其他层面的属性, 比如物品的种类、产地、生产商等, 所以此编码适用于物流运输, 但未必适用于流通中更多的信息需求。

国家物品编码标准中的单品编码是对分类编码或属性编码的延伸, 是在物品类别代码的基础上细化到每个单品本身。例如, GB16735-2004道路车辆车辆识别代号 (VIN) 标准为单品编码标准, 车辆识别代号由世界制造厂识别代号 (WMI) 、车辆说明部分 (VDS) 、车辆指示部分 (VIS) 三部分组成, 共17位字码。此编码涵盖的信息包括地理区域、国别、制造厂、车辆特征代码、校验码、年份、装配厂及生产顺序号。

二、物品标识标准发展现状

目前各领域和行业间对物品标识的认定不同, 这一直是社会各界关注的焦点。现有物品标识的标准种类繁多, 但是由于应用的领域、行业各不相同, 因此标识方法之间存在很大的差异。尤其在物联网、供应链、电子商务飞速发展的背景下, 如何统一对标识的认定, 以及方法、标准、系统间的兼容性问题进一步突显出来。

在自动识别技术应用领域, 现有与标识相关的标准在各领域、各行业的信息化建设中发挥着十分重要的作用。自动识别技术主要包括条码识别技术、射频识别技术、生物特征识别技术、卡识别技术、光学字符识别技术、传感识别技术等。但现有的标准只局限于条码标识技术方面, 其他自动识别技术方面的标准还比较少。现有的国家标准有:商品条码符号放置指南、条码符号印制质量的检验、包装, 用于发货、运输和收货标签的一维条码和二维条码、信息技术, 自动识别与数据采集技术二维条码符号印制质量的检验、动物射频识别, 技术准则、三九条码、PDF417条码、汉信码、动物射频识别技术准则等。

相比编码标准来说, 标识标准数量上比较缺乏, 关于物品标示方面标准相对多一些, 但识别方面条码的标准较少, 关于射频识别、特征识别、传感识别这些方面的标准几乎没有, 急需制定。物品标识是物品编码的表相, 是物品被解码读取的基础。物品标识标准的缺失严重影响了物品编码标准的应发挥的作用, 同时更是阻碍了物品信息被成功读取的路径。因此, 更专业全面的物品标识方面的标准有待编制。

三、物品编码标识标准体系建设存在的问题

从社会、经济发展及企业的角度出发, 大力开展对物品标识及其体系的研究是十分必要的。可以讲, 加强标准体系建设, 将有利于提升我国社会和经济发展总体水平, 降低企业运营成本, 提升生产效益, 否则将会成为经济、社会和企业发展的瓶颈。

1、在理论上, 物品编码标识体系的研究还未形成完整的理论体系框架。当前多种编码标识方案 (ISO、GS1、UID、OID) 并存, 各应用领域的编码方案互不兼容。从标准制定的角度出发, 基础术语、标识体系是缺失的, 各地区行业间对物品的编码标识标准也不统一。

2、在技术上, 物品标识体系的标准化研究仍然不够全面。标识技术的研究需要结合编码技术与解析技术, 而此方面缺少相应的技术支撑环境, 不能提供一个良好的编码标识技术支持平台。

3、在实践上, 人们对物品编码的作用和复杂性认识不够。物品编码是计算机应用的基础, 然而在实际工作中, 人们对物品编码的重要性认识不够。加上对现有国家物品编码标准宣传力度不够, 导致人们认为物品编码就是简单的给物品赋予一个代码, 对物品编码的认识过于简单化, 很少考虑编码资源的通用性、可扩展性。各自为政, 重复建设现象严重, 造成了资源浪费。

四、发展趋势

长期以来我国在物品编码标识方面进行了相关的标准化研究和应用工作, 研究制定了相当数量的标准, 这些研究成果为研究并建立适合我国国情的标识体系奠定了坚实的基础。但我国标准化研究在物品标识体系方面的研究较少, 各个领域和行业间关于物品标识的认定不同。因此, 各种标识方法之间的兼容问题进一步突显出来。如何建立一套适用于各个领域的物品标识体系, 加快建设我国物联网标识解析平台, 并将物品编码、物品标识、物品跟踪追溯与物联网应用、电子商务应用、现代物流应用结合起来, 正成为物品标识标准化理论研究和行业应用必然发展趋势。

摘要:物品的编码标识在经济、信息全球化的环境下, 越来越被世界各国重视。对物品进行有效的、标准化的编码及标识是信息化的基础工作。物品编码标识问题一直是社会各界关注的焦点。现有的有关物品编码标准种类繁多, 但是由于应用的领域、行业各不相同, 因此编码方案之间存在很大的差异, 尤其是在现代信息化飞速发展的背景下, 编码之间的兼容问题进一步突显出来。而标识标准的数量严重不足, 无法起到完整的规范作用。

关键词:编码,标识,标准,物品编码,物品标识

参考文献

[1]杜伟.农村社会经济统计信息分类与编码标准研究[J].安徽农业科学, 2010.38.

[2]王剑, 张楠, 张亚晶.GS1标准体系和HI BC编码标准及其应用[J].信息技术与标准化, 2009.6.

[3]杨桂玲, 叶雪珠, 袁玉伟, 张志恒.欧盟食品标识法规管理现状及对我国食品标识体系的建议[J].食品与发酵工业, 2009.5.

标准编码 篇6

H.264标准是新一代视频压缩标准,与前一代H.263标准相比,其编码效率提高一倍以上,但编码器的复杂度和计算量大为提高。仅就最低档次Baseline而言,H.264编码器存在以下问题:复杂度是H.263的10倍多,计算量增大;H.264采用多参考帧技术,要求处理器体系构架对处理器的数据调度机制以及片内外存储器的组织有新的考虑;H.264中新增加的编码技术(整数变化、去方块滤波等)要求现有的媒体处理指令集必须进行扩展;复杂度的增加导致H.264芯片的实现周期和产品成熟周期大大延长。

针对以上问题,笔者设计一个简化的H.264编码器,只保留标准的H263视频编码基本模块,并改进耗时较多的运动估计等算法模块来减少计算时间,满足实时通信的要求。

2 H.264视频编码器的简化

H.264与H.263视频编码标准的原理相同,是基于块的混合编码,通过运动补偿和帧间预测去除时域冗余,通过变换编码去除频域冗余。H.264标准又使用了多参考帧预测、7种不同大小的块预测模式以及1/4像素精度的运动估计、帧内预测、整数变换等技术,编码效率大幅提高,但也增加了编码器的复杂程度。笔者去除H.264标准中的SP帧预测、B帧预测、环路滤波、加权预测、帧场自适应预测,只使用1个参考帧,不使用码率控制、算术编码和率失真优化方式,在7种模式选择中只选择16×16和8×8两种模式。经过上述简化,得到了一个功能相对简单的编码器。

3 H.264视频编码器的算法改进

笔者使用Intel公司开发的Intel Vtune Performance Analyzer软件来测试各模块的运算时间,各模块占总运算时间的比重如表1所示。这4个部分约占运算总时间的80%,要提高编码器的运算时间,就必须对这些模块进行优化。笔者对运动估计搜索算法、帧间模式选择算法和插值算法进行改进。

3.1 改进的基于起点预测的快速运动搜索算法

1)交叉菱形运动搜索模板

在文献[1]的实验中,利用FS对13幅不同运动程度的视频图像进行运动估计,得出运动矢量概率分布规律如下:

(1)视频序列的运动矢量在空间分布上存在中心偏置特性,即运动矢量的分布以(0,0)为中心向外发散,具有梯度下降的特性,并且大部分运动矢量分布在[-4,4]的中心区域窗内。

(2)约有75%左右的运动矢量分布在水平和垂直方向上,而只有8%左右的运动矢量分布在相同半径的其他方向上,这说明运动矢量有交叉偏置特性。

基于以上所述,运动矢量的概率分布具有交叉-中心偏置分布特性。依据该特性,设计了交叉菱形搜索模板,如图1所示。图1a和图1b分别为大交叉菱形模板(LCSP)和小交叉菱形模板(SCSP)。在进行整像素搜索时,采用两步搜索算法,第一步采用大交叉菱形模板进行搜索,第二步以第一步得到的最佳匹配点为中心,采用小菱形模板进行搜索,得到最终的最佳匹配点。例如,如果第一步搜索得到的最佳匹配点在大交叉菱形模板的最右侧,那就以该点为中心进行第二步的搜索,搜索点位置见图1c。

2)自适应提前中止策略

由文献[1]的运动矢量概率分布统计结果发现,有45%的运动矢量是零矢量,这说明大部分图像块是静止的。如果能找到一个合适的阈值,使得在搜索时,若当前块的像素差值(SAD)小于该阈值,则直接中止搜索过程,这将大幅度降低算法的计算时间。笔者采用提前中止策略来自适应地选择阈值。在图像的运动过程中,当前宏块的运动特性和周围相邻宏块的运动特性相关性比较大,可以通过周围相邻块的运动矢量和SAD值来自适应的选择阈值。步骤如下:

(1)首先,判断当前块左边、上边、右上边3个相邻宏块的运动矢量是否全为零,如果成立,此时当前块的运动矢量为零的概率较大,则选择这3个宏块对应的SAD的最大值作为阈值;

(2)其次,如果当前块左边、上边、右上边3个相邻宏块的运动矢量不全为零,则选择这3个宏块对应的SAD最小值作为阈值,因为这时当前块的运动矢量为零的概率不如(1)中情况,选择最小的SAD作为阈值能保证搜索的精确性。

3)改进后的快速运动搜索算法

根据以上阐述,笔者采用一种基于起点预测的交叉菱形运动搜索算法[2],具体步骤如下:

(1)整像素搜索。首先,对初始搜索点对应的宏块进行运动估计并计算当前宏块的SAD值,如果SAD值小于阈值,则认为初始搜索点是最佳匹配点,转到步骤(3),否则进行步骤(2);

(2)采用图2a所示模板搜索初始搜索点周围步长为2的4个点,得出最佳匹配点,然后以这个最佳匹配点为中心,采用图2b所示模板搜索周围步长为1的4个点,得到最佳匹配点,转到步骤(3);如果第一步搜索得到的最佳匹配点在大交叉菱形模板的最右侧,那就以该点为中心进行第二步的搜索,搜索点位置见图2c所示;

(3)半像素搜索。采用图2b所示模板搜索最佳匹配点周围步长为1的4个半像素点,得出最佳的匹配点。

3.2 帧间编码模式选择算法的改进

H.264视频编码标准规定,在进行帧间编码时,编码器对所有模式进行遍历,并计算各种宏块模式(包括帧内预测模式)的编码代价,选择最小代价宏块模式作为最终编码模式,但这需要对每一种可能的宏块模式进行运动搜索和率失真优化计算,使得计算量急剧增加,不适合实时编码的要求。基于以上思想,笔者采用了文献[3]提出的基于图像宏块纹理特性的算法进行帧间模式选择。从图像宏块纹理特性和宏块运动特性进行模式选择,同时考虑skip模式和B帧的direct模式等。

本算法从时域角度出发,根据前后帧相同位置宏块之间的SAD来判断宏块的纹理特性

式中:xi,j和yi,j代表了当前帧和前一帧的位置处的像素值。首先进行16×16模式,如果计算得到的SAD小于指定的阈值T,就选择16×16模式,否则继续进行8×8预测模式并得到最终的最佳预测模式。由于每一帧图像的运动剧烈程度是不一样的,因此T的选择是动态的

式中:M,N分别为一帧图像的宽和高;w为系数,随QP动态设置,并由实验和统计得出。本帧间预测模式都没有使用帧内预测。

3.3 插值算法的修改

为了提高预测精度,减小预测残差能量,H.264标准采用1/4像素的运动估计并在参考帧中只存在整像素采样点,所以需要对参考帧首先进行1/2像素位置插值,再进行1/4像素位置插值。从文献[4]得知,计算一个1/2像素位置的插值点需要4次乘法、6次加法、1次移位,计算一个1/4像素位置插值点需要2次加法、1次移位,则对一幅CIF图像的亮度分量进行插值,大约需要352×288×3×4次乘法,352×288×(3×6+12×2)次加法以及相应的移位运算,运算复杂度非常高。本算法以JM86源代码为基础,仅保留1/2像素点的插值运算,舍去1/4像素点的插值运算。H.264标准是以1/4像素进行运动搜索和运动补偿的,所以需将整像素和亚像素中关于1/4像素点的搜索位置调整到1/2像素点,不再进行1/4像素的运动搜索,运算量减少很多,编码速度大大提高,但像素的精度没有优化前精细,图像质量会降低,码率会随之增加。

4 实验结果分析

实验的硬件环境采用奔腾4处理器、主频2.0 GHz的PC,内存512 Mbyte,以JVT发布的JM8.6为基础,使用baseline profile档次,参数为CAVLC熵编码,关闭多帧参考和NAL,不采用RD模式,编码的序列除首帧外,其余各帧都是P帧,只使用16×16和8×8两种模式,测试序列均为QCIF格式。实验结果见表2。

以上6个测试序列的编码速率都在20 f/s(帧/秒)以上,以牺牲少许编码性能来换得较高的编码速度。

最后,笔者以H.263编码器作为参考进行性能比较。实验的软、硬件条件一样,编码模式只用16×16和8×8两种模式,运动搜索算法都为改进后的搜索算法,实验结果见表3。在本编码器的PSNR普遍比H.263高的情况下,本编码器的比特率比H.263的低,这说明在相同条件下,本编码器的编码性能要高于H.263编码器。

5 小结

笔者简化的编码器模块的设计参照H.263编码标准,功能上相当于H.263编码器,但又有H.264标准的码流。因此,在对计算复杂度和速度要求很高的实时传输系统和DSP系统中都可使用本编码器来替代原来的H.263编码器,实际应用价值很大。

参考文献

[1]梁燕,刘文耀.基于起点预测的自适应快速搜索算法[J].计算机工程,2005,19:1-3.

[2]XU J B,PO L M,CHEUNG C K.Adaptive motion tracking block matching algorithms for video coding[J].IEEE Trans.Circuits and Systems for Video Technology,1999,9(7):1025-1029.

[3]沈芳.H264标准的帧间模式选择快速算法[J].图像处理,2006 (6):230-232.

标准编码 篇7

但从现有的研究来看, FIAS有其局限性。第一, FIAS未对讲授进行划分, 无法对教师的讲授进行更深入的分析。第二, FIAS系统笼统的将所有问题都归纳为提问, 无法对教师提问的质量与性质进行分析。第三, FIAS缺少对信息技术运用于课堂的分析。第四, FIAS将沉默或混乱的内容规定为“无有效语言”, 即课堂中无助于教学的沉寂。但在真实的课堂中, 教师常常要求学生进行独立思考或完成练习, 而这应是一种有助于教学的沉寂。因此, 本文重新制定了课堂分析的编码系统, 见附表。

方海光曾基于FIAS与i TIAS提出改进型弗兰德斯互动分析系统 (i FIAS) , 其优化调整主要包括以下几点:将原编码4“提问”加以区分为“提问开放式问题”和“提问封闭式问题”;将原编码学生语言维度中增加“学生与同伴讨论”, 并将“学生主动说话”细分为“学生主动应答”及“学生主动提问”;为针对数字化课堂教学环境, 也特别提出了技术维度, 分为“教师操纵技术”和“学生操纵技术”。本文基于FIAS与i FIAS, 进行以下改进:

在编码标准的分类方面, 一方面, 将“教师讲授”加以区别, 分为陈述性讲授、程序性讲授及技术性讲授。讲授法是中小学课堂教学中运用最广泛的教学模式, 教师恰当地运用讲授法能有效提升教学效果。因此, 将“教师讲授”加以区别, 分为陈述性讲授、程序性讲授及技术性讲授, 旨在更有效地记录教师在讲授方面的表现, 有利于之后的教学视频分析。另一方面, 将“无助于教学的混乱”改为“无助于教学的沉寂或混乱”;将“学生与同伴的讨论”“有益于教学的沉寂”及“学生操纵技术”合并为“有益于教学的安静或活跃”。教师提问不恰当或教学环节中断都可能导致沉寂, 而此时是无助于教学的, 故将“无助于教学的混乱”改为“无助于教学的沉寂或混乱”。在教师组织学生进行讨论或进行小组活动时, 当教师参与学生讨论, 可活跃课堂气氛、提高教学效果, 属于“有益于教学的活跃”。此外, “学生操纵技术”多数是学生利用多媒体设备完成教师布置的任务, 这种情况下如若是多人合作完成则属于“有益于教学的活跃”, 若是独立完成则属于“有益于教学的安静”。

在编码标准的描述方面, 由于教师在实际编码过程中对“教师接受情感”“教师表扬或鼓励”“教师采纳观点”这三个类目界定歧义性较高, 难以明确什么情境下对应哪个编码, 因此本文对这些易混淆的类目辅以多个具体实例加以区分。而如“陈述性讲授”“程序性讲授”“技术性讲授”“学生主动应答”“无助于教学的沉寂或混乱”“有益于教学的安静或活跃”等新增类目则给予重新定义。

总的来说, 本文研究者在编码标准描述方面主要进行了两方面的改进: (1) 对已有类目的描述加以修改、举例并细化; (2) 对新增类目下定义。

在编码标准的观察原则方面, 第一, 增加了教师自问自答这种情况下的观察原则, 详见下表。第二, 当同一个3秒内, 同时出现教师语言及学生语言, 则根据观察者判断此3秒中起到关键作用的语言属于谁。如教师提问, 此3秒内重点是教师提问内容, 而仅出现学生回答的“好”这类单一话语, 属于类别“4.1”或“4.2”;而此3秒内重点是学生回答问题的内容, 而仅出现教师回应的“还有吗”这类单一话语, 属于类别“8”或“9.1”。

通过实践过程中所获得的数据:采用FIAS进行编码的一致率为32.9%, 而采用C-FIAS进行编码的一致率为63.13%。因此, 可以验证整合型弗兰德斯互动分析系统的编码标准相较于弗兰德斯互动分析系统的编码标准具有更高的信度, 并且在具体的教学应用中发现改进后的编码系统除了更大程度地消除了编码的歧义性外, 编码呈现的结果对实际的教学也有更好的指导意义。

参考文献

[1]时丽莉.“弗兰德互动分析系统”在课堂教学中的应用[J].首都师范大学学报 (社会科学版) , 2004 (S2)

[2]方海光、高辰柱、陈佳.改进型弗兰德斯互动分析系统及其应用[J].中国电化教育, 2012 (10)

[3]李松林.课堂教学行为分析引论[J].教育理论与实践, 2005 (7)

基于HEVC视频标准的熵编码过程 篇8

在保证视频图像质量的前提下,HEVC通过增加一定的计算复杂度,可以实现码流在H.264/AVC的基础上降低50%。为了实现目标,HEVC采用了一些全新的编码技术,比如:基于LCU(Largest Coding Unit)和四叉树(Quad Tree)的灵活编码结构[1]、大尺寸变换单元结构的选择[3]、改进的去方块滤波技术以及HEVC的并行化改进设计等。

HEVC继承了H.264/AVC标准的一些基本要素,仍然采用以块为基本单元的预测加变换的混合编码结构,压缩编码过程主要包括预测过程(包括帧内预测和帧间预测)、变换过程和熵编码过程三部分。

1 HEVC中的一些关键技术

1.1 灵活的编码结构

HEVC采用灵活的四叉树编码结构取代H.264中的宏块(MB,Macroblock)提高编码效率,以CU(Coding Unit)为基本编码单元,CU的大小可以为8x8,16x16,32x32,64x64,CU根据预测情况划分为一个或多个预测单元(PU,Prediction Unit),其中PU包含多个变换单元(TU,Transform Unit),这种变换、预测和编码分离的结构,大大增加了各个环节编码的灵活性,使压缩预测更符合图像的特性。

1.2 大尺寸变换单元结构

大尺寸离散余弦变换是HEVC视频编码标准中提升编码效率的重要技术之一,H264标准中,只采用了4x4/8x8的DCT变换尺寸,而在HEVC标准中以变换单元(TU)进行变换和量化[3],二维离散余弦变换的最大尺寸为32x32,这种大尺寸变换单元的选择可以使编码器在处理高分辨率画面中经常出现平坦区域时能够更好地提高压缩编码效率。虽然DCT尺寸越大,计算复杂度也相应的有所增加,但是随着大规模集成电路芯片计算能力的提升,人们可以在两者之间做出更好地权衡。

1.3 改进的去方块滤波技术

HEVC中采用deblocking filter和样本自适应偏移技术(SAO,Sample Adaptive Offset)技术。在H.264中,去方块滤波器按照宏块先后顺序对宏块内每一个4x4块的竖直和水平边界进行滤波,由于相邻边界之间4个样点值的数据依赖性,这种滤波方式不利于数据的并行处理,而HEVC标准中只对8x8块的边界进行处理,这样相邻两条竖直边界就不存在数据依赖性,从而可以提高设计的并行性。HEVC标准中在deblock之后采用SAO技术,对每一类图像像素值加减一个偏值,可以大大降低图像的失真率。

1.4 HEVC的并行化设计

HEVC标准为了提高编码器的并行性,引入了Tile[4]和WPP(Wavefront Parallel Processing)的概念。

一幅图像可以按照光栅扫描的方式分成多个Slice,也可以依据垂直和水平边界将其划分为若干个矩形Tile,每一个Tile和Slice可以包含整数个LCU,并且都可以实现独立的编解码,从而提高编解码器的并行处理能力。支持WPP的slice内部,每一行LCU都是一个可以独立进行编解码的单元,这种处理方式尤其适用于多核处理器实现编解码器。

2 HEVC熵编码过程

2.1 HEVC的视频码流结构

与H.264的视频码流结构相似,每一个视频流都要有一个起始码字进行作为序列的起始点标识,它也可以用来标识不同的编码标准,起始码字一般都是采用定长码字进行编码,解码器只有找到起始码字才能对其他信息进行解码。图3所示为视频码流的层次化结构:

HEVC在编码过程中先将SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)头信息编入码流,不同的是,HEVC在SPS和PPS前面添加了VPS(Video Parameter Set)参数设置信息,加入VPS的主要目的是为了提高码流的兼容性,以便分级编码的视频可以在原来的设备上播放,也可以在新的支持分级编码的解码器设备上播放,接下来就是编入视频流的主体部分—Slice信息,Slice信息包括slice设置信息slice header部分和描述图像语法元素信息的slice data部分。

2.2 Slice的熵编码过程

HEVC和H.264类似可以将一帧图像分成多个独立的slice限制误码的扩散和传输,另外增加了Tile的概念,如图二所示将一帧图像分割成纵横多个矩形块在slice进行编码时,以光栅形式对每个tile矩形块进行扫描编码,每一个矩形块内也按照光栅形式对每个LCU进行扫描编码,这样大大提升了视频编码设计的并行性。

和H.264相比,熵编码的编码引擎在HEVC中并没有太大变化,仍然是采用regular,bypass,terminate三种模式,但是HEVC中的语法元素上下文表格并不再是连续的,而是某一类语法元素放在一个表格。

每一个LCU进行编码时,先将deblocking后的SAO信息编入码流,主要包括sao_merge_left_flag,sao_merge_up_flag,sao_offset_abs,sao_offset_sign,sao_type_idx_luma,sao_type_idx_chroma,和sao_band_position,经过大量测试,通过自适应样点补偿,编码出来的图像失真效果比不采用SAO要小很多。接下来是对LCU中编码单元的分割信息、预测信息和残差信息进行编码,Intra或Inter模块通过预测过程得到最佳预测模式和CU的分割情况[6],然后以CU为单位对预测信息和残差信息进行编码。CU的熵编码流程如图4所示。

1)split_cu_flag编码

首先编码CU的划分信息,64x64的LCU通过模式预测判决是否进行划分,如果不进行划分,则以64x64的块大小进行后续的预测信息和残差信息编码,否则将64x64块分成4个32x32块大小的CU,再对每一个32x32块大小的CU进行划分信息判决编码直至8x8块,所有不同大小的CUK块通过Z扫描顺序进行编码,因为8x8块是CU的最小单位,为了节省码字当检测到CU的大小为8x8时则不进行split信息编码。另外,如果视频图像的宽度和高度不能被64整除,当检测到每一行或每一列的最后一个LCU时则不对LCU进行划分信息编码。图5所示为一个LCU中的不同大小的编码单元。

2)transquantbypass_flag和skip_flag编码

transquant_bypass_flag是跳过transquant和in-loop filter过程的标志位,skip_flag是P Slice和B Slice的skip标志位,当skip标志位为1时,只需要对merge_idx(merge种类的标识位)进行编码,然后当前CU的编码结束,否则将对CU的其他语法元素进行编码。

3)prediction mode编码

prediction mode包括MODE_INTRA和MODE_INTER两种模式,当slice type=I_Slice时,prediction mode=MODE_INTRA,当slice type=P_Slice/B_Slice时,prediction mode可以是MODE_INTER,也可以是MODE_INTRA,后者将采用intra的预测方式,编码预测方向信息。为了节省码字,slice type=I_Slice时预测信息不写入码流,只对P_Slice和B_Slice的prediction mode进行编码。

4)partition size编码

partition size是PU(Prediciton Unit)大小的分区,在HEVC中采用了Symetric和Asymteric两种分割类型,共8种分割形态,如图6。

这也是和H.264仅有symmetric类型不同之处,这样考虑主要是为了照顾一些大尺寸图像的纹理分布特性。其中IN-TRA_MODE只有2Nx2N和Nx N两种形态。

1)predition infomation编码

当采用INTRA_MODE预测模式时需要编码luma/chroma intra direction,HEVC中采用了多达35种帧内预测模式,除了planar模式和DC模式外采用了33种基于方向的预测模式[6],精确地从更多的方向消除视频的空间冗余性,进一步提高帧内模式的编码效率。HEVC提出的planar模式能够更好得预测画面的平坦区域,对于高分辨率的大块区域可以取得较好的预测效果。split_flag,skip_flag,luma direction在HEVC熵编码中的上下文建模属于典型的运用空间相邻的同类语法元素作为依据的设计,上下文选择的依据是左侧CU和上侧CU的信息[2],但是在选择top direction时,HEVC并没有采用上面LCU的CU direction作参考,仅仅在LCU内部CU编码时会用到上面CU的direction作为参考[4],这和H.264中选择上面宏块的预测模式有所不同。当采用INTER_MODE模式进行编码时,需要编入ref_frame_idx,mvp_idx,mvd信息,因为prediction info是基于PU为单位进行编码的,所有针对不同的PU分割类型要对每一个PU块的mv信息进行编码。

2)coefficient编码

HEVC以变换单元(TU)为基本单元进行变换和量化,支持4x4到32x32尺寸大小的变换单元,DCT变换同样采用四叉树的变换结构,这样有利于提高大尺寸变换的单元的编码效率。如图七所示,TU block的depth最大为2。

在进行残差编码时,首先编写TU的分割信息。与CU的划分编码类似,如果当前TU块可以划分,然后以Z扫描方式递进到每个子块中进行划分,不然则直接对残差信息进行编码。首先编码cbf(coded block flag)信息,cbf_cb,cbf_cr,cbf_y,如果TU可划分,如图七(b)所示,则在遍历四个TU子块之前进行cbf_cb,cbf_cr编码,而cbf_y则要针对每个TU子块都要进行编码。然后对TU的QP差值dqp(delta qp)进行编码,每个CU编码一次dqp。最后对残差信息进行编码,由于HEVC中采用大尺寸变换单元结构,而残差信息大部分集中在TU块左上角,所以HEVC进行残差系数扫描时,引入了Diagonal Scan扫描方式,如图8所示,

不仅4x4块中系数按照Diagon Scan方式扫描,每个4x4 block块也是按照Diagonal Scan方式扫描,在残差系数扫描中,HEVC还采用了Vertical Scan和Horizontal Scan扫描方式,MODE_INTER编码模式只采用Diagonal Scan扫描方式,MODE_INTRA模式的扫描方式将通过预测方向信息来决定。

第一个要编写的语法元素是扫描的最后一个非零残差系数坐标last_sig_coeff_x和last_sig_coeff_y[5],这两个语法元素都是由前缀和后缀组成,前缀是按照算术熵编码写入,后缀是按照定长编码写入。然后依次编码非零系数标志位(significant_coeff_flag),大于1系数标志位(coeff_abs_level_greater1_flag),大于2系数标志位(coeff_abs_level_greater2_flag),非零系数符号位(coeff_sign_flag),最后将大于2的残差系数绝对值去2后编码。

当一个LCU中所有的CU数据信息编码完成之后要进行terminate标识位编码。

3 结束语

目前,HEVC标准已经基本定稿,很多技术层面较之前的编码标准都有大幅度的提高,标准中采用的许多新技术和理念都有利于提高HEVC的编码效率,新标准的制定,必将掀起新一轮的视频研究工作的热潮。该文结合前段时间所做的软件建模工作对HEVC的熵编码过程进行了分析,接下来的工作主要致力于编码器的硬件实现和优化设计。为了提高硬件设计的吞吐率,硬件算术编码引擎采用可处理multi-bins的多级流水线结构,diff-banks SRAM来存储上下文表格,针对不同大小TU块的残差数据编码过程,提出合理的ping-pong结构来避免扫描过程和编码过程的等待,缩短编码周期;为了更好的控制datapath处理过程,采用高效的转换状态机来处理各个语法元素的编码过程。

参考文献

[1]刘昱,胡晓爽,段继忠.新一代视频编码技术HEVC算法分析与比较[J].电视技术,2012,36(20):45-49.

[2]车效音,尹宝才.面向下一代视频编码标准的帧内预测与熵编码技术研究[D].北京:北京工业大学,2012:1-68.

[3]刘梅锋,陆玲.新一代视频编码标准HEVC变换方法的研究[J].电视技术,2012,36(1):1-5.

[4]Joint Collaborative Team on Video Coding(JCT-VC)of lTU-T SGI6 WP3 and ISO/IEC JTC 1/SC 29/WG 11[C].High efficiency vid eo coding(HEVC)text specification draft 9,JCTVC-KI003.11th Meeting:Shanghai,CN,10-19 October,2012.

[5]Vivienne Sze,Madhukar Budagavi.High Throughput CABAC Entropy Coding in HEVC[J].IEEE_TCSVT,2011:1778-1791.

上一篇:中学声乐课下一篇:工资协商