基于模式识别论文

2024-06-05

基于模式识别论文(通用6篇)

篇1:基于模式识别论文

基于神经网络ZISC的模式识别系统

摘要:首先介绍人工神经网络ANN实现技术的历史、现状和发展,着重分析RBF网络的原理及其建立在超大规模集成电路基础上的硬件神经网络的设计方法。然后,介绍一种新的硬件神经网络技术ZISC的工作原理和应用。最后,以ZISC036芯片为例,实现一个模式识别系统。

关键词:人工神经网络 ZISC 超大规模集成电路 径向基函数 模式识别

引言

当前对人工神经网络ANN(Artificial Neutron Network)的研究热潮源自Hopfield J.[1]和McclellandJ.等人于20世纪80年代发表的论文[2],[3]。Hopfield提出了激活函数为非线性的反馈网络,并将其成功地运用于组合优化问题;Mcclelland和Rumelhart用多层前馈网的反向传播学习算法(Back Propagation)成功地解决了感知器不能解决的“异或”问题及其它的识别问题。他们的突破打消了此前人们由于简单线性神经网络感知功能的有限而产生的,使ANN成为了新的研究热点。之后,新的网络结构和新的学习算法层出不穷,目前常见的都已达到几十种。在这些神经网络中,径向基函数RBF(Radial Basic Fuction)网络由于具有强大的矢量分类功能和快速的计算能力,在非线性函数逼近等方面,特别是模式识别领域,获得了广泛的应用,从而成为当前神经网络研究中的一个热点[4]。

模式识别是人工智能经常遇到的问题之一。其主要的应用领域包括手写字符识别、自然语言理解、语音信号识别、生物测量以及图像识别等领域。这些领域的共同特点都是通过对对象进行特征矢量抽取,再按事先由学习样本建立的有代表性的识别字典,把特征矢量分别与字典中的标准矢量匹配,根据不同的距离来完成对象的分类。以识别手写数字为例,字典中有由学习样本建立的10个标准矢量(代表0~0),把从识别对象中抽取的特征矢量分别与这10个标准矢量匹配,矢量间距离最短的就说明别对象与这个标准矢量的分类最接近,进而识别出其表示的数字。

模式识别过程中,产生一个具有代表性的、稳定且有效的特征矢量分类匹配策略,是补偿变形、提高识别率的有效途径,如何确定分类器是识别系统成功的关键。可以说,模式识别的本质就是分类,就是把特片空间中一个特定的点(特征矢量)映射到一个适当的模式类别中。传统的模式识别分类都是基于串行处理的匹配策略:首先由学习样本建立识别基元(字、词、音、像素)的标准矢量识别字典,取取的特征矢量顺序与字典中的标准矢量计算区别得分;最后根据概率做出决策,输出识别结果。当模式类别很大时,识别速度会下降得很快,而近年来,用RBF网络解决这方面的问题得到了很好的效果。

理论模型要求发展神经网络型计算机来实现,但迄今 为止,这方面的工作限于条件还主要集中在传统计算机的软件模拟实现上。大多数学者认为,要使人工神经网络更快、更有效地解决更大规模的总是,关键在于其超大规模集成电路(V LSI)硬件的实现,即把神经元和连接制作在一块芯片上(多为CMOS)构成ANN。正是因为上述的原因,其中神经网络的VLSI设计方法近年来发展很快,硬件实现已成为ANN的一个重要分支[5],[6]。

以下介绍IBM的专利硬件RBF神经网络芯片技术ZISC(Zero Instruction Set Computer),并给出用ZISC设计和实现的一种模式识别系统。

1 用VLSI设计硬件神经网络的方法

神经网络的IC实现是比较困难的,设计者必须把神经系统模型的特性反映到受半导体工艺和IC设计规则制约的电路中去。用VLSI设计硬件神经网络的方法主要分为数字技术、模拟技术和数模混合技术等,下面分别作简要介绍。

(1)用模拟技术实现硬件神经网络

模拟神经芯片通过单元器件的物理性质来进行计算,因而可以获得很高的速度。神经元的核函数计算功能一般由乘法器或运算放大器来完成,而连接权值大多以电压形式存储在电容上或是以电荷形式存储在浮点门上。利用模拟神经芯片不仅可以制造多层前向感知器那样的传统结构,还能从形态上进行如硅视网膜这样的生物仿真设计,从而更有效地模拟生物学功能。

在解决实时感知类的问题中,模拟神经芯片扮演着主要的角色。因为这些问题不要求精确的数学计算,而主要是对大量的信息流进行集合和并行处理,这方面低精度的模拟技术从硅片面积、速度和功耗来看具有相当大的优势。但是模拟芯片的抗干扰性差,设计中需要考虑对环境因素变化引起的误差进行补偿,非常麻烦;它的另一个缺点是,制造一个突触必须考虑权值存储的复杂性,同时要求放大器在很宽的范围内呈现线性[5],[6]。

(2)用数字技术实现硬件神经网络

用高低电平来表示不同状态的数字电路是信息工业中最常用的技术。数字神经芯片有非常成熟的生产工艺,它的权值一般存储在RAM或EPROM等数字存储器中,由乘法器和加法器实现神经元并行计算。对设计者来说,数字神经芯片可以以很高的计算精度(达到32位或者更高)实现神经元核函数。另外,用数字技术实现神经网络时,通常可以采用标准单元库或可编程门阵列直接进行电路设计,这样可以大大减少设计时间[5],[6]。

数字神经芯片不仅具有容错性好、易于硬件实现及高精度、高速度的优点。更重要的是有很多数字电路CAD的软件可以作为设计工具使用。但要实现乘/加运算,需要大量的运算单元和存储单元。因而对芯睡面积和功耗要求很高。为了适应大面积的数字电路的要求,现在很多数字神经芯片都采用了硅片集成技术(Wafer-Scale Integration)。

(3)用数模混合技术实现硬件神经网络

出于上述种种考虑,许多研究人员提出并采用了各种数模混合神经芯片,具有数字及模拟工艺各息的优点而避免各自的缺点,运算速率高,芯片面积小,抗噪声能力强且易于设计。典型的数模混合信号处理部分则全是模拟的。这种结构很容易与其它的数字系统接口以完成模块化设计。近年来在各种数模混合神经芯片设计中,利用脉冲技术的数模混合神经芯片和利用光互连技术的光电混合神经网络芯片得到了广泛的关系,它们代表神经网络未来发展的方向。

尽管数模混合神经芯片有种种优点,但它也存在着一些不足。比如,对于大多数数模混合神经芯片来说,训练学习算法的实现往往需要一个附加的协处理器,这无疑会增加整个神经网络系统的成本和复杂性[5],[6]。

2 RBF网络原理和它的硬件实现

RBF网络是一种有导师的三层前馈网络。它最重要的特点是中间隐层神经元的基函数只对输入剩激起局部反应,即只有当输入落在输入空间的 一个局部区域时,基函数才产生一个重要的非零响应;而在其它情况下基函数输出很小(可近似为零)。网络结构如图1所示。

(本网网收集整理)

图1(a)描述了隐层神经元的作用,其中X=(x1,x2,…,Xn)是输入层的输入矢量;C=(w1,w2,…,Wn)是该隐层神经元的中心矢量(每个隐层神经元的中心徉量存储在其与输入各种神经元之间的连接权中),σ代表宽度(半径);而|| ||表示n维空间中矢量之间的距离(这里的距离不一定是数学意义上的欧几里得距离,在不同的情况下可以有种种含义);f是隐层神经元的基函数,目前用得比较多的是高斯分布函数。

RBF网络每个输出层结点的输出为其与各隐层神经元输出y的加权求和。按高斯分布函数的定义,隐层神经元的输出y与输入矢量x的函数关系应服从正态分布,即当X与中心矢量C的距离很矢时,y接近最大值;反之y值减小。如X与C的距离超过宽度σ(即远离中心)时,输出y可近似为零,相当于对输出层没有贡献。这就实现了局部感知。

不难看出,RBF网络用作矢量分类器时,输入层神经元个数由矢量空间的维数决定,隐层神经元个数由模拟类别数决定,每个隐层神经元的中心矢量(与输入层各神经元之间的连接权)都代表一种模式类别。输入矢量与哪个隐层神经元的中心矢量距离近,哪个隐层神经元的基函数输出就大,相应的模式类别对输出层的贡献就大;与哪个隐层神经元的中心矢量距离远,哪个隐层神经元的基函数输出就小,甚至不激活,输出0,相应的模式类别当然就不会影响RBF网络的输出,矢量和模式类别的分类由此完成。

相对于网络结构的简单,RBF网络权值的训练方法要复杂一些。通常分为下面的两个步骤。

①隐层和输入层之间的权值采用无教师聚类方法训练,最常用的是KNN法(K-Nearest-Neighbor)。它的基本思想是先设定训练样本的一个子集;再用模式分类算法LBG由这个子集形成N种类的模式,即把子集中的样本归类;然后,按顺序处理子集外的训练样本:对任一样本X,找出K个与X距离最近的矢量(随便找,只要近就行),计算这K个矢量分别属于N个模式种类的数目,哪个模式种类包含的最近矢量最多,X就属于哪个模式种类。

将输入的训练样本聚类后,每个模式种类中所有样本矢量的平均值就代表该隐层神经元和输入层之间的权值(中心矢量);而所有样本矢量与中心矢量的平方差的平均值就代表宽度σ。这样就做出了各个隐层神经元的全部参数。因为这种方法只要求输入训练样本就可以进行分类,无须知道训练样本的理想输出,因此被称为无教师方法。

②输出层和隐层之间的权值采用有教师聚类方法训练。简便实用的一种办法是:在确定隐层和输入层之间的权值之后,把训练样本矢量和其理想输出代入RBF网络,从而推出各个输出层神经元和隐层之间的`权值。

可以看出,需要分类的模式类别数的增加总可以通过不断增加三层RBF网络隐层神经元数来实现,含义十分直观。由于其学习过程为两步,且每一步的学习算法都十分有效,所以它的学习速度很快。RBF网络主要适用于解决已知的大规模分类问题,比如图像目标跟踪、面部和双眼的生物图像识别等。

对RBF网络的硬件实现技术,目前存在着不同的观点。但就有大规模分类和实时要求的模式识别问题而言,数字电路技术是最合适的选择,原因有以下几点:

①RBF网络用于手写字符识别、生物图像识别、自然语言理解这样的领域时,需要分类的模式类别数往往成千上万,所以要求隐层神经元数极大,单片神经芯片很难完成。使用数字神经芯片,网络的扩展十分容易,一般不需要外围逻辑器件而只要电阻就可以完成;而用数字神经芯片由于精度高,理论上可以无限并行扩展,且性能不下降。

②一个实用的模式识别系统,分类的模式往往会随着样本与环境的变化而变化,这就需要不断调整权值。数字神经芯片的权值存在数字存储器中,存储和恢复都很方便。这样用于模式识别系统的RBF网络的权值易变性得到

了保证。

③模式识别系统对特征矢量提取对象的预处理是比较困难的工作。预处理效果不好时,RBF网络的输入往往含有噪声。数字神经芯片在抗干扰性方面与其它V LSI技术相比,显然具有无可比拟的优势。

④模式识别的要求包括模糊匹配和精确匹配两种。当用RBF网络实现精确匹配时,模拟技术完成不了这个要求,此时,数字神经芯片是避免错误输出的唯 一选择。

3 ZISC技术及其在模式识别中的应用

虽然人们已经在神经网络的硬件实现上做了大量的工作,并实现了许多不同的网络结构和算法;但是RBF网络的硬件实现工作却了了无几。这说明幅度当前的IC技术实现RBF网络的功能对设计水平的要求是比较高的,因此,本文介绍的这种商业芯片ZISC就成为了模式识别系统的一种有价值的神经网络硬件平台。

无指令计算机ZISC是世界著名的IBM实验室的一项创新性科研成果[7],它采用数字电路技术实现了RBF神经网络及KNN学习算法的集成电路芯片。作为ZISC芯片的合作发明人与授权生产商,美国Silicon Rcognition公司专业从事ZISC技术推广,其生产的ZISC036是一颗含有36个隐层神经元,专门用于各种模式识别矢量分类的集成电路。以下列出了它的一些主要特点与功能:

*使用RBF网络模型,无须编程而只须给它训练样本,即能实现学习和自适应识别;

*全并行运算,模式分类速度与隐层神经元存储的矢量数量完全无关;

*无须外围逻辑电路即可实现多片ZISC036级连,模式分类数量及神经网络规模没有限制;

*输入和存储的矢量分量数目从1~64个可调(每个分量8位);

*超快速度,64个分量的特征矢量的识别在4.8ms内完成(主频时钟20MHz);

*用寄存器存储神经网络全局信息与神经元信息和权值;

*CMOS和TTL兼容的I/O,TQFP144封装,5V标准电源供电。

不难看出,应用这种神经网络芯片不需要操作系统和编程语言,主要的工作就是训练它和让它学习。因此,用它开发面向消费类的模式识别产品是一种简单且实用可行的方法,可以大大地缩短研发周期。

本文给出了用六片ZISC036级连,通过印制电路板实现的通用模式识别系统。图2为这个系统的总体框图。

系统通过PCI总线接受待识别的模式原始数据。数字存储在2个8MB高速DRAM区中。神经网络控制器选用Xilinx Virtex FPGA,它的主要功能是完成对原始数据的特征矢量提取并输入到ZISC036芯片阵列中。可以使用标准的FPGA开发工具生成不同的RBF文件,从而实现不同的特征矢量提取电路。ZISC036芯片阵列按照三描述的方法一个个顺序接受矢理输入,然后进行并行的学习和分类,识别结果作为输出返回。只要修改FPGA中的特征矢量提取电路和界面程序,就可以实现图像、话音等各种不同的模式识别程序,只要修改FPGA中的特征矢量提取电路和界面程序,就可以实现图像、话音等各种不同的模式识别功能。这个通用模式识别系统的性能以传统CPU或DSP的指标来衡量,相当于13.2GPS(每秒执行132亿条指令)。

用上述系统可以完成如图像目标跟踪、图像识别、数据挖掘等许多实时性要求很高的模式识别和分类功能。以下用一个自适应图像目标跟踪的实验作为例子,视频图片演示结果如图3所示。

图3的视频图片从一段AVI文件中捕获。首先从初始的视频帧中选定汽车的图像,提取其纹理特征作为训练样本输入到ZISC神经网络。然后,ZISC神经网络在后面接下来的视频帧中搜索类似的图像纹理模式并圈定跟踪目标的坐标。如果发现所跟踪目标的模式发生变化,ZISC神约网络能够自动学习新的特征并建立一个新的模式存入神经网络。通过不断地比较已存入神经网络的模式和所跟踪目标之间的区别,系统就能够识别目标,从而在拥挤的背景和变化的环境下始终锁定目标。实验用视频图片为320×240像素,跟踪目标扫描范围为20×20像素。

结语

RBF神经网络的硬件实现是实现高速大规模模式分类的关键,而使用现有的比较成熟的商业芯片又无疑能简化模式识别系统的开发工作。IBM的ZISC采用数字电路技术实现了RBF神经网络芯片,用它作为核心,既能够大幅度提高识别性能,又能够缩短开发周期,是设计高性能模式识别。

篇2:基于模式识别论文

模式识别是将待识别对象的特征与给定样本信息进行比较、匹配,并给出识别对象所属模式的判断.在计算机识别与控制系统中,常常要解决基于特征向量的模式识别问题,在这类识别中,标准模式与待识别对象均是以特征向量的形式表现.由于客观事物的复杂性和不确定性以及人类思维的模糊性,在解决实际问题时,往往会因计算、测量数据带有误差而不能用确定的数来表示特征值,从而导致了特征向量的分量的不确定性,在数量上的反映往往不是一个确定的数值,而是一个范围,适合用区间数表示.因此,本文研究特征向量的分量以区间数呈现的模式识别方法,以拓广模式识别方法应用的对象.表示 a 与 b 之间的距离.这种表示方法是将区间数视为平面上的点,并没体现区间数所呈现的不确定性.实际上,区间数完全由其宽度与中心确定,而在一定程度上宽度反映了不确定性的信息范围,中心反映了不确定性的信息取值的平均值.同时,考虑到区间数的宽度与中心对不确定性信息的影响,因此,给出如下距离概念.在实际识别中,识别对象往往由多个特征刻画,而这些特征值的物理量纲也不尽相同,为了消除不同物理量纲对计算结果的影响,就需要对这些特征值进行规范化处理.最常见的类型有效益型和成本型.由于本文对区间数距离的定义是基于区间数的中值和宽度,因此我们采用文献中的基于中值—半宽的规范化方法.规范化方法介绍如下: 2 模式识别方法2.1 模型描述令 C = c1,c2{,…,c }n为特征集,特征的权重向量 W =(w1,w2,…,wn).对象相对于某一个特征的特征值往往具有不确定性,因此用一个区间数来表示特征值,对每一个特征值作规范化处理.这样,对象可视作 n 维区间数向量(称之为特征向量).这样,对待识别对象的识别,即归属哪一个标准模式之中的问题,可转化为特征向量之间的接近程度来考虑.为此,结合本文中的贴近度,给出择近原则如下描述,用于基于区间数的距离的模式识别之中.算例分析随着无线电通讯技术的发展,考试作弊手段越来越现代化.为了防范考试作弊现象,需要对考场周边的电磁环境进行监测和评估,以便高效地发现高科技作弊信号.本文从无线电信号强度、频率占用度和频段占用度三个方面基于模式识别方法对考场电磁环境进行分析.依据历史数据和专家经验将电磁环境的复杂度分为五个等级,将其视为五种标准识别模式,表示为 A1,A2,A3,A4,A5,其中依据择近原则该考场电磁环境属于“二级”,本文结果与实际电磁环境一致.

篇3:基于模式识别论文

随着国民经济持续高速发展, 公路运输需求强劲增长, 公路基础设施建设取得了飞跃式发展。《国家高速公路网规划》于2004年经国务院审议通过, 同时也是中国公路网中最高层次的公路通道。《国家高速公路网规划》采用放射线与纵横网格相结合的布局方案, 形成由中心城市向外放射以及横贯东西、纵贯南北的大通道, 到目前为止, 全国高速公路通车里程已超过到6万公里。

在公路上行驶的载重卡车、大型平板车、拖挂车等大型载货车辆的数量急剧增加。但与此同时, 公路超限运输也愈演愈烈, 危害性越来越大, 造成对路面和桥梁的严重损害, 大大缩短了公路使用寿命, 也严重威胁人民生命财产安全。为此, 交通主管部门进行了多方面的研究和实践。借鉴国外成功的经验, 从2003年起, 部分省市高速公路试行对载货汽车实施计重收费、超限运输实行加重收费、对恶意超限运输车辆实行惩罚性的收费方式。

目前, 国内高速公路基本已经全部实行计重收费, 计重系统设备以称重台和数据处理器为核心, 配接车辆分离器、轮轴识别器等, 在货车通过的时候, 取得车辆的轴重、轴型等信息, 以此来计算货车的缴费金额。计重系统设备中的轮轴识别器的主要作用是检测货车轮胎数, 现在采用的轮轴识别器由埋设于路面下的多个开关设备或传感器件组成, 按照一定的间隔进行排列。在实际使用中, 计重设备中故障出现最多的就是轮轴识别器, 轮轴识别器出现故障的原因是车辆所载煤泥、水等脏物渗入轮轴识别器后, 开关设备或传感器件受潮湿失效或损坏, 还有部分轮胎磨损严重, 该压的地方没压下去, 从而导致工作不正常, 并且维修很不方便。轮轴识别器出现故障后就会对过往车辆的核载量出现偏差, 往往是核载量偏小, 导致超载率升高, 引起司机和收费员的争执问题, 以致收费车道开始涌堵, 造成收费站的瘫痪。因此研制一种新型的具有低故障率的快检系统势在必行。

2 技术改良的可行性和成熟性分析

2.1 系统结构和技术创新性论述

计重系统 (如图1所示) 设备以承载器和相应处理器为核心, 配接进口主车辆分离器 (红外光幕) 、辅助车辆分离器 (地感线圈) 、轮轴识别器等。

当车辆行使经过承载器后, 称重传感器将所承受的压力信号按一定比例转换成电压信号后送数据处理器, 数据处理器对模拟信号采样, 并对采样结果做数字滤波处理, 计算后得到轴重量送发送缓冲区;车辆驶离承载器后, 继续前行碾压轮轴检测器, 轮轴识别器通过判断被压传感器个数确定轮胎宽度, 通过轮胎宽度得出轮胎个数信息;数据处理器通过检测车轴距离确定轴组个数;车辆分离器提供分离车辆信号, 所有信息传输给车道收费计算机, 收费计算机按照计重收费标准计算车辆的计重收费金额, 并进行收费和车辆放行。

各信息具体实现方法如下:

●车辆轴重检测的实现:车辆的轴重是通过承载器的称重传感器直接测得, 但是要根据秤台上四路传感器信号的差异判别车辆的行驶方向和速度, 用存储于下位机中的有关参数进行修正, 以得出最接近真值的数据, 当车辆在承载器台面上停顿时则需等该轴完全驶下承载器时再对数据进行处理和传输。

●车辆整车重量检测的实现:车辆通过承载器的每一轴重量都暂存在数据处理器中, 车辆完全驶离承载器后, 车辆分离器送来收尾信号, 数据处理器将各轴重量相加得出整车重量。

●轮胎数检测的实现:因为轮胎数是确定车辆轴型的重要参数, 而轴型又是确定车辆是否超限的重要依据, 所以必须实现轮胎数的检测。轮胎数的检测是由安装在承载器顺车行方向下方设置的一台轮轴识别器实现的。在车道中心线一侧的路面上装置10只或以上均匀分布的轮轴识别单元, 每个单元的输出均与轮轴检测器的输出装置相连, 当车辆通过时轮胎与地面接触部位的数量和面积可以由轮轴识别单元检出, 信号由输出装置进行处理得出一侧的轮胎数和轮胎宽度, 从而确定单胎和双胎。

传统的轮轴识别器如图3:

●车辆轴组检测的实现:车辆轴组可以通过相邻两轴或三轴称重信号出现的时刻, 当时测得的车速来判断是单轴、双连轴还是三连轴, 然后确定哪些称重信号是一个轴组的。

●车辆轴型检测的实现:在前述监测数据实现的基础上, 可以利用轮胎数、轴组来得出车辆的轴型。

●自动判别车辆是否超限的实现:车辆每一轴的轴重在数据处理器内都单独存放, 并与其轴型的判断数据结合与设定的超限值进行比较, 计算后的超限值单独放缓冲区。

拟技术改良的方法和创新点主要有两方面:

1) 采用软件的方式, 实现轮轴识别, 从根本上解决传统的硬件式轮轴识别器故障率高、维修困难的问题。

2) 将模式识别技术应用于轮轴识别, 首先将货车的特征数据数字化, 变换为适于计算机处理的数字信息, 随后进行特征抽取, 特征抽取后可进行分类, 即从特征空间再映射到决策空间。为此而引入鉴别函数, 由特征矢量计算出相应于各类别的鉴别函数值, 通过鉴别函数值的比较实行分类。

2.2 改良技术与国内外同类产品现行指标比较

轮轴识别器是为高速公路公路计重收费系统车辆轮轴识别检测而设计, 用于检测通过车辆的轮轴单双轮状态, 确定其标准载重范围。轮轴识别器广泛应用于公路计重收费、路政超限车辆检测和港口码头称重管理等领域, 目前市场上使用的主要有两种:一种是使用霍尔开关设备, 另一种是使用传感器, 传感器型又分为压力传感器、光纤光栅传感器等。传统的轮轴识别器从其工作原理来讲, 都必须敷设于路面上, 当车轮压过时, 通过产生的开关量信号或传感器信号, 来检测通过车辆的轮轴单双轮状态。由于过车路面环境比较恶劣, 重车通过频次较高, 油污、车辆所载煤泥、水等脏物多, 这些不利因素必然会影响传统的轮轴识别器使用和维护。虽然, 目前有很多厂家通过改进轮轴识别器的封装技术或使用新型传感器来降低环境因素对设备的影响。例如用橡胶封装传感器, 但在北方日夜气温变化较大, 尤其地面温度日夜变化较大时, 采用橡胶易老化失效。再如使用光纤光栅轮轴识别传感器作为传感部件, 具有防潮、防电磁干扰、易维护等优点。但都无法从根本上解决路面恶劣环境对轮轴识别器的影响, 只能是或多或少降低对设备的影响程度。

基于模式识别的轮轴识别器, 运用模式识别技术, 采用软件的方式, 根据计重仪表提供的货车轴间距、轴重、车长等数据, 通过运算分析, 与建立的货车轮轴类型模型数据库进行对比, 判别货车轮轴类型。从根本上解决传统的轮轴识别器由于工作环境恶劣而故障率高、维护困难的问题, 国内有几家企业已经着手研发新型的轮轴识别器, 但目前都还处于摸索起步的阶段。

3 技术改进的原理分析

模式识别的目的:利用计算机对物理对象进行分类, 在错误概率最小的条件下, 试识别的物体尽量与客观物体相吻合。在特征空间和解释空间找到一种映射关系, 从模式得到的对有用空间的度量、基元构成的空间。

依靠所需类别的数据样本集, 按他们的特征、向量来确定判别函数, 只有判别函数确定以后, 才能用它对未来模式进行分类, 对分类模式要有足够的先验知识, 通常要采集足够数量的具有典型性样板进行训练。用某种相似性度量的方法, 将原始数据组织成有意义的和有用的各种数据, 该方法是通过识别对象各部门之间的联系, 达到识别分类的目的。

4 课题主要研究方案和工艺路线

4.1 研究内容、技术路线

本项目主要研究的技术包括:1) 轮轴识别技术;2) 模式识别技术;3) 单片机技术;4) 高速公路计重设备。其中的技术难点主要是模式识别技术, 模式识别 (Pattern Recognition) 是指对表征事物或现象的各种形式的 (数值的、文字的和逻辑关系的) 信息进行处理和分析, 以对事物或现象进行描述、辨认、分类和解释的过程, 是信息科学和人工智能的重要组成部分。具体到本项目中, 需要对货车的尺寸参数 (包括车长、轴距等) 、质量参数 (包括载质量、整备质量、满载总质量、轴荷空载质量、轴荷满载质量等) 、轴型参数等信息进行处理分析, 找出各种类型货车在各种装载情况下这些参数的差异, 从而能够根据这些信息准确对各种货车进行分类定义, 也就是建立货车类型模型库。

4.2 车辆轴限及车货总重限判别标准

根据2004年国家标准GB1589-2004《道路车辆外廊尺寸、轴荷及质量限值》和2000年交通部第2号令《超限运输车辆行驶公路管理规定》, 比较车辆总轴重限载与车货总重限载, 取两者之中的最小值为判别标准。

●轴限标准:单轴 (每侧单轮胎) :7 t;

单轴 (每侧双轮胎) :10 t;

并装双轴 (每侧双轮胎) :18 t (每少2个轮胎减4 t) ;

并装三轴 (每侧双轮胎) :24 t (每少2个轮胎减4 t) 。

●车货总重限的标准

2轴车:17 t;

3轴车:25 t;

4轴车:35 t;

5轴车:43 t;

6轴车及以上车:49 t。

4.3 载货汽车的类型标准

据国家发改委发布的产品公告及其他有关载货汽车的标准规定, 目前有以下几类轮轴类型:

5 达到的质量指标和市场应用前景

5.1 预期达到的技术指标

基于模式识别新型轮轴识别器预期达到的技术指标:

1) 基于模式识别技术, 采用软件的方式, 判别货车轴型。识别正确率达到98%以上。

2) 采用单片机技术, 对目前高速公路使用的计重设备无须改动, 直接安装在计重仪表与上位机 (收费车道计算机) 之间, 通过串口进行连接。也可以直接安装在称重仪表里。

3) 平均无故障时间 (MTBF) 从20 000 h提升至100 000 h, 平均维修时间 (MTTR) 从1 h提高至仅需10 min。

5.2 课题的成熟性和可靠性论述

篇4:基于模式识别论文

船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进行改进,将其作为轨迹相似度的评价标准.采用无监督DBSCAN聚类算法实现船舶运动模式的提取.利用琼州海峡船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据,对该水域的船舶运动模式进行提取,获得行驶于该水域的船舶运动轨迹分布以及各类轨迹中转向区域的分布,其中船舶运动轨迹包括从琼州海峡东峡口向西航行的船舶轨迹,从琼州海峡西峡口向东航行的船舶轨迹,从秀英港前往海安港的船舶轨迹,从海安港前往秀英港的船舶轨迹和从琼州海峡东峡口前往海口港的船舶轨迹.将最终的聚类结果应用于电子海图显示与信息系统(ElectronicChartDisplayandInformationSystem,ECDIS)上,实现了对船舶的动态监控仿真.

关键词:

船舶自动识别系统(AIS);模式识别;聚类分析;电子海图显示与信息系统(ECDIS);琼州海峡

中图分类号:U697.33

文献标志码:A 收稿日期:20150907 修回日期:20151102

0引言

随着全球船舶自动识别系统(AutomaticIdentificationSystem,AIS)岸站的建立和不断完善,各地海事主管机关时刻都能接收到大量有关船舶信息的数据.对这些数据的研究可以帮助我们提取船舶运动模式,分析船舶行为,从而进一步挖掘不同航线船舶、不同类型船舶的运动特点.例如:在一些运量较大的港口附近,对船舶运动轨迹进行分类能够帮助监控人员识别异常行为;根据渔船运动的无规律性和货船运动的周期性,利用聚类结果区分船舶种类,判断运动特征是否与船舶类型相符,是否需要进一步的监控和调查.此外,船舶运动轨迹的聚类分析能够为航路规划和定线制的设计提供理论依据,有利于加强船舶动态监控,提高海事监管的效率.

目前国内外学者提出了诸多从目标对象的轨迹中获取运动模式的方法.SHU等[1]利用自组织映射网络作为预处理技术标记行人的运动特征,然后采用后向算法建立马尔科夫模型,实现了对人行为模式的提取;胡宏宇等[2]以改进的Hausdorff距离作为相似度标准,采用谱聚类算法实现了对车辆轨迹空间分布的提取;闻佳等[3]利用加权的Hausdorff距离和周分割算法实现了车辆轨迹的聚类;RISTIC等[4]基于港口信息,采用核密度估计的方法对船舶轨迹进行分类;ETIENNE等[5]提出了一种基于统计学和图论的轨迹聚类分析方法,该方法将船舶的起讫港作为节点,将相似轨迹归一化为特定的有向路径;AARSETHER等[6]采用图像匹配的方法对船舶轨迹进行聚类;GERBEN等[7]对提取船舶运动模式的两种主要的相似度对比的方法进行了分析,总结出二者中更适合于船舶轨迹聚类的方法;ANDERS等[8]将轨迹聚类应用于近海监控系统来识别船舶的异常行为;LAXHAMMAR等[9]通过高斯混合模型和核密度估计的方法对船舶运动进行统计分析,获得有异常行为的船舶数据.此外,神经网络和以K均值为代表的无监督聚类方法也被广泛应用于轨迹聚类,如JONHSON等[10]建立自组织特征映射网络学习轨迹分布模式,ATEV等[11]则利用K均值算法完成对轨迹的聚类.

海上交通与陆路交通有一定的相似性.道路被划分为单行道、双行道等,而航路也被划分为单向航路和双向航路.虽然海上交通的航行范围广阔,但在某些特定水域(港口、通航分道、狭水道)船舶密度较大,轨迹分布较密集.鉴于此特点,应用在陆路交通上的一些方法也可以应用到海上交通,以提高海上交通的监管力度和效率.

1AIS数据的预处理

由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS数据通常具有较高的可信度,但是AIS数据中的船舶位置、船舶速度等信息会由于设备以及信号漂移等原因发生较大的改变,如AIS数据显示船舶位于陆地上,显示航速为35kn甚至更高[12].

为保证数据的可用,需要对数据做预处理,具体方法如下.

2轨迹聚类

移动目标轨迹的聚类能否取得良好的效果,在于轨迹间的相似性度量是否合理.当前主要的相似性度量的方法有基于欧氏距离的算法、基于公共子序列的算法、基于动态时间弯曲距离的方法和基于Hausdorff距离的方法,其中基于欧氏距离的算法通常用于计算等长的船舶轨迹相似性,其他的几种方法可以用于不同长度的船舶轨迹相似性计算.以上方法都仅从距离方面反映相似度,而基于轨迹结构距离的相似性度量方法的优点在于能够刻画每条子轨迹变化的趋势.因此,为便于度量船舶轨迹的变化,需要将整条轨迹划分成若干条子轨迹.

2.1轨迹分割

船舶轨迹的划分是通过设置船舶转向角的阈值实现的.船舶轨迹转向角是指相邻两个子轨迹段的航迹向之差,见图1.

图1中,a,b为轨迹中的两条子轨迹段,其航迹向的夹角为θ1,即为这两条子轨迹的转向角.鉴于AIS数据的位置坐标采用的是WGS84坐标系,利用恒向线直接反解算法[13]求得两条子轨迹段的航迹向,根据其航迹向的差值可以获得船舶子轨迹间的转向角.

恒向线直接反解算法的步骤如下.

2.2轨迹结构相似性度量

船舶子轨迹段相似性计算从子轨迹段的航迹向和两条子轨迹段间的距离两个方面进行.对两方面的度量结果赋以一定的权重求和,形成轨迹的结构距离.

(1)船舶航迹向的比较.

如图2所示,Li,Lj表示两条航迹线,θ表示航迹段的方向夹角,J表示Lj相对于Li的偏转程度.

航迹向对比方法为

通过上式不难发现:当夹角为0°时为最佳状态,即两条子轨迹方向完全一致;当夹角大于90°时可以认为两条轨迹基本反向,将两条轨迹的距离设置为无穷大,这样有利于区分航向相反船舶的轨迹.

(2)位置的比较.

本文在两条子轨迹段间距离的度量方面所采用的相似性度量方法为基于Hausdorff距离的方法:

式中:P(Li,Lj)为两轨迹间的位置距离;h(Li,Lj)为两轨迹间的直接Hausdorff距离;d(a,b)为a与b之间的欧氏距离.

船舶轨迹结构是指船舶轨迹所具有的属性的集合,这些属性刻画了船舶轨迹的特性和状态.船舶轨迹结构通常包含船舶运动信息,如:船舶的航迹向、船舶的位置.同时,在实际应用中还可以加入速度以及波动性的度量.进行轨迹相似性的比较时,充分考虑这些因素可以提高聚类的精度[14].依照式(8)和(9)可以求得子轨迹航迹向以及子轨迹间距离相似度.为计算轨迹结构的相似性,还需设定他们在轨迹结构中所占的权重W=(WT,WP),其中WT表示角度距离权重,WP表示位置距离权重.各权重值设定应满足:权重值之和应为1;各权重值应为非负,同时不能大于1.通常情况下采用的是将结构距离中的权重平均分配.式(11)和(12)分别为结构距离和相似度计算方法.

2.3聚类算法

基于轨迹结构距离的聚类算法是以DBSCAN算法为框架的,即从子轨迹集合中任取一条轨迹并判断在其邻域半径内是否包含满足要求的最小实体数.如果满足以上述条件,则认为是核实体,并搜索该实体的密度可达对象,标记为一类,直至子轨迹集合全部扫描完毕,未被标记的子轨迹则是孤立轨迹.具体的实现方法如下.

步骤1设定权重W,转向角阈值ω,近邻阈值η,近邻的数目ε.

步骤2根据ω将轨迹T分割成若干个子轨迹Ti.

步骤3对子轨迹段Ti,计算其与未标记的子轨迹段的D和N,若满足D和N条件的轨迹数目大于ε则将该子轨迹段标记为核心子轨迹段.

步骤4将Ti子轨迹段距离范围D内满足N条件的子轨迹段Tj与Ti聚为一类.

步骤5对Tj重复步骤3和4,将满足条件的子轨迹段继续归为一类,如果Tj不再满足上述条件,则重新从子轨迹集合中选取未被聚类的子轨迹段重复步骤3和4.直至轨迹集合全部扫描完毕.

3琼州海峡应用实例与应用

琼州海峡位于雷州半岛与海南岛之间,宽10~20nmile,长50~60nmile,是广州港、湛江港等港口与北部湾各港口海上交通的捷径.琼州海峡主要可分为3部分,分别为:琼州海峡东口,包括外罗水道、北水道、中水道和南水道;琼州海峡西口,包括灯楼角与临高角联线以西、兵马角所在经度线以东水域,该水域是来往于琼州海峡驶往八所港、三亚港等地的转向点,也是往北部湾各港口的转向点;琼州海峡中部,包括山狗吼灯塔经度线以西、灯楼角与临高角联线以东水域,该水域的水较深(20~118m),碍航物较少.

算例采用32位WIN7系统、2GRAM,在VS2010编译条件下提取750条船舶运动轨迹进行聚类,获得了5类结果,见图3.A类结果为从琼州海峡东峡口向西行驶于通航分道内的船舶的航行轨迹分布、B类结果为从琼州海峡西峡口向东行驶于反向航道的船舶的航行轨迹分布、C类结果为从海安港到秀英港的船舶的航行轨迹分布、D类结果为从秀英港到海安港的船舶的航行轨迹分布、E类结果为琼州海峡东峡口向西行驶进入海口港的船舶的航行轨迹分布.

3.1算法分析

为比较算法的优劣,将基于轨迹结构距离的DBSCAN算法与传统的DBSCAN算法进行对比,结果见表2.

表2算法对比结果

从表2中可以看出,基于轨迹结构距离的DBSCAN算法在运行时间方面劣于传统的DBSCAN算法,但是在分类结果和准确度方面皆优于传统的DBSCAN算法.这是因为:基于轨迹结构距离的DBSCAN算法需要进行轨迹的分割、角度的度量、归一化等操作,增加了计算复杂度;该算法以轨迹特征为参考,从多方面计算轨迹相似度,易发现比较隐蔽的轨迹群,使其聚类效果优于传统的DBSCAN算法的聚类效果.

3.2聚类应用

将上述所获得的船舶轨迹聚类的结果应用到船舶监控、异常检测上,能够大幅度提高海上安全保障能力,防止海上交通事故的发生[15].

3.2.1速度监控

速度监控是利用监控水域的AIS信息,对聚类结果中的船舶速度进行统计,获得船速分布图.根据实际工作中的经验和需要,确定行驶于该监控水域的船舶速度监控范围.图4是对从琼州海峡东峡口航行至海口港的船舶速度统计.对于该监控水域,本文以80%船舶运营速度(9~14kn)为标准.

图5为监控系统的速度报警,可以看出编号为A的船超速,说明该船航速不在监控航速范围内,予以报警.

3.2.2位置监控

位置监控主要是对航行于聚类结果区域的船舶进行船位的实时监控,如果船舶偏离监控水域,本船和监控系统应给予报警和提示,提醒监控人员和船舶驾驶员关注船舶动向.图6a为本船的位置报警示意图,图6b为监控系统的位置报警示意图.

3.2.3航向监控

航向监控主要利用AIS数据对聚类结果中船舶航向进行统计,获得船舶的航向分布,以此作为监控依据.图7a是对从琼州海峡东峡口到海口港的聚类结果中船舶转向后的航向统计结果.图7b和7c为本船和监控系统的航向报警示意图.

综上所述,可以得到船舶监控的实现流程图(图8),首先对进入监控水域的船舶进行位置监控(若偏离监控水域则报警),然后进行速度监控(判断速度是否超出规定范围,如果超出则进行速度报警),接着进行航向的监控直至船舶驶离监控水域.

4结论

本文利用轨迹结构距离作为相似性的度量标准,对轨迹段间的相似性进行评价,采用无监督的DBSCAN算法将相似性接近的船舶轨迹归为一类,实现了对船舶运动模式的提取.以琼州海峡为例,利用预处理过的部分琼州海峡AIS数据,将航行于该水域的船舶轨迹分为5类,分别为从琼州海峡东峡口向西航行的船舶轨迹、从琼州海峡西峡口向东航行的船舶轨迹、从海安港到秀英港的船舶轨迹、从秀英港到海安港的船舶轨迹以及从琼州海峡东峡口向西航行进入海口港的船舶轨迹.从琼州海峡东峡口向西航行的船舶轨迹位于(20°14′25″N,110°26′20″E)与(20°09′05″N,110°01′24″E)之间的通航分道内;从琼州海峡西峡口向东航行的船舶轨迹分布于(20°13′N,110°26′20″E)与(20°06′45″N,110°01′24″E)之间的通航分道内;从琼州海峡东峡口向西航行进入海口港的船舶轨迹,其转向位置大约发生在以(20°10′16″N,110°14′08″E)为圆心,半径为0.5nmile的水域范围内.将聚类的结果与ECDIS模拟器相结合,从船舶位置、速度、航向等3个方面实现了船舶动态监控的仿真.实验证明船舶运动模式识别能够有效地应用于船舶动态监控,进而保障航行安全,增强海上安全保障能力.

参考文献:

[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.

[2]胡宏宇,王庆年,曲昭伟,等.运动目标空间模式识别与异常行为检测[J].吉林大学学报,2011,41(6):15981602.

[3]闻佳,崔维.实时视频中的车辆运动轨迹的提取和聚类[J].计算机工程与应用,2010,46(11):155157.

[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.

[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesDinformation,2009,14(5):85106.

[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.

[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.

[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.

[9]LAXHAMMARR,FALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.

[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.

[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.

[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.

[13]史国友,朱公志,贾传荧,等.恒向线主题直接正反解的高精度算法[J].大连海事大学学报,2009,35(2):59.

[14]YUANG,XIASX,ZHANGL.Anefficienttrajectoryclusteringalgorithmbasedonstructuralfeatures[J].JournalofComputationalInformationSystems,2011,7(11):10271035.

篇5:基于模式识别论文

基于DRASTIC的地下水易污染性多目标模糊模式识别模型

摘要:介绍了目前国外广泛应用的`含水层易污染性评价的DRASTIC模型,分析了该模型存在问题及产生原因,讨论了含水层易污染性及其评价中存在的模糊性,建立了多目标模糊模式识别模型,给出含水层易污染性评价大小的习惯性描述语言.分别用DRASTIC模型和多目标模糊模式识别模型对一个应用实例进行了研究,由评价结果的分析比较结果表明,多目标模糊模式识别模型比DRASTIC模型更真实地反映含水层易污染性.作 者:王国利    周惠成    杨庆    WANG Guo-li    ZHOU Hui-cheng    YANG Qing  作者单位:大连理工大学土木工程系,辽宁,大连,116024 期 刊:水科学进展  ISTICEIPKU  Journal:ADVANCES IN WATER SCIENCE 年,卷(期):, 11(2) 分类号:X143 关键词:含水层    易污染性    多目标    模糊模式识别   

篇6:数字图像模式识别

深圳市南山区学府路;***、lixia_2011@126.com

求职意向

数字图像处理、模式识别算法工程师 教育经历

汕头大学 电子工程系 信号与信息处理专业 硕士2007.9—2010.6 汕头市

·在校期间成绩优良,分别一次获汕头大学一等、二等奖学金;2008 09担任女生部部长负责统筹管理,成立特色学科及基础学科研讨组,积极开拓学生的思维并提高他们的学习成绩,更贴近社会的新路线。

潍坊学院 信息与控制工程学院 电子信息工程 学士2003.9—2007.6 潍坊市

·2007年9月以第一名成绩考入汕头大学攻读硕士研究生;在校期间担任班级学习委员负责不同类学生的学习方法指导;2004-9-2007-6担任学院文艺部部长,负责迎新晚会筹划,锻炼了团队领导能力、协调能力、临场反应能力以及创新思维。英语及专业技能

●熟练掌握了数字信号处理及它的常用算法、有良好的数学功底;熟悉图像处理的基本算法、熟悉模式识别基础知识与智能系统理论及它们的应用,在模式识别和运动跟踪方面有较深的理解;熟悉光伏应用系统的结构、性能原理;曾在核心期刊系统仿真技术发表文章(基于神经网络应用的光伏最大功率跟踪)。

●英语:六级考试 362;四级考试 473;具有较强的相关专业学科的英文文献阅读能力; ●能熟练使用计算机,会用电路仿真软件、LabVIEW软件、熟练掌握Visual C++的MFC程序设计和MATLAB仿真工具,能够做算法的设计和仿真;并能应用LabVIEW软件进行信号处理(波形测量、时频域分析与数学分析(概率统计拟合最优化等)。工作经历

2010 6-2010 8深圳市辉锐天眼科技有限公司担任核心研发工程师 ●职位为智能监控核心研发工程师

●负责计算机视觉方面的IEEE文章的讲解及不同算法的实现研究,负责机器视觉系统图像处理、分析及识别算法设计、实现,参与图像处理技术研究与设计,对已有算法进行优化改进。使用OpenCV进行背景/前景提取、检测识别、了解运动跟踪的常用算法、设计相关信号特征提取算法及其设计模式识别分类器等。项目经验

2008 09-2009 11模式识别与智能系统理论的算法研究 ●算法在MATLAB仿真,并在SIMULINK中建模,最后把这个算法用C++语言编程,在VC++中生成了可执行文件。

2009 01-2009 06生物细胞图像病变检测算法研究 ●在MATLAB中仿真了算法,正确率达到82%。

2009 07-2009 09图像压缩算法编码器设计 ●在FPGA芯片上实现并验证了方案,对比得出了FPGA比DSP在神经网络实现上的明显优势,前者采用指令顺序执行的方式,数据位宽固定,FPGA处理数据的方式是基于硬件的并行处理方式,即一个时钟周期内可并行完成多次运算,特别适合于神经网络的并行特点。2010 02在科进生物识别公司 ●了解了不同二维条码尤其QR code的特点,探讨了定位图形的方法,了解了指纹识别,探讨了小波变换及gabor变换在纹理图像的特征提取的优劣。自我评价及爱好

上一篇:反对邪教手抄报资料下一篇:中班下学期社会 飞机飞起来