车牌识别算法与系统

2024-06-11

车牌识别算法与系统(精选八篇)

车牌识别算法与系统 篇1

智能交通管理系统的研究成为近年来研究热点,通过智能交通管理系统,可实现道路交通管理的自动化和车辆行驶的智能化,增强运输安全,减少交通堵塞,增加车辆机动性和路面运输效率,节约能源。

1 车牌识别系统

车牌识别系统(License Plate Recognition,LPR)是智能交通系统的关键组成部分,一个完整的车牌识别系统包括了图像预处理、车牌定位、字符分割和字符识别等主要模块。其流程图如图1所示。

图像预处理主要是将输入的彩色图像转换为灰度图像,然后再进行灰度拉伸和平滑。这里首先将24位R,G,B的彩色图像按式(1)转换成256级的灰度图,以减少存储和计算量,图2是转换后的车牌灰度图。

Gray=0.299R+0.587G+0.114B(1)

2 车牌定位

车牌定位是车牌识别系统中的核心环节,正确、可靠地提取出车牌区域,是提高整个车牌识别系统识别率的关键。

2.1 基于小波变换的车牌边缘提取

由于用传统的边缘检测算法检测到的边缘信息中含有很多无用的干扰信息,采取基于小波变换提取边缘的算法,将车辆图像分解为包含图像基本信息的低频部分和包含图像细节信息的高频部分。

经实验,进行两层的小波变换分解即可满足要求。以下是车牌区域图像的实验图片。

图3是对图2中汽车图像进行小波分解得到的图像。从图中可以看出,经过小波分解后的图像噪点已大大减小,车牌的纹理也比较明显。其中,水平分量夹杂了汽车前面的排气格栅等干扰信号的信息,容易对车牌的定位造成很大的干扰。垂直分量的效果较好。对角线分量在去除干扰信息时,也去除了部分车牌信息,对后续车牌定位有较大影响。

图4是利用车牌图像小波分解的垂直分量进行边缘提取的图像,从图中可以看出,车牌部分的纹理特征比较明显,车前格栅等干扰均已除去,噪点干扰大大减小,而且只需对高频图像进行检测,即1/4的图像进行检测,运行时间大大缩短。

2.2 数学形态学处理

小波变换提取的车牌边缘很明显,但是车牌边缘并不是连续的,不利于根据其特征进行进一步的判断。因此,需要对其进行形态学的处理,使其成为一个连通的整体,便于后续定位。图像经腐蚀和膨胀后变得平滑,如图5所示。

牌照图像经过了以上的处理后,牌照区域已经十分明显,此时可进一步确定牌照在整幅图像中的准确位置,利用bwareaopen函数来移除对象中不相干的小对象。如图6所示。

接着采用投影法进行车牌的精确定位,利用水平投影和垂直投影进行牌照区域与背景的分割,可以得到车牌的位置坐标,切分出车牌,实现车牌的精确定位。图7为经过投影运算后,定位剪切后的彩色车牌图像。

3 字符分割

字符分割可使用连通域法和垂直投影法,由于基于连通域的方法对连通域的判断易受车牌质量的影响,例如字符出现断裂、边框与字符粘连等,在一定程度上影响了车牌的识别率。针对连通域方法的不足,陈振学等提出了基于灰度垂直投影分割的方法[1]。该算法利用由从中间到两端搜索的方法确定字符的上下边界,且利用一维循环清零法及先验知识垂直分割得到单个的字符,对二值图像进行垂直投影,若垂线上有亮点则将对应的投影值设为1,否则为0,得到垂直投影矩阵,通过扫描矩阵,将车牌字符得以分割。通过灰度垂直投影分割法分割出的车牌字符图像如图8所示。

4 字符识别

4.1 多模板匹配

在车牌字符识别环节, 本文使用多模板匹配的方法。模板匹配的主要特点是实现简单,当字符较规整时对字符图像的缺损、污迹干扰适应力强且识别率相当高。目前,我国的车辆牌照字符按顺序依次排列,第一个字符为汉字,一般为省份的简称;第二个字符为英文大写字母,第三、四个字符为英文字母和阿拉伯数字的混编,第五至至第七个字符为阿拉伯数字。

针对这一特征,可分别建立三个模板库, 即汉字库、字母库和数字库,为了克服对于同一字符,由于其拍摄角度,扭曲程度的不同,使得归一化后的字符图像在形状、笔画位置等方面呈现多样性,在此基础上,再为每个字符配备了多个标准模板,这些标准模板以尽量体现字符各种常见变形情况为选择标准。计算匹配度的算法较多,通常采用如下计算公式:

Si=m=1,n=1Μ,Ν(X×Τi)m=1,n=1Μ,ΝΤi(2)

式中:X为细化的待识别图像;Ti为字符标准模板。按照公式(2)计算匹配度Si,并取其平均值,这样可以减少单个特殊字符不匹配的现象,增加算法的健壮性。通过实验验证,如果能正确选用5个典型模板是最佳方案。

4.2 二次细分优化识别

对于特别相似,极易混淆的字符,一般可以通过进一步分析相似字符局部特征加以识别,称之为二次细分。二次细分为这些特别相似且经常出现误识别的字符另外建立了局部模板库,这些模板库以相似字符为组建立。如将8与B视为一组,以其左半部特征建立标准模板库,O与Q则以右下部为特征建立模板库。二次细分算法步骤如下:

(1) 若初次识别结果为相似字符组之一,则进入(2),否则进入(5)。

(2) 根据初次识别结果,确定所属的局部模板库。

(3) 根据选定的模板库,选定同样位置,按照公式(2)计算匹配度。

(4) 选取匹配度最大值作为二次细分结果,也就是最终识别结果。

(5) 输出最终识别结果。

经过二次细分优化识别以后大大提高了整个系统的识别正确率,图9所示为本文车牌识别结果。

5 结 语

在车牌识别系统中,车牌的识别正确率和识别速度是两个非常重要的性能指标,尽管车牌识别技术已经取得一定突破,但如何同时提高这两个性能指标仍然非常值得研究。 随着智能交通系统中各项技术的日趋成熟和完善,相信不久的将来,新的高效的实用算法一定会解决当前车牌识别系统中所面临的诸多问题。

参考文献

[1]陈振学,汪国有,刘成云.一种新的车牌图像字符分割与识别算法[J].微电子学与计算机,2007,24(2):42-44.

[2]CHANG S L,CHEN L S,CHUNG Y C,et al.Automaticlicense plate recognition[J].IEEE Transactions on Intelli-gent Transportation System,2004,5(1):42-53.

[3]张德丰.Matlab小波分析[M].北京:机械工业出版社,2009.

[4]章毓晋.图像处理和分析技术[M].北京:高等教育出版社,2008.

[5]周妮娜,王敏,黄心汉,等.车牌字符识别的预处理算法[J].计算机工程与应用,2003(15):78-80.

[6]秦襄培,郑贤中.Matlab图像处理宝典[M].北京:电子工业出版社,2011.

[7]DOUGHERTY E R.Introduction to morphological imageprocessing[M].Bellingham:SPIE,1992.

[8]占君,张倩,满谦.Matlab函数查询手册[M].北京:机械工业出版社,2011.

[9]刘静.几种车牌字符识别算法的比较[J].电脑与电信,2008(8):72-74.

车牌识别系统的研究与构建 篇2

汽车牌照自动识别技术是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统,目的是在汽车行进过程中通过采集的车辆图像自动完成车牌的定位及识别,进而实现进一步调度和管理。车牌识别在交通控制和管理中有着重要的实际运用价值和广泛的应用前景,对于高效、智能和实时的交通管理具有十分重要的意义。进入21世纪,由于计算机视觉技术的发展,开始出现汽车牌照识别的系统化研究,至今已有众多车牌识别算法和系统出现,一些实用的 LPR 系统也开始应用于车流监控、出入控制、电子收费等场合。现代车牌识别技术是计算机视觉、图像处理与模式识别的融合,尽管国外车牌识别技术已经非常成熟,但由于国内外车牌和实际交通环境不同,引进的系统无法满足我国的车牌识别管理,因此对于车牌识别系统的研究与构建是非常有必要的。

一、车牌识别系统的研究现状

早在80年代中期,ARGUS英国Alphatech公司就开始了名为RAUS的车牌自动识别系统的研制。ARGUS的车牌识别系统的识别时间约为100毫秒,通过ARGUS的车速可高达每小时100英里[1]。还有Hi-Tech公司的See/Car system,新加坡Optasia公司的VLPRS等。国内在90年代也开始了自己的车牌识别系统的研究。目前比较成熟的产品有中科院自动化研究所汉王公司的汉王眼,香港亚洲视觉科技有限公司的慧光车牌号码识别系统等等。虽然国内汽车车牌识别系统也取得了较大的进展,但由于该研究总体处于发展状态,加之个性化场景的不同,对该识别系统的需求不同,还需进一步改进、完善,提高车牌整体识别率,复杂环境下识别率等等。

二、车牌识别系统的构建

1.图像处理子系统

本系统在图像处理模块中,图像采集设备由一个高质量的CCD摄像头、光源、数字摄像机和图像采集卡构成。检测装置采用外触发的方式进行车辆检测,当检测到车辆通过时,摄像机进行车辆牌照的采集,拍摄到包含车辆牌照的图像,将采集到的图像传入计算机中。

考虑到在图像采集过程中,图像会受恶劣的天气、变化的光线以及拍摄角度等环境因素的影响,避免产生识别错误,需要对图像进行预处理。本系统采用频域法,在对图像进行灰度化、边缘检测的基础上,利用傅里叶变换将图像变换到频域,然后根据目标信息的特征利用Roberts等算法进行相应的滤波处理。

2.车牌定位子系统

在车牌定位子系统中,如何在复杂的背景下克服干扰准确定位出含有车牌字符区域成为重中之重。本系统提出一种基于改进Isotropic Sobel边缘检测算子的车牌定位算法。在经过图像预处理后的原始灰度图像中确定牌照的具体位置,然后采用Otsu算法阈值化,再对阈值化后的二值图像做数学形态学运算得到车牌的候选区域,最后利用车牌特征去除伪车牌。

3.字符分割子系统

首先对我国标准车牌的分布特点进行了解,标准车牌字符分为三个部分,首位为省名缩写(汉字),次位为英文字母,再次位为英文字母或阿拉伯数字,末四位为数字,字符总长度为409mm,其中单个字符统一宽度为45mm,高度为90mm,第二、三个字符间隔为34mm。利用这些先验知识,本系统分析比较了常用的车牌字符分割算法,提出了基于直线拟合的车牌倾斜校正算法,并将该车牌倾斜校正算法应用于字符分割算法中。

4.字符识别子系统

在对分割好的字符进行大小归一化和倾斜度的校正后,车牌识别系统进入字符识别步骤。本系统综合分析了基于模板匹配、特征统计、分类器的车牌字符识别算法,以二值图像字符的笔画像素分布为基础进行字符的四周边特征、粗网格特征、二值图像投影特征进行识别,深入研究了BP神经网络分类器的特点[2],提出了一种基于改进BP神经网络的多分类器车牌字符识别算法。利用此算法,完成车牌字符识别步骤。

三、总结与展望

本文所构建的车牌识别系统集中了光电、计算机、图像处理、计算机视觉、人工智能、模式识别等关键技术。充分利用特定场景的经验知识,优化车牌识别算法,使该算法识别的准确度高,同时还尽量降低运算时间,保证了实时性。通过加强图像预处理技术,加入车牌识别模型的自适应因子控制等手段,减少了由于外界不良因素如:天气、光线、污渍等造成的图片难以正确识别的机会,对于车辆出入管理系统的误判率趋于0。

随着信息化时代的不断发展,住宅、小区、停车场等需要保安人工监控的地方都将使用车牌识别系统,减少了许多人为因素造成的疏忽之处。也能扩展到犯罪车辆、肇事车辆、被盗车辆的辨识和拦截,交通流量监测等领域,为人们出行的安全和便捷提供了保障。同时,车牌识别的方法对其他检测和识别领域也有着重要的借鉴价值,其己成为智能交通工程领域研究的重点和热点问题之一。

参考文献

[1]MD.TanvirLearningAlgorithmsforArtificialNeuralNetworks,Proc.10tbInformationEngineeringSenimarJune2001.

[2]杨大力,刘舒.基于神经网络的车牌汉字识别方法[J].中国人民大学公安学报,2009,5(3):56-57.

车牌识别算法的研究 篇3

车牌的定位

对车牌图像信息进行预处理, 先将YUV图像转换成RGB格式, 再灰度化。彩色图像灰度化的效果如图1 (b) 所示, 在对图像进行中值滤波和梯度锐化处理。

车牌图像信息进行预处理后, 本文采用基于纹理分析的方法对车牌进行定位。一般车辆图像中, 车牌部分的图像灰度级会发生快速变化, 故可采用边缘检测技术找到车牌边界。车牌定位算法的具体过程如下:

(1) 首先对车牌灰度图像进行边沿检测, 采用Sobel边缘算子, 从不同方向检查边缘。Sobel算子不是简单的对图像求平均再差分, 而是加强且中心像素点四邻域像素的权重, 其运算结果为边缘图像[3]。该算子的计算公式表示如下:

(4) 进行列扫描, 确定车牌区域具体大小;

(5) 继续搜索, 找出所有车牌候选区, 再根据车牌的其他几何特征排除一些不满足其特征的区域。

车牌图像中存在车牌的边框和铆钉, 二值化后会增加白色像素点的个数, 为使所截取的车牌图像不影响字符分割和字符识别的处理效果, 需对所截取的车牌图像去边框和铆钉处理。本文采用数学形态法:先对截取的车牌号进行二值化;再将与二值化图边缘连通的白色像素点都去除或改为黑色像素点, 处理效果如图3所示。

字符分割

在字符分割前, 必须对车牌图片进行车牌识别。如图4.6所示, 车牌图像的校正效果。

字符分割目的是将定位后的车牌区域分割成单个字符区域。在车牌倾斜校正时, 车牌的大小已经归一化处理。对车牌图像进行去噪声处理后, 以列为单位, 统计其每列白色像素点的个数, 这样就可以得到一个垂直投影图, 如图5所示。

最后根据字符比例先验知识和图像中的字符信息, 可以得到7个字符的详细分割区域, 并将七个字符图像截取出来, 如图6所示。

字符识别

本文采用模板匹配方法来识别字符, 字符模板匹配法实际是度量输入字符与字符模板的相似性, 取其中相似性最大的字符模板作为输入字符所属类别。字符识别的重点在于如何提取字符特征量和设计分类器以提高识别的正确率。

1字符识别预处理

在对字符进行特征提取之前, 需要对字符进行归一化处理。归一化处理包含大小归一化和字符粗细归一化。

对字符进行大小归一化, 即统一字符尺寸的大小, 首先要确定模板的大小。本文选用字符模板大小为16×8。根据水平和垂直两个方向像素分布情况, 按比例将字符线性放大或缩小成同一散度的点阵。大小归一化的描述如下:

2字符特征提取

字符特征提取是字符准确识别的前提, 特征提取应对待识别对象的各种特性加以考虑, 但不等于特征空间维数越高越好, 识别精度并不随着特征数量的增多而提高。常用的字符特征有网格特征和轮廓特征[9]。

轮廓特征属于局部统计特征, 它包括外部轮廓特征和内部轮廓特征。提取轮廓特征的方法如下:将归一化后的字符图像等分成n行, 计算第一行从左边界至第一次由黑变白处的长度;依次类推, 计算图像右边界、上边界、下边界第一次由黑变白处的长度, 从而可以得到字符外轮廓特征。字符内轮廓特征也分为左、右、上、下轮廓特征。与提取外轮廓特征不同的是, 其值为字符边界到字符图像内侧的距离, 即从各边界起到先经过由黑变白, 再经过又白变黑处的距离。

一般不同的字符特征适用性不同, 用单一的字符特征很难对受多种条件影响的车牌字符进行识别[10]。另外由于不同特征向量维数不同, 且它们之间所表示的意义不太相同, 权重可能相差很大, 若采用直接将它们组合的方法, 会造成较大权重的特征向量占主导位置, 而较小权重的特征向量被忽略掉, 可以通过采用加权方法来解决这种情况。本文通过加权方法将网格特征与轮廓特征组合起来, 假设某一字符提取网格特征的到的向量为A, 提取轮廓特征得到的向量为B, 那么采用加权方法得到的特征为:

式 (6) 中, a, b代表加权系数, 通过不断的实验来确定它们的值, 从而达到较好的分类效果。最后确定车牌字符的特征维数为16。

3分类器距离算法设计

在特征空间中, 用某一方法将被识别对象归为某一类别就是分类器。模板匹配法实际上就是采用多个标准样本的距离分类器, 通常利用平均样本法计算样本均值作为每个类别的标准样本, 之后计算待识别样本与标准样本间的距离, 选择距离最小的标准样本类别作为待识别样本类别。

Euclidean距离是常用的一种距离算法, 其优点是各点连续可微分。

为减小计算量, 本文对Euclidean距离算法进行改进:

本文选择车牌常用汉字、数字、英文字符的标准样本, 抽取每个字符网格特征和轮廓特征的加权组合特征, 计算每个字符所选样本的特征均值作为标准样本, 选择式 (8) 作为距离准则。

结束语

车牌识别中图像增强算法研究 篇4

关键词:车牌,图像增强,中值滤波

在车牌识别系统中, 由于受噪声等因素的影响, 在图像的摄取和传输中, 造成图像效果并不理想。图像增强目的是采用一系列技术去改善图像的视觉效果, 或将图像转换成一种更适合于人或机器进行分析和处理的形式, 如锐化处理可突出图像边缘轮廓线, 编程控制计算机进行跟踪, 便可作各种特征分析。因此, 对车牌图像进行增强处理, 去除噪声, 以得到视觉效果更好, 更易分辨的图像, 这对于提高字符分割质量和字符识别率至关重要。

一、图像增强算法

图像增强的增强图像的算法有很多, 如灰度线性变换、图像平滑处理和线性滤波等, 根据处理图像域又可分为空间域增强和频率域增强。目前用于车牌图像增强的常用算法有:均值滤波、维纳滤波、直方图均衡、中值滤波等。

1. 均值滤波

均值滤波是典型的线性滤波算法, 它是指在图像上对待处理的像素给一个模板, 该模板包括了其周围的临近像素。将模板中的全体像素的均值来代替原来的像素值的方法。

2. 维纳滤波

维纳滤波是对退化图像进行恢复处理的一种算法, 其采用的维纳滤波器是一种最小均方误差滤波器, 在实际应用时多用下式进行近似处理:

其中K是一个预先设定的常数。该算法的滤波效果比均值滤波器效果要好, 对保留图像的边缘和其他高频部分很有用, 不过计算量较大。维纳滤波对有白噪声的图像滤波效果最佳。

3. 直方图均衡

直方图均衡是灰度变换的一个重要应用, 是最常见的间接对比度增强方法之一, 广泛应用在图像增强处理中。其主要是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布, 可以产生一幅灰度级分布具有均匀概率密度的图像。但是则有一定的缺点, 它的缺点就是变换后图像的灰度级减少, 某些细节则会消失, 比如说直方图中会有高峰, 然而在经过处理后的则会对比度不自然的过分增强。

4. 中值滤波

中值滤波是由图基 (Turky) 在1971年提出的, 所谓中值就是窗口中奇数个数据按大小顺序排列后处于中心位置的那个数。中值滤波以窗口的中值作为处理结果。它是一种非线性信号的处理方法, 在图像处理中, 常用于用来保护边缘信息。通过从图像中的某个采样窗口取出奇数个数据进行排序得到的结果。中值滤波的实现原理是把序列或数字图像中的一点的值, 用该点邻域中的各个点的值的中值替代。对序列而言中值的定义如下:

若x1、x2、x3…xn为一组序列, 先把其按大小排序为:xi1≤xi2≤xi3≤…≤xin则该序列的中值y为:

设输入为{xi, i∈I}, I为自然数集合或子集, 窗口长度为n, 且令, 则滤波器的输出为:

如果推广到二维, 则可以对二维中值滤波做如下定义:设{xij, (i, j) ∈I2}表示数字图像各点的灰度值, 滤波窗口为A, yij为窗口是A在xij点的中值, 则:

针对图像的中值滤波的过程为, 首先将模板内 (窗口) 所涵盖的像素按灰度值由小到大排列, 再取序列中间点的值作为中值, 并以此值作为滤波器的输出值。

另一种方法则更接近于人眼的实际感觉, 过程是先计算周边像素灰度的平均值, 若所考虑像素的灰度与此平均值的差异超过一定临界值时, 则判定此像素为干扰, 该点的值应采用先前计算所得的平均值来替代, 若不超出临界则用该点实际像素的灰度值作为滤波器的输出。

二、图像增强算法比较

在实验系统中, 以一车牌图像为例, 分别采用中值滤波、均值滤波、维纳滤波和直方图均衡等对其进行了增强处理, 处理前及采用不同算法处理后的图像对比如图1所示。

三、实验结果分析

通过实验分析, 中值滤波实现的过程并不是很复杂, 相对来说比较简单, 对于消除高斯白噪声的效果并没有显示出特别的效果, 但对脉冲干扰及椒盐噪声的抑制且在抑制随机噪声的同时能有效保护边缘少受模糊, 相对来说效果就特别好。经滤波后的图像不仅适合人眼的视觉, 而且还能够满足消除图像的干扰影响, 许多类型的随机图像噪声信号都可以利用其进行消除, 在图像处理中是比较理想的滤波算法。

参考文献

[1].郭勇、吴乐男, 《行驶车辆的牌照识别系统》, 《测控技术与设备》, 2000, (11) :37-402.

[2].徐全生, 《汽车牌照图像的预处理研究》[J], 《沈阳工业大学学报》, 2002, (4) :121-1243.

自适应车牌抓拍识别算法研究 篇5

图像分割作为图像识别领域最重要的技术方法之一,具有广泛的应用前景,图像分割就是经原始图像分割成若干个封闭的、具有特定意义和性质的区域,并从中提取出感兴趣的区域。图像分割是图像分析的基础和关键步骤,分割技术的优劣直接关系到后续图像分析的可靠性和有效性,因此,提高图像分割技术至关重要,现有的图像分割技术对特定区域跟感兴趣区域存在明显差异性的图像处理结果较为理想,而对于图像中包含复杂的环境以及特定区域过多或者感兴趣区域较小时,简单的图像分割技术的分割效果并不理想,因此,提高图像分割技术的适应性以及分割的准确性显得尤为重要[1,2]。

国内外学者在图像分割方面做了大量研究,取得了一定的成果,张晶等人从图像分割技术的基本原理出发,对典型的图像分割技术进行阐述和说明,且对图像分割技术在机车检测、生物医药等领域的应用做了介绍,对图像分割技术的未来发展趋势作了预测。欧阳鑫玉对传统的阈值分割法、边缘检测法以及区域分割法作了陈述,此外,对出现的新兴图像分割方法作了简要介绍,并指出未来图像的发展趋势。上述两人只对图像分割作了理论陈述[3],并未对图像分割中存在的关键技术以及解决方案提出理论依据。刘保利针对SAR图像局部灰度值的统计特征和像素空间的方差分布,建立了MarkovGAR模型对SAR图像进行分割,此种方法在一定程度上大大提高图像的分割提取精度,但此种方法只适应用高分辨率的图像,其使用范围较窄。上述研究在一定程度上促进了图像分割技术的发展,但都不同程度的存在缺陷,本文通过不断调整X、Y方向的阈值检测范围达到图像分割的自适应,该方法能够有效获取不同方向上图像梯度的最大变化率,依据阈值检测结果确定最佳的分割区域,从而确定感兴趣的目标区域。最后,以复杂环境下的车牌图例作为算例对所提算法进行验证,测试结果表明,自适应图像分割算法在一定程度上能够适应复杂的环境条件。

1、图像阈值分割技术

灰度阈值分割技术[4,5]是最为常见的并行区域技术,它在图像分割中应用范围最广的,本文所提及的算法也是建立在阈值分割方法之上的。所谓的阈值分割方法实际上就是将输入图像f到输出图像g作如下变换,

将大于等于(或者小于等于)阈值的像素作为背景元素,生成一个而至图像,其中,T是预先设定的阈值,阈值选取的好坏决定该方法成败。由此可见,图像阈值算法的关键是确定阈值,如果能够确定一个合适的阈值就可以准确的将图像分割开来。该方法适用于物体与背景有较强的对比性,感兴趣区域的灰度比较单一,该方法总可以得到封闭的连通域的边界。

阈值分割中阈值的选取依据:仅仅依赖像素灰度的全局阈值;依赖于像素灰度和其周围领域的局部特征性质的局部阈值以及依赖像素灰度、周围领域局部特性以及坐标位置有关的动态阈值。本文选取第三种阈值选择方法。

2、小波去噪

小波变换[6,7]将信号与一个在时频两域均有良好局部特性的小波函数进行卷积,是一种线性变换,它对原始信号进行时频两域分解,其基本思想就是:各种信号频率高低不同的分量具有不同的时变特性,通常较低频率成分的频谱特性随时间的变化较为缓慢,而频率较高成分的频谱特性变化迅速,这样就可以规律的非均匀地划分时间轴和频率轴,这可以在不同频带范围内获得较为合适的时间分辨率和频率分辨率。小波去噪的数学描述就是对图像f(x,y)进行二维小波变换如下:

式中:s为小波尺度,通常取2的次幂,**为二维卷积运算,将上式简记为向量形式:

图像小波去噪就是将图像与小波基函数进行卷积运算。

3、自适应分割技术

本文所提出的自适应图像分割技术[8,9]涉及到两个阈值的设定,即灰度阈值和X、Y方向的阈值检测范围。对于数字图像,其存储的一般格式为二维矩阵,对图像处理就是对图像原始矩阵进行相应的初等变换,首先通过矩阵元素间的差分求得图像的梯度值,由于经差分求解后,梯度矩阵的维数会减小,为了保证梯度矩阵跟原始图像矩阵具有相同的大小,对图像的边缘进行补充,补充时依据下式进行,

其中,u为原始图像,g为图像的梯度。

试验中所采集到的图像进行灰度化处理,运用小波对其进行去噪,选取的小波函数为db2,分解层数设为3,去噪结果如下图所示:

经小波去噪后图像的基本特征被很好的保留了下来,这保证了后续图像分割的可靠性和有效性,为图像后续处理提供了可靠的数据。灰度值阈值的确定需对原始图像的灰度值的分布进行分析,灰度值的分布范围一般会呈现出双峰特性,波峰就是感兴趣区域与背景区域的灰度均值,下图是图像灰度值的统计分布,从图中可以看出,灰度在60-70之间出现了较大波峰,因此在充分考虑了灰度统计分布后初步确定灰度阈值范围约为60-70之间,图像分割必须给出确定的灰度阈值,为此,本文运用遗传算法确定最佳的灰度阈值,候选解的范围设定为60-70,初始解g0=60,将每个候选解阈值下的图像X、Y方向的阈值检测结果作为适应度函数,只适应就是依据图像的统计特征初步确定图像的阈值范围,进而利用优化算法对候选解区域进行细化,最终得到最佳的阈值。

图像沿X、Y轴的阈值检测就是给定一个阈值,在此阈值下,通过设定阈值的移动范围,沿图像矩阵的行与列进行搜索,对大于阈值的次数进行统计,图4、图5是X、Y方向位距离下灰度极差的变换情况。

图4、5只列举了一行或一列的灰度极差。在求极差时,距离区间的选取也具有一定的随机性,若选取的距离区间过大,则目标区域边界像素梯度的变化情况很难获取到,若取的距离区间过小,致使计算量大大增加,且图像隐含的噪声对目标域边界的确定影响很大,有时根本无法获取到真实的目标区域边界(即便图像经过去噪处理,图像还会隐含一些无法剔除的噪声,这些噪声往往会对处理结果产生重要的影响)。本文选取行的距离区间为30,列的距离区间为15,再通过行列遍历确定目标区域的沿X、Y轴的范围。最终确定目标区域范围如下图所示。

从图中可以看出,通过自适应分割算法后,图像的目标区域被准确的确定下来,可见,该算法具有较强的适应性,能够适应复杂的环境,对车牌的扫描以及检测提供了一种新的思路。

4、结束语

图像分割技术作为图像处理技术推广的关键性因素,对图像分析起着基础性作用,现有的图像分割技术的适用范围较窄,复杂的环境对图像分割又提出了新的要求。本文针对现有图像分割技术存在的技术缺陷,对阈值分割技术进行了扩展,提出自适应的阈值分割技术,在对图像进行灰度化以及去噪处理后,对图像的灰度统计特征进行分析,将具有双峰特性的灰度统计分布的波峰处的灰度区间作为遗传算法的候选解域,利用遗传算法确定最佳的灰度阈值,将初始解设定为候选解的下限,将每个候选解阈值下的图像X、Y方向的阈值检测结果作为适应度函数,从而保证灰度阈值是跟图像的灰度统计特征有关的变量,这间接就是提高了灰度阈值分割技术的适用范围。最后利用所提出的算法对车牌图片进行分割,分割结果显示:该算法能够有效提取出药品的商标,该算法对复杂的车牌的自动化获取提供了一种新的思路,对图像分割技术的推广具有重要意义。

摘要:现有图像分割技术对复杂的环境适应性并不强,在有外界因素干扰的情况下,简单的图像分割技术根本无法满足工程实践的精度要求,针对此种情况,提出一种自适应的图像分割方法,利用小波分析剔除图像噪声,在充分保留图像原始信息的情况下再对图像进行分割处理,该分割方法能够根据不同的环境状况,不断调整X、Y方向的阈值检测范围,获取不同方向上图像最大的梯度变化率,通过图像梯度变化率以及X、Y方向的阈值变化确定最佳的分割区域。最后,以复杂环境下车牌照图例作为算例对所提算法进行验证,测试结果表明,自适应图像分割算法在一定程度上能够适应复杂的环境条件。

关键词:图像分割,阈值检测,自适应

参考文献

[1]张晶,王黎,高晓蓉等.数字图像处理中的图像分割技术及其应用[J].信息技术,2010(11): 36-39..

[2]欧阳鑫玉,赵楠楠,宋蕾等.图像分割技术的发展[J].鞍山钢铁学院学报,2002,25(5):363-366.

[3]刘保利,田铮.基于灰度共生矩阵纹理特征的SAR图像分割[J].计算机工程与应用,2008,44(4):4-6.

[4]付峰,应义斌.生物图像阈值分割方法的研究[J].浙江大学学报(农业与生命科学版), 2003,29(1):108-112.

[5]梁忠伟,叶邦彦,彭锐涛等.基于灰度直方图拟合曲线的数字图像对于只分割技术研究[J].现代制造工程,2007 (9):103-105.

[6]甘亚辉,戴先中,李新德等.小波边缘检测在焊缝图像处理中的应用[J].华中科技大学学报(自然科学版), 2008(S1):65-67.

[7]贾超,王耀坤,邢晶晶.利用小波多尺度积实现裂纹缺陷的边缘检测[J]计算机工程与应用,2011,47(15):219-221.

[8]张伟,蒋宏,任章.自适应多阈值图像分割算法[J].自动化技术以应用,2007,26(8):71-73.

车牌照自动识别算法研究 篇6

在现代社会中,图像自动识别技术在军事和民用的许多领域都得到了日益广泛的应用。车牌识别技术的研究是图像识别技术中最常见的一种应用,具有重要的现实意义和理论价值。

一个完整的车牌识别系统一般由图像输入、图像处理(提取特征)和牌照定位识别3部分组成。本文只把重点放在后两步,着力研究这两部分的算法和实现过程。

车牌识别系统和其他的图像识别过程一样,关键在于特征的选择和提取。

我国的车牌底色和字符颜色种类并不多,而且字符主要是英文字母、数字以及少量汉字组成,这就提供了2个非常明显的特征:颜色和字符。

但由于车牌的不同,以及检测时不同的光照条件,给车牌识别增加了难度,很难用一种算法就实现一个完善的系统。

在这里以常用的蓝底白字车牌作为基本研究对象,分别利用颜色和字符这两个特征,采用Matlab 7.0作为开发软件,对车牌识别算法进行研究,并对比其算法和识别效果。

2 基于颜色特征的车牌自动识别算法

以蓝底白字的车牌为目标,用其颜色作为选取和要提取的特征,在输入原始图像后,对行和列方向的蓝色像素点进行统计,分别得到行和列方向上特征蓝色像素的位置,然后用这两个位置的坐标值对原图进行截取,即可以得到车牌图像。

2.1 车牌识别算法实现过程分析

实验采用图片主要有3张,分别是car1.jpg,car2.jpg,car3.jpg,如图1所示:

Matlab在处理JPG格式的真彩图像时实际上是作为3个RGB矩阵处理,可以用一条简单的Matlab语句来分别定义3个矩阵:

I=imread(′car1.jpg′);

[y,x,z]=size(I);

myI=double(I);

第一行是将图像car1.jpg读取到Matlab的变量I中;第二行是根据图像I的大小(xy分别代表I在行和列方向上的像素个数)以及RGB维度(z=1,2,3,分别代表R,G,B)设置三维矩阵大小;最后一行生成一个大小等于图像I,元素值等于图像I的相应位置像素的RGB值(三个维度分别存储R,G,B)的图像矩阵。

之后,在RGB空间中根据广义上的“蓝色”范围,对R,GB分设置一个阈值范围,在行和列方向上分别统计每个像素的RGB是否在这个阈值范围内。这个过程在Matlab中属于一个常用的数组(矩阵)循环查询的过程,对行和列只需要分别用一个二重循环(每列和每行分别一个循环),循环次数分别等于前面定义图像矩阵时获得的yx的值。

这个过程的关键是阈值的选择。根据RGB色彩空间理论,以8位格式存储的RGB表示系统R,GB分别有28个值,其组合出来的色彩则可以有224种。人凭肉眼不可能区分224种颜色,即使假设车牌的底色都是绝对相同的,由于光照、灰尘、水汽、环境对比等的干扰,在原始图像获得过程中也会造成图像颜色与实际颜色存在差别,因此,这里要统计的“蓝色”是一类相近色彩的总称,这给阈值确定带来了困难。阈值范围太窄,可能遗漏一些视觉色彩;而阈值范围太宽,也可能会增加一些实际不存在的视觉色彩,影响识别的效果,甚至造成错误。本文根据参考文献中的相关内容,结合实践验证后采用的阈值范围是:100≤R≤200,40≤G≤200,B≥150。

当完成这个步骤后,每行每列可以得到2个一元函数f(x)和g(y);xy对应的行和列方向的值;f(x)和g(y)分别代表列和行方向蓝色像素点的个数。如果fg值大于阈值,则代表检测到了车牌的颜色区域,反之,则表示还没检测到车牌的颜色区域。根据这个阈值,设计一个判断循环,就可以分别在行和列方向得到2个坐标刻度。

由于图像和算法本身的不足等原因,得到的这4个坐标刻度所围成的区域并不一定完全和真实的车牌在图像上的区域吻合,需要根据实验进行人工修正。利用修正后的4个坐标刻度去截取原图,就可以得到车牌,完成整个基于颜色特征的车牌照识别过程。

2.2 车牌识别效果及其原因分析

采用色彩特征作为识别依据是简单直观的,特别是在周围色彩干扰比较小时可以非常正确地识别车牌,但是,如果周围色彩干扰较大时,正确的识别比较困难。在对三张实验图片的识别中,对car3.jpg就没有识别到正确的车牌,却把图片中一个蓝色路标牌作为目标。

为了分析识别效果,特别提取3张实验图片在列和行方向的蓝色像素点统计函数f(x)和g(y),并绘制成曲线,分别见图3中(a)~(c)。

从图3(a)和图3(b)中可见,因为两图图像质量较高,色彩的色度和对比度都非常高,而且图形规则,因此在统计图上上显得统计曲线非常规整。而从图3(c)发现,统计图上在y方向的统计上时有2个阈值范围内像素集中区域,在进行4个坐标刻度截取时,首先是y方向产生了统计错误,进而影响到x方向的统计(程序设计规定,x方向的统计是在y方向统计的基础上进行)。

分析原因,这与程序设计上有一定关系:首先本程序采用的色彩RGB值,是笔者参照参考文献中的先验值,再根据RGB色彩空间理论和实验验证得出的一个修正值,在客观性和普遍性上有所欠缺;其次本程序对目标的尺寸识别、位移和旋转等方面上有着很大缺陷,从而导致识别上的误差乃至完全错误;最后,算法中的循环统计还不太完善,导致循环统计错误,而影响到定位。

3 基于字符特征的车牌自动识别算法实现

按照良好特征的4个条件:可区别性、可靠性、独立性和数量少来看字符,车牌字符完全符合以上4个条件。车牌字符一般都是整个图像中最集中的区域,字符简单而且变化少,满足可区别性和数量少的要求。另外车牌上的字符区域与其他图像区域相比,大的色块比较少,这样边缘比较突出,满足独立性和可靠性。

以字符为特征的识别系统流程相对色彩要复杂一些。首先要对输入图像进行预处理,其次对图像进行二值化,再次要削弱图像中背景和噪声的干扰,就可以得到一个非常简单的二值图像,其中的1值点大部分是目标点,最后只需要用类似于蓝色像素统计的办法统计出1值点,再进行1次阈值判断就可以得到车牌的位置坐标,从而完成识别。

3.1 车牌识别算法实现过程分析

以上节中识别不成功的car3为例。首先对图象进行预处理,将24位真彩图转化成256级灰度图。这样不仅便于后续的图像快速处理,提高计算运行速度,而且对多颜色图像进行了统一,避免了颜色造成的干扰。按照现行标准的平均值法,灰度转化的原理是:g=0.3R+0.59G+0.11B在Matlab中可以使用前面提到过的图像的格式转化函数将RGB真彩图像转化成灰度图像。如下所示:

I=imread(′car3.jpg′);

I2=rgb2gray(I);

将图像二值化后,图像上只有0值和1值点。0值多半为背景,1值中包含要寻找的字符特征,也有部分景物干扰。二值化过程有效突出了图像中的边缘部分,排除大部分背景干扰,达到突出目标的目的,同时也大大降低了后续处理的工作量。

Matlab为二值化过程提供了一个简便的函数BW=im2bw(I,level),level是归一化的阈值,取值在[0,1]之间,其取值直接关系到二值化的效果。图像中灰度大于等于level/256(灰度/256)的像素在二值化后置为1,反之,像素在二值化后被置为0。这样,如何选取阈值level成了这一步的关键。

实践证明,合理选择阈值能够有效地将背景基本置为0。Matlab提供了一个有效阈值计算函数graythresh,这个函数是根据Otsu方法,生成1个阈值,这个阈值将使图像二值化后区域内部的元素差异最小。

在参考文献[1]中,也提供了一个计算阈值的经验公式:T=Gmax-(Gmax-Gmin)/3,T是阈值,Gmax 和Gmin分别是图像中的最高、最低灰度值。本文选用这个经验公式作为产生阈值的方法。

然后,再对图像进行削弱背景和噪声干扰处理。首先对二值图像进行边缘检测,进一步去除背景的干扰,然后针对噪声干扰多为独立点,而字符特征多为短竖线这一特点进行中值滤波,过滤掉噪声。

在进行边缘检测时,常用的几种边缘检测算子是:Robert算子、Sobel算子、Prewitt算子、LOG算子和Canny算子,其具体内容可参考相关文献。

经过实验比对,Canny算子最满足本文去除背景的要求,因此在程序中选用的是Canny算子。

Canny算子是根据著名的Canny三原则(信噪比原则、定位精度原则、单边缘响应原则)结合获得的信噪比与定位乘积之最优逼近算子,使用一阶导数的极大值表示边缘。其基本思想是先将图像使用Gauss函数进行平滑,再根据一阶微分的极大值确定边缘点。Canny算子使用2个阈值来分别检测强边缘和弱边缘,当且仅当弱边缘与强边缘相连时,弱边缘才会出现在输出中,因此受噪声干扰较小,能检测到真正的弱边缘。边缘检测后需要进一步去除噪声。因为字符多是一些短竖线和短横线,而背景噪声很大部分是孤立噪声,因此,使用中值滤波函数medfilt 2就可以滤除主要噪声了。根据前面的分析,这里中值滤波采用的模板窗口是一个9行1列的竖线滤波窗口(medfilt 2函数参数为[1,9]),这样将过滤掉图像中非短竖线的部分,从而去掉噪声。

经过前面几步后,基本就可以获得一个比较“纯净”的二值图像,在这个图像上的字符特征区域有比较密集的“1”值点,还散布有少量残余背景和噪声也表现为“1”值点。接下来采用统计的方法对“1”值点分别在行和列方向进行统计,步骤几乎与采用色彩特征进行识别的统计过程一致,区别只在于色彩特征要求统计阈值的是256级的RGB范围,而这里只需判断是否为“1”。

确定车牌位置也于前面的色彩特征识别时确定位置的过程一样,也是用1个阈值来判断是否“遇到”了特征字符区域,然后确定4个坐标刻度,然后根据实验情况对这4个刻度进行修正,最后准确地对车牌实现定位。

3.2 车牌识别效果及其原因分析

通过实验发现,基于字符特征的车牌自动识别技术对于car1.jpg和car3.jpg都具有良好的识别效果,但对于car2,jpg的识别却发生错误,识别对象变成了右后视镜。

分析错误的原因发现,当car2.jpg转为灰度图时就已经出现错误的隐患了,车牌部分已经几乎和周围的背景完全混在一起,如图4所示。再转换为二值图像,车牌部分完全成了黑色,也就是没有任何“1”值点,字符特征已经完全被附近的背景所掩盖,导致错误发生,如图5所示。

分析car2和car1以及car3的区别,可以发现car2图像中,字符区域字符的特征不明显,而且字符的颜色和周围背景的颜色很接近;另外车牌区域和周围区域的颜色对比度很大,导致在转换为灰度图像时,车牌区域相对周围区域灰度级太低,在二值化时被判决为“0”区域,即被判决为背景,导致识别失败。这个问题在本算法中无法避免,在实际运用中必须运用其他识别方法辅助进行来解决。

4 结 语

利用Matlab作为工具,结合汽车牌照识别,本文对数字图像中的目标识别技术进行一定的研究。在前人的工作基础上,提出2种分别基于色彩和字符特征的车牌识别算法。两种算法都简单易行,各有所长,并有所优化选择。由于客观条件及时间的限制,这两个车牌自动识别算法尚不成熟,在以下几个方面还有一些问题需要解决:

(1) 解决原始图像来源不同导致的图像质量差异问题,或者从算法上抑制这些差异造成的影响;

(2) 改进算法,解决相近色彩干扰问题,解决循环统计计数问题;

(3) 进一步提高算法的普遍性,给算法增加一些可选分支,使得算法能适应多种识别需求。

这些问题还需要在后续研究中进一步提高和完善。

参考文献

[1]何斌,马天予.数字图像处理[M].2版.人民邮电出版社,2003.

[2]王耀南,李树涛,毛建.计算机图像处理与识别技术[M].北京:高等教育出版社,2001.

[3]廖佩朝.自动目标识别器的发展现状及应用分析[J].红外与激光技术,1992(2):1-2.

[4]李弼程,彭天强,彭波,等.智能图像处理技术[M].北京:电子工业出版社,2004.

[5]闻新,周露,张鸿.Matlab科学图形构建基础与应用[M].北京:科学出版社,2002.

[6]容观澳.计算机图像处理[M].北京:清华大学出版社,2000.

[7]赵雪春,戚飞虎.基于彩色分割的车牌自动识别技术[J].上海交通大学学报,1998,32(10):4-9.

[8]张炜,王庆,赵荣椿.汽车牌照的实时分割算法[J].西北工业大学学报,2001,19(1):35-37.

[9]清源计算机工作室.Matlab 6.0高级应用——图形图像处理[M].北京:机械工业出版社,2001.

[10]郭亚,王水波.基于灰度图像的车牌定位算法研究与实现[J].现代电子技术,2008,31(2):137-139.

几种车牌字符识别算法的比较 篇7

车牌自动识别系统是目前交通部门十分重要的科研课题之一,在公共安全、交通管理及军事部门有着极其重要的应用价值。由于我国车牌种类繁多,拍摄时所处的环境条件各异,使得车牌字符的识别更加困难。典型的牌照自动识别系统如下图1所示,主要由由图像采集、预处理、二值化、车牌定位、字符定位、字符分割和字符识别等几部分组成,这些过程存在着紧密的联系。本文就几种主要字符识别方法进行了研究。

2. 字符识别原理

字符识别是模式识别领域中很活跃的一个分支。字符识别的基本思想是匹配判别。抽取待识别字符特征按照字符识别的原理和预先存储在计算机中的标准字符模式表达形式的集合逐一进行匹配,找出最接近输入字符模式的表达形式,该表达形式对应的字就是识别结果。字符识别的原理如图2所示。

经过图像预处理,得到了二值化的数字点阵。对二值化字符图像进行特征提取,针对字符图像的特征提取的方法多种多样,有逐像素特征提取法、骨架特征提取法、垂直方向数据统计特征提取法、基于网格的特征提取法、弧度梯度特征提取法等很多方法。特征提取要保证类内聚类性和类间可分性,同时避免维数冗余性,应该考虑两方面情况:一方面是反映图像全局的特征,这种特征对一般噪声不敏感,另外一方面,选取的特征能够反映出图像的局部细节特征。

抽取一定的表达形式后,采用某种分类判别函数和判别规则,与模板库中己知的标准字符表达形式匹配判别,就可识别出输入的字符图像。

虚线以下是识别系统的学习部分。学习是根据多个未知字样抽取出模式表达形式,自动构造或修改充实字典,不断提高系统识别率。

经过多年的研究,对于标准字体的识别技术目前已经相当成熟,但在车牌识别系统中,由于实际使用条件的影响,存在着许多不利于识别的因素。与其它字符识别相比,车牌字符识别有其特殊性,主要体现在以下几点:

(1)字符集小。车牌上出现的汉字字符为省、自治区、直辖市或特殊机构的简称。加上26个英文字符以及10数字,字符类别不超过100类。

(2)待识别的字符图像小。字符图像来源于定位分割得到车牌图像,车牌占车辆图像中的比例很小,因此,车牌字符一般都很小,字符的宽高通常在20~30个像素之间,这样就增加了识别的难度。

(3)车牌字符图像受到的干扰因素多。车牌识别系统是全天候工作的系统,由于受到天气、外界干扰、车辆运动、车牌倾斜以及拍摄角度等因素的影响,导致提取到的车牌字符图像中的字符的大小、粗细、位置及倾斜度都不一样。另外,车牌的清晰度、清洁度、新旧底色及光照背景等因素,可能会使采集到的图像存在严重干扰,如字符模糊、畸变甚至断线等。因而,要求所采用的识别方法具有很强的抗干扰性和环境适应性。

(4)存在一些结构特征非常相似的字符。例如:数字“2”与字母“Z”,数字“8”与字母“B”,数字“5”与字母“S”,数字“0”、字母“Q”、“D”和“O”等。

除了第(1)点对识别有利外,其余特点都使得车牌字符的识别实现起来非常困难。目前最常用的车牌字符识别的方法有基于模板匹配的字符识别算法、基于神经网络的字符识别算法和特征统计匹配法。下面对几种方法分别做详细介绍。

3. 模板匹配字符识别算法

模板匹配方法是一种经典的模式识别方法,是最直接的识别字符方法,其实现方式是计算输入模式与样本之间的相似性,取相似性最大的样本为输入模式所属类别。首先要建立模版库,将待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选择最佳匹配作为结果。这种方法具有较快的识别速度,尤其对二值图像速度更快,可以满足实时性要求,但是,它对噪声很敏感,而且对字符的字体风格不具有适应性,任何有关光照、字符清晰度和大小的变化都会影响识别的正确率,因此在实际应用中为了提高正确率往往需要使用大的模板或多个模板进行匹配,而处理时间则随着模板的增大以及模板个数的增加而增加。该算法的一种改进是基于关键点的模板匹配算法,但针对不同的应用环境,关键点的选取方法是不同的。

由于车牌字符属于有限的字符集,如果前面的预处理工作做得比较好,预处理的图片质量较高,图片的水平倾斜度较小,这种方法的识别率基本能达到要求,可以获得较高的识别率。即便字符的切割不够精确,出现有用信息丢失的情况,采用多模板匹配仍能保证较高的识别率。

下面介绍一种简单的模板匹配算法。算法的基本思想是:将归一化后字符二值图像与模板库中的字符二值图像逐个进行匹配,采用相似度的方法来计算车牌字符与每个模板字符的匹配程度,最相似的就是匹配结果。

相似度函数定义式如下面的公式所示:

其中,f(i,j)为待识别车牌字符图像中像素点(i,j)的灰度值,这里的取值为0或l;t(i,j)为模板字符图像中像素点(i,j)的灰度值,这里的取值为0或1;M和N为模板字符点阵横向和纵向包含的像素个数。

匹配的步骤如下:

(1)依次取出模板字符,将模板字符按照上下左右四个方向,在周围五个像素的范围内滑动,每次分别计算出相似度S值,取其中的最大值S作为字符与模板字符之间的相似度函数。

(2)依次从待识别的字符与模板字符的相似度中找出最大相似度值所对应的模板字符,判断是否大于该字符的阈值T,如果S大于T,那么待识别字符的匹配结果就是该模板字符,如果小于T,则拒绝识别。

该算法可用于类似车牌字符等印刷体字符识别。在字符较规整时,算法对字符图像的缺损、污迹有较强的抗干扰能力,而且识别率高,但是它在字符旋转、变形,笔划粗细不同等情况下,识别能力有限。

4. 神经网络字符识别算法

神经网络理论自20世纪中期提出以来,取得了一系列的研究成果。近年来,随着计算机技术和非线性科学的发展,神经网络理论的研究又进入一个新的高潮,其应用己经渗透到各个领域,并在智能控制、模式识别、计算机视觉、生物医学工程等方面取得了巨大贡献。

用神经网络进行字符识别,主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。这种方法实际上是传统方法与神经网络技术的结合,可以利用人的经验来获取模式特征,然后充分利用神经网络的分类能力来识别字符,其识别效果与字符特征的提取有关,而字符的特征提取往往比较耗时。因此,字符特征的提取就成为研究的关键,特征参数过多会增加训练时间,过少会引起判断上的歧义。另一种方法是充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。这种网络互连较多,待处理信息量大。这种方法无需特征提取,由网络自动识别字符,抗干扰性能好,识别率高。但该方法产生的网络结构比较复杂,输入模式维数的增加可能导致网络规模庞大。

基于神经网络的字符识别算法一般包括以下四个步骤:

(1)对分割出来的字符样本进行预处理;

(2)提取样本字符特征;

(3)将特征送到神经网络中训练,训练好的神经网络对特征敏感;

(4)将待识别字符预处理提取特征后送到训练好的神经网络中进行识别。

基于神经网络的车牌字符识别方法,对于解析度较高和图像比较清晰的车牌,这些方法能有效识别车牌中的字符,但对于较低解析度和较为模糊的车牌还有很多工作要做,因为这些方法只有在车牌中的每个字符被独立分割出来的前提下才能完成识别工作,而独立分割车牌取得字符,对较低解析度和较为模糊的车牌来说是非常困难的。虽然,神经网络在识别效果上提高的余地较大,具有较强的容错能力,还可进一步训练学习,识别率较高,但其识别速度较慢,不能满足实时性的要求。

5. 特征统计匹配法

特征统计匹配法的要点是先提取待识别模式的一组统计特征,再按照一定准则所确定的决策函数进行分类判决。汉字的识别是将字符点阵看作一个整体,根据每个字符的笔画特征不同,将字符分解为横、竖、撇、捺、折、圆中的一种或几种结构特征的集合,经过大量的统计得到所用特征,再与字符库中的特征集合进行匹配,从而得到输入字符的识别结果。最常用的方法是网格特征匹配法。然而在实际应用中,由于外部原因的存在常常会出现字符模糊、字符倾斜等情况,从而影响识别效果,当字符出现笔画融合、断裂、部分缺失时,此方法更加无能为力。因此,实际应用效果不理想,鲁棒性不强。

6. 结论

车牌字符识别是整个车牌识别系统的最后一步,字符识别的准确率直接影响整个系统的最终识别结果。目前,车牌字符识别的研究虽然在技术上已经取得一定突破,然而离复杂多变的实际应用要求还有一定差距,许多新方法仅停留在理论和文章上或者限定在比较狭窄的约束范围内,暂不能以产品的形式大范围投入使用,因而车牌字符识别的实用化研究仍然有很长的路要走。

参考文献

[1]宋建才.汽车牌照识别技术研究[J].工业控制计算机,2002,4:45-57.

[2]张兴汇,刘玲,杜升之等.车牌照定位及倾斜校正方法研究[J].系统工程与电子技术,2004,2:237~239.

[3]崔屹.数字图像处理技术与应用[M].电子工业出版社,1997.

[4]张旭,王宏安,戴国忠等.面向车牌识别的区域分割技术[J].计算机工程,2002,12:113~115.

车牌识别算法与系统 篇8

近年来,随着我国经济的快速发展和人民生活水平的日益提高,城市交通问题面临越来越严峻的挑战。面对这一重大问题,构建智能交通系统(Intelligent Transport System,ITS)被认为是保障交通安全、缓解拥堵难题、减少交通事故的有效办法。车牌号码作为车辆的唯一标识,使车牌识别系统成为了智能交通系统中重要组成成分。在目前的交通系统中,车牌自动识别系统在高速公路监控与收费系统、停车场收费系统、交通事故现场勘察、违章车辆监控、ETC(Electronic Toll Collection,不停车收费系统)等领域都有着十分广泛的应用。

SVM(Support Vector Machine,支持向量机)是由Vapnik[1]等于1995年首先提出的,能够有效的解决非线性、高维模式识别等问题。由于SVM是一个二类问题的分类,而车牌字符识别是一个多类分类问题。目前,国内外很多学者对SVM在车牌字符领域的应用进行了研究。王伟[2]等研究并改进了基于二叉决策树的多分类SVM车牌字符识别算法;Bottou L[3]等应用“一对一”方法训练多分类SVM分类器对字符识别进行了研究;刘永春[4]等研究了“一对其余”方法在车牌字符中的应用;Knew S[5]等通过有向无环图构造了多类SVM分类器。以上方法都是构造多分类SVM分类器对字符进行识别,但缺点是所需的分类器过多,“一对其余”方法对K类分类问题需要K个分类器,“一对一”方法和有向无环图方法需要k(k-1)/2个分类器,完全二叉树方法需要log2k个分类器,针对需要种类较多的分类需要较多的分类器,导致训练时间太长且误差很大。Zhigang Y[6]等虽然研究了基于纠错输出编码字符识别,但没有针对车牌字符的识别进行研究。

因此,本文针对车牌字符识别提出了基于优化纠错输出编码的多分类SVM算法,对K类分类问题需要n个分类器,n满足2n≥K。针对车牌字符中的34个数字与英文字符,2n≥34的最小取值为n=6,26=64此时远远大于字符个数34,即此时不可分区域很大,容易导致分类误差很大。本文结合类似字符二次再识别对编码进行优化,将类似字符分为一类,大幅减少了不可分区域,降低了识别误差。实验结果表明本文提出基于多分类SVM的车牌识别算法识别率高,满足实际要求,而且训练时间短,鲁棒性良好。

2 基于纠错输出编码的字符编码

纠错输出编码算法是多分类器融合的典型算法之一,它能将一个多分分类问题分解成若干个两类分类问题。在正确识别的情况下,输出矩阵中应有且仅有一行与车牌字符编码数列相同,那么这一行所对应的类别即为最终识别结果。若矩阵中不存在与该数列相同的行,即存在不可分区域,那么査找输出矩阵中与车牌字符编码数列汉明距离最接近的一行,将该行所对应的类别作为最终识别结果。在一个编码排列中,任意两个码字之间对应位上编码取值不同的位的数目即为这两个码字之间的汉明距离。其计算公式如(1)所示。

其中,x,y分别为两个的编码串,n为编码位数。

由于SVM是二类分类器,本文采用二进制编码。针对车牌汉字字符,满足2n≥31的最小取值为n=5,存在不可分区域,因此汉字字符编码如下表所示;针对数字与英文字符,2n≥34的最小取值为n=6,此时26=64远远大于字符个数34,即此时不可分区域很大,容易导致分类误差很大。因此,结合本文提出的二次再识别,对传统的纠错输出编码进行优化。先将类似字符“0”与“D”、“2”与“Z”、“4”与“A”、“5”与“S”、“8”与“B”归为一类,那么需要分类的数目即变成29,满足2n≥29的最小取值为n=5,且不可分区域远远小于n=6时的不可分区域。汉字字符的编码如表1所示,英文和数字字符编码如表2所示。

3 多分类SVM分类器构造

3.1 特征提取

特征提取是指把样本从一个高维空间通过映射或者变换到低维空间。对于车牌识别系统来说,考虑到其在实际应用中实时性要求,特征选取需要考虑到系统的运算速度以及字符的识别正确率。同时,针对相似字符,为提高相似字符的识别正确率,本文将针对相似字符将进行第二次再识别。

根据车牌字符的长宽比例,将字符区域分为2×4块,如图1所示:

针对车牌数字和字母字符,其端点、交点以及闭合环的结构特征总共3个;统计每个模块的像素值为“0”的总个数,总共8个模块,作为字符的8个特征;并统计每条划分线上像素值为“0”的总个数,总共4条划分线,作为字符的4个特征;再计算字符的Hu不变矩,得到7个不变矩特征。因此,通过提取上述特征总共得到22维特征向量,进行字母和数字的分类识别。

由于汉字字符的结构较复杂,单一的特征已经不足以较好的描述字符的特征,需要结合多种特征对字符进行识别。基于汉字的局部和全局结构考虑,本文釆用一种基于网格统计特征和笔画结构特征的混合。分别提取每一块区域的区域笔画特征:质心、散度、区域像素密度、笔画复杂度,从全局结构考虑取字符图像的13点特征以及图像对称系数。字符图像分为8个区域,分别计算每个区域的质心、散度、区域像素密度、笔画复杂度,共生成32维特征向量;然后计算出整体的像素密度和对称系数,加上13点特征,最终形成了47维特征向量。

3.2 最佳参数模型的选择

本文采用的是目前使用较为广泛的径向基(RBF)核函数,RBF核函数能够逼近任意的非线性函数,具有良好的泛化能力及很好的收敛速度。考虑到最佳的运算效率,本文采用双线性法求解SVM分类器的最佳参数(C,σ2)。分别对每个字符分别选择20个训练,测试样本为每个字符10个,经实验得到的核函数最佳参数为:汉字字符分类器取C=100,σ=0.6;字母数字字符分类器取C=60,σ=0.3。部分参数对应的识别率见表3:

3.3 二次识别

采用多特征SVM多分类器的方法进行字符识别,针对大多数字符的识别率都比较高,容易识别错误的主要是结构类似字符。本文通过上述分类方法先将类似字符归为一类,再根据类似字符的局部结构细节特征,将类似字符进行二次识别。本文将车牌字符中的类似字符分为以下五类,并针对这五类类似字符采取提取字符的局部特征再分类,通过对比局部区域的笔画像素特征进行二次识别。类似字符归类如表4所示:

本文以“8”与“B”为例说明,“8”与“B”的局部特征区分在字符的左侧,“8”的左侧结构是曲线,“B”的左侧为一竖直线,可取左侧顶部、中部与底部的区域对比其像素密度进行二次识别,其直观图如图2所示:

3.4 算法描述

以汉字字符为例,基于纠错输出编码的SVM多类分类算法流程如下:

①车牌汉字字符总共有31个,所以取K=31,n=5,各车牌汉字字符编码假设为{x4x3x2x1x0},其中x4,x3,x2,x1,x0取0或1。编码矩阵为31行5列的矩阵,如图3所示。

②n=5即只需要训练5个分类器(C1,C2,C3,C4,C5),分别对应编码矩阵的每列。如C1对应矩阵第一列,其中值为1的元素即代表该行类别在C1分类器中划分为+1类,值为0的元素即代表在C1分类器中划分为-1。同理,其他四个分类器的训练方法类似。

③每个字符在每个分类器中的识别输出都有一个结果,即为0或1,5个分类器(C1,C2,C3,C4,C5)识别输出的结果即为{x4x3x2x1x0}。

④根据{x4x3x2x1x0}的值对应编码矩阵中的编码,求出汉字字符。若没有找到匹配项,即处于不可分区域中,则取编码中汉明距离最小即误差最小的编码为结果,取其对应的汉字字符。

上述过程用流程图可以表示见图4:

4 实验结果及分析

本文共选取了1200张不同环境条件下的车牌字符作为训练样本,测试样本为每种字符类型各500张车牌字符,采用交叉验证的方式训练识别。图像来源均来自各个不同的高速公路收费站现场图像识别系统现场随机采集的照片。其整体识别正确率如表5所示:

结果表明,本文提出的基于多分类SVM的车牌识别算法识别率较高,识别速度较快。由于“一对其余”方法是目前应用最为广泛的SVM多种类分类方法之一,本文在相同字符特征及相同模型参数的条件下与“一对其余”方法对比。结果如表6所示:

由上表可知,本文提出的基于多分类SVM的车牌识别算法对比传统的“一对其余”法识别率更高,而且训练时间、识别时间均更短。因此,在总体性能上略优于传统的“一对其余”方法。

本文的实验仿真平台是基于Matlab R2014a GUI搭建,编程语言采用M语言,其中SVM分类器的训练和识别采用LIBSVM工具箱Matlab版本的接口。硬件条件为Inter Core i7CPU,8G内存,Windows7旗舰版操作系统。软件运行界面如图5所示。

5 结论

车牌识别技术是智能交通系统中的一项核心技术,在高速公路监控与收费系统、停车场收费系统等领域都有着广泛的应用。字符识别算法是车牌识别技术中的关键环节。本文对车牌字符识别问题构造了基于优化纠错输出编码的多分类SVM分类器,本文做出了如下的贡献:

①传统的基于SVM车牌字符识别算法针对多分类问题所需的分类器数量太多,导致训练时间太长且误差很大。本文提出的车牌字符识别算法所需分类器数量大幅减少,从而节约了训练时间。

②对车牌字符中的字母与数字编码进行了优化,大幅减少了不可分区域,降低了识别误差。

③本文提出的基于多分类SVM的车牌识别算法识别率高,而且训练时间短,鲁棒性良好,满足实际需求。

在本文中,选取的实验字符均为比较清晰完整的字符,即笔画结构都是完整清晰的,但是在现实应用中,很多的现场采集图像由于环境因素可能会导致笔画断裂或者不清晰等。因此以后将会考虑到字符的残损进行下一步的研究。

参考文献

[1]Vapnik V.The Nature of statistical learning theory.New York:Springer-Verlag,1995.

[2]马伟等.SVM多类分类器在车牌字符识别中的应用[J].计算机工程与设计,2011,12(9):46—50.

[3]Bottou L,Cortes C,Denker J et al.Comparison of classifier methods:A case study in handwritten digit recognition.Proceedings of the International Conference on Pattern Recognition,Los Alamitos,CA,USA,1994:77-82.

[4]刘永春.基于SVM的车牌字符识别算法研究[J].四川理工学院学报(自然科学版),2012,8(4):14—20.

[5]Knew S.Net computer:methods,configuration and application.New York:Springer,1995.

上一篇:外力破坏下一篇:中印边界问题