火灾图像识别

2024-06-10

火灾图像识别(精选九篇)

火灾图像识别 篇1

能够准确并及时的探测火灾发生是消防安全的重要手段。传统的火灾探测器基本上都是利用火灾发生时火焰的烟雾、温度、光等方面来进行检测,但由于传统的火灾探测器受到空间大小、周围环境及不确定因素的影响,往往表现出一定的误报、漏报现象。图像型火灾探测技术是通过光学镜头对监测对象在计算机上进行火灾识别,根据火灾发生时表现出来的丰富的特征,图像型探测技术可以如同人类视觉一样,进行直观的、准确的判断,并且可以不受环境影响及时的发出警报。而图像型火灾探测技术主要是通过早期火灾火焰在图像上表现出的静态以及动态特征来探测火灾,其中的主要问题是对火焰图像的特征识别。

人工神经网络(Artlficial Neural Network,简称ANN)是人一种模仿人脑工作的信息处理系统。它能够保证系统不受外界因素的影响,具有较好的容错性和可靠性[1]。本文运用RBF神经网络建立火灾火焰的识别模型,将提取出的火焰特征作为输入量,对火焰图像进行识别,提高了火灾识别在不同场景中的准确率。

2 RBF神经网络算法[2]

RBF(Radial Basis Function)神经网络也称为径向基神经网络,其网络结构简单、训练简洁而且学习收敛速度快、逼近能力强,是一种具有较强的输入输出映射功能的最优网络。因此他已被广泛应用于时间序列分析、模式识别、非线性控制和图像处理等领域。

RBF神经网络主要由输入层、隐层和输出层组成。输入节点只传递输入信号到隐层。隐层节点由辐射状基函数构成(如高斯函数),隐层节点中的作用函数具有局部逼近能力,对输入信号在局部产生响应。输出层节点采用线性函数[3]。

RBF神经网络的激活函数可表示为[2]:

式中,||xk-ci||为xk和ci之间的距离;ci为高斯函数的中心向量;σ为高斯函数的方差。

则网络的输出为:

式中,xk=(x1p,x2p,⋯,xmp)T为第k个输入样本;k=1,2,3,⋯,K,K为样本总数;ci为网络隐含层节点的中心;ωij为隐含层到输出层的连接权值;i=1,2,3,⋯,h为隐含层节点数;yj为与输入样本对应的网络的第j个输出节点的实际输出。

RBF网络的学习算法具体为三个方面:

1:求取基函数中心c。

网络初始化:随机选取h个训练样本作为聚类中心ci(i=1,2,⋯,h)。

将输入的训练样本集合按最近邻规则分组:按照xk与中心为ci之间的欧氏距离将xk分配到输入样本的各个聚类集合υk(k=1,2,⋯,K)中。

重新调整聚类中心:计算各个聚类集合υk中训练样本的平均值。

步骤2:求解方差σi。

步骤3:计算隐含层和输出层之间的权值。

隐含层至输出层之间神经元的连接权值可以用最小二乘法直接计算得到:

3 火灾的判别

基于RBF神经网络的图像型火灾探测算法主要分为三个部分;a)对图像进行预处理,目的是消除一定的干扰,有利于提高图像处理分析的效率;b)提取疑似火焰区域的特征,包括颜色决策、面积变化率和闪烁频率;c)将获取的特征值作为RBF神经网络的输入量,通过神经网络的训练获取这些特征参数包含的火灾信息,从而判断是否为火灾图像。

3.1 预处理

对图像预处理的目的主要是为了提高图像的清晰度,改善图像的视觉效果,使得图像可便于人理解和计算机处理[4]。中值滤波最大的优点就是能够克服线性的滤波器在处理图像时带来的一系列图像细节模糊的缺点,主要用来减少随机干扰和脉冲干扰[5]。它基本原理是对采样得到的邻域数据先进行排序然后取得这些像素点灰度值的中值作为该处理像素点的灰度值。在中值滤波中,认为每一像素都与其周围邻域的像素有密切关系,一般对一些孤立像素点并不十分关注。中值滤波法的实现步骤主要有两步:(1)将图像中的某个采样窗口中的奇数个数据进行从大到小排序;(2)用排序结果中的中值替代要处理的数据。

3.2 特征提取

3.2.1 颜色决策

火焰颜色特征在HSI空间用颜色矩来表示,以这样表示来作为神经网络的输入。其方法是图像中的每个颜色分布都能用颜色的矩来表示。而且在低阶矩中包含了主要的颜色信息,所以仅用颜色的一阶矩、二阶矩和三阶矩就能够表达图像的颜色分布[6]。则表示式分别为:

其中,N代表图像面积,H(pi)代表图像p在HSI空间中的第i个像素的H分量值。计算火焰像素的一阶颜色矩,作为RBF神经网络识别火焰的一个判据。

3.2.2 面积变化率

火灾在发生初期,火苗是不断跳动的,表现在图像上就是高亮区域的面积是不断变化的,并且连续几帧图像中,高亮区域的面积是呈增长趋势的。但车灯等快速闪动的疑似火焰物体,高亮区域的面积变化率比较小。依此特性可以区分火焰和疑似火焰物体。

3.2.3 闪烁频率

火焰的主要频率为8-12Hz[7],可以作为火焰识别的另一个重要判据,它的主要特点是不随着周围环境的变化而变化。设在一定时间内,采集k帧序列图像,得到k个面积观测值,对其进行傅里叶变换,进行频谱特性分析[8]:

f(t)=∑S(i)ej2πti[i=1,2,L,k](8)

选择前面研究的颜色决策、面积变化率和闪烁频率这三个火焰特征判据作为RBF神经网络的输入量,通过神经网络的训练来判断是否为火灾图像。

4 实验结果分析

图1为对火灾图像进行中值滤波的结果显示。

在对图像进行中值滤波后暖气片反射的亮光区域变暗,而真正的火焰区域变化不大。

取36-40帧图像的特征数据作为测试样本来检验RBF神经网络的识别能力,当输出值大于0.6就认为是火灾图像[9]如表1。

从表1可以看出,36-39帧图像的火焰特征比较明显,RBF神经网络成功的诊断出火灾图像。

5 结束语

图像型火灾探测的核心问题是火焰以及干扰光源物体的分类识别,本文主要研究了RBF神经网络的工作原理,把火焰的特征数据火焰一矩色矩、面积变化率和闪烁频率作为RBF神经网络模型的输入变量,对图像进行实验研究。结果表明了利用RBF神经网络对火焰图像进行识别具有较高的准确率和较好的实时性。

摘要:火灾火焰特征的提取是图像型火灾火焰探测中的关键问题,该文提出了一种基于RBF神经网络算法的图像型火灾识别的方法,首先运用中值滤波的方法对图像进行预处理,然后提取疑似火焰区域的颜色决策、面积变化率和闪烁频率特征,最后将获取的特征值作为RBF神经网络的输入量,通过神经网络的训练获取这些特征参数包含的火灾信息,从而判断是否为火灾图像,仿真实验结果证明了算法的准确性和实时性。

关键词:火焰图像,RBF神经网络,图像型,特征提取

参考文献

[1]基于模糊神经网络的图书馆火灾监控系统关键技术研究[D].太原:中北大学,2009.

[2]陈祥光,裴旭东.人工神经网络技术及应用[M].北京:中国电力出版社,2003.

[3]厉谨.图像型火灾探测技术的研究[D].西安:西安建筑科技大学,2010.

[4]孙即祥.图像分析[M].北京:科学出版社,2005.

[5]田浩,葛秀慧,王顶.数字图像处理原理与应用[M].北京:清华大学出版社,2007:74-84

[6]Noda S,Ueda K.Fire detection in tunnels using an image processing method.In:Vehicle Navigation and Information System Conference Proceedings,Yokohama:1994,57-62.

[7]Hamins A,Yang J C,Kashiwagi T,An experimental investigation of the pulsation frequency of flames[J].Symposium(International)on Com bustion,1992,24(1):1695-1702.

[8]T.H.chen.An intelligent Real-time Fire Detection Method Based on Video Processing.In Processing of the IEEE37th Annual2003,Inter national Carnahan Conference on Security Technology.104-111.

火灾图像识别 篇2

——矿井安全知识宣传

文章主要介绍了瓦斯、矿井火灾、透水、煤层爆炸和爆破事故及其防治等相关知识,让公司的员工对灾矿井火灾隐患有所识别,增强灾害防治紧急避险的意识,从而有利于公司实现安全生产。

一、瓦斯

(一)瓦斯是什么

瓦斯是煤矿五大灾害因素之一。瓦斯是一种无色、无味、无臭的气体。瓦斯比空气轻、与空气的相对密度为0.554。瓦斯有很强的扩散性。瓦斯的渗透性很强。矿井瓦斯具有燃烧性和爆炸性。当井下空气中瓦斯浓度较高时会相对降低空气中的氧气而使人窒息死亡。

(二)瓦斯矿井的条件

同时满足下列条件的矿井为瓦斯矿井:(1)矿井相对瓦斯涌出量小于或等于10立方米/t;(2)矿井绝对瓦斯涌出量小于或等于40立方米/min;(3)矿井各掘进工作面绝对瓦斯涌出量均小于或等于3立方米/min;(4)矿井各采煤工作面绝对瓦斯涌出量均小于或等于5立方米/min一的矿井为出形式。

(三)瓦斯爆炸及其预防

瓦斯爆炸必须同时具备三个基本条件:一是瓦斯浓度在爆炸界限内,一般为5%至16%;二是混合气体中氧的浓度不低于12%;三是有足够的点火源。三个条件必须同时具备,缺一不可。

预防瓦斯爆炸的主要措施:(1)预防瓦斯积聚;(2)防止明火;(3)防止电火花;(4)防止爆破火焰;(5)防止摩擦火花;(6)防止高温热源。

发生爆炸事故时的应急避险:(1)保持镇静、清醒,不要惊慌失措乱喊乱跑。当听到或者感觉到爆炸声响和空气冲击波时应立即背朝声响和气浪传来方向、脸朝下、双手置于身体下面、闭上眼睛迅速卧倒;(2)立即屏住呼吸,用湿毛巾捂住口鼻,防止吸入有毒的高温气体,避免中毒和灼伤气管和内脏;(3)用衣服将自己身上裸露部分尽量掩盖,以防火焰和高温气体灼伤身体;(4)迅速取下自救器,按正确方法戴好,防止吸入有毒气体;(5)高温气体和冲击波过后应立即辨别方向,以最短的距离进入新鲜风流中,并按照避灾路线尽快逃离灾区;(6)已经无法逃离灾区时应立即选择避险硐室。

(四)煤与瓦斯突出及预防

预兆 :在井下采掘过程中,煤与岩石常常一瞬间被从煤体中抛出,并喷出大量瓦斯,这种现象叫煤与瓦斯突出,简称为“突出”。煤与瓦斯突出事故不仅会造成采掘工作面和通风系统的破坏,同时大量煤与瓦斯以极快的速度喷出,还可能会充塞巷道,造成人员窒息和瓦斯爆炸、燃烧及煤(岩)埋人事故。煤与瓦斯突出前,一般都有预兆,没有预兆的突出极少。

突出预兆可分为有声预兆和无声预兆。

有声预兆,是指煤层发出劈裂声、闷雷声、机枪声、响煤炮以及气体穿过含水裂缝时的吱吱声等。声音由远到近,由小到大,有短暂的,有连续的,时间间隔长短也不一致;煤壁还会发生震动和冲击,顶板来压,支架发出折裂声。无声预兆,是指工作面顶板压力增大,煤壁被挤压,片帮掉渣,顶板下沿或底板鼓

起;煤层层理紊乱、煤暗淡无光泽、煤质变软;瓦斯忽大忽小,煤壁发凉,打钻时有顶钻、卡钻、喷瓦斯等现象。

注意事项:(1)井下工作人员发现上述预兆后,应立即向有关部门报告,及时采取措施;(2)情况严重时,应立即停止作业,迅速迎着风流撤出。

顶板冒顶的预兆:(1)响声;(2)掉渣;(3)片帮;(4)漏顶;(5)裂缝;

(6)瓦斯涌出量突然增大;(7)顶板淋水增大。

(五)应急操作规程:(1)必须按作业规程的规定及时支护,严禁空顶作业,并及时回柱房顶和充填;(2)所有支架必须架设牢固,并有防倒措施,严禁浮煤或浮矸上架设支架;(3)严禁在控顶区内提前摘柱;(4)碰倒或者损坏、失效的支柱,必须立即恢复或者更换。

(六)发生冒顶事故时的应急避险:(1)迅速撤退到安全地点;(2)遇险时要靠煤帮贴身站立或者到木垛处避灾;(3)遇险后立即发出呼救信号(4)积极开展自救互救(5)被隔堵人员要积极配合外部营救工作。

二、矿井火灾

(一)什么是矿井火灾

凡发生在井下的火灾及发生在井口附近但危害到井下安全的火灾,都叫矿井火灾。

(二)发生火灾的基本要素有:(1)热源。(2)可燃物。(3)氧气。

(三)矿井火灾的危害:(1)矿井火灾的危害;(2)井下发生火灾后,产生大量的有害气体;(3)引起瓦斯、煤尘爆炸;(4)产生火风压;(5)产生再生火源;(6)造成经济损失。

(四)煤炭自燃的初期预兆:(1)巷道内湿度增加,出现雾气、水珠。(2)煤炭自燃放出焦油味。(3)巷道内发热,气温升高。(4)人有疲惫感。

煤炭自燃的易发地点 :(1)断层附近;(2)采煤工作面的进风巷、回风巷和切眼;(3)停采线附近;(4)遗留的煤柱;(5)破裂的煤壁;(6)巷道的高冒处;(7)假顶工作面;(8)封闭墙内、溜煤眼;(9)联络巷;(10)浮煤堆积的地方。

(五)预防煤炭自燃的主要方法:(1)均压通风控制漏风供氧;(2)喷浆堵漏钻孔灌浆;(3)注凝胶防灭火。

(六)矿井发生火灾事故的应急处理

1、井下发现了烟火或者明火等火灾灾情,应立即通知附近的工作人员。

2、如果火灾不大应立即组织力量直接把火扑灭。

3、如果火灾范围大火灾或者火势猛则应撤出灾区人民、保证自身安全的前提下,采取稳定风流、控制火势发展、防止人员中毒和预防瓦斯或者煤尘爆炸的措施,并随时保持和地面指挥部的联系,根据指挥部的命令行事。

4、见到火或突然接到火警通知,需要立即撤退的人员要在判明灾情和自己实际处境以及应急措施的前提下再采取行动。

(七)发生火灾事故后安全撤离时应注意事项

1、要尽最大的可能迅速了解或判明事故的性质地点范围,事故区域的巷道情况、通风系统、风流、火灾烟气蔓延的速度和方向以及自己所处巷道位置之间的关系,并根据矿井灾害预防、事故处理计划和现场实际情况确定撤退路线和避灾自救的方法。

2、撤退时,任何人无论在任何情况下都要不要惊慌,不能狂奔乱跑。

3、如果在自救器有效作用时间不能及时安全撤出时,应在设有存储备用自救器的硐室内换用自救器后再自行撤退,火灾寻找压风管路系统的地点以压缩

空气供呼吸之用。

4、撤退行动要迅速果断又要快而不乱。

5、如果无论是逆风或顺风撤退都无法躲避着火巷道或者火灾烟气造成的危害,则应迅速进入避难硐室;没有避难硐室时应在烟气袭来之前选择合适的地点就地利用现场条件快速构筑临时避难硐室,进行避灾自救。

三、透水

(一)透水事故的易发地点

(1)接近含水层、导水断层、溶洞和导水陷落柱等地点;(2)近水淹或者可能积水的井巷、老空或相邻煤矿的地点;(3)接近可能与河床、湖泊、水库、蓄水池、水井等相近的断层破碎带的地点;(4)打开隔离煤柱防水的地点;

(5)接近可能出水的钻孔地点;(6)接近有水的灌浆区的地点。

(二)矿井发生透水之前的预兆

(1)挂红;(2)挂汗;(3)煤壁变冷;(4)出现雾气;(5)水叫;(6)顶板淋水加大;(7)顶板来压,底板鼓起;(8)水色发浑,有臭味;(9)工作面有害气体增加;(10)裂缝出现渗水。

(三)矿井发生突水事故时的应急避险

(1)在突水迅猛、水流急速的情况下,现场人员应立即避开出水口和泄水流躲避到硐室内,拐弯巷道或其他安全地点;(2)当老空水涌出,使所在地点有毒有害气体浓度增高时,现场职工应立即佩戴好隔离式自救器;(3)井下发生突水事故后,决不允许任何人以任何借口在不佩戴防护器具的情况下冒险进入灾区;(4)水害事故发生后,现场及附近地点工作的人员在脱离危险后,应在可能情况下迅速观察和判断突水的地点、涌水的程度、现场被困人员的情况等并立即报告矿井调度。

四、煤尘爆炸

(一)煤尘爆炸的条件

(1)绝大多数煤尘本身具有爆炸性。(2)悬浮煤尘的浓度达到一定值(45—200g/m3)。(3)有点燃引爆煤尘的高温热源。(4)空气中氧气浓度不低于18%。

(二)预防煤尘爆炸和爆炸传播的主要措施

(1)降尘措施:煤尘注水;水泡泥;湿式打眼;喷雾洒水;清扫积尘;

(2)防止煤尘被引爆的措施:防止点燃煤尘的高温热源的出现,因此要严格管理和限制生产中可能出现的火源、热源;

(3)隔爆措施:在可能发生煤尘爆炸地点的通道上,预先设置岩粉棚、水棚、自动式隔爆棚、隔爆水幕及撒布岩粉袋,一旦发生煤尘爆炸,利用煤尘爆炸产生的冲击波使其自然动作,将消焰剂弥撒于巷道空间,阻隔或者熄灭爆炸火焰的传播,实现隔绝煤尘连续爆炸的目的。

五、爆破事故及其防治

引起矿井爆破事故的因素很多。在爆破器材的质量、储存、管理、运送、使用或与爆破技术有关的任何一个环节出现问题,都可引发爆破事故。

(一)爆破前的防治措施

(1)按适用条件使用质量合格的炸药、雷管;(2)加强对爆破器材的管理;

(3)对爆破地点认真检查;(4)在有煤尘爆炸危险的地点进行爆破时,20M内应进行洒水降尘;(5)加固爆破点附近支架,机器、工具和电缆必须加以保护或

移出工作面。

(二)爆破过程中的防治措施:

(1)爆破时,严格执行“一炮三检”制和“三人连锁放炮”制。(2)加强警戒。

(3)按规定装药、联线。(4)爆破工不得随意将发爆器或钥匙转交他人。(5)爆破时,爆破工必须发出警告,至少再等5秒方可起爆。

(三)爆破后的防治措施:

(1)加强通风,及时吹散炮烟。(2)认真检查。(3)正确处理拒爆、残爆。

(四)特殊爆破事故的防治措施:

1、巷道贯通时的爆破事故防治:(1)巷道贯通前,要检查和排放贯通地点的瓦斯。(2)独头掘进贯通爆破时,距贯通地点20M,必须在穿透位置里外两侧设好警戒,禁止在警戒区作业或逗留,透位不清,禁止爆破。(3)两头对掘贯通爆破时,距贯通地点20M,必须停止一头作业,任然保持通风,由一头贯通,并派专人负责警戒。(4)巷道贯通前,要加固支架,以防崩倒棚子和崩坏棚腿,造成倒棚冒顶。5)超过贯通距离而不通时,要立即停止爆破,查明原因,重新采取贯通措施。

2、穿透“老空”时的爆破事故防治:(1)打眼时,如发生炮眼内出水、温度骤高骤低、有大量瓦斯涌出、煤岩松散等情况,要停止爆破,查明原因。2)距穿透“老空”15M时,要探明“老空”来源,以及“老空”中的水、火、瓦斯等情况,如有水、火、瓦斯,必须采取防水措施,瓦斯排放措施和火区封闭措施,否则禁止爆破。(3)距穿透“老空”时,要把人员撤到安全地点,并在安全地点实施爆破。

3、接近积水区的爆破事故防治:1)要根据实际情况,编制切实可行的探放水设计和安全措施,否则禁止爆破。(2)发现透水预兆,要立即停止爆破,及时汇报,查明原因,情况危急时,人员立即撤离。(3)打眼时发现炮眼渗水,不要拔出钻杆。(4)处理溜煤眼堵塞时的事故。(5)必须采用取得煤矿矿用安全标志的煤矿许用炸药。(6)每次爆破只准使用一个煤矿许用电雷管,最大装药量不得超过450G。(7)爆破前必须检查瓦斯。(8)爆破前必须洒水。9)在有威胁安全的地点,必须撤人、停电。

4、处理溜煤眼堵塞时的事故:(1)必须采用取得煤矿矿用安全标志的煤矿许用炸药。(2)每次爆破只准使用一个煤矿许用电雷管,最大装药量不得超过450G(3)爆破前必须检查瓦斯。(4)爆破前必须洒水。(5)在有威胁安全的地点,必须撤人、停电。

5、石门揭穿突出煤层进行震动爆破时的爆破事故防治:(1)必须编制专门设计。(2)震动爆破工作面,必须具有独立、可靠、畅通的回风系统,爆破地点,反向风门位置,避灾路线及停电、撤人和警戒范围等,必须在设计中明确规定。

(3)爆破30min后,人员方可进入工作面检查。

交通中的图像识别应用 篇3

我们都知道图像,在日常生活中也要接触大量的图像,图像就是图形和影像的总称,我们通过眼睛所观察到的一切都是图像,那么,什么是图像识别?什么又是图像识别技术呢?

图像识别又叫图像再认,是指人们再次辨认出某一图形的过程,当图形信息刺激人体的感觉器官,人体通过记忆中存储的信息与当前的感官信息进行对比加工,从而再次辨认出这一图形。人体具有极强的图像识别能力,我们看下面几张图片:

图1、2、3是图形设计师们对字母A的美化设计,虽然在颜色、形状和大小上有较大差异,但人们都可以轻松的识别出它就是字母A;图4、5、6从拍摄角度和光线上来说都是三张截然不同的图像,但人们也可以很轻松的分辨出它就是同一个项链。人们不仅可以通过视觉识别出某一图像,甚至图像识别还可以不受感觉通道的限制。例如,当别人在你背上写字母A时,相信你依然能识别出这一字母来。

人体神秘而神奇,究竟人体是怎样进行图像信息识别的呢?经过科学家们多年的研究发现,人体进行图像识别应该是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,人体在图像识别过程中,总是排除输入的多余信息,抽出关键信息,同时将这些关键信息进行整合,从而形成一个完整的知觉映像。

进入21世纪以来,伴随着科技的发展,人们变得越来越“懒”,以前必须要人类智能才能完成的图像识别工作也希望由计算机来替代,“图像识别技术”也由此而生。图像识别技术是人工智能的一个重要领域,它借由计算机来完成图像的识别功能。

图像识别的模型主要有两种——模板匹配模型和原型匹配模型。模板匹配模型强调当前的刺激必须与大脑中的模板完全匹配,图像才能被识别。例如字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A才能被识别。这个模型简单明了,但是它要求图像与模板必须完全吻合,这就要求在模板库设计时必须考虑所有的情况,这几乎是无法实现的,因此这一模型仅适用于场景较为单一的图像识别过程。

为了解决模板匹配的问题,人们提出了原型匹配模型,它将从图像中提取出的“相似性”作为原型,拿它来检验所要识别的图像。仍以字母A为例,它记录的原型是字母A的尖这一原型,所有具备尖这一特征的图像都将被识别为A。这种模型更倾向于人类的思维模式,也能识别出情况更为较多、较复杂的图像,因此称为图像识别技术的发展方向。

图像识别技术在交通中的应用

图像识别作为人工智能的重要内容,21世纪以来得到了巨大的发展,广泛应用于生产生活的各行各业中。在银行和商业中,图像识别技术用于识别支票和钞票上的特殊数字和字符;在医学上,图像识别技术用于识别早期肿瘤、分析心电图以及血小板计数;在军事中,图像识别技术用于导弹的精确制导;在地质勘探中,图像识别技术用于发现石油和天然气可能存在的底层;在现代遥感技术中,图像识别技术用于识别不同的自然资源。

近年来,伴随着城市的飞速发展,城市内人口急剧增加,汽车拥有量持续提高,由此引发了一系列的交通安全和交通拥堵问题。交通问题是涉及人、车、路的一个复杂的系统问题,它往往伴随着海量数据的分析和处理。因此,近年来,图像识别技术被广泛应用于交通运输领域,以提高交通管理者的工作效率,更好的解决城市交通问题。目前,图像识别技术已经广泛应用于交通违章监测、交通拥堵检测和交通信号灯识别等交通运输领域。

1. 交通违章监测

相信每一个有驾驶经验的人都会对道路上突然的闪光心存忌惮,没错,当闪光灯亮起的时候,可能你又要去缴纳罚单了。为了更好的保证道路的行车安全,这种先进的电子监测系统,也就是我们俗称的“电子警察”正被广泛的应用于抓拍“闯红灯”、“超速”等交通违章行为中。当“电子警察”采集到违章图像后,通过PSTN网(公共交换电话网)或Internet网送回交通监控中心,由专业的处理软件完成违章车辆图像显示、筛选、车牌号判读、违章车辆图文信息记录以及资料管理和查询等工作。其中,车牌号判读便运用了先进的图像识别技术,那么,车牌号是如何被识别出来的呢?

车牌号判读主要由图像处理、车牌定位、字符切分和字符识别四部分组成。

图像处理:将模拟图像转换为数字图像,模拟图像也就是空间连续的图像,而数字图像是空间离散的图像,比如10000像素的图像就是说图像是由10000个点组成的,由于计算机只能识别数字图像,所以我们首先便要将抓拍到的图像转换为数字图像。

车牌定位:将数字图像转化为灰度图像,也就是把彩色图像转换为黑白图像,图像的明暗变化由灰度值的大小决定。接着对灰度图像进行二值化分析,其目的是寻找一个合适的灰度值,把车牌照突出出来。然后用预存的车牌照特征与二值化分析后的图像进行比对,最终确定车牌照的位置。

字符切分:完成牌照区域的定位后,再将牌照区域分割成单个字符,然后进行识别。字符分割一般采用垂直投影法,这是因为字符在垂直方向上的投影会在字符间取得一个局部的灰度最小值,易于将字符分割出来。

字符识别:字符识别可以采用前面所提及的两种方法,基于模板匹配的方法和基于原型匹配的方法。基于模板匹配的方法是将分割后的字符与字符数据库中的所有模板进行匹配,最后选最佳匹配作为结果。基于原型匹配的方法是先对字符进行特征提取,用所获得的特征来识别字符。

2. 在交通拥堵检测中

当我们乘坐小汽车或者公交车的时候,什么事情最让我们心烦意乱呢?没错,就是堵车了。在发生拥堵的时候我们最希望谁出现?没错,就是伟大的交通警察,他们让道路秩序井然有序,恢复畅通。那么可以在交通拥堵即将发生或已经发生时迅速通知交警吗?答案是肯定的,图像识别技术就可以实现交通拥堵的自动检测,及时通知交警进行交通疏导。那么图像识别技术是如何实现佳通拥堵的自动检测的呢?

交通拥堵自动检测主要由道路有效区域划定和车流所占面积比例两部分组成。

道路有效区域划定:将车辆流区域和非车辆流区域进行区分,车辆流区域是指路面本色的区域,它有灰度值变化较小的特点,因此大多数杂点较少的路面都可以轻松的识别出来;非车辆流区域是指花坛、护栏等区域,它的灰度值变化较大,进行区域划定前后的图像如图8和图9所示。

车流所占面积比例:车流所占面积比例的计算由边缘像素统计、交通流区域计数和交通拥堵判别三个过程组成。边缘像素统计是指在道路有效区域划定的基础上,在道路有效区域划定的基础上,统计所有灰度值剧烈变化的像素点,即边缘像素点,这些灰度值剧烈变化的像素点实际上就是车道上行驶车辆的边界点;接着在交通流区域计数时对所有边缘像素点进行扫描,通过判断当前像素点与前后像素点的关系确定行驶车辆所占的区域;经过上面两个步骤后,就可以实时的计算出行驶车辆所占的区域面积与道路有效区域面积的比例,这一比例与交通工程师提供的拥堵值进行比较,便可以轻松判别出交通拥堵的状况。如图10所示。

3. 在交通信号灯识别中

在世界上,大约有7%~8%的色盲、色弱患者,由于无法准确快速的在交叉口判断出交通信号灯信息,而给他们的日常出行带来了不便,目前,以图像识别技术为基础的交通信号灯识别技术给他们的出行提供了帮助。那么,交通信号灯是如何被识别出来的呢?

交通信号灯的识别方法有两种:一种是基于颜色分割的交通信号灯识别方法;另一种是基于形状分割的交通信号灯识别方法。

基于颜色分割的交通信号灯识别方法:交通信号灯的颜色特征是最为凸显的特征。我们也许都挺熟过RGB颜色空间,它是以红、绿、蓝三种基色来显示彩色,虽然我们希望以不同的R、G、B值来识别不同的交通信号,但是这种方法是不实际的,因为R、G、B三者之间的相关性较高,容易受光照、阴影等因素的影响,从而无法正确识别出红、绿、黄三种交通信号。HIS颜色空间颜色空间是适合人类视觉特性的色彩模型,其中H表示色度、I表示强度、S表示饱和度,HIS空间模型H、I、S三者之间相关性较小,易于进行颜色识别。因此,在基于颜色分割的交通信号灯识别中便采用将RGB颜色空间转换为HIS空间,再根据H、I、S值的阈值范围的方法来识别红、绿、黄交通信号。

基于形状分割的交通信号灯识别方法:交通信号灯在形状上有个显著的特征,即被一个黑色矩形框所包围。根据信号灯设计规范,该矩形框有固定长宽比。可利用该特征,将交通灯范围提取出来。如下图所示。

图像识别技术在交通中的应用展望

火灾图像识别 篇4

火灾探测器的主要功能是通过对温度、火焰和燃烧气体等参量及时做出有效反应, 然后再通过一些敏感软件, 把这些表征火灾参量的物理量变化为电信号, 最后传送到火灾报警器。因此我们可以根据不同的火灾参量以及不用的响应方式, 创制各种各样的火灾探测器。其中较典型的有:感温、感烟、火焰、气体、图像和复合式等。

火灾过程通常都伴随着大量烟、气、温、光等各类信号的出现, 处于不同的环境以及不一样的燃烧成分, 都会对烟雾颗粒的组成、色彩、温场分布以及光谱造成不同。因此, 火灾发生过程中会涉及到许多物理与化学参数, 而且其表现出的特征又比较突出, 那么针对火灾发生时不同生成物的特性而起作用的是不同类型的火灾探测器。分别作用于不同的场合, 自然也有各自的局限性。

1 早期火灾探测技术的发展

自19世纪40年代至20世纪40年代, 感温探测器一直都是占据主导地位, 但是这类探测器有一个明显的不足就是对火灾探测的反应不是很灵敏。但是当时随着感温火灾探测器大量的不断被用于军事上, 这在一定程度上促进了火灾探测技术的迅猛发展。

到了20世纪50年代, 瑞士物理学家Emst Meili研制出了现代离子感烟探测器的雏形, 1970年时, 欧洲已经安装了近百万只离子感烟探测器, 到目前仍占已经安装火灾探测器的90%。在离子感烟探测器统治的30年之中, 人们也逐步开始研究光电感烟技术, 但却苦于相关工艺技术原因没有得到实际应用。

20世纪70年代末, 由于突破了高寿命的光电元件技术, 光电感烟探测器应运而生, 并取得长足进步。国外在大幅度减少离子感烟探测器, 光电感烟探测器的销售量己经占到90%, 我国也逐步呈现这种趋势。

2 大空间火灾探测研究概况

根据采集的信号的类型不同火灾探测器可分为感温、感烟、感光、气体火灾探测器以及复合型探测器等几类。但由于受到各种因素 (粉尘、温度、湿度、空间高度、空气流速等) 的影响, 或者被保护场所的特殊要求, 因而在相对较大的场所, 或需要早期以及更早期发现火险的重要场所失去了效用。所以大空间内早期火灾的探测报警成为热安全工程技术领域的一项难点, 主要原因有以下几点:

(1) 由于空间高度增大和空气流动等原因致使烟气和温度无法到达顶棚, 即使到达顶棚却出现了烟气浓度和温度下降, 这就使感烟和感温探测器产生误报警或不报警。当粉尘浓度过大也会使离子型感烟探测器失去相应效用。

(2) 根据探测火焰发出的红外或紫外光感光火灾探测器发出报警信号。但由于判据单一, 极易对高功率热源或强光产生误报警。

(3) 复合型防火探测器仅仅增加了判据的数目, 并没有完全消除以上缺点, 仅仅使探头的整体性能稍有改善。

近年来火灾科学界正逐步把注意力转移到火灾现象本身和深层次的机理研究方面, 并取得了一定的成果。相关的技术方法都把火灾过程中的某个特征物理量作为监测对象。比如图像型火灾探测器技术和产品的研究和开发。

3 火灾图像监测技术的提出

通过不断的研究我们意识到当可燃物质处于燃烧的过程中时, 会释放出从紫外到红外频率范围的光波, 对于可见光波段, 因为其都有独特的色谱以及纹理等特点, 会出现火焰的图像与背景有明显的区分。燃烧学的各种原理证明, 当火焰燃烧过程中有高达95%的能量是集中到红外波段进行释放的。所以这就提示我们在对图像进行处理的过程中, 对于红外波段的图像识别完全可以通过红外成像的原理来获的可燃物燃烧所释放出的红外图像进行图像处理, 以达到实时监控的目的。图像信息的丰富化和直观性是其他任何火灾探测器所不能提供的。

我们通过对图像的处理, 可以及时的观察到火灾的发生。而图像监测快速性的基础是视觉所接受以光为传播媒介的信息;因此可以判定图像信息是否丰富和直观往往是我们对火灾发生时辨别及判定, 奠定了坚实的基础, 这是其他火灾探测技术都无法实现的。通过图像来监控火灾的发生, 其中涉及到一个非常关键的部件, 那就是光学镜头。它是图像检测过程中与外界发生间接接触的纽带, 通过这种监控结构, 即使是在十分恶劣的室内环境中也可以保证图像监测技术的正常使用, 同时也可以在室外环境中使用。

远程视频监控系统通过采用非接触式的探测技术, 使其防腐蚀性能和密封性能良好, 抗干扰能力强, 利用结合数字通信和数字图像处理技术, 分析火灾火焰的图像特征, 使大空间恶劣环境下的火灾探测问题得到了更好的解决。

4 火灾图像监测技术的研究现状

火灾图像探测系统, 是一种以计算机为核心, 结合光电技术和计算机图像处理技术研制而成的火灾自动监测报警系统, 同时具有观测普通影像和红外监测实现火灾自动报警的双重功能。基于数字图像处理和分析的新型火灾探测, 火灾图像探测利用摄像头对现场进行监视, 对获得的图像进行图像处理和分析, 这样就可以通过早期火灾火焰的形体变化特征来探测火灾的发生。

利用图像进行火灾探测有自己独特的优势, 因为图像是包含了强度、形体、位置等信息的信号。目前国内外对这种新的火灾探测技术开展了深入研究。比如“视频火灾探测”方法;通过提取电站锅炉燃烧火焰的图像特征, 再用人工神经网络的方法对火焰形态作研究, 这样在区分燃烧情况方面就得到了更好的结果;通过阐述火灾图像探测的基本原理, 提出了提取早期火灾火焰辐射持性、形体变化特性的几种新方法等。

目前为止, 综合国内外的火灾图像识别研究, 可以看出大都是在灰度图的基础上进行处理, 采用的大都是比较单一的判据, 导致了漏报, 误报率比较高, 所以系统的鲁棒性、适应性比较差, 这些都成为了困扰火灾图像识别研究人员的世界性难题。

参考文献

[1]程晓舫, 王瑞芳, 张维农.火灾探测的原理与方法 (上) [J].中国安全科学学报, 1999, 9 (1) :24-29.

[2]陈涛, 袁宏永, 范维澄.火灾探测技术研究的展望[J].火灾科学, 2001, 4:108-112.

[3]Meili E.The Ionization Chamber Smoker Detector[J].Swiss Electro technical Association, Bulletin No.23, 1952.

[4]孙宇, 王健, 于洋.浅谈图像型早期火灾监测与数控固定消防水炮扑救技术[J].消防科学与技术, 2003, 22 (3) :223-225.

火灾现场金属变色痕迹识别智能方法 篇5

1 问题描述及整体框架

针对火灾中建筑金属构件 (钢制品) 变色痕迹特征与燃烧 (热辐射) 参数之间的关系开展相关的研究工作。利用测试图像样本构建和训练模型。在测试阶段, 利用模型对未知的金属构件进行自动的识别分类。

如图1所示, 系统分为两个主要部分, 图像样本库的构建以及分类模型的构建。图像样本库包括了条件分析、步骤设定、加热装置选择、材料选择、温度采集设备、图像采集设备等内容。分类模型包括了图像预处理、特征提取与表达、参数配置和分类模型训练等内容。给定金属构件的测试图像, 通过预处理、特征提取等步骤, 用训练好的模型就可以对其进行分类识别。

2 样本库构建

选用常见的镀锌钢板和冷轧钢板作为金属构件实验材料, 将其均切割成1cm×1cm、厚度均为1.0mm的正方形小块, 控制金属受热面积大小相同以保证实验条件的一致性。分别选用真空加热炉、马弗炉、汽油喷灯火焰直接作用3种方式加热, 将在不同温度下加热后的样品贴好标签, 放置在恒温恒湿箱中, 以调节不同的湿度获取多种条件下的金属变色痕迹。

具体试验步骤如下:

(1) 将钢板分别放置在3种试验箱中进行加热, 调节温度分别为400、600、800、1 000℃;

(2) 在完成设定的试验温度后将钢板取出, 进行不同方式的冷却;

(3) 将所有试验钢板贴好标签, 见表1;

(4) 将贴好标签的钢板置于恒温恒湿箱中, 在相对湿度85%, 室温25℃下分别静置24、36、48h;试验结束后将钢板取出, 将相对湿度调为65%进行一次相同试验;

(5) 使用HIROX型显微镜图像采集设备在特定光源条件下对取出后的钢板变色痕迹进行图像采集;

(6) 对图像进行分析整理, 观察痕迹得出结论;

(7) 利用图像处理技术设计智能模式识别算法;

(8) 试验完毕, 整理试验设备和数据。

3 金属变色痕迹图像识别分类方法

3.1 样本图像库宏观分析

分别使用马弗炉、真空加热炉、汽油喷灯火焰对镀锌钢板和冷轧钢板进行样品制备, 针对影响金属表面变色痕迹的6个主要因素, 即材料类型、加热方式、加热温度、冷却方式、静置时间和相对湿度等进行了研究。通过观察试验图像样本库 (见图2) , 得到如下比对结果。

(1) 材料类型的影响。常温条件下, 镀锌钢板由于保护层的作用, 不易生锈;而在高温条件下, 由于表面的镀锌层脱落失去对钢板的保护作用, 从而加快了钢板表面的氧化变色反应, 因而镀锌钢板表面的锈蚀程度重于冷轧钢板。

(2) 加热方式的影响。分析比较所有的金属变色痕迹图片发现, 金属在汽油喷灯火焰直接作用下表面的锈蚀程度比在其他加热源的作用下更明显, 情况也比其他的锈蚀情况严重, 究其原因是温度骤降破坏钢材表面保护层, 减弱保护层的保护作用, 从而使锈蚀加剧。

(3) 加热温度的影响。随着加热温度的逐级上升, 钢板表面的颜色依次呈现蓝色、橙色、浅黄色等趋势, 可依据钢板的颜色变化情况分析比对所经受加热温度的大小, 进而确定火势蔓延方向。另外, 无论是镀锌钢板还是冷轧钢板, 随着实验加热温度的升高, 钢板表面生锈变色更为明显, 金属锈蚀变色痕迹面积增大, 颜色变深, 钢材表面锈蚀点数量与加热温度呈一定的比例关系。

(4) 冷却方式的影响。对金属钢板进行淬水冷却时, 无论是镀锌钢板还是冷轧钢板, 其表面的锈蚀情况都较严重, 当钢板表面自身颜色较浅时, 淬水冷却后表面会出现大量的黑色锈蚀点, 锈蚀面积逐渐长大, 具有均匀的破坏性。

(5) 静置时间的影响。静置时间越长, 金属表面锈蚀程度越严重。

(6) 相对湿度的影响。在临界相对湿度以上时, 钢板锈蚀严重程度远远大于临界相对湿度以下。

3.2 金属变色痕迹图像特征提取与分类识别方法

3.2.1 特征提取方法

用颜色特征和梯度特征对金属变色痕迹图像进行特征提取和表达。

颜色特征:在国际标准MPEG-7中有一项颜色表示方法标准被称为描述符颜色布局, 这项标准是用来表达样本图像中的各个颜色分量的分布情况。描述符颜色布局是将选取的图像分成几等份, 然后对每一份图片进行处理获得颜色的均值, 这些均值整合起来组成了图像颜色分量均值矩阵, 对颜色分量矩阵进行DCT处理从而得到每张图像的颜色特征, 这个颜色特征就是能够代表每张钢板变色痕迹图片特征的特征值。由于研究中涉及的金属变色痕迹图片均为jpg格式, 为使测试程序简便高效, 设计如下的颜色分量提取方法。

(1) 将每张金属钢板变色痕迹图像分割成4×4份, 然后将每一份图像的R、G、B颜色的平均值计算, 这3种颜色的均值代表每一份图像的主要颜色;

(2) 对每一份图像的R、G、B这三种颜色的颜色分量值进行离散的线性代数DCT处理, 得到每张图像的颜色特征矩阵, 将线性可分的低频颜色分量作为特征值提取出来, 计算出所选矩阵的特征向量对金属变色痕迹图像信息进行详细描述。

(3) 对提取的DCT颜色特征矩阵进行矩阵运算处理, 然后计算DCT系数。

(4) 在计算出的系数中挑选出能对变色痕迹图像进行分类的4个低频颜色分量, R、G、B这三种颜色中每个颜色都提取4个分量, 也就是每张金属变色痕迹图像都有12个特征参数代表其颜色特征值, 从而对金属变色痕迹图像进行全面的信息表达。

图3给出了金属变色痕迹图像不同颜色通道的直方图。观察图像R、G、B颜色分量的指定直方图走势形状和峰值就可以得到代表图像的全面而特有的信息特征。

梯度特征:方向梯度直方图 (HOG) 特征是一种在计算机图像处理技术中用于对图片信息进行全面描述的一个特征算法, HOG可以对图片中选取位置的梯度进行全面统计。

图4给出了金属变色痕迹图像的梯度特征图。其具体操作方法是将选取的金属变色痕迹样本图像分成若干个小单元格, 每个单元格为6×6个像素, 程序测试中选择含有9个通道的HOG代表每个小单元格的梯度特征信息, 以统计小单元格中6×6个像素的梯度特征信息, 即将每个小单元格的梯度方向共360°分成9个方向块, 将每个小单元格内各个像素投影到其应有的角度位置范围内, 采用梯度方向在HOG中进行加权投影处理, 得到各个小单元格自身代表的HOG特征, 就是这个小单元格对应的9维特征向量。

3.2.2 基于支持向量机的金属变色痕迹图像分类识别

支持向量机 (SVM) 是Vapnik等人在对小样本问题进行长时间研究基础上发现的另一种对信息进行分类处理效果较好的线性分类器, 涉及到线性可分函数、线性不可分函数和非线性函数等领域, 具有较深的理论背景。

SVM的主要思想有以下两点:一是SVM不仅可以分析线性可分问题, 对其进行数据模式识别分类, 同时也可以对线性不可分问题进行分析, 主要解决思路是将数据从低维空间转换到高维空间, 高维空间中的样本数据可以采用线性的分类方法进行线性处理;二是SVM能够在风险最小的情况下求得样本数据空间的最优分类方法, 达到模式识别分类的最好效果, 使样本数据空间的风险减小到最低值。

经过上述环节的特征提取, 可将一张金属变色痕迹图像表示为包含颜色和梯度特征的高维向量, 进而使用SVM进行模型的学习训练。

4 方法测试

算法使用VC++、OpenCV作为编程语言和开发库, 利用特征提取和分类构建的方法对金属图像的多种属性值进行建模分析及预测。针对以下6种不同的变量属性, 分别构建分类器, 共取得实验数据192组。

表2给出了金属变色痕迹针对不同属性的识别训练测试结果。从结果中可以看出, 针对不同属性变量, 在不同训练时间、不同识别时间情况下, 对钢板不同属性的识别准确率各不相同, 其中对钢板相对湿度属性的识别准确率最高, 能够达到90%。

5 结论

针对影响金属变色痕迹的变量依次进行模拟实验并获取了大量的钢板变色痕迹, 通过对痕迹图像进行预处理后提取的颜色分量特征和HOG特征, 在实验训练和测试过程中编写能够准确进行识别分类的智能识别算法, 分别对不同的属性进行模式识别。研究发现, 支持向量机对于金属变色痕迹图像的材料类型、加热方式、加热温度、冷却方式、静置时间、相对湿度的识别准确率分别为60%、70%、50%、80%、70%和90%, 其中相对湿度的识别准确率最高, 达到了90%。实验结果表明, 该模式识别算法能够对金属变色痕迹特征进行快速有效识别, 操作简便, 能够帮助基层火灾调查人员根据金属变色痕迹准确识别火害程度, 具有实际的应用价值。

参考文献

[1]张小宏, 王伟轩.论火灾调查工作现状及改进措施[J].武警学院学报, 2007, 23 (8) :56-58.

[2]金河龙, 王书文.浅谈根据非金属不燃物体被烧痕迹判定起火部位[J].消防科学与技术, 2001, 20 (2) :55.

[3]李一涵, 邱榕, 蒋勇.数值模拟方法在壁面烧损痕迹的应用[J].火灾科学, 2006, 15 (2) :102-110.

[4]韩小坤, 张清, 杨兴伟, 等.真空相变加热炉应用优势及故障排除[J].中国化工贸易, 2014, (14) :107.

[5]RAFAEL C G, RICHARD E.Woods.Digital Image Processing, Third Edition[M].Pearson Education Inc., 2010.

[6]王培培.基于视频的人体动作识别研究[D].南京:南京邮电大学, 2013.

[7]倪恺.基于梯度方向直方图的行人检测方法研究[D].天津:天津工业大学, 2011.

[8]GUPTA A, JAIN R.Visual Information Retrieval[J].Communication of the ACM, 2012, 40 (5) :71-79.

火灾浓雾中的人体目标识别探测 篇6

1 人体目标识别探测系统

1.1 数据采集和灰度化处理

从人员密集场所火灾现场的视频图像数据中采集出人体目标信息,是人体特征识别系统设计的首要环节,救援现场视频数据提取的质量,直接决定着人体目标图像的识别效果,在火灾运动中人体目标图像的提取是整个识别系统中的关键步骤。由于人员密集场所的火情环境要比普通静态环境复杂,会受到不可预知的因素影响,救援现场图像质量不稳定,需要对人员密集场所火灾浓雾视频图像进行预处理,以提高数据质量,减少人体特征信息提取的运算量,缩短时间。

在人员密集场所火情现场及时回传视频图像数据,就是为了保证有较大的探测区域,现场前端设备焦距设置较大,场所内火情初期范围较小,浓雾环境下的人体特征识别影响不明显,为防止图像边缘进一步模糊,需要对原始数据信息进行保护。通过灰度值公式,实现火灾场所的视频图像信息数据的反差系数计算,利于救援现场的火情特征表达,便于人体特征识别系统的计算,提升探测速度。

视频图像的灰度化处理,是通过RGB三维坐标进行加权计算实现的。计算RGB平均值作为加权平均,得到场所救援现场视频图像的灰度值公式,如式(1)所示。

式中:Gray(i,j)为火灾救援现场图像数据中坐标为(i,j)的点的灰度值;R(i,j)为图像红色数据加权值;G(i,j)为图像绿色数据加权值;B(i,j)为图像蓝色数据加权值。

1.2 人体运动目标检测的背景估计算法

人员密集场所火情环境要比普通静态环境复杂,受各种不可预知因素影响较大,常规的干扰包括火灾中各种机械运动、光照变化、温度变化等。针对这种情况,可以采用人员密集场所火灾中运动目标检测的背景估计算法。

背景估计算法是通过现场视频图像中数据的回传,在视频图像变化较小的视频中对运动目标进行检测的一种方法。火灾浓雾中运动目标检测的背景估计算法的流程,如图1所示。

图1 背景估计算法流程图

根据背景估计算法的流程图,对人员密集场所火情视频图像进行更新,现场图像传输是背景图像估计算法的核心,结合现场视频图像数据收集过程,即为本帧图像由上一帧图像和下一帧的视频图像数据合成获得,背景视频图像数据更新计算公式,见式(2)所示。

式中:Bn+1(x+y)为第n+1帧火情现场视频图像中坐标(x,y)点的灰度值;In+1(x,y)为从人员密集场所火情现场视频图像中截取的第n+1帧坐标为(x,y)点的灰度值;α为权值系数,决定背景图像上下帧差别大小。

(x,y)的静止和运动灰度值若无差别为静止,有差别则为运动。α权值大小能够决定图像中较小扰动是否会被分离出来,权值越小越倾向于将小扰动从整个监控图像中分离出来,权值越大对监控图像变换越不敏感。

背景更新方法的原理主要是在人员密集场所中,利用火情烟雾的扩散性和其他运动物体的扰动方式不同的特性,获取现场视频图像数据,然后通过设定时间范围,随着时间间隔逐渐增大,对视频图像数据进行背景比较,使人员密集场所火灾中扩散速度较慢的火情烟雾不会被检测为移动的人员。由式(2)得出火情烟雾的预判能力,如式(3)所示。

式中:Bt(x,y)为人员密集场所中火情现场视频初始帧在背景中坐标为(x,y)点的灰度值,保证了算法对火情烟雾的预判能力;a、b分别为火情现场视频数据的权重系数,a+b<1。

在人员密集场所人体目标特征检测中,加入背景估计算法和火情烟雾的预判,能去除物体移动、机械运动、温度变化等干扰,提高了人体特征的捕获能力。

2 基于PCNN图像特征改进的模型识别系统

2.1 PCNN模型的图像样本

火情浓雾视频图像目标检测得到的图像数据,即PCNN模型的图像样本,由于火灾现场浓雾影响运动目标检测,获得的视频图像的像素不高,要针对性地对浓雾图像数据样本进行灰度化和灰度级处理。灰度化处理主要是针对火灾现场浓雾视频数据进行RGB加权,根据火灾现场获取到的不同视频图像数据按级别进行灰度处理,以两极值为参照,对RGB三个分量进行计算,取平均值为加权灰度值。结合式(1)得到加权灰度值公式,如式(4)所示。

灰度级处理改变人员密集场所火情浓雾图像灰度值,利用式(4)计算加大视频图像数据的反差,将火灾浓雾视频数据中灰度点夸张放大,完善现场图像数据质量,利于火情现场浓雾中人体目标的识别。

在火灾现场视频数据中分离出来的烟雾特征不明显,会增加后期人体目标特征识别难度。灰度级的处理能够通过改善局部现场视频数据对比度解决这一问题。根据加权灰度值公式(4),得到灰度级处理公式,如式(5)所示。

式中:f(x,y)为现场视频数据坐标(x,y)的灰度值;g(x,y)为一定时间范围后视频数据获取数据像素坐标(x,y)的灰度值;z1和z2分别为火情浓雾灰度取值范围,由火场不同环境光线条件设定。

由PCNN图像特征得到的加权灰度值公式和灰度级处理公式为构建PCNN图像模型奠定了基础。

2.2 PCNN图像模型构建与熵值运算

人员密集场所现场火情视频图像数据采集过程中,根据式(4)、式(5)得出PCNN模型,如式(6)所示。

式中:β通常取值范围为0~1;Fij(n)是连接系数PCNN的迭代次数;n为人体目标检测强制停止的条件,通常情况下最优迭代次数为20。

根据PCNN算法模型,图2(a)为火灾浓雾现场采集的原始图像,图2(b)~图2(f)依次是经过PCNN处理后的输出图像,即不同迭代次数下的视频数据信息。可以发现,当n=4时,输出的现场火情浓雾边缘信息非常明显,当n=6时,背景图像从原始图像中分离出来,当n=7时,现场图像数据浓雾被获取。

图2 不同数值下PCNN输出图像比较

PCNN模型在输出火情现场的视频图像数据信息中,视频数据统计特征用熵值来表示,熵值就是火情浓雾视频数据中局部图像中所含的信息量程度。在火情浓雾图像数据PCNN迭代过程中,每次迭代产生的数据信息差异性会导致得到的熵值不同,且有一定的序列性,并在一定范围内缩放与平移。

考虑到在火情浓雾状态下,主要是对人体目标特征进行检测,改进算法中的熵值,将统计迭代生成的图像中为0和1的全部替代,熵值运算如式(7)所示。

式中:Entropy(P)为火灾浓雾信息的熵运算;p1为现场视频火灾浓雾检测P中1出现的次数即人体目标特征;p0为火情检测过程P中所有物品像素总和。

3 仿真实验与结果

为了验证改进算法的效果,对火灾浓雾中不同场合的视频图像进行实验。实验选取Intel CeleronM 2.8GHz,2G内存,计算机采用Windows 7操作系统。

先对成像速度进行测试,目的在于测试该成像方法是否会对人员密集场所火灾浓雾人体成像造成延迟,结果表明,改进后的算法成像速度明显高于传统算法,且随着时间推移呈几何倍数地高于传统算法。

进行两种算法的人体目标识别比较,其目的在于比较两种成像方式识别火灾浓雾图像人体所需要的时间,共设置100 MB数据,结果如图4所示。

图3 两种算法图像识别速度比较图

实验发现,35s后该方法有37个人体目标被识别,而用传统方法进行识别,被识别的目标只有1个。

4 结论

(1)火灾浓雾条件下视频数据信息运动目标检测是实现人体目标特征检测的重要前提,通过对视频数据预处理,将现场视频数据信息进行加权计算,提升人体目标检测速度。通过火灾浓雾视频运动目标检测的背景估计算法排除物品及机械运动等错误检测结果。

(2)基于PCNN的火情浓雾人体目标特征提取法,通过现场视频数据灰度化和灰度级的处理,对获取的视频数据样本进行处理,优化PCNN设定参数,确定系统迭代次数,减少检测计算时间。

参考文献

[1]何立,黄永履,王君华,等.卫星遥感图像的增强处理[J].计算机应用,2006,27(3):6l-65.

[2]陈兴杰,柴晓冬.一种基于简化PCNN的红外图像分割方法[J].安徽大学学报(自然科学版),2010,34(1):76-77.

[3]陈坤,许红.林火识别报警和自动定位系统在森林防火监控系统中的应用[J].计算机科学,2006,7(5):122-125.

[4]常威威,郭雷,付朝阳,等.利用脉冲祸合神经网络的高光谱多波段图像融合方法[J].红外与毫米波学报,2010,29(3):205-207.

[5]付雪靖,王阿川.基于彩色图像的林火图像火焰分割研究[J].林业劳动安全,2009,22(2):17-21.

[6]关宇东,韩提,王宏,等.基于图像识别算法的森林防火系统设计[J].科技导报,2008,26(5):77-80.

[7]黄振华,李正明,潘天红,等.基于图像型森林火灾无线远程监控系统[J].传感器与微系统,2009,28(3):86-88.

[8]贾志成,胡天翔,刘春景.基于机器视觉的森林防火监测技术初步研究[J].2008,36(10):21-23.

[9]胡君健,谢启源,袁宏永.复合与智能火灾探测技术展型[J].消防科学与技术,2005,24(2):199-201.

[10]王浩波,霍然,胡隆华.关于性能化防火分析与设计规程的讨论[J].消防科学与技术,2003,22(4):

人脸图像识别方法的研究 篇7

关键词:人脸识别,图像识别,识别技术,研究

0 引言

人脸图像识别,主要是利用人脸的分析以及比较,针对其中的相关视觉特征以及相应的信息,进行身份的鉴别,总的来说,人脸图像识别技术和声音识别、指纹识别以及虹膜识别等,都是属于生物特征识别技术的范畴之内。但是,人脸图像识别技术又和其他的生物识别技术有着一定的不同,也有其他的技术所无法比拟的优势,例如,在人脸识别技术当中,不需要干扰人们的正常行为,就可以达到极佳的识别效果,因为人们只需要在摄像机之前以自然的状态停留一段时间,计算机就可以进行快速的身份鉴别,并且准确度较高,这一点优势是其他的生物识别技术所无法比拟的。正因为如此,现今人脸识别技术得到了非常快速的发展,在多个领域当中,都有着广泛的运用,包括安全防护、企业的防护等,下文将针对其中的主要技术,进行深入细致的探究和分析。

1 人脸识别的主要方法

人脸识别的技术方法,有许多种,包括基于几何特征的识别技术、基于神经网络的识别方法、基于匹配的人脸识别技术等,下文将进行着重的阐述,力求帮助相关技术手段在实践操作当中得到更加广泛的运用。

1.1 基于几何特征的人脸识别技术

此种类型的人脸识别技术,其起源于上个世纪九十年代。基于几何特征的人脸识别技术,主要是针对人们的眉毛、眼睛、鼻子、脸以及嘴巴等,分析其形状以及它们之间存在的相应的几何关系,同时将其很好的存储为一个具有特征的图形矢量图,所以,总的来讲,基于几何特征的人脸识别技术,可以归纳为矢量图之间的距离。同时,在相关的识别当中,为了有效的提升识别的效率和质量,运用此种方式针对照片进行相应的预处理,其中的项目包括有二值化、图像的灰度变换、图像的归一等。基于几何特征的人脸识别技术,主要的优势是识别的速度较快并且对于内存的要求比较小,但是,其没有有效的形成一套统一式的特征提取标准。

1.2 基于相关匹配的人脸识别技术

基于相关匹配的人脸识别技术,其主要的识别技术方法包含有等强度的识别线法、各种模板的匹配法等等。在模板的匹配法当中,由于其是一种经典的模式识别就似乎方法,所以,主要是采用归一化互相关的技术,直接的对两个图像之间的匹配程度进行计算,而模板的匹配法当,还需要两个图像之间的相关目标,有着同样的尺度、光照以及取向等,所以需要进行相应的预处理。此种识别技术方法,受到图像的质量以及人脸的遮挡等等相关因素的影响比较小。而等强度线,则主要是利用灰度的图像,进行多级灰度值的相关匹配识别,此种技术,需要在背景以及头发均为黑色的前提之下运用,并且,对于表面的光照等,要求也较高,总的来讲,其限制的因素较多,所以应用的范围也比较小。

1.3 特征脸的识别技术

特征脸的识别技术方法,起源于上个世纪九十年代末人们提出的人脸识别技术理论,其基本的思想,是将相关图像之中的人脸区域,看成是一种随机的向量,同时,根据相关的操作,将图像的统计特征,进行相应的正变交换,即K-L变换,进而获得相关的正交K-L基底,利用此写基底,针对其中的线性组合,可以对人脸的图像进行表达,对人脸进行描述,进而可以进行人脸的识别,同时准确度也较高,此种方式,由于利用到了相关的技术,所以也可以称为基于K-L的变换识别技术方法。针对此种方法,在进行相关的变换之后,其低维的空间之内有较好的人脸表达能力。但是,特征脸的识别技术方法劣势在于对于外部的因素带来的图像影响,无法进行有效的区分,同时,没有很好的考虑到人脸的信息类别,姿势、光照等因素,都会对其识别的准确度造成一定影响,所以,其技术理论在应用当中还存有缺陷。

1.4 基于神经网络的人脸识别技术

基于神经网络的识别技术方法,主要是利用神经网络当中较大量的简单的处理单元,即神经元,来构成相应的复杂系统,将其很好的互联起来,进而解决相应的识别问题。常见的神经网络模型,主要有多层的映射网络、感知器以及RBF网络等等,它们都是从不同的角度针对生物的神经吸引当中不同层次进行相关的模拟以及描述,此种技术方法的识别效率较高,准确度也较强。在早期的人脸识别技术当中,神经网络主要是;来自联想的映射网络,使用来进行人脸的回忆功能。在后期的研究当中,发现其可以等价于输入的矢量交叉矩阵,同时,利用此种技术方法,可以对一组人脸进行分量的分析识别,在相关的操作过程当中,不需要进行较为复杂的信息提取工作,同时,也不需要一套由工作人员来确定的规则,可以根据具有代表性的图像样本,进行自我的学习以及信息量的扩充,具有较强的自适应性,同时,其缺点也同样明显,运算的量较大、训练的时间也较长。

2 基于特征的人脸识别技术

根据上文的详细阐述和分析,可以对现今主要的人脸识别技术方法有着一个详细的了解和掌握,接下来,将针对基于特征的人脸识别技术方法,进行全面的分析和探讨,力求更好的推动此项技术的进步和发展。

2.1 图像的预处理

基于特征的人脸识别技术方法,主要是通过对人脸之上的个正特征信息进行提取,其实现较为简单。首先是图像的预处理。为了更好的提升图像的识别效率,就需要对图像进行相应的处理,处理主要包括有灰度的变换以及二值化。灰度变换主要是为了将图像的灰度从一个比较窄的区域当中,有效的扩展到0~255的整个的灰度定义域之中,其变换的公式如下所示:

运用此公式,针对图像进行二值的转化,同时,采用二次边缘的提取方法,来进行下一步的计算。其实现的方法,G1至G9为3*3的区域,同时,计算得出G5周围的几个点的灰度值之和,并且,按照上述的公式,计算得出结果值,而当G5的中心点灰度值小过于阈值之时,则该中心点是黑点,反之则是白点。具体的图像如下图所示:

同时,在进行人脸图像的预处理当中,还需要注意人脸图像姿态的归一化,以减少任务姿态存有的一定程度的深度偏转现象。一般的,将图片调整至正面视图,并且在图像的旋转当中,还需要注意两眼间的角度,将其作为图片旋转的基准,两眼之间的中点以及鼻尖的角度,则为计算的基准。两眼的中点和鼻尖以及鼻子保持在同一条垂直的直线之上,此图像则为正面视图,如果不再一条垂直线之上,则图像是姿态偏转类型的视图。针对双眼和鼻尖等点,来求出两幅图像之间的仿射变化关系,同时再进行图像的校准,进而补偿由于姿态的深度存有偏转带来的影响。

2.2 图像的特征定位以及特征的提取

针对相关图像进行相应的预处理之后,即可对眉毛、眼睛、嘴以及鼻子等特征的部位进行定位,并且对其图像的信息进行提取。通过对灰度图像进行相关的水平灰度投影以及垂直的投影,可以初步的对人脸进行定位,然后,运用一个和瞳孔的大小相类似的方框,针对整张脸进行搜索,对其中的信息进行提取和分析,而当落在此个方框之内的黑色素达到最大的个数之时,此位置即为眼睛的位置。同时,在准确的对眼睛位置进行定位之后,就可以有效的搜索边缘点,得出眼睛的实际大小情况等。眉毛的位置搜索,也是通过灰度的垂直方位图来进行匹配操作。从人脸的顶点开始,逐渐的向下移动,在每一次的移动当中,在该点的部位放置一条水平的缝条,进而将其相关的垂直灰度,和投影图进行分析和比较,如果两者的比较结果保持一致,并且其位置是处于眼睛的上方,那么就可以判定出此位置即为眉毛的位置。

嘴巴以及鼻子,定位的方法比较类似,当定位鼻子之时,需要从眼睛的垂直位置进行相关的搜索,而当水平方向之上得出的灰度图像素数达到某一最大值之时,则可以确定该位置为鼻子的Y坐标位置,根据计算,即可以得出其X坐标的具体位置。

2.3 识别效果分析

根据上述的分析,可以对特征识别的主要技术方法和操作的流程等,有着明晰的了解和掌握。针对目标进行人脸的识别,并且针对特征的定位以及相关特征信息的提取,还需要从照片当中将得出的信息查找出来。经过多次的实验和应用,使用该种技术方法得出的人脸识别准确率可以达到90%以上,准确度较好。

3 结束语

综上所述,根据对人脸识别技术方法进行详细的分析和阐述,并且着重的对其中主要的技术理论、应用的流程以及根据特征的人脸技术方法进行分析和探讨,力求更好的推动此项技术的进步与发展,为相关技术和事业的前进作出积极的贡献,同时,促进其在更多的领域当中得到更加广泛的运用。

参考文献

[1]王磊洪.浅议人脸图像识别技术的主要方法合格技术理论[J].现代科学,2010.9

[2]周晨为.试论一种基于特征的人脸识别技术方法和在实践操作当中的应用[M].现代计算

[3]机科学技术,2009.3

[4]张振东.浅议人脸识别技术方法的发展和主要的理论依据[M].图像识别技术资讯,2008.7

无序图像自动匹配与识别 篇8

图像匹配的方法一般分为两种类型, 直接匹配或是基于特征的匹配。直接匹配的方法试图使用图像的像素值通过迭代的方法对图像进行配准[1,2]。基于特征的方法试图从图像中提取出不同类型的特征, 例如线特征或点特征, 并使用该特征的邻域信息来进行特征匹配[3,4]。

在基于特征的方法中, 目前使用较多的是基于不变特征的方法。这类方法根据点特征的邻域信息计算出相应的特征描述符用以完成特征检索和匹配。这方面的工作最早是由Schmid和Mohr提出的[5], 他们的方法通过对Harris角点进行高斯求导, 形成旋转不变描述符。Lowe对这种方法进行了扩展, 增加了特征的尺度不变性[6]。其他一些研究人员还设计出对于仿射变换不变的特征描述符[7,8]。常用的特征点检测算子包括Harris角点检测算子、DOG检测算子、最大稳定区域的方法[9]。并且在特征点的可重复性和描述符匹配性能评价方面也取得了不错的进展[10,11]。

基于不变特征的方法已经成功地应用到很多领域中, 包括物体识别[6], 从运动获取结构[12]以及全景图像拼接[13]。虽然对图像匹配的研究已经取得了很多进展, 仍然有值得研究的空间, 特别是在现有的文献中缺乏对以下问题的详细讨论:如何对输入的多幅无序图像进行自动匹配与识别, 并将属于同一个场景的不同图像进行分类并合成相应的全景图像。

基于此, 本文设计并实现了一个全景图像自动识别和拼接的系统, 能够对输入的多幅无序图像进行自动分类识别与拼接。整个系统分为特征检测、特征匹配、多图像匹配和多图像识别四个部分。系统首先对输入图像进行MOPS特征检测, 然后使用k-d树对特征点进行快速匹配, 根据最近邻特征点距离与次近邻特征点距离之比得到初始匹配点对。根据图像特征点之间的对应关系使用RANSAC算法建立任意两幅图像之间的匹配模型, 并用概率统计策略对其进行鲁棒校验。本文的主要贡献在于将多图像匹配问题建模为在不同图像节点之间建立无向连通图的问题, 而多图像识别的问题可以归结为对建立好的一个或多个无向连通图进行深度优先遍历。整个系统的流程如图1所示。

1 MOPS特征检测

为了判别输入图像之间是否具有重叠区域以及图像之间的运动模型, 首先对图像进行MOPS特征检测。MOPS算法[14]是Matthew Brown针对图像拼接中尺度变化相对较小提出的一种特征检测算法, 与SIFT[6]相比具有检测速度更快的优势。MOPS算法对Harris算法进行了扩展, 为原本不具备旋转不变和尺度不变的Harris算法增加了一定的旋转不变性和尺度不变性。

对于每一幅输入图像I (x, y) , 首先和SIFT算法类似, 在构造图像金字塔的时候使用子采样率参数s=2, 金字塔平滑尺度参数σp=1.0构造高斯图像金字塔。然后在金字塔的每一层提取Harris特征点。在金字塔第PL (x, y) 层图像处的Harris矩阵计算公式为:

其中表示梯度算子, 积分参数σd=1.0, gσi表示二维高斯卷积函数, 其σi=1.5。为了在金字塔图像中的每一层检测特征点, 首先需要计算Harris角点响应函数fHM:

其中det (HL) 代表矩阵HL的行列式, tr (HL) 代表矩阵HL的迹矩阵, λ1和λ2分别为矩阵HL的特征值。如果金字塔图像PL (x, y) 在 (x, y) 处的角点响应函数值在其3×3的邻域中为最大值, 并且大于阈值t, 则将其作为候选特征点, 在实验中取参数t=10.0。

为了使Harris特征点具备旋转不变性, 需要对每一个候选特征点赋予一个主方向θ。通过对局部梯度进行平滑可以计算得到方向向量uL:

其中积分尺度参数σo=4.5。

一旦确定了特征点在金字塔图像中的位置, 还需要为每一个特征点赋予一个描述符。这个描述符是对特征点所在局部区域的某种描述, 并能够支持不同图像之间可靠的、有效的特征匹配。给定一个特征点fp (x, y, level, θ) , 对以特征点为中心的w×w大小的图像局部块进行采样, 因此特征向量为w×w维。参数w用于控制检测到的特征点数目, w的值越大, 检测到的特征点数目越少。为了使描述符向量对光亮度变化具有不变性, 还需要对描述符向量进行归一化, 使其均值为0, 标准偏差为1。

2 特征匹配

如果拼接的是柱面全景图或球面全景图, 首先需要使用反向映射将每一幅输入图像转换为柱面图像或球面图像, 在转换过程中还需要使用双线性插值避免在图像变换中的走样。然后将每一幅图像中的特征点通过正向映射也转换到相应的柱面坐标系或球面坐标系中, 再进行匹配。在对不同图像之间的特征点进行匹配时, 需要对特征向量进行最近邻搜索。本文采用基于k-d树的最近邻搜索算法, 可以将特征检索的时间复杂度从O (N1N2D) 降低到O (N1log2N2) 。

算法1基于k-d树的快速特征匹配

(1) 为每一幅图像的特征点集构造一颗k-d树;

(2) 依次对每一幅图像的每一个特征点进行遍历。初始时图像索引值i=0, 特征点索引值n=0。对于第i幅图像的第n个特征点, 对所有其他图像的k-d树进行检索, 查找和当前特征点欧氏距离最近的前两个特征点nn1和nn2, 其欧氏距离分别为d1和d2。当d1和d2的比值小于0.6时, 认为是最佳匹配点;

(3) 当所有图像的所有特征点都遍历完成后, 还需要对特征匹配的结果进行校验。假设第i幅图像中第ni个特征点的匹配图像索引值为j, 匹配特征点索引值为nij。需要检查第j幅图像中第nij个特征点对应于图像i的匹配特征点索引值是否为ni, 如果两者不相符就认为该匹配是错误的。

3 多图像匹配

根据图像特征点之间的对应关系就可以建立输入图像集合中任意两幅图像之间的匹配关系。可以用无向图结构来表示这个计算过程, 每一幅输入图像是无向图中的一个节点, 如果两幅图像之间满足给定的匹配关系, 则在这两个节点之间存在一条连接线。多图像匹配问题就是要计算这个无向图结构中所有存在的无向连通图。

算法2基于无向图结构的多图像匹配

(1) 依次对输入的每一幅图像进行遍历, 初始索引值i=0;对除了第i幅图像以外的图像进行遍历, 初始索引值j=0。如果第i幅图像和第j幅图像之间有匹配的特征点对, 就将该特征点对加入到第i幅图像的图像匹配集合中;

(2) 如果第i幅图像和第j幅图像之间匹配的特征点数量大于给定的阈值, 则认为两幅图像之间存在一个可以计算的模型, 并将第j幅图像的索引值加入到第i幅图像的模型集合中;

(3) 用RANSAC算法[15]对第i幅图像和第j幅图像之间的匹配特征点对进行鲁棒校验, 剔除外点, 同时求出两幅图像之间的运动模型参数。

对于每一对潜在的匹配图像之间都存在两组不同类型的匹配特征点对, 一组是符合运动模型几何一致性的特征点对, 即内点;一组是几何不一致性的特征点对, 即外点。本文使用基于统计的策略对图像匹配进行鲁棒校验, 其基本思想是比较这一组内点/外点是由一个正确的图像匹配或者错误的图像匹配产生的概率大小。对于一幅给定的图像, 用nf表示这幅图像在重叠区域中的特征点数目, ni表示这幅图像在重叠区域中的内点数目。可以用服从0-1分布的随机变量m来表示随机事件“这幅图像匹配正确或错误”。假设事件“第i个匹配点对f (i) ∈{0, 1}是内点/外点”是n重伯努利实验, 那么随机变量“内点总的数目”服从二项分布:

其中p1是给定一个正确的图像匹配, 一个特征点是内点的概率;p0是给定一个错误的图像匹配, 一个特征点是内点的概率。因此内点的数目ni=∑nfi=1f (i) 。本文在实验中选择参数p1=0.7, p0=0.01, 与使用RANSAC算法校验后的结果进行对应, 可以通过贝叶斯公式计算一个图像匹配样本是正确的后验概率:

如果p (m=1| f (1:nf) ) >pmin, 则认为该图像匹配是正确的。假设p (m=1) =P (m=0) , 则:

本文在实验中选择参数pmin=0.97, 则当条件ni>5.9+0.22nf成立时, 认为该图像匹配是正确的。

4 多图像识别

一旦建立好图像两两之间的匹配关系, 就可以根据匹配图像的连接集来查找全景图像序列, 还可以对一组输入图像之间存在的一个或多个全景图像进行自动识别, 同时拒绝那些不和其他图像匹配的“噪声”图像。本文把这个问题表示为对多个无向连通图的深度优先遍历。

算法3全景图自动识别算法

(1) 检查图像列表里面是否还有没有拼接过的图像, 如果有, 选择这幅图像记为Ifrom, 作为新的拼接图像Iresult的起始图像, 将其标记为“已经拼接”;如果没有则算法退出;

(2) 假设图像Ifrom的匹配列表中共有N幅图像, 令索引值s=0, 从匹配列表中选取索引值为s的图像Ito, 如果图像Ito还没有被拼接, 则调用算法4对这两幅图像进行拼接;

(3) 令索引值s=s+1, 如果s

算法4全景图自动拼接算法

(1) 根据Ito和Iresult之间的映射关系动态调整包围盒的大小;

(2) 根据包围盒的位置依次调整Iresult中已经拼接过的图像的位置参数, 生成新的结果图像I'result, 将旧的图像Iresult拷贝到I'result中新的位置, 并令Iresult=I'result;

(3) 使用多频带融合算法[16]将Ito与Iresult进行合成, 并记录Ito在Iresult中的位置和索引号, 将其标记为“已经拼接”。依次从Ito的匹配列表中取出每一个元素, 递归调用算法4。

5 实验结果

系统的运行环境为Ubuntu 13.04 64位操作系统, 系统的实现方式为C++语言, Open CV 2.4.5。图2是对两幅具有重叠部分的图像进行MOPS特征检测的结果。图中每一个特征点旁的数字表示两幅图像特征点之间的对应关系, 图中的网格大小为16×16, 表示计算特征点描述符时图像局部块的采样大小, 两幅图像边角处的灰色图像块表示以当前选中特征点为采样中心, 采样大小为16×16的图像局部块中的每一个像素的灰度值。在进行特征匹配时, 如果图像I1和图像I2包含的特征点数目分别为m和n, w为特征向量的维数, 采用直接搜索的算法时间复杂度为O (mnw) , 使用基于k-d树的匹配算法可以将时间复杂度降低到O (mlog2n) 。在参数估计步骤, 假设匹配集U中包含N对元素, 其中内点的数量为I, 计算一次去除外点的操作最少需要m对特征, 则RANSAC算法的时间复杂度与 (N/I) m成正比。在图像融合步骤, 如果两幅图像的重叠区域宽度为w, 高度为h, 频带数为bands, 颜色通道数为c, 则多频带融合算法的时间复杂度为O (bands×c×w×h) 。

图3 (a) 是使用佳能40D相机拍摄的6组共25幅图像, 每一幅图像的分辨率都是1024×683。为了测试系统的正确性和鲁棒性, 在将图像输入系统之前先对这25幅图像进行随机排列。图3 (b) 为这25幅无序图像经过系统处理以后的输出, 共有6幅输出图像。从输出结果可以看到系统能够对输入的多幅无序图像进行正确匹配和识别。另外, 注意到虽然有一幅图像和其他图像有重叠部分, 但是由于这幅图像的拍摄地点和重叠图像的拍摄地点不同, 不满足全景图像合成的要求, 因此作为一幅单独的合成图像输出。

6 结语

本文设计了一种新的无序图像自动匹配和识别系统。这个系统使用MOPS对多幅无序图像进行特征检测, 并使用概率模型对图像匹配进行校验, 在没有任何用户输入的情况下能够对无序图像集中的多个图像序列进行自动匹配与识别, 并将属于同一个场景的多幅图像进行自动拼接。即使图像之间存在由于光照变化带来的亮度差异, 对多频带图像融合方案的采用也能够在图像之间形成平滑过渡, 同时保持高频细节。本文进一步的研究内容包括使用Open CL或CUDA这样的并行计算框架将计算放到GPU中运行, 以及探索其他特征检测、图像匹配和图像融合方法。

摘要:设计一个多幅无序图像的自动匹配和识别系统, 能够根据用户输入的多幅无序图像进行自动匹配和识别, 并对具有重叠的图像进行自动拼接。系统首先对输入的每一幅图像进行MOPS特征检测, 然后通过k-d树的最近邻搜索完成不同图像特征之间的快速匹配。其次基于图像特征之间的对应关系使用RANSAC算法建立任意两幅图像之间的匹配模型, 并用概率算法进行鲁棒校验。通过构建与图像匹配关系对应的无向连通图结构, 实现多幅无序图像的自动识别。最后使用递归算法对无向连通图进行深度优先遍历, 并用多频带融合算法消除拼接痕迹, 合成相应的全景图像。实验结果表明该系统能够自动对多幅无序图像进行自动匹配与识别, 验证了算法的可行性和有效性。

指纹图像识别技术的研究 篇9

1 系统概述

指纹识别系统包括指纹图像的采集, 预处理, 特征提取以及特征匹配等。其中, 预处理在指纹识别中起着不可忽视的重要作用, 由于压力, 变形, 在场的污渍和其他噪音的影响, 导致预处理上的指纹识别系统的准确性和可行性直接受到影响。空间区域中的图像预处理, 也可以在频域实现。有很多成熟的前处理方法。特征提取是则是通过合适的算法提取出能够体现图像明显特征的参数和数据。特征匹配则通过将采集数据和数据库中的指纹信息进行比较, 从而进行确认。

2 指纹图像的预处理

2.1 指纹图像预处理概述。

指纹识别的预处理过程由分割、二值化、细化这几步组成。分割就是把原始灰度图像的感兴趣区域和背景区域分离开, 感兴趣部分包含着脊线和谷线的清晰区域分割操作能有效地去除部分噪声, 使后续处理更加简便, 所以分割是预处理的第一步。现有的指纹图像分割方法大都是根据指纹图像灰度的统计特征 (如方差、均值) 设计算法的。

2.2 分割。

指纹图像, 往往不是完全充满指纹, 常混有一定的背景噪音, 所有有必要进行图像的分割, 从而减少预处理的区域, 提高图像信息的抗干扰性。图像分割的质量直接关系到后续特征的提取和识别的精确度。

2.3 二值化。

图像分割后需要对图像进行二值化处理, 按照某个设定的阀值, 将图像像素值转换成“1”或“0”。通常采用局部阈值自适应二值化算法。该算法利用指纹的脊线和谷线宽度的特点大致是二元化的黑色和白色像素相同数目应该大致相同的特点, 来进行二值化处理。

2.4 细化。

二值化后的指纹图像, 脊线仍具有一定的宽度。而指纹识别只和纹线的方向有关, 无需考虑其厚度。所以从减少数据量和提高识别精度的角度考虑, 有必要对指纹图像进行细化处理。细化的原则就是要保持纹线连接性、方向性以及中心位置等特征的不变。

传统的图像细化算法, 会带来明显的脊吞噬现象或骨骼位置偏移现象, 效果不是很好, 因此需要进行算法改进。本文在OPTA细化算法的基础上进行改进。改进后的算法应用于细化时, 与原始图像对比, 显示了叉脊线的特征信息, 并连接基本上保留了点, 但它也带来了一些伪特征点, 而这些伪特征点, 大多在噪音区。可以分开处理, 以减少伪特征点后去噪。

3 指纹图像的特征提取

指纹图像的提取关键在于伪特征的过滤。因此需要对空洞、毛刺、绞线、断脊等伪特征能够进行较好的判断及滤除。

3.1 伪特征点的滤除步骤如下:

选取半径为R的领域, 假设领域内包含M个特征点。比较这M个特征点的关系是否和真特征点的标准相一致。一致则为真特征点, 予以存储, 否则作为待滤除的特征点进行下一步分析。

3.2 对交叉点和端点进行分析。

在端点分析时, 考虑领域内的M个特征点时候存在断脊及短线等伪特征 (真特征是没有的) 。如果检测到存在断脊或短线, 则先进行短线的删除, 然后接着删除掉断脊, 从而实现伪特征的删除;在进行分叉点分析时, 则是分析M个点中, 是否包含有孔洞和毛刺等结构特征。如果存在其中一种, 则为伪特征。要先进行毛刺的删除, 其次删除孔洞, 最后是滤除叉连。

3.3 经过前面两步骤的精确处理以后, 如果还存在较多数量的特征的话, 并且数量保持在50个以上, 则表明指纹图像中存在较多的干扰信息, 从而导致伪特征比预期的多很多, 难以滤除。在这种情况下, 则需要采用遍历各特征点的办法, 对距离很近的特征点予以删除, 值得达到标准为止。

4 指纹图像的匹配

基于特征点的模式被认为是普遍采用的一种特征匹配方式。通过提取指纹图像的特征点, 将指纹图像转换成一系列的点集。再将指纹图像匹配转换为两组点集的一致性问题。考虑到指纹信息在采集的时候是按某一方向和力量录入的, 对应的数据存入了指纹识别系统中的存储区域。而当再次验证指纹时, 由于指纹按下的方位和力度往往和指纹图像录入时不一样。因此, 在进行指纹图像信息匹配时, 需要将采集到的指纹的特征点集进行旋转、展缩等各种变化, 以便和数据库中的原始指纹信息进行良好的匹配, 而避免误动作。这一点当然是图像匹配的难点所在。

因此在图像匹配时, 需要对每一个细节点信息进行处理和配比, 包括方向特征 (一般考虑脊线方向) , 端点特征以及分叉点特征等。然后结合奇异点、脊线等表征出来的信息综合考虑。在进行具体的细节点匹配时, 要通过选用的算法, 对各细节点之间的几何关系进行计算, 从而对细节点之间的等同关系进行判断。有点图像匹配算法, 在进行细节点匹配时, 会计算出一个最大似然概率P, 当P的值较大, 说明匹配度高, 匹配双方更为接近。然后找出P值最大的进行最终的成功匹配;还有一种算法是采用阀值来实现指纹信息的匹配。只要细节点之间的差异程度在预设的阀值范围内, 则认为配对成功, 否则配对失败。

这种细节匹配的核心在于引入了限界盒的概念, 传统的匹配中的限界盒是固定大小的。为了提升匹配的精确度, 本文采用了可变大小的限界盒。这样就可以扩大细枝末节的匹配准确度。可以说由于指纹图像呈现的非线性, 导致了细节匹配也应该采用这种非线性的限界盒方式, 从而确保匹配的准确度。另外, 指纹特征匹配的过程中, 如何选择一个可靠的参考点也是非常重要的。如果将所有可能的点都分别作为参考点, 势必会加大计算量。

5 结论

随着社会的不断发展, 科学技术的不断提升, 对于我们的生活来说, 更加高安全性的身份识别技术已经变的越来越重要, 这是我们进行社会活动的安全保障, 经过不断的改革与创新, 专业人士的研究我们不难发现, 指纹识别正以其处理高速、采集方便和准确性高的优点, 被广泛的应用于各种领域当中, 并取得一致好评, 使人们在进行社会活动中对于身份的识别问题可以放宽心情。相信指纹识别技术的发展前景是不可估量的, 会成为保障社会活动合法有序进行的基础。

参考文献

上一篇:GNSS测量下一篇:液相微萃取