高斯核模型

2024-06-22

高斯核模型(精选九篇)

高斯核模型 篇1

近年来,随着科学技术的发展,硬件设备制造成本降低,视频跟踪技术的应用越来越广泛,在视频监视、智能交通、图像处理、医疗诊断和国防军事等方面均有广阔应用前景和实际意义[1]。视频序列运动目标检测技术是视频跟踪中非常重要的步骤,如何获得可靠的背景并将前景分离出来,是成功跟踪目标的关键[2,3]。早期的背景建模方法是单高斯模式,不能准确描述复杂多变的背景,继而Stauffer等人提出了混合高斯模型[4,5]。混合高斯模型可以更准确地对复杂背景进行建模,但该方法计算量大,效率较低,不能满足某些应用,如智能交通系统中对实时性的要求,模型参数的设置也较为复杂。之后,又提出了很多混合高斯模型的改进算法,如采用自适应混合高斯建模方法,调整模型的均值和方差的学习率[6,7,8],以及彩色分割算法[9]解决了拖影问题和检测目标内部出现空洞等问题,在一定程度上改进了目标检测的有效性,但实时性方面始终需要进一步改善。Elgammal[10,11]等人提出了一种无参估计的方法——核密度估计,不需要事先假定像素值的分布,直接从训练帧的像素连续变化值中估计出概率密度函数,核密度估计算法速度较快,但易受噪声影响,噪点较多,并且对于细节处理能力较差。本文提出了一种基于混合高斯模型和核密度估计的运动检测方法,采用先整体后细节的方式,先用核密度估计方法快速确定必为前景与必为背景的区域,对于不能准确判定的区域采用混合高斯模型确定其为前景或背景。该方法集成了核密度估计与混合高斯模型建模的优点,大大提高了前景分离的准确性,并且有效控制了计算量,具有较好的实时性。

1 基于混合高斯模型的背景建模

在传统的高斯模型中,图像中的每个像素的灰度值用N(u,d)的高斯分布进行描述。即对背景图像B,(x,y)点的灰度满足:

且每个像素相互独立。为了更准确地对背景进行建模,Stauffer[4,5]等人将每个像素点在时间域上的概率分布表示成由K个高斯分布组成的混合高斯模型。对每个像素点,取其时序最近的前t个时刻的像素值作为一组样本{X1,…Xt},当前t时刻像素观察值的概率分布表示为:

其中,K为高斯模型的数量,即混合高斯模型中分量的数量,通常取3~5[12];ωi,t为t时刻第i个高斯分布的权值,满足∑undefinedωi=1;μi,t和∑i,t为t时刻第i个高斯分布的均值和协方差矩阵;η(Xt,μit,,∑i,t)为第i个高斯分布的高斯概率密度函数:

假设红、绿、蓝三个颜色通道相互独立,并具有相同的方差,即协方差具有形式:

①匹配与参数更新

K个高斯分布按照优先级undefined由高到低排列。

将Xt与每个高斯分布进行匹配,若|Xt-μi|<3σi则当前像素值与第i个高斯模型匹配。若匹配成功,则根据当前像素值更新参数。具体如下:

更新被匹配的高斯分布的权值,均值,方差。α为权值更新率,ρ为参数更新率。当像素值与高斯分布匹配时,Mi,t取值为1,否则取值为0。即对没有匹配成功的高斯分量,应降低它的权重。

若没有任何一个高斯分布与当前值匹配,则用当前值替换优先级最低的高斯分布。用当前像素值代替高斯分布的均值,并用较大的方差和较小的权值初始化该高斯分布。

②背景模型估计

参数更新后,按照高斯分布优先级undefined将各高斯分量由高到低排序。位于序列第一位的为最能描述背景的高斯分布,最后一位则为不稳定噪声产生的分布,在下一帧计算中将被新的高斯分布取代。由K个高斯分布中选择前B个作为背景模型:

T为阈值,为背景在整个高斯模型中应占的最小比重。若T取值较小,则由排在最前面的一个高斯分布表示;若T取值偏大,则会融入更多的高斯分布混合表示。

③前景检测

当有前景目标出现在场景中时,像素值会发生突变,不满足高斯分布,利用这一点建立背景模型和分离前景目标。根据前B个高斯分布建立的背景模型,按照优先级次序将像素值分别与B个高斯分布逐一匹配。若没有表示背景模型的高斯分布与之匹配,则判定该点为前景点,否则为背景点。

2 基于核密度估计的背景建模

Elgamma等人提出了一种基于核密度估计的非参数估计建模方法[10,11]。通过统计学的方法对历史帧进行数学建模。不需要事先假定像素值的分布即背景参数模型,可直接从训练帧的像素连续变化值中估计出概率密度函数。与单高斯模型相比,核密度估计算法有着很强的适应性,能够处理背景复杂和像素快速变化的场景[13]。

按时间轴,取视频序列的N帧为样本,每个像素的取值可视为一个随机变量,有样本集{x1,x2,…,xN},设某像素点t时刻的观察值为xt,则该值的密度可由Parzen窗方法估计:

undefined

Ka是窗宽为σ的核函数,Kσ满足K(t)≥0,且∫K(t)dt=1。

选择高斯函数为核函数,则可得到密度估计:

undefined

对于RGB图像,密度估计表示为:

undefined

选取合适的窗宽,若

p(xt)

像素点xt为前景点,否则为背景点。Tf为图像的全局阈值。

3 核密度—混合高斯级联模型

非参数核密度估计算法已经广泛应用于鲁棒的复杂场景背景建模中[14],但是,由于非参数核密度估计背景建模是对一段视频的统计分析过程,采用单一模型,导致采样样本中存在的噪声使最终结果的噪点较多,并且对于细节如轮廓边缘处理过于粗糙。而混合高斯模型对每个像素点建立多个高斯分布,能更精确描述图像特征,但计算量较大,算法复杂。考虑到核密度估计算法计算量较小,实时性较好等特点,本文对同一场景分别建立描述背景的核密度估计模型和混合高斯模型,先采用核密度估计对前景和背景进行大致分割,再用混合高斯模型对边缘细节等不能精确描述的区域建模分析,从而确定其所属类别。

这是一种更精细的建模方法。大部分的筛选工作由运算速度较快的核密度估计算法完成,少量核密度估计无法准确判定的像素点由混合高斯模型确定。本文算法实现流程图如图1所示。

传统的核密度估计方法只设一个全局阈值Tf,本文首先设置两个阈值τ1、τ2,分别表示前景点的上界与背景点的下界,整体分割图像得到可靠的前景区域与可靠的背景区域。τ1大于传统核密度估计分割阈值,τ2小于传统核密度估计分割阈值。如果当前像素以概率密度大于τ1符合模型,则标记为背景点,若以概率密度小于τ2符合模型,则为前景点。若概率密度值落入两个阈值中间,表明此区域出现误差的可能性较大,为不能准确判定区域。用混合高斯模型对此类像素点进行二次判定,从而得到较好的前景检测结果。

4 实验结果

为验证本文算法的有效性,选择两段视频序列做测试,视频1为简单场景,行人行走视频序列,为单目标检测。视频2为较复杂场景,道路路口车辆行驶视频序列。采用本文所述方法,主要验证算法对目标检测的有效性,算法由Matlab编程实现。视频分辨率分别为320×240(视频1)像素和640×480(视频2)像素。

核密度估计背景建模中,背景阈值τ1为0.3,前景阈值τ2为0.2。混合高斯模型中,阈值τ为0.25,最大高斯模型个数为5,初始权值0.05,初始化标准差为6,模型学习率α为0.1,权值更新率β为0.1。

图2为行人行走视频序列结果,(a)为某一帧原始图像,(b)为核密度估计算法的目标检测结果,(c)为混合高斯模型算法的目标检测结果,(d)为本文算法目标检测结果。图3为道路车辆行驶视频序列结果,同样,(a)为某一帧原始图像,(b)为核密度估计算法的目标检测结果,(c)为混合高斯模型算法的目标检测结果,(d)为本文算法目标检测结果。由结果可见核密度估计算法所得检测结果(图2(b),图3(b))目标轮廓周围不清晰,细节较模糊,而且背景中混入的噪声点较多;混合高斯模型的检测结果(图2(c),图3(c))目标细节清晰,噪声点小,但计算量大,同样场景下耗时为核密度估计的一倍。本文的检测结果结合了二者的优点(图2(d),图3(d)),以较小的运算代价得到了准确的运动目标检测结果,边缘更清晰,噪声点大大减小,并且实时性较好。测试结果证明系统采用的方法是有效的。

5 结束语

高斯核模型 篇2

高斯模型中不同变量下的2π及3π关联函数

相对论重离子碰撞中,在不同变量下, 关联函数的`函数形式可以是不同的. 对π源密度的高斯分布,给出了2π关联函数C2(q,q0)和3π关联函数C3(Q)的公式.

作 者:陈小凡 杨学栋 陈志来 作者单位:哈尔滨工业大学,理学院,黑龙江,哈尔滨,150001刊 名:哈尔滨工业大学学报 ISTIC EI PKU英文刊名:JOURNAL OF HARBIN INSTITUTE OF TECHNOLOGY年,卷(期):200335(3)分类号:O572关键词:相对论重离子碰撞 2π干涉学 3π干涉学

高斯核模型 篇3

关键词:财务指标;核主成分;混合高斯模型;聚类

中图分类号:F23 文献标识码:A doi:10.19311/j.cnki.1672-3198.2016.07.046

1 研究背景

上市企业定期公布的财务报表对投资者选股、持股有一定的参考价值,但大量数据背后的信息往往难以被发掘。聚类分析是一种以数据特征为基础的分类技术,通过对上市企业财务数据的聚类分析,能基于财务指标的相似性实现对上市企业的有效分类,对投资者有重要的指导意义。

原思聪(1995)首次探讨了模糊数学方法在股票选择方面的应用,通过综合隶属函数与模糊函数构建了股票选择的评价体系,然而模糊聚类的主观性较强。沈周翔、钟键(2005)则采用主成分(PCA)的方法,通过提取累计方差贡献率大于95%的两个主要成分,将股票财务数据投影到二维平面上,并根据平面象限区分聚类类别,但传统的PCA算法是基于线性组合构造主成分的,并不能处理具有非线性结构的财务数据,因此学者提出了以核主成分(KPCA)技术替代PCA技术进行特征提取。余乐安、汪寿阳(2009)先用KPCA算法对股票的财务数据进行降维处理,再对降维后的数据采用K-Means聚类,这种处理方法能得到准确率更高的聚类结果。但K-Means聚类为硬聚类技术,无法反映KPCA降维及聚类过程中的不确定性,更无法对聚类结果提供有效的解释。针对此问题,在KPCA降维数据的基础上,本文引入一种基于混合高斯模型的聚类算法,能有效地提高聚类结果的可解释性。

2 混合高斯模型软聚类算法

已有研究所采用的聚类算法都是一类优化目标函数的硬聚类算法,其特点是能清晰地对事物进行划分,不允许模棱两可的结果。然而,上市企业的财务指标具有多样性及复杂性等特点,硬聚类算法显然很难基于复杂多样的财务指标将上市企业清晰地加以区分。一种基于混合高斯模型的软聚类算法能有效地解决该类问题。

2.1 混合高斯模型的基本概念

混合高斯模型(Gaussian Mixture Model,GMM)是一种以高斯分布为基础的混合模型,其概率密度函数可表示为多个高斯分布概率密度函数的线性组合。Wilson(1999)已证明,由有限多个高斯分布构成的混合高斯模型能以任意精度逼近任何的多元分布,这种良好的性质使得其在降维或聚类中有良好的应用前景。

2.2 混合高斯模型算法

混合高斯模型是由多个独立的单高斯分布模型(Singal Gaussian Model)的线性组合而成,每一个单高斯分布可称为混合高斯模型的成分(Component)。考虑多元的情况,假设1×d的多维变量x服从单高斯分布,其概率密度函数f(x;μ,∑)为:(1)

其中,μ是1×d的均值向量,∑是d×d的协方差矩阵。而GMM的概率密度函数g(x)则可表示为:(2)

K为成分的数目,在聚类应用中同时代表类簇的数目;αi(i=1,2,…,K)是权值因子,是第i个单高斯分布在混合模型中所占的权重;μi,∑i分别是第i个单高斯分布的均值向量及协方差矩阵。

2.3 混合高斯模型参数估计

由于聚类是一种无监督学习的方法,其结果具有较强的目的导向性,因此在聚类应用中,聚类类簇数据K,即混合高斯模型的成分个数往往是外生的,而需要估计的参数有αi、μi及∑i(i=1,2,…,K)。假设N×d的数据集,服从概率密度函数为g(x;θ)的混合高斯分布,θ表示所有参数的集合,其似然函数L的形式如下:(3)

由于单个混合高斯概率密度函数值一般都很小,随着数据点个数N的增大,连乘的结果会变得非常小,容易造成浮点数下溢,因此采用自然对数形式改写目标似然函数:(4)

一般的参数求解方法是通过对对数似然函数求偏导以求得各参数的极值,然而(4)式中在对数函数里面存在大型求和符号,不能用求偏导解方程的发法直接求得参数极值。Bilmes(1998)提出的期望最大化算法(EM),能通过多次迭代的方法简化参数估计过程,进而求取模型参数。

首先初始化混合高斯模型的所有参数,设为θ0=(α0,μk0,∑k0),k=1,2,…,K,其中K个多元高斯分布的均值向量μk、协方差矩阵∑k可通过统计方法进行计算权值αi初步设定为1/K。在迭代的过程中,对于第j个样本点xj,其由第k个多元高斯模型生成的概率定义为:(5)

然后,在第一次更新参数的步骤中,计算可得ωj1(k),对于任意一个样本点xj,其值的ωj1(k)*xj部分可看作是由第k个单高斯模型产生的,即将该部分数据用作第k个单高斯模型的参数估计。因此,第k个单高斯模型共产生了ωj1(k)*xj(j=1,2,…,N)共N个数据点,通过这N个数据点能计算出第k个单高斯模型的均值向量与协方差矩阵参数,在第一次更新参数时,第k个单高斯模型的参数可更新为:(6)(7)(8)(9)

在第一次EM迭代计算后,可得到所有参数的更新值θ1,用θ1代替初始化参数,即可以进行第二次的EM迭代计算。在目标精度下,设置一个阈值thresh-old,在n次重复EM迭代后,当满足|ln(L)[n-1]-ln(L)[n]|

3 实证分析

3.1 数据来源

本文参考了财务综合能力分析的指标体系构建方法,考虑到数据的全面性及可得性,搜索了2014年沪市、深市134家房地产上市企业的年度财务指标,包括偿债能力、运营能力、盈利能力及发展潜力四个一级维度之下的18个二级财务指标(见表1),形成样本数据集(本文数据来自Wind资讯金融终端,实证分析通过Matlab实现)。

3.2 实证分析

在聚类类簇数目设定上,参考通达信软件对于股票收益率板块的区分(《通达信板块解释》),将作为外生参数设置为三类,分别表示下游企业、中游企业以及优质企业。

通过KPCA降维,在85%的阈值下将18个指标压缩为12个,并以该13412的降维后数据为基础,采用EM算法估算混合高斯模型的参数。参数估计后根据所得的概率矩阵,将134家上市企业聚为三类,其中聚于一类(优质企业)有5家,二类(中游企业)有113家,归于三类(下游企业)的有16家,聚类的三维可视图见图1。其中,132家上市企业能以85%以上的概率进行聚类,说明三成分的混合高斯模型能很好地逼近样本数据的多元分布,对样本聚类的把握性较大,而聚类概率低于85%的两家企业具体情况见表2。从表2可看出,两个聚类异常点与三维可视图结果相似,此外,由于不能以较高的概率确定其归属,因此对该两家企业的聚类情况应谨慎对待。

4 结论及建议

4.1 结论

实证分析显示,基于GMM的聚类算法能较好地实现对房地产上市企业的聚类,并反映各企业归属各类别的概率大小。事实上,GMM参数的估计依赖于样本点属于各个类别的概率大小,当遇到某样本点属于两个类别的概率相差甚小的时候,可对分类结果抱有怀疑态度,从而通过修正算法等方法找寻更精细的分类。

此外,通过GMM参数的估计,能获得各类簇近似的单高斯分布,而通过相应单高斯分布能深入了解到各类簇的结构与性质,便于对各类簇进行评估或进一步的研究。

4.2 建模的启示及建议

综合上述分析,有如下启示和建议:

(1)对于证券公司而言,其公布的业绩评价对于投资者购买股票具有举足轻重的作用,因此其评价必须严谨并有充分的依据。通过本文的分析,券商可以适当在上市公司业绩评级的过程中采用高维数据聚类的方法,通过该方法所得的聚类结果较之传统的净资产收益率识别具有更高的可信性。

(2)对于政府而言,加快证券市场的改革进度,进一步完善上市公司财务报表审核机制,确保所以上市公司公开财务报表的真实性。只有基于准确真实的数据出发,才能使研究结果贴近市场、贴近企业、贴近投资者,才能带动金融行业的进一步发展。

高斯核模型 篇4

图像分割是根据图像中一个或多个特征将图像分成某些感兴趣的区域,是图像分析、理解的关键[1]。在由三维目标映射为二维图像的过程中,图像会有信息丢失,成像设备所受诸多因素干扰是不完备的,使得图像除了目标外还存在随机噪声。而人的视觉对于图像从低到高的灰度级别不是严格确定的,由此导致图像边缘、区域、纹理等的定义以及对图像底层处理结果的解释存在不确定性[2]。故图像分割问题是典型的结构不良问题,而模糊集理论具有描述不良问题的能力,把模糊理论引入图像处理领域,将使基于模糊集理论的图像分割方法具备更好的分割效果。

模糊聚类分析已有很多方法,在基于目标函数的聚类方法中最具有代表性的是模糊C均值聚类方法FCM(Fuzzy C-means)[3],是由Dunn从硬C聚类方法引出,后又经过Bezdek归纳并加以完善。FCM图像分割方法是通过目标函数的迭代优化来实现对图像特征的划分[4],在当前基于目标函数的模糊聚类图像分割方法研究中,都是基于这一基本思想。

本文从FCM图像分割算法出发,在基于二维直方图加权的聚类中心优化调整的基础上,提出结合高斯核函数的综合算法(2DWGKFCM),最后将该算法应用于图像分割,并进行算法对比。

1 基于二维直方图加权的图像分割算法

1.1 加权模糊均值聚类算法

假设X={x1,x2,…,xn}为p维实数空间中给定的一个有限样本子集,xk∈Rp为第k个样本的特征矢量。对于任意给定的类别数c,2≤c≤n,样本集X的加权模糊均值(WFCM)聚类问题可以表示成如下的数学规划问题:

wi为每个样本的加权系数,且满足概率约束条件

为模糊划分矩阵,有:

为样本集X的模糊c划分空间;V={v1,v2,…,vc}为c个模糊类的聚类中心矢量集;‖·‖为某种范数,用来定义样本与聚类中心的相似性测度;m为模糊加权指数,控制聚类的模糊程度。

利用拉格朗日乘子法,可推导出式(1)的优化迭代公式,即:

加权系数wi的作用在于聚类中心的调整,当wi=1/n时,认为各个样本对分类影响一致,该算法就退化为经典的FCM算法。

1.2 二维直方图加权系数

基于FCM的分割算法中,直接把灰度及其出现的频度作为待分类样本,与FCM相结合就形成了一维灰度直方图加权的FCM图像分割算法[5]。其分类样本数不随图像尺寸的增大而增大,满足分割的实时性要求,但由于噪声干扰等原因,目标和背景的分布相互重叠的不可区分,使得该方法的前提不再成立。而在基于原图像和领域平滑图像而构造出的二维直方图上[6],当利用了像素空间相关的这一信息后,目标和背景的分布就会比一维直方图容易区分。

二维直方图H(s,t)描述了原图I(x,y)中灰度值为s,同时在平滑图像的同一位置具有灰度值为t的像素(对)的个数[7],即为两幅图的联合概率密度:

基于二维直方图加权的FCM图像分割算法具体的实现方法如下:定义待分类样本为二元组xi=(s,t),i=0,1,…,L2-1,其中i=s L+t,加权系数为wi=H(s,t)。

2 基于高斯核的FCM图像分割算法

为避免高维运算,利用满足Mercer条件的一个函数,将高维空间的内积运算通过低维空间的简单运算实现,无须考虑非线性映射ф的形式,这个函数就称作核函数[8],记为K(x,y),满足:

高斯核函数的定义为

2.1 隶属度及聚类中心的确定

本节选择高斯核函数与FCM算法进行结合,则FCM算法目标函数改写为:

令J(U,V)对隶属度uij的偏导数等于

令J(U,V)对聚类中心v1的偏导等于0,有

,可得

2.2 高斯核函数径向宽度的选择

σ为函数的宽度参数,控制函数的径向作用范围[9]。对于聚类问题而言,如果特征空间样本点的聚类结构紧致,则较小σ的值便能保证样本点的有效聚类;如果聚类结构分散,则隶属度函数分布模糊性强,那么,较大σ的值有助于得到明确的隶属度函数分布[10]。

设样本集X={x1,x2,…xn,},定义样本集的中心,样本点到样本中心的距离,则样本集平均距离为

基于样本点的到样本集中心的距离方差,作为径向宽度σ的值[11],有:

样本点间的距离方差表征了聚类周围的聚合程度[12],即样本点聚类结构的紧致程度,可利用样本点间的距离方差进行粗略的衡量。

3 实验仿真与分析

如图1所示,实验用图为细胞灰度图像及地面灰度图像,大小均为256×256。在原图的基础上叠加了方差为0.03的高斯白噪声,平滑图像用“average”均值滤波实现,同时保持灰度级范围不变(0~255)。预设模糊因子m=2,聚类分割算法截止阈值ε=1e-5。运行环境MATLAB R2012a(7.14.0.73964-bit)。

相比于2DWFCM的图,传统FCM算法噪声的抑制情况较差,在分割图中基本看不出原图中的细胞结构。在2DWFCM中,虽噪声被有效抑制,但部分细胞也被误分为噪声而被抑制。如左上角的框中,分割结果细胞轮廓丢失明显,而中央的主细胞的内部结构在高噪声环境下也得不到很好的还原。

两种分割算法的性能比较如表1所示。

(PSNR单位:d B)

从峰值信噪比(PSNR)可看出,2DWFCM的数值大于FCM算法,即前者的图像抗噪性能更佳,且2DWFCM在收敛时间上有较大改善,较FCM算法提高了34倍。在此基础上,横向对比了四种算法的分割效果,如图2所示。

图2所示的分割结果可看出,虽然四种算法的分割效果均不同程度地受到了噪声的干扰,但均得到了可识别的地物特征分割结果。相较于另外三种算法,2DWGKFCM算法对屋顶左右斜面的灰度变化,以及街道十字路口中心交叉处的还原更加准确,具体如表2所示。

(PSNR单位:d B;收敛时间单位:s)

表2显示了四种算法的分割效率及量化效果,由于GKFCM的算法复杂度的提高,分割效率低下,而二维直方图加权系数的引入可有效降低收敛时间,提高分割效率;2DWGKFCM算法则兼具了高斯核的抗噪性能与二维直方图加权算法的分割效率,拥有了更高的PSNR值及更少的迭代次数,即在噪声环境中具有更好的鲁棒性及分割有效性。

4 结束语

本文在传统FCM算法上结合了基于图像二维直方图加权系数及高斯核函数,提出了2DWGKFCM图像分割算法。针对传统基于核的FCM分割方法对噪声敏感及分割效率低下的弊端,将具有调整二维直方图加权系数引入,不仅结合了图像像素点的灰度信息及像素点与其领域间相关的空间信息,在噪声环境下获得了更好的分割效果,还提高了算法的收敛速度,提高图像分割效率。在此基础上,结合高斯核可针对原始空间中线性不可分的样本,用以丰富原始算法单一的聚类结构,使2DWGKFCM算法对噪声和野值点具有更好的鲁棒性,能更好地满足特征复杂的图像分割问题。通过实验结果的比较,验证了本文提出算法的有效性。

摘要:文中提出了基于二维直方图加权的高斯核FCM图像分割方法,该方法在传统FCM算法中融入了二维直方图的加权系数及高斯核函数。在图像分割中,由于噪声干扰,传统的FCM算法在许多情况下并不能有效区分目标和背景,而利用二维直方图中像素点与其领域间相关的空间信息,将其作为加权系数用来调整聚类中心,可有效提高分割效率。此外,算法结合高斯核函数用于改善FCM算法在样本特征空间线性不可分时带来的划分不准的缺点,改善图像分割效果。实验结果表明,此算法在提高图像分割效率的基础上,比传统算法具有更好的鲁棒性与有效性。

关键词:二维直方图,加权,高斯核,FCM,图像分割

参考文献

[1]张晶,王黎,高晓蓉,等.数字图像处理中的图像分割技术及其应用[J].信息技术,2010,34(11):36-39,43.

[2]陈东辉.基于目标函数的模糊聚类算法关键技术研究[D].西安:西安电子科技大学,2012.

[3]Lin Jzau-sheng.Fuzzy Clustering Using A Compensated Fuzzy Hopfield Network[J].Neural Processing Letters,1999,10(1):35-48.

[4]Li Ao,Li Yi-bing,Yang Xiao-dong,et al.Image restoration with dual-prior constraint models based on Split Bregman[J].Optical Review,2013,20(6):491-495.

[5]Fu Q,Li Y B,Tang C R.Image Enhancement method for sonar images based on Surfacelet and Multi-Scale Retinex[J].Journal of Applied Sciences,2012,30(5):505-510.

[6]Bouveyron C,Girard S,Schmid C.High-dimensional data clustering[J].Computational Statistics and Data Analysis,2007,52(1):502-519.

[7]姜园,张朝阳,仇佩亮,等.对聚类算法普遍存在问题的解决办法[J].电路与系统学报,2004(3):92-99.

[8]刘小芳.基于模糊聚类理论的模式识别研究[D].成都:电子科技大学,2004.

[9]Li Yi-bing,Fu Qiang,Ye Fang,et al.Blind Image Restoration via the Integration of Stochastic and Deterministic Methods[J].Mathematical Prob-lems in Engineering,2014(1):1-10.

[10]Li Yi-bing,Fu Qiang,Ye Fang,et al.Dark channel prior based blurred image restoration method using total variation and morphology[J].Journal of Systems Engineering and Electronics,2015,26(2):359-366.

[11]张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004(6):858-868.

高斯核模型 篇5

运动对象的检测、跟踪是计算机视觉领域研究的重点之一。一个好的跟踪系统, 首先要能较可靠地检测出将要跟踪的目标[1]。而对于目标的检测、提取算法, 主要有光流法、时间差法和背景差法[2,3]。

光流法是在不需要背景区域的任何先验知识条件下就能够实现对运动目标的检测和跟踪, 但其计算量非常大, 对噪声比较敏感[4,5]。时间差法是通过对连续视频图像序列中相邻的两帧或三帧计算基于时间的差分, 并用阈值化处理来提取视频序列中的运动区域。该方法能够适应环境的动态变化, 实现实时的运动目标检测。但其要求目标颜色与背景颜色要有一定的区分, 否则得不到完整的目标区域, 且容易漏检, 产生拖影[6]。背景差法是目前最常用的一种方法, 该方法利用当前图像与背景的差分来检测运动区域, 它克服了时间差法的缺点, 获取的运动对象信息更为准确。背景差法的关键在于背景图像的初始化和更新[7]。

高斯混合模型 (GMM) 是一种经典的背景模型[8], 模型的参数采用自适应方式更新, 很好地解决了复杂背景光照变化、物体运动慢、突然进入或移出场景的物体等对背景模型的影响, 可以准确可靠地提取运动对象, 为进一步的跟踪提供最佳的初始化信息。

1 高斯混合背景模型

1.1 高斯混合模型

对于背景简单, 光照变化缓慢的环境, 单高斯即可获得很好的背景模型。考虑实际应用中背景较复杂的情况, 并增强系统的鲁棒性, 本系统采用多高斯混合建立背景模型。即对视频图像的每个像素点建立多高斯混合模型, 同时处理多种背景变化, 且模型的参数自适应更新。

设任意像素点的像素值为Ix, y, i, 则任意像素点的历史像素值可以表示成:

用K个独立的高斯分布联合建立模型来表示这些历史像素值, 像素值Xt为当前像素值的概率为:

式 (2) 中K是分布数目, Xt是t时刻的像素值, μi, t, ∑i, t为第i个高斯分布在时刻t的均值和协方差, ωi, t是估计的第i个权值, 它反映该高斯分布出现的比例, η是高斯概率密度函数:

K的取值一般由存储器容量和计算能力及背景复杂度决定[8], 通常取值3到7。

1.2模型参数更新

对于模型参数的更新, 传统的EM估计算法[9,10]存在收敛速度不稳定、只能保证收敛到局部极值、计算开销大等缺点。这里采用一种拟合方法, 即用当前图像每个像素点与相应高斯分布作比较, 如果其与高斯分布的期望值差在2.5倍标准差之内, 即Xt-μi, t≤2.5σi, t-1, 则认为匹配。如果找到一个最佳的匹配, 设此匹配高斯为第l高斯, 则对各分布权重更新方法如下:

然后对ω进行归一化处理。α为学习常数, 通常取值范围为0.01—0.1:α1决定参数改变的速度。对于匹配高斯参数更新方法为:

其中ρ=αη (Xtμt, iρ2) 。

如果K个分布中没有一个与当前像素值匹配, 则令ωk, 并删除Nk=N (μk, ∑k) 。模型最小可能分布被当前像素值作为平均值的分布取代, 初始化时赋较大方差, 取较低权重。即:

1.3 背景前景分离

按ω/σ值对高斯混合分布进行降序排序。其将最可能的背景分布保留在顶部, 最小可能的背景分布被置底, 最小可能分布可能会被新的分布取代。将前B个分布选作为背景模型[11],

对于复杂的背景, 高斯混合背景模型中T值取较大值;而对于简单背景, 取较小。

2 算法实现步骤

2.1 初始化

选取高斯的阶数K (3~7) 值和学习常数α (通常取值范围为0.01-0.1) 。对每个像素用均值为μk, 协方差矩阵为∑k, 以及相关的权重为ωk的K高斯Nk=N (μk, ∑k) 进行初始化。

2.2 取第t帧

设图像的亮度向量为xt———可能是一个RGB向量xt= (rt, gt, bt) 。确定哪一个高斯与观察值匹配, 选择一个最佳的作为第l高斯。

2.3 找到一个匹配的l高斯

(a) 设置权重 (如式 (4) ) , 然后规一化。

(b) 更新模型参数, 如式 (5) 、式 (6) 。

2.4 没有高斯与xt匹配

按式 (7) 确定参数。

2.5 由等式 (8) 确定B

并从此通过最佳高斯匹配来决定是否是背景或者前景。

2.6 采用图像模糊或是形态学的膨胀或腐蚀

移除差分图像中小的区域和填补大的空洞, 获取图像中运动对象。

2.7 采集下一帧图像, 返回第二步

在运动对象自动检测过程中, 设定阈值判断是否检测到运动对象。若检测到运动对象, 则终止背景更新, 提取运动对象轮廓, 中心等信息。对于阈值的设定, 直接影响运动对象信息的准确度。

3 实验结果

基于视觉跟踪实验室硬件系统, 在不同环境下反复实验, 均取得较好效果。算法克服了光流法、时间差法的一些不足。在复杂背景光照变化、物体运动慢、突然进入或移出场景的物体等对背景模型的影响, 可以准确可靠地提取运动对象, 为进一步的跟踪提供最佳的初始化信息。

如图1, 是在光线较暗和有CRT显示器干扰、光线变化和背景抖动、强光照背景等复杂背景情况下, 实时图像、背景图像和提取的运动对象。实验表明在各种复杂环境下, 算法检测到的运动对象, 清晰、完整, 避免了光流算法和时间差法造成的易受噪声干扰、漏检和有拖影等弊端, 具有很强的实用价值。

4 结语

本文通过对自适应多高斯混合背景模型运动对象检测算法的研究, 实现了在简单与复杂背景情况下对运动对象的检测提取。相比传统的光流法, 同等计算能力的情况下, 此算法具有更高的运算效率;而与时间差法相比, 具有更好的检测效果, 提高了运动检测的准确性、可靠性、鲁棒性。此算法为进一步实现运动对象的跟踪提供了准确、可靠的检测结果, 有着重要实用价值。

参考文献

[1] 侯志强, 韩崇昭.视觉跟踪技术综述.自动化学报, 2006;32 (4) :603—617

[2] 万 缨, 韩 毅, 卢汉清.运动目标检测算法的探讨.计算机仿真, 2006;23 (10) ;221—226

[3] 张森悦, 李一波.复杂条件下的运动目标检测方法研究综述, 沈阳航空工业学院学报, 2008;25 (3) :59—63

[4] Barron J, Fleet D, Beauchem I S.Performance of optical flow tech-niques.International Joumal of Computer Vision, 1994;12 (1) :42—47

[5] 施家栋, 王建中, 王红茹.基于光流的人体运动实时检测方法.北京理工大学学报, 2008;28 (9) :794—797

[6] 初红霞, 宋起超, 王希凤, 等.基于帧间差分与Camshift相结合的目标跟踪算法.弹箭与制导学报, 2008;28 (3) :85—88

[7] 王宏群, 孙洪伟.基于背景建模的运动目标检测, 电脑知识与技术, 2008;3 (4) :825—827

[8] Stauffer C, Grimson W E L.Adaptive background mixture models for real-time tracking.IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'99) -Volume2, 1999

[9] Wayne P·Power A J.Schoonees.Understanding background mixture models for foreground segmentation.Proceedings Image and Vision Computing NewZealand2002University of Auckland, NewZealand, 26—28th November2002:267—271

[10] Bilmes J A, International Computer Science Institute, In:Gentle A·Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models.Inter-national Computer Science Institute, 1998

高斯核模型 篇6

1.1 基于内容的图像检索

在网络和存储技术飞速发展的今天,从多媒体数据库检索有用的信息变得十分重要。作为多媒体信息检索中的一个重要分支,图像检索受到广泛关注。由于基于文本的图像检索其结果不尽人意,基于内容的图像检索(CBIR)成为近期图像检索领域的主流方向。它根据图像的语义特征(如图像的颜色、纹理、布局等)从图像数据库中检索出具有相似特性的其它图像。常见的CBIR方法有颜色直方图方法,累加直方图方法,基于颜色-空间特征的图像检索方法等。颜色直方图法通过提取图像的颜色直方图并比较其相似度来判断图像的相似度,从而得到检索结果,该方法只考虑到了图像的颜色信息,未考虑到图像的空间信息。累加直方图方法是颜色直方图方法的一种改进,它用累加方式来增强颜色直方图的鲁棒性。基于颜色-空间特征的图像检索方法将颜色特征与空间特征相结合,先用HSV模型对图像进行分割,然后根据分割得到的对象的颜色、形状和位置信息来计算图像的相似度。

1.2 基于有限混合模型的聚类分析

所谓聚类,就是按照一定的标准将事物进行区分和分类的过程。这一过程是无监督的,即在这一过程中没有任何关于类分的先验知识,仅靠事物间的相似性作为划分类的准则。聚类分析则是指用数学的方法研究和处理给定对象的分类。聚类分析是一个将数据集划分为若干簇的过程,它将相似度较高的数据对象聚为一个簇,而将相似度较低的数据对象区分开。为了实现对数据对象的聚类,人们提出了很多种不同的算法,主要可以分为以下几种:划分聚类算法、层次聚类算法、基于密度的聚类算法、基于网格的聚类算法以及基于模型的聚类算法等。各种算法的代表算法分别为k-means算法、CURE算法、CLIQUE算法、STING算法和EM算法。文献[5]介绍并分析了各种常用聚类算法及其优缺点和适用范围。

基于混合模型的聚类算法是以概率统计理论为基础的一种灵活有效的聚类方法,它的基本框架是有限混合模型,聚类的基本策略是先对数据集进行初始划分,再采用EM算法进行模型参数估计,实现聚类结果的优化,最后用合适的方法选出最佳模型及聚类数目。用基于有限混合模型的方法进行聚类分析,可以克服一般聚类算法对数据集中的噪声无法建模以及聚类数目难以确定的问题。高斯混合模型是我们常用的一个数学模型。它是单一高斯概率密度函数的延伸,它能够平滑地近似任意形状的密度分布。文献讨论了混合模型聚类的局限性及存在的问题。

2 基于高斯混合模型聚类的图像检索算法

本文提出一种基于高斯混合模型聚类的图像检索方法,不仅考虑到了图像的颜色特征,而且也重视了图像的空间特征。主要分以下3步进行:①提取每个图像的每一个像素的特征;②对像素的特征矢量集建立高斯混合模型并用EM算法优化混合模型参数,得到每个图像的混合模型,从而得到图像库的混合模型集;③对各个图像高斯混合模型的参数向量混元建立高斯混合模型并估计模型参数,得到与检索例图模型相似的模型的类,从而得到检索结果。

对像素的特征矢量进行聚类,是将一幅图像分为若干个区域的过程,使得每个区域的像素具有较高的相似性,称为一类。每一个区域中的像素属于该类的概率分布可用一个高斯分布来描述,因而对整个图像可用具有G个混合成分的高斯混合模型来描述。特征提取以像素为单位进行,每个像素的特征矢量包含该像素的颜色和空间信息。我们选择(Y,U,V)作为颜色信息(其中Y为亮度信号,U、V为色度信号),同时选择该像素的坐标(e1,e2)作为位置信息。将每一个分量归一化到[0,1]区间。从而将每一个像素映射到5维空间里面的一个向量x=(Y,U,V,e1e2)中。

2.1 高斯混合模型

在Gauss混合模型中,待聚类的数据被看成是来自于多个正态分布的混合概率分布,这些正态分布代表不同的类,从而可以用各正态分布的相关参数(均值与协方差矩阵)作为类原型。设d维随机变量X=(xundefined,xundefined,…,xundefined)T具有有限混合高斯正态分布,若x为其中的一个采样,则其概率密度函数为:

undefined

其中undefinedundefined,j=1,2…,G是第j个分支的概率密度函数,即第j类所包含数据服从的d维正态分布的概率密度函数,μj是均值,∑j是协方差矩阵。πj是混合比例,满足undefined,它描述了第j类所包含的数据量比总数据量之比。G个成分对应于混合模型聚类的G个类。参数空间为undefined,其中参数θj由均值μj和协方差矩阵∑j组成。

要完成对数据集的聚类,只需估计出混合模型(1)的参数即可,主要用极大似然方法。即要求解以下优化问题:

求undefined。

其中undefinedundefined是参数Ψ的对数似然函数。

2.2 用于模型参数估计的EM算法

一般采用EM算法来估计混合模型的参数,EM算法是一种从“不完全数据”中求解模型参数的极大似然估计方法。记所取样本点取值为x=(xundefined,xundefined,…,xundefined)T并称之为不完全数据,同时引入潜在数据z=(z1,z2,…zn)T,其中zi在{1,2,…,G}中取值,表示第i个样本点来自于第zi个分支。称y=(xT,zT)T为完全数据。则完全数据对数似然函数为:

undefined

EM算法的基本思想是假设数据独立同分布于已知初始参数的高斯混合模型,因此可以根据初始模型推导出各数据点属于每个成分的概率,然后修改每个成分的参数值,重复该过程直到收敛。

但是传统的EM算法有着对初始值敏感的缺陷,近年来,关于EM算法的初始化也有不少研究。如岳佳等采用一种基于密度估计的方法来初始化EM算法,并与各种传统初始化方法作对比,取得了不错的效果。在本文的算法里,我们不着重于EM算法的初始化,主要介绍EM算法的主体在模型参数估计上的应用。

2.3 模型分支数的选取

模型分支数的选择指的是对式(1)中参数G的选择。在建立混合模型的过程中,分支数的选择对于输入样本的精确聚类是十分重要的,太多的分支会形成对数据的过度拟合从而使模型推广能力太差;太少的分支又不能很好地近似隐藏在数据中的规律。为了选择最优的G值,各种选择分支数的方法的研究也在不断进行。杨明提出了一种MML-EM1方法来选择模型分支数。该方法的优点是它将模型选取(估计最优分支数)和参数估计结合到一个单一的EM算法中,且对模型参数初始值的稳健性,选择最优分支数的正确率随着对初始分支数的增大而增高。

2.4 算法

本文的算法首先对图像库中每幅图像进行分析,提取出图像特征,建立特征库,对像素特征建立高斯分布模型,然后用EM算法估计混合模型参数,优化聚类中心。再以各个图像高斯模型的参数向量混元为数据集,按上述方法聚类。最后返回包含检索例图的簇。在本文算法的整个聚类过程中,假设模型的分支数已知和初始参数值给定。

2.4.1 基于高斯混合模型的图像检索算法

输入:图像库,检索例图,像素特征值混合模型参数初始值π01,μ01,∑01,图像模型参数向量混合元混合模型参数初始值π02,μ02,∑02。

输出:检索结果——包含检索例图的簇

(1)对图像库中的任意图像k,提取k的每个像素的特征向量xi=(YI,UI,VI,e1i,e2i),i=1,2,…,nk (nk表示像素总数),对数据集x=(xundefined,xundefined,…,xundefined)T建立高斯混合模型(1)。

(2)采用算法2迭代估计模型(1)的参数,得到参数值向量kj=(πj,μj,∑j)T,j=1,2,…,Gk.(Gk表示图像k的模型分支数)。

(3)得到图像k的模型参数向量混合元mk=(k1,k2,…,kGk)。

(4)对数据集m=(mundefined,mundefined,…,mundefined)T (r表示图像总数)建立高斯混合模型(1)。

(5)采用算法2迭代估计模型(1)的参数。

(6)输出包含检索例图的簇。

2.4.2 EM算法

(1)在参数空间Θ中为Ψ选择一个合适的初始值Ψ(0),k=0;

(2)E-步:由Ψ的当前估计值Ψ(k),计算辅助函数(完整数据对数似然函数关于x的条件期望):

undefined

(3)M-步:在参数空间Θ中极大化Q(Ψ,Ψk),即:

求undefined

(4)若logL(Ψ(k+1))-logL(Ψ(k))≤ε1或‖Ψ(k+1)- Ψ(k)‖≤ε2,迭代终止,否则k←k+1,转第(2)步。

3 结束语

本文提出了一种基于高斯混合模型聚类的图像检索算法,通过对图像集二次建模,采用EM算法优化模型参数,从而检索出符合要求的图像。本文是在假设模型分支数已知和初始聚类中心已给定的情况下进行聚类的,可以通过进一步研究模型分支数选取方法和改善EM算法初始敏感性方法来提高检索精度。

摘要:通过研究聚类算法在图像处理上的应用,提出了一种基于高斯混合模型聚类的图像检索方法。该检索方法首先提取每幅图像的特征,并以特征值为数据集建立高斯混合模型,得到所有图像的高斯混合模型。再以所有图像的混合模型参数集作为数据集,用基于高斯混合模型的聚类算法进行聚类。最后输出检索例图所在的类,即得到检索结果。

关键词:图像处理,基于内容的图像检索,混合模型,聚类,EM算法

参考文献

[1]SWAIN M J,BALLARD D H.Color indexing[J].InternationalJournal of Computer Vision,1991(1).

[2]刘忠伟,章毓晋.利用局部累加直方图进行彩色图像检索[J].中国图像图形学报(A辑),1998(7).

[3]王涛,胡事民,孙家广.基于颜色-空间特征的图像检索[J].软件学报,2002(10).

[4]胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007(2).

[5]汤效琴,戴汝源.数据挖掘中聚类分析的技术方法[J].微计算机信息,2003(1).

[6]冉延平,余昭平,贾利新,等.基于混合模型的聚类算法研究[J].河南科学,2005(3).

[7]岳佳,王士同.高斯混合模型中EM算法及初始化的研究[J].微计算机信息,2006(11).

高斯核模型 篇7

在有毒气体发生泄漏之前, 准确地确定一旦发生毒气泄漏事故之后所造成的伤害范围, 有利于应急预案的编制和事故发生时的科学指挥, 能有效地减少人员的伤亡事故。笔者以高斯模型为机理, 以毒负荷为判断伤害标准, 对有毒气体发生泄漏之后的伤害范围进行研究, 并以氨气瞬间泄漏为例, 对其泄漏后各种因素对致死、重伤、致伤区域影响做出分析研究, 其研究结果对疏散预案的编制、应急响应部门的疏散指挥具有一定的参考意义。

1 高斯模型

高斯模型适用于非重气 (密度小于或等于空气的气体) 扩散, 分为烟团扩散和烟羽扩散。一般作出如下假设:毒气云团不受空气浮力的影响, 云团流动或云羽轴向蔓延速度等于环境风速;云团内部或云羽横截面上浓度等参数符合高斯分布。

当非重气瞬间泄漏时, 应使用高斯烟团扩散模型, 其毒气浓度的变化规律如式 (1) 所示:

undefined

式中:C为空气中毒气浓度, kg/m3;H为泄漏源高度, m;Q为源瞬间泄漏量, kg;V为风速, m/s;t为泄漏后的时间, s;σx、σy、σz分别为x、y和z方向的扩散系数, m。

2 伤害区域的划分

有毒气体弥漫在空气中, 如果超过一定浓度并持续一定时间, 便可能有致病、致残甚至致死的危险。毒气泄漏事故发生后, 根据有毒气体对周边的伤害程度, 将影响范围分为以下几个不同的区域:致死区, 指在这个区域内的人员, 如果没有防护, 多数人将会中毒死亡;重伤区, 指在这个区域内的人员, 将遭受重度或者中度的中毒, 须住院治疗, 个别人会中毒死亡;轻伤区, 指该区域内多数人会有中度、轻度中毒, 经门诊治疗即可康复。

3 中毒判断的标准

暴露在毒气体环境中, 引发人们中毒伤害, 通常有两种方法来衡量:浓度法和毒负荷法。

3.1 浓度法

浓度法是假定人在有毒环境中暴露一定的时间, 不同浓度的毒气对人的不同伤害。以氨气为例, 以浓度法为评价标准, 350 mg/m3以上便很难忍耐, 不能工作, 可以认为是轻伤浓度;553 mg/m3以上为强烈刺激症状, 可忍受75 s, 可以认为是重伤浓度;1.5 g/m3以上可危及生命, 可以认为是死亡浓度。

3.2 毒负荷法

根据英国卫生安全执行局的提议, 用毒负荷计算有毒气体对人的伤害程度。毒负荷是毒气浓度和接触时间的函数, 其具体定义如式 (2) 所示:

TL=∫undefinedCn (t) dt (2)

式中:TL为毒气的毒负荷, ×10-6n·min;C为毒物浓度, ×10-6;t为接触时间, min;n为幂指数, 对不同的毒气取值不同。

毒负荷法由毒气不同吸入量引发不同伤害程度的机理发展而来, 相对浓度法较为科学, 而且它可以计算变化的毒气浓度对人们的影响。笔者采用毒负荷法作为毒气致死致伤的判断依据。部分有毒气体对人体的毒害剂量如表1所示。

4 算 例

以氨气泄漏为例, 假设容器突然发生破裂导致氨气瞬间泄漏。由于高斯模型较适合应用于低风环境, 假设为一级风、大气稳定度为B;假定人的呼吸器官 (鼻孔) 距地面高度为1.55 m;在疏散过程中, 呼吸有毒气体在体内积累, 假定当积累量达到致死、重伤、轻伤毒负荷标准时, 便发生相应的伤害。以下风向5 m为步长, 横方向1 m为步长作迭代运算, 研究在不同逃跑速度、毒源高度、泄漏量下, 毒气泄漏造成的伤害范围。

4.1 疏散速度

假设1 000 kg的氨气发生瞬间泄漏, 毒源高度2 m, 在不同的疏散速度下, 有毒气体造成的各个伤害范围如表2所示。

4.2 毒源高度

假设1 000 kg氨气发生瞬间泄漏, 逃跑速度3 m/s, 在不同的毒源高度下, 有毒气体造成各个伤害范围如表3所示。

4.3 泄漏量对伤害范围的影响

假设毒源高度为2 m, 逃跑速度3 m/s, 在不同的泄漏量下, 有毒气体造成各个伤害范围如表4所示。

毒气扩散造成的伤害范围成桃叶状, 其下风向距离和横风向最宽宽度的大小与泄漏量和泄漏发生时条件有关。以1 000 kg的氨气突然泄漏为例, 在毒源高度为2 m, 逃跑速度为3 m/s的情况下, 造成的伤害范围如图1所示。

5 结 论

基于上述研究, 可以得到如下结论:

(1) 疏散速度显著影响伤害区域的大小。在伤害威胁潜在区域内的人员及时迅速地疏散, 能有效地减小动态疏散中人员发生致死致伤的区域;疏散速度对下风向和横风向的影响程度相当。

(2) 毒源高度对伤害区域影响不大。其中, 对死亡区域和重伤区域的影响相对比对轻伤区域的影响大一些。

(3) 泄漏量对伤害区域影响较大。泄漏量的增加, 能显著增加下风向的伤害距离和横风向的伤害宽度, 从而使伤害范围显著增大。

(4) 笔者所述的伤亡区域, 均是人群及时疏散时可能有伤亡事故发生的区域范围, 在实际应急预案的编制、疏散指挥中, 应参照浓度法计算的结果综合考虑。

摘要:利用高斯模型中有毒气体瞬间泄漏模型, 采用动态计算方法, 在有毒气体扩散和人员动态疏散过程中, 以毒负荷为伤亡基准, 研究有毒气体发生瞬间泄漏时, 逃跑速度、毒源高度和泄漏量对毒气造成的致死区域、重伤区域和轻伤区域大小的影响。为毒气泄漏事故发生时应急响应部门的疏散指挥提供一定的参考。

关键词:高斯模型,有毒气体,毒负荷,疏散,伤害范围

参考文献

[1]宇德明.易燃、易爆、有毒危险品储运过程定量风险评估[M].北京:中国铁道出版社, 2000.

[2]董华, 刘忠.舰船火灾中烟气沿通道蔓延特性的计算机模拟[J].火灾科学, 1995, 4 (2) :74-77.

[3]周国强.大气污染扩散 (高斯) 模式简易推导法的研究[J].洛阳大学学报, 1994, 9 (2) :30-34.

[4]杜建科.毒气泄漏过程及其危险区域分析[J].中国安全科学学报, 2002, 12 (6) :55-59.

[5]周波, 张国枢.有害物质泄漏扩散的数值模拟[J].工业安全与环保, 2005, 31 (10) :42-44.

[6]潘旭海, 蒋军成.液氯泄漏事故模拟分析[J].工业安全与环保, 2003, 29 (3) :30-32.

高斯核模型 篇8

通信和信号处理理论一般建立在高斯噪声基础上。在一般电子设备中, 把噪声看成高斯噪声是足够准确的;在一些复杂环境中, 影响信号接收的很多噪声为非高斯噪声, 混合高斯模型可以精确拟合非高斯噪声。二阶统计量 (相关函数和功率谱) 存在一些缺点, 如他们对加性噪声敏感, 不能辨识非最小相位系统等, 为了克服这些缺点, 需使用三阶或更高阶统计量进行分析。高阶统计量已成为信号处理的一种有利的数学工具。在此, 主要研究混合高斯模型的高阶统计量, 特别讨论二元混合高斯模型[1], 给出理论值, 通过Matlab仿真验证其理论值的正确性, 并讨论概率分布情况。

1混合高斯模型

所谓混合高斯模型, 是指概率密度函数为各高斯概率的加权和。它的概率密度函数可以表示成:

F (x) =i=1mpi1δi2πexp{- (x-bi) 22δi2} (1)

式中:pi为第i个高斯分量的加权系数, 且i=1mpi=1;每个高斯分量N (bi, δi) 的均值为bi, 标准方差为δi;m为混合高斯阶数。

下面从以下几个混合高斯模型讨论分析:

(1) m元混合高斯模型 (m>2) 。相同方差的概率密度为:

F (x) =i=1mpi1δ2πexp{- (x-bi) 22δ2} (2)

式中:pi服从均匀分布pi=1/m或二项分布pi=cmi/2m (1, 2, …, m) 时为多模噪声[2]。一般当b>4δ时, 可把高斯噪声模型迭加码间干扰看成多模噪声[2,3]。

(2) m元高斯混合模型 (m>2) 。相同均值的概率密度函数为:

F (x) =i=1mpi1δi2πexp{- (x-b) 22δi2} (3)

这可以看成是单模噪声[2,3]。

(3) 二元混合高斯模型 (m=2) 。概率密度为:

F (x) =i=12pi1δi2πexp{- (x-bi) 22δi2} (4)

式中:p1+p2=1, 可以分为相同均值和相同方差讨论, 这与双模噪声[2,3]相一致。

2高阶统计量

高阶统计量[4,5,6]是高阶统计量和高阶谱的统称, 一般包括高阶矩、高阶累积量、高阶矩谱和高阶统计量谱四种主要统计量。

这里主要运用高阶矩和中心矩混合高斯模型进行分析研究。

2.1 高阶矩和中心矩

随机变量x的第一特征函数为:

Φ (ω) =E[ejωx]=-+ejωxF (x) dx (5)

高阶矩为:

mk= (-j) k[-+ejωxF (x) dx] (k) |ω=0= (-j) k (i=1mpiejωbi-ω2δi22) (k) |ω=0= (-j) ki=1mpil=1kckl (ejωbi) (l) (e-ω2δi22) (k-l) |ω=0= (-j) ki=1mpil=1kckl[1+ (-1) k-l2]×1×3 (k-l-1) (jbi) (l) (jδi) (k-l) =i=1mpil=1kckl[1+ (-1) k-l2]×1×3 (k-l-1) (bi) (l) (δi) (k-l) (6)

则:

m1=i=1mpibi, m2=i=1mpi (bi2+δi2) m3=i=1mp1 (bi3+3δi2bi) m4=i=1mpi (bi4+6δi2bi2+3δi4) (7)

中心矩为:

μ2=E[ (x-Ex) 2]=m2-m12μ3=E[ (x-Ex) 3]=m3-3m2m1+2m13 (8) μ4=E[ (x-Ex) 4]=m4-4m3m1+6m2m12-3m14

针对二元混合高斯模型:

相同均值时:

m1=bm2=b2+p1δ12+p2δ22m3=b3+3b (δ12+δ22) m4=b4+6b2 (δ12+δ22) +3p1δ14+3p2δ24 (9)

相同方差时:

m1=p1b1+p2b2m2=δ2+p1b12+p2b22m3=p1b13+p2b23+3δ2 (b1+b2) m4=p1b14+p2b24+6δ2 (b12+b22) +3δ4 (10)

2.2 斜度和峰度

在信号的高阶统计分析中, 常对信号x (t) 的高阶统计量某个特殊切片感兴趣。

斜度:对任何一个信号, 斜度为零, 服从对称分布。

s=μ3/μ23/2 (11)

峰度:衡量一个信号的分布偏离对称分布的歪斜程度。

k=μ4/μ22-3 (12)

3仿真实例

仿真二元混合高斯模型[7]。数据获取如图1所示, 即:rand (0, 1) 随机产生一个数据α, 当α<p1时, 从N (b1, δ1) 中取一个数据;当α>p1时, 从N (b2, δ2) 中取一个数据, 组成2 000个数据, 进行1 500组试验, 取其平均结果。

二元混合高斯模型中, 由图2和表1可知, 在相同均值时, 始终服从单模分布, 是对称分布;当|δ1-δ2|逐渐变小时, 峰度值接近零, 越靠近高斯性。图3和表2可知, 在相同方差时, pi=1/2 (i=1, 2) ;当|b1-b2|逐渐增加时, 由单模变成双模, 峰度值远离零, 远离高斯性, 始终服从对称分布;当b>δ时, 是双模噪声。

4结语

通过比较混合高斯模型的高阶统计量理论值和仿真值, 验证理论值的正确性。在通信和信号处理中, 混合高斯模型显得尤为重要。采用高阶统计分析方法可知概率分布情形, 很多应用中都要求概率分布是对称分布等一些特殊分布, 当峰度值接近高斯模型峰度值零时, 可以当作高斯噪声处理。在此给通信理论中混合高斯模型的研究做补充。

摘要:以高阶统计量数学分析方法, 对混合高斯模型进行研究, 并给出理论计算结果。重点讨论二元混合高斯模型, 给出高阶统计量的理论值, 用Matlab仿真不同方差和不同均值时多膜性、对称性和斜度值、峰度值的估计结果, 并比较斜度值、峰度值的理论结果和仿真结果, 验证理论结果的正确性, 为通信理论中混合高斯模型的研究做补充。

关键词:混合高斯模型,高阶统计量,二元混合高斯模型,峰度值,斜度值

参考文献

[1]王红军, 田铮, 武新乾.二元正态混合高斯模型的偏度与峰度[J].系统仿真学报, 2008 (4) :855-857.

[2]山拜.达拉拜, 黄玉划.几类非高斯噪声的转换研究[J].电子学报, 2004, 32 (7) :1 091-1 093.

[3]В.А.Чердынцев, С.Далабаев.ПриемСигналовнаФонеПомех.Белорусскийгосударственныйуниверситетинформатикиирадиоэлектроники[Z].1995.

[4]王明慈, 沈恒范.概率论与数理统计[M].北京:高等教育出版社, 1999.

[5]张贤达.现代信号处理[M].北京:清华大学出版社, 1995.

[6]张贤达.时间序列分析——高阶统计量方法[M].北京:清华大学出版社, 1996.

[7]飞思科技产品研发中心.Matlab 7辅助信号处理技术与应用[M].北京:电子工业出版社, 2005.

高斯核模型 篇9

在背景减除的实时视频监控及运动目标检测与跟踪领域中经常采用混合高斯方法为背景建模。混合高斯背景模型是一些高斯函数的加权和,能够描述像素的双峰或多峰状态,能够对比较复杂、光照缓慢变化和存在小幅度重复运动的背景(喷泉、摇动的树木、雨雪天气等情况)准确建模。前期的研究者通常采用EM算法估计混合高斯模型参数,但由于EM算法固有的缺陷[1]限制了其应用,目前GMM基本采用在线K均值估计的统计建模方法。文献[2]中背景模型的学习与更新都采用一个小的常量α,虽能保证背景模型的稳定性,但影响了高斯成分的收敛速度,对于动态背景的适应能力较差。文献[3]对学习率因子做了改进,将它与时间建立联系,使学习算法具有了自适应性,提高了收敛速度。文献[4]结合EM算法推导了基于最大后验概率准则的高斯模型参数迭代公式,该算法虽具有较好的适应性和分割效果,缺点是计算复杂并且选取合适的参数比较困难。采用背景减除得到的前景目标通常包含运动阴影,且与物体轮廓相连。如果不进行阴影抑制,会使分割得到的物体变形,甚至使物体通过阴影合并产生欠分割问题,从而影响进一步的分析。文献[5]在HSV颜色空间中,根据阴影使背景变暗、背景在被阴影覆盖前后的亮度比值成近似线性、阴影不会使背景像素的色度有很大改变的特点,进行阴影抑制。文献[6]采用归一化颜色分量结合亮度信息进行阴影检测与抑制,文献[7]对多种阴影检测抑制算法进行了全面的分类比较。然而,基于以上方法在去除阴影的同时损失了那些比阴影更暗或者与阴影具有相似特性的前景点,导致目标出现破碎和空洞。

本文提出了一种有效的混合高斯模型的自适应背景更新算法,通过对背景模型的学习与更新、高斯分布生成准则等方面的改进和优化,采用基于形态学重构的阴影消除方法使得前景目标分割的性能得到了有效地提高。

2 混合高斯模型

在RGB色彩空间对每一像素点进行混合高斯建模,混合高斯模型使用K个高斯模型来表征图像中各个像素点的特征。设用来描述每个点颜色分布的K个高斯分布分别具有不同的权值ωi,t(Σωi,t=1,i=1,2,……,K),它们总是按照优先级(ω/σ)从高到低的次序排序。取定适当的背景权值部分和阈值T,只有在此阈值之内的前若干个分布才被认为是背景分布,其它则是前景分布。

设xt为t时刻的某一像素值,其概率密度函数能写成K个高斯分布的线性组合:

其中:ωi,t、µi,t和Covi,t分别为在t时刻第i个高斯分布的权值、均值和协方差矩阵。从计算角度考虑,协方差矩阵经常记为

K个高斯分布按ω/σ降序排列,仅仅取前面的B个高斯分布表示背景分布,即

其中T为背景阈值。

3 基于GMM的视频分割算法

3.1 参数初始化

与已有GMM不同的是,图像各像素点不采用固定个数的高斯分布描述,而是根据各点像素值出现的混乱程度采取不同个数的高斯分布,一部分变化很小或是保持静态的像素只需一个高斯分布就可描述,其他变化较大的非静态点可根据实际情况用多个高斯分布表示。这样可以提高计算效率,保证算法的实时性。算法设定描述每个像素点的最大高斯分布个数为Kmax=4。首先初始化背景模型,每个像素点高斯模型个数初始设定为K=1,第一帧各点像素值用来初始化高斯分布均值µK,0,标准方差σ取相对较大的值(σK,0=20),混合高斯权重为1/Kmax。

3.2 背景模型的学习与更新

在检测前景点时,按照优先级次序ω/σ从大到小将xt与各高斯分布逐一匹配,若没有表示背景模型的高斯分布与xt匹配,则判定该点为前景点,否则为背景点。若检测时没有找到任何高斯分布与xt匹配,则按照新高斯分布生成准则进行相应处理。具体实现如下:

1)匹配准则

已存在的K个高斯分布参数按优先级与当前像素值xt进行逐一匹配检测,即判别是否满足|µi,t-xt|

2)背景学习与更新

背景学习与更新采用相同的迭代等式同时进行。用当前观测值与已存在的第i个高斯模型匹配,如果成功则按下式更新匹配的第i个高斯模型分布参数:

其中:对于没有匹配成功的高斯分布,其µ、σ保持不变。K个高斯分布的权重按下式更新:

式(5)中其中对于匹配的高斯成分Mi,t=1,其他不匹配的K-1个成分Mi,t=0。在更新完高斯分布的参数和各分布权值后,还要对各个分布重新计算优先级和排序,并确定背景分布的数目。从式(4)-(5)可以看出,α决定高斯成分权重的更新速度,确定各个在背景中的优先级,α越小,背景成分越稳定;β决定背景的更新速度,β越大,背景成分收敛速度越快。实验中发现α取较小的值,β取一个相对较大的值,可以较好地在提高收敛速率的同时保持背景模型的稳定性。

3)新高斯分布生成准则

如果已存在的K个高斯分布与当前像素都不匹配,且满足K

其中:常数Term用来控制前景像素保持静止后被融入为背景的时间,变量c用来计数,计算观测值与新的高斯分布匹配的次数。当新分布权重更新增大到阈值Tω时,则将以迭代更新的均值、方差和权重为参数的高斯分布代替原有成分中权重最小的一个。这个较大的权重Tω可以保证新加入的分布能够成为稳定的背景成分。最后,当新高斯成分成为背景模型后,计数参数c清零,并对新的K个权值重新进行规一化。

3.3 光照突变检测和像素点的自动更新

实验表明,光照的突变(如开、关灯)将引起场景中几乎所有像素点亮度值发生较大改变。如果仍然按照前面得到的混合高斯分布对单个像素分别处理,大面积背景点就会被误判为前景。为避免此种情况,我们的方法是,统计当前帧中像素值变化较大的像素点个数,若像素个数大于整幅图像像素个数的60%,则对整幅图像所有的像素优先级最大的高斯分布的参数同时进行替换,用当前帧图像像素值代替均值,权重取较大的值(max(ωt,i))以保证新的分布成为稳定的背景成分,标准差取为20。上述方法能较好地解决了光照的突变问题,实现背景的及时更新,同时也实现了新的光照条件下前景目标的分割。

4 阴影的检测与消除

HSV颜色空间中H表示色度,S表示饱和度,V表示亮度,反映了人的视觉系统感知色彩的方式,比RGB颜色空间能更准确地检测出阴影。我们采用HSV色彩空间的非模型判决方法[8]实现阴影检测。其理论依据是,阴影处的亮度与饱和度较背景暗,而色彩基本保持不变。由如下决策公式,判断像素点是否为阴影:

其中:IH(x,y)、IS(x,y)、IV(x,y)与BH(x,y)、BS(x,y)、BV(x,y)分别表示(x,y)处像素值I(x,y)与背景像素值的H、S、V分量。参数0<αS<βS<1,αS取值要考虑阴影的强度,背景上投射的阴影越强,αS越小;βS用来增强对噪声的鲁棒性。参数τS、τH的选取则主要凭经验调试。算法中αS=0.4,βS=1,τS=0,τH=50。

按上述方法对背景混合高斯建模,对新来的各像素点按背景分布进行匹配判别,得到分割前景目标后的二值图像模板Morg。对Morg进行3×3形态学开运算去除孤立噪声点,结果记为Ms。Morg经去阴影处理后,得到的仅包含前景点的二值图像记为M。由于去阴影过程将前景中比阴影更暗或与阴影有相似特性的某些像素点误判为阴影去除掉,导致部分前景像素的丢失。为尽可能保留更多的前景目标,可采取基于形态学目标重构[9]的处理方法:

其中:F是经前景分割、阴影去除和目标重构后最终的分割结果,SE为结构元素,其尺寸依赖于目标的大小,试验表明,7×7的结构元素可以达到较好的效果。

5 实验结果与结论

为兼顾算法收敛速度和背景模型的稳定性,α、β分别取较小和相对较大的值0.005、0.2;为使得前景像素保持静止后被融入为背景的时间适中,Term取100左右比较合适;背景阈值T取0.4可较好确定背景模型。上述选定的阈值和参数能适用于光照不同、背景复杂程度不同的各类室内、外场景。为了验证文中算法的有效性,分别对标准序列(160×120)和自拍序列(320×240)进行了测试并与文献[2]中的算法作了比较。图1(a)~(d)为标准序列原图,(e)~(h)是采用文献[2]中算法对各序列的分割结果,(i)~(l)是文中所述算法对各序列的分割结果。对于图1(a)Waving Trees序列而言,(e)中错误分割比较严重,相当一部分摇动的树枝被判为前景,而(i)分割的效果显然要好得多。图1(b)、(c)和(d)分别对应Light Switch序列正常光照、关灯和再次开灯的情况,比较(f)、(j)可知,我们的算法分割目标更完整,并且很好地解决了显示屏闪烁的问题。值得注意的是,由于本文算法考虑了光照突变的情况,所以即使出现随机、反复的开、关灯的情形,也能比较准确的进行前景分割,分割结果如图1(k)、(l)所示。相反,一般方法不能正确处理光照突变,如图1(g)、(h)所示,当开、关灯后出现大面积被误判成前景的白点和虚影,检测效果很不理想。

图2(a)~(c)是自拍的室内、外场景,(d)~(f)是文献[2]中算法的分割结果,(g)~(i)是本文所述算法的分割结果,再经式(7)、(8)去除阴影后的最终结果如(j)~(l)所示。对比两种算法的分割结果可以看出本文算法分割效果更优。从图2(j)~(l)可以看出,基于形态学重构的阴影消除方法可以比较干净的去除阴影,前景目标基本上没有损失。从算法效率上比较,在用图2视频序列测试时,文献[2]中算法的平均视频处理速度为156.1ms/帧,而本文方法的视频处理速度可达为102.8ms/帧,单帧处理时间减少了50%左右。表1对图2中3种视频序列的计算时间作了比较(运行条件VC++6.0,P4 3.06G CPU,512M Memory)。

本文提出了一种新的基于GMM的视频分割算法,对背景模型的学习与更新、高斯分布生成准则的改进和优化,兼顾了背景稳定性与模型收敛速度。考虑了亮度突变的情况,实现背景的及时更新。采用了基于形态学重构的阴影消除方法,在有效去除阴影的同时最大程度地保留了前景目标。对各种实际场景序列的实验分析表明,该算法有效地提高前景目标分割的性能,具有更强的适应性。

参考文献

[1]Zivkovic Z,van der Heijden F.Recursive unsupervised learning of finite mixture models[J].IEEE Trans.on PAMI,2004,26(5):651–656.

[2]Stauffer C,Grimson W.Adaptive background mixture models for real-time tracking[J].Proc.of IEEE Int.Conf.on CVPR,1999,2:246-252.

[3]Dar-shyang Lee.Effective Gaussian mixture learning for video background subtraction[J].IEEE Trans.on PAMI,2005,27(5):827-832.

[4]Cheng J.Flexible background mixture models for foreground segmentation[J].Image and Vision Computing,2006,24:473-482.

[5]Bai Sheng C,Yun Qi L.Indoor and outdoor people detection and shadow suppression by exploiting HSV color information[C]//Proceedings of the Fourth International Conference on Computer and Information Technology.Wuhan,China:IEEE Computer Society,2004:137-142.

[6]McKenna S J.Tracking groups of people[J].CVIU,2000,80:42-56.

[7]Prati A,Mikic I.Detecting moving shadows:algorithms and evaluation[J].IEEE Trans.on PAMI,2003,25(7):918-923.

[8]Cucchiara R.Improving shadow suppression in moving object detection with HSV color information[J].Proc of Intel.Transportation Systems Conf,2001:334-339.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【高斯核模型】相关文章:

混合高斯模型05-20

读高斯有感04-24

高斯背景建模05-23

高斯定理本科论文04-11

高斯数学家04-20

高斯_数学论文04-20

高斯的调查英语日记04-21

数学家高斯的介绍07-16

线性二次高斯控制06-30

数学家高斯个人简介08-26

上一篇:网络贷款平台下一篇:现代精细化工发展