Otsu自适应阈值

2024-07-02

Otsu自适应阈值（精选八篇）

Otsu自适应阈值篇1

关键词：CDF9-7小波,自适应Otsu算法,视频字幕,图像分割

0 引言

视频是依据人眼视觉暂留原理, 存储的看上去平滑连续而实际上动态捕捉的一系列的静态照片, 已经成为互联网上除文字、声音之外最重要的媒体形式, 对其自动分析与理解已经成为当前网络监管的重要研究内容。视频图像中的文字隐含了非常丰富的高层语义信息, 对其分割、定位、识别、理解和检索具有重要的现实意义。从这些处理步骤来讲, 分割和定位操作是字符识别、理解和检索等高层处理的基础, 直接影响着高层处理的成功率和精确度。字幕作为视频中最重要的文字, 有的以独立的字幕文件存在, 而有的被嵌入在视频图像中。独立存在的字幕文件往往仅包含时间区间和文本信息, 比较容易处理, 而嵌入在视频图像中的字幕就必须首先进行图像分割操作, 然后采用适当算法定位这些文字的区域。

图像分割就是把图像分解成有限个感兴趣的和特质相关的区域的一种操作, 是图像分析、理解和识别操作的基础, 因此研究人员从各个学科出发, 提出并不断改进了很多图像分割方法。目前主要的分割方法有基于阈值设定、基于边缘检测、基于区域、基于聚类分析、基于模糊集理论[1], 以及基于群体智能[2]等众多分割方法。这些算法各有优缺点, 存在的主要问题是适用范围的局限性和较低的准确性及鲁棒性。本文提出的CDF9-7小波变换结合自适应Otsu算法的视频图像分割方法, 对于视频图像中字幕区域的分割效果良好。

1 视频图像分割步骤

本文给出的分割方法总体来说有三步。首先, 先从视频中获取视频图像, 对彩色图像则要进行去噪和灰度化等预处理。目的在于尽可能削弱图像背景级噪声对字幕文字的相关性。然后, 对预处理后的图像进行CDF9-7 小波变换, 获取其水平和垂直方向的高频分量HH。因为CDF9-7 小波是满足线性相位要求的非常适用于图像处理的双正交小波, 而视频字幕区域背景和字幕颜色往往对比度高, 边缘信息和高频分量丰富。最后, 使用自适应Otsu算法找出该高频分量中的最佳阈值, 分割出图像中包含字幕文字的有效区域。

1.1 CDF9-7 小波

9-7小波是一个双正交小波[3], 其正交性体现在母小波ψ及其对偶母小波之间, ψ和本身没有正交性, 即, 对应地其尺度函数Φ及其对偶尺度函数也满足正交关系, 即, ψ和构成一对L2 (R) 空间的双正交小波基。正交小波可视为是在时的双正交小波的特例。虽然相对正交小波, 9-7双正交小波正交性放宽或者说变弱, 但是它具有很好的对称性和线性相位特性。其滤波器系数获取可以通过求解约束PR条件得到。但约束条件毕竟只是必要条件, 为使无穷乘积收敛, Cohen、Daubechies和Feauveau提出了以它们名字首字母命名的CDF方法, 在求解时增加了新的消失矩条件, 求解出了系数和没有消失矩条件略有不同的9-7小波, 可记为CDF9-7小波。这种小波除了原有的对称性和线性相位这些优点外, 支撑区间变小且收敛更快, 正是由于CDF9-7小波的这些优秀特征, 因而被广泛用于图像处理等领域, 目前已经成为了JPEG 2000有损图像压缩标准中的默认小波。但在具体实现中, 由于图像数据量往往很大, 为提高运行效率, 往往并不直接采用离散小波变换的快速算法 (MALLAT算法) , 而是对CDF9-7小波进行提升实现, 在同等条件下, 运算速度和效率较MALLAT算法提高2倍。

CDF9-7小波对二维图像变换的步骤是, 首先用分析滤波器对图像 (记为cj+1l, n) 的列做小波变换, 得到低频部分和高频部分。然后对低频部分的行做小波变换, 得到低频中的低频分量cjk, m (记为LL) 和低频中的高频分量dj, 1k, m (记为HL) ;对高频部分的行做小波变换, 得到高频中的低频分量dj, 2k, m (记为LH) 和高频中的高频分量dj, 3k, m (记为HH) 。以上分解也可以先做行小波变换再做列小波变换, 结果相同。最后, 图像经一级分解后由如下4块区域组成:

多级分解可以持续对LL分量 (图像概貌) 进行, 最终图像变成塔式结构, 为区分每个小块, 一般需要对LL等块添加代表分解级数的下标。由于一般的视频字幕文字区域与背景 (往往纯色) 存在比较强的边缘, 对比度高, 边缘信息和高频分量本身非常丰富, 因此, 经过分解后, 利于图像分割的信息主要集中在高频中的高频分量HH中;多级分解必然是对上次分解的低频分量LL进行, 本身隐含的视频字幕文字区域信息很少。经过多种条件下的反复测试, 在准确率基本一致的情况下, 多级分解运算量大幅度提高, 并无必要, 对预处理后的图像只需要使用CDF9-7 小波变换进行了一级分解即可。即完成一级分解得到的HH1送做后续处理, 其他3 块数据暂时不用。

1.2 自适应Otsu算法

经过CDF9-7 小波分解后的图像区域HH1滤除了原视频图像中的低频信息, 隐含了大量视频图像的高频边缘信息, 但并没有对图像进行分割, 同时由于图像背景的复杂性, 视频图像字幕区域之外的部分仍然存在很多对比度高的边缘信息, 因而必须采用相应的方法进行分割和判定。

传统的Otsu算法一般被认为是图像阈值方式分割中阈值选取的“最佳算法”, 也可以称为最大类间差法或大津算法[4]。这种算法计算简单, 受图像对比度和亮度影响较小, 因而在图像分割领域应用广泛。其基本理论是按图像的灰度特性, 寻找出灰度范围在0~ L- 1 之间共L个灰度级的图像的使得类间方差d最大的最佳阈值t , 小于t的像素集归为背景, 大于t的像素集归为前景。用数学方法描述即为: t = max (d) , d = bp (t) * (be (t) - u) 2+ fp (t) * ( fe (t) - u) 2, 其中变量:bp为取最佳阈值时背景总的像素点占整幅图像的比例 (概率) ;be为取最佳阈值时背景总的像素点灰度值的均值;fp为取最佳阈值时前景总的像素点占整幅图像的比例 (概率) ;fe为取最佳阈值时前景总的像素点灰度值的均值;u为整幅图像像素点灰度值的均值。使以上表达式值最大的t , 即为分割图像的最佳阈值。类间方差越大, 则背景和前景的差别越大, 类间方差越小, 则背景和前景的差别越小。造成类间方差变小的原因主要是阈值计算不当, 使得部分背景错分为前景或部分前景错分为背景, 因此, 最佳阈值的选择至关重要。

这种算法虽然简单且效果较好, 但是也有一些显著缺陷。主要有:

(1) 最佳阈值的选取必须遍历图像整个灰度范围0~L - 1 内的所有像素, 逐个计算类间方差d并找出使类间方差最大的t, 运算量大, 难以满足视频图像中字幕区域的分割这样的实时系统应用;

(2) 阈值选取是在整个视频图像范围进行计算, 而实际视频帧图像本身灰度分布动态变化且受到各种噪声的干扰, 仅利用灰度直方图得到的阈值难以得到满意的图像字幕区域分割结果。

为此, 在视频图像中字幕区域图像分割这样的实时应用中, 针对以上两点不足, 考虑到视频图像字幕区域往往集中在视频图像下部, 甚至有的字幕区域背景还是纯色或少量噪声的实际, 提出了一种自适应的Otsu算法。设某视频图像分辨率 (宽×高) 为m× n (如640×480, 1 280×720 等) , 共L个灰度级, 其基本方法步骤是:首先, 根据图像高度, 自适应地确定字幕区域的高度范围, 截取字幕区域子图像并结合根据sum (第k行像素值) 等于或约等于m × L, 用软件简单计算, 自适应地判别上述字幕区域背景是否为纯色 (如白和黑) 或近似纯色。好处是, 最佳阈值t的选取局限在较小区域, 大幅度降低了运算量;然后, 选择字幕区域子图像灰度值中位数作为“最佳阈值”或传统的Otsu算法遍历出最佳阈值。特别地, 对字幕区域中字符和背景为纯色或近似纯色的情况, 即使有噪声, 灰度个数或灰度级L也非常小, 传统的Otsu算法可以极快找出最佳阈值, 甚至可以直接灰度值中位数作为“最佳阈值”, 两种方案都可以进一步降低运算量, 真正满足实时系统要求;最后, 使用上述最佳阈值对整幅视频图像进行分割。

2 实验及结果

实验全部在Matlab 2009b下编程完成, 数据为常见的电影、新闻和动画。目前, 对于图像分割效果的评价, 没有统一的客观数量指标[5], 本文的评价指标设定为传统的Otsu算法求出的最佳阈值和自适应Otsu算法求出的最佳阈值之间的差值td, 传统的Otsu算法耗时减去自适应Otsu算法耗时的时间差jl。以从电影《第五元素》中截取的一个视频图像为实例, 其分辨率为560×315, 宽高比为16∶9, 经过对比计算td等于3, 可见阈值差别很小;jl等于80 ms, 如果将整个2 小时5 分钟的整个视频累积, 则总的jl近590 s, 可见自适应Otsu算法效率和实时性显著提升。作为实例的视频图像按自适应Otsu算法所得阈值进行图像分割的结果如图1 所示。从实验结果看出, 改进的算法令人满意。

3 结语

本研究提出的基于CDF9-7 小波分析和自适应Otsu算法的视频图像分割方法, 较其他分割方法大幅度降低了运算量, 高效易行, 满足实时性需求并具有一定的鲁棒性。以这些区域为基础, 可以进一步完成诸如视频文字区域定位等图像分析、理解和识别操作。但由于视频图像背景的复杂性, 算法的准确性及鲁棒性仍需进一步提升。

参考文献

[1]何俊, 葛红.王玉峰.图像分割算法研究综述[J].计算机工程与科学, 2009 (12) :58-61.

[2]马苗, 刘艳丽.图像分割背景下群体智能优化算法的性能对比[J].云南大学学报:自然科学版, 2012 (4) :401-407.

[3]刘在德, 常晋义, 沈钧毅.一类双正交插值小波的参数化构造及图像编码应用[J].中国图象图形学报, 2010 (4) :557-564.

[4]胡敏, 宋银龙.基于二维Otsu和模糊聚类的图像分割算法[J].计算机应用研究, 2012 (4) :1563-1565.

[5]邓廷权, 焦颖颖.图像分割质量评价的二型模糊集方法[J].计算机工程与应用, 2011 (32) :217-220.

二维Otsu阈值分割算法的改进篇2

关键词：图像分割；阈值分割；Otsu算法

中图分类号：TP312

在图像处理、模式识别和计算机视觉领域，图像分割对于许多图像分析和处理的任务来说是一个基石。因为人们往往仅对图像中的某些部分感兴趣，所以希望将这些相关区域分离并提取出来以进行进一步的应用，如进行特征提取和测量。图像分割是解决此类问题的方法。图像分割是把图像分成各具特征的区域并提取出感兴趣目标的技术和过程。图像分割技术是一项计算机领域里的经典的研究课题，计算机视觉中的图像理解包括目标检测、特征提取和目标识别等，都依赖图像分割的质量。

因为分割质量的好坏将直接影响图像处理的后续工作的进行，所以对图像分割的研究一直是图像技术研究中的热点和难点之一。到目前为止已经出现了许多图像分割技术，如：基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。其中阈值分割算法是应用在图像分割领域的最流行的技术。阈值分割是最早提出的图像分割方法之一，具有简单、快速的优点。阈值分割算法的基本思想是通过处于图像灰度取值范围之中的灰度阈值将图像划分成不同的区域，从而达到分割的目的，其中最常见的一种方法，是将图像划分为两部分，即前景和背景。阈值分割的关键是阈值的选取。阈值分割算法具有悠久的历史，并广泛应用于图像分析与目标识别等方面。常用的阈值分割算法有最小误差法、最大类间方差法、P-tile法、双峰法、灰度直方图凹度分析法、最大熵法与Otsu方法等。

在这些阈值分割算法中，Otsu法是最流行的方法之一。由于Otsu法拥有计算简单、实时性高、鲁棒性强等优点，所以被广泛使用。Otsu法是由日本人大津首先提出的，也称“大津阈值法”或“最大类间方差法”。该方法是基于图像中前景和背景两类别的可分离性提出的。在一些免费的或是商业的软件上，如GIMP或是MATLAB，都采用Otsu法来进行图像的自动阈值分割。在图像阈值分割中，确定最佳的阈值t*往往是基于估计的位置和散度。像其他的方法一样，Otsu方法采用取样的方式和样本分布的偏差来估计位置和散度。然而，如果这些图像的分布是非常倾斜的或是有异常数据等情况出现时，Otsu分割算法提供的结果通常不令人满意。为了解决这一问题，我们提出了一种基于中值的Otsu分割方法，并且它与原来的Otsu方法相比可以得到非常令人满意的结果。

假设在灰度值为L的灰度图像中，灰度值为i的像素个数用ni表示，总的像素个数用n表示；pi表示灰度图像中灰度值i出现的频率，则pi=ni/n。将图像中的像素按灰度值用阈值t分成两类，设为C0和C1，其中C0={0，1，…，t}，C1={t+1，t+2，…，L-1}。

则这两类像素出现的概率分别是：

ω0= pi= ω（t），ω1= pi=1- ω（t）

这两类像素出现的均值分别是：

μ0= i = ，μ1= i =

图像总均值表示为：

而且我们可以发现：

设ω0和ω1代表前景和背景的概率。μ0，μ1，μT表示前景，背景和整个图像的灰度值的平均值。设表示两类的类间方差，则

最终，最佳阈值t*为

传统的二维Otsu法是通过均值来确定最佳阈值，对于那些直方图呈双峰分布的图像，该算法具有十分优秀的分割效果。然而，因为均值的鲁棒性较差，若直方图是单峰的或是接近单峰的时候，亦或是有异常数据时会失败。

我们知道，当直方图的分布是倾斜的，或当有异常数据等情况出现时，中值比均值具有更强的鲁棒性。所以我们用中值来代替原式中的均值，以尝试获得更好的阈值和分割结果。

原式中的μ0，μ1，μT可以被中值m0，m1，mT所替代，于是在C0和C1的类间方差可以重写为

最优的阈值t*为

在验证本文的实验中，传统的Otsu方法和我们改进的Otsu方法都在Visual C++ 2008软件上进行测试，应用的计算机的CPU型号是AMD Athlon 7750 Dual-Core 2.7GHz，内存是2G RAM，系统是Windows XP platform。通过实验我们可以发现改进的Otsu方法得到的阈值分割的结果是令人满意的，而传统的Otsu方法得到的阈值分割的结果并不理想。

结论：在本文中，我们提出了一种基于中值的Otsu图像阈值分割算法。传统的二维Otsu方法对于双峰分布的直方图提供了令人满意的结果，但是，如果直方图是单峰的或是接近单峰时所得到的结果并不理想。我们知道，当直方图的分布是倾斜的，或当有异常数据等情况出现时，中值比均值具有更强的鲁棒性。在这样的情况下，我们用中值取代均值来进行背景和前景以及整个图像的Otsu法分割。与原来的Otsu方法相比，这种方法提供了更优的阈值和令人满意的阈值分割的结果。

参考文献：

[1]W Niblack.An Introduction to Digital Image Processing[M].Prentice Hall，Englewood Cliffs，NJ，1986：115-116.

[2]J Sauvola and M Pietikainen.Adaptive Document Image Binarization[J].Pattern Recognition，2000，33（2）：225-236.

[3]B Gatos，I Pratikakis and S J Perantonis.Adaptive Degraded Document Image Binarization[J].Pattern Recognition，2006，39（3）：317-327.

[4]F Moghaddam and M Cheriet.A Multi-scale Framework for Adaptive Binarization of Degraded Document Images[J].Pattern Recognition，2010，43（6）：2186-2198.

[5]C H Chou，W H Lin and F Chang.A Binarization Method with Learning-build Rules for Document Images Produced by Cameras[J].Pattern Recognition，2010，43（4）：1518-1530.

[6]Y T Pai，Y F Chang and S J Ruan.Adaptive Thresholding Algorithm：Efficient Computation Technique Based on Intelligent Block Detection for Degraded Document Images[J].Pattern Recognition，2010，43（9）：3177-3187.

[7]Chierr Hsing.Chou，Werr Hsiung Lin，Fu Chang.A binarization method with learning build rules for document images produced by cameras[J].Pattern Recognition，2010，43（4）：1508-1530.

作者簡介：杨小鹿（1991-），男，吉林省长春市人，本科，研究方向：计算机科学与技术学院。

Otsu自适应阈值篇3

边缘检测是图像分析与计算机视觉领域一直研究的热点, 传统的边缘检测算子如Roberts、Sobel、Prewitt、Kirsch、LOG、Canny等, 由于算法自身存在着种种不足, 在实际应用中效果并不十分理想。1986年, John Canny提出了最佳边缘检测算子的3个准则, 并推导出了一个最优边缘检测算子的近似实现———Canny算法[1]。Canny算子具有比较好的检测效果, 并得到了广泛的应用, 但是在应用Canny进行边缘检测时, 一方面, 应用高斯滤波器对原图像进行滤波后, 在一定程度上对噪声起到了抑制作用, 却也对图像的边缘信息进行了平滑, 使得边缘信息丢失;另一方面, 在进行边缘点的选取时, 需要人工设定高低两个阈值, 当光照或场景发生变化时, 需要人工来改变此双阈值, 这使得Canny算法不具有自适应性。

针对Canny算法存在的上述问题, 许多学者提出了自己的改进算法。针对采用高斯滤波器可能造成原图像的边缘信息丢失问题, 文献[2]提出采用中值滤波代替高斯平滑滤波, 并对混有椒盐噪声的图像进行处理, 取得了比较好的效果;文献[3]提出自适应空间域平滑方式清除图像的椒盐噪声, 达到了较好的去噪效果。另外, 针对双阈值设定方面, 文献[4]提出了基于梯度幅值直方图和类内方差最小化自适应高低阈值的方法, 针对不同的图像实现双阈值自适应提取, 并证明了其算法的有效性;文献[3]提出用图像的灰度共生矩阵的惯性矩阵特征值自适应调整高斯函数的空间系数和边缘检测阈值, 实现了图像的边缘提取, 但对条件的限制比较苛刻。针对Canny算法存在的问题, 文献[2-5]在一定条件和一定程度上解决了传统Canny算子在平滑过程中丢失边缘信息的问题或双阈值自适应确定的问题, 但还有待于进一步提高和完善。

1 传统Canny算法

1.1 Canny算法的实现

在文献[1]中, John Canny认为一个最优的边缘检测算子应该满足以下的3个准则:

(1) 信噪比最大化准则, 即不漏检真实的边缘, 也要减少将非边缘点判为边缘点输出, 这个准则使输出的边缘信息信噪比最大化。

(2) 定位性能最优准则, 即检测出来的边缘点要尽可能地接近真实边缘的位置。

(3) 边缘响应准则, 即单一的边缘只有唯一的响应, 并且对虚假的边缘响应予以最大的抑制。

在图像的边缘检测中, 抑制噪声和边缘检测是无法同时满足的, 边缘检测算子通过平滑滤波滤除噪声的同时也增加了边缘的不确定性;反之, 提高边缘检测算子对边缘敏感性的同时, 也提高了对噪声的敏感性。Canny算子在抗噪与精确定位间寻求了一种折中方案[2], 推导出了最优边缘检测算子的一个近似实现, 即边界点位于图像被高斯函数平滑后的梯度幅值极大点上。

1.2 Canny算法的缺陷分析

传统Canny算子虽然是基于最优化思想推导出来的边缘检测算子, 但在实际应用中不一定最优。该算子采用高斯滤波器对图像进行平滑处理, 在具有较强噪声抑制能力的同时, 也将一些高频的边缘给平滑掉了, 造成了边缘信息的丢失。另外, Canny算子的高、低阈值是由人工设定的, 且需要依据先验经验, 进行多次反复试验才能找到合适的值。实际的图像可能受光照、场景等变化因素的影响, 高低阈值是变化的, Canny算子不具有自适应性, 在很多情况下难以得到比较满意的检测结果。

2 改进的Canny算法

2.1 双边滤波

传统的Canny算法采用高斯滤波器对原图像进行平滑处理, 在抑制噪声的同时, 也平滑了图像的边缘信息。1998年, C.Tomasi和R.Manduchi提出了双边滤波。双边滤波在处理相邻各像素的灰度时, 不仅考虑了空间的邻近关系, 也考虑了灰度的相似关系, 通过对二者的非线性组合, 自适应滤波得到平滑图像。双边滤波的特点是对图像的每一点用其空间相邻其灰度相近的像素平均值代替原来的值, 从而达到滤波效果。在图像变换平缓的区域, 一个小的邻域内图像的灰度变化不大, 近似为常数, 这时双边滤波就转化为标准的低通空域滤波器。而在图像变化剧烈的区域, 滤波器用边缘点邻域内灰度相似的像素点的灰度平均值代替原来的灰度值[6]。双边滤波既可以达到滤波的效果, 又可以保持图像边缘的细节, 是一种很有应用价值的滤波方法。

2.2 OTSU自适应确定阈值

OTSU是一种使类间方差最大的自动确定阈值的方法。其基本思想是根据图像灰度特性, 将图像像素分为背景和前景两部分, 使他们的类间方差最大, 从而得到分割的最佳阈值。对于一幅M×N图像I (x, y) , 前景 (即目标) 和背景的分割阈值记作T, 属于前景的像素点数占整幅图像的比例记为w1, 其平均灰度u1;背景像素点数占整幅图像的比例为w2, 其平均灰度为u2。图像的总平均灰度记为u, 类间方差记为g, 则有:

将式 (5) 代入式 (6) 中得:

再用遍历法求出使g最大的阈值T, T即是待求的最优阈值, 令其为滞后阈值的高阈值, 再用以下公式求得低阈值:

其中, k (一般情况下2

2.3 改进的自适应阈值Canny算法步骤

(1) 双边滤波。应用双边滤波对图像进行去噪处理, 双边滤波在处理相邻各像素的灰度时, 不仅考虑了空间的邻近关系, 也考虑了灰度的相似关系。通过对二者的非线性组合, 自适应滤波得到平滑图像, 该处理不仅滤除了大量噪声, 而且保留了图像的边缘信息。

(2) 计算梯度幅值和方向。经过“双边滤波”处理后, 计算滤波后图像的梯度、方向、幅值。

(3) 进行非极大值抑制。在该过程中Canny算法使用3×3大小的窗口在8个方向的领域对M[i, j]的所有沿梯度方向进行梯度幅值的插值, 然后在每一点上, 领域的中心像素m[i, j]与梯度方向上相邻两个像素比较, 如果小于相邻梯度的两个幅值, 则将其标记为0, 否则标记为1, 这一过程就把M[i, j]多点细化为了一个元素宽度, 保留了精确的梯度幅值[3]。

(4) 自适应确定双阈值, 并进行边缘检测与连接。计算梯度直方图, 应用OTSU算法计算双阈值Th和Tl, 然后开始扫描图像, 对边缘图像中标记为候选边缘的任一像素点 (i, j) 进行检测, 若点 (i, j) 的梯度幅值G (i, j) 大于高阈值Th, 则认为一定是边缘点;若点 (i, j) 梯度幅值G (i, j) 小于低阈值Tl, 则认为该点一定不是边缘点;而对于梯度幅值G (i, j) 位于Th和Tl之间的像素点, 则将其看作疑似边缘点, 再进一步依据边缘的连通性进行判断, 若该像素点的邻接像素中有边缘点, 则认为该点也是边缘点, 否则该点为非边缘点。

该改进的自适应阈值Canny算法是基于双边滤波和梯度幅值类间方差最大化的算法, 在一定程度上解决了Canny算法存在的两个问题。

3 实验结果与分析

改进的自适应阈值Canny算法用Visual C++6.0及Opencv1.0实现, 实验中选取了多组图片 (下面只列出2组图片) 进行测试, 与传统的Canny算法对比, 其实验结果如图1所示。

通过对上述实验结果进行对比分析, 可以看出文中提出的改进的自适应阈值Canny边缘检测算法更好地解决了传统Canny算法存在的在平滑过程中丢失边缘信息的问题和双阈值自适应确定的问题, 而且对光照的变化和场景变化具有很强的自适应能力, 取得了较满意的效果。

4 结语

对传统的Canny算子存在的缺陷进行分析, 提出了基于双边滤波和梯度幅值类间方差最大化自适应确定高低阈值的改进方法。改进的算法首先应用双边滤波对图像进行处理, 不仅对图像的噪声进行了很好的抑制, 而且边缘的高频信息得到了很好的保留;然后应用类间方差最大算法 (OSTU) 自适应确定Canny算子的高低阈值。实验结果表明, 该改进的算法很好地解决了传统Canny算法存在的缺陷, 而且对光照的变化和场景变化具有很强的自适应能力, 进一步扩展了Canny算法的应用范围。

参考文献

[1]JOHN CANNY.A computational approach to edge detection[J].IEEE Trans.Pattern Analysis and Machine Intellegence, 1986, 6 (8) :679-698.

[2]张彬, 司璇, 金飞, 等.一种改进型Canny图像边缘检测方法[J].中国传媒大学学报:自然科学版, 2011, 18 (2) :39-42.

[3]张振亚, 白治江, 王成道.自适应Canny边缘检测算法[J].上海海运学院学报, 2003, 24 (4) :373-377.

[4]李牧, 闫继红, 李戈, 等.自适应Canny算子边缘检测技术[J].哈尔滨工程大学学报, 2007, 28 (9) :1002-1007.

[5]吕哲, 王福利, 常玉清.一种改进的Canny边缘检测算法[J].东北大学学报:自然科学版, 2007, 28 (12) :1681-1684.

Otsu自适应阈值篇4

边缘是图像灰度发生突变的区域, 包含了图像的主要信息。图像边缘是图像的基本特征, 是图像分割、图像理解的主要依据[1]。传统的边缘检测方法主要是微分边缘检测算子, 主要从图像边缘点灰度的突变着手, 求解图像一阶或二阶梯度来获得图像边缘, 经典算子有Sobel算子、Roberts算子、Pre- witt算子、LoG算子和Canny算子等[2]。这些传统的边缘检测算子虽然运行简单, 但对梯度的操作都使它们对噪声比较敏感, 边缘容易被噪声污染。SUSAN算法[3]是属于角点检测算法中的一种, 1997年由牛津大学的Smith提出, 由于其独特的USAN原理, 是一种基于灰度差的算子。SUSAN检测的突出优点是具有很好的定位效果, 检测精确, 对局部噪声不敏感, 抗噪能力强, 计算速度快。因此该算法自提出以来受到众多学者研究和应用。对于SUSAN算法的改进, 大多数学者主要集中在相似度阈值t上, 提出了很多的改进[4,5,6,7,8], 但是几何阈值也起到了至关重要的作用, 决定了检测到边缘的粗细程度, 本文就是从几何阈值上进行改进, 提高了传统SU- SAN算法的边缘检测性能。

1 传统 SUSAN 算法

SUSAN算法一般选37像素近似圆形模板, 模板的中心点定义为核。将模板内所有像素点都和核进行灰度的相似度比较, 若灰度差值小于一定阈值, 认为该点和核相似, 模板内和核相似像素点构成的区域称为USAN区域。

USAN主要区域形状如图1所示, 当模板完全处于背景中时 ( 如图1中a) , USAN区域的面积最大; 当模板向目标区域移动时, USAN区域面积将会减少; 当模板的中心点在目标边缘上时 ( 如图1中c和d) , USAN区域将会进一步变小, 为模板面积的1 /2; 进入目标边缘后, USAN区域又会逐步变大 ( 如图1中b) , 当模板继续向目标区域移动, 全部进入目标区域时 ( 如图1中h) , USAN区域面积又将变为最大。其中, 若模板中心为角点时 ( 如图1中e, f, g) , USAN区域面积最小, 约为1 /4。

SUSAN算法的计算过程如下:

相似度计算:

式中, I ( r 0 ) 为模板中心像素的灰度值; I ( r) 为模板中心像素点外其他某一像素点; c ( r, r 0 ) 为相似比较函数; t为相似度比较阈值, 一般取20 ~ 50, 本实验中取t = 25。有比式 ( 1) 更合适的比较函数[9], 如下:

USAN值计算如式 ( 3) 所示:

计算初始边缘响应:

SUSAN算法在边缘检测中几何阈值g设置为

2 SUSAN 边缘检测算法的改进

2. 1 算法原理

几何阈值g的取值决定了边缘的粗细程度, 若g取值偏大, 提取的边缘厚度较宽; 若取值偏小, 边缘会较细, 漏检边缘也会较多。在传统SUSAN算法中, 几何阈值都是通过USAN原理和实验经验设定的固定值。但在实际应用中, 图像的最佳几何阈值不是固定的数值。因此如果找到每幅图片的合适的几何阈值将会改善算法的检测效果。

几何阈值g用于USAN面积判决, 因此自适应g的调整从USAN面积着手。遍历图像的所有像素对各像素的USAN面积进行统计, 建立一个横坐标为USAN大小, 纵坐标为该USAN值大小的像素点数的统计图。该图描述的是图像边缘强度的信息, 图像中边缘点远少于非边缘点, 因此图像中非边缘点在图中会聚集在一起形成一个峰值, 在该图中其他区域分布比较均匀没有明显的谷底。最大间类方差法具有统计意义上的最佳分割阈值, 具有分割效果好、自适应性强的优势, 因此考虑用最大间类方差来选择合适的阈值g, 把USAN值比较大的非边缘区域和USAN值相对小的边缘区域分割出来。

同时考虑孤立噪声的影响, 若图像的孤立噪声点较多, 那么在USAN面积统计图中, USAN值小的区域会聚集大量的点, 形成一个峰值, 因此也可以用最大间类方差法来自适应选择一个阈值g来把US- AN值偏小的噪声点和真正的边缘点分割开来。

本文改进算法是通过用Otsu算法对USAN面积求解了3次计算获得的3个几何阈值将图像分为4个区域: 噪声点和边缘点混叠区 ( S 1 ) 、边缘点区 ( S 2 ) 、边缘点和非边缘点混叠区 ( S 3 ) 和非边缘点区 ( S 4 ) 。然后对S 1 和S 3 区域进行进一步边缘判决 ( 如果该点八邻域内有点在S 2 区域则将该点移入S 2 ) 和局部非极大值抑制来将S 3 区域划分到S 2 和S 4 中, 将S 1 中边缘点聚类到S 2 中, 最后用获得的2个自适应阈值g 2 和g 3 来代替原SUSAN算法中固定g对S 2 区域中的点进行初始边缘响应计算来获得边缘。

2. 2 最大间类方差法分割几何阈值过程

设某点的USAN值为m, 则m共有N max 个不同的等级, n i 表示USAN面积为i的像素个数, 设P i 是USAN值为i的像素点出现的概率, 则有

假设一个阈值分割k, 0 < k < N max - 1, 把图像中的分成C 1 和C 2 两类, 其中C 1 由USNA面积在[0, k ]之间像素组成, 表示边缘点的USAN面积集合, C 2 则由USAN面积在[k +1, N max - 1]之间的像素组成, 表示非边缘点的USAN面积集合, 则有

边缘区域C 1 占的比例为:

C 1 区域均值:

非边缘区域C 2 占整体图像中的比例为:

C 2 区域均值:

整体USAN面积统计均值μk 为:

类间方差定义为:

当类间方差σ2 B 最大时, 分割效果最好, 此时所对应的阈值g 1 即为最优阈值。g 1 将图像的USAN区域划分为2块: 边缘点区和非边缘区域, 对于这2块区域再分别用Otsu算法进行计算获得另外2个几何阈值g 2 和g 3 。

3 实验结果

为了验证算法的有效性, 用2组图像进行实验, 人物图像如图2所示, 加入强椒盐噪声的简单几何图像如图3所示。图2中分别采用Canny算子, 传统SUSAN算子和本文自适应几何阈值改进的SU- SAN算子进行实验比较, 图3验证抗噪性, 由于Canny算子抗噪性以及边缘检测的效果明显没有SUSAN算法好, 因此省略了Canny算子的实验结果图, 增加了文献[10]中提出的增加固定几何阈值下限来抑制噪声的SUSAN改进算法, 各算法的实验效果如图2和图3所示。

从图2中可以看出, SUSAN算法边缘检测效果比传统边缘检测算子中的Canny算子检测效果要好, 不过传统SUSAN算子的检测结果在边缘上比较粗, 而本文改进的SUSAN算子检测结果相比之下边缘更细和平滑, 并且连续性好。图3 ( b) 表明即使传统的SUSAN算法具有不错的抗噪性, 但是在强椒盐噪声情况下还是力不从心, 图3 ( c) 是文献[10]的几何阈值改进算法, 在实验中该阈值下限为8, 可以看出结果和传统SUSAN算法相比有了很大的提高。图3 ( d) 是本文提出的自适应几何阈值改进的SU- SAN算法, 可以看出改进后的SUSAN算法基本不受噪声的影响, 只有若干小区域的噪声未被滤除掉, 处理效果最好。

4 结束语

根据传统SUSAN边缘检测的缺陷, 通过对SU- SAN算法的研究, 在固定几何阈值的设定上进行自适应改进。通过对图像所有像素点USAN面积进行最大间类方差算法来多次分割图像获得几何阈值, 并通过边缘的判决和非局部极大值抑制来将图像中的像素点进行分类, 找出边缘点集, 然后在对边缘点集里的点采用双阈值来进行SUSAN的边缘初始响应计算获得边缘。该算法是根据每幅图像的特点自适应获得相对更优化的几何阈值, 因此比传统SU- SAN算法具有更好的检测效果。实验也证明该边缘检测算法效果良好, 同时具有更好的抗噪性。

参考文献

[1]MALLAT S, ZHONG S.Characterizations of Signals from Multiscale Edges[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992, 14 (7) :710-732.

[2]冈萨雷斯, 伍兹.数字图像处理 (第3版) [M].北京:电子工业出版社, 2012:454-461.

[3]SMITH S, BRADY M.A New Approach to Low Level Image Processing[J].International Journal of Computer Vision, 1997, 23 (l) :45-78.

[4]刘博, 仲思东.一种基于自适应阈值的SUSAN角点提取方法[J].红外技术, 2006, 28 (6) :331-333.

[5]VINCENTE, LAGANIRE R.Detecting and Matching Feature Points[J].Journal of Visual Communication and Image Representation, 2005, 16 (1) :38-54

[6]何微, 邓小炼.自适应阈值的遥感影像角点提取算法[J].遥感信息, 2011 (6) :23-27.

[7]YU Jin-hua, TAN Jing-lu, WANG Yuan-yuan.Ultrasound Speckle Reduction by a Susan-controlled Anisotropic Diffusion Method[J].Pattern Recognition, 2010, 43 (9) :3 083-3 092.

[8]徐垚.SUSAN算法的几点改进[J].信息技术, 2011 (11) :142-145.

[9]HARRIS C, STPHENS M.A Combined Corner and Edge Detector[C]∥Proc 4th Alvey Vision Conference, 1988:189-192.

软硬阈值结合的自适应图像降噪算法篇5

一、Contourlet多方向多尺度分析

Contourlet滤波器组有一个相关联的连续域的扩展。通过多分辨率分析框架, 将精确地建立起离散Contourlet变换和连续域Contourlet变换扩展之间的联系。这里的多分辨率分析框架与小波和滤波器组之间的连接相类似[4]。新的框架中包含了多方向分析以及它与多分辨率分析之间的关系。为简单起见, 仅对正交滤波器进行讨论。这种情况下, 框架是紧支的。双正交滤波器有相似的结果。

首先, 对联合Laplacian金字塔 (LP) 进行多尺度 (分辨率) 分析。假设Contourlet滤波器组的LP采用的是正交滤波器, 每一维都进行下采样为2的操作。在正常条件下, 在迭代的LP中, 低通合成滤波一种特殊的阶函数, 该函数满足下面这个二阶等式[4,5]:

其次, 在迭代的Contourlet滤波器组中, 方向滤波器组的离散基可以看作为前面多分辨率分析的连续域子空间基的变形。

二、软硬阈值结合的自适应图像降噪

如果用fi, j和gi, j分别表示原始图像和加噪图像在点 (i, j) 的灰度值, εi, j表示噪声分量, 则含噪声的图像表示为:

降噪算法步骤如下:

(1) 在原始图像中加入高斯白噪声εi, j, 与fi, j独立, 且服从分布。

(2) 通过对含噪图像进行Contourlet变换来确定对图像分解的级数l和对应分解方向数d。

(3) 确定阈值。噪声Contourlet系数在每次Contourlet变换分解时都主要集中高频区域, 并且其在各个方向子带上具有不同的噪声分布。增加分解尺度, 信号在高频区域中逐渐增多, 噪声逐渐减少, 并且该变化的增减成一定倍数。

由于信号Contourlet系数决定于Contourlet系数绝对值, 则对Contourlet系数绝对值进行排序, 由此确定各层各方向的最佳阈值位置。

(4) 对前述分解系数采用软硬阈值函数结合方式进行阈值处理, 得到新的图像降噪的阈值处理函数。而在小波变换图像降噪中, 权值μ的值通常取0.5。则有以下公式:

新的阈值函数降噪后的图像较硬, 视觉质量均有所提高。

(5) 对降噪后的图像进行Contourlet逆变换即可得到降噪后的图像。

三、实验分析及总结

选用软件MATLAB R2007a版本搭建实验环境, 采用“pkva”方向性滤波器及“9-7”金字塔滤波器, 对大小为512×512的“zoneplate”图像进行测试。评价标准采用了客观标准信噪比SNR[6]。通过图像对比, 显然新降噪方法在保留了较好的视觉效果的同时, 缓解了部分伪吉布斯现象。而且对纹理丰富的图像有更好的降噪效果。

软硬阈值相结合的图像降噪方法, 将软硬阈值函数相结合, 采用自适应多阈值的方法对图像进行降噪处理。该方法用不同的阈值对应不同尺度不同方向, 并结合了软硬阈值函数的优点, 提高的ISNR值。实验表明, 该方法能在更好的保留了图像的细节和纹理的同时, 有效地去除图像中的随机白噪声, 并且减轻了应阈值的伪吉布斯现象, 得到了更清晰的视觉效果, 图像信噪比得到了提高。该方法更实用于处理信息丰富的图像。

摘要：Contourlet变换具有多尺度多方向的特性, 它采用类似线段的基结构来逼近源图像, 在图像处理的工程中有较高的使用率。本文利用这一特性, 将软硬阈值函数相结合, 采用自适应阈值的方式对图像进行降噪。该方法充分考虑图像在纹理、方向和尺度上的不同, 根据尺度和方向的不同, 选择不同阈值, 保留了软硬阈值函数的优点, 提高了降噪后的图像的信噪比, 且图像的纹理信息得到了有效的保留, 降噪后的图像的视觉效果更好。

关键词：软阈值,硬阈值,Contourlet变换,多尺度多方向,图像降噪

参考文献

[1]方辉, 郑春燕, 尹忠科.一种改进Contourlet变换的图像去噪算法[J].计算机工程与应用, 2010, 46 (17) :197-199.

[2]曾业战, 钱盛友, 刘畅, 王岐学.非下采样Contourlet变换自适应图像去噪方法[J].计算机工程与应用, 2010, 46 (10) :157-159.

[3]杨帆, 赵瑞珍, 胡绍海.基于Contourlet系数相关特性的自适应图像去噪算法[J].光学学报, 2009, 29 (2) :357-361.

[4]S.Mallat.A Wavelet Tour of Signal Processing[M].2nd ed.New York:Academic, 1999.

[5]Vetterli M., Kova civic J..Wavelets and Subband Coding, Englewood Cliffs[M].NJ:Prentice-Hall, 1995.

Otsu自适应阈值篇6

1 车道检测流程简述

在常规的基于数字图像的车道检测中, 采集到的原始图像往往含有较大的噪声。因此需要先对原始图像进行滤波降噪, 本系统采用滑动滤波算法, 首先将图像看成是一个二维矩阵, 在图像中选取一个4×4的子矩阵, 然后求取矩阵中所有元素的平均值, 并作为矩阵中各元素滤波后的新值, 接着平移该子矩阵并按上述方法计算, 直到将图像中所有的像素点都计算完为止。这种方法对周期性的干扰消除效果较好。进过滤波处理以后, 图像中的高斯噪声基本被去除。针对图像中存在的梯形失真和桶形失真需要进行相应的校正。然后需要对图像进行二值化, 这样可以方便对图像的进一步处理。二值化前首先需要确定图像的阈值, 然后以阈值作为临界点, 遍历图像中的所有像素值, 做简单的比较, 大于阈值的区域认为是白色, 小于阈值的区域认为是黑色。进过这一步处理之后, 图像中只有最亮和最暗两种灰度值。然后根据该图像提取出标志线的位置, 并计算出中线的的位置。这样就实现了对车道标志线的提取和检测。

2 基于均值法的自适应阈值算法

该算法的具体实现过程是, 首先遍历校正后图像的每一个像素点, 将各个像素点的灰度值全部加起来, 然后除以总的像素点的量。这种算法实际上是求得图像中所有像素灰度的平均值, 并将平均值作为图像的阈值。这种算法较为简单, 实现起来也比较方便, 但是由于图像的分辨率通常较高, 一般都有上万个像素, 做一系列的加法和除法计算量较大, 这对实时性要求高的系统很不利。而且对系统的资源消耗较大。经过对该算法的实际验证发现, 由均值法计算出的阈值与实际情况相比往往有所偏差, 还需要根据具体情况进行校正。当环境光线变化较大时, 对系统辨识车道的能力有很大的影响。这种算法并不能很好的实现阈值的自适应。

3 基于中位数法的自适应阈值算法

该算法主要是参考统计学中中位数的计算方法实现阈值的自适应的, 具体过程如下:将校正后的图像以像素为单位, 按照灰度值从大到小的顺序将所有的像素点排列起来, 然后找到位置处于中间的两个像素点, 求这两个像素点灰度的平均值, 将该值作为阈值。在整个处理的过程中, 对性能影响最大的部分就是排序。在实验过程中, 采用的是快速排序, 在像素点为70000的情况下, 完成一次排序最少需要大概600ms, 这对该系统来说是不可忍受的。而且在计算过程中, 对资源的消耗较大。如果采用先排序再计算中位数的方法, 显然不能适用于微处理器资源有限且实时性要求较高的系统中。由于数字图像与其他的统计学中的统计量相比有很大的不同, 对数字图像的处理往往对微处理器开销较大, 但是所有像素的灰度值都在0~255这个范围之内。针对这一特点, 在软件上可以这样实现:建立一个有256个元素的一维的数组, 数组每一个元素的下标对应一个像素的灰度值, 遍历图像中的所有像素, 统计图像中每级灰度值的个数并存入对应的一维数组中, 这样就可以得到一幅图像每个灰度值的像素个数, 然后就可以通过简单的比较找到位置处于中间的像素的灰度值。通过实际验证发现, 用这种方法计算一次需要大概20ms左右, 远低于排序算法的时间。对但对微处理器资源的消耗略大。该算法还有一个问题, 当图像中出现大面积同一种颜色时, 用中位数计算阈值往往不能反映出图像亮度和黑白差别等信息, 由此计算出的阈值与期望值相比出现较大偏差, 很可能会对车道检测造成不利的影响。

4 基于大津法的自适应阈值算法

大津法是一种针对灰度图像的自适应的阈值确定方法, 其主要思想是, 按照图像的灰度特性, 将图像分成背景和前景两个部分。背景和前景的类间方差越大, 说明二者之间的差别越大。如果部分目标和前景被错分, 则会导致二者之间的类间方差减小。所以按照类间方差最大的原则进行分割, 则错分的概率最小。大津法处理的具体流程是, 首先给定图像的像素总数N, 分别统计出灰度值为0~255的像素个数Ni及每个灰度值出现的概率pi=Ni/N, 计算出图像的平均灰度值μ。分别计算以T=j (0≤j≤255) 为分割值的前景比例ω0, 背景比例ω1, 前景平均灰度μ0, 背景平均灰度μ1, 然后计算类间方差gj, 这样就可以得到最大的类间方差gk对应的分割值T, 此时分割值T就为图像的灰度阈值。这种方法计算得到的阈值较为准确, 能够很好的适应各种不同的光线环境。但总体来说计算较为复杂, 对于实时性要求较高的系统来说, 较为不利。

为了提高整个系统的实时性, 减小平均用于计算阈值的时间, 采用每采10幅图像计算一次阈值的方法, 而并不将每次采得的图像都用于计算阈值, 每次计算得到的阈值不仅用于当前图像的处理, 还用于接下来9幅图像的处理, 这样系统既减小了花在阈值计算上的时间, 同时还保证了整体的实时性。由于大津法对图像阈值变化的自适应性较强, 因此系统整体的性能较好。

5 结论

经实验及上述分析可以得到如下结论, 将基于大津法的自适应算法用于车道检测系统中, 并对算法及代码结构做一些优化后, 系统计算出的阈值对环境的适应性较好, 计算量适中。系统整体的实时性达到了预期的目标, 且车道检测的准确率较高, 因此采用大津法作为系统阈值计算的方法是合适的。

参考文献

[1]常华耀, 王军政, 陈超等.一种基于光照无关图的车道检测方法[J].北京理工大学学报, 2011.

[2]付忠良.图像阈值选取方法——Otsu方法的推广[J].计算机应用, 2000.

[3]李刚, 贺昱曜, 赵妍.基于大津法和互信息量的路面破损图像自动识别算法[J].微电子学与计算机, 2009.

[4]管欣, 贾鑫, 高振海.基于道路图像对比度——区域均匀性图分析的自适应阈值算法[J].吉林大学学报:工学版, 2008.

Otsu自适应阈值篇7

汽车是一种最常用的交通工具, 随着技术的发展, 具有自动巡航、自动泊车等功能的智能车已经开始得到了广泛地研究和应用。作为智能机器人[1]和车辆工程的一个交叉研究领域, 国内外越来越多的企业和科研院校加入了此项研究。在国内, 国防科技大学、浙江大学、清华大学等都在积极研究, 而在国外MIT率先研究出了第一台完全自主的智能车。其中视觉技术[2,3]又是智能车技术中的关键技术。其中涉及到图像数据的获取、摄像头的标定、图像处理和特征信息的提取等。

而图像阈值是图像处理中一个重要的参数, 但其值会根据光线等因素的不同而不同。本文提出可一种自适应图像阈值的算法, 解决了在实际的环境中, 由于受到光线等因素的影响而带来的阈值的变化。

2 视觉智能车辆的道路图像采集

2.1 道路特征信息的提取

本文设计的视觉智能车辆采用CMOS摄像头作为传感器。CMOS摄像头由感光处理芯片方阵排列的感光元组成, 当外部图像经镜头折射聚焦到感光芯片上时, 灰度信息转化为电压信息存储在这些感光元中, 在时钟脉冲的作用下这些电压信息顺序输出到信号线上。为了实现序列图像的同步顺序传输, 在扫描过程中加入了场同步和行同步信号。

现在国内通用的视频信号是PAL制信号, 摄像头传送的信号也都是PAL制。PAL制信号的时序如图1所示。摄像头的工作原理[4]是:以隔行扫描的方式采集图像上的点, 当扫描到某点时, 就通过图像传感芯片将该点处图像的灰度转换成与灰度对应的电压值, 然后将此电压通过视频信号端输出。当扫描完一行, 视频信号就输出一个低于最低视频信号电压的电平 (凹槽) 并保持一段时间, 这就是扫描换行的标志, 称为行同步脉冲。然后开始扫描新的一行, 直到扫描完该场的视频信号, 随后出现场消隐区。在该复合消隐脉冲中, 场同步脉冲持续时间远大于其它消隐脉冲, 它是扫描换场信号, 标志着新一场的到来。场消隐区恰好跨在上一场的结尾和下一场的开始部分, 等场消隐区过去, 下一场的视频信号才开始到来。摄像头每秒分奇偶场, 共扫描50幅图像。

本设计使用的CMOS摄像头型号为JK309B, 该摄像头的视频信号是320线, 这320行又分为奇偶场, 即每场图像只有160行。摄像头分奇偶两场, 每秒共扫描50幅图像。当一场结束后, 扫描点会从本场最后一行到下场的第一行, 这段时间场消隐区间如图1所示。场消隐区间又分为前复合消隐脉冲, 场同步脉冲, 行同步脉冲。场同步脉冲标志着下一场的到来, 场同步脉冲后第一个行同步脉冲信号后就开始新一场的开始。如图2所示, 是JK309B的视频信号在示波器中的显示波形, 根据测试同步脉冲有1.3us前无效时间和6.2us的后无效时间, 后无效信号后就是有效的图像信号, 通过ARM芯片对其进行采集。一行结束后, 再进行新一行的扫描, 如此循环, 直到320行结束。

2.2 图像采集系统的硬件系统

CMOS视频信号采样的关键是能检测出场同步和行同步信号, 否则ARM处理器将无法区分同步信号和实际图像信息信号。采用视频信号分离芯片能够识别出通用的PAL制视频信号中的场同步脉冲, 行同步脉冲和消隐脉冲, 并将其分离出来, 同时还能分辨出奇偶场信息。本设计选用了视频信号NI公司的芯片LM1881[5]。

CMOS视频信号首先经过滤波电路, 通过一个电容耦合接LM1881管脚2, 经芯片分离后管脚1输出行同步信号CS, 作为中断信号输入到ARM处理器中, 管脚3输出场同步信号VS, 是一个宽度约为230us的低电平, 也作为中断信号输入到ARM处理器中。管脚7 (O/E) 输出是奇偶场信息, 低电平表示偶场, 高电平表示奇场。分离后的信号如图3所示。具体的视频分离和采集电路如图4所示。

3 自适应图像阈值算法与分析

3.1 自适应图像阈值算法

阈值就是以某个色阶作为基准, 把所有比基准亮的像素转换为白色, 把所有比基准暗的像素转换为黑色, 从而将灰度或彩色图像转换为高对比度的黑白图像。因为视觉智能车在现场运行过程中面临的光线环境是未知的, 而对于后续的图像处理, 设置一个合适的阈值很重要, 故需动态选择区分黑白的阈值, 在陌生光线环境下对阈值进行自动的标定为以后图像处理的二值化和边缘检测提供保证。如图5是在示波器上观测的正常光线情况下白色道路黑色指引线的波形图, 黑色位置凹下去, 左右白色的位置是高度相似的;如图6在光线不理想 (偏暗) 时在示波器上观察到的一种情况, 这时左边的白色值比右边的白色值低 (称为左肩低右肩高) , 这样对于边缘的提取干扰非常的大。

有一种已被使用的方法[6]能解决光线不好的情况下, 因为在光线不好导致图像通常都会出现凸起的情形, 如图6所示.这时黑线提取算法出错几率会大大增加, 为了避免这种情况发生, 可以根据图像的变化趋势将阈值的附加上一个修正值。在左边的阈值加上一个数值, 右边的阈值则减去一个数值。修正值的计算可以大致采用如下式子算出:

为了解决这个问题, 本文提出了一种自适应光线的动态阈值的设定方法。其具体算法过程如图7所示:首先进入陌生环境先进行图像数据的采集存入二维数组ccd_test[row][line]中, 其次求出各行图像数据中图像采样值的最小差存入一维数组ccd_result中, 根据从远到近的加权系数得到自适应的阈值。然后再根据系统计算出来的阈值, 作为后续算法的参数R_th, 具体算法如下式:

其中, Ki为加权系数, 越近权值越大, 因为得到的数据越清晰。

3.2 实验与结果

通过具体实验结果如表1所示, 使用固定的阈值方法, 对光线的变化比较敏感, 抗干扰能力较为弱, 而根据一般处理处理方法校正, 在光线弱的时候效果较好, 但是在光强的时候效果比较差。用本文的自适应阈值方法, 在光线变化时能较好的工作, 抗干扰能力较强, 说明该算法是可行的。

4 结束语

本文为了解决视觉智能车在现场环境中, 光线不同从而导致固定的阈值不能适应图像处理的问题, 提出了一种自适应图像阈值的标定方法, 该算法采用智能车辆在现场环境中动态标定阈值的方法, 使智能车辆的视觉系统的抗光干扰性能得到了一定程度的提高。并且通过实验结果的分析, 证明该方法有一定的可行性。

摘要：视觉技术已经广泛地应用于智能车巡航系统中, 其中图像处理是提取道路信息的重要途径, 而图像阈值是其中一个重要的参数。文章提出一种自适应图像阈值的算法, 解决了在实际环境中, 由于受到光线等因素影响而带来的阈值变化, 实验证明效果良好。

关键词：视觉智能车,自适应,图像阈值

参考文献

[1]蔡自兴.智能控制及移动机器人研究进展[J].中南大学学报 (自然科学版) , 2005, 36 (5) :721-726.

[2]GN DeSouza, AC Kak.Vision for Mobile Robot Navigation:A Survey[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24 (2) :237-267.

[3]MH Li, BR Hong, ZS Cai, SH Piao, QC Huang.Novel indoor mobile robot navigation using monocular vision[J].Engineering Applications of Artificial Intelligence, 2008, 21:485-497.

[4]俞斯乐.电视原理[M].北京:国防工业出版社, 2005.

[5]National semiconductor.LM1881.datasheet[EB/OL].http://www.ti.com/lit/ds/symlink/lm1881.pdf, 2006.

Otsu自适应阈值篇8

在水龙头制造等行业, 产品的表面质量是一个重要的质量指标, 目前, 这类产品的表面质量检测基本上还是靠人工目测。随着机器视觉技术的快速发展, 在表面缺陷检测领域引入机器视觉技术已成为人们关注的热点。但由于不同背景下的表面缺陷特征呈现较大的差异性, 因此, 机器视觉技术中的缺陷分割、特征提取及分类识别面临着一定的困难, 如果不能正确分割缺陷, 那么特征1提取和正确分类将受到影响。图像分割算法通常分为三类:阈值分割、边缘分割、区域提取[1]。在传统的阈值分割算法的基础上, 已经发展出基于梯度的边缘强度算法、迭代阈值算法、局部多阈值算法、最小类间方差法、矩量保持法等方法[2]。由于类似水龙头的表面缺陷具有:表面成曲面光照不均匀、有高光效应、表面缺陷微小等特点, 因此这类模糊小缺陷的识别很难达到理想的效果。识别光照不均匀的表面微小缺陷时, 图像的灰度值不是很稳定, 如果直接用阈值法, 需要阈值的自动调节, 而现有的依据灰度直方图自动选择阈值的方法, 由于在有无缺陷的情况下直方图几乎一致, 很难自动寻找到适当的阈值。而人工智能的方法需要用大量的样本进行训练, 为实际的应用带来了难度。

基于以上原因, 在研究光滑反光曲面物体表面缺陷的特殊性时, 我们总结出了一种基于边缘检测的表面微小缺陷的自适应阈值分割方法。该方法先通过顶帽变换增强图像, 再利用边缘检测算子得到可能目标的边缘, 取原图像中对应边缘点的灰度均值作为分割阈值来分割图像, 可以较准确地分割出灰度值不一致的细微缺陷。

2 基于灰度阈值图像分割的基本原理

灰度阈值分割法[3]是假设每个图像都是由许多灰度值相近的像素构成的, 物体和背景之间或者不同物体之间的灰度值有明显的差别, 只要选取一个适当的灰度阈值, 然后将每个像素的灰度值和它进行比较, 将灰度点超过阈值的像素点重新分配以最大灰度 (255) , 低于阈值的像素点分配以最小灰度 (0) , 从而组成一个新的二值图像, 这样就把目标从背景中分割出来。

图像阈值化处理实质上是一种图像灰度级的非线性运算, 随着阈值的取值不同, 可以得到不同的二值图像。

选取阈值的一种方法是目视直方图[4], 根据直方图我们可以很容易地选取一个阈值来分割。另一种选择阈值的方法是反复试验, 挑选不同的阈值, 直到观察者觉得产生了较好的结果为止, 这在交互式环境下特别有效。但是很多情况下我们希望计算机能根据图像的特点自动选择一个合适的阈值来进行分割, 而不需要人为的干预[5]。因此需要一种自适应阈值选取方法。下面介绍一种经典的自适应阈值分割方法。

3 最大类间方差法 (OTSU)

OTSU算法也称最大类间差法[3], 被认为是图像分割中阈值选取的最佳算法, 由于其计算简单, 且不受图像亮度和对比度的影响, 因此在数字图像处理上得到了广泛的应用。其基本思路是按图像的灰度特性, 将图像分成背景和前景两部分, 背景和前景之间的类间方差越大, 说明构成图像的两部分的差别越大, 当前景错分为背景或背景错分为前景都会导致两部分差别变小。因此, 使类间方差最大的分割意味着错分概率最小。

设灰度图像灰度级为1-m级, 利用OTSU算法计算图像的最佳阈值为:

其中的变量说明:当分割的阈值为k时, µ为整体图像的灰度平均值, µ (k) 为阈值为k时的平均阈值, w (k) 为阈值为k的概率。使以上表达式值最大的k, 即为分割图像的最佳阈值。

研究光滑反光曲面检测表面缺陷的过程中, 我们获取的一部分缺陷图像是模糊目标, 图1为沙眼、刮伤以及漏镀等缺陷的原始图像, 图2为我们经过图像增强等预处理之后使用OTSU算法分割出的三种不同图像的分割结果:

经典方法的不足之处在于, 由于目标具有灰度值不均匀的特点, 直接利用经典的阈值分割法难以保证检测出所有的目标点。因此, 我们可以利用图像特点, 采取先对图像进行顶帽变换增强图像, 利用边缘提取算法, 提取可能目标的边缘, 取原图像中对应边缘点的灰度均值, 作为整个图像分割的阈值来进行自适应阈值分割方法。

4 自适应阈值选取方法

算法的基本原理如下:

(1) 对图像做顶帽变换[6], 得到增强图像;

对于光照不是很均匀的图像, 如果要转换为二值图像, 由于背景光不同, 将会导致有些暗背景的地方出现丢失现象。顶帽变换, 用来提取形态学梯度信息, 以抑制背景噪声, 增强目标对比度, 顶帽算法的定义为:

其中f是被测恢复图像, “o”表示形态学灰度开操作, g是结构元素。如图3所示, 对沙眼、刮伤以及漏镀等模糊背景下的缺陷不明显的图像进行了顶帽变换。结果显示, 与原图像相比顶帽变换增强了图像的对比度, 将有利于目标的提取。

(2) 用Sobel算子对增强图像做边缘检测[6];

Sobel算子是根据像素点上下、左右邻点灰度加权差, 在边缘处达到极值这一现象来检测边缘的。与其它边缘检测算子相比, 它对象素的位置的影响做了加权, 可以降低边缘模糊程度, 因此效果较好。图4为我们对具有沙眼、刮伤以及漏镀的缺陷图像进行边缘检测的结果, 可以看出, 检测出的边缘范围比O T S U算法检测出的目标范围要大, 增大了可能目标的范围。

(3) 提取原图像中对应于边缘检测中检测出的边缘点的灰度值, 求它们的均值, 利用求出的均值作为原图像的阈值进行分割, 从而将目标分割出来。这样我们进行图像分割的阈值就是利用图像的特点来选取的, 具有一定的灵活性, 满足自适应阈值分割的特点。本文算法的分割阈值可以定义为:

其中num为边缘检测中检测出的边缘点的个数, iA=f (r (i) , c (i) ) 为原图中对应边缘点的灰度值, A即为最后的分割阈值。

对于沙眼缺陷图片经过边缘检测出的边缘点数num=36, 由式 (3) 得出的分割阈值A=10;同样对于刮伤缺陷图像n u m=1 6, A=9;漏镀缺陷图像我们得到的边缘点数和阈值分别为:n u m=1 6, A=2 0。

图5为利用本文算法分割的最后结果, 由图5 (a) 可以看出, 本文方法在对沙眼缺陷图像进行分割的结果中显示出能检测出更多OTSU算法检测不到的目标;由图5 (b) 可以看出, 在对刮伤缺陷图像进行分割的时也表现出一定的优越性;由图5 (c) 可以看出, 对漏镀缺陷图像进行分割的结果比O T S U算法检测出的目标更明确。

下图为本文算法的处理过程:

从实验结果可以看出, 对于同样的目标, 图2为经典的O T S U算法下提取出的目标, 我们可以看出经典算法只能提取出比较明显的几个目标, 而不能提取出相对模糊的目标。由此可以看出, 经典的O T S U算法在文中提到的在模糊小目标的分割上有很大的局限性, 存在很多目标漏检的情况。本文算法是在利用原图像特点的基础上对分割阈值进行改进的一种算法。如图3所示, 首先我们利用顶帽变换增强了图像的对比度;然后利用Sobel边缘提取算法, 提取所有可能目标的边缘, 如图4;最后提取原图像中对应边缘点的灰度均值作为整个图像分割的阈值来提取目标, 如图5。这样就使得阈值的提取具有灵活性, 能在图像中较完整地提取出各个目标。

5 结语

本文采用先通过顶帽变换增强图像, 再利用边缘检测算子得到可能目标的边缘, 取原图像中对应边缘点的灰度均值作为分割阈值的方法来分割图像, 较准确地分割出灰度值不一致的细微缺陷。该方法是基于顶帽变换和边缘检测的自适应阈值分割方法, 具有算法简单, 效果良好, 自适应能力好等特点。将该算法应用于实际图像中, 由实验结果可见, 与OTSU算法相比, 该算法能更有效地提取出目标, 取得了比较满意的目标分割效果。同时该算法还存在有待改进之处, 其性能在一定程度上还依赖Sobel算子的边缘检测性能, 因此如何有效地获得目标边缘信息, 以及在保证算法检测性能的前提下提高算法的运行速度是我们下一步的工作方向。

参考文献

[1]卢易苏, 陈武凡.自动分割图像新方法研究[J].计算机应用研究, 2012, 29 (3) :1127～1129.

[2]陈涛, 刘献礼, 吉举正, 周洪玉.基于BP神经网络的钢球表面缺陷识别[J].机械工程师, 2010年第7期:56-57.

[3]王爱玲等.MATLABR2007-图像处理技术应用[M], 北京:电子工业出版社, 2008:165～186.

[4]岳贤军.基于梯度直方图的产品表面缺陷图像自适应阈值分割发放研究[J].南通大学学报, Vol.6, No.1, 2007.3:82-86.

[5]WANG Wen-hui, FENG Qian-jin, LIU Lei, et al.Segmentation ofbrain MR images through class-adaptive Gauss-Markov randomfield model and the EM algorithm[J].Journal of Image andGraphics, 2008, 13 (3) :488-493.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【Otsu自适应阈值】相关文章：

自适应Otsu算法06-14

系统自适应05-06

煤质自适应05-14

空间自适应05-15

自适应定位05-27

温度自适应05-28

自适应教学06-13

自适应补偿06-13

自适应抑制06-17

自适应校正06-25