基于特征

2024-08-31

基于特征(精选十篇)

基于特征 篇1

1 基于自适应加权扩展LCP的单样本人脸描述

1.1 图像分块

设样本图像为M,维数为M×N,考虑到眼睛、鼻子、嘴巴等等对人脸识别起到重要作用的部位是横向分布的,采用横向分块。设块数为q,则

设Q=M/q,Xi1(i=1,2,…,q)的维数是Q×N。

1.2 LCP模式描述

LCP模式包括方向导数模式(Directions Derivative Patterns,DDP)和方向变化幅度模式DMP,下面分别给出具体定义。

定义1:n次方向导数模式(n order DDP)DDP(n)(X0):表征中心像素点和具各个方向相邻像素n次方向导数模式,DDP(1)(X0)表示像素点X0的1次DDP。

如图2所示,设样本图像为X,X0是样本图像局部子块的中心像素,Xa(a=1,2,3,…,8)表示中心像素点X0的邻域像素。

定义2:n次方向导数Iθ(n)(X0):表示X0像素在θ方向的n次方向导数,θ可以取0°,45°,90°,135°,180°,225°,270°。

Iθ(0)(X0)表示X0像素在θ方向的0次方向导数,具体定义为

Iθ(1)(X0)表示X0像素在θ方向的1次方向导数,具体定义为

DDP(1)(X0)则表示为

f(x,y)的定义为

显而易见,DDP(0)(X0)是基础的LBP算子。

下面给出和的递推关系

得到I(n)θ(X0)的值,DDP(n)(X0)的计算公式为

定义3:n次方向变化幅度模式(DMP)DDP(n)(X0):表征中心像素点和它各个方向相邻像素n次变化幅度的趋势。

定义4:n次方向变化幅度Mθ(n)(X0):表示中心像素n次方向导数模式下,在每个方向上的幅度变化趋势的描述。

Mθ(1)(X0)的定义为

式中:|·|表示绝对值计算符号。

DDP(1)(X0)定义为

下面给出Mθ(n)(X0)和Mθ(n-1)(X0)的递推关系

于是就得到了DDP(n)(X0)的表示

定义5:n次局部综合模式(LCP)LCP(n)(X0):n次方向导数模式和n次方向变化幅度模式的融合,具体的表示如下

1次LCP运算示例如图1所示。

1.3 基于局部纹理贡献度的自适应加权

对于一个维数为M×N,灰度级别为m的数字图像f(x,y),图像的熵定义为

如果将图像分块,每个字块图像的信息熵不仅可以表示该字块的信息量还可以表示该字块细节纹理的丰富程度。基于L.Nanni[14]图像信息熵模式,局部信息熵定义为

H(·)为图像熵;w是滑动窗口尺寸;F(i,j)是以(i,j)为中心的块,F(i,j)w定义为

定义6:局部纹理贡献度CM:表征子块图像对整幅的图像的纹理贡献程度。

分块后子图像的纹理贡献度可定义为

(x+(i-1)×q,y)是第i个子块中(x,y)的值,q是总的分块数目。

2 试验结果和分析

主要将算法应用于ORL、YALE B库,ORL主要测试表情变化和部分遮挡,YALE B库测试对于光照的不变性。试验中主要对比的算法如表1所示。

%

2.1 ORL库上试验

ORL人脸库包括40个人,每个人10幅人脸,具有不同的表情、有无眼镜等变化。从每人的10幅图像中取1幅作为训练样本测试的结果如表2和图2所示。显而易见,AWELB方法的识别率要高于其他几种方法,基本的LBP方法的识别率最低,主要原因在于基本的LBP算子不能很好地描述较大尺度的特征并且对表情的变化非常敏感;LBP1、LBP2和LTP识别率比LDP和LCP低,主要原因可以归结为LDP和LCP算子考虑到了局部特征的方向性,能够多方位地描述局部特征;AWLCP的识别率高于两种LDP方法,主要因为一方面LCP比LDP的方向描述更加全面,并且考虑到了方向幅度变化的趋势,另一方面每个子块给出了重要程度的描述。分块试验中16块时识别率最高,因为分块过多或者过少,都会陷于细节或者失去细节。图2所示为1次AWLCP和2次AWLCP模式随分块变化的示意图。

%

2.2 Yale B库上试验

测试为Yale B库的部分数据,共10个人,每人100张照片,每人随机取1幅图像作为训练,试验的结果如表3和图3所示。通过表3,AWLCP方法的识别率要高于其他几种方法,主要原因和上述ORL库类似,总体识别率都比ORL库要低,主要是复杂光照会对识别率有影响。图3所示为1次AWLCP和2次AWLCP模式随分块变化的示意图,当块数为16时,识别率能达到最高。

%

3 总结

针对目前缺乏训练样本时大多数现有的算法无法达到很好效果的问题,提出了自适应局部综合特征加权的单样本人脸特征提取方法,该算法在ORL和Yale B人脸库上对部分遮挡、表情变化、光照变化等环境进行测试,并且与LBP、LBP1、LBP2、LTP、LDP1和LDP2进行比较,结果如下:

1)LCP在分块为4、8、16、32和64的条件下,以ORL库表情变化人脸为测试集,平均识别率比LBP、LTP和LDP分别提高21.39%、19.18%和8.95%;以ORL库部分遮挡人脸为测试集,平均识别率比LBP、LTP和LDP分别提高10.2%、15.9%和5.18%。

2)LCP在分块为4、8、16、32和64的条件下,以YALE库表情变化人脸为测试集,平均识别率比LBP、LTP和LDP分别提高27.07%、21.82%和15.94%;以YALE库部分遮挡人脸为测试集,平均识别率比LBP、LTP和LDP分别提高23.23%、14.91%和10%。

3)LCP在分块为4、8、16、32和64的条件下,以YALE B库复杂光照人脸为测试集,平均识别率比LBP、LTP和LDP分别提高24.48%、23.61%和0.98%。

基于BBS的网络交往特征 篇2

一段时期以来,关于网络交往特征的探讨成为学术界的热点。学者们普遍认为网络技术的易传输、高保真、容量大、处理快等特点,使网络交往呈现出新的特征。李正风等人撰文指出,赛博空间不仅影响人类认知方式的变革和文化的演进,而且“意味着人类生活观念的重大变革,这种变革与人类未来的生活方式相互促动”。它“将真正促进人类行为规则的创新,并由此推动社会生活和社会交往方式的变革”[1]。我国学者王雅林也曾指出:“网络技术的神奇功能将为人们的社会交往提供最先进的手段,无限扩大人们的交往范围,把‘天涯若比邻’变为现实,从而为人们的社会交往提供了更多的选择性、灵活性、快捷性和交往深度。”[2]史蒂夫・罗伯茨也认为,在网络空间中“物理位置是无关紧要的。真正的友谊不受条件的限制。人与人之间的友谊来自心心相应,而不是因为他们住在一个城镇。而且,通过网络,人们无需见面便可以交流关系。”[3]另一方面,社会关系也超越了阶级的限制。电脑网络作为架构人际关系的媒介,与电话有着极大的不同。它不仅可以当做私人间的通讯工具,也使得个人得以获取与传播有关公众事物的各种讯息。有的学者还认为,网络化的交往方式使个体接触到不同的文化传统,价值观和行为规范的评价,扩大和提高了个体的社会认定范围和程度,由此个体之间的同质性减少,异质性增强[4]。由此可见,学者们在互联网空间的开放性与交互性、虚拟性与沉浸性的特质,无疑为人们的交往与沟通突破这些限制提供了技术支持进而使网络交往具有新的特征方面达成了共识,但是仅仅探讨了网络交往的一般性特征。换句话说,网络技术虽然为网络交往提供了技术支持,但人们究竟将网络所提供的社会支持发挥得如何,还需实证研究加以检验,即从实证研究看,网络交往的特征还只是一个假设,而不是一个结论,或只能称之为一般性结论。因此,在网络迅速普及并成为人们另一种主要交往方式的今天,对网络交往进行全面研究,弄清网络空间中人与人之间的关系,把握网络交往的具体化特征,无疑具有重要的意义。

网络交往依托于不同的网络空间,如聊天室、电子邮箱、BBS等。在不同的网络空间中,其交往的方式也不同,因此,不能用网络交往的一般性特征加以概括。为此,从初开始,笔者以哈尔滨工业大学BBS站为个案,对BBS电子空间中的网络交往问题进行了调查研究。

BBS是高校校园局域网的重要功能之一,也是每一个高校网站的重要版面,可以说只要有网站,就必有BBS。高校BBS的功能大体一致,一般支持分类讨论区、处理信件、上鹊桥、工具箱、系统资讯、精华公布栏等内容。其中分类讨论区、处理信件、上鹊桥是BBS提供的交流场所。分类讨论区是BBS交流功能的集中体现,其意义在于任何上网的人,都可以通过自己的电脑,将自己的想法和信息张帖(Post)到分类讨论区中,让其他人分享。同时也可以通过回复主帖(Re)的形式与他人进行探讨。在Post与Re的过程中,就形成了一种特殊的互动关系――网上交往;处理信件是在该BBS范围内传递信件,其功能类似于E-mail;上鹊桥实际上是一个聊天场所,既可以支持双人密谈,也可以支持多人对谈。

本研究以哈尔滨工业大学校园网为依托。哈工大校园网于建成。哈工大校园网络提供电子邮件、文件传送、WWW浏览、拨号接入、电子公告牌等服务。

哈工大紫丁香BBS站(简称哈工大BBS)设有系统讯息、工业大学、兄弟院校、电脑技术、休闲娱乐、文学艺术、科学研究、体育运动、谈天聊地、国内转信等10大类约140余个版面。自205月30日起至目前为止,共有9282个注册用户,来访用户达189万人次,平均每天发信3000封左右。

1 研究设计

(1)理论假设及调查过程

本研究的理论假设是:基于BBS电子空间中的交往,在实现着网络交往的一般性特征的同时,具有新的特征。

研究资料的搜集工作是通过先后进行的两次网上调查完成的。第一次为试调查,时间为年12月15日。此次调查是为了全面了解和把握哈工大BBS上的互动关系状态,因此,调查将10个分类讨论区(共138个版面)作为调查范围。在对当日发布的2046份帖子进行初步分析的过程中,发现在诸如系统讯息、站内服务等一些讨论区中,并没有通过回帖的形式建立起讨论关系,因此,这些讨论区可以排除在研究的范围之外。此外还发现,回帖和主帖的间隔时间不尽相同,有的主帖在发布后的几分钟内(甚至是1分钟)立刻就有回帖应对;而有的主帖却在几天后才有人回复,在这种情况下,只选择一天作为研究的时段显然不足以反映互动关系状态。因此,根据试调查中反映出的问题,并本着“既要在内容上涵盖全面,又要体现出很强的互动关系”的原则,在进一步修改、完善了研究方案后,进行了正式调查。正式调查的时间为3月5日―3年11月。调查的范围是“工大论坛”、“飞扬的梦”、“计算机学院”、“动画漫画”、“音乐天地”、“聚会生日祝福”、“网络技术与应用”及“CAD/CAM”等8个版面。这8个版分别代表了校园生活、院系资讯、体育运动、休闲、文学艺术、交往、网络、电脑等八大分类讨论区。在这七天8个讨论区中共发帖4068份,有作者552人(包括回帖在七天内,而主帖却在七天外的作者),这552位作者就是本次调查的研究对象和样本。

(2)样本的矩阵表示

由于本研究使用社会关系矩阵法来研究BBS交往特征,因此,首先需要将通过回帖体现出的讨论关系在关系矩阵中标示出来。具体做法是:第一步,给样本编制1-552的序列号,并建立一个横行为主帖者,纵列为回帖者的552×552的关系矩阵图。第二步,将每一份帖子中反映出的讨论关系用作者编号进行矩阵的坐标表示,例如,2号回复给4号的帖子表示为(2,4);在这七天中无人回复的帖子,用(i,i)表示。例如,4号发布的某个帖子,七天中无一人回复,则此帖用(4,4)表示。第三步,将所有帖子的坐标点在552×552的关系矩阵图的相应位置标示出来,重复出现多次的坐标点按实际次数标明,没有讨论联系的记为0。以一个有4个样本构成的B网为例,如果其讨论关系如下:2号回帖给4号2个帖子,4号发布的其他3个帖子无人回复,3号所发的2个帖子无人回复,1号回帖给2号1个帖子,2号回帖给1号1个帖子,4号回复给1号1个帖子。那么,其所有帖子用坐标点依次标示为:(2,4),(2,4),(4,4),(4,4),(4,4),(3,3),(3,3),(1,2),(2,1),(4,1)。所有帖子在矩阵中的标示方法如表1所示。如此,4068份帖子中的每一份都可以在关系矩阵的相应位置标示出来,用这种方法进行标记的矩阵我们称其为矩阵A,亦是原始矩阵。由于每一个样本至少发帖一次,因此在A矩阵中,不存在其横行、纵行、对角线同时为0的情况。为了统计的方便和深入,我们矩阵A进行了转化,得到了矩阵B。具体做法是:不论讨论次数的多少,有回帖联系的记为1,无回帖联系的记为0,这实际上得到了一个0-1矩阵,也是社会网测量的标准矩阵。将表1关系转化为矩阵B,如表2所示。

(3)研究变量

规模 罗纳德・伯特认为,“网络的概念毫无疑问,也许就是其规模,规模是个人网

络最具代表性的定义。对于特定的个人、群体或是法人和公司,其网络包括所有一起直接联系的个人以及它们之间的联系。因此,特定的个人与他人之间的联系构成了他的网络规模”[5]。在表2中,与1号有讨论关系的是2人(2号和4号),因此,其规模为2。如果一个作者,他既不回复别人的帖子,其帖也不被别人回复,那么,他的交往规模为0。

表1 矩阵A

附图

表2 矩阵B

附图

密度 指讨论网中实际有的连接线数与可能有的连接线数之比。它是一个从相互有直接关系的点是多还是少的意义上来说明网中关系的密切程度的相对指标。用公式表示为:Density=∑∑Zij/N2-N(N为样本数)。本文的实际连接线数用矩阵中坐标点的个数来度量,即实际有的连接线数是该网的连接矩阵中所有格值之和。以表2为例,其密度=4/42-4=0.333。

凝聚度 它是实际有的对偶关系数与可能有的对偶关系数之比,是通过计量对偶关系相对数量来测量网络凝聚力的指标。用公式表示为:G=2×∑∑(Zij+Zji)/N2-N。本文的实际对偶关系数用互相具有回复关系,即互选关系的对数来测量。所谓个体间互选关系的对数,即个体A回帖给B,且B也有回帖给A的情况为1对。在有N个点的网中,最多可能有的对偶关系数为(N2-N)/2,实际有的对偶关系数是互相具有回帖关系的对数之和。

点出度 某一点的点出度是当连接线有方向时,自该点引出的连接线的数目。它是连接矩阵中与该点对应的行的格值之和,即一个人回复他人的人数之和。在表2中,1号的点出度为1,3号点出度为0。

点入度 某一点的点入度是当连接线有方向时,以该点为终点的连接线的数目。它是连接矩阵中与该点对应的列的格值之和,即一个人被他人回复的人数之和。在表2中,1号的点入度是2,3号的点入度则为0。

连接度 某一点的连接度是该点连接线的数目或(在连接线有方向时)进出线的总数。它是连接矩阵中与该点对应的所有格值之和。当连接线有方向时,一点连接度即为该点的点出度与点入度之和,连接度是描述一点与其他多少点有直接关系的数量指标。本文中,一个人的连接度是回复他人与被他人回复的所有人数之和,即一个人与他人进行讨论的次数。

此外,由于每一个讨论区的样本是不同的,实际上在每个讨论区中均形成了一个讨论空间,每个讨论区的样本数就是在该讨论区内的交往成员数。所选的8个讨论区合称为全部讨论区,实际上,全部讨论区是个虚拟结构。(见表3)

表3 BBS讨论区的编码

编码 讨论区名称 样本数

B0 全部讨论区   552

B1 动画漫画 32

B2 计算机学院   153

B3 CAD/CAM    22

B4 飞扬的梦 82

B5 工大论坛  301

B6 音乐天地 85

B7 聚会生日祝福 96

B8 网络技术与应用 37

2 调查结果的描述和解释

(1)BBS交往规模

从表4提供的数字可以看出,虽然各BBS讨论区的规模值存在着差异,但是经过比较也可以总结出一些共性的特征。首先,BBS讨论区的平均规模局限在5人的范围内。平均规模最大的是全部讨论区,其值为4.94;平均规模最小的是“CAD/CAM”,其值为1.18;其他各讨论区的平均规模大多集中在2-4的范围内。其次,除“CAD/CAM”和“网络技术与应用”网外,其他BBS讨论区均有20%强的调查对象在本讨论区与5个或5个以上的人进行过讨论。在“网络技术与应用”讨论区中,这部分调查对象所占的比例是10.8%,而在“CAD/CAM”讨论区中,没有调查对象与5个或5个以上的人进行过讨论。再次,在各BBS讨论区中都存在一定比例的规模值为0的成员。无疑,规模为0的讨论网成员没有与他人建立起直接的联系,亦即没有建立起讨论网络。最后,从BBS讨论规模的最大值与最小值中可以发现,有的成员与30人以上进行过讨论,有的甚至与60余人讨论过,但是,也有从未与他人进行过讨论的人。从上面的描述中我们可以发现,BBS讨论区成员的交往规模存在很大的差异。

表4 BBS的交往规模

附图

(2)BBS空间中交往的密度与凝聚度

根据密度的测度公式,在一个讨论区中,如果个体与个体之间均发生讨论关系,密度值大的网络密度高,表明个体接触到的群体规模大,亦即个体所接收的回帖内容范围广,个体从中获取的信息量亦大。反之,如果仅有少数个体之间有联系,密度值低,则该网络密度低,个体接收回帖的范围小,从中获取的信息量也小。从讨论网的密度公式可以看出,密度值D在大于0,小于等于1的范围内。从图1提供的数字看,密度值最大为0.0605,最小为0.0055。

图1还标示出了讨论网中关系的另一特征。数字表明,在低于100个样本的讨论区中(B1、B3、B4、B6、B7、B8),凝聚度值超出了10%,表明平均在100个个体中,10对以上的个体互相间有讨论往来。而在高于100个样本的讨论区中(B2、B5),凝聚度值低于6%,表明平均在100个个体中,有不到6对的个体互相间进行过讨论。实际上,根据原始矩阵的数据看,有一定数量的、互相间有讨论往来的个体的互动频次超过了一次。

附图

图1 BBS讨论区密度与凝聚度

网络密度、凝聚度的统计结果较之现实社会的交往而言,数值是较低的,其原因是多方面的。首要的原因是,在每个BBS讨论区中,可供讨论的话题多,样本的数量也较多,因此,人们可选择的讨论对象范围广,选择易分散。另一方面,即使是在样本数小的讨论区中,密度、凝聚度值也不大,这说明讨论区的发育程度还很低,没有形成稳定的持续的论题。由于现实社会中的交往关系是个体间的讨论关系构成的相对稳定的体系,因而,其密度、凝聚度是较稳定的,可是,在BBS电子空间中,这种讨论关系的建立随着讨论话题的变化而变化,因此,其密度、凝聚度亦是动态的,其密度、凝聚度的即时状态取决于BBS电子空间中的成员所发布的讨论话题是否能够引起他人的普遍关注。

(3)BBS讨论网的点出度、点入度与连接度

表5描述的是BBS空间中成员间的点出度、点入度与连接度的情况。首先,根据点出度值可以看出,无论在哪个BBS空间中,都有一些人从未给他人发过回帖,这部分人所占的比例在“CAD/CAM”网最高,达到了36.4%,在“聚会生日祝福”和“工大论坛”讨论区最低,分别占17.7%和17.6%;给5个以上的人发过回帖的成员所占的比例,在“聚会生日祝福”讨论区中最高,达到了18.7%,而在“CAD/CAM”讨论区中,没有成员给5个以上的人发过回帖。

其次,根据点入度值也可以看出,无论在哪个BBS讨论区中,

都有成员从没有收到过他人的回帖,这部分成员所占的比例在“CAD/CAM”讨论区中最高,达到了50%,最低的在“聚会生日祝福”讨论区中,也超过了20%,可见,有相当比例的成员所确立的讨论话题没有人参与;收到5人以上回帖的成员所占的比例在“聚会生日祝福”讨论区中最高,为22.9%,在“CAD/CAM”讨论区中,没有人收到过5位以上人的回帖。

最后,根据连接度值可以看出,与人进行过五次以上讨论的成员所占的比例最多的是在“飞扬的梦”讨论区中,占38.0%;比例最少的是在CAD/CAM讨论区中,占9.1%;无论在哪个BBS讨论区中,与他人进行过一次讨论的成员所占的比例最大,这进一步体现出了BBS成员交往范围的特点。值得注意的是,连接度值为0的成员所占的比例等同于规模为0(见表3)的成员所占的比例,这是因为在BBS空间中没有与他人发生过讨论联系的成员是固定的。

BBS空间中成员交往的点出度、点入度和连接度值在一定程度上反映了其成员讨论关系的构成状态,有些成员是通过回复他人的帖子来建立起自己的讨论网络,而有的成员却依靠被动的接受他人的回帖来形成自己的讨论网络,也有的成员兼而有之。那么在BBS电子空间中,点出度和点入度对于讨论关系的建立,哪一个具有更大的意义?经过对表4的数据比较发现,在数值为0的情况下,无论在哪个BBS电子空间中,其成员的点入度所占的比例均大于点出度。这表明BBS电子空间中,成员中的多数人的讨论关系是通过回复他人的帖子而不是通过接收他人的回帖实现的。

3 结论

通过对本次实证调查数据的初步分析可以看出,在BBS电子空间中进行交往的成员在交往的规模、交往的连接方式等等方面都具有鲜明的特质。这是与互连网交往空间的开放性、交互性、虚拟性等特征紧密相关的。但我们所关心的,并不仅仅通过实证数据对互联网交往的一般性特征的进一步验证,而是在于在BBS电子空间中的交往关系结构究竟在何种程度上实现着网络交往的特点,具有怎样的特质?这就需要我们在实证研究的基础上,从社会学视角出发,对基于BBS电子空间的.交往特征进行深层的分析和理论上的阐释。

(1)BBS互动关系实质是一种新型的动态人际关系

在社会心理学中,人际关系大多被定义为个体与他人之间的心理距离和行为倾向。“个体之间的关系大多是由人与人之间的互动建立起来的,蕴涵着各种各样内容的关系。”[6]但是因特网的出现,为人们形成新型的人际关系提供了工具性支持。根据人际关系的定义,在BBS电子空间中,由成员间的讨论所形成的互动关系结构,实质上是网络时代人际关系的一种新的形式――网上人际关系。从网上人际关系形成的前提看,它不同于现实社会中基于血缘、地缘、业源形成的网络式结构,而是通过网络互动产生和扩展出来的一种“网缘性”社会关系。网上人际关系的结构,随着作者的变化而不断发生着变化,因此,与现实社会相比,它是动态的,欠稳定的、弹性的结构。

(2)交往对象的选择性:无限与有限的统一

网络技术的易传输、高保真、容量大、处理快等特点,协助人类超越时间、地理空间上的限制,扩大了交往的规模,增加了交往的频率,加快了交往的速度。在这个意义上可以说,“个人正通过网络逐步地走向全球化”,正如社会学家吉登斯所说:“在高度现代性的条件下,自我认同和全球化中的转型,是地方性和全球性的辩证法的两极……由高度现代性所导入的时空分延的层次如此广阔,以致‘自我’和‘社会’在人类历史中首次在全球性的背景下交互联结了。”[7]从人际交往研究的角度出发,网络技术为交往规模、点出度、点入度、连接度的最大化提供了可能和技术支持,亦即从技术理论上,每一个BBS电子空间中的规模、点出度、点入度的最大值都可以是N-1(N=样本数)。虽然本次调查数据中BBS电子空间中交往的规模、点出度、点入度的最大值(见表3、4)与技术提供有一定的差距,但是在一定程度上也验证了网络交往范围扩大的事实。

实证调查数据还表明了网络交往范围的另一个方面的特征。从表3、4中还可以看出,60%以上的成员更倾向于在5人以内的范围里进行互动,可见,在网络空间中人们的实际交往范围并不象技术提供的那样无限大,而是在无限的范围内进行了选择和确定,即是说,网络交往范围在最大化的同时亦具有可选择性。所谓可选择性,是个体可以有选择地与他人建立人际交往,有选择的投入情感,有选择的与他人保持行为等方面的一致性[8]。关系的这种可选择性,无论在现实社会还是虚拟社会都是存在的。所不同的是,在互联网空间中,可选择的范围扩大了。究其原因,人们交往对象范围的确定,可能与现实中社会互动的日常惯例和网络成员的讨论话题的吸引力等因素不无关系。

(3)讨论关系形成的环节和过程

虽然网上讨论关系与现实社会中的讨论关系都是基于人与人之间的互动行为而建立起来的。但是,讨论关系形成的环节和过程却是不同的。在现实社会中,讨论关系的形成过程是:问题者选择讨论对象。所谓问题者,是需要与他人建立讨论关系的人,是讨论关系形成的始发者。而讨论对象则是讨论关系中的被选择者。在这个过程中,问题者有权选择与哪个人建立讨论关系,对问题者而言,讨论对象是明确的、可选择的。但在BBS中,讨论关系的确立过程则是:主帖者提出话题,其他的BBS成员可以根据自己的兴趣决定是对此话题进行讨论。这里的主帖者既包括现实社会中的问题者,也包括主观上仅仅是为了发布某些信息,并不需要与他人建立讨论关系的人。主帖者能否成为问题者,关键在于讨论对象的选择与否。在此过程的正向环节中,无论是那种意义上的主帖者在提出供讨论的话题后,并不能确定哪一个他人可以与其建立讨论关系,对问题者而言,讨论对象是广泛而又不确定的。实际上,在这个环节中并没有建立起讨论关系。但是,对于原来意义上的讨论对象而言,却可以在众多的供讨论的话题中选择自己感兴趣的内容进行回复,进而与发帖者建立起了讨论关系,显然,现实社会意义上的讨论对象成为了关系形成的始发者,进而被选择的发帖者成为了问题者。可见,在BBS中,讨论关系形成的过程和方向与现实社会是完全不同的。

表5 BBS讨论区的点出度、点入度与连接度

附图

(4)交往的独立性、主观性与被动性

毋庸讳言,随着网络化、全球化时代的到来,“个人交往的独立性亦大大增强了。这是由于全球化客观上增加了个体认同的选择机会,这便使个人主观上的自主性较之以往更加突出了”[9],当代社会哲学大师吉登斯曾作如是说。网络交往不再受到年龄、性别等身份地位限制,而是按照自己的主观需要,自由地建立起交往的网络,因此,在线交往可达致对为了功利性目的而进行的“虚假交往”的消解,易于实现交往理性的最高境地――心灵沟通。但是,通过上面对网上人际关系的形成环节和过程的分析不难看出,基于BBS的网上交往在独立性与主观性大大增强的同时,也表现出了被动性的特点。其被动性体现在两个方面:其一,作为仅仅是为了发布信息的主帖者,主观上并没有于他人进行讨论的需要,但是却被动地成为了他人的讨论对象。其二,在现实社会中拥有建立讨论关系主动权的问题者却成为了被讨论关系中的被选择者,而现实社会意义上的被选择

者却成为讨论关系建立的主导和关键。实际上,BBS中大多数成员的点出度大于点入度的统计数据也支持了这个结论。

虽然从总体而言,一个人的选择意味着另一个人的被选择,即个体的主动性意味着他人的被动性,但是,从交往的始点――问题者在讨论关系中的地位看,无疑,其被动性的特点更为突出。基于BBS的网上交往的独立性、主观性与被动性的特征表明,个体可以更加主动、独立地与人进行交往,但是能否成为网络中的意见领袖,却取决于他人对自己网络行为的认可。而网络虚拟形式网络中的行为带有鲜明的符号色彩,这对交往者的素质提出了更高的要求。

(5)人际互动的时空特征

BBS电子空间中的人际互动符号化为帖子与帖子间的“帖际”互动的特征,使我们不得不审视其间所呈现出的时空特征。从空间上看,此时的人际互动跨越了地理的界限,可以实现不在同一物理场景中的人际互动,吉登斯早已将这个特征阐释得淋漓尽致。吉登斯在捕捉现代人日常的生活经验时,使用了“时空的分隔”的概念。他认为,在前现代社会,人类的活动是被“到场”所支配,即对事物及人物之掌握要受制于当事人是否在场这一因素。现代性的出现及科技之日新月异,改变了空间与人类的关系,人的互动已不再受制于必然在场这个条件,当事人与“不在场之存在者”的联系变得习以为常。“地方”这个字汇已被冠上了一个奇异的含义,因为在一个特定场所进行的活动可随时受远方的人和事所影响。在此基础上,他还提出了“抽离”的概念,抽离泛指一个脱离了社交关系建构及人际互动需要必然在场这个先决条件,反而在无限的时空中再将二者整合的过程[10]。从时间上看,人际互动具有异步性特征。在对帖子进行分析的过程中我们还发现,某些回帖与主帖的间隔时间非常短,仅仅在几分钟(甚至是1分钟内)就完成了一次讨论,互动的即时性很强。但是,还有另外一种情况,即某些帖子回复的是1天、甚至是更长时间之前他人发布的帖子,互动具有滞后性。在回复之时,也许发布者早已退出了交流的场景,此时的人际互动变成了人――帖子(符号)的互动,可以说,人际互动的异步性特征更形象地表述了“缺席”的含义,此时与之互动的他人是真正意义上的不存在。

根据BBS电子空间中人际互动的同步性与异步性特征,我们可以将吉登斯的“当事人与‘不在场之存在者’的联系也是平常的”论断加以改换,提出一个与此相补充的观点――“当事人与‘不在场(缺席之不存在者’的联系也是可能的”的。这样看来,吉登斯所说的“缺席”,既可以表现为“他人”物理空间中的不存在,亦可以表现为他人时间上的异步性,或是时间上的不存在。这样,“缺席”可以从时间和空间两个角度来理解:从空间上看,网络技术弥合了在场与不在场的界限,使空间与在场分离,它创造了一种面对的是没有“他人”存在的情境,身体的空间性已不再成为互动的制约因素。从时间上看,实现了人际互动的同步性与异步性的统一。

由此可见,在BBS电子空间中,通过发布帖子和对帖子的回复,人们建立了一种新型的人际关系结构――“网缘性”人际关系。现实社会中的人际关系,是通过地缘、业缘、血缘等建立起来的,但是,在网络日益发展的今天,人与人之间通过网络互动产生和扩展出来了一种突破传统地域社区限制的网上人际关系。与现实社会相比,它是动态的、不稳定的、弹性的结构。它的产生,使网络交往呈现出新的特点:首先,在线交往的范围实现着有限与无限的统一:一方面,网络技术使交往对象可以无限扩大;另一方面,在交往实践中,人的交往范围在一定程度上首先是社会中的日常管理等因素的影响,交往对象是有限的。其次,网络交往在体现出独立性、主观性特点的同时,也体现出了被动性的特征。BBS讨论网的形成,不仅对传统的人际关系理论、社会交往理论产生了冲击和影响,而且其中呈现出的网上交往的新特点,更进一步丰富了网上交往理论。

【参考文献】

[1] 李正风,等.赛博空间与社会变革[J].自然辩证法研究.,(5).

[2] 沙莲香,等.中国社会文化心理[M].中国社会出版社.1998:85.

[3] 迈克尔・沙利文―特雷纳.信息高速公路透视[M].北京:科学技术文献出版社..195-197.

[4] 郑荣双,严全治.互联网的信息超载、虚拟性与PIU[J].自然辩证法研究.,(5).

[5] 方壮志.社会网研究的基本概念和方法[J].华中理工大学学报(社科版).1995,(3).

[6] 杨宜音.试析人际关系及其分类[J].社会学研究.1995,(5).

[7][9] Anthony  Giddens.Modernity  and  Self-identity[M].Polity  Press,1991.

[8] 陈学艺.社会学[M].北京:知识出版社.1991.81

基于特征编码的数控自动编程研究 篇3

关键词:CAD/CAM;加工特征;NC编程

中图分类号:TP308 文献标识码:A 文章编号:1006-8937(2012)26-0083-02

1 特征造型技术

特征造型是近二十多年来发展起来的一种新的造型方法,它是CAD第三次技术(参数化技术)革命的里程碑。特征造型技术的发展可以分为三个阶段,第一阶段:以点和线表示实体的二维造型方法。第二阶段:传统三维几何造型方法,即以线框造型、曲面造型、实体造型等几何元素来表达实体。这种描述方法没有明显的结构、功能及工程含义,计算机很难识别和统一管理。第三阶段:将特征作为基础的三维造型方法,这种方法将大量工程信息包含到设计过程中,较好地改善了前两阶段的局限性。特征造型技术目前广泛地用于计算机辅助设计系统。

与传统三维几何造型相比,特征造型具有以下三方面的特点

{1}以特征造型为基础的零件模型易于理解和修改。在基于特征造型技术的建模过程中计算机辅助设计系统会自动生成模型树,可以将建模过程直观的反映出来。

{2}基于特征造型技术的计算机辅助设计系统是交互式的设计系统,能够让设计人员充分发挥设计的创造性,可以提高设计效率.

{3}特征造型的操作目标不是初期的线条和体素,而是层次较高的功能要素,如定位孔、螺纹孔、键槽等,零件的几何结构通过特征组合来定义。

2 特征识别和提取

在产品数字化设计与制造中,零件的特征识别是一项非常关键的技术。目前已开发出了各种CAD/CAM软件,如UG、SolidWorks、Pro/E、Catia等,这些软件都是以特征造型为基础,而特征造型为产品的数字化设计与制造过程中的特征识别创造了良好的条件。特征识别可以分为交互特征定义和自动特征识别两类。

2.1 交互特征定义

交互特征定义是在计算机显示器屏幕上对显示的零件三维实体模型操作,在操作界面的引导下,设计人员在模型上选取构成特征的一些几何实体(如几个平面),CAD/CAM软件系统就可将这些几何实体组织起来,定义为某个特征,例如选取三个相邻的正交平面,CAD/CAM软件系统就可以将其定义为槽。初步定义的特征还缺少表面粗糙度、公差等技术要求这些非几何信息,必须补充上去,这样才能完成特征建模。交互特征定义由设计人员直接对实体模型进行操作,比较直观,具有较大的灵活性,但操作繁琐,效率低。所以通常是在应用自动特征识别方法不能完全识别特征的情况下作为一种补充处理手段来使用。

2.2 特征自动识别

特征自动识别是通过计算机智能技术来取代交互特征定义中设计人员的干预。零件实体模型中的所有特征信息都具有特定的工程意义和加工工艺,特征自动识别技术可以将所有的特征信息自动提取出来。特征自动识别原理是通过特征识别器实现。特征识别器是在软件程序中设计特定的算法,该算法实际上先将零件几何模型中的所有数据遍历,然后将几何模型与一组预先定义的特征进行比较,预先定义的这组特征包含了特征造型中涉及到的所有特征,通过比较,最后就可以找到与预先定义的特征组中相匹配的模型特征,实现特征自动识别。

基于特征造型的CAD/CAM软件对于主要特征一般分为基准特征、实体特征、曲面特征、修饰特征和集合特征。基准特征包括基准的位置与坐标等信息;实体特征用于实现实体造型;曲面特征用于实现曲面造型;修饰特征不能独立存在,它只能附加在实体特征上;集合特征包括组和阵列特征。CAM所需要的是零件的加工特征,包括以下几个方面的内容:零件管理信息、形状特征信息和精度特征信息。零件管理信息由特征代码、特征名以及材料信息构成;形状特征信息描述了零件的几何形状;精度特征信息用于描述特征的几何尺寸与形状的允许变化范围。加工特征分为五大类,包括平面、曲面、孔、槽和辅助特征,其中每一大类又可以细分为若干小类。加工特征的描述要用到四类要素:特征代码、特征名、特征几何形状和特征工艺信息。其中特征几何形状表示孔的深度、半径等;特征工艺信息表示零件表面粗糙度、加工精度、材料等。

3 基于特征模型的零件柔性编码

基于特征模型的零件柔性编码系统是以数据模型原理为基础,与刚性编码系统相比,其框架结构是不固定的,零件的有效特征信息可以根据不同的零件而采用多层来详尽地描述。其描述方法为层层深入法,采用这种描述方法可以满足不同生产条件、不同场合的要求。常用零件柔性编码系统的结构有三种,即树式结构、链式结构和混合结构。基于特征模型的零件柔性编码系统是在零件实体模型的基础上,对模型特征进行识别并提取,然后采用柔性编码技术对提取出来的零件特征进行编码,在三种柔性编码系统结构中这属于混合结构编码。

混合结构编码具有以下特点:

①既有柔性码位,也有固定码位。柔性码位主要为零件的特征信息码位;固定码位用来表示零件的功能信息和总体信息,包括零件类型、尺寸、材料、热处理方法等信息;

第一层:总体特征码。总体特征码具有固定的代码长度,主要用于描述和反映零件的功能和形状特征,能够在总体上对零件进行分类,通过总体特征码可以确定零件族别。

第二层:加工面特征码。加工面特征码主要详细描述除主特征之外的零件工艺特征,这些工艺特征用于描述零件的加工面特征以及主要工艺信息。加工面的形状用加工面特征码的第一个码位表示,如平面、螺旋面、球面、齿面、孔、螺纹、槽、导轨等。在代码中零件的每一个特征信息用两个字符表示,零件的所有特征信息表现为一字符串,与传统编码系统相比,可以避免各种信息排列方式的限制,同时也克服了高项掩盖低项的缺点,使代码的含义清楚,并且可以将不具备这方面特征略去。对于添加的特征,可以用()加以区别。零件的典型工艺可以根据加工面特征码加以确定。

第三层:非加工表面特征码。这层代码用于补充描述零件加工面特征,或者补充描述加工面特征之间的位置信息,如平行度、垂直度、倾斜度、同心度。这层代码的码位数不固定,零件加工表面特征之间的相互关系数量决定码位字符数。这层可以根据需要取舍。

4 NC代码自动生成

数控自动编程是根据零件当前加工部位的基本特征,按照一定的加工工艺,生成相应的加工指令代码及转速、进给速度、刀具指令代码,依据对加工部位的几何形状的描述,生成节点坐标指令。零件的加工方式和零件柔性编码中的特征信息决定了基本加工特征。根据零件柔性编码描述的零件基本几何信息,数控程序自动生成模块能够进行相关的数据处理,其处理方法是将外圆、端面或内孔相关参数的数据传递给刀具程序模块,例如模型基点与端面之间的相对位置关系,模型基点与厚度之间的相对位置关系,端面外圆的直径等。

完整的数控加工程序包含三大部分:数控加工准备程序段、加工程序段和结束程序段。其中数控加工准备程序段和结束程序段在数控加工程序中是必不可少的。准备程序段主要包括设置工件坐标系、设置换刀点、设定转速单位、设置最大转速、开启冷却液、启动主轴和设置旋转方向;加工程序段是根据零件的加工工艺,编写刀具轨迹,设定切削用量;数控加工程序结束段主要包括、关闭冷却液、刀具快速回退到程序起点、取消刀具补偿、主轴停转和程序结束。完整数控加工程序的准备程序段和结束程序段的格式基本相同,不同之处在于不同加工零件的相应工艺参数,因此在实际编程中,可以将相同结构的程序段写在一起。在应用程序时,通过内部调用并结合参数输入,就能自动生成所需要的代码段。

参考文献:

[1] 张英杰.面向自动数控编程的零件加工特征建模技术[J].西安交通大学学报,2008,(3).

[2] 黄利江,许建新,田锡天.基于特征模型的零件柔性编码研究[J].机床与液压,2007,(11).

基于颜色特征的车牌定位 篇4

关键词:二值化,相对重要性滤波,车牌定位

1. 引言

车牌定位是车牌识别系统(1icense plate recognition,简称LPR)中一个至关重要的环节,是LPR的基础和前提[1]。由于车身颜色和牌照颜色的多样性,要设计一个通用性好的车牌识别系统具有一定的难度。文献2中的图像二值化算法能够准确地定位灰色车身蓝色牌照,但是这种算法存在一定的缺陷,对于其它颜色的车身牌照定位不精确。针对文献2中的不足,本文首先介绍了一些常用的二值化算法,然后利用颜色分类器对图像选取合适的二值化算法,并结合一种相对重要性滤波算法筛选车牌候选区域,最后根据牌照的特征对车牌进行准确定位。

2. 图像二值化算法

2.1 图像单通道颜色二值化

对于黑色、黄色、红色和蓝色牌照的车来说,牌照图像的像素只集中在B通道,而且B通道含背景颜色最少,所以对以上类型的车辆可以采用设置B通道阈值对图像进行二值化。首先将彩色测试图i分离成R,G,B三个通道分量,并选取B通道分量[3]。

其次用改变了的拉氏模板H对B通道分量进行加强边缘的处理。目的是减少边界锐化的强度,减少后续滤波等一系列预处理的麻烦。

通过使用合适的方法选取阈值T1,可将图像分割为两部分,分割后的图像为f1(x,y)。

2.2 图像灰度的分布特性二值化

考虑到车牌图像的特点,车牌字符排列具有规律性,字符和牌照底在灰度值上存在突变。因此选取了初始阈值进行图像二值化处理。其原理是统计每幅图像灰度的分布特性,用T对图像进行二值化[4]:

Gmax和Gmin分别为最高,最底灰度值。在灰度图g(i,j)的基础上,进行二值化处理,并把二值化的图像与单通道二值化图像相减,具体方法见文献2,得到如图3所示。

2.3 最大类间方差法

由OStu提出的最大类间方差法是在判决分析最小二乘法原理的基础上推导得出的。其基本思想:一幅图像被一个阈值分为目标与背景两部分当两部分之间的方差最大时,分割效果最好。OStu二值化的操作被看成是将整个图像在阈值t处分为两类,一类代表背景,一类代表前景目标,令代表类间方差,则最佳阈值可以通过使下列判别函数最大化得到:

经过最大类间差法二值化以后,牌照区域存在细小的空洞,致使车牌分成几个小的连通区域,这样将无法对车牌进行准确的定位[5],本文将采取形态学的方法对图像进行平滑处理,有效对车牌的连通区域进行整合。此步骤的关键是选择合适的结构元素,最终取得了如下图所示的图像。

3. 基于神经网络的彩色图像二值化方法

对于灰颜色和黑颜色的汽车,我们采用基于神经网路的方法对其进行分类选择合适的二值化算法[6],通过将待判断的像素色度、色饱和度作为神经网络的输入量,将色度、色饱和度符合灰色系列要求的像素统一置0,将符合黑色系列要求的统一置1,将其它像素的置为-1,这样就可以根据这些数来选择合适的二值化算法。置为0的采用文献3所用到的方法进行图像预处理,置为1的直接采用图像单通道颜色进行图像二值化,置为-1的采用最大类间差法进行图像二值化后采用腐蚀膨胀对牌照区域进行更深一层的处理。最后所有处理过的图像都会出现类似如图4滤波前所示的牌照区域和非牌照区域,此时我们还不能辨别哪个是牌照区域,哪个是非牌照区域,所以接下来我们将采用相对重要性滤波对图像做进一步处理。

4. 相对重要性滤波

图像经过预处理后,车牌候选区域逐步呈现出来,但此时二值化图像中牌照的像素块数目往往还较多,当中包含了较多的非牌照区域[7]。为此,我们这里采用了相对重要性滤波,这样就可以把阈值分割后的二值化图像中过大或过小的面积抛弃掉,进而提高了对车牌区域的准确定位。

设相对重要性滤波R=Area(i)/S,i=(1,2…num),Area(i)为所以牌照候选区域的面积,i=1,2…num为牌照候选区域的块个数,S为整幅图像的面积。当R<0.05时,可以将小面积的非车牌区域屏蔽掉;当R>0.5时,可以将大面积的非车牌区域屏蔽掉,如图4所示。

从图4可以看出,通过相对重要性滤波后,把一部份小面积的候选区域去掉了,剩下一些面积跟牌照面积相当的候选区域,此时我们可以采用车牌特征长宽比(P)。车牌的大小是标准的,宽高比在一定范围内,在这里我们当p<0.14时,把候选区域的面积设置为0。同样的,如果P>0.5时,也把候选区域的面积设置为0,最终我们可以得到如下图5所示的车牌区域。

5. 实验结果

与以往的单一二值化方法相比,文中充分利用了神经网络对彩色图像进行颜色分类再选择合适的二值化算法,提高了车牌图像二值化效果,为进一步准确定位牌照区域扫除了障碍。实验证明,本方法在一定程度上克服了文献2只针对一种颜色车型的牌照定位的不足,同时提高了车牌定位的准确度。

参考文献

[1]袁庭启,徐涛.一种基于HSV空间和纹理特征的快速车牌定位方法[J].重庆工学院学报,2008,22(10):179-182.

[2]杨冬涛,黄杰贤.基于图像二值化和特征的车牌定位[J].广西轻工业,2009.

[3]张朝阳,潘保昌,郑胜林,彭绍湖.基于消除背景的人脸定位方法[J].广东工业大学学报,2007,24(2):90-92.

[4]张凯.Visual C++在图像处理技术方面的应用[J].内江科技,2006,2,103-103.

[5]李刚,曾锐利,林凌,蒙军.基于数学形态学的车牌定位算法[J].仪器仪表学报,2007,28(7):1323-1327.

[6]邹永星,钱盛友,王润民.基于图像特征的车牌字符分割方法研究[J].湖南师范大学自然科学学报,2007,30(4):60-64.

基于轨迹特征的预警系统目标识别 篇5

基于轨迹特征的预警系统目标识别

文章针对弹道导弹预警系统目标识别任务的特点,通过分析弹道导弹和卫星目标间的运动特性差异,给出了预警雷达基于最小矢径这一特征区分弹道导弹和卫星的流程,并分析了弹道导弹射程、雷达测量精度、观测时间、采样间隔等因素对此流程的影响.仿真结果表明:利用最小矢径实现弹道导弹和卫星的.区分是可行的,而且此法对雷达测量精度要求不是特别高.

作 者:董洪乐 曹敏 黎湘 胡杰民 Dong Hongle Cao Min Li Xiang Hu Jiemin 作者单位:国防科技大学空间电子信息技术研究所,长沙,410073刊 名:空间电子技术英文刊名:SPACE ELECTRONIC TECHNOLOGY年,卷(期):5(3)分类号:V4关键词:预警雷达 最小矢径 弹道导弹 卫星

基于商务英语语用特征的分析 篇6

【关键词】 商务英语 语用学 语用特征 分析

【中图分类号】 G642.3 【文獻标识码】 A 【文章编号】 1674-067X(2014)09-002-02

0

在全球经济一体化日趋紧张的今天,各国间的商务活动步伐逐渐加快,以此为契机,商务英语成为了具有独特的语用学特征的综合性学科。且在人们的生活中变得愈加不可缺少。

1. 商务英语的含义

Business English是商务英语在英语中的定义,商务英语作为商务活动的交际语言,受到社会、经济和政治文化背景的深远影响。在牛津英语中,商务英语被分成了了四个层面,相对的解释了商务英语的独特之处:第一,英语是商务英语的来源和根本;另一方面关于特殊的商务技能即Business English,学习商务英语就一定要掌握电话销售、商务谈判、商函撰写、商务会谈等主要内容;再一方面了解和学习特殊的商业词汇,在商务活动中由于不理解的商业词汇的误译很可能给企业带来不可小觑的损失,特别是一些专业名词和通用语言;最后的文化价值方面一定要把握好中西方文化的深厚底蕴,只有真正的做到理解其含义在能做到在其价值之间游刃有余。

2. 商务英语的语用特征分析

语用分析是从微观角度对语言的使用来进行的研究。如此,从商务英语的语境出发,商务英语的语用特性有哪些呢?下文便把用词和用语两部分做了详细的介绍和分析研究。

2.1用词方面

2.1.1专业词汇丰富

职业涉猎许多的方面和领域,因此职业语言也丰富多变,而商务英语就是重要的职业语言的一种,几乎所有的领域都包含一些专业的语言词汇。一些国际贸易中常见的词汇如:current account surpluses, visible-trade balance,只有熟练的掌握了这些专业词汇、具有优秀的商务知识商业企划才能真正的展开。此外,商务英语是一门综合类语言学科,时代的发展,促进了一些反应经济界的新思想、新内容及其最新的技术和管理方式的新词汇。比如说:E-business——电子商务,digital globe——数字地球,pink collar——“粉领”(女性职员),venture capital——风险投资。这些商务用语中的“新词”出现的次数远远多于普通的用语,如今,快速、大量成了新词汇的发展趋势。新词汇的出现明显的丰富了专业词汇的内容。

2.1.2常用词的使用

商务英语要求用语在正式的同时要保证通用于国际,能让大众了解明白,因此,商务英语用词便多使用一些常用词,使其能够简单易懂、正式规范、平实达意。一些规范严谨的公文会应用一些正式的词汇,如prior to、expiry等,它们较before、end而言更为正式,更具有权威性。单个动词比动词短语更受欢迎,例如continue比keep on和go on使用更为广泛普遍。但介词却与动词相反,介词更喜欢用复杂的介词短语而不是简单的介词,如:in the nature of常常代替like等。

2.1.3外来语的使用

商务英语中拉丁语和法语是许多商务专业术语的鼻祖,一部分由其词根派生或合成,因此不少专业术语的前缀或后缀都一样。部分拉丁语融合到英语中的方式有直接和间接,如de facto fort(事实上侵权行为)等,这些词汇大多来源于法律专业术语。

2.1.4广泛应用成对同义词

在商务用语中西方国家更习惯于把大量的同义词连用,原因是避免由于词汇的联想而产生争论,因此,同义词的连用缩小了词义的范围.AⅡ documents shall become null and

void automatically from the date on which the Contract comes into force.这就是一个同义的形容词成对出现的例子。这种词汇的使用方法证明了商业英语严谨,不允许出现模糊概念的态度。商务英语抛弃了文字的流畅性,而行成了商务英语复杂和保守的语用特征。

2.1.5缩略词的应用

商务工作讲究效率,节奏快。因此,语言的应用也必须言简意赅。在这样的前提下,便逐步出现了大量的缩略词,缩略词的应用涉及方面广泛,因此在日常生活中,缩略词随处可见。缩略词通常由单词的首字母组成,并大写。种类繁多,大体可分为四种:国家城市代码、货币代码、国际组织机构代码、贸易术语。

2.2用语方面

2.2.1礼貌表达

世界任何语言都具有相同的语言使用原则即礼貌原则。商务英语通常会为了表达郑重而应用礼貌的原则。因此具有明显的郑重的语用特征。这是普通英语所不具备的。Your earlier response to our request will be appreciated.此例句中“will be appreciated”就是一种郑重的表达。郑重的表达多应用于商务信函中,一封言辞恳切、彬彬有礼的信函有利于产生愿意与之合作的美好心情,由此,礼貌原则在商业信函中的应用可以带来更多的商业机会。另外礼貌的原则还表现在以换位思考的方式来阐述问题。

2.2.2委婉表达

委婉的表达方式适应几乎所有的语言。委婉表达更为含蓄,在一些语言交流中含蓄的表达方式避免了一些矛盾冲突的发生,而更有利于商业目标的实现。I should say the price is reasonable if you take the quality into consideration.在此例句中,含蓄的表达了己方不愿降价的态度,防止了可能会因为直接表达而引起合作的终止。

2.2.3省略表达

和普通英语不同,省略表达在商务英语中多数是为了请示、拒绝、申辩,同时也会应用于商务广告等方面。Ask for more.这是一个广告,很明显此广告应用了省略的表达。由此可知,广告用语的最大特点便是省略表达。商务英语由于职业特性的要求,语言要简练,可省则省,以提高商业效率。

3. 结语

本文基于商务英语的语用特征从词汇和用语两方面进行了对商务英语的分析。词汇方面要依据商务英语的特征和词汇规律,认真的完成对国际商务英语的了解和掌握。在语用方面语用学在商务英语中商务信函和商业交流中起着不可忽视的作用。

[ 参 考 文 献 ]

[1] 李春林.商务英语的语用特征分析[J].长春大学学报.2010.5(17):32-33.

[2] 李蓓霖.浅析商务英语词汇的语用特征[J].湖南经济管理干部学院学报.2011.11(16):88-89.

基于不变矩特征的图像识别 篇7

图像识别是指给定一个查询图像,需要从图像库中找到与之类似的图像。图像识别的方法很多,按图像像素值的匹配算法包括全局相关算法[1]、快速傅立叶算法[2]等等,这种算法简单,易于实现。按图像特征的匹配方法是指在原图像和变换后的图像中进行提取,对比例、缩放、旋转、灰度变换等具有不变性的特征进行匹配的方法。

不变矩方法是一种经典的特征提取方法。单纯的中心矩或是原点矩尽管可以表征平面物体的几何形状,却都不具有不变性,但可从这些矩构造不变量。Hu[3,4]提出图像的7个不变矩具有平移、旋转、比例不变性,在目标识别、图像匹配、形状分析等领域得到了广泛的应用;Jan Flusser和Tomas Suk[5,6]又提出了另外一些不变量,并将之运用于字符和图像的识别,取得了不错的效果。图像灰度变化时,在感观上发生了很大的变化,但它所对应的直方图在形态上的变化却不会很大,可利用直方图所含有的相关信息量来描述图像信息。本文选取了3个不变矩,并且把图像的直方图不变矩及其统计特征量作为特征向量运用到图像识别中,两个图像之间的相似性程度可以用这些不变量的数值进行描述。

1 不变矩理论

矩在统计学中用于表征随机量的分布,而在力学中用于表征物质的空间分布。若把二值图像或灰度图看作是二维密度分布函数,就可把矩技术应用于图像分析中[7]。

对于任意非负整数p,q,二维图像模式f(x,y)在平面R2上的p+q阶矩定义为:

mpq=∫∞∞∫∞∞xpyqf(x,y)dxdy,p,q=0,1,2,L (1)

式中f(x,y)为图像的灰度(密度),仅在有限R2平面上分段连续。显然,mpq由f(x,y)唯一确定,反之亦然。

由于mpq不具有平移不变性,因此定义p+q阶中心矩为:

undefined

归一化中心矩ηpq定义为:

ηpq=μpq/μundefined,r=(p+q+2)/2,p+q=2,3,L (3)

2 不变矩特征提取

对于数字图像,积分用求和代替,对于一分辨率为M×N的数字图像f(x,y),在离散情况下,mpq定义为[7]:

mpq=undefinedxpyqf(x,y),μpq=undefinedundefined

其中,p,q=0,1,2,L;undefined是图像的重心坐标

undefinedundefinedxf(x,y)/undefinedundefinedundefinedxf(x,y)/undefinedf(x,y) (5)

Jan Flusser和Tomas Suk又提出了另外一些不变量,并将之运用于字符和图形的识别,取得了不错的效果。根据实验结果和计算量的大小,我们总结了3个不变量,公式如下:

f1=η20+η02,f2(η20-η02)2+4ηundefined,f3=η20η02-ηundefined

3 直方图特征提取

图像的直方图反映图像的统计特性,它表达了图像中取不同灰度值的面积或者像素数在整幅图像中所占的比例,通过直方图还可以求出一幅图像中所含的信息量。因此,当同一区域的成像条件发生改变时,虽然人眼看上去图像发生了很大的变化,但是它所对应的直方图在形态上的变化却不会很大。所以,可以利用直方图所含有的信息量来定义图像的不变特征,从而找出图像之间的匹配点。

设二维图像f(x,y),它的灰度值范围为r0,r1,L,r255,则直方图为:p(ri)=ni/N,其中,N为像素总数,ni为灰度值为ri的像素个数。

由公式(4),可以求得直方图不变矩的k阶中心矩,则归一化中心矩为: ηk=μk/μundefined,r=k+1

通过计算可以得到μ0=1,所以就有ηk=μk。基于同样的思想,用上面的公式求解ηk,将ηk进行重新组合,构造如下4个具有位移、比例及尺度不变性的图像直方图不变矩:

f4=η4/ηundefined,f5=η5/(η2η3),f6=η6/ηundefined,f7=η7/(η3η4)

以此4个直方图不变矩作为图像的特征描述分量。采用峰度、对称度、能量、熵4个直方图的统计特性作为图像的特征描述分量。峰度是描述直方图数据分布的陡峭度,是聚集在均值附近还是散布于直方图的尾端。对称度是描述直方图数据分布的对称性,表示数据分布偏离对称的大小,对于等灰度分布直方图,即直方图均衡化情况,G最小。

K=η4/σ4=undefined(ri-μ)4p(ri)/4,G=undefinedp2(ri),S=η3/σ3=undefined(ri-μ)3p(ri)/σ3,H=-undefinedp(ri)log2(p(ri))

其中σ2=η2,σ为标准差。通过上面的公式可以分别求得直方图的峰度、偏度、能量、熵4个统计特性。

4 图像匹配

设基准图的尺寸为M×N,在待匹配图中选取相应的区域,在区域内以(M×N)窗口移动,当窗口移动到匹配点位置,数据库图像与子窗口的相似程度最大。

第一步,将获取的待匹配图像进行灰度化,转换成灰度图像,以进行矩特征值以及直方图特征值的提取。

第二步,计算f1、f2、f33个不变矩。

第三步,计算待识别图像的灰度直方图,得到p(ri),即图像的概率密度函数。

第四步,计算待识别图像的直方图不变矩f4,f5,f6,f7,直方图的4个统计特征K,S,G,H。

第五步,归一化处理,由3个不变矩及其直方图不变矩和直方图统计特征构成的特征向量:

E=(f1,f2,f3,f4,f5,f6,f7,K,S,G,H)

undefined

第六步,相似性度量。采用加权距离计算公式,计算两幅图像之间的差距。设Q为待识别图像,P为数据库中的图像。归一化之后的特征向量为:A=(a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11)。则两幅图像之间的距离计算公式为:

Dist=undefined

其中w1,w2是权值,可以根据具体情况设定,如果图像的直方图特征变化比较小,则w2的值应该大于w1的值。

5 实验结果分析

在实验中,使用Linux操作系统,MySQL数据库,采用摄像头摄取图像,用C语言编程进行验证。为了验证不变矩具有的特性,下面给出了三幅不同的绿豆图像。

分别计算它们的f1,f2,f3,f4,f5,f6,f7,K,S,G,H,在实验测试中,w1,w2分别取0.4,0.6。表1给出了计算结果。为了验证识别算法,选取30幅图像,把它们的像素值存储到数据库中,为了增加识别的成功率以及降低在摄取图像时存在噪声的影响,每种图像取4幅,然后计算这4幅图像的每一个像素点的像素值的平均值。通过识别验证,识别的成功率比较高。

从表1可以看出,计算的11个不变量,在图像a、b、c中保持了较好的不变性。该识别算法中,我们使用了直方图不变矩以及几何矩,通过两者的结合使用,以及引入了峰度、偏度、能量、熵4个直方图的统计特性,比仅用Hu矩或者几何矩具有更高的识别率。

6 结束语

基于不变矩理论的图像识别算法,立足于不变矩的不变性,兼顾直方图的统计特征,以及几何矩的几何特性。将Hu提出的图像的7个不变矩进行组合定义了4个直方图不变矩、4个直方图的统计特征以及使用Jan Flusser和Tomas Suk提出的一些不变量得出3个不变矩,以这11个不变量作为特征空间的描述向量,依据待识别图像与数据库图像之间的相似性度量,最后从数据库查找出需要图像的特征信息,实验结果表明,该方法在图像识别中精度比较高,具有较好的识别效果。

参考文献

[1]Smith J,Chang S F.VisualSEEK:A fully automated content based image query system[J].In:Proceedings of the Fourth ACM Multimedia Conference,Boston,1996:87-98.

[2]Reddy B S,Chatterji B N.An fft-based technique for transla-tion,rotation and scale-invariant image registration[J].IEEE Transactions on Image Processing,1996,5(8):1266-1271.

[3]孙君顶,毋小省.基于熵及不变矩特征的图像检索[J].光电工程,2007,34(6):102-106.

[4]王枚,王国宏,高小林等.基于PCA和边缘不变矩的车标识别新方法[J].计算机工程与应用,2008,44(4):224-226.

[5]Jan Flusser,Tomas Suk.Degraded Image Analysis:An Invariant Approach[J].IEEE Transactions on Pattern Analysis and Ma-chine Intelligence,1998,20(6):590-603.

[6]Jan Flusser,Tomas Suk.Pattern recognition by affine moment invariants[J].Pattern Recognition,1993,26(1):167~174.

[7]Muharrem?Mercimek,Kayhan?Gulez,Tarik?Veli?Mum-cu.Real object recognition using moment invariants[J].Sadhana,2005,30(6):765-775.

基于蜜罐特征的蜜罐识别技术 篇8

1 蜜罐识别技术现状

蜜罐技术已由单一的蜜罐发展到现在的第三代蜜网,还出现了动态蜜罐(Activate Honeypots)、蜜场(Honeyfarm)、Honeytoken、应用层蜜罐(Honeyapp)、同步/异步交互蜜罐(Active/Passive Honeyclient)等新概念、新技术[2]。但是其核心技术如数据控制、数据捕获、数据分析、重定向等是不会变的。在计算机应用领域,无论蜜罐作为一个系统还是一个软件甚至是网络,都会存在这样那样的弱点,而蜜罐识别技术就是利用这些弱点来对蜜罐进行识别。

根据攻击者与应用程序或服务的交互能力蜜罐可分为低交互性和高交互性蜜罐[1]。

1.1 对低交互性蜜罐的识别

低交互性蜜罐通常是运行在现有操作系统上的仿真服务,以模拟某一服务、端口或者是整个操作系统为主,只允许少量的交互行为,攻击者并不能与其在各个层面上交互,因此这种蜜罐丧失了灵活性。

1.1.1 基于Fake proxies的识别技术

该技术主要目的就是捕获垃圾邮件,典型应用在“send-safe”公司设计的反蜜罐软件Honeypot Hunter,该软件在25端口开一个虚假的邮件服务,要求每个open relays向它反向连接,如果某个open relays只有连接成功会话而没有后继会话,就会使该软件产生响应,攻击者以此来判断目标系统很可能是蜜罐[3]。但该软件有很大的局限性,首先如果蜜罐通过数据控制技术限制了蜜罐向外连接的次数,就无法识别蜜罐的存在;其次该软件只适用于针对垃圾邮件的蜜罐,不具有通用性。

1.1.2 面向Tarpits的识别技术

Tarpits是一个虚假的信息系统资源即所谓的“黏着蜜罐”,其对发向该计算机的请求有意地延缓应答,目的是迷惑系统入侵者,耗费攻击者的系统资源,以延迟攻击者。但该技术非常容易被检测,只要具有一些网络工程经验就可以判断出目标系统的真伪。比如,在OSI/ISO参考模型第七层的Tarpits,仅仅需要看服务的延迟,攻击者就可以在多次尝试后发现目标系统是个假系统;对于第四层的Tarpits如LaBrea,TCP窗口减小为0,并且Tarpits继续接收新的数据包,这种现象会提醒攻击者目标系统很可能是蜜罐。

1.1.3 针对Honeyd的识别技术

Honeyd是由Niels Provos开发的一种开放源代码的低交互性蜜罐,可在应用程序层和IP堆栈层模拟数百万个操作系统,通过代理和重定向支持对实际主机、网络服务的整合,其主要目的在于对可疑活动进行检测、捕获和预警[4]。

在Honeyd 0.8版本前,Honeyd对同时包含SYN和RST的TCP畸形包进行无条件的反应回包,从而出现了TCP/IP协议栈行为和真实主机的差别。2006年Honeyd的一个最新漏洞被BUGTRAP公布,使得Honeyd对某些分片的畸形IP包不能正确应答,而真实主机是可以应答的。随着Honeyd版本的升级和漏洞补丁的分发,对Honeyd的识别越来越困难,但是基于TCP/IP协议栈、IP包和异常数据包的识别方法仍然是对Honeyd进行识别的思路。

1.2 对高交互性蜜罐的识别

高交互性蜜罐通常是以真实的系统为基础来构建,攻击者所面临的是真实的系统和服务,其可以收集更多的信息,同时也和攻击者间拥有更高的交互等级和交互能力,攻击者可以探测、攻击、破坏这种系统,并将其作为进一步攻击的工具,相对低交互蜜罐其配置更加复杂,需要更多资源的支持,具有更高的风险性。其典型代表主要是由Lance Spitzner领导的蜜网项目(Honeynet)。

除蜜罐使用的核心技术外,大部分的蜜罐系统都会使用一些辅助软件来帮助蜜罐系统完成某个功能,例如虚拟机、Sebek、Honeywall等,研究这些软件的特征及其漏洞进行识别,也可以判定目标系统的真伪。

1.2.1 识别虚拟软件

虚拟机技术几乎可以模拟所有的操作系统,不仅可以节省大量的硬件资源,而且具有易于维护,便于恢复现场,容易与真实环境隔离等特点。因此高交互蜜罐主要采用虚拟主机进行部署,虚拟机探测技术也就相应地成为攻击者最常用到的蜜罐识别方法。当识别出目标系统中运行虚拟软件时,虽然不一定是蜜罐,但起码会引起足够的警觉。

虚拟机探测的目标就是要检查当前代码是否正运行在一台虚拟的主机上,有很多方法可以用于探测虚拟机的存在,主要可以分为四类:

(1) 根据文件系统和注册表中的虚拟机信息探测虚拟机;

(2) 根据虚拟主机的内存分配特征探测虚拟机;

(3) 根据虚拟主机的硬件特征探测虚拟机;

(4) 根据虚拟机中的特殊指令与通道探测虚拟机。

文献[5,6,7,8]详细介绍了针对虚拟软件的检测方法。

1.2.2 识别Sebek组件

为捕获SSH和SSL加密的信息,蜜罐部署者会在蜜罐机器上安装基于内核的Rootkit来捕获感兴趣的数据,这个Rootkit就是Sebek。常用于高交互度蜜罐系统的数据捕获工具,以内核模块方式运行于蜜罐中。Sebek通过替换Sysread系统调用来捕获攻击者的相关信息,所有通过Sysread的数据都将被记录,然后把这些记录通过网络模拟成其他UDP数据传输出去,以满足蜜罐对攻击者鼠标、键盘等操作进行监视的要求[9]。

现有的检测方法[10]有:查看反应时间(Latency);观察网络传输计数器(Network Traffic Counters);修改系统调用表(Modification of SysCall Table);查找隐藏模块等。文献[11]还介绍了一种名为“NoSEBrEAK”的“DD检测法”。

1.2.3 识别Honeywall

Honeywall作为一个蜜网网关,是第二代蜜网方案整体架构中最重要的核心部件之一。作为蜜网与其他网络的惟一连接点,所有流入、流出蜜网的网络流量都将通过Honeywall,并受其控制和审计。同时由于其是一个工作在链路层的桥接设备,不会对网络数据包进行TTL 递减和网络路由,也不会提供本身的MAC 地址,因此对黑客而言,Honeywall是完全不可见的[12]。

由于Honeywall的存在出境的通信将被严格限制,比如每天只允许15个出境TCP连接。只需要启动大量的出境连接,然后观察如果在一定数量的连接之后连接是否受到了阻止,即可判断Honeywall的存在。第二种方法是利用Snortinline软件,它检测出从Honeypot向外发出的含有的攻击特征的攻击数据包,发出报警信息并对攻击数据包加以抛弃或修改,使其不能对第三方网络构成危害。通过建立一些包含匹配Snortinline的数据库的字串的网络通信,然后检查是否收到目的包或者检查收到的通信是否是原来的格式,从而识别出Honeywall的存在[13]。

1.2.4 基于系统内核的识别技术

蜜罐技术的发展趋势越来越偏向于系统内核,比如蜜罐系统中常常会使用类似Rootkit的隐藏技术[9],与真实系统的差别越来越小,对蜜罐的识别难度越来越高,所以蜜罐识别技术也同样向着系统内核方向发展,对操作系统透彻的了解,从系统的角度去看待问题、分析问题、解决问题,这将是蜜罐识别技术发展的方向。

(1) 对隐藏技术的检测

高交互性蜜罐通常采用内核级的隐藏技术,基本思路是劫持内核函数来达到隐蔽对象的目的。主要有隐藏模块、隐藏文件、隐藏进程、隐藏连接等技术。文献[14,15]详细地说明了针对隐藏技术的识别方法。

(2) 识别UML

UML(User-mode Linux)允许在一个Linux系统(主机)上运行另外一个Linux系统(客户机),客户机可以作为蜜罐使用,和VMware类似,它同样是虚拟的系统,并没有使用实际的硬盘,而是使用一个叫UDB的虚拟IDE设备。通过查看关于UML的系统配置文件,例如检查一下/etc/fstab和目录/dev/ubd,或者运行mount你就会发现运行在一个UML system内,当然这些信息可以被伪装。

2 基于蜜罐特征的识别技术

Honeypot构建在现有网络技术基础上,虽然采用了各种的隐藏方法和技术,但是Honeypot必然有它自己的特征,而这些特征就是攻击者识别的依据。这些特征可以分为个性和共性两类。个性特征则是针对某一种特定Honeypot技术或者产品的,而共性特征是一般Honeypot都具备的。

2.1 基于蜜罐个性特征的识别技术

在实际的应用中,由于Honeypot产品和技术的不同,针对特定的Honeypot进行识别的技术也是多种多样。上文所讨论的对Honeyd,Sebek,虚拟机和UML的识别就是针对这四种典型Honeypot应用的识别技术。

2.2 基于蜜罐共性特征的识别技术

蜜罐的共性特征主要包括有两大类别:TCP/IP协议栈[16]和网络特征[17,18]。

2.2.1 基于TCP/IP协议栈的识别

不同的操作系统有不同的网络协议栈行为,攻击者通常会运行指纹识别工具引入操作系统特定的指纹,如使用Nmap指纹库作为TCP/UDP连接的参考;使用Xprobe指纹库作为ICMP包的参考。

基于TCP/IP协议栈的操作系统识别是比较成熟的技术,这方面的常用工具有Nmap,Queso等。在比较简单的低交互度的一些Honeypot中,仅仅在应用程序级别模拟操作系统,并没有对协议栈进行模拟,如Specter假如模拟的操作系统和本机的操作系统不相同,攻击者利用协议栈的指纹识别可以发现正在攻击的操作系统和识别出的操作系统类型不符,从而判断蜜罐的存在[19]。

2.2.2 基于网络特征的识别

网络特征主要包括连接数目、网络流量、数据包内容、TCP/IP值、网络延迟和路由以及重定向等。

利用网络连接识别,例如对Honeywall的检测就用到了该方法。

利用网络流量识别,例如针对Sebek的“DD-attack”就是采用这样的方式[11]。

利用数据包内容识别,例如对在蜜罐中广泛采用的Snortinline技术的检测。

利用网络延迟或路由识别,这种方法通常被用来识别目标主机和蜜罐主机部署在不同地区这一类型。例如文献[20]中Lance Spitzner为解决蜜罐部署和管理困难的问题而提出的Honeypot Farm概念。

3 蜜罐识别技术分析

对低交互性蜜罐系统的识别,主要集中在模拟技术的检测上。这种蜜罐只允许入侵者做很少的交互,配置简单、易用,安全性高,但同时由于存在着较为明显的特征或指纹,很容易被有经验的黑客识别。

高交互性蜜罐的检测、识别工具,虽然非常有效,但是检测思路主要集中在某一特定蜜罐组件或某一蜜罐隐藏技术上,检测思路单一,存在较大的局限性,易漏报或误报,并且无法检测未知的蜜罐系统。

4 结 语

蜜罐识别技术发展迅速,但目前国内外还没有一个组织或个人对蜜罐识别技术进行综合性的应用化、工具化。若能够将多种蜜罐识别技术相结合,会明显地增强蜜罐的识别性,促进蜜罐识别技术的发展,也能促进蜜罐技术和网络安全技术的发展。所以如何使各种蜜罐识别技术相融合、相综合,使蜜罐识别技术得到更好的应用,成为蜜罐识别技术领域亟需解决的问题。

摘要:为了进一步推动蜜罐识别技术的发展,讨论了目前针对低交互性蜜罐和高交互性蜜罐的识别原理和识别方法,阐述蜜罐的设计思想和实现机制,在前人的基础上进一步提出了基于蜜罐特征的识别技术,即通过蜜罐个性指纹、协议栈和网络特征分析蜜罐个性特征和共性特征,进而对蜜罐进行识别,最后对蜜罐识别技术进行了分析和展望。

基于观点挖掘的产品特征提取 篇9

电子商务的蓬勃发展,激发了网络购物的热潮。网络评论不仅作为反馈机制帮助生产者和销售商提升产品性能,而且有效帮助客户做出合理的决策,然而评论信息的迅速增长,迫切需要借助一定的技术手段来使这一过程变得更为准确而便捷。网络上现有的星级评定已经不足以帮助生产者、销售者和客户清晰定位产品的优势所在和劣势所在。目前,基于产品特征进行观点挖掘已经引起人们的广泛关注。

产品特征指的是产品的部件,属性,以及性能等对象。产品特征提取的方式有两种,人工定义和自动提取。Kobayashi N等[1]人工定义了汽车的特征词,Zhuang L等[2]人工定义了电影的特征词,Liu B等[3]采用关联规则,利用Apriori算法获得频繁项集的方法自动获取产品特征候选集(名词或者名词短语),李实等[4]在中文语料中,采用基于Apriori算法的非监督型产品特征挖掘算法,实现产品特征的信息挖掘,Somprasertsri G等[5]根据句法分析,采用特征词与情感词的6种不同关系获取产品特征,Wei C P等[6]采用语义学方法利用情感词对特征词做剪枝处理。由于人工定义具有领域局限性,不同领域需要不同的领域专家来确定该领域的特征词,且移植性较差,本文采用自动提取方式,根据产品呈现在网络上的方式和特点,搭建了产品信息-整体评论-细节评论3层模型提取产品特征,该模型针对不同层的层次特点,采用了不同的提取方法,此外,该模型将上层的特征词定义为下层的停用词以及在第三层中加入依存关系,成功地实现了对特征项降维的目的,从而提高特征提取的效率。产品特征提取的整体流程如图1所示。

1 数据准备以及预处理

本文基于网络爬虫的页面解析技术从google购物页面(http://www.google.com/shopping.)抓取了产品名称为Canon EOS Rebel T3i Digital SLR Camera的产品信息和客户评论。产品信息如例句1所示,包含产品标题和产品属性,客户评论例句2所示,“[t]”代表评论标题,“[c]”代表评论内容。抓取客户评论共434条,整体评论和细节评论分别包含379句和3293句。

例句1:

February 2011-Canon-SLR-18 megapixel-Optical Viewfinder-Crop Sensor-3 x optical zoom-CMOS-Pop-up Flash-ISO 12800

例句2:[t]Awesome camera.[c]Pros:Picture quality,tilt screen,shooting in live mode.Cons:Can't see focus points in live view,so many buttons for a beginner.I love this camera,but I learned real fast how little I THOUGHT I knew about photography.The Rebel still turns out fantastic photos even in the hands of an amateur。

由于高质量的挖掘结果取决于高质量的数据,因此数据的预处理是知识挖掘过程的重要步骤。下面4步预处理过程都是为特征项的有效提取做准备。

1)分句,采用stanford cor NLP提供的开源包中类Maxent-Tagger(http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/tagger/maxent/MaxentTagger.html.)提供的分句方法tokenizeT ext(Reader r)对文本文档分句处理。

2)词性标注,识别句子中各词的词性,缩小特征项候选集的范围,是此项预处理工作的重心。本文利用工具JText Pro(http://jtextpro.sourceforge.net/.)中的CRFTagger进行词性标注。

3)停用词,指那些原来在英语中会遇到很多a,the,or等使用频率很多的字或词,常为冠词、介词、副词或连词等。在本文中,停用词还有另外一种特殊定义,在3层模型中,上一层提取出来的特征词将作为下一层的停用词,这样可有效提高下一层特征提取的效率。

4)词根还原(词缀修剪),主要是把同一单词的不同形式还原成标准形式。在显式特征提取阶段,由于抽取对象主要是名词,因此只需将复数名词还原成单数名词,而不必整体还原,增加工作量。

对例句2中的评论信息经过以上4步预处理后,评论信息将转变为如图2所示的文本信息。

其中,NN指名词,JJ指形容词,RB指副词,VBD指动词过去式,VBG指动词的现在分词。

2 特征提取

本文根据产品在网络中的页面形式,搭建了3层模式对产品进行显式特征提取,第1层为产品信息层,主要指的是产品标题和产品属性;第2层为整体评论层,即综述产品的优缺点;第3层为细节评论层,详细阐述对该产品的具体看法。在一些特殊情况下,客户仅发表整体评论或表述细节评论,这并不影响产品特征的提取。3层模型有以下好处:

1)各个层之间产品特征提取方法相互独立,各层可根据其独特特点选择不同的算法。

2)各层之间又存在联系,上层对下层共享其已提取的产品特征,下层就可避免提取和上层相同的特征。

根据产品特征的形式,产品的特征有两类,由单名词所描述的特征和由名词性短语描述的特征。

2.1 产品信息部分提取产品特征

第1层产品信息层包含产品标题和产品属性,如例句1所示。

标题信息一般包括产品名称和这个产品的特色,通常由介词“with”将产品名称和特色分隔开。产品名称,代表整个产品且频繁出现在评论信息中,因此不需要对其提取,将这部分的词作为停用词加入到停用词词表中;特色部分,提取词性为名词的词如lens。

属性信息为销售商对产品参数的简单描述,它的特点是各个属性间有明显的分隔符,各个属性描述短且仅有一个特征词,如本例中各属性用“-”分割,提取属性短句中词性为名词的词作为特征词,得出megapixel,viewfinder,sensor,zoom,cmos,flash,iso。显然,此部分提取结果如viewfinder是产品的部件,megapixel为图像的属性。因此,这部分不仅易发现特征词而且特征词提取的准确率较高。

2.2 整体描述部分提取特征

整体评论,指含有pros、cons等情感比较明确的评论信息。语料分析发现如词downsides、upsides有类似于pros、cons的效果,因此含有downsides和upsides的句子也属于整体评论。

对pros句和cons句特征提取的有Lopez A等[7]Liu B等[8],分别对xml文件如“Picture quality,tilt screen”和文本文件如“pros:Picture quality,tilt screen”通过训练语言模型,识别产品特征,然而整体评论并非都如此简洁,因此本文在此层提取产品特征的思路类似文献[3]但又有所不同,本文采用FP增长算法[9]获得频繁项集作为特征候选集,此算法对于挖掘长的和短的频繁模式都是有效的和可伸缩的,大约比Apriori算法快一个数量级。FP增长算法包含2个方法,构造Fp_tree和FP树的挖掘FP-growth(Tree,α)。

构造Fp_tree算法描述如下:

1)首先扫描一遍事务数据库D,得到1频繁项的集合L。

2)创建FP-Tree的根节点,标记为“null”。

3)对每个事务Trans中的频繁项进行排序,得到[p|P],其中,p是事务Trans中的第一个元素,而P是剩余元素的列表。

4)调用insert_tree([p|P],T),如果T的某个孩子N,满足条件N.item-name=p.item-name,则N的计数增加1,否则创建新节点N,将其计数设置为1,链接到它的父节点T,并且通过节点链结构将其链接到具有相同item-name的节点。如果P非空,则递归调用insert-tree(P,N)。

FP树的挖掘FP-growth(Tree,α)算法描述如下:

1)if Tree含有单路径P then

2)for each路径P中节点的组合(记作β)

3)产生模式β∪α,其支持度计数support_count等于β中节点的最小支持度计数;

4)else for Tree的头表中的每个ai{

5)产生模式β=ai∪α,其支持度计数support_count=ai.support_count;

6)构造β的条件模式基和β的条件FP-Tree,即Treeβ;

7)If Treeβ≠Φthen

8)调用FP_growth(Treeβ,β);}

为了提高频繁项集是产品特征的精确度,对频繁项集剪枝采用两种方式:紧密度剪枝和冗余度剪枝。候选特征项中多于1个词的候选特征短语中各个词在文本内出现的位置相对较近,而相距较远的词组合而成的词组可能是无意义的,因此紧密度剪枝指的是去除在特征候选集中无意义的频繁项集。秉承词组的优先级高于单个单词的优先级原则,如句子“Good image stabilization.”,选择词组“image stabilization”作为产品特征明显优于选择“image”或者“stabilization”更能展示用户的表达中心点,而“image”或者“stabilization”作为“image stabilization”的子特征,如果其在文本中单独出现的次数小于最小支持度,将剪除,因此冗余度剪枝指的是去除特征候选集中无法完整表述产品特征的频繁项集。

2.3 细节描述部分提取特征

细节评论:指的是不是整体评论的评论。

第3层的文本信息远远多于第1层、第2层的文本信息,如何高效率、高质量地提取产品特征是本层的重点。在构建事务数据库时,由于前两层的产品特征作为此层的停用词,因此工作量的减少可实现高效率提取产品特征,但由于此层需要补充的产品特征较之此层的产品特征将大大减少,干扰词如beginner,friend等词比例增大,这些词虽然是名词,但不是与被评论对象相关的概念特征,如何剔除这些词实现高质量的提取产品特征对此层来说是个难题,经过语料分析和文献调研发现,依存分析作为句法分析的方法之一得出的依存关系可以明确地表明词语间的支配关系。根据这种支配关系,发现特征词一般受到修饰词的修饰来表达对其的喜怒哀乐情感。如句子“It is fast,great size,and a good weight.”,得出依存关系“nsubj(fast-3,It-1)cop(fast-3,is-2)root(ROOT-0,fast-3)amod(size-6,great-5)conj_and(fast-3,size-6)det(weight-11,a-9)amod(weight-11,good-10)conj_and(fast-3,weight-11)”,此句的“size”和“weight”分别被“great”和“good”修饰,因此可以得出这样的结论,被修饰词修饰的词更有可能是特征词,研究和实验分析得出,其中依存关系amod(名词-index,形容词-index),pobj(介词-index,名词-index)能发现特征词。

此层预处理部分不需要词性标注,因为依存分析中暗含其词性,句法分析自动分析出句子的语法结构和词与词之间支配关系,为了保持句子的完整性,停用词仅作为依存分析提取的词筛选条件,如果不是停用词将加入事务数据库D中,然后再对事务数据库D提取频繁项集及对其剪枝处理。

3 实验结果分析

特征标注阶段选择了两位和本研究无关的同学,分别标注了语料中所描述的产品特征并互相进行了验证,最后确定88个产品特征。

本文采用最经典的评估方法,准确率(precision),召回率(recall)和平衡它们两者的F值(F-score)对我们的特征提取算法进行评价:

其中,F(A)代表从语料中提取产品特征正确的集合,N(A)代表从语料中提取特征的集合,M(A)为语料中标定的特征集合。

一层模型是相对于三层模型定义的,指语料作为整体。语料经预处理后,获取频繁项集及其对此剪枝后获取的结果作为产品特征,经过以上3项评估,实验结果如表1所示。

在三层模型中,不仅对逐层进行了评估,而且对第3层中是否采用依存分析筛选候选特征词都进行了评估。实验结果如表2所示。

由以上实验结果可知,本文中搭建的三层模型优于传统的一层模型提取产品特征。细节评论层(A)、细节评论层(B)虽然都采用了三层模型,但分别指的是没有经过依存分析筛选获得候选特征词和采用依存分析析筛选获得候选特征词两种情况,实验结果还说明了加入依存分析的算法得出的结果优于没有采用此算法的。

虽然细节部分经过依存分析这种方法去除了部分干扰项,但干扰项的比例还是较大,一方面原因是句法分析本身不可避免的错误,另一方面,干扰词和特征词在句法中有很大的相似性,造成了此部分准确率较差,但总体召回率有明显提高,F值也达到了72.94%的好成绩。

4 结语

在充分调研现有产品特征提取算法的基础上,一方面搭建了有优越性3层模型,第1层产品信息的绝对精简利用简单预处理就可直接提取产品特征且正确率很高,第2层和第3层相比,评论数量占用了10.32的比例就可提取准确率达到83.33%,召回率达到56.82%的好结果,第3层虽然准确率有所下降,但召回率方面有了明显的提高;另一方面句法分析中的方法之一依存关系,此方法在第3层不仅剔除了干扰项,达到了降维目的,而且提高了这一部分准确率。

3层模型提取产品特征和依存分析关系的筛选特征候选集提取更加有效的特征侯选集对特征提取工作都有很好的研究价值。

摘要:探索产品特征,以帮助生产商和服务商有针对性地改进产品性能和指导用户对产品的各个性能有比较全面的了解。通过分析产品信息和评论信息,搭建3层挖掘模型实现基于观点挖掘的产品特征提取,第3层挖掘模型创新性地使用关联规则和依存分析相结合的方法。采用网络爬虫技术从互联网获取实验数据,实验结果证明该模型和该方法的有效性。

关键词:观点挖掘,产品特征提取,关联规则,依存分析,网络爬虫

参考文献

[1]Kobayashi N,Inui K,Matsumoto Y,et al.Collecting evaluative expressions for opinion extraction[C]//IJCNLP'04 Proceedings of the First international joint conference on Natural Language Processing,Berlin,Heidelberg:Springer-Verlag,2005:596 605.

[2]Zhuang L,Jing F,Zhu X Y,et al.Movie review mining and summarization[C]//CIKM’06 Proceedings of the 15th ACM international conference on Information and knowledge management.New York,NY,USA:ACM 2006:43 50.

[3]Hu M,Liu B.Mining and summarizing customer reviews[C]//KDD’04 Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining,Seattle,Washington,USA,Aug22 25,New York,NY,USA:ACM,2004:168 177.

[4]李实,叶强,李一军,等.挖掘中文网络客户评论的产品特征及情感倾向[J].计算机应用研究,2010,27(8):3016 3019.

[5]Somprasertsri G,Lalitrojwong P.Extracting product features and opinions from product reviews using dependency analysis[C]//Proceedings of FSKD.2010 Yantai,Shandong,10 12 Aug.2010:2358 2362.

[6]Wei C P,Chen Y M,Yang C S,et al.Understanding what concerns consumers:a semantic approach to product feature extraction from consumer reviews[J].Information Systems and E-Business Management,New York,NY USA:Springer 2010,8(2):149 167.

[7]Lopez A,Veale T,Majumder P.Feature Extraction from Product Reviews using Feature Similarity and Polarity[R].Computer Science and Informatics,2009.

[8]Liu B,Hu M,Cheng J.Opinion observer:analyzing and comparing opinions on the Web[C]//Proceedings of the 14th international World Wide Web conference(WWW-2005),New York,NY,USA:ACM(2005),2005:342 351.

基于互补特征的桥梁识别方法 篇10

桥梁作为重要的交通枢纽,大多位于主干道路与河流相交处,由于桥梁位置的特殊性,桥梁目标的自动识别和精确定位不论在军用还是民用上都具有重大意义。桥梁自动识别一直是计算机视觉与模式识别研究领域的重要研究方向,也是图像处理领域的一个研究热点。近年来,国内外一些学者提出了针对不同情况的桥梁识别算法。

徐胜荣等研究了远距离侧拍桥梁的识别,将识别过程分成低、中、高三个处理层次[1]。低层处理时,由原图和梯度图像的直方图得到二值化图像和水域团块基元及相应的边缘曲线;中层处理用HOUGH变换进行线条检测和线条关系的分析,得到假设的目标;高层处理进行“模型匹配推理”,利用置信度方法进行验证,该算法应用了桥梁存在两条平行长直线特征。

Hou Biao等人采用小波变换进行去噪,并保留河流边缘,采用OTSU阈值方法进行图像分割,对提取的水域进行细化操作,得到河流的中轴线,通过寻找相距比较近的线段端点找到桥梁[2]。该算法认为桥梁和陆域的灰度值接近,相对较亮,水域灰度值较低,图像的直方图峰谷明显,可以采用一般的阈值分割算法进行图像分割来提取水域,但对于存在多峰,或者峰谷不明显,一般的分割方法都不能很好地分割。

Wu Fan等人采用光学图像和SAR图像结合办法来寻找桥梁,先在SAR图像中找到感兴趣区域,然后在光学图像中验证桥梁的存在[3]。该算法对SAR图像和全色单波段图像的桥梁进行识别,不能充分利用多光谱图像的颜色特征。

这些桥梁识别算法主要存在以下两个问题。这些算法都针对单一图像源,桥梁识别率低,无法满足实际应用需求[4,5,6];许多算法认为桥梁的首要特征就是它自身的几何特征即两条平行的长直线[7],但是由于传感器的视角,观测距离的原因,或者由于堤坝、草地、桥墩、桥顶或者拱桥等因素的影响,在实际观测中,遥感影像中并不一定存在平行的长直线或某几条长直线。本文提出了利用桥梁在多光谱、全色和SAR图像中的互补特征进行桥梁识别的方法,有效提高了桥梁识别的正确率,同时,本文针对SAR图像噪声干扰强,桥梁边缘信息容易丢失等问题,提出了区域均值比特征提取方法。

1 遥感图像特性

多光谱图像中,通常的大型桥梁宽度仅为1-3个像素,长度小于20个像素,提取桥梁经常会出现漏检或者虚警。多光谱图像水域和陆地颜色差别大,因此可以利用多光谱的颜色特征提取水域,同时提取潜在的桥梁区域。

全色图像桥梁目标特征显著,但很难提取河流区域,区分全色图像水域和桥梁有较大困难,利用纹理特征提取全色图像水域方法运算量太大。

SAR图像人造目标灰度值明显高于其他目标[8],容易提取人造目标,但很难区分桥梁和其他人造目标。由于SAR图像成像机理的影响,存在大量的相干斑噪声,对于目标识别存在很大影响,现有的去噪方法不能完全去除噪声干扰,这也是造成虚警的重要原因[9,10]。SAR图像桥梁常存在断裂现象,没有很好的平行线特性。SAR图像桥梁识别的算法现在仍然处于起步阶段,对于桥梁的断裂和虚警问题一直没有得到很好的解决。由于噪声干扰和阴影影响,桥梁的定位也可能存在偏差,需要寻找更好的算法进行精确定位和目标识别。

桥梁在不同的遥感图像中具有各自独特的特征。桥梁在多光谱图像中具有颜色特征,在全色图像中纹理特征明显,在SAR图像中桥梁为亮色调,具有区域均值比特征。有效地组合多源图像特征,发挥不同传感器的优势,可以获得目标完整的特征,有助于提高目标识别率。

2 桥梁识别方法

本文处理的主要是包含水域的遥感图像,感兴趣的目标是桥梁和水域,重点在于利用多光谱、全色、SAR图像的互补特征进行桥梁识别。如果只用多光谱图像进行桥梁识别,由于多光谱图像分辨率较低,提取桥梁经常会出现漏报或者虚警;如果只用SAR图像进行桥梁识别,SAR图像桥梁边缘常存在断裂现象,同时SAR图像存在大量的噪声,对于目标识别存在很大影响,容易造成虚警和漏报;如果只用全色图像进行桥梁识别,河流的灰度层次丰富,河流区域很难提取,如果不利用河流的位置来提取桥梁,计算量太大。

考虑到上述原因,本文利用多源遥感图像桥梁识别方法进行桥梁识别。首先利用多光谱图像颜色特征进行水陆分割,得到潜在桥梁区域,利用全色图像的纹理特征和SAR图像的区域均值比特征对潜在桥梁区域进行桥梁识别,结合三者的结果,给出最后识别结果,有利于解决单一图像源进行桥梁识别运行速度慢、虚警率高的问题。多源遥感图像桥梁识别方法的具体步骤如下:

(1)读入多光谱图像,对其进行HSV空间转换。RGB颜色模型到HSV颜色模型的转换公式为:

MAX和MIN分别为RGB颜色模型中R、G、B三分量的最大和最小值,R、G、B分别为三个分量的灰度值,H、S、V为得到的HSV颜色模型三个分量的灰度值。对H、S、V三个分量分别进行迭代阈值处理。由于数据量过大,为了提高软件运行速度,因此需要对三个分量进行降维处理:求出分量灰度的最大值和最小值的差,差除以需要的维数就是每次灰度递增的数值。其中H分量由于值过小,需要乘以360放大其数值。

(2)分别对H、S、V三个分量进行膨胀、腐蚀等数学形态学预处理。

(3)求出图像的最大灰度值和最小灰度值,分别记为Zmax和Zmin,令初始阈值为:

根据阈值Tk将图像分割为前景和背景,分别求出两者的平均灰度值ZO和ZB;求出新阈值:

若Tk=Tk+1,则Tk即为阈值;否则转第二步,迭代计算,直到最终阈值。

(4)用8邻域搜索去掉小面积干扰区域,得到水陆分割结果。设边缘图像的目标像素为0,背景像素为255,按从上到下、从左到右的顺序扫描图像,遇到目标像素P,则标记为新的标记值L;以P为种子点,将其8邻域内的目标像素标记为L,直到该连通区域标记完毕。继续扫描图像,直到图像中所有目标像素都标记完毕。对标记完的区域计算面积,设置阈值,去掉面积小于阈值的区域。三个分量所得的结果分别取其相同位置的最大值。

由于每个多光谱图像的水域和陆地颜色各不相同,三个分量水域和陆地的特性也都不一样,因此需要用所得结果的白色区域面积判断所得结果是否正确,如果面积小,就对分量进行反运算,再进行判断,直到面积达到一定阈值为止。

(5)使用形态膨胀和形态腐蚀算子对水体区域进行规整。考虑到噪声和桥梁目标的尺寸,定义膨胀和腐蚀的结构元素均为:

对图像中的像素点先做n次膨胀运算,然后再做n次腐蚀运算,即可去除噪声,得到连通的河流区域。将连通后的河流区域和水陆分割二值化图像相减,得到包括潜在桥梁区域在内的一个连通区域。

以连通区域的每个像素点为中心,向8个方向延伸k个像素的长度,k不能小于桥梁的宽度。设变量为a,相反方向的一对像素点的值如果相同,a值取1,如果相反,a值取0。将4对像素点所得的a值相加,所得的和越大,说明这个中心像素点属于桥梁区域的可能性越大。设定阈值,经过判断,得到潜在桥梁区域。

(6)首先产生潜在桥梁区域的灰度共生矩阵GLCM,通过计算两灰度值在区域中水平相邻(右上角45°方向、竖直方向(即90°方向)、左上角135°方向)的次数得到灰度共生矩阵,GLCM中的每一个元素代表灰度i与灰度j在区域中水平相邻(右上角45°方向、竖直方向(即90°方向)、左上角135°方向)的次数。

式中,等号右边的分子是具有某种空间关系、灰度值分别为i,j的像素对的个数,分母为像素对的总和个数。

因为动态求取区域的GLCM区间代价过高,本文首先将灰度值转换到I的灰度区间。由于图像是一个灰度图像,转换到8级。为了保证准确率,返回四个方向的灰度共生矩阵。

为了进行纹理分类,首先提取各类样本,统计各类纹理特征,找出最大差异的纹理量,作为特征量进行识别。对输入全色图像进行纹理分析,输出纹理分析的结果,并以不同的结合方式辅助桥梁识别。实验结果表明,能量、对比度、同质性纹理特征这三种纹理特在纹理特征量上差异最大,因此计算灰度共生矩阵的特征,分别提取全色图像的能量(式(8))、对比度(式(9))、同质性纹理特征(式(10)),并实现全色图像桥梁识别。p(l1,l2)表示共生矩阵的值。

(7)根据SAR图像得到潜在桥梁区域的区域均值比特征,确定阈值,识别桥梁。将(6)和(7)桥梁识别的结果进行决策层融合。利用全色、SAR图像桥梁识别结果为真的或关系(OR规则)给出最后桥梁识别结果为真的识别结果,利用全色和SAR图像识别结果为假的与关系(AND规则)给出最后桥梁识别结果为假的识别结果。采用决策层融合,所需要处理的数据量小,可以提高识别速度。

SAR图像桥梁常存在断裂现象,且桥梁边缘线性特征不明显,对于噪声比较敏感,因此只用形状特征、位置特征检测桥梁容易造成虚警和漏检。本文提出了SAR图像区域均值比特征提取桥梁的方法。SAR图像对人造目标(特别是金属目标)形成的角散射体等十分敏感,人造目标在SAR图像中表现为特别亮的点或者区域。区域均值比反映了SAR图像在区域内的相对亮度均值大小,区域均值比大,则趋于SAR图像非平稳区域,即城市建筑、公路桥梁等。区域均值比特征有利于保持目标形状,可以较好地保护图像中的边缘,因此,本文使用区域均值比特征筛选潜在桥梁区域,有助于解决SAR图像桥梁识别难的问题。区域均值比的计算公式如下:

n为区域的像素个数;f(i,j)为SAR图像在点(i,j)处的亮度值;M、N分别为图像的高度和宽度;u(k)表示SAR图像在区域k的亮度均值;u表示SAR图像的亮度均值。

多源遥感图像桥梁识别方法流程图如图1所示。

3 实验结果及分析

为了验证本文方法的有效性,采用多组多光谱、全色和SAR图像进行了实验,下面给出其中四组图像,如图2-图5所示。从图像中可以看出,多光谱图像桥梁的分辨率低,不容易提取桥梁;全色图像的桥梁边缘明显,但是水域灰度层次丰富,不易提取水域;SAR图像桥梁的边缘线性特征不明显。图2中有一个桥梁,图3、图4中有两个桥梁,图5中有五个桥梁;图3和图4的两个桥梁基本上是平行的,图5的五个桥梁不平行;图2、图3、图5的河流比较弯曲。

3.1 经典桥梁识别方法

经典桥梁识别方法主要包括多光谱融合的图像分割、基于辐射统计特征的桥梁识别以及河流中线法桥梁识别。

(1)多光谱融合的图像分割。首先采集红色、绿色和近红外3个波段光谱图像,采用R+IR、2G-R-IR、R+G+IR、G+IR、G+R、IR-R等融合方式,然后利用最大方差自动取阈值法确定阈值,并根据此阈值分割图像。这种通过融合后图像分割的方法不能充分利用桥梁在遥感图像中的互补特征。多光谱融合方法桥梁识别结果如图6所示,多光谱融合分割只利用水域和桥梁的拓扑关系特征,融合后部分河流边缘区域和河流内部被误识别为桥梁。

(2)基于辐射统计特征的桥梁识别。利用SAR图像的Pun熵作为识别判断的依据。由于Pun熵反映图像灰度分布情况和信息丰富程度,一般不随目标变形而发生改变,因此具有很好的普适效果。但是桥梁的Pun熵与误识别为桥梁的河流边缘差别不大,因此容易出现虚警和漏检。基于辐射统计特征的桥梁识别结果如图7所示,四组图像桥梁识别虚警率很高。

(3)河流中线法。先用水域和桥梁的相邻关系确定感兴趣区域,再利用连通河流的中轴线必穿过桥梁这一特性去除干扰区域,很难精确确定河流的中轴线。河流中线法桥梁识别结果如图8所示。桥梁1有一部分桥梁没有检测出来,桥梁2有一部分被误检为桥梁,桥梁4有一个桥梁没有识别出来。河流中线法对河流两岸较平行的桥梁识别结果较好,但是对弯曲的河流桥梁检测容易出现误检。

桥梁识别方法还有基于双级并行点火脉冲耦合神经网络模型、基于支持向量机的SAR图像桥梁目标检测、方向比值法、最短距离法等。本文只与以上三种经典桥梁识别方法进行实验比较。

3.2 结合多源遥感图像互补特征的桥梁识别方法

图9到图12给出了单一图像桥梁识别结果。可以看到,多光谱图像将一部分河流区域误识别为桥梁,特别是河流边缘部分。全色和SAR图像桥梁识别结果虽然也有虚警和漏检,但是比多光谱图像桥梁识别的正确率高。

本文利用颜色特征提取多光谱图像中桥梁所在的背景即河流,然后限于河流区域来提取潜在桥梁,根据潜在桥梁区域在全色图像中的纹理特征和SAR图像中的区域均值比特征来识别桥梁,以全色图像的桥梁识别结果为主,SAR图像的桥梁识别结果为辅,利用OR规则在决策层融合,以提高识别率和可靠性,以弥补光学成像遥感在天时、天候、云层覆盖、存在伪装和隐蔽目标等情况的不足。该方法结果见图13到图16。

从图13到图16结合多源遥感图像互补特征的桥梁识别方法结果可以看到,结合互补特征后桥梁识别正确率明显提高,虚警率明显低于单一图像识别。本文桥梁识别准确率和误检率统计结果如表1所示。

结合多源遥感图像互补特征的桥梁识别方法产生漏检和虚警的主要原因如下:

(1)阈值不能适应所有图像;

(2)有的图像中某些桥梁部分比较模糊,无法识别桥梁;

(3)多光谱图像水域和某些桥梁颜色比较相近,在水陆分割时被误检为水域。

本文利用多光谱图像的颜色特征进行水陆分割,得到潜在桥梁区域,分别提取全色、SAR图像潜在桥梁区域的纹理特征和区域均值比特征,结合三者结果,得到最终桥梁识别结果。

本方法充分利用桥梁在遥感图像中的互补特征,以全色图像的桥梁识别结果为主,SAR图像的桥梁识别结果为辅,在决策层融合以提高检测率和可靠性,以弥补光学成像遥感在天时、天候、云层覆盖、存在伪装和隐蔽目标等情况的不足。

目标识别因为操作复杂,非常耗时,使得某些需要快速目标识别的应用难以完成。本文先提取水域,再利用水域分割结果得到的潜在桥梁区域提取特征,减少了计算时间,识别速度如表2所示。不同的图像由于其大小不同,会造成识别速度不同。

4 结语

由于单一传感器在进行遥感图像目标识别时提取信息不够全面,不能有效地利用多源遥感信息的互补特征,导致目标识别率较低。因此,本文采用多传感器融合技术,综合利用多光谱、全色、SAR图像的互补特征进行桥梁识别,有效提高了桥梁目标的正确识别率;同时,由于SAR图像桥梁常存在断裂现象,且桥梁边缘线性特征不明显,没有很好的平行线特性,用形状特征等提取SAR图像等传统方法对于噪声比较敏感,因此只用形状特征、位置特征检测桥梁容易造成虚警和误检。因此,本文提出利用SAR图像的区域均值比特征提取桥梁的方法。本文方法只对水上桥梁进行识别,无法识别立交桥之类的桥梁,对于系统的不足之处将在后期的工作中继续完善。

参考文献

[1]徐胜荣,徐凡,叶秀清.基于知识的桥梁目标识别方法研究[J].模式识别与人工智能,1993,5(2):123-128.

[2]Hou&nbsp;Biao,Li&nbsp;Ying,Jiao&nbsp;Licheng.Segmentation&nbsp;and&nbsp;Recognition&nbsp;of&nbsp;Bridges&nbsp;in&nbsp;High&nbsp;Resolution&nbsp;SAR&nbsp;Images[C].IEEE,2001:479-482.

[3]Wu&nbsp;Fan,Wang&nbsp;Chao,Zhang&nbsp;Hong.Recognition&nbsp;of&nbsp;Bridges&nbsp;by&nbsp;Integrating&nbsp;Satellite&nbsp;SAR&nbsp;and&nbsp;Optical&nbsp;Imagery[C].IEEE,2005:3939-3941.

[4]李小娟,沈楠.基于多源信息融合的水上桥梁目标识别算法[J].计算机工程与设计,2008,29(22):5854-5859.

[5]蒋咏梅,刘伟.面向桥梁目标自动检测的多源遥感图像融合模型与方法[J].电子与信息学报,2006,28(10):1794-1797.

[6]Chul&nbsp;H&nbsp;Jung,Woo&nbsp;Y.Double-Step&nbsp;Fast&nbsp;CFAR&nbsp;Scheme&nbsp;for&nbsp;Multiple&nbsp;Target&nbsp;Detection&nbsp;in&nbsp;High&nbsp;Resolution&nbsp;SAR&nbsp;Images[C].2010&nbsp;Radar&nbsp;Conference,2010,3:1172-1175.

[7]刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2009,14(4):622-635.

[8]周小成,汪小钦,骆剑承.基于对象关系特征的高分辨率光学卫星影像水上桥梁目标识别方法[J].遥感信息,2010(2):36-42.

[9]陈生,王宏,沈占锋.面向对象的高分辨率遥感影像桥梁提取研究[J].中国图象图形学报,2009,14(4):585-590.

上一篇:专业群教学资源信息化下一篇:石灰土基层施工