视觉注意机制

2024-08-17

视觉注意机制(精选九篇)

视觉注意机制 篇1

关键词:注意机制,HOG,SVM,WTA

0 引言

行人检测是智能交通和驾驶辅助系统的重要组成部分。快速准确的检测行人可以辅助司机提高行车安全, 或者为智能车辆实现安全驾驶和自主导航提供关键技术, 因此, 这个课题近年来备受关注。

基于视觉的行人检测方法可以分为三大类:基于模板型、基于模型与基于学习型。基于模板型是以确定人体模板作为匹配初始条件, 但人体的模板求解比较复杂;基于模型是采用建立好的模板在图像上进行匹配, 从而完成车辆检测, 该算法容易受光线变化、行人的姿态变化的影响, 并对模板依赖较大, 而且行人的姿态太多, 统一建模困难;基于学习型的方法是通过提取人体的各种特征, 然后利用模式识别的方法进行分类, 其中基于梯度方向直方图 (Histogr am of Oriented Gradient, 简称HOG) 的特征描述行人的方法最为主流, 但是提取的人体特征向量维数较大, 使得计算量较大, 严重影响了实时性, 加上线性SVM作为弱分类器进行级联训练, 虽然节省了时间, 但需要在整个图像区域匹配, 影响了实时性与精确性。

针对以上的不足, 本文引入了视觉注意机制, 将模拟人类视觉注意机制的目标检测方法引入到行人检测中。在传统的注意模型[1]中加入形状特征描述, 提取颜色、亮度和形状等特征[2], 将各个特征通过一定的特征合并策略将各注意图合并成一张显著图, 以定位出行人检测区域。然后在行人检测区域利用行人训练得到的分类器进行检测。

1 基于注意机制的检测模型

人类视觉系统指导注意力分配的因素[3]有两个:自底而上的注意和自上而下的注意。其中, 自下而上的注意, 也称为数据驱动的注意选择, 是最具代表性的是基于特征整合理论的显著性检测模型。

该模型的基本思想是, 输入一幅图像, 通过线性滤波提取视觉特征中的亮度、颜色和方向三种特征, 通过边缘检测得到的边缘图形成对应的形状注意图, 在多种尺度下通过高斯金字塔、中央周边差和归一化处理, 形成相对应的亮度特征图、颜色特征图和方向特征图。这些特征图先经过特征内部的竞争, 形成颜色、亮度、方向的关注图, 然后通过特征之间合并生成最终的显著图, 再经过生物学中赢者取全WTA (Winners Take All) 网络, 提取行人检测区域。

自底向上的数据驱动模式采用的是Saliency Tool模型。设r、g、b分别对应于输入图像的红、绿、蓝信道, 于是可得灰度图L= (r+g+b) /3, 及高斯金字塔I (σ) 。为了从强度中分离出色度信号, 使用I来归一化r、g、b信道。因为亮度非常低的色度变化是觉察不到的, 所以归一化仅在灰度大于全图最大的1/10位置上进行, 而其他位置的r、g、b值则被赋为0。

归一化后建立4个宽调谐的颜色通道:红色R=r- (g+b) /2, 绿色G=g- (r+b) /2, 蓝色B=b- (g+r) /2和黄色Y= (g+r) /2-|r-g|/2-b, 负值则置为0。进一步根据这些颜色通道可建立4个高斯金字塔, 可得具有方向选择性的实Gabor金字塔O (σ, θ) 。

考虑3种特征, 亮度、颜色和朝向。若中央周边差操作为Θ。

在人类视觉系统中, 该特征是由对暗中央亮周边或亮中央暗周边敏感的神经元来检测的。神经元在被一种颜色所激励的同时, 被另一种颜色所抑制, 而在感受野的周边则相反。在人类的视皮层中, 共有4种空间和颜色秸抗, 分别为红/绿、绿/红、蓝/黄和黄/蓝颜色对。

关于朝向特征, 用θ∈{0°, 45°, 90°, 135°}这4个方向的Gabor滤波器对亮度图进行滤波, 得到方向图。

其中, O (c, θ) 为实Gabor金字塔。

最后, 将3种特征进行合并, 生成显著图, 再根据WTA机制找到显著图中的兴趣区域, 映射回原图, 得到目标区域。

2 基于HOG与SVM分类器相结合的行人检测方法

方向梯度直方图[4] (Histogram of Oriented Gradient, HOG) 特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。通过检测窗口对整幅图像的整体信息转换为组向量数据集, 即HOG特征向量, 最后通过支持向量机 (Support Vector Machine, SVM) 判断人与非人。

2.1 HOG特征计算

HOG特征的计算过程如下:

1) 灰度化 (将图像看作一个x, y, z (灰度) 的三维图像) ;

2) 采用Gamma校正法[4]对输入图像进行颜色空间的标准化 (归一化) ;目的是调节图像的对比度, 降低图像局部的阴影和光照变化所造成的影响, 同时可以抑制噪音的干扰;

3) 采用简单的梯度算子下[-1, 0, 1]平方向Gh和垂直方向Gv的梯度值;

4) 计算梯度方向θ (x, y) ;

5) 将图像划分成小cells (例如6*6像素/cell) ;

6) 统计每个cell的梯度直方图 (不同梯度的个数) , 即可形成每个cell的descriptor;

7) 将每几个cell组成一个block (例如3*3个cell/block) , 一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。

8) 将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image (你要检测的目标) 的HOG特征descriptor了。这个就是最终的可供分类使用的特征向量了。

2.2 SVM分类器

支持向量机将向量映射到一个高维的空间里, 在这个空间里建立有一个最优超平面。在分开数据的超平面的两边建有两个互相平行的超平面。把待分类训练数据设为{Xk, Yk}其中取代表训练样本HOG特征向量, Xk代表样本种类 (人用l, 非人用-1) 。首先通过函数将Xk映射到一个高维的空间里, 然后用判断函数寻求最优超平而进行分类。本文应用台湾大学林智仁副教授等开发设计的快速有效的SVM模式识别的软件包。

其中, 对于那些与人体样本十分相似的非人样本, 在初始训练中, 很难分辨, 容易误判, 需要对其结果进行再次训练, 得到负样本集。这样可以提高检测率。

3 实验结果与分析

为了对本文的算法进行有效的评估, 选取了三段校园里拍摄的视频图像, 摄像头在拍摄过程中存在一定程度的抖动, 增加了检测的难度, 使得检测结果更具有效性。从每段视频中截取了20帧视频图像进行了实验分析, 检测结果如图1所示。

对上述实验结果分析可知, 本文算法可以较好的完成行人检测任务。

4 结束语

本文提出了一种基于视觉注意机制的交通标志检测方法。在传统视觉注意机制模型提取颜色、亮度、朝向特征的基础上, 增加形状特征, 根据显著程度找到感兴趣区域。实验结果表明, 该方法克服了由于颜色分割的不完善造成的形状检测失误的缺点, 在对各个特征之间相互独立检测的同时, 又考虑亮度和朝向特征在检测中所起的作用。注意机制在目标与背景颜色相近时提取显著图的效果较差, 并且本文方法整体的实时性较差。因此, 今后将对这两方面进行改进。

参考文献

[1]冯松鹤, 郎丛妍, 须德.一种融合图学习与区域显著性分析的图像检索算法[J].电子学报, 2011 (10) .

[2]许言午, 曹先彬, 乔红.行人检测系统研究新进展及关键技术展望[J].电子学报, 2008 (05) .

[3]田广, 戚飞虎.移动摄像机环境下基于特征变换和SVM的分级行人检测算法[J].电子学报, 2008 (05) .

注意力训练视觉材料 篇2

1.少小少少小少少少少少小少少少少小少少小少小少少少少少少小少“小”共()个

2.大太大大大太太大大大大大太大大大太大大大太大大大大太大大大“太”共()个

3.友友支友友友支友友友友友友支友支友友支友友友友支友支友友支“支”共()个

4.bbbpbbpbbbbpbbpbbbbbbbpbbbbbpbbpbbbpbbbbbbbpbbpbbbbbpbbbbp“p”共()个

5.*********8999999899898“8”共()个

二、从下面的数字行中把所有的9966圈出来

***699969696

***999666996

***996969966

***969966699

***699969696

三、找出下面英语单词中的字母“o”,用圆圈圈起来

homewhenbackworkthisgoodenjoypolitereadingclubbornafterslimlongmusichardswimmingshortwearhobbybadmintonvolleyballcourtfootballfieldpool

一、找出每组中与其他不一样的字,把他们圈起来,并记录有多少个。

1.少小少少小少少少少少小少少少少小少少小少小少少少少少少小少“小”共()个

2.大太大大大太太大大大大大太大大大太大大大太大大大大太大大大“太”共()个

3.友友支友友友支友友友友友友支友支友友支友友友友支友支友友支“支”共()个

4.bbbpbbpbbbbpbbpbbbbbbbpbbbbbpbbpbbbpbbbbbbbpbbpbbbbbpbbbbp“p”共()个

5.*********8999999899898“8”共()个

二、从下面的数字行中把所有的9966圈出来

***699969696

***999666996

***996969966

***969966699

***699969696

三、找出下面英语单词中的字母“o”,用圆圈圈起来

视觉注意机制 篇3

在计算机视觉研究中, 许多传统的方法往往以解决模式识别的分类问题为主要任务。很多工作也将人体检测作为模式分类任务, 通过人体的部分静态特征, 训练一些特定的分类器以检测人体。目前用作分类的特征包括HoG特征[1], 肤色[2], 形状[3], 轮廓[4]等。

近年来随着神经生物学和心理学等学科的发展, 计算机视觉研究者们越来越关注视觉注意机制, 提出了很多视觉注意计算模型, 这些模型的建立将视觉注意机制有效的运用于解决计算机视觉的具体问题中, 特别是拟人视觉注意选择机制提高了视觉监控系统的实时性并为解决信息冗余等问题提供了有效方法[5,10]。

为了使广大相关科研人员对基于视觉注意的人体检测和跟踪的研究现状有着更加清晰明确的了解, 该文将从视觉注意机制及其在人体检测和追踪中的应用两方面回顾相关的方法和技术。论文首先对视觉选择性注意机制及主要认知计算模型做重点阐述;其次, 从人体检测和追踪系统的一般处理框架, 即感兴趣区域选择, 特征提取和人体追踪三个层次, 分别介绍各阶段的主要方法和技术;最后分析研究难点, 同时对未来的发展趋势进行总结和阐述。

1 视觉注意机制及其计算模型

1.1 视觉注意机制

从心理学和神经生物学关于视觉注意的实验研究中发现, 生物的视觉系统通过两种方式利用信息来指导视觉注意[6,7], 即自底向上和自顶向下。自底向上 (Bottom-up) 是由纯外部因素决定, 如颜色, 方向, 运动, 二维或者三维空间中物体的连接特征等。通常这些特征也被称为视觉显著性特征, 它用来吸引或者刺激视觉从而引起注意[8]。自顶向下 (Top-down) 是根据与当前视觉行为有关的先验知识来预测和感知物体[9,11]。前者速度较快, 后者具有快速定位, 删除冗余信息等作用, 通常两者交织进行。

1.2 基于视觉注意机制的计算模型

对应Bottom-up注意机制的计算模型主要分为基于特征选择和基于空间的模型。Treisman首先提出“特征整合理论”[12], 该理论将视觉信息处理分为预注意与注意两个阶段。随后Koch和Ullman提出选择性视觉注意计算模型[13], 该模型将输入图像的特征分解再构成显著性映射图, 最后通过WTA (Winner-Take-All) 竞争神经网络形成一个中心表示 (central-representation) 。Itti实验室ilab在Koch&Ullman模型的基础上做了很多工作[14,15,16]。在计算机的许多领域中都得到了较为成功的应用, 如场景分析、图像分割和物体识别等, 成为其它模型的参照标准。

Koch和Itti的模型是数据驱动模型, 没有考虑先验知识因素, 处理结果完全由输入图像的特征决定。Sun等人结合自顶向下和自底向上的注意机制机制提出基于物体视觉注意的计算模型[17]。基于物体视觉注意的模型首先在物体显著图上进行分组然后引入分层选择性框架指导注意转移。该模型参照人类大脑认知过程和竞争机制, 为自顶向下模型提供了依据, 推动了结合自顶向下和自底向上机制模型的发展。

2 基于视觉注意机制的人体检测

基于视觉的人体检测方法一般首先从视频图像中检测出人体区域或人体轮廓, 然后进一步的确认和跟踪。一般将人体检测分成两个步骤:1) 目标与背景分割 (ROI选择) ;2) 分类 (人体模型匹配) 。

3 固定背景分割

3.1.1背景差分

背景差分是视频监控系统中一种最常用的方法[18,19,20]。它是利用当前图像与背景图像的差分来检测目标区域的一种技术。它将每一帧图像与事先存储的背景图像相减, 若差值大于某一阈值, 就判为前景, 且相减的结果直接给出目标的位置、大小和形状等信息。背景场景中存在各种物体, 特别是不同时刻光照、风向引起物体阴影或运动的差异造成图像序列中背景的差异和遮挡, 使背景模型的建立尤为困难。在背景的有限和平稳变化假设下, 文献[19]提出基于卡尔曼滤波的方法获得背景, 而文献[20]采用单高斯分布的方法。用多重假设描述渐变场景中的行为是背景建模和差分的一大突破[21]。在此基础上, 研究人员提出大量相关方法来解决背景中的平稳行为和有限变化。Monnet等人提出一个在线的自动退化模型来捕捉和预测动态场景中的行为[18], 希望能够减少动态场景对于准确检测的影响。

Stauffer和Grimson[22]提出了一种混合高斯函数 (MoG) 表示每个像素的方法, 在运行过程中用新的高斯函数来更新。这种更新通常是递归的, 它能处理有光照变化和重复动作的背景, 例如, 摇摆的树木。并根据统计规律在序列中挑选合适的点对背景进行恢复。该模型在背景无运动物体的时候, 连续采N帧图像, 用来实现对背景模型的初始化。假如, 对某一像素点, 采样值为X1, X2, …, XN, 这N个采样点就要用一个混合的高斯分布函数来近似地表示, 混合概率密度可用式 (1) 来表示[22]:

其中, K是高斯分布的个数, 一般取3至5个, ωi, t是第i个高斯分布的权重, μi, t是时刻t第i个高斯分布的均值向量, ∑i, t是其相应的协方差矩阵, η是高斯分布的概率密度函数, n是特征向量的维数。通常, 确定这些参数的方法有两种:EM (Expectation-Maximization) 算法和K-均值算法。EM算法是确定混合高斯模型参数的常用方法, 利用采样值, 通过迭代之后, 最终可将混合高斯模型的参数同时确定出来。

训练得到的K个模型, 并不是全都代表背景模型, 最后用一个阈值T来分离出背景模型。[22]

3.1.2 Bottom-up方法

Bottom-up方法模拟人类自底向上的视觉选择性注意机制, 提取图像的低层视觉特征并分类。这种方法主要根据颜色、纹理, 轮廓和运动等视觉的显著性特征将感兴趣的目标区域选择出来[23,24,25,26]。文献[23-24]在Itti-Koch模型[15,16]的基础上建立了自底向上的显著性区域选择模型, 并作为SaliencyToolbox[24]工具的一部分, 该模型介绍了一种从特征地图中推断注意位置原对象扩展的处理方法。文献[25]在此基础上加入Chan-Vese活动轮廓用于图像分割和注意位置的确定, 这个方法在提取ROI的测试中很成功。显著性区域的检测是提高人体检测处理速度的一种主要方法。文献[26]使用频率调整的显著区域检测方法获得全分辨率的显著性地图。通过扫描显著性区域而不是整个图像有效的加速人体检测过程。

在Bottom-up分割中, 由于分割的目标设定在不同的方法中有很大的差别, 在图像物体数目未知的情况下分割准确难度更大。更重要的是个体差异以及物体本身受光照、场景等内外因素的影响, 特征变化大, 物体与环境关系复杂等因素, 这些都会导致分割错误。因此, 分割结果在不同方法中有差异, 尤其是人的分割结果差异更明显。因此必须引入从高层往下的Top-down处理。

3.1.3 Top-down方法

Top-down分割特点可以描述为:学习己识别物体的形状, 结构和表面特征, 提取对物体的描述知识, 从单独物体到物体集合, 上升到对该类物体的共同的特征的认识, 建立先验模型, 并已知分割任务中的目标, 调整视觉特征线索的组合, 使得特定的物体在图像中的区域被分割出来。文献[27-29, 36]提出一些top-down, 特定类的分割算法。这些算法适合用于图像中已知物体的可变模型, 可变模型的形状给出所需分割的估计。文献[30]将top-down方法用于行人检测, 集成多次迭代且来源不同的根据。大型数据集的定性和定量的研究结果证实, 这种方法能够在拥挤的场面, 甚至当他们重叠和部分阻挡对方时可靠地检测行人。此外, 这种方法更灵活, 允许其在非常小的训练集上实施。

尽管Top-down分割强调的方面与Bottom-up分割不同, 但Top-down的实现不能脱离Bottom-up的基本技术, 简单区分两者只是方便研究。很多算法将两者结合起来, 如文献[31, 48]。

3.2 人体模型匹配

当目标物体被分割出来, 即获得了一组初始人体的假设后, 进一步确认涉及人体模型。这种模型通常是通过获得关于人体的先验知识建立的。经过这样的模型粗略分类进一步建立生成或鉴别模型[45], 一般引入视觉特征的划分和分类技术。对于行人分类无论是生成还是鉴别方法, 都是将给定的图像 (或子区域) 指定为行人或非行人, 这种指定取决于相应的类后验概率。生成和鉴别的模型之间的差异是如何估计每类后验概率。目前主流的生成模型包括2D[47]、3D[46]和其他的形状模型。与生成模型对比, 鉴别模型通过学习训练集中人体和非人体的判别功能的参数来判定。鉴别模型通常借助于物体的显著性特征, 如[36]引入人的头部检测, 头部特征的显著性为行人检测提供自上而下的知识指导, 克服了图像中行人大小变化和相互遮挡等情况的影响。

4 基于视觉的人体跟踪

目前有大量的工作致力于人体跟踪中轨迹信息推断, 通常跟踪是指当前帧中的目标在随后帧中找到最匹配的目标区域。有些方法是利用人体外观模型结合几何和动力学知识来跟踪[32,33,34,35].也有些方法在贝叶斯框架下合并检测和跟踪, 结合外观模型与观测概率推理。在这里, 无论是单线索[32]或多个线索[37]都有使用。

现实世界中, 行人跟踪的一个重要的问题是如何处理图像中的多个目标。有一种研究是使用粒子滤波器来进行多目标跟踪[39,40,41,42,43,44]。其中, 文献[39,41,42,43,44]采用一个联合状态空间来进行多目标跟踪, 这种方法的优点是对象间的相互作用能够被恰当的定义, 不足之处是其计算量随着对象数目的增多成指数增长。用单个对象状态空间的跟踪方法通常计算量不大[39,43], 相当于并行地执行多个单对象跟踪器。然而, 这类方法的不足之处是对象间的相互作用很难容易地建模。

受近年来人的视觉系统研究成果的启发, 生物启发机制被模拟并应用于人体跟踪, 特别是选择注意机制[36,37]。[48]在生物启发的注意系统VOCUS上, 结合top-down指导的搜索模块获取人体的最显著区域来追踪人体。[36]在处理视频信息时, 先通过自底向上的注意机制提取出显著点, 并融合生物合理的对立运动显著性排除步相关区域, 显著点的运动和位置信息提取出来之后用进行成组 (Grouping) 操作, 运动和空间位置相似的点被归入同一组。行人的跟踪采用了基于层次选择的注意机制, 在成组和个体两个层次检测和筛选连续的运动轨迹, 能够处理两个个体轨迹分离和重合的状况。

Xu等人[37]结合静态多特征图和运动特征图在视频序列中检测显著点位置。他们建立了一个动态视觉注意计算模型, 通过该模型检测到的位置描述为进一步粗略分割的种子点, 这样跟踪问题就被转化为子图像匹配问题。

5 结论

基于视觉注意机制的人体检测和跟踪是近年来新兴的一种拟人拟生物机制的研究方法。该方法结合人的视觉注意机制来提高系统实时运行效率和解决现实环境的复杂性。特别是近年来一些生物合理的人体显著性计算模型的提出以及人体运动分析的发展为人体检测的准确性提供了保障。另外一些新技术和新设备的诞生也促进了人体检测和追踪系统的成熟。不过由于机器视觉灵活性以及先验知识获得的局限性, 误检和漏检情况在所难免, 因此这方面的工作需要进一步的研究。

摘要:复杂背景下的人体检测和追踪一直是计算机视觉研究领域的热点问题。借鉴生物合理的拟人视觉注意机制并应用于人体检测和追踪问题的策略由于其高效性和实时性, 受到越来越多的关注。其核心是根据人体的运动显著性和人体视觉外观的特征的提取和筛选对图像序列中的人体进行定位和追踪。基于视觉的人体检测和追踪系统的一般处理过程包括感兴趣区域选择、分类和人体跟踪。该文就这三个方面涉及的主要研究成果进行回顾和比较, 并对研究难点和发展趋势进行分析。

训练新生儿的视觉能力及注意力 篇4

2001年8月9日 17:08 强生(中国)有限公司提供

怎样训练新生儿以及什么时侯训练新生儿是家长最关心的问题。一般孩子在吃饱后1小时左右会有10分钟到半时的觉醒时间,我们要利用新生儿这段觉醒时间进行视听训练。

可和新生儿面对面地谈话,让他注视你的脸,慢慢移动头的位置,设法吸引新生儿视线追随你移动。可给新生儿看红色绒线球,一般距新生儿15-20厘米,慢慢抖动红球,以引起新生儿注意,再慢慢移动红球,让新生儿追视,这种方法可以训练新生儿的视觉能力及注意力。也可给新生儿看红光,方法是准备一个手电筒,外面包一块红布,距新生儿20厘米左右给新生儿看红光,大人要上下左右慢慢移动电筒,速度以每秒移动3厘米左右,大约1分钟摇动12次,每次距离为30-40厘米,让新生儿的目光追随和捕捉红光,从而训练新生儿目光固定以及眼球的协调能力。这些训练可每日一次,每次1分钟。我们还可距新生儿15-20厘米让新生儿看印有黑白脸谱、条纹及同心圆图形的卡片,促进新生儿的视觉分辨能力,看时家长可观察新生儿注视每个图形的时间,以了解新生儿比较喜欢看哪一种图形,一般新生儿都比较喜欢看人的脸谱。在新生儿觉醒时,母亲可在新生儿耳边距离10厘米左右,轻轻呼唤小宝宝,使他听到你的声音后转过头来,还可以用能发出柔和声音的吹塑玩具、彩色旋转玩具、色彩鲜艳的球,悬挂在新生儿的床头,吸引新生儿听和看的兴趣。新生儿很容易疲劳,一般每次视听训练不要超过

视觉注意模型研究方法 篇5

随着信息时代的来临,处理数据的不断增多。用户对信息处理的效率和准确性的需求越来越高。当接到一个具体的任务时,如果要计算机把所有的数据进行处理分析又要求其处理的实时性,在待处理的任务中,我们所需要的数据内容往往是所有的数据中的一小部分,如何从给出的任务中找到我们需要的内容,这也是当前计算机信息处理中的重要研究内容。人类的生理视觉已经开始融入到图像处理中,视觉注意机制也开始用在信息处理中用来从繁多复杂的数据中选择有用信息。视觉注意机制的思想就是迅速的找到显著对象,放弃非显著部分,大大的提高资源利用率,减小处理时间。视觉注意机制是人类对外界输入的信息中保留其中的有用信息,消除冗余信息,是人类感知对外界大量信息的选择性和主动性的保留。目前,针对视觉注意机制的研究才刚刚开始,还没有形成一个相对成熟的体系,本文就视觉注意机制模型的发展状况作一下简要的介绍。

1 基于计算模型的视觉注意模型

视觉注意机制的计算模型主要包含自下而上的数据驱动模型和自上而下的任务驱动模型。这两个模型都是要通过计算图像的显著图,得到图像的感兴趣区域。其研究人员对视觉注意机制进行深入的研究后提出一些理论模型,可以将这些模型理解为视觉注意机制的认知模型,介绍几种著名的认知模型 :

(1)过滤器模型

过滤器模型是由英国著名心理学家Broadbent在1985年提出的,Broadbent经过实验研究得出 :人的感觉通道对信息的接受和加工处理的能力是有限的,但是人眼能够看到的信息量是十分庞大的,所以不可能对所有进入人眼的信息进行加工处理,这就需要对外界的信息进行筛选,因此可以通过过滤器滤掉一些信息,只处理保留下来的重要信息。

(2)衰减模型

衰减模型是美国心理学家Treisman于1960年提出的,Treisman认为,由于高级分析水平的容量限制,需要过滤器对其作一定的调节,过滤器不是单单的通过一个通道的信息,也可通过其它通道的信息,只是其余通道的信息在这个过程中会产生衰减,强度减弱,但并没有被全部阻拦掉,其中的重要信息会被保留下来,得到加工处理。

(3)反应选择模型

Deutsch等人于1963年提出了反应选择模型,Deutsch认为所有通道的信息都会得到知觉加工,即生物视觉会分析视觉感知到的所有信息,注意不是发生在如何对外部信息进行选择,而是发生在对刺激的反应做出选择,即当遇到重要的有意义的刺激时,人们才会给予反应。

(4)特征整合模型

特征整合 模型是由Treisman和Gelade提出的,在特征整合模型的理论中,视觉注意模型的注意阶段和感知加工阶段是由信息的预处理和信息的集中注意处理这两个过程共同组成,此模型将注意和知觉加工结合到一起,但是此模型只是重点强调了当集中注意后会使图像得到增强,没有阐述明白如何根据特征图进行视觉注意的引导。

2 基于视觉注意单元的视觉注意模型

(1)基于空间特性的视觉注意模型

视觉注意机制的经典Itti模型 [4] 就是基于空间特性的注意模型,Itti模型先是对待处理的图像作平滑和降采样处理,处理后得到每一层的尺寸都不同的图像高斯金字塔结构,然后提取视觉的初级特征,在每一层图像上提取颜色、亮度和朝向等特征,对各个特征作中央周边差运算,然后进行归一化处理,这样就分别得到了三个特征的显著图,再对各特征显著图线性相加融合计算出原始图像的总显著图。观察和分析图像的总显著图,可以看出图像中不同区域的显著性程度,根据这些区域的显著程度的大小可找到原图像的显著范围,然后用圆形区域标志原图像的显著区域。

(2)基于特征的视觉注意模型

注意模型按照特征来分可分为两种,第一种是把图像的特征信息用调制函数来研究和处理 ;第二种是利用特定的特征和这些特征的组合使用来生成图像的特征显著图,并对显著图进行调整处理。第一种的模型包括有Tsots的特征调整方式 ;第二种则包括本文重点研究的Itti模型,此模型即是利用调整特征权值的方式得到图像的显著图。在现阶段所研究的基于特征的模型中,大多都是对第一种的研究。

(3)基于物体特性的视觉注意模型

这种注意模型首先要选好特殊物体,然后根据对选好的这个特殊的物体的查询进行调整的视觉注意模型,此模型的设定要求我们要筛选的物体必须是现实的有实际意义的。基于物体特征的视觉注意模型包括Rolls等的改变视觉感受野的方法以及Sun等的视觉注意模型。

3 结论

视觉注意机制 篇6

图像作为视觉信息的主要表达手段, 是人类感知客观世界的主要信息来源。面对现今庞大的图像数据, 如何快速有效地定位出图像中的主要信息内容已经成为了人们的研究热点。显著物体检测技术是其中的一项关键技术, 它能迅速定位出图像中的重要对象, 赋予计算机分析处理过程一定的主动选择能力, 将有限的资源优先分配给图像中最主要信息, 从而在复杂环境中快速有效地加工和处理信息[1]。显著物体检测技术可以广泛应用于许多计算机视觉领域, 包括图像/视频压缩[2]、目标跟踪[3]、目标检测与识别[4,5]等。显著物体检测技术的迅速发展, 使得在图像处理实践课程中添加相应的内容显得更加必要, 所以本文提出显著物体检测的实验设计。

物体检测是图像分析的一项关键内容, 涉及到各方面的知识, 要掌握物体检测技术, 需要学生对多种图像处理技术具有一定的综合应用能力。为了让学生更好地掌握物体检测技术, 针对自然图像内容与背景的复杂性和多样性, 本文研究设计并实现了一个根据图像的初级视觉特征进行图像主要内容即显著物体检测的实验方案。该方案受文献[6]和[7]的启发, 模拟人的视觉感知能力, 充分利用图像的亮度、颜色和方向特征进行显著物体检测, 并介绍了显著物体检测的评价标准, 将实验所得结果与微软亚洲研究院给出的基准检测结果进行比较, 希望通过本实践内容加深学生对物体检测算法的理解以及激发学生进一步学习研究的兴趣。

1 视觉注意算法原理

在面对任何一个场景时, 人类的注意力会迅速集中在少数几个显著的对象上, 并对这些对象进行优先处理, 该过程被称为视觉注意[6]。如图1所示, 人眼会迅速将注意力转移到与周围其他图形不同的图形上, 并认为这些与众不同的图形是图像的主要内容。模拟视觉注意过程, 人们根据不同的图像特征进行图像显著性检测, 这里仅对一种经典的Itti方法[7]进行介绍。

Itti方法首先对输入图像进行多个特征通道和多尺度的分解, 再选取图像的亮度、颜色和方向特征作为视觉初级特征, 通过计算中央周边差和非线性归一化得到对应的特征显著图, 最后将各特征显著图进行线性组合得到总显著图。整个算法主要包括以下几个步骤:

1.1 高斯金字塔

对于输入图像I, 首先利用高斯金字塔算法进行多尺度分解, 得到9幅不同尺度的图像I (σ) , 其中σ∈[0...8]是尺度参数。这一序列图像反映了图像在不同尺度上包含的信息。

1.2 初级特征提取

该步骤采用中央周边差操作对高斯金字塔序列图像进行最基本的视觉特征计算, 设c表示高斯金字塔序列的中央序列, 取值范围为c∈{2, 3, 4}, s表示高斯金字塔序列的周边序列, 取值范围为s∈{3, 4}, 对各个特征显著图计算如下:

1.2.1 亮度特征提取

根据亮度特征计算亮度特征显著图I (c, s) , 总共得到6幅亮度特征显著图:

1.2.2 颜色特征提取

根据双色对立原理计算宽频调谐颜色特征显著图RG (c, s) 和BY (c, s) , 总共得到12幅颜色特征显著图:

1.2.3 方向特征提取

考虑局部方向信息, 通过Gabor滤波器获取局部方向特征显著图O (c, s, θ) , 总共得到24幅方向特征显著图:

其中, θ∈{0°, 45°, 90°, 135°}

1.3 特征显著图合并

Itti方法使用多种特征提取方法导致特征取值范围不同, 因此不能直接将这42幅不同类型的特征显著图整合在一起。Itti方法采用规范化操作N (·) , 将特征图最强的峰值保留, 抑制其它的局部峰值:

经过规范后的特征显著图就可以通过叠加操作将它们整合到一起, 得到最终的图像显著图

2 实验方案的设计

物体检测实验作为数字图像处理课程内容的补充与增强, 应具有以数字图像处理课程的先修学科和计算机处理能力。先修课程:高等数学、数字信号处理、数字图像处理、Matlab程序设计。

2.1 实验环境

(1) 操作系统:Windows XP或以上版本;

(2) 软件:Matlab 6.0及以上版本 (含图像处理工具箱) ;

(3) 图像库:微软亚洲研究院公开的基于视觉注意的物体检测基准图像库。

2.2 实验内容

实验方案步骤主要有: (1) 构造高斯金字塔; (2) 利用中央周边差算子计算特征显著图; (3) 特征图合并; (4) 根据显著图进行物体检测。

2.2.1 利用高斯金字塔对图像进行多尺度表示

高斯金字塔本质上为信号的多尺度表示法, 即将图片进行高斯模糊, 并且向下取样, 以此产生不同尺度下的图像序列进行后续处理。相应源程序存放在D:Sal Obj目录中, 程序名为gaussian Subsample.m。启动Matlab程序后, 在File菜单中选择setpath, 选择D:Sal Obj, 可将所有程序和图片存放在该目录下。在主窗口中键入图像读入函数imread () 后, 调用高斯金字塔函数, 生成高斯金字塔序列。图2 (b) - (e) 是对图2 (a) 进行尺度参数σ∈[0...3]的高斯金字塔分层结果。

2.2.2 利用亮度、颜色和方向特征得到特征显著图

结合图像的亮度、颜色和方向特征, 并采用中央周围差操作, 得到图像的初步特征显著图。这部分内容通过三段代码实现, 得到亮度、颜色和方向特征显著图的程序名分别为Intensi-ty.m、Color.m和Orientation.m。图3是利用上述程序进行特征检测得到的特征显著图。

2.2.3 将特征显著图规范化并合并得到显著图

利用规范化操作分别对得到的亮度、颜色和方向特征显著图进行规范化。最后通过叠加将它们整合到一起, 得到最终的显著图。规范化操作和整合特征显著图的程序名分别为Normalized.m和Combine Maps.m。图4是利用上述程序进行处理得到的最终的显著图。

2.2.4 利用显著图进行物体检测

本实验该部分借鉴文献[6]提出的方法, 选取出部分像素, 并确保这些像素覆盖了灰度值较大的95%的图像像素。如图5所示, 本实验用一覆盖这些像素的最小红色矩形框标识出图像主要目标所在的最小区域完成检测。

3实验结果与分析

为验证提出的显著物体检测实验方案的可靠性, 随机选取微软亚洲研究院公布的显著物体检测图像数据库作为实验数据集。参照文献[6]的算法性能评价方法, 如公式 (9) - (11) 所示, 使用查准率、查全率和F度量进行评价。

其中, ∑xgx为基准二值图, ∑xax为检测结果二值图, 一般取α=0.5, F度量衡量的是算法的整体性能。

从部分检测结果 (见图6) 可知, 本文设计的实验方案具有较好的鲁棒性, 能够对不同形状、大小及背景环境的物体均具有较好的检测能力。要求学生根据上述三个性能评价指标对检测结果图像进行计算, 并据此就算法的适用性等方面给出一定的分析。鼓励学生根据自己的理解修改特征显著图的获取算法和相关程序, 并进行性能评价指标计算, 与本实验方案进行比较, 加深理解。

4 结语

本文设计并实现了一种模拟人的视觉感知系统进行视觉注意计算的显著物体检测实验方案, 通过对视觉注意原理和方法的介绍, 利用程序及通过具体的实验结果, 进一步加深了学生对Gabor滤波、高斯金字塔尺度表示、规范化操作、物体检测等相关知识的感性认识, 同时使学生能够通过自主动手实践, 培养他们的科研兴趣, 锻炼实践创新能力。利用预留的接口允许学生修改函数, 以及利用评价标准对检测结果进行比较, 希望能激发学生对这一方向的研究兴趣。

摘要:针对传统图像处理课程中目标检测理论抽象并且缺乏实践应用的缺点, 设计了基于视觉注意的显著物体检测实验, 通过实验操作增强学生对物体检测理论的理解以及激发学生进一步学习的兴趣。该实验方案可以检测不同内容、主题与背景环境的自然图像, 具有较强的鲁棒性和较好的可操作性。

关键词:视觉注意,物体检测,Gabor滤波,非线性归一化

参考文献

[1]赵倩, 曹家麟, 胡越黎.结合高斯多尺度变换和颜色复杂度计算的显著区域检测[J].仪器仪表学报, 2012, 33 (2) :405-412.

[2]Walther D, Koch C.Modeling attention to salient proto-objects[J].Neural Networks, 2006, 19 (9) :1395-1407.

[3]Itti L.Automatic foveation for video compression using a neurobiological model of visual attention[J].IEEE Transactions on Image Processing, 2004, 13 (10) :232-250.

[4]Fan J, Wu Y, Dai S.Discriminative spatial attention for robust tracking[C]//Proceedings of 11th European Conference on Computer Vision, 2010:480-493.

[5]Gao D, Han S, Vasconcelos N.Descriminant saliency, the detection of suspicious coincidences, and applications to visual recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31 (6) :989-1005.

[6]Liu T, Yuan Z, Wang J, Sun J, et al.Learning to detect a salient object[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33 (2) :353-367.

视觉注意机制 篇7

关键词:标志设计,色彩配置,视觉感知,机制

标志是一个信息的载体, 有很强的信息传递功能, 在某种程度上甚至超过了语言文字, 因此标志的设计非常重要[1]。符号、图案、色彩、字体是标志设计的四大要素。色彩在标志设计的几大要素中有着极其重要的地位, 标志的色彩能最先引起受众的注意, 并给受众以深刻的印象。心理学有关研究表明, 人的视觉器官在观察物体时, 最初的20秒内色彩感觉占80%, 而形体感觉占20%, 因此, 色彩给人的印象是迅速而深刻的[2]。

标志色彩配置的重要性不言而喻, 评价一个标志很大程度上是通过视觉感知的, 所以本文将研究视觉感知与色彩配置之间的关系与作用机制, 运用实验的方法验证该机制的正确性, 从而用该机制去指导和评价标志的色彩配置。

1视觉感知与色彩配置

1.1标志视觉感知

标志视觉感知包括人对标志的生理感知和情感体验两个方面, 生理感知是人对标志最为客观的反映, 情感体验则是人对标志反映出的想法。

1.1.1生理感知。标志生理感知主要是单纯对标志色彩的感知, 这个过程是极短的。视觉对色彩会产生相应的感知, 从标志设计的角度, 这样的感知体现为:温度感、体量感、距离感。a.温度感:标志的温度感由标志整体色调确定, 红、橙、黄为暖色, 其中, 橙色称为暖极;绿、青、蓝为冷色, 其中蓝色称为冷极[3]。b.距离感:在同一视距条件下, 鲜明色、暖色有向前的感觉, 而灰暗色、冷色有后退感觉。3.重量感:色彩的重量感取决于色彩的明暗程度, 通常情况下高明度的色彩有轻松感, 低明度的色彩有沉重感。

1.1.2情感体验。标志情感体验是比生理感知更深一层次的视觉感知, 不单纯体现在对标志色彩的生理感知, 而是大脑经过分析结合自己的经验对标志做出情感上的判断。

从标志设计的角度, 视觉对标志色彩产生的情感体验表现为:兴奋与宁静、轻快与庄重、科技与古典。情感体验绝不止这三组关系, 只是根据标志设计与评价中色彩这一环节提取了权重值较大的三组关系。

1.2标识色彩配置

色环中各颜色与其它颜色之间有着相应的关系, 进行色彩配置时根据需要在相应的关系中选择颜色进行合理搭配, 其主要关系包括同类色、邻近色、对比色以及互补色。为了方便研究, 将四种关系进行整合重新定义:同类色与邻近色统称为调和色;对比色与互补色统称为对比色。因此, 确定标志主色后再选择这两种关系进行色彩搭配, 可以得到标志色彩配置的三种基本类型。a.原色:主色不与其它关系进行色彩搭配, 整体只有一种颜色。原色的颜色单纯、强烈、鲜艳夺目, 艺术效果和传播效果显著。b.调和色配置:主色与同类色或者邻近色进行色彩搭配, 例如用桔红与桔黄、中黄、浅黄等邻近色进行搭配。调和色配置的标志色调统一和谐、感情特性一致。c.对比色配置:主色与对比色或者互补色进行色彩搭配。对比色配置主色与辅助色的色相感鲜明, 各色相互排斥, 对比强烈。

2视觉感知对标志色彩配置的作用机制

2.1关系

标志设计的要求各不相同, 而标志不同的色彩配置会达到不同的效果, 需要通过视觉感知来验证所设计的色彩配置是否满足相应的要求。

标志与人之间是通过视觉感知产生交互的, 因此, 视觉感知与色彩配置之间有着关联性。视觉感知是人对标志色彩配置的客观反映, 而视觉感知中的生理感知可以通过仪器测量, 情感体验可以定性分析, 这为研究二者间的作用机制提供了可行性基础。

2.2作用机制

视觉感知对标志色彩配置的作用机制是:通过色彩搭配的视觉感知效果反过来指导标志设计的色彩配置。

研究色彩配置的视觉感知效果, 首先要把握标志主色与原色、调和色、对比色各自的视觉感知。主色 (M) 分为两类:鲜明色 (M1) 与深暗色 (M2) 。辅助色 (A) 三种配置类型:原色 (Am) 、调和色 (A1) 与对比色 (A2) 。通过2*3的组合方式得到六种中色彩配置方案, 然而调和色Am与原色相同, 所以不存在色彩配置, 因此只有M1A1、M1A2、M2A1、M2A2四种色彩配置方案。将各自的视觉感知两两组合从而得到不同色彩配置的视觉感知效果。

标志主色与辅助色之间是主从关系, 两者之间不平等, 因此在分别研究其视觉感知时应当做加权处理, 主从关系上可以得出主色的权重值是大于辅助色的。主色 (M) 为单色, 生理感知上没有重量感与远近感, 只有温度感:即M1主要为冷色, M2主要为暖色。情感体验上相应为:M1兴奋、轻快、科技;M2宁静、庄重、古典。调和色 (A1) 两色相近, 色调统一和谐, 从生理感知上为:A1重量重、距离远;情感体验上相应为:A1宁静、庄重、古典。对比色 (A2) 两色对比强烈, 色相鲜明, 从生理感知上为:A2重量轻、距离近;情感体验上相应为:A2兴奋、轻快、科技。

根据M与A的权重值可以得到表1的结果。

由此, 得出了视觉感知对色彩配置的作用机制:标志设计要求“兴奋、轻快、科技”时, 可使用M1A1[冷、重、远]、M1A2[冷、轻、近]以及M2A2[暖、轻、近] (主色影响较小) 的色彩配置方案;标志设计要求“宁静、庄重、古典”时, 可使用M1A1[冷、重、远] (主色影响较小) 及M2A1[暖、重、远]、M2A2[暖、轻、近]的色彩配置方案。

3眼动仪实验

3.1实验目的

标志视觉感知中的生理感知通过眼动仪实验能够很好的测量出来, 而且眼动仪实验比较客观、准确。同时, 让被试在实验前了解、熟悉对应的情感体验要素, 色彩配置的情感体验也可以通过眼动仪实验进行验证。

3.2实验设计

根据视觉感知对标志色彩配置作用机制研究中得出的六个方向, 相应的选取了六个具有代表性的两组标志, 因实验器材及准确度的要求, 一组标志在四个为宜, 这里把因为主色权重衍生的 (M1A1) [主色影响较小]与 (M2A2) [主色影响较小]略去: (图1)

第一组:L1 (M1A1) 、L 2 (M1A2) 、L3 (M2 A1) 、L 4 (M2A2) 。

第二组:L 5 (M1A1) 、L 6 (M1A2) 、L7 (M2A1) 、L 8 (M2A2) 。

被试在实验前需要熟悉视觉感知中生理感知要素与情感体验要素定义:即温度感、重量感、远近感;兴奋与宁静、轻快与庄重、科技与古典。实验时根据提示观察两组标志的要素, 例如:观察一个画面中的四个标志的温度感, 先找出最暖的标志, 再找出最冷的标志, 从而可以根据热点图得到最暖和最冷的标志。

a.实验设备:Tobbi眼动仪一台, 联想一体机一台。b.实验材料:自制图片素材两组, 每组图片需要被试观察6次, 分别得出6个视觉感知要素结果。c.实验地点:实验室, 室内环境避免了过多干扰。显示屏周围围有白板, 遮住了视觉干扰。d.实验对象:本次实验共选择了50名被试, 矫正视力正常, 无眼部疾病。

3.3实验分析

根据实验安排, 每组图片观看的内容包括六个要素, 分别是为了考察每组标志的温度感、重量感、远近感, 兴奋与宁静、轻快与庄重、科技与古典。

图2显示了一个被试一组图片的六个要素的热点图及轨迹图。图片中接近红色的区域表示在15秒中的观察时间中对该区域的注视时间更长, 因为在试验中给予被试的引导是观察具有相应要素特征的标志, 所以注视时间越长的区域表示该标志是引导因素视觉感知明显的标志。

表2为第一组标志的热点分析, 根据热点数量的不同, 将四个标志进行排序, 由此可以得到四个标志的视觉感知属性。L1:冷、重、远, 兴奋、轻快、科技;L2:冷、轻、近, 兴奋、轻快、科技;L3:暖、重、远, 宁静、庄重、古典;L4:暖、重、远, 宁静、庄重、古典。基本符合前文得出的机制, 因此可以肯定该机制的正确性。

4结论

研究视觉感知与标志色彩配置间的关系, 得出了视觉感知对色彩配置的作用机制:标志设计要求“兴奋、轻快、科技”时, 可使用M1A1[冷、重、远]、M1A2[冷、轻、近]以及M2A2[暖、轻、近] (主色影响较小) 的色彩配置方案;标志设计要求“宁静、庄重、古典”时, 可使用M1A1[冷、重、远] (主色影响较小) 及M2A1[暖、重、远]、M2A2[暖、轻、近]的色彩配置方案。

通过实验, 验证了该机制的准确性并得到以下结论:a.标志主色 (M) 对标志视觉感知影响最大;b.鲜明色 (M1) 与对比色 (A2) 进行色彩配置时, 视觉感知效果为:冷、轻、远, 且最能达到兴奋、轻快、科技的情感体验;c.深暗色 (M2) 与调和色 (A1) 进行色彩配置时, 视觉感知效果为:暖、重、近, 且最能达到宁静、庄重、古典的情感体验;d.其余色彩配置方案则居于中间, 且视觉感知效果要根据主色M的影响权重值而定。

参考文献

[1]秦.标志设计要素浅谈[J].科技资讯, 2012 (11) :213-213.

[2]朱虹, 詹秦川.色彩在标志设计中的研究与应用[J].艺术与设计, 2009 (3) :53-53.

视觉注意机制 篇8

一、什么是受众注意力

注意, 其实是人的一种心理状态, 是心理活动对一定对象的指向与集中。当消费者已经做出决定要购买一种商品时, 为了买到自己更满意的产品, 会主动寻找有关这类产品的广告信息。尤其是要买的产品对自己具有较大的意义时, 寻找此类广告信息的主动性越强。然而, 在更多的情况下, 消费者面对广告信息是在一种被动的情况下, 广告是单方面的向广告受众提供他们可能当时并不需要购买的商品信息, 以期激发他们的某种购买欲望。这种注意的情形正是广告受众对大多数广告采取的注意状态。

二、视觉形象如何吸引受众注意力

人是靠眼睛观看事物的。但人眼的视觉神经紧密地连接着大脑的思维、意识、记忆等, 所以, 视觉活动是眼睛无法触摸的, 而让知觉去触摸。这样, 广告视觉形象语言的产生, 就形象法则情感诉求

是将所要表达的意图或观念转换成某种人们用眼睛能看懂的视觉样式, 即所谓“视觉艺术, 即非实物存在的感官意识, 就是以往的经验在头脑里被抽象出来”。

在那则著名的公益广告《希望工程大眼睛》里, 一个农村小女孩睁着一双忧郁而略带哀伤的大眼睛, 你仔细地盯着她看, 会畏惧她的眼神。也许在你贫瘠的记忆里, 流失了那么多人的眼睛, 可她的眼睛你一看就不会遗忘。美国著名传播学教授保罗·梅萨里同样认为, 由于瞳孔被视为现实世界中性兴奋的标志之一, 时装照片中的瞳孔常被人为放大以增加照片中女模特的魅力。广告中的图片起了现实生活中视觉经历替代物的作用, 也源于人们在现实生活中被人注视时, 总要以目光回敬对方的习惯。为什么一个三角形的形状可以包含着尖锐的矛盾?一个商标能包含着这个企业的信誉和产品的质量?看来这一切这都不是“看”的关系, 而是知觉的关系。因此, 在广告中, 作为虚拟现实的形象, 它通过人的知觉判断, 更进一步地引发人们的联想, 并伴随着人类心智的抽象活动, 使视觉形象设计达到传播商品概念的媒介作用。

三、视觉形象获取受众注意力的重要手段

(一) 感觉为先

心理学告诉我们, 感觉是知觉的前提。人们了解事物的独特性质, 常常发生在感觉中;而在对事物特质的所有感觉中, 人们对色彩的反应尤为强烈。因此, 广告中的视觉形象展现, 常常以“色”为先, 夺人“眼球”。

出于色彩的理由, 可口可乐在我国的电视广告, 常以红色为基调, 既配合了它本身的包装, 又使广告受众感到强烈的视觉刺激, 再配合快节奏的音乐和舞蹈动作, 使广告受众产生兴奋的情绪, 感到喝了可口可乐会使人充满旺盛的精力;在中国, 黄色是皇帝用的颜色, 在广告中常以黄色来突出产品的名贵;而那则著名的“南方”黑芝麻糊广告, 则以偏黄的基调, 突出了旧日情怀。

除了色彩, 在影视广告作品中, 设计者借助先进的影像技术手段, 可以让观众置身于奇特和超现实的空间世界。总之, 观众在欣赏广告作品时, 喜欢有好的感觉设计, 这样他更愿意参与到广告的事物中来, 在一定程度上, 这种感觉激发了他的知觉和联想, 从而主动获取了他的注意力。

(二) 形象法则

在众多名人代言的产品广告中, 明星们的靓丽外表和酷感造型, 使消费者获得审美愉悦的同时, 也增强了购买该产品的欲望。然而, 随着现代科学技术的进步, 特别是电脑图形处理软件在媒体中的应用, 使一种违背现实生活的广告视觉展现, 在很大程度上越来越吸引着受众的目光。前几年电视媒体上广泛播出的广告“三九感冒灵”, 就使用了电脑“变形”技术。该广告的内容为:母亲、儿子、媳妇一家三口去药房买感冒药, 是买中药还是西药?婆婆媳妇之间发生意见分歧, 随着两人“中药”“西药”争吵声的不断加大, 儿子被婆媳两人一左一右拉着的手, 也逐步地发生变形, 越拉越长, 最后, 儿子一声“中西结合”, 争吵声停止, 被拉扯的手也恢复了正常。这个广告创意以背离正常的“长手”设计, 吸引受众目光的同时, 也利用了人们脆弱的心灵以及敏感性神经质, 做一种压抑的表现, 使人产生怪异感觉, 以获取同情的效果, 让你快速决策购买该产品, 达到了广告的目的。

因此, 在广告设计中, 将过去所熟悉的东西在外表上加以显著改变, 是作为吸引受众注意力的一种重要手段。著名认识心理学家罗杰·谢泼德 (Roger Shepard) 对这种违背现实的视觉形象曾做过广泛的研究, 他指出, 人的大脑在对这类不可能存在的图形做出反应时, 感知系统会做出细微的调整, 对不熟悉的物体加以特别关注, 从而引发好奇心。近期荧屏上许多以明星代言的电视广告, 如葛优、邓超等以角色反串的表演形式, 同时出现在屏幕上, 也正是利用了观众喜欢看到自己熟悉的明星不同表演风格的心理。

(三) 情感诱发

当然, 在视觉形象针对人脑的各种抽象思维活动中, 最终是要诱发人类情感的。于是在广告视觉形象的展现中, 以形式为诱导因素, 通过视觉语言的情感设计, 达到情与形的结合, 赋予了广告作品丰富的感情色彩和浓郁的人情味, 以“情”动人, 唤起人们对真善美的追求。

由视觉形象诱发情感来强化注意力, 也是目前我国广告讲究情感诉求的重要展现方式。感性诉求与消费者购买商品的社会和心里需求有关。许多消费者支持其购买决策的动机都是感性的, 在进行购买决策时, 他们对品牌的感觉可能比对这种品牌的特征或属性的了解更为重要。许多广告主在销售那些与竞争无重大差异的品牌时, 既然理性的差异难于辨认, 吸引消费者情感方面的诉求就会起到更好的作用。中国人重视亲情与礼仪, 就电视广告而言, 从脑白金到酒类、手机、及各种日用品, 几乎都在亲朋好友、妻子丈夫、子女父母等亲情上做文章。近几年, 随着微电影的兴起, 飘柔洗发水、益达口香糖等电视广告已经使用故事化的手段, 通过微电影分集叙述, 将年轻人的情感世界表现得淋漓尽致。而同时这些产品在针对年轻一族的诉求时, 也将唯美时尚的特质给呈现出来了, 让人易于接受。

(四) 幽默心理

与国内广告的情感诉求方式不同, 国外许多著名的广告在设计中常常调用人类幽默的心理因素, 以增强广告的传播效果。生理学的研究结果表明, 人们大笑或微笑时, 压缩的血管使更多的血液被挤入大脑, 从而使大脑分泌内啡太, 产生良好情绪。在这种状态中, 受众的注意力变得相当精准、热烈。因此幽默的广告最容易给人们灌输品牌意识。

四、结语

随着时代进步和社会发展, 人们的思想观念也悄然发生着改变。如何顺应时代潮流, 设计制作出更加赏心悦目的广告, 迎合观众的口味和审美情趣, 从而获取更多的受众, 是我们每个广告从业者都必须共同面对的现实和努力的方向。我们只有掌握了受众的视觉心理, 懂得了一定的形象法则之后, 再融合祖国优秀的传统文化, 汲取国外先进的广告设计经验, 经过不断的摸索和锤炼, 才能呈现出更好的视觉艺术品。

摘要:广告营销通过吸引受众的注意力来达到营销目的。现代社会广告信息越来越多, 对广告受众的注意力争夺也越来越激烈。而注意其实是人的一种心理状态。那么, 在广告的说服性传播艺术中, 视觉形象究竟要如何来获取受众的注意力?本文通过研究受众的视觉心理, 提出了广告设计, 特别是电视媒体广告设计中可能获取观众注意力的重要手段。当然随着社会的进步与发展, 人们的思想观念也在逐步地发生变化, 作为广告从业者只有不断地学习和创新才能有更好的艺术品呈现。

关键词:受众注意力,视觉心理,形象法则,情感诉求

参考文献

[1].余小梅.广告心理学[M].北京:北京广播学院出版社, 2003.1.余小梅.广告心理学[M].北京:北京广播学院出版社, 2003.

[2].保罗.梅萨里.视觉说服—形象在广告中的作用[M].王波, 译.北京:新华出版社, 2004.2.保罗.梅萨里.视觉说服—形象在广告中的作用[M].王波, 译.北京:新华出版社, 2004.

[3].钱家渝.视觉心理学—视觉形式的思维与传播[M].上海:学林出版社, 2006.3.钱家渝.视觉心理学—视觉形式的思维与传播[M].上海:学林出版社, 2006.

[4].陈宏年.广告设计概述[M].北京:北京广播学院出版社, 2002.4.陈宏年.广告设计概述[M].北京:北京广播学院出版社, 2002.

视觉注意机制 篇9

体育比赛事中,在‘各就位’和‘预备’口令之后,参赛者应马上完成有关动作,任何参赛者不能在合理时间内完成有关动作,则属起跑犯规。听到枪响应立即起跑。如果运动员在没有听到枪响而做出起跑动作,则属于抢跑。但如果运动员在听到枪响而没有做出起跑动作时,则属于起跑反应滞后。一般水平的赛事中,可能起跑速度不是决定比赛胜负的关键,但涉及到高水平的体育竞技中,反应速度有可能是决定胜负的一个关键要素。以北京奥运会为例:女子400米自由泳项目中英国的丽贝卡·阿德林顿以4分3秒22获得金牌,美国的凯蒂·霍夫以4分3秒29获得银牌,金牌与银牌相差仅0.07 s。男子100 m蝶泳项目金牌与银牌相差0.01 s,女子50 m自由泳这个项目金牌与银牌相差0.01 s。不难看出,如果运动员在起跑线上的反应速度慢下几十毫秒甚至几毫秒,直接决定了冠亚军的角逐。

当然决定反应速度的因素可能有多个,首先是来自刺激物本身(刺激类型、强度、呈现方式等)的影响,其次是来自个体本身(个体差异、练习水平、定势、准备状态以及心理素质等)的影响,再者外界环境等一些因素也会产生影响。本研究将就机体的准备状态(预警时间)对反应时的影响及其内在机制进行初步探讨。具体而言,本研究欲在“各就位——预备——发枪令”这一体育活动的范式基础上,在视觉通道上设置了“开始-准备-目标探测”实验范式,采用事件相关电位(ERP)技术初步探讨不同预警时间(准备到目标刺激的时间间隔)下目标刺激出现后的脑内时程动态变化。

ERP技术主要通过辨别大脑活动时激发的脑电波变化来判断大脑结构和被激活区域,它能提供达到毫秒级的时间分辨率,能有效地评估某些认知活动的时间特点,其成分是多维度的,包括波幅、潜伏期、极性(P/N)和头皮分布等,波幅反映的是大脑的兴奋程度,潜伏期反映的是神经活动与加工过程的时间和速度,而极性指的是正波还是负波[2]。该实验范式下,被试欲对目标刺激做出快速反应,就需首先对其进行识别。识别电位是ERP早成分中比较重要的一个成员,是当被试看到可识别视觉刺激(如词或图片)时,在约200~250 ms内达到峰值的脑电反应[3,4,5,6],它由美国纽约州立大学布鲁克林医学中心的Rudell教授于1991年首次描述。此外,与任务加工过程中资源分配有关的P3成分,我们预期在个体进行快速反应过程中也会被诱发。因此,通过对不同预警时间下出现的目标刺激所诱发的RP以及P3进行考察,可以为我们较好的了解预警时间对个体快速反应的影响机制提供较为直接的电生理证据,以期为体育比赛中有关反应速度的训练在某种程度上提供参考。

1 研究方法

1.1 被试

随机选取国内某大学学生17人(8男9女),年龄20~24岁(平均22.3岁)。被试经问卷测试皆为右利手,无疾病,视力或者矫正视力正常,做完实验后被试均获取适量报酬。

1.2 实验设计

单因素(2个水平)被试内设计,自变量为预备刺激到目标刺激出现中间的时间间隔(ISI:400 ms和1000 ms)。自变量水平的选取是根据先前的预实验结果。在我们的预实验中,我们选取了9个水平:400 ms、600 ms、800 ms、1000 ms、1200 ms、1400 ms、1600 ms、1800 ms和2000 ms。结果表明,ISI在400~1000 ms之间时,被试对目标刺激的探测速度会随着ISI的逐步增大而加快,1000 ms之后,随着间隔时间增大,目标刺激的探测速度开始变慢。因此我们选取两个比较有代表的ISI(400 ms和1000 ms)。因变量为被试正确按键的反应时以及目标刺激诱发的ERP成分。

1.3 程序与任务

实验程序采用E-prime软件编写,显示器为19英寸液晶显示器。被试眼睛与显示器齐平,距离屏幕57 cm。刺激流程如图1所示,在黑色的背景中央首先呈现“+”(呈现100 ms),间隔1000 ms出现“预备”(呈现100 ms),然后不同的ISI后出现目标刺激(呈现1000 ms)。目标刺激为直径视角为1°的白色小圆圈。被试的任务是在目标刺激出现后,立即做出按键反应。提前或目前消失之后的按键视为无效。实验中,目标刺激总是出现在固定位置(中心点)。为了提高被试的投入度,我们设置了两类刺激。具体而言,出现“”(目标刺激)按“1”键;出现“”则不需按键。整个实验分3个block,每个block里有60次任务(其中每种ISI下出现20次“”10次“”),各任务均随机出现。正式实验之前,被试有一定的练习时间。在确保被试明白实验任务后才开始记录。实验时被试静坐于实验室内,两眼注视屏幕中央,要求被试尽量少动,目标刺激呈现时尽量不眨眼,尽可能快而准地做出按键反应。

1.4 数据记录和分析

使用德国Brain Products公司的ERP记录与分析系统,按国际10-20系统扩展的64导电极帽记录EEG,以双耳乳突的连线作为参考电极,双眼外侧安置电极记录水平眼电(HEOG),左眼上下安置电极记录垂直眼电(VEOG)。每个电极处的头皮电阻保持在5 kΩ以下。滤波带通为0.05~80 Hz,采样频率为500 Hz/导。完成连续记录EEG后离线(off line)处理数据,自动校正VEOG和HEOG,并充分排除其他伪迹。根据本实验的目的,主要分析目标刺激出现后所诱发的ERP,分析时程(epoch)为字谜出现后500 ms,基线为刺激出现前100 ms。按照被试的按键反应结果,分别对ISI为“400 ms”下与“1000 ms”下按对的EEG进行叠加。波幅大于±80(V者被视为伪迹自动剔除。根据实验所得到的两类反应任务的ERP总平均图(图2)。在100~300 ms内,两条件下在头皮的顶枕部均诱发的明显的RP成分。该成分别在左半球的PO7点和右半球的PO8点达到顶峰。采用峰值法对RP成分进行检测。以P08为例,RP的峰值以及潜伏期在400 ms和1000 ms下分别为:-6.17μV和199.53 ms,-5.29μV和191.18 ms。根据已有研究,选取2个电极位置对RP成分进行二因素重复测量的方差分析,二个因素分别为条件类型(“400 ms”和“1000 ms”)和记录点(PO7和PO8)。在300~500ms内,两条件下的目标刺激在头皮大部分区域均诱发了一个明显的P3成分。采用平均振幅法对P3在300~500 ms的时间窗口进行二因素重复测量的方差分析,二个因素分别为条件类型(“400 ms”和“1000 ms”)和记录点(Fz,F1,F2,F3,F4,FCz,FC1,FC2,FC3,FC4,Cz,C1,C2,C3,C4,CPz,CP1,CP2,CP3,CP4,Pz,P1,P2,P3,P4,POz,PO3和PO4)。方差分析的P值采用Greenhouse Geisser法校正,脑电地形图由64导数据得出。

2 结果与分析

2.1 行为数据

实验采用的是简单检测任务,总体检测发现反应错误率低于1%,因此,本研究不对错误率进行分析。个别被试由于失误导致的按错键已在数据提起中自动剔除。另外对于反应时小于100 ms的数据也进行了删除。行为记录表明,被试在ISI为“400 ms”和“1000 ms”下对目标刺激的正确反应的速度分别为:503 ms和468 ms。统计结果表明,条件的主效应显著,F(1,16)=15.658,p=0.001。

2.2 脑电数据

2(电极点:PO7和PO8)×2(条件:400 ms和1000 ms)重复测量分析显示,在RP的波幅上,条件的主效应显著,F(1,16)=6.671,P <0.05,表现为400 ms下的波幅(-7.02V)显著的高于1000 ms下的波幅(-5.54μV)。电极点的主效应以及电极点和条件的交互作用均不显著。在RP的潜伏期上,条件的主效应显著,F(1,16)=5.207,P <0.05,表现为1000 ms下的潜伏期(198.41 ms)显著的快于400 ms下潜伏期(191.24 ms)。电极点的主效应以及电极点和条件的交互作用均不显著。

28(电极点:Fz,F1,F2,F3,F4,FCz,FC1,FC2,FC3,FC4,Cz,C1,C2,C3,C4,CPz,CP1,CP2,CP3,CP4,Pz,P1,P2,P3,P4,POz,PO3和PO4)×2(条件:400 ms和1000 ms)重复测量分析显示,在300~500 ms内,条件类型的主效应均显著,F(1,16)=12.179,P <0.01,表现为1000 ms下诱发的P3成分更正。另外,电极位置的主效应均显著,F(27,432))=8.466,p<0.001,但任务类型与电极位置的交互作用均不显著。

3 讨论

在很多体育竞技项目中,运动员需要对特定的目标刺激做出快速反应。这些刺激有听觉的、有视觉的。以听觉为例,田径运动员需要在听到哨响后做出起跑动作。在视觉层面上,篮球运动员在争抢篮板时,需对即将出现在特定区域的篮球做出快速的反应。这些项目中,如何能对即将出现的目标刺激做出快速反应,一直是人们比较关注的热点。

该研究在“各就位——预备——发枪令”这一体育活动的范式基础上,创设了“开始-准备-目标探测”实验范式,采用事件相关电位(ERP)技术初步探讨了预警时间对特定目标刺激的快速反应的影响。在一项预备性实验中,结果发现ISI在400~1000 ms之间时,被试对目标刺激的探测速度会随着ISI的逐步增大而加快,1000 ms之后,随着间隔时间增大,目标刺激的探测速度开始变慢。据此,我们选取两个比较具有代表性的ISI(400 ms和1000 ms)作为脑电实验的两个考察水平。行为结果验证了ISI为1000 ms时被试对特定目标的刺激反应速度(468 ms)显著的快于ISI为400 ms下的反应速度(503 ms)。由此可见,不同预警时间可以直接导致反应速度达到几十毫秒的差异。那么是什么导致这种差异的呢?ERP以其有效地反应认知活动的时间特点为我们了解被试在不同ISI下对特定目标识别判断做出反应这一过程提供了有效参考。

首先,两条件下在目标刺激出现后约200 ms均诱发了明显的RP成分。如前所述,RP是被试看到可识别视觉刺激(如词或图片)时,在约200~250 ms内达到峰值的脑电反应,反应的是对刺激物的识别。该研究下,1000 ms下对目标刺激识别的RP的潜伏期显著的快于400 ms下潜伏期,这表明1000 ms下被试能较早(提前约7 ms)的对目标刺激进行识别。这提前几毫秒的识别可能是导致快速做出反应(提早约35 ms)的一个很重要的原因。而导致提前的识别原因可能是由于预警时间为1000 ms下,被试对即将到来的目标刺激识别已经做好了充足的准备,是目标刺激识别的最佳期。换句话说,如果预警时间过短(例如400 ms),被试就没有足够的时间进行注意资源的“调集”,当目标刺激出现后,人类的大脑可能还需要继续“调集”注意资源,因此延长了对目标刺激识别的时间。此外,400 ms下的波幅显著的高于1000 ms下的波幅。波幅作为大脑兴奋程度的一个反应指标,可能表明400 ms下被试对目标刺激的识别需要付出更多的认知资源。400 ms下的预警时间,被试由于还继续“调集”注意资源应对即将到来的目标刺激。因此,当目标刺激出现之时被试需要花费更多的心理资源用于识别。对目标进行了识别并不等于就可以做出快速反应。这只是为快速反应提供了一个好的铺垫。

随后,在300~500 ms内,两条件下的目标刺激在头皮大部分区域均诱发了一个明显的P3成分。关于P3的认知功能有很多,其中它的一个比较典型的认知功能是认为它与选择性注意和资源分配等认知活动有关,在一定程度上其波幅反映了对给定任务的心理资源投入量。该研究下1000 ms下目标刺激诱发的P3成分更正,这可能表明该条件下被试付出了更多的认知资源用于接下来的按键反应。这可能也是导致被试在预警期为1000 ms下对目标刺激能快速做出反应的一个最直接的原因。该条件下被试之所以能付出更多的认知资源应对接下来的按键反应也是源于前一阶段较早的对目标刺激的识别。

4 结论

该研究在视觉通道上就预警期对反应时的影响机制进行了初步探讨。结果表明,预警时间对目标刺激的反应时间是存在影响的。这种影响机制反映在ERP指标上首先是RP波幅和潜伏期上有差异,其次,与心理资源投入量有关的P3在波幅上也存在差异。这一结果,相信能为体育比赛中有关反应速度的训练在一定程度上提供参考,例如,预警时间为1 s可能是个体在视觉层面上比较合适的准备期。今后有必要对听觉以及其他通道展开研究。

摘要:该研究采用“开始-准备-目标探测”范式,利用事件相关电位技术初步探讨了不同预警时间下目标刺激出现后的脑内时程动态变化。结果发现:首先,在目标刺激出现后的200 ms左右,短ISI(400 ms)和长ISI(1000 ms)在大脑的顶枕部两侧均诱发了明显的识别电位,并且长ISI(1000 ms)下RP的潜伏期显著的快于短ISI(400 ms)下RP的潜伏期,可能反应了ISI为1000 ms下对目标刺激的快速识别;随后,300~500 ms内,在头皮的大部分区域,长ISI(1000 ms)比短ISI(400 ms)诱发了一个更正的P3成分,可能表明长ISI下被试需要付出更多的认知资源用于接下来的快速反应。

上一篇:节约型高校下一篇:听力学习障碍