监控内容

2024-06-15

监控内容(精选四篇)

监控内容 篇1

关键词:电子邮件,代理技术,邮件监控

0 引言

近年来, 电子邮件成为了互联网上最为典型的应用之一, 由此引发的安全问题已经成为使用者和相关安全开发人员关注的重点, 特别是内部人员通过电子邮件泄露相关涉密信息的问题, 成为邮件安全领域的一个新的问题[1]。

对于传统的邮件安全领域, 如垃圾邮件问题、邮件轰炸问题等, 都有了比较成熟的处理方法和技术;而对于邮件泄露相关涉密信息的问题, 还没有比较妥善的解决方法。本文通过对代理技术的研究, 提出了一种针对邮件客户端的监控技术, 来监测内部网络和外部网络的邮件通信信息, 通过对邮件数据的处理分析, 发现其中携带涉密信息的邮件, 对携带涉密信息的邮件进行监控。

1 相关技术的背景

1.1 电子邮件系统构成

电子邮件系统主要由3部分构成, 分别是:邮件用户代理 (MailUserAgent, 简称MUA) 、邮件服务器和电子邮件使用的传输协议。其中, 在邮件服务器层还包括邮件传输代理 (MailTransportAgent, 简称MTA) 和邮件投递代理 (MailDeliveryAgent, 简称MDA) 。MTA负责将邮件从一个服务器传输到另一个服务器, MDA负责将邮件投递到用户邮箱中。

1.2 代理技术

代理服务器 (ProxyServer) 可实现一种重要的服务器安全功能, 其工作主要对应在开放系统互联 (OSI) 模型的会话层, 从而起到防火墙的作用。代理技术作为网络通信的主要技术之一, 最初是用来突破自己的IP限制, 去访问一些IP不可达的主机。而现在, 多是使用邮件代理的方式来监控内部网络和外部网络之间的邮件通信。

目前, 主流的代理技术有HTTP代理技术和SOCKS代理技术两种。具体地, HTTP代理技术是内容代理技术, 即使用超文本将所传输的协议及内容通过HTTP代理服务器发送到目标主机, HTTP代理技术仅只代理支持TCP一种协议;SOCKS代理技术是连接代理, 代理连接建立后, 原封不动地转发数据, 并且SOCKS5代理支持TCP协议和UDP协议。

1.3 邮件内容识别技术

电子邮件是通过使用SMTP协议与邮件服务器通信进行发送的, 邮件的收件人、发件人、主题、正文和附件的信息都使用DATA命令向服务器发送。其中, 邮件的正文和附件包含在MIME格式的字段中, 研究可通过解析MIME格式的字段, 以获取邮件的内容。

1.4 多模匹配技术

多模匹配是邮件内容审计的主要工具之一。多模式匹配算法主要有Aho-Corasick自动机算法 (1975年) 、反向跳跃自动机算法 (2000年) 、SBOM算法 (1999年) 、mgrep算法 (1994年) 、Commentz-Walter算法 (1979年) 、DAWGMATCH算法 (1993年) 、MULTI-BDM算法 (1996年) 、SumKim99和BNDM算法 (2001年) 等等[2]。

2 电子邮件监控技术实施

2.1 邮件代理系统

邮件监控系统以邮件代理服务器为平台, 对内部网和外部网之间的邮件通信进行监控。邮件代理服务器除了代理邮件通信的功能外, 还可以通过检测邮件流量, 实现邮件内容等信息的获取, 从而对邮件进行监控。邮件代理服务器的工作位置如图1所示。

当内部网络和外部网络进行邮件通信时, 会首先向邮件代理服务器发送代理请求, 获得代理权限, 然后通过邮件代理服务器和邮件服务器进行通信。研究时则可以从邮件代理服务器上获取内部网络和邮件服务器之间的通信数据。

2.2 邮件监控系统

邮件监控系统由邮件代理服务, 邮件内容获取模块, 邮件内容审计模块和响应策略模块构成, 各个部分的功能和关系如图2所示。

2.2.1 邮件代理服务模块

邮件客户端 (以Foxmail为例) 设置代理服务器类型有HTTP代理、SOCKS4代理和SOCKS5代理, 本文则设置为SOCKS5代理, 相应地即在服务器端实现一个SOCKS5代理, 为邮件客户端提供邮件的代理功能。

首先, 由邮件客户端向代理服务器建立TCP连接;然后, 邮件客户端向代理服务器发送代理请求;代理服务器向邮件客户端发送允许代理的响应报文;邮件客户端收到代理服务器的响应后, 向代理服务器发送协商请求信息及相关端口信息;代理服务器向邮件客户端返回协商请求结果和代理端口号;邮件客户端将数据发送到代理服务器, 并由其代理发送、或接收邮件[3]。

2.2.2 邮件内容获取模块

通过对邮件协议的设计解析, 就可以获取到邮件的内容。当内部网络向邮件服务器发送邮件时, 此时则可根据SMTP协议去获取邮件的内容。在SMTP协议中, 邮件客户端通过向邮件服务器发送”DATA”关键字、也就是向服务器发送邮件主体请求, 收到邮件服务器的确认后开始发送邮件的主体。当研究中收到邮件客户端发出的DATA数据后, 暂不将数据发送到邮件服务器, 而是首先在代理服务器上解析DATA数据, 以获取邮件的主题、正文和附件。

邮件数据包括两部分, 分别为邮件头和邮件体。现在将这两部分的结构内容展开研究论述。首先, 邮件头的结构如下所示:

Date标示邮件的发送时间, From标示邮件的发件人, To标示邮件的收件人信息, Subject是邮件的主题, Mime-Version标示了MIME的版本, 而Content-Type则标示了邮件的内容类型。在这个例子中, 邮件的主题是经过编码的, “=?GB2312?B?ucu0886w?=”标示邮件的主题是GB2312编码的, 又经过了Base64编码后进行传输的。

其次, 邮件体信息通过MIME格式编码, 一封邮件的邮件体如下所示 (已删去部分空行和冗余信息) 。

对MIME编码的解析, 首先判断其传输编码, 在每个boundary下都有Content-Transfer-Encoding字段标示本部分内容的传输编码方式, 常见的编码方式有:7bit, Base64和quoted-printable。然后对相对应部分进行还原, 即可得到邮件正文和附件的原始编码, 进而得到邮件的内容[4]。

2.2.3 邮件内容的审计

邮件监控需要对获取到邮件内容进行审计, 以判断这封邮件的内容是否涉及到涉密信息。

通过对邮件源码的解码获取到邮件的主题、正文和附件的内容, 然后对其进行文本预处理, 排除干扰项, 然后将获取的内容通过对关键字进行匹配, 来判断邮件是否涉密。

通过对比了Aho-Corasick算法 (简称AC算法) [5]、反向AC自动机算法和反向跳跃自动机算法[6], 可以发现反向跳跃算法较适合做邮件内容的审计。反向跳跃自动机算法结合了AC算法和BM算法, 在进行多模匹配的过程中, 反向跳跃算法有较高的效率。在涉密邮件信息的检查中, 涉密信息在邮件中占有的比例较小, 匹配过程中匹配失败的次数比较多, 则跳跃产生的次数比较多, 使得反向跳跃自动机算法匹配时间偏向于较好的情况, 故选择反向跳跃自动机算法作为邮件内容的审计策略。

由于中文的编码方式有多种, 而在邮件中中文的编码方式是未知的, 多样的, 所以对于每个中文关键字, 都将其GB2312码、GBK码、UTF-8码和Unicode码编入AC自动机中, 提高审计的准确率。

2.2.4 响应策略模块

经过内容审计后, 邮件可以分为涉密邮件和非涉密邮件。对于非涉密邮件, 直接对其转发, 不采取任何措施;对于涉密邮件, 对其进行销毁处理, 由代理服务器接收邮件, 替换邮件的内容, 将邮件的主题、正文和附件替换为预先准备好的警告邮件或垃圾邮件, 发送到服务器, 以保证涉及的关键信息不通过电子邮件的方式泄露。另外, 保存涉密邮件的信息, 以便后期跟踪调查。

2.3 邮件监控技术的目标

邮件监控技术的目标包含两个方面:一方面是保证良好的邮件环境, 过滤垃圾邮件和防止邮件炸弹;另一方面是保证信息安全, 防止内部涉密信息通过电子邮件的方式泄露出去。

3 结束语

本文给出了一种利用邮件代理服务器实现对内部网络和外部网络之间的电子邮件进行监控的方法, 提高了电子邮件的安全性, 降低了内部人员有意或者无意地通过电子邮件泄露涉密信息的可能性。

参考文献

[1]林磊.基于Linux的邮件实时监控技术研究[D].南京:南京理工大学, 2005.

[2]张冬艳, 殷丽华, 胡铭曾, 等.面向内容安全的多模精确匹配算法性能分析[J].通信学报, 2004, 25 (7) :128-136.

[3]夏永泉, 张秉权, 许洁萍.SOCKS5代理技术分析及应用[J].软件技术, 2003, 22 (1) :42-45.

[4]王圣波.局域网垃圾邮件监控及过滤技术的研究[D].长春:吉林大学, 2014:31-32.

[5]AHOA, CORASICKM.Efficient string matching:an aid to bibliographic search[J].Communications of the ACM, 1975, 18 (6) :333-340.

监控员的工作内容 篇2

2.密切观察监控点,发现异常(如烟火等)应立即报告上级,并迅速通知有关人员前往扑救,3.火警就是命令,一旦发生火灾,工作人员必须高度集中,坚守岗位,密切注意火势曼延,及时报告,4.密切观察屏幕上的人和事,发现乱窜楼层或故意乱扭门锁以及在多个楼层重复出现的嫌疑人,应立即通知保安前往调查,严格控制一切不法行为在酒店出现,5.严格遵守安全保密制度,保守监控中心的任何秘密,未经领导批准,不得查阅任何录像资料,有无关人员进入监控中心时,应立即劝其离去,并记录工号。如是领导进入,应在值勤本上做好记录。

6.熟悉安保监控、消防报警等设备的技术性能及操作方法,熟悉各部门消防设备的分布情况,了解当天客人的住宿情况。

7.负责保管本岗位所使用的各种设备和设施,交接班时应对设备和物品的种类、数量及完好程度进行检查登记。

8.认真观察监视部位,在监控屏上发现可疑情况和受监控对象时。应及时进行跟踪切换录像并通报各有关岗位采取必要措施。当消防系统报警或接到报警电话,应立即用对讲机通知就近的安保人员赶赴现场予以处理,同时做好详细记录。

9.做好监控、报警仪器的清洁保养工作,当监控报警仪器发生故障时。应立即通知和协助工程部门尽快排除故障,并做好详细记录。

10.要热情礼貌地应答各方面的来电。

11.要保证所佩带的机器电源随时充足。

12.监控室内不准吸烟、闲聊,上岗后和离岗前应进行整理打扫,以保持室内外的清洁卫生。

13.认真做好监控值班记录,交接班时要说清情况和动态。对未处理完的工作应向接班员工转述。接班人员未到岗,本班值勤人员不得擅自离岗。14.

一、严禁闲杂人员进入消控室,室内严禁吸烟。

二、坚守值班岗位,严密监视消防信号,认真做好值班记录。

三、发生火警、火灾时按酒店规定的火警火灾处置程序进行操作。

监控内容 篇3

网络信息安全是一个关系国家安全、社会稳定、民族文化继承和发扬的重要问题。其重要性,正随着全球信息化步伐的加快越来越突显出来。随着互联网的发展,用户对网络的访问和需求越来越大,随着网络信息资源的丰富,网络流量越来越大,各种网站经营的业务范围混乱,而缺乏有效的监督管理技术,给网络运营商的业务管理、信息安全管理带来了很多负面效应和问题。如何安全有效的管理网络业务,即:如何发现网站,进而发现网站内容及其主要叙述的关键词,同时追踪其迁移轨迹和内容变更等更是成为互联网上的业务管理和信息安全管理中的一个难题。

如果采用传统的技术发现网站,可以通过域名查找IP,而逆向无法实现(除非域名做了反向解析,但是此类域名极少),而且,国内同类产品目前是通过搜索引擎原理实现的,其网站发现方案采用蜘蛛技术,通过网络抓取而获得,遍历整个互联网时间周期长(约为1个月)。数据更新速度慢导致不能及时在指定IP段内进行网站的发现和网站内容分析。

本文通过IP地址分段表,提取用户访问路径,获得所有被访问的网站域名、访问流量信息和IP地址等信息,通过系统获取的域名提取网站主页内容,从而确定网站的主要经营业务。原则上,只要历史上被用户访问过一次的网站,均可被记录发现,从而及时发现各种有害网站,帮助网络运营和监管部门进行网络管理,提高IDC的监管。

随着网络技术的迅猛发展,现行的网络环境日益复杂,网络上各种信息鱼龙混杂,丰富的网上信息资源带来了海量的数据分析和处理,使得网络运营者对网络信息的管理和维护工作难以有效展开。为全面发现某一段网络地址中存在的信息内容,并对内容实现垂直分类,现拟研究一种在指定IP段内发现网站域名,并对网站内容进行分析、分类的技术框架,目标是通过该技术框架,在网站接入地址动态变化和内容动态更新环境下进行智能分析。

1 相关研究

为了及时发现网站及内容,首先必须要取得该地址段内的所有网站域名。现有较普及的技术主要是搜索引擎使用的网络爬虫技术和在用户软件中装插件方法。

网络爬虫技术,即通过自动读取一篇文档遍历Web的超链接结构,从而递归获得被引用的所有文档。搜索引擎对搜集到的内容按照关键词进行索引,建立索引数据库提供全文检索。这种方法受多种因素限制:一是硬件规模、网络爬虫的性能、网络带宽等因素直接影响整个搜索引擎索引网页的数量、质量和更新周期;其二,索引技术的先进性、自然语言的识别能力等方面则直接影响搜索的准确性和响应速度;其三,网络中的一些孤岛站点由于不与其他网站建立连接,很可能无法被爬虫发现。这些因素影响了搜索引擎的信息全面性。因此,网络爬虫技术在该领域的应用存在投资巨大、不适于小规模应用、难以提供个性化服务等问题,所以至今尚无成功利用该技术的应用案例。

以插件形式安装到用户软件系统中的方法,如alexa工具条等,可以收集用户上网信息,定期向服务端汇报,从而收集网络上的地址列表。该技术实现难度不大,获得数据较全面,局限之处在于要求绝大多数用户安装此服务,才可以获得更全面的信息。所以该方案也无法获得应用和推广。

2 系统框架结构

系统主要解决的是在指定IP段内发现网站并对网站内容分析,从性能上说,一是实现实时发现,实时跟踪,提高数据库更新周期;二是解决网络孤岛的问题,只要历史上被访问过一次的网站、网页、服务站点,均可以被该系统发现,而不需要考虑网站与其他节点之间的链接数量的多少。系统可以实现针对指定IP段内的网络域名的提取,包括主域名、二、三级等下级域名、以IP作为访问的地址,在发现域名的基础上,系统将继续判断该地址所提供服务的类型(如Web,FTP等),最后将分析所提供服务的信息内容,提取关键词,进行信息归类,提供检索。系统拓扑结构如图1所示。

3 系统功能设计与实现

整个系统分为数据采集、数据分析、内容抓取、信息分析、检索响应块5个模块,如图2所示。各模块之间互相配合衔接,顺序执行。为提高整个系统的鲁棒性,提高在各模块出现异常状况下的容错能力,各模块之间采取数据缓冲存取的方式。为减少系统在做大容量数据处理时对硬件的依赖,全面使用了内存数据库技术,最大程度减少对硬盘读/写。

3.1 数据采集

模块位于整个系统入口,负责采集并清洗用户上网信息并将其序列化。该模块不间断进行数据采集,确保数据的及时更新。模块运行逻辑如下:

(1) 对用户上网的海量信息(DNS日志)进行定时(如每小时)抓取,通过FTP等方式存储本地设备,为减少整个系统对网络带宽的依赖,数据压缩后传输(最大压缩比可达1∶6)。

(2) 对日志文件初步分析,剔除异常文件,防止引起系统错误。

(3) 分析程序对本地的数据文件解压后,分块(每块3 MB)读入内存处理。

(4) 建立内存数据库和相关map结构,提取所有曾解析过的域名信息(包括主域名及二、三级等域名);合并相同域名并序列化,当前日志文件处理完成后,再对各区块的运算结果再次合并、剔除重复,最终获得的域名存入MySQL数据库,提供给下一模块,同时删除日志文件,节省硬盘空间。

数据采集的最终目的是获得所有被访问过的域名。

3.2 数据分析

该模块承接数据采集模块,为提高整个系统的更新频率,每日运行一个周期,对其采集的域名信息进行分析,根据地域归类。模块运行逻辑如下:

(1) 读取数据库中所有域名,包括以前发现的域名、主域名、二、三级域名。

(2) 启动500个线程,将这些域名分为500等分,各赋予每个线程;每个子线程对域名执行ping,并获得对应的IP地址。

(3) 根据所要采集的网络地址段,将符合条件的域名存入该容器中;不符合的舍弃,不做判断。

(4) 对比前一天所采集到的域名,若属于新增域名,则增加记录;若属于已有的域名,且指向发生变化,则记录下变更信息;未变化则不做修改。

(5) 对照IP地址的物理分配方案,即可输出某IP段内(或某物理地域内)所含域名的数据成果。

数据分析的最终目的是获得指定IP段内的所有域名。

3.3 内容抓取

该模块局部采用爬虫技术,对数据分析所输出的域名进行内容抓取,并存入本地库中。该模块在数据分析执行一周期后执行,每日执行一次。完成以下操作:

(1) 读取数据库中所获取的域名数据;

(2) 根据获得的数据数量,分若干线程,每个线程负责对500个域名的内容抓取;

(3) 根据域名对应服务器所开放的端口服务,来确定该域名提供的网络服务;

(4) 如果是Web服务,读取网页所包含的内容及页面所包含ifram,frame等子页面的内容,形成原始数据存入数据库;对获得的内容进行哈希运算,运算结果作为判断是否更新的依据(无更新则不记录);

(5) 将所获得的404,500等常见错误信息、相应时间等存入数据库;

(6) 按上述路径对页面上的链接重复抓取,直到所有页面上无本网连接为止,记录所抓取的相关子页面内容。

内容抓取的最终目的是获得指定IP段下,所有的域名所提供的服务类型、内容、响应速度等基础数据,同时获得以IP地址作为访问地址的Web服务。

3.4 信息分析

该模块部分承接内容抓取功能,针对提供Web服务的域名,采用内容提取、中文分词、词频分析等技术,获取内容的关键词及重要程度排序。

(1) 读取数据库中所获取的最新更新的Web内容;

(2) 进行中文分词和词频运算,获得该段内容的核心关键词及其权重;

(3) 根据关键词所属类别,归类关键词。

信息分析最终实现是输出网页每天所叙述的内容,归属为某一类或几类,并找出最贴近的类,从而形成垂直分类信息。

3.5 信息检索

该模块提供人性化检索界面,实现数据的查询,展示系统运算结果,可以实现:

(1) 对指定IP段内的域名进行检索;

(2) 对指定IP段内的信息内容的关键词检索;

(3) 对指定IP段内的网站相对访问量、响应速度、错误页面数、IP网址等信息检索;

(4) 对指定域名的历史内容、历史指向迁转的查询;

(5) 对指定类别的信息检索等。

4 系统实现

4.1 软件选型

为增强系统的稳定性和执行效率,减少对其他软件系统的调用和依赖,系统主程序部分采用C++语言编写。由于该系统对数据库依赖较小,可选用任何数据库软件,实验系统选型MySQL 5.0。为满足信息查询的需求,检索服务系统使用Php语言。

4.2 硬件选型

由于整个系统对资源开销主要集中在数据采集模块和内容抓取模块,而在使用内存数据库等技术的前提下,对系统要求不高,选型PC Server(CPU 4核2.8 GHz×2,内存4 GB,scsi硬盘300 GHz×6 raid 5)两台,网络要求10~100 Mb/s独享接入。

4.3 系统程序实现关键步骤

系统程序实现关键步骤如下:

(1) 日志分析:建立map结构,开始处理日志程序:

(2) 获取域名所在地区;

(3) 内容抓取。

5 系统性能分析

5.1 实验测试条件

为了验证该系统的可靠性,以某省内所有论坛网站为例进行抓取测试。

(1) 硬件环境

服务器:1台PC Server;配置CPU4核2.5 GHz×2,内存4 GB;scsi硬盘136 GB×2 raid 1;网络带宽为100 Mb/s共享。

(2) 测试环境

数据源为某省级DNS服务的220万宽带用户,DNS每小时整点吐出打包日志一次,DNS最大的日志是在9~10点间生成的日志,大小约1.13 GB,压缩后为189 MB。

5.2 实验测试结果

单小时日志平均传输时间约为25 s,解压约需30 s。采集模块处理单小时日志的数据时间平均约为11 min,数据分析模块运行一周期时间为6 h(库内积累的域名约900万个)。

输出结果:

(1) 获得指定该省内的主域名数为57 045个(与从域名注册商公布的数据基本吻合),二级域名数为59 403个,IP网站数为589个,内容抓取时间约7 h。

(2) 获得省内论坛的数量1 031个。

测试结果显示:获取的省内的主域名数与从域名注册商公布的数据基本吻合;测试结果还显示:当所有模块同时执行期间,CPU平均占用率为57%,内存平均使用669 MB。

5.3 实验结果与系统性能分析

(1)

通过在线实施测试表明,实现DNS日志的采集, 分析服务器在100Mb/s共享带宽环境中, 传输时间要求5 min内完成,自动解压1 min内完成。

(2)

DNS日志分析,2 GB DNS日志,实现20min内完成分析,提取相关数据:域名、流量,并入库。

(3)

分线程进行域名查询, 10h内完成所有域名的遍历。

(4)

指定某个B段IP地址进行内容抓取,时间不超过1h。对内容进行关键词分析,与上一步骤同时进行。

6 结 语

通过对指定IP段内发现网站并对网站内容分析的方法,获得的数据具有全面性、及时性;对系统要求小,执行效率高。系统健康度高,维护成本小。该技术在分类信息获取、信息安全管理等方面有着广泛的应用价值。

参考文献

[1]SIEMENS AG.SIMATIC S7-200programmable controllersystem manual[M].[S.l.]:SIEMENS,2004.

[2]WINSTON HO W S,SIRKAR KK.Membrane handbook[M].USA:Van Nostrand Reinhold,1992.

[3]KESTING R E,Fritzsche.Polymeric gas separation mem-branes[M].USA:John Wiley&Sons Inc,1993.

[4]肖安昆,刘玲腾.自动控制系统及其应用[M].北京:清华大学出版社,2006.

[5]吴其蒙.高纯氮设备流程设计综述[J].深冷技术,2002(2):15-19.

[6]近藤精一,石川达雄,安部郁夫.吸附科学[M].李国希,译.北京:化学工业出版社,2006.

[7]SHINKEY F G.过程控制系统:应用、设计与整定[M].萧德云,吕伯明,译.北京:清华大学出版社,2004.

监控内容 篇4

关键词:可伸缩视频编码,扩展空间可伸缩性,交通视频,内容自适应

0 引言

SVC[1]这种只提供唯一可伸缩的视频码流来支持多种设备和异构网络的技术优势非常适合视频监控系统的应用。其包括时间可伸缩、空间可伸缩和质量可伸缩三种类型。空间可伸缩主要是指不同分辨率间的线性缩放操作,并通过标准将多个分辨率视频压缩到一个码流中[2,3,4]。当前SVC标准中的扩展空间可伸缩ESS支持不同纵横比间的裁剪与缩放操作[3,5]。

视频重定位是最近得到广泛关注的一项技术。给定视频通过非线性操作将内容自适应的缩放到不同的目标分辨率和纵横比,并保留视觉重要区域,变形在视觉相对不重要的区域被隐藏。其中Warping[6]和Seam Carving[7]是视频重定位中研究较多和性能较好的两种技术。文献[8,9,10]将SVC标准和内容自适应的视频重定位技术结合起来进行研究,其核心思想是通过文献[6]中的Warping重定位方法得到空间基本层的视频,并把基于Warping的非线性纹理预测和Warping本身的预测编码集成到SVC标准的框架中来。该方法对于一般广播电视的视频应用,在增加一定带宽的情况下,对低分辨率终端有较好的内容自适应性。由于监控视频在一般情况下背景长期静止,不同监控对象类型又有着独有的视频特征信息,所以监控视频的重定位与内容自适应有着一定的特殊性。

本文针对交通监控视频进行研究。大多数情况下,人们只对监控有效区域中的主导车辆,即视觉上最突出的车辆感兴趣,通过视频分析模块定位出主导车辆所在运动窗,即包含车辆的最小窗口,可以认为该窗口就是监控画面的视觉重要区域,所以对于高分辨率交通监控视频的内容自适应重定位,只采用裁剪和缩放方法,优势在于:(1)由于计算复杂度低,可以做到实时的视频重定位;(2)完全符合SVC标准的编码框架,无需任何标准的扩充和功能的添加。

1 系统编码结构

整个系统编码器结构如图1所示。与标准的SVC空间可伸缩编码器相比,主要是增加了“交通视频分析”部分,在该处理部分中,利用人眼只对监控有效检测区域内运动车辆感兴趣的特点,通过背景差法获取运动车辆,并进行跟踪和分析,从而达到视频重定位的效果(见第2节详述);接着输出ROI在空间增强层(即原始交通视频)内的裁剪参数(即相对位置与宽高),并利用该参数对增强层进行裁剪和缩放,产生视频重定位后的空间基本层;然后将空间增强层视频、空间基本层视频和裁剪参数输入到SVC编码器进行ESS下的编码。为了进一步提高编码的率失真性能,针对空间增强层中的ROI分布,以跟踪准确度代替PSNR进行度量,采用变换系数压缩矩阵和分层量化策略去除与跟踪无关或关联低的码流,达到更高的压缩率(见第3章详述)。

2 内容自适应的空间扩展

如图2所示,CIF空间增强层通过两种方式来产生QCIF的基本层,一种是传统的一般下采样方式,一种是通过裁剪和缩放的方式将运动车辆所在ROI的裁剪窗口生成基本层,使用SVC标准的ESS方法,ESS中的关系如图3所示。可以看出,裁剪窗口不用和宏块大小进行对齐,这更有利于精确的定位ROI所在窗口;同时,裁剪和缩放参数可以针对每一帧图像进行设置,可以更好的对视频内容进行自适应的ROI选取。此处唯一的限制就是空间基本层的宽和高要小于对应的裁剪窗口。

采用文献[11]中改进的单高斯模型进行监控视频的背景建模,对于停车和缓行较多的监控也可以取得较理想的背景图像。由于基于区域的车辆跟踪算法具有良好的抗噪性和实时性,文献[12]对于常见的遮挡问题给予了有效解决,本文使用文献[12]算法进行车辆跟踪。

对于常见的近距离单车道监控,车辆从进入监控画面的有效区域到驶出,如图4所示。可以看出,从第i帧到i+18帧,只有一个深色车辆,那么该车对应的运动窗就是ROI,将作为裁剪窗口,从i+19帧开始到i+39帧,监控画面会出现其他运动车辆,但是深色车辆运动窗面积相对较大,仍为主导车辆,所以仍以深色车辆运动窗作为ROI进行裁剪,那么下采样后的重定位效果如图5所示。

由于在不同时间段上每帧中运动窗大小不一致同时也存在运动车辆检测不十分准确的情况,这会导致短时间连续帧内重定位后的同一车辆的大小不一致(仍如图5所示),这种宽度和高度上的变形,会造成视觉上的不舒服感。为了减少变形的差异性,应该使同一辆车的运动窗保持一致。为了保证同一车辆运动窗大小的一致性,本文选用的策略是以同一辆车在监控时间范围内作为主导车出现的最大运动窗为标准,其他运动窗按照上、下、左、右四个方向扩展到最大运动窗大小。

基于主导车辆运动窗分析的视频重定位算法如下描述:

Step1定义两个数据结构,CarList和TraceList。CarList表示每帧图像中跟踪车辆对象的链表,即每帧图像对应一个CarList;TraceList用来保存已经读入但还未进行主导车辆检测的每个图像所对应的CarList,图像经过主导车辆检测后,所对应的CarList从TraceList中进行删除;

Step2判断车辆何时已经不在监控范围。

式中Car表示跟踪车辆,current表示当前检测帧,Length表示i帧后面连续检测的帧数。比如当Length=3的情况下,以图4为例,当在current=i+48帧位置,连续检测后面三帧中的CarList,都检测不到深色车辆,则认为深色车辆已经不在监控范围。当一个运动车辆从监控画面中消失后则按照下面步骤进行该车辆是否为主导车辆的检测。

Step3判断主导车辆。

式中i表示监控车辆出现的帧位置,Count函数用于检测跟踪车辆的数量,仍以图4为例,比如从i帧到i+47帧查找每帧对应的CarList,检测出从第i帧到i+18帧,只存在Step2中驶出监控范围的深色车辆,此车即为主导车辆。Area函数用于计算车辆运动窗面积,>>符号表示远大于,可以根据应用的实际需要设定一定的比例阈值,比如从i+19帧开始到i+39帧,监控画面会出现其他运动车辆,但是该深色车辆运动窗面积相对较大,仍为主导车辆,所在从i帧到i+39帧中深色车辆为主导车辆。

Step4找出跟踪车辆的最大运动窗,该车辆的其他运动窗以此为标准进行扩展,并获取每个帧号和扩展后运动窗位置与大小等参数,用于裁剪窗口的下采样。比如图4中的第i+27帧中该深色车辆运动窗最大。

Step5如果跟踪车辆与其他车辆的运动窗大小基本一致,不存在主导车辆,比如图4中检测的i+40帧到i+42帧的深色车辆。此时则按照常规的传统方法对整个画面进行下采样,也就是说整个有效监控区域都是ROI。

Step6如果跟踪车辆为次要车辆,则不作处理。比如图4中从i+43帧到i+47帧,有多辆车存在,检测出深色车辆为次要车辆。

Step7将跟踪车辆对应的CarList从TraceList中删除掉。

Step8用同样的方法循环处理,继续对后面车辆进行主导车辆的检测。

3 基于跟踪最优的压缩编码

采用以上内容自适应方式进行SVC编码,全局的相关性变弱了,而且由于基本层整体预测性能的下降,会导致层间预测性能的进一步下降,所以系统整体编码的率失真性能会有较大的下降。

为了编码时分配更多的比特资源给视觉感知更重要的宏块,有两种常用的方法进行比特资源控制,一种是量化参数QP(Quantization Parameter)控制,即重要的宏块给与更小的QP;另一种是频域系数压制,图6描述了18种不同的频域系数压制矩阵SM(Suppression Matrix),通过与4×4的频域系数矩阵对应元素相乘,将部分高频系数转为0,从而达到压缩目的。

事实上,仅仅基于ROI的编码,不管是QP或SM控制,率失真性能的提高也是有限的,因为码率的减少总会带来质量的损失。考虑到交通监控视频的特殊性,主要目的是在对象跟踪的基础上,进行高层语义的分析,所以此处以跟踪最优代替PSNR作为解码视频质量的评价标准[13],以达到高压缩率的目的。

利用文献[13]思想,并将基于ROI的QP和SM控制结合起来去除更多低跟踪感兴趣比特,算法具体如下:

Step1对不同宏块类型进行QP初始化:

式中q为QP的输入值,x为增加的量化度,如果太大,帧间预测效果会损失过多,如果太小,无法去除更多的视觉冗余,此处取经验值6。有效监控区域是指交通监控感兴趣的公路或道路路段,关注于其中的车辆与行人,除此以外的区域为非有效监控区域。进一步的量化优化将针对非背景帧的有效监控区域中的宏块。

Step2频域系数压制初始化:

式中SMA是图6中所示SM的数组,SMC表示当前所选的SM,数组索引i初始化为0,就是说跟踪度量从使用最少的比特开始,SMC将对有效区域内的所有宏块进行处理。

Step3跟踪视频片段集初始化:

式中Sk表示用来做跟踪处理的视频片段,其大小由编码的时延需求和具体的应用所决定,通常不会太大。使用集合S而不是单个的Sk是为了通过跟踪度量平均值的方法来提高准确度,但是如果片段过多的话会带来较高的计算复杂度,因此根据经验在实验中选用帧长度为5和10的两个片段,那么压缩后的码率R和跟踪准确度A按如下计算:

Step4 SMA索引i=i+1,获取下一个SM,即SMC=SMA[i],(Ri,Ai)按照式(6)再计算。通常情况下,Ri会大于Ri-1,如果Ai≤Ai-1×p并且Ai+1≤Ai×p,则循环结束,否则继续获取下一个索引i,并且计算(Ri,Ai),直到满足上述条件或结束,此处按照经验0.95≤p≤1。当更多频域系数被去除的时候,噪声也会更多的被滤除,在个别步骤可能会引起跟踪准确度比前面的更好,因此在上述判断中将A连续判断两次来尽量保证结果的准确性。通过这样处理,可以得知为跟踪准确度提供最高权衡的频率系数被保留了下来。

4 实验结果

4.1 编码效率

测试的交通视频来自国内外真实的应用,并且在视角、质量和监控类型各有不同。实验选用Pentium(R)Dual-Core2.5GHz CPU,2G内存的台式电脑,Window XP操作系统。实验配置参数为:编解码器为JSVM9.19版本,测试1500帧,GOP大小为8,intra-period为-1,inter-layer预测模式为2,对于近距离、路口和远距离监控的空间分层对应关系为(720×480,352×288),(352×288,176×144)和(640×480,320×240),可以看出包括了二分与非二分的比例关系。基本层与增强层的QP分别为(22,24)、(26,28)、(30,32)和(34,36)。

首先采用传统的率失真方法进行度量。选用的不同编码策略如表1所示。标准二分下采样空间可伸缩编码方案简称SD;内容自适应下裁剪窗口下采样的ESS简称CE;CE中通过QP控制的感兴趣区域编码简称CE_Q;CE中通过变换压缩系数控制的感兴趣区域编码简称CE_C;裁剪窗口内部宏块简称CI;裁剪窗口边缘宏块简称CE;检测区域运动宏块简称DM;检测区域静止宏块简称DS;无效区域运动宏块简称IM;无效区域静止宏块简称IS。QPE表示增强层量化参数,SMn含义参见表1中说明。

对应QP=(22,24)的不同编码方案下PSNR与码率对比如表2-表4所示,其他QP值下对应的结果基本相似,不再列出。感兴趣区域率失真比较曲线如图7所示,不同参考帧下比较结果基本一致,此处为参考帧数量为2的比较结果。

从表2-表4中,可以看出,多参考帧情况下,SD与CE的整帧图像下和ROI下的PSNR都没有增益,而对于CE_Q,整帧图像下PSNR两参考帧比一个参考帧下平均有约0.37 d B增益,ROI下平均约0.13 d B增益,对于CE_C整帧图像与ROI分别有约0.17 d B和0.1 d B增益。这是因为基本层内容来自增强层的cropping和scale,所以内容突变的情况会多一些,采用多参考帧的情况下,预测会更加准确,但是由于多参考帧会增加一定的编码时间,只有在对实时性要求不是很高的情况下,才考虑使用。进一步分析可知,与SD相比,在CE下由于基本层帧间和层间的整体关联性变差,所以帧内编码模式增多,码率平均增加约15%;在CE_Q和CE_C下,码率最大增加约8.7%,最小约1%,平均增加约5%和3%,比CE下减少了约10%~12%,减少效果显著;再来看PSNR,由于CE_Q和CE_C对于不同的非ROI区域给予了不同级别的低质量编码,所以整帧图像质量会有较明显的下降,与SD相比,CE_Q和CE_C的PSNR最多减少2.5 d B,最少减少0.8 d B,平均减少约1.8 d B和1.4 d B;而对于ROI区域,由于给予了更高的质量编码,与SD相比,CE_Q和CE_C的PSNR最多减少0.7 d B,最少减少0.3 d B,平均减少约0.6 d B和0.4 d B,这种损失对于ROI区域内的监控效果和视频分析造成的影响几乎可以忽略。从图7中可以清晰地看出,对于ROI区域来讲,CE_C的率失真性能略高于CE_Q,这是由于在CE_Q方案下,部分非ROI区域QP值较高引起的。而CE_C与CE_Q的率失真性能都明显高于CE,确保了在空间增强层ROI区域高质量编码情况下的低码率传输,并有效地支持了空间基本层的内容自适应。总体来说,编码效率有一定的提升,但不是很显著。

不同序列的码率与跟踪准确度比较曲线如图8所示。从图8可以看出,远距离监控的编码效率最好,在相同跟踪准确度的情况下,比传统方法码率节省约80%,最差也有60%的节省。对于所有测试序列,平均有60%的码率节省。在相同码率情况,远距离监控也有着更高的跟踪准确度,可以看出明暗变化、附加噪声和摄像机抖动并没有对编码效率产生影响。车行流畅和较少的流量带来更佳的跟踪准确度和更高的压缩率。这是因为此时静止背景图像的数量较多,而且远距离监控画面中的无效监控区域面积也更大,所以与跟踪无关或低关联的码流就更多。

4.2 计算复杂度

下采样视频来自原始的高分辨率视频,对于内容自适应的ESS,不仅要进行裁剪和缩放,还要进行空间增强层的背景建模和车辆跟踪,如表5所示,对于整体的计算复杂度几乎没有影响,一方面是因为选取算法本身的低复杂度,另一方面是背景图像占有一定的比例。

在内容自适应ESS的编码过程中,迭代量化优化(IQO)被加入,如表6所示,该算法耗用时间占整体比例极低,基本可以忽略。

5 结语

上一篇:旱地玉米高产栽培技术下一篇:创新环境艺术