网络舆情系统

2024-08-28

网络舆情系统(共6篇)

篇1:网络舆情系统

舆情监测系统介绍

功能和服务

舆情监测系统的数据是经过清洗、过滤、抽取、分析和挖掘的,舆情监测系统的主要功能并不只是提供简单的舆情信息搜索,而是具有全网搜索、定向监测、自动发现,自动预警,趋势分析,自动分类等功能,具有丰富的统计结果。

而互联网搜索引擎只能提供相关的搜索服务,要靠人工主动去搜索,搜索结果出于商业利益的驱动,掺杂很多的不合理的因素,准确性、可用性不强。全面性和及时性方面完全不能满足舆情监控的需要。

采集范围和深度

舆情监测系统所采集的信息范围主要是定向的,是用户关注的特定区域、特定领域的网站,针对这些网站可以做到全面采集和精准采集。虽然baidu/google等互联网搜索虽然采集范围广泛,但是针对具体的舆情载体,采集深度不够,采集不全面。

目前搜索引擎的数据采集采用的是广度优先策略,会根据url地址进行重复采集的控制。对于论坛、贴吧等舆情载体不会按照主贴、跟帖、翻页的方式进行精确采集,采集深度满足不了舆情监控应用的需要。

西盈网络信息雷达系统专门针对西盈网络舆情监测(监控)系统和西盈竞争情报系统开发而成的,深度挖掘技术超越了google等以智能化和广度见长的搜索引擎爬虫系统。

更新速度

舆情监测系统用户可以自己设置采集的更新频率,对于舆情高发的载体网站可以做到分钟级的更新,这一点互联网搜索引擎是无法达到的。互联网搜索引擎的采集周期一般都是数天或者数周,甚至会出现漏采,无法采集的情况。

采集的网站种类

舆情监测系统可以做到对新闻,论坛,博客,贴吧等舆情载体的全面采集,尤其是针对论坛(包括跟帖),贴吧等这些“草根”网站(这些媒体往往是舆情高发区域),实现全面、迅速的舆情采集的同时,可以实时更新信息的点击数,回复数,转载数等等。而互联网搜索引擎大多是采集新闻网站,而对于论坛,贴吧、博客等等往往无能为力,更无法提供舆情分析需要的统计数据。采集数据的有效性

互联网搜索引擎所采集的数据,往往是没有经过过滤的,甚至充斥着大量的广告等垃圾信息。这些信息往往可以作为舆情的并不多。而舆情监测系统所采集的数据全部都是有效的,和用户相关的,真正称之为舆情的数据。

舆情信息储存和利用

舆情监测系统的信息是储存在用户本地的,可以进行归档,分析利用以及作为应用系统的数据来源,但是针对互联网搜索引擎中的数据,用户没有任何干预的手段,只能通过其固定的检索服务进行访问。

相关信息的数量

百度和谷歌等互联网搜索引擎虽然拥有绝对多的数据量,但是对于和用户相关的舆情信息,由于其没有定向采集全面,深度等优势,其收录数量就会大大低于舆情监测系统。另外,舆情监测系统集成了互联网搜索引擎的元搜索功能。可以整合多个搜索引擎的搜索数据。

总结

成功的舆情监测系统是主动告知用户google等搜索引擎中或收录或没有收录的与“我”相关的舆情信息。重大事件及时预警,并提供量化的统计分析数据助力舆情分析,通过自动生成舆情报告等方式辅助舆情工作。

网络舆情监控系统解决方案

方案背景

据中国互联网信息中心调查,截至2009年12月31日,中国网民达到3.84亿人,全国互联网普及率28.9%,手机网民规模达到2.33亿。网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源于新闻评论、BBS、博客、聚合新闻(RSS),网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。

由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过BBS论坛、博客、新闻跟贴/转贴等渠道来表达观点传播思想。如果引导不善,负面网络舆情将对社会公共安全形成威胁。对相关部门来说,加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。对企业来说,准确掌握产品和市场情况,监控竞争对手和行业动态,是企业市场、行销决策的重要支撑。方案内容

系统介绍

易观网络舆情监控系统,整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测聚焦,倾向性研判等,实现用户的网络舆情监测和新闻主题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。

系统结构图

系统组网图

系统功能

1)深度多渠道网络信息采集,为用户提供监控源配置功能,可以对监控源的优先级进行配置调整。

2)完善的信息预处理机制:超链分析,编码识别,URL去重,锚文本处理,垃圾信息过滤,内容去重,关键字抽取,正文抽取等。

3)强大的索引分词机制,对舆情信息实施双重过滤,具有自动分类、自动聚类、相似性排重功能,系统能够自动完成热点发现。

4)热点舆情:系统自动识别出热点焦点事件,以舆情形式分新闻、论坛和博客三种类别呈现。及时发现网络热点信息。

5)专题追踪:生成专题报道对网络话题进行专题化的侦测和追踪,如两会、奥运会,对专题话题形成系统性的掌握和监控。

6)分站/分类浏览:对系统中舆情可以按网站和不同的分类进行浏览。同时可以对显示的舆情进行操作(设置影响、入简报、专题、收藏、删除)。

7)趋势分析:来源载体/站点分布、单个/多个关键词热度曲线图、主题/关键词热度的整体趋势、文章转载量日均/总体趋势分析、舆情信息的地域分布、网民检索行为分析。

8)突发事件分析:对突发事件进行预警,跨时间、跨空间综合分析,获知事件发生全貌。9)多种舆情检索方式:可按网站、类别、时间段、关键词等条件进行专项化全文检索,并可生成查询时间和次数、关键词查询频率等查询统计数据。另外还将结合检索关键词,随时补充全文检索库中的关键词,有机结合个人操作习惯,可在检索结果中进行二次检索。

10)舆情统计报告:根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。

11)统计报表:系统生成各种形式的报表。报表包括图表和数据表格,图表包括饼图、折线图、直方图等,如总量图、趋势图等;数据表格是对舆情信息的数理统计,以数字的形式记录各项舆情数据。另外用户可以自己需求定制报表模版,比如日报、周报、月报等。

12)舆情报警系统:对突发事件、涉及内容安全的敏感话题及时发现并报警,系统提供多种报警方式。

系统特点

1)精准全面的网络舆情采集,能够对论坛、博客、新闻评论等内容进行全面、精确的采集和及时的更新,为舆情分析提供强有力的数据保障。

2)多维度实时监测、过滤网络舆情信息,采集到本地的文章会自动标注并分析,具有趋势图直观展现。

3)专业的舆情办公平台,用户可以根据实际工作需要,将需要关注的信息定制到系统,用户可以随时调出自己需要的资料,直接追踪关注事件的传播源头,把握传播动态,系统自动生成舆情报告,节省用户人力。

4)专业的舆情分析顾问服务,基于易观深厚的互联网行业背景以及对网络舆情深刻的认识,协助用户进行舆情监控设计,对用户背景、行业特征及需求做深度调研,给出最适合用户的舆情监控方案。

5)丰富的舆情项目开发实施经验,有专业的舆情实施队伍和资源,提供从舆情监测规划、舆情系统选型、舆情项目实施、舆情工作开展到舆情干预的一体化的舆情系统解决方案。

6)拥有成熟的舆情产品,可以根据用户要求定制,需求牵引及时,在保证效果的同时提供良好的用户体验。

商业价值

帮助客户全面、及时、精准、专业、高效获取网络舆情并为己所用;

第一时间获取客户相关的正负面新闻、泄密信息、领导相关报道、近期舆论热点等,健全危机事件预警机制防患于未然;

协助企业客户准确掌握产品和市场情况,监控竞争对手和行业动态,为企业市场、行销决策提供支持支撑服务。

附件1:

“网络游戏未成年人家长监护工程”实施方案

“网络游戏未成年人家长监护工程”是一项在政府部门、人民团体指导下,社会和家长参与,网络游戏经营单位具体实施的社会行动,旨在加强家长对未成年人参与网络游戏的监护,引导未成年人健康、绿色地参与网络游戏,构建和谐家庭关系。该工程自2011年3月1日起全面实施。

一、“家长监护工程”的主要内容

(一)网络游戏经营单位建立专门的服务页面,公布专线咨询电话,开通专门受理渠道,介绍受理方式。

(二)家长需要了解、引导、控制孩子游戏活动的,由家长向网络游戏经营单位提供合法的监护人资质证明、游戏名称账号以及限制措施等信息。限制措施包括:限制每天或每周玩游戏的时间长度,限制玩游戏的时间段,或者完全禁止。

(三)网络游戏经营单位按照家长要求对未成年人的账号采取限制措施,并持续跟踪观察,及时反馈该账号的活动,为家长提供必要协助,制止或限制未成年人的不当游戏行为。

二、实施“家长监护工程”的具体要求

各网络游戏经营单位要做到“四有”,即有专人负责、有专线电话、有专区设置、有季度报告。

(一)专人负责

1.要指定专门的负责人,并将指定负责人及联络方式向所在地省级文化行政部门备案;

2.培训专门服务人员对“家长监护工程”提供专业咨询解答和服务支持;帮助家长了解被监护人游戏行为,提供家长与被监护人进行沟通的建议;

3.服务人员要持续跟踪每个申请,及时与家长沟通情况,反馈该账号的活动,了解未成年人参与游戏的状况,为家长提供必要协助。

(二)专线电话

1.开通单独的专线服务电话(区别于普通服务热线),提供咨询解答和受理服务;

2.在原有的客服电话中提供转接到专线服务电话的链接;

3.要提供多种服务渠道,确保家长可选择最便利的方式提出服务申请(传真、网络申请、电子邮件、信函邮寄、上门申请等)。

(三)专区设置

1.在网站设置“家长监护工程”专区,在主要运营产品网站的显著位置设置进入该工程页面的链接方式; 2.专区要有对工程情况、申请条件、处理流程、可采取的监护结果等事项的说明;

3.要在专区显著位置设置监护服务申请入口、受理方式(家长监护专线);

4.专区要预设好问题和答案,或展示虚拟案例操作流程及结果,供家长阅览和参考;

5.专区要设置服务申请进度查询;

6.专区要登载《未成年人健康参与网络游戏提示》(附件2),引导未成年人健康地玩游戏、玩健康的游戏。

(四)季度报告

各网络游戏经营单位要在每季度末向所在地省级文化行政部门提交“家长监护工程”情况报告。报告内容包括咨询数量、申请数量、受理与完成情况、重点案例分析、疑难问题说明,对于工程实施过程中出现的问题提出意见或建议。

三、强化信息公开和社会监督

文化部在中国文化市场网设置“家长监护工程”专栏,公布网络游戏经营单位名录、各经营单位“家长监护工程”服务网站主页、热线电话等信息,供家长和社会查询和监督。

篇2:网络舆情系统

免费工具虽然不要使用费,且能够获取需要的信息,但费时费力,对于品牌型等网络舆情监测要求较高的企业并不可取。目前国内致力于网络舆情监测软件开发,如托尔思TRS、方正电子政务、邦富软件、线点科技、中科点击、本果信息技术、古尼软件、迅奥科技、蓝通百特、维思比科技、iri网络口碑、红麦软件、新联财通、易宝等等。分析上述公司开发的舆情监测软件,主要包括以下功能:

1、自动采集功能

付费舆情监测软件把人工收集舆情的繁琐工作自动化了,其功能与搜索引擎的蜘蛛爬虫类似。当然,作为舆情管理系统,在自动采集页面后,还需要做自动分类、自动生成摘要,自动获取关键词,并建立索引。

2、分析处理功能

分析与处理功能主要表现在传播路径分析、话题演化分析以及观点倾向分析等。以TRS互联网舆情管理系统为例,具有话题发现与追踪、信息预警机制、倾向性分析、信息过滤、多维度关联舆情分析与舆情专题、舆情干预等功能。

3、统计报表功能

用符合用户习惯的可视化形式表现分析与处理的结果,也是付费舆情管理软件的一项重要功能。该项功能主要包括舆情简报、趋势图表、聚类图等,一些智能化的软件还会给出文字概述及舆情应对建议

等。

4、协同工作功能

部分舆情管理系统除了具备上述功能外,还有部分OA的功能,能够为后期企业各部门协同应对舆情提供OA环境。

篇3:网络舆情分析系统功能研究

由于网络的信息量十分巨大,仅依靠人工的方法难以应对网络海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情分析系统,及时应对网络舆情,由被动防堵化为主动梳理、引导。

网络舆情分析系统的基本功能

在我国,作为网络舆情管理的主体一般是地方政府和主管部门,其对网络舆情管理的基本要求是:及时掌控所辖范围内网站上的信息情况(包括论坛、博客、网站等),防止网络突发事件的发生进而诱发群体事件,维持安全健康的网络环境和稳定的社会环境。

因此,服务于地方政府或主管部门的网络舆情分析系统应该具备以下七大基本功能。

网站的设置功能:舆情分析系统所配置的来源网站主要包括国内知名的门户网站、论坛、贴吧、博客、所关注的境外网站以及辖区内一些有影响力的网站。

Web页面浏览的功能:网站的设置是为了方便采集信息的管理,也方便用户在Web页面上的浏览。

指定网站的搜索功能:主管部门所关注的信息类似百度贴吧的网络社区,以及辖区内具有一定影响力的网站,如各级论坛、各政府网站等;这部分的需求是通过配置指定网站的方法来实现的,指定网站配置采集可以做到信息的准确性。

全网搜索的功能:收集国内各个知名门户网站对该区域的报道和论坛中一些敏感的话题。由于全网搜索的准确性难免有所下降,应该可以通过配置关键字过滤来采集数据,保证采集回来的信息是用户所需要的。

主题事件的跟踪功能:主要通过主题词来监控一些突发事件和热点事件,如突发事件、重大事件。

敏感词自动检测功能:基于敏感词典信息过滤技术,可以有效地识别各种有害文字信息,以摆脱有害信息的侵扰,进一步监测各种严重政治性错误、淫秽色情、凶杀暴力、赌博迷信、非法、负面报道等内容的发生,可对各类有害信息及时有效地发起预警,并严防此类严重错误见诸报端。

短信提示功能:其主要作用是服务于领导。通过正常的配置,将采集的信息及时用短信的形式发给领导,使领导可以第一时间知道某些突发事件和热点事件的情况。

网络舆情分析系统的核心功能

充分考虑到使用者的功能需求,对以上基本功能进行软件工程学的分析后,可以发现以上七大基本功能的具体实现涉及舆情分析引擎、自动信息采集、数据清理、代理服务四大部分。其中,核心部分是舆情分析引擎。

舆情分析引擎是舆情分析系统的核心功能,至少应当具备八个模块进行功能分解。

识别模块:热点话题、敏感话题识别,可以根据新闻出处的权威度、评论数量、发言时间密集程度等参数,识别出一定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。

倾向性分析模块:对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计。

主题跟踪模块:分析新发表文章、帖子的话题是否与已有主题相同。

自动摘要模块:对各类主题、各类倾向能够形成自动摘要。

趋势分析模块:分析某个主题在不同的时间段内,人们所关注的程度。

突发事件分析模块:对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。

报警系统模块:对突发事件、涉及内容安全的敏感话题及时发现并报警。

统计报告模块:根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。

舆情分析系统的核心技术在于舆情分析引擎,涉及的最主要的技术包括文本分类、聚类、观点倾向性识别、主题检测与跟踪、自动摘要等计算机文本信息内容识别技术。这些技术一向是国内外信息工作者关注的领域。其中基于关键词统计分析方法的技术相对比较成熟,但在其有效性方面还有很大的提高空间。

网络舆情分析系统的其他功能

网络舆情分析系统的舆情分析引擎部分是其核心功能,而自动信息采集、数据清理、代理服务也是必不可少的,与舆情分析引擎作为整体进行信息处理,实现舆情有效分析。

自动信息采集部分主要是通过网络页面之间的链接关系,从网络中自动获取页面信息,并且随着链接不断向整个网络扩展。目前,一些搜索引擎使用这项技术对全球范围内的网页进行检索。舆情监控系统应能根据用户信息需求,设定主题目标,使用人工参与和自动信息采集结合的方法完成信息收集任务。

数据清理功能部分主要完成对收集到的信息进行预处理,如格式转换、数据清理、数据统计。对于新闻评论,需要滤除无关信息,保存新闻的标题、出处、发布时间、内容、点击次数、评论人、评论内容、评论数量等。对于论坛BBS,需要记录帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等,最后形成格式化信息。条件允许时,可直接针对服务器的数据库进行操作。

代理服务部分主要是指使用者根据需要选择服务功能要求,每个月只需要支出很少的费用,获得一个使用期限的用户名和密码,就可以登录使用系统平台,使用过程类似网页形式的电子邮件;或者完全将监控任务委托给系统,然后根据代理服务协议,为使用者提供全方位的舆情监控服务,所获得的各类反馈信息,采用电话、电子邮件、手机短信等方式及时汇报给使用者,支持个性化的报表定制。

网络舆情分析系统的相关技术

网络舆情分析技术是系统的核心应用技术,该技术是一组管理、提炼、应用、共享所有的显性知识和隐性知识及信息资源的方法,主要包含自然语言处理技术、信息检索技术、数据挖掘技术等相关技术。

自然语言处理技术主要包括自动分词技术和自动关键词与自动摘要技术。自动分词技术是中文信息处理与分析的基础。以词典和规则为基础,综合利用了基于概率分析的语言模型方法,使分词的准确性达到一定的信度,并可根据不同的应用进行适合特定要求的分词。自动关键词与自动摘要技术:在篇章语义分析的基础上,综合考虑词频、词性、位置信息,实现准确的自动关键词与自动摘要。

信息检索技术主要包括全文检索技术和图片内容检索技术。全文检索技术,即全文引擎将传统的全文检索技术与最新的Web搜索技术相结合,同时融合了多种相关技术,具有丰富的检索手段以及同义词等智能检索方式。图片内容检索技术,即图片检索不仅提供基于图片描述的检索,还提供对图片内容的检索,以及结合描述与内容的综合检索。

结语

网络舆情分析是有效掌控网络、促进社会主义和谐社会建设的重要手段。网络舆情分析系统涉及多媒体数据共享、互联网搜索、统计分析、数据仓库和数据挖掘以及人工智能等领域和技术,是一个复杂而新颖的应用领域。尤其是随着语义网络技术的更进一步的发展,必将使其舆情系统分析的结果更准确、更科学。

参考文献

[1].许鑫、章成志:《互联网舆情分析及应用研究》,《情报科学》,2008(8)。

[2].郝爱峰:《网页结构化信息抽取技术方法研究》,《山西电子技术》,2008(4)。

[3].吴兴业、班成英:《互联网舆情分析预警初探》,《信息网络安全》,2008(6)。

[4].班成英:《统计挖掘技术与舆情分析预警》,《数据》,2008(6)。

[5].林业锐:《数据挖掘技术在互联网金融信息检索中的应用》,《华南金融电脑》,2008(6)。

[6].戴媛、程学旗:《面向网络舆情分析的实用关键技术概述》,《信息网络安全》,2008(6)。

[7].钱爱兵:《基于主题的网络舆情分析模型及其实现》,《现代图书情报技术》,2008(4)。

篇4:校园网络舆情监控系统研究

关键词:网络舆情;QS单模式匹配算法;SunWu算法;敏感词

中图分类号:G642 文献标识码:B 文章编号:1002-7661(2015)06-003-01

一、引言

隨着互联网的兴起,信息的迅速传播,人们的生活方式、人际交往以及思维方式也随之改变。在高校,校园网络作为学生日常学习生活的重要平台,重要性毋庸置疑。学校主页、校内各学院、各部门主页,学校BBS,甚至各个学院BBS,班级网站都是高校学生经常访问的平台。类似于这种公共广场,是大学生自由发表评论、表达意见的网络空间,校园内外的一些重大事件和突发事件通常会以最新最快的速度在这种媒介场所内出现,引发大学生的广泛关注,形成大量的讨论。随着意见的扩散和讨论的深入,讨论的主题往往会逐渐趋向特定的焦点,形成具有一定规模的较为明确的网络舆情。而出于学生思想的积极引导以及校园安全工作的管理,对校园舆情进行有效的监控,是各高校所能采取的合适手段之关键。

关键字匹配算法主要是串匹配。串匹配是利用一个符号序列查找出一个或多个特定符号序列的过程。利用串匹配能在正文文本中寻找所有关键字集合中的关键字,并报告关键字出现的位置。依据在匹配过程中所要匹配的模式串个数,串匹配算法可分为单模式串和多模式串。串匹配技术的发展是与其应用密切相关的。随着计算机信息技术的发展,其应用领域除了早期的文本编辑、全文检索系统、查询系统等,现今已广泛应用到了网络入侵检测系统(NetworkIntrusion Detection System)、内容过滤、生物科学计算以及新闻主题提取等。利用串匹配技术,我和团队自主开发了校园网络舆情监控系统,并通过模拟数据,验证了串匹配技术在舆情监控系统中应用的正确性。

二、算法介绍

QS(Quick Search)算法是利用不良字符跳转表和文本串中未出现在模式串里的字符来匹配紧邻当前匹配窗口的下一个字符,能有效的加快匹配速度。在实际应用中,QS适用于大字符集、模式串较短时的情况。QS算法的空间复杂度为O(σ),其预处理阶段的时间复杂度为O(m+σ),最好情况下QS算法的时间复杂度可以达到O(n/(m+1))。

SunWu算法是基于单模式的BM算法设计出的一种多模式匹配算法。与其它算法不同,SunWu算法使用“块字符”(Block Character)作为基本单位,将其作为进一步匹配的入口和进行跳转的依据。SunWu算法使用长度为B的字符串代替坏字符串,进行最大限度的跳跃,并且使用散列技术和前缀表来减少需要进行实际匹配的次数。此外,SunWu算法不受大小字符集环境的影响,在中文情况下能够表现出比较好的性能,符合中文字

三、结果分析与展示

QS算法和SunWu算法是典型的关键字匹配技术的算法,二者有各自的优点,但也存在着明显的不足。因此,在自主开发的舆情监控系统中,我们将二者相结合运用,通过测试数据分析可知,QS算法和SunWu算法结合使用能大大提高系统的性能和效率。如图3.1所示,在其他条件相同的情况下,模式串的最小长度m=2,模式串数量由500增加到5000时,各算法扫描时间的变化。从表中可以看出,随着模式串数量的增加,各算法的运行时间都有相应增大,QS的运行时间一直低于SunWu算法。当模式串数量小于3000时,QS的运行时间少于SunWu的运行时间。当模式串数量大于3000时,QS的运行时间多于SunWu的运行时间。而二者的结合使用所需的运行时间则处于中间水平。加之,表3.2所示,模式串数量为100,模式串最短长度从2到8时,各种算法在reuters21578语料上消耗的时间。由表可看出,二者结合使用所花的扫描时间始终明显低于其它两种算法。当m=2时,二者结合使用所花的扫描时间低于SunWu算法的1/6,m=8时,二者结合使用所花的扫描时间低于SunWu算法的1/2。随着m的增大,二者结合使用的算法所花的扫描时间呈减少趋势,且差距亦呈减少趋势。

四、总结

篇5:网络舆情系统

2012年,“大数据”(big data)成为企业管理界的热门词汇。《纽约时报》称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析,而非基于经验和直觉。很多学者和企业家也似乎达成共识:未来,数据将会像土地、石油和资本一样,成为经济运行中的根本性资源。由此可见,“大数据战略”在未来企业竞争中占据着核心作用,而作为企业“大数据战略”建设中信息采集的主要部分:网络信息数据采集,则发挥着不可代替的作用。

“大数据”时代已经来临

“大数据”时代特征是三“大”。第一,管理难度大。海量数据的收集、保存、维护、共享及研究等任务,都面临越来越大的挑战。第二,研究价值大。海量的精准数据,辅以信息技术,使对忠实记录现实生产生活的数据进行系统研究以探求背后规律成为可能。第三,对社会影响大。对海量数据的研究,能够从纷繁复杂的元数据中提取信息,进而提炼出有规律的知识,将这些知识普遍应用于经济、政治、社会生活的方方面面,将极大地激发社会生产力,产生革命性的影响。

我国企业发展情况符合“大数据”时代的特点。第一,企业数据量的增长速度大大超过从前。据计世资讯统计,近三四年,中国500强企业的数据总量每半年翻一番,这是以前数十年中国企业信息化发展中绝无仅有的。第二,数据多样化,特别是非结构化数据爆炸式增长。过去三年,非结构化数据复合年增长率超过90%,驱动力主要来自互联网、移动应用、微博、社区网络等新应用,以及平安城市、智慧城市等信息化建设。第三,快速化需求。企业更加需要适应快速变化的市场环境,而且信息技术已经使得全球市场无边界化、无国界化。企业要想在这样的市场中立足,必须利用信息技术快速从海量信息中获得对自身最有价值的信息。第四,数据价值最大化。如何让这些有用的信息给企业或个人带来价值,为企业发展创造一种新的商业模式或者利润增长点,这是“大数据”时代对于数据的核心要求。如互联网行业利用大数据分析网民上网习惯,及时推送各种个性化信息;公共服务行业通过分析视频、音频等信息,进行舆情监测,保障社会安全等。

信息获取与管理成为“大数据战略”建设软肋

“大数据”正以难以想象的速度带来新一轮信息化革命。众多专家学者预测,“大数据”时代,即将带来新的思维变革、商业变革和管理变革。在“大数据战略”构建过程中,如何掌握海量有效数据的企业,如何提升强大数据分析能力成为这一战略建构的关键点。

目前涉及掘金大数据的企业,多是在数据利用上单打独斗,而大数据时代到来的重要标志,应该是海量数据资源的有效整合和数据资源库的出现,以及围绕数据资源库形成的,贯穿于收集、整理、分析、应用整个流程的产业链条。

巧妇难为无米之炊,掘金大数据的首要一点,还是谁拥有更多、更有价值的数据。当前,社交网络、移动互联网、信息化企业都是海量数据的制造者。有数据显示,脸谱公司手中掌握着8.5亿用户,淘宝注册用户超过3.7亿,腾讯的微信用户突破3亿,微博注册用户达5.03亿,这些庞大用户群所提供的数据,正在等待时机释放出巨大商业能量。但是,面对如何更新频繁的海量信息,企业将如何有效、准确和完整的对自身需要的数据进行采集、抓取则是令大多数企业“大数据战略”建设最为头疼的事情。

瑞频人民舆情网络网络信息中心系统打造信息数据集散中心

基于大数据时代,面对海量网络信息数据,企业传统信息采集无法满足“大数据战略”对信息数据需求的背景,公司基于自身强大的信息采集系统研发了网络信息中心系统,帮助企业打造“大数据战略”的信息数据集散中心。

瑞频人民舆情网络网络信息中心系统主要目的是 为大公司大集团的市场部门与公关部门提供一个收集外部信息的平台,包括与本公司相关的信息,与竞争对手相关的信息,行业信息,价格信息,与合作伙伴相关的信息,用户网上反馈的各种信息,科研技术信息等,解决企业信息数据获取面窄、获取量小、获取不准确等问题。同时,该系统 可以做到多人在一个平台上可以快速浏览当日或过去的所有相关信息,实现信息的整合与内部共享,保证决策的协调性。该系统在发挥信息数据集散中心作用的同时,并具有预警功能,可以在某方面的信息一旦出现时迅速通知相关人员。

篇6:网络舆情系统分析复习资料

1.舆情:就是舆论的实际情况,又称为社情民意,是公众的意愿和态度,包括公众对各种政治和社会现象及问题的认识或看法,是群众心理、情绪、意见、要求和思想的综合表现。2.网络舆情:是指在互联网背景之下,众多网民对社会(现实社会、虚拟社会)各种现象、问题所表达的信念、态度、意见和情绪表现的总和,简言之,即网络上的社情民意。3.网络舆情的传播特征:(1)现代传播技术的发展,大大改变了媒介传播的方式和格局。(2)随着全球卫星系统的发展和成熟以及个人电脑的普及和网络信息传输速度的迅速提高,一个以网络媒体为主、其他媒体为辅的全球大众传播格局正在形成。4.网络舆情的形成过程:

从网络舆情形成的结构特征来看,网络舆情的形成是一个“线性过程”,网络舆情形成的每个阶段环环相扣。网络舆情形成的线性过程:公共事务发生——刺激性信息传播——个人情绪态度和意见的形成——网络互动——网络舆情的形成与表达 5.网络舆情的形成模式(1)渐进模式

<1>一般情况下,网络舆情的形成会呈现出一个渐进的过程。

<2>在社会矛盾的形成和积累之下,指向某种矛盾的舆情在暗暗地滋生和积累,经历有无到有、由弱到强、由隐匿到公开的过程,最终可能会以某一公共事务为导火索而在网络上爆发出来。(2)突发模式

<1>网络舆情形成的突发模式在体现“刺激——反应”机制时更为明显,其刺激物就是突发事件,网路上民众的舆情就是反应物。

<2>突发事件一经发生,便在网络上迅速传播,激起公众的强烈反应,舆情表达集中且剧烈。

6.网络舆情的形成动因

(1)外部动因:外部动因包括社会环境作用力合网络空间的舆情空间作用力。

(2)内部动因:内部动因则包括利益需求和心理作用力,其中,公众自身的利益需求是舆情形成的动力源头。7.网络舆情的评估指标

(1)舆情评估是一项需要综合考虑多方面因素和变量的系统工程。

(2)网络舆情评估四个一级指标:传播扩散、民众关注、内容敏感、态度倾向。

<1>传播扩散指标(一级指标):是影响网络舆情信息安全的重要指标之一,它用来刻画某一具体的舆情事件或细化主题的相关信息在一定统计时期内通过互联网呈现的传播扩散状况。

网络舆情信息流量变化(二级指标)

1)网络舆情信息流量变化是指在一定的统计时期内某一舆情信息通过互联网不同的数据源通道形成的报道数、帖子数、博文数等相关信息总量的变化值,它总是通过WEB页面数的变化来呈现的。

2)通过WEB页面在不同的统计期内的数值从而形成的在一段较长时间内连续的WEB页面变化走势,能帮助评估者挖掘出舆情波动点所在的时间等重要时期,便于发现舆情信息态势的变化规律。

<2>民众关注指标(一级指标):用来刻画在一段统计时期内民众对国家各方面舆情信 1 息的关注情况,有助于从海量的舆情信息中捕捉和发现民众关注的热点所在,通过密切关注该舆情信息的爆发和演化规律,以确保舆论安全。1)论坛通道舆情信息活性(二级指标)累计发布帖子数量(三级指标)、发帖量变化率、累计点击数量、点击量变化率、累计跟帖数量、跟帖量变化率、累计转载数量和转载量变化率。2)新闻通道舆情信息活性(二级指标)累计发布新闻数量(三级指标)、发布新闻数量变化率、累计浏览数量、浏览量变化率、累计评论数量、评论量变化率、累计转载数量、转载量变化率。3)博客通道舆情信息活性(二级指标)累计发布博文数量(三级指标)、发布博文数量变化率、累计阅读数量、阅读量变化率、累计评论数量、评论量变化率、累计转载数量、转载量变化率。4)其它通道舆情信息活性(二级指标)

其他通道:主要包括即时通信软件(QQ、MSN)、电子邮件、手机短信平台等。其它通道舆情信息活性值(三级指标)<3>内容敏感指标(一级指标)

1)网络舆情信息内容敏感是指某一特定的网络舆情信息内容可能造成的危害程度。2)网络舆情信息内容敏感性(二级指标)3)网络舆情信息内容敏感程度(三级指标)<4>态度倾向指标(一级指标)1)态度倾向指标用以刻画针对某一特定的网络舆情信息,民众所持有的观点态度(即民意)倾向。

2)网络舆情信息态度倾向性(二级指标)3)网络舆情信息态度倾向程度(三级指标)8.网络舆情的评估流程 网络舆情评估的流程,大体包括三个基本环节:舆情收集和整理——舆情分析和研判——舆情总结和报告

(1)舆情的收集与整理

舆情信息的收集,也就是进行舆情艘搜寻、调查和采集。

应该组织专人或委托专门机构,建立健全舆论信息网络。

<1>舆情的收集

①抓住关键渠道收集网络舆情信息

a.中央重大政策和改革措施的出台所引发的舆情,以主流媒体、政府重点新闻网站为主要挖掘渠道。

b.与社会民众切身利益相关性较强的政策、做法所引发的舆情,以权力部门的相应网站为主要挖掘渠道。

c.国内外要闻、重大事件的跟踪报道、热点评论等,以新闻网站为主要挖掘渠道。d.社会热点问题以及突发事件,以虚拟社区的热门版块和BBS跟帖为主要挖掘渠道。

e.小道消息、谣传、各种议论的集散地,蕴含着倾向性、苗头性的舆情信息,并通过转载扩大影响,以个人网页为主要挖掘渠道。

f.社会思潮以及理论动态舆情,以学术类理论网站和社科类言论网站为主要挖掘渠道。②把握有价值舆情点收集网络舆情

舆情热点、舆情焦点、舆情兴奋点、舆情波动点、舆情重点、舆情诱发点 ③不同阶段采取不同方式收集网络舆情信息

舆情酝酿阶段、舆情初现与发展阶段、舆情形成与外显阶段

<2>舆情的整理

经过搜集而获得的原始舆情信息和样本通常是繁杂无序且真假混合的,因此需要进行整理。整理的过程就是信息和信息样本的组织过程,目的就是使信息从无序变为有序,成为便于分析评估的形式。(2)舆情的分析与研判

<1>对调查获取后的舆情,应该组织专人或委托专门机构进行分析和评估。舆情分析的 重点是舆情发展的未来态势,包括舆论发展的方向、强烈程度,以及对社会政治、经济、文化等的影响,尤其是对社会稳定是否存在着潜在危险。

<2>舆情研判的标准是看舆情的发展是否符合舆论引导的目的。(3)舆情的总结与报告

最后,对舆情分析资料进行归纳总结,写出舆情评估报告。9.网络舆情的评估方法(1)内容分析法

<1>内容分析法是情报学中一种对文献内容作客观系统的定量分析的专门方法,其目的是弄清文献中本质性的事实和趋势,揭示文献所含有的隐形情报内容,对事物发展作情报预测。

<2>基本的做法是把媒介文字、非量化的有交流价值的信息转化为定量的数据,建立有意义的类目分解交流内容,并以此来分析信息的某些特征。(2)比较分析法

运用比较方法对网络公共事件进行分析,意味着突破地域和时间的制约,对同一地区的不同事件进行比较,对不同地区的事件进行比较,对不同时期的同类事件进行比较。通过对已成型舆情评估案例的分析,对比目前需要评估的舆情,比较二者间的异同之处。(3)抽样分析法

<1>科学抽样时进行舆情事件分析重要的前期环节,结合互联网传播的特点,科学的抽样规范与否直接影响舆情分析结论的可靠性。

<2>样本的选取,媒体信息从体裁上分为报道与评论,抽取样本应该以评论为主;从地区上分为全国性媒体、地方性媒体与境外媒体;从体制上分为体制内媒体与商业化媒体;从文章来源上分为原创与转载。另外重大涉外舆情事件还要关注境外媒体。10.网络舆情的评估技术(1)单体化技术

<1>网络舆情采集与提取技术:梅雪等人(2007)通过全自动生成网页信息抽取Wrapper的方法在一定程度上实现了动态网页数据的抽取与集成,具有一定的处理准确率以及抽取效率。

<2>网络舆情话题发现与追踪技术:段建国等人(2007)在此思路的基础上进行改进,实现了话题发现与追踪:即将文本聚类问题转换为话题特征聚类问题,并依据事件对语言文本信息流进行重新组织与利用脚。

<3>网络舆情倾向性分析技术:唐慧丰、徐琳宏、李艳玲等人(2007)致力于网络舆情文本的倾向性分析技术:通过判断网络环境下倾向性特征词的特点和类型,并进行语气极性判别和标注,从而构建一个面向互联网的倾向性语气词典,建设一定规模的标准数据集,为中文倾向性分析的深入研究提供支持。

<4>多文档自动文摘技术:张姝(2007)、刘茂福、张瑾(2008)在一定程度上实现了网络舆情信息自动生成报文,并能通过浏览器进行浏览和信息检索。(2)系统化技术

<1>互联网舆情监测Beehoo系统。该系统由中科院计算所网络重点实验室设计并开发,3 目前己推出3.0版本。

<2>方正智思舆情预警辅助决策支持系统。该系统由北大方正技术研究院(2005)设计开发。该系统由舆情规划、舆情收集、分析处理、舆情预警四个环节组成,主要针对离线的网页数据进行舆情自动分析和预报,分析规划舆情监控内容,形成了一个具有生命特征的周期往复的社情民意反馈系统。<3>网络舆情分析系统。北京理工大学列络与分靠式计算实验室(2008)正在进行网络舆情分析平台的研发工作,现己完成了逻辑模型和框架的设计。<4>TRS网络舆情监测系统。北京拓尔思信息技术股份有限公司正在进行TRS网络舆情监测系统的研发工作,现已完成了逻辑模型和框架的设计。

<5>网络舆情分析模式。谢海光等人(2006)通过探索网络舆情形成和发展的基本特点,提出了舆情热点(热度)、重点(重度)、焦点(焦度)、敏点(敏度)、频点(频度)、拐点(拐度)、难点(难度)、疑点(疑度卜粘点(粘度)和敝点(散度)等十个分析模式和判据基本结构。<6>网络舆情指数分析体系。南京大学秦州副教授(2005)以近年来网上重大矿难报道数量绘制出网络舆情环境下的“矿难舆情指数曲线”,探索了基于网络上特定主题WEB页面数绘制网络舆情指数体系的可行性。<7>网络信息采集与分析模式。北大李晓明教授(2003)提出了一个利用计算机技术、针对某一特定主题,对互联网上海量信息进行采样收集与分析的模型。该模型包括样本空间的选取、主题特征的提取、目标参量的设置、网页收集、数据后处理几个模块。需要强调的是,模型在目标参量设置上提出“主题强度参量体系”,对样本空间的网页从宏观统计和变化过程,绝对数量和相对数量,总体信息和独立信息这三个维度进行分析。

11.网络舆情引导:就是政府针对网络舆情进行干预和调控,以抑制网络舆情对公共决策的负面影响,促进网络民主舆论健康发展。(1)建立应对处置机制,及时控制网络舆情 <1>建立舆情处置机构 <2>建立快速应对机制 <3>建立新闻发布制度 <4>建立后续联动处理机制

(2)加强网络评论队伍建设,理性引导网络舆情(3)加强与传统媒体互动,形成主流舆论强势

<1>从理论上来说,网络传播的特点使任何人在网络上都有传播信息的可能。但实践证明并不是所有的人都会去接受网上已发布的所有的信息。

<2>发挥主流媒体的传播优势来引导舆情更显其重要性。(4)发挥“意见领袖”作用,引导网民自我教育 <1>“意见领袖”(opinion leader)又称舆论领袖,通常指在信息传递和人际互动过程中少数具有影响力、活动力,既非选举产生又无名号的人。

<2>政府需要找到恰当的方式,与网络“意见领袖”进行沟通,引导他们理解党和政府的方针政策,理解政府解决种种复杂问题的基本思路和实际操作,让网络上的“意见领袖”多一些建设性意见,少一些破坏性意见。这样,通过网民引导网民,用网民自己的声音引导、感染网民,实现网民自我教育、自我引导,往往能够达到事半功倍的效果。12.言论自由与政府干预

(1)我国《宪法》第 35条明确规定:“中华人民国和国公民有言论、出版、集会、结社、游行、示威的自由。”从民主角度出发,言论自由是民主的前提。(2)约翰•密尔顿在其论著《论言论自由》中首先提出言论自由的主张,认为言论自由是“一切伟大智慧的乳母。”

4(3)按照《宪法》的规定,每一个公民都有利用互联网的权利和自由,中国政府支持互联网的发展和广泛的应用。但同时任何自由都并非没有边界,每一个公民又要自觉地遵守法律和秩序,维护国家的、社会的和集体的利益。13.政府干预言论自由的目的

从理论上说,政府干预言论自由只能是为了两个目的:一是为了保障言论自由这一公民基本权利的有效实施;二是当言论自由的价值与宪法保障的其它价值发生冲突时的一种取舍,如为了社会公共利益或者国家利益的 ,或者是为了保障第三人的正当权利。14.“集体性的自决”

(1)宪法保障言论自由的价值不是让个人可以无所顾忌地表达其私人偏好,也不是为了个人的自我表达或者个性体现,而是为了实践民主政治的要义——“集体性的自决”。

(2)国家应该拓展网络公共讨论的空间,把各方的意见都呈现给公众,确保公众听到所有应该听到的声音来保证公共辩论的强健。15.政府应积极地有所作为

(1)如果政府对所有言论都放任自由,不予以任何干预,那么强势者的言论势必压倒甚至淹没弱势者的声音,一部分人的言论自由非但没有得到保护反而受到了压制,即所谓的“沉寂化”效应。

(2)政府应当在某些情况下积极地有所作为,通过制度安排和政策手段保障平等的言论机会。在这个意义上,政府可以是言论自由的朋友而不是敌人。16.我国政府近年网络舆论管理措施

(1)建立了以法规为主体的互联网政策框架体系(2)高度重视对互联网信息发布的管理(3)整顿互联网信息发布者(4)铁腕管制网吧经营

(5)行政指导:网络评论员引导网络舆论(6)安装技术软件对互联网内容进行管制 17.我国网络舆情管制特点

(1)网络舆情管制重管理轻权利

(2)我国政府对互联网信息的管理主要采取了政府主导型管理模式,强调政府在管理中的主导作用,政府通过强有力的法律手段和行政手段直接干预和管理互联网。

(3)我国现行的网络相关规范,大部分是政府从方便管理的角度制定的,内容大多是对网络从业者或者网民课以义务。(4)在法律责任部分强调的都是网络经营者或网民违反相关规定时应承担的责任,如罚款、停业甚至判刑,鲜见对网络从业者或者网民权利进行保护相关规定。18.网络舆情监管模式创新:从管制到治理

西方国家的互联网管制措施一般都遵循三个原则:(1)保护言论自由的原则(2)禁止不良信息传播的原则(3)行业自律的原则 19.网络舆情应对之策

(1)适当调整管理思路,从“维稳”到“促和(2)完善网络治理的法律规制(3)加强行业自律(4)“问计于民”,积极采纳网民的意见和建议

(5)重视网络监督,厉行官员问责制,提高政府公信力

5(6)突发事件迅速反应,危机管理泰然自若,“尽早讲、持续讲、准确讲、反复讲” 20.备注:关于“四讲”

国务院新闻办把突发公共事件的舆论引导策略,概括为“四讲”,即:

(1)尽早讲,政府要尽快抢占信息发布制高点,第一时间表明对事件的态度及应对措施;(2)持续讲,向公众不断披露事件进展情况;

(3)准确讲,发布信息真实全面,争取公众的认可;(4)反复讲,采取各种方式对公众进行答疑解惑。

这是对近年来突发事件经验教训的深刻总结。

案例:汶川大地震与王家岭矿难 21.特别关注:突发事件的应对

(1)有学者已经把“危机管理”称为“危机沟通管理”。

上一篇:毕业搞笑标语下一篇:啦啦队评分规则