大数据和数据化思考

2024-07-26

大数据和数据化思考(精选十篇)

大数据和数据化思考 篇1

关键词:大数据应用,大学英语教学,新尝试,新思考

大数据 (Big data) 是指无法在可承受的时间范围用常规软件工具进行捕捉、管理和处理的数据集合。早在1980年, 著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中, 将大数据热情地赞颂为“第三次浪潮的华彩乐章”。随着云时代的来临, 大数据也吸引了越来越多的关注。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC标志着人类社会已经进入一个全新的大数据时代。大数据时代信息具有四个特点, 分别为Volume (数据体量巨大) 、Variety (数据类型繁多) 、Value (价值密度低) 、Velocity (处理速度快) , 俗称4V特征。大数据不仅仅意味着更多的信息, 它也改变了人们的生活习惯、行为方式, 甚至认知方式, 同时也为大学英语教学提供了新的机遇和挑战。本文从我国大学英语教学所面临的问题入手, 探讨大数据时代下, 大学英语教学改革的新尝试和新思考, 并提出大学英语教师应采取的应对措施。

1 我国大学英语教学所面临的问题

目前, 我国大学英语教学主要采取以教师为中心的课堂教学。虽然引入计算机作为辅助手段, 但教师仍处于主导地位。同时, 由于受到教育资源的限制, 我国大学英语课程的教学班级普遍偏大, 学生人数多, 教学时间有限, 学生课堂参与度较低、练习的机会严重不足。这导致了教学上一定程度的“重知识, 轻技能”, 学生接受性技能与产出性技能发展不平衡, 学生的实际语用能力、交际能力较差, 不能很好地适应社会发展的需要。

2 大数据为英语学习带来的变化

随着大数据时代的到来, 英语学习呈现出一系列新的变化。

大数据时代带来全新的时间和空间概念, 使学习者能更好地实现自主化学习。大量的英语学习工具、学习平台和在线学习系统应运而生。学习者成了真正的中心。他们可以选择感兴趣的课程, 按照自己的学习习惯来安排学习的进度;也可以在任何时间和任何地点提交作业、向老师提出问题, 并得到及时准确的答复:系统会自动批改学生提交的作业, 教师也可以掌握学生答题情况, 根据学生需求对学生“开小灶”。

大数据时代为英语学习带来了海量、多样的资源。有文本的、音频的、视频的, 包括百科全书、词典、虚拟场景;以书本为中心的纯视觉材料会减少, 要求手、眼、耳、口并用的材料大大增加。

大数据技术通过分析不同英语学习者在英语学习过程中产生的数据, 了解其掌握情况、学习行为及其习惯, 发现其存在的问题, 预测其未来发展的趋向。比如, 大数据可以根据学生在网络课堂学习后留下的活动轨迹, 分析出该学生对某类知识的偏好, 阅读或写作方面的习惯, 以及各类知识的掌握程度和存在的问题, 适时地向其推荐合适的学习材料, 并制定最佳的学习方案。如写作练习时, 向学习者推荐更高级别的词汇或提醒其注意更多地使用某类句型等。

大数据刷新了教育和学习理念, 促使英语教学模式发生了深刻变革。MOOCS解构了传统的封闭课堂, 创造了一个前所未有的, 多元的开放的网络大学堂, 催生了微课、翻转课堂等新型教学模式。信息的传递在课前完成:学生预先观看教师制作的微视频, 接受教师的在线辅导, 并通过互联网搜集、查阅相关的资料。课堂时间留给师生间交流、互动。学生们讨论由老师或学生自己提出的与课程相关的问题;教师有针对性地对学生的学习困难给予帮助。教师和学生的角色发生了变化, 实现了以“学生为中心”的课堂模式, 促进了学生对知识的吸收内化过程。

3 大数据时代英语教学改革的新尝试和新思考

大数据为大学英语教学创造了极为有利的条件, 也提出了新的挑战。为此, 我们可以从以下几个方面进行思考与应对。

3.1充分利用大数据, 创造有利于英语学习的环境。

大数据、云计算、移动互联网使英语学习者随时可以置身于大量、逼真的英语环境中。

学生们随时随地可以通过手机、i Pad等电子设备接触到互联网以及随之而来的大量信息。在教学上, 教师可以筛选价值较高的英语学习网站, 推荐给学生;学生通过添加该网站的微信号或在手机上下载客户端就可以随时接受英语听力、阅读等各方面资讯。

在单词记忆上, 教师可以在指导学生用传统方法记忆单词之余, 利用单词记忆软件, 网站学习社区来记忆。如百词斩软件, 根据记忆效果对记忆内容进行区分, 并针对艾宾浩斯遗忘曲线, 在需要增强刺激时自动提醒学生进行学习, 同时趣味的配图和例句让记单词成为一种乐趣。沪江的开心词场, 则根据单词类别帮你设定任务和完成时间表, 每次完成任务后的“沪币”则是最好的奖励, 学习者可以用它来购买其他的学习课程。

在写作上, 互联网中的各种写作系统可以帮助老师很大程度上解决一个教师难以满足众多学生的点对点的教学需求的难题。传统的写作教学, 对于非英语专业的大英学生, 没有指定的写作教材, 老师布置的作文练习只能涉及教学中的某个话题, 很难顾及写作体裁的广泛性, 进而在写作教学中难于做到循序渐进。同时课程班级人数较多, 教师批改量大, 即使付出了大量的心血和劳动, 教学效果并不理想, 学生的写作水平没有明显提升。学生水平参差不齐, 有的学中式英语极其严重, 作文根本无从下笔, 教师把错误句子画出来后, 学生对发回的作业往往看了得分后便随手丢弃, 不再作修改, 教学效果差强人意。大数据时代的在线写作系统很好地解决了师生共同的难题。各种写作平台受到师生共同认可, 如“句酷作文批改网”、“体验英语写作系统”等。老师可以在线布置作文, 对学生所在班级进行管理。学生输入老师布置的作文号开始写作, 也可以选择网络中已有的其他作文自行练习。对于学生完成的作文, 在线系统能够立刻给出分数, 并在评分的基础上, 从词汇、语法、篇章和内容等多维度进行评价, 提出详细的修改建议。这些信息可以帮助学生在写作过程中选择准确的词汇和句型, 解决大部分语法问题, 从而提高学生语言运用的能力, 节省教师处理学生语言错误的时间。老师在必要时, 可以在机器批改基础上对评分、评语和句型的修改意见做出进一步改进。新型的在线写作批改系统把教师和学生解放出来, 消除了学生写作过程中的焦虑感和直接面对教师负面评语的挫败感, 保护了学生的写作热情, 提高了英语写作教学的效率, 有助于促进学生英语写作能力的提升。同时大数据云存储技术可以捕捉学生写作过程的每个细节, 如某类词语的使用频率、拼写错误率等, 生成学生的写作学习轨迹的发展性评估。

在大学英语课堂教学中, 老师可以利用当代学生易于接受移动化数字信息的特点, 将与时政热点相关的即时消息、数码图像、视频片断设计到教学中, 帮助学生尽可能多地接受碎片化的知识信息。

3.2 转变教学理念

首先, 教师就要从以前的资源提供者转变为资源整合者。由于大数据信息四通八达, 学生获取英语学习资源轻而易举。此时, 教师应加强对有效信息的捕捉能力和分析处理能力, 依据学生的个性化需求, 有选择性地提供给学生, 并指导学生开展学习。

其次, 教师的教学方法要由传统的单向灌输转变为启发建构, 树立起建构主义基础上的“以学生为中心”、“以学习为中心”的教学新理念。学生现在并不缺乏英语学习资源, 缺的是发掘有价值资源的能力和利用资源提高自身英语学习效率的方法。所以教师应充分研究教学对象, 了解其学习特点、动机和需求, 激发学生广阔而丰富的英语学习兴趣和热情, 主动探求英语知识;从而进一步帮助学生从海量数据中获取有价值的学习资源, 成为学生建构知识的支持者、帮助者和引导者。同时还要指导学生制定长期、中期、近期的不同学习目标和相对应的实施方案, 传授英语学习策略和方法, 授之以渔, 推动学生自主学习, 发展自己。

第三, 教学过程中, 教师可以将互联网大数据与传统教学方法优势相结合。如运用“任务法”、“交际法”、“产出导向法”等多元教学法。老师们可以通过设计自然真实的交际任务,

激发学生的求知欲和好奇心, 鼓励学生输出所学的知识, 将互联网获取的知识、数据转换为实际技能, 提高英语的应用能力。

3.3更新教学内容

语言作为沟通的工具, 学习语言最终是为了沟通。因此, 英语的学习应该更注重与生活息息相关的内容。在教学中, 教师应该加入生活中的真实语言材料, 让英语贴近学生的生活, 变得生动、有实效感。在听力、词汇、语法、阅读和写作的教学上以实用性为指导, 如收听网络公开课TED, Coursera, 国际名校公开课并发表自己建议, 制作PPT展示;阅读网络报刊, 制作自助游旅行计划, 办一份英文杂志等, 推行同时满足个人发展需要和社会发展需要的服务学习, 促进外语教育从应试教育到素质教育的根本转变。

3.4调整评估体系, 让考试发挥科学的导向作用。

评估分为终结性评估和形成性评估, 多年来我国的教学倾向于终结性评估, 为了让评估体系更好地为教学服务, 新时代的教师应该走终结性评估与形成性评估相结合的路子, 利用互联网大数据在教学过程中不断循环评估教学的效果, 调整教学计划和目标。

4 大数据对教育的负面影响

教师在享受互联网大数据给大学英语课堂教学带来便利的同时, 也要注意大数据所带来的一系列问题, 尤其注意对其不应过度依赖。各种新兴技术的运用使数据的产生越来越容易, 也越来越快, 数据呈爆炸式的增长。教师如何在海量信息中提取有价值的信息, 如何避免过度使用图像、音频效果, 在授课内容上喧宾夺主, 忽视与学生的互动环节, 如何成为资源整合者而不是简单的提供者, 这些都是教师需要花时间和精力解决的问题。

5 结束语

大数据时代已经来临, 它给大学英语教学带来了机遇、便利, 也带来了新的挑战。大学英语教师要积极应对大数据对英语教学的挑战, 充分利用大数据, 创造有利于英语学习的环境;同时转变教学理念, 与时俱进地更新教学内容, 开展更个性、灵活的教学方法, 完善评估体系, 由知识的讲授者变为学习的引导者, 提高对信息的辨识和整合能力, 促进个人核心能力的提升, 抓住机遇, 为自己在新时代的挑战做好准备。

参考文献

[1]王海啸.大数据时代的大学英语写作教学改革[J].现代远程教育研究, 2014 (3) .

[2]蒙岚.大数据时代的教育变革与教学改进——以加拿大与中国的英语教学为例[J].江西社会科学, 2014 (12) .

[3]陈坚林.大数据时代的慕课与外语教学研究——挑战与机遇[J].外语电化教学, 2015 (1) .

[4]陈金平.大数据时代的大学英语教师职业发展[J].当代外语研究, 2014 (4) .

大数据时代信息安全思考论文 篇2

大数据是指传统无法在一定时间内使用传统的数据库工具、软件对其进行搜集、整理以及处理的数据集合。与传统的数据处理“模式”不同,大数据更加注重“数据信息”处理的效率、质量。大数据具有几个基本特征:(1)数据数量大。在大数据时代下,电脑硬盘容量也在逐渐扩大,由原本的TB级别跃升至PB、ZB级别,而一些大型企业的数据甚至已经达到了EB量级,数据数量的增加促进了信息技术的进一步发展。(2)处理速度加快。随着信息技术的不断革新,数据生成与处理速度都得到了质的发展,满足了信息化时代的需求。(3)数据价值密度较低。当前,大数据价值密度与数据总量呈现出反比相关的关系,即有效数据数量较少。如何提高数据价值密度,是当前促进大数据时代发展所必须思考的问题。

大数据和数据化思考 篇3

关键词:科学方法变革;哲学思考;大数据方法

1998年,生物化学家托尼·卡斯在《大数据管理者》一文中首次提出“大数据”概念,并在2008年“大数据”专刊后迅速爆发,成为社会各界积极研究的热点课题。大数据的爆发带来了第二次数据革命,在实现万物皆数理念的同时开启了数据发展的第三个阶段,同时在科学研究当中,数据作用、地位的改变也引发了诸多哲学问题,使得大数据研究逐渐被纳入到科学、哲学领域当中。

一、大数据的概述

(一)内涵。首先,大数据是一门数据科学,它借助数据挖掘等方式来对海量数据这一研究对象的内在规律进行挖掘,所研究的内容涉及到不同科学领域当中的所有共性数据问题,在找出数据规律的基础上解答相关的科学问题;其次,大数据是一个技术平台,与常规的数据不同,大数据的数据收集、提取、存储、分析都离不开软件与硬件的支持,这些技术共同构成了大数据分析的技术平台;再次,大数据是一种研究方法,它涉及到生物医学、生物信息学、自然灾害预报等科学,科学在大数据背景下正逐步走向数据密集型科研;最后,大数据是一项潜在的资源,根据相关报告,大数据在医疗领域每年所创造的价值将高达300亿美元,且将会使零售业的利润提高一半以上。

(二) 方法。大数据中的数据挖掘主要采取分类、关联分析、聚类分析、异常检测技术。其中,分类是根据数据学习得出将自变量对应到因变量以实现自变量分类的分类模型;关联分析是对海量数据当中关联规则等有意义数据关系的发现;聚类分析是把海量数据划分为同簇对象相似性高、异簇对象极不相似的多个有意义的簇;异常检测是找出离群点的过程。

二、大数据方法及其改革

(一)与传统模型方法的区别。部分学者在研究过程中将模型划分为两类,即物质形式和思维形式的科学模型,前者根据模型来源的不同分为天然模型与人工模型;后者依据模型特点的差异分为理想模型、数学模型、理论模型以及半经验半理论模型。通过对比分析得出,大数据模型不同于传统数据模型,它不具有物质形式,是没有抽象过程的数据运算,且其算法同数学模型的得出过程大不相同,因此大数据模型并不属于以上的科学模型,而是一种新型的经验模型。

(二) 与统计建模的区别。数据挖掘在模型方法上虽然很接近统计学,但其与统计建模仍存在本质差异。表现在:1.研究地位。前者的数据模型是科学研究的主角并担当了科学理论角色,而后者一般是经验、理论研究当中的配角、检验者;2.数据类型。前者的数据是类型复杂、质量偏低的海量数据,后者则是精心设计、高质量的实验数据;3.模型确立。前者借助海量数据确立模型且其目标变量具有不明确性,后者依据研究问题确立模型且有明确的目标变量;4.建模驱动。前者采用强调建模过程、模型可更新性的数据驱动,而后者则采用强调设计、验证合理性的验证驱动。

(三) 与计算机仿真的区别。计算机仿真包含了由模型建立、仿真模型建立和仿真实验所联系的系统、系统模型以及计算机三要素。大数据方法与计算机仿真方法的区别主要表现在:1.研究对象。前者的研究对象为海量数据,后者则面向依据系统建立的数学模型;2.推理逻辑。前者为数据归纳,后者为演绎计算;3.自动程度。前者为计算机自动进行,后者的计算机仅仅在仿真实验环节采取自动进行;4.说明力度。前者相比较后者具有更高的说明力;5.角色地位。前者在科学研究中占据了主体地位,而后者则担当实验角色;6.基础设施。前者包括传感器、网络设施等,后者通常只涉及一台或多台计算机。

三、大数据的方法论

(一)逻辑维度。科学论证从逻辑角度来看可分为归纳和要求前提决定性支持结论的演绎。在大数据分类当中使用得最为广泛的方法是由包括根节点、叶节点、内部结点的结点与由向边构成的具有层次性的决策树。其中根节点、内部结点主要由数据集中属性组成而叶节点则由类标号所组成,由向边是在归纳已有数据的基础上所得出的,其归纳方法包括求同法和求异法。与其他算法的原理相同,决策树也是根据数据集中提取分类模型来完成分类的。

(二) 主体维度。传统科学定律的理解主要来自于规则性进路的恒常联系、心理习惯以及必然性进路的必然性,根据大数据模型可预测的、依据相关算法与数据得来、不具有必然性的特征可以得出大数据不属于演绎系统,不符合系统进路与必然性进路,但其预测性使得其符合心理习惯进路。因此,大数据模型与物理定律可应用在不同的领域当中。

(三) 内涵维度。作为大数据哲学及其方法研究当中的一个焦点问题,因果关系、相关关系的研究目前在业界还没有统一的定论。大数据因果、相关的考量目前需要研究的主要包括大数据方法是不是仅能获得相关关系、相关关系可否在科学角色中取代因果关系这两个问题。

一方面,大数据算法虽然包含了消除归纳法,但无法体现因果性所严格强调的充分条件当中的必要条件,不能完全确定其因果性。由此可见大数据方法仅能发现相关关系,只有在具备具体模型的情况下才能发现相关关系。另一方面,第二个问题对因果、相关关系间的对立隐含了假设,实际上针对科学、定律、因果说明目前还存在争议,根据大数据符合心理习惯进路、不符合系统与必然性进路可得出在仅认为定律是心理习惯的情况下才可科学说明大数据的相关关系并代替因果性。

(四) 功能维度。大数据的功能主要包括对既有数据模型的描述和预测。从描述角度看,大数据方法因无法发现因果性而不能进行因果说明,而在定律说明中大数据模型又仅仅符合心理习惯进路,由此可见大数据模型说明力弱。从预测角度看,大数据模型经过评估、随数据更新而更新、针对具体问题且海量数据中蕴含的经验信息丰富,使得大数据预测虽无必然性但预测准确。

四、大数据的核心特征和意义

科技的进步改变了经验世界,海量的数据使人们的视野更加开拓。大数据技术超越了人类智力,未来还将逐步突破人们的心理习惯。以说明力低、预测力高为核心特征的大数据预示了一种全新的科学,相比较现有的能够借助因果机制、科学定律、模型隐喻类比来说明的科学,大数据模型利用复杂其计算量大的计算方法从数据形式下的经验世界中直接获得,在涵盖了经验世界的丰富信息的同时也表现了海量的经验。作为一种全新的经验表现形式与科学研究类型,大数据同时给科学研究创造了一种全新的方法。从经验角度来看,大数据实现了无所不在;从方法角度来看,大数据的核心特征使得其突破了人们的智力与心理习惯;从科学的角度来看,大数据将会引领现代人们走向一个全新的世界。

五、 讨论

随着我国经济水平的快速提升和科技水平的不断进步,一些发达国家开始逐步制定、实施大数据战略。大数据给科学研究带来了新兴的方法,通过对海量数据的潜在模式做出描述并在此基础上做出预测,以实现对数据中富有价值的规律、模型的深入发掘。大数据既是经验表征的新方法,也是探索经验后的知识的新方式,大数据方法在科学、哲学等领域当中具有很大的研究前景。(作者单位:江西财经大学马克思主义学院)

参考文献:

[1]喻国明. 大数据方法与新闻传播创新:从理论定义到操作路线[J]. 江淮论坛,2014,04:5-7+2.

[2]刘继伟. 基于大数据的多尺度状态监测方法及应用[D].华北电力大学,2013.

大数据和数据化思考 篇4

信息图示(infographic)近来的兴起也受大数据时代的推动,在移动互联网媒体与PC端互联网媒体时代,各种海量信息呈爆炸式增长,人们已进入快阅读模式,因此信息图示的运用范围越来越广泛,传统媒体(报纸、电视)、微博微信、公众号、自媒体等很多内容也越来越向图形图示化转换,信息图示也将成为各种媒介信息传播的常用方式。

一、信息图的概念与兴起分析

信息图示,英文为Infographic,又称为“信息图表(Infographic Graphics)”,也可称为“信息的可视化”(Information visualization),是指数据、信息或知识的可视化变现形式。可视化的变现形式就是将复杂的信息和数据条理化、图形化,使受众能够通过变现的图解、图示快速地消化和理解复杂的数据和信息。抽象信息的视觉表达方式自18世纪后期数据图形学诞生以后,被人们用来经常揭示数据和信息中的奥秘。

Infographic存在已久,但近年才在互联网上经常被大量的运用,尤其多见于各种新兴的传播媒介。数据可视化、信息图形、知识可视化、科学可视化是信息可视化图表的主要特征,而信息图表视觉设计已有了长足的发展与进步。任何信息材料通过重新归纳、组织、整理,都可以以表格、图形、地图等可视化方式来表现。

二、大数据时代下信息图示与新闻媒体结合的重要性

有大数据时代预言家之誉的维克托·迈尔·舍恩伯格认为,在大数据时代,要用大数据思维来予以应对,[1]因此,互联网对新闻的编写、形式、内容、传播等方面产生了巨大的影响,使其产生了巨大变化。首先,全媒体时代的今天,智能化手机、新兴的直播平台、强大的社交媒体已让人人都可以成为新闻的发声者,新闻发布已经不再只是通过新闻记者进行唯一发布。在互联网中,每个人都可以在自媒体或私人公共平台上发布大量的文字、图片、视频、音频等信息,这些海量的数据中,如何过滤、提炼有效的数据信息,并进行深度解析,是目前媒体人需要思考的问题,也是媒体人眼下面临的巨大挑战。

信息图示最突出的优势在于它可以对信息更精确和更形象地进行传达。首先,通过编辑设计过的可视化图表具有易读性和视觉冲击力,简洁的文字和图形化的解读更能吸引读者的阅读欲望;其次,可视化对信息的表现方式更容易引起受众的关注,在高效的快餐化信息时代,人们越来越吝惜自己的注意力,受众对媒体资料的需要必须更加简洁高效,这就意味着,我们对信息的提炼要更加有效,并通过最简单易懂的图形表达和最少的文字解读给受众,帮助受众阅读、理解和消化。

三、信息图示与新闻媒体融合发展和制作的思考

网络信息化时代,读者面临的现状是媒体选择多,沉浸时间段;媒体面临的问题是如何吸引读者。由此,受众有了更多的媒介选择,媒介之间基于内容流动和入口开放而更容易实现互动融合。媒体如何转型,从新闻视觉传达开始,只依赖文字是不够的。

“信息追随功能”(美国著名建筑师路易斯·沙利文),“媒介即讯息,媒介最重要的作用是‘影响我们理解和思考的习惯’”(加拿大著名哲学家及教育家),这意味着媒体不等于直接信息,媒体高于产品本身,在网络时代的召唤下,媒体更多地应为读者提供体验式服务。

读者不需要接触到那些琐碎的专业细节,所以一幅信息图表(infographic),只要讲清楚一个观点就行了。当然,这并不等于只展现一个数字,而是你使用的这一组数字,来说明一个主要观点。

设计进入新闻内容的成果便是信息图示(infographic),它能让新闻产品面貌焕然一新,为读者塑造独一无二的观感体验,并能打动读者,使读者产生共鸣,让新闻价值得以完整的传递。

从媒体从业人员来看,记者编辑不仅要具有熟练地使用文字、图像的能力,还需要懂得如何收集、整理、分析数据,再由设计人员对整理后的有效信息进行可视化加工,前期的过滤提炼工作和后期的图像化设计缺一不可,这就意味着,前期和后期必须有很好的沟通和合作才能完成一个好的信息图示。

基本流程:提出问题——搜集信息——探索形式——确定逻辑&框架——梳理信息——设计图形——整合信息图示。

首先,探索形式,确定变现形式也是最重要的一环,因为错的图表、词不达意,形同虚设,设计人员要根据记者或编辑提供的初级信息设计框架、画出想象图,这个初稿首先应确定的是以哪种可视化方式进行表达,大致可分为表格式、图形式、数据式、地图式等4种方式。确定基本表现方式和框架草图之后发给编辑,并与编辑或记者在信息结构与视觉方案上达成共识即确定逻辑和框架。

其次,梳理信息,编辑或记者根据框架重新组织和提炼文字资料(碎片状)再返回给设计。

再次,设计图形,设计人员根据重新提炼的文字和预想的草图进行正稿的制作,设计人员必须通过修改后的精准信息制作和设计出更准确的可视化的图形。

最后,整合信息图示,设计人员与编辑或记者一起对信息图示进行最后的文字修改和拼合版面。

信息图示的制作过程也是文字编辑和图形设计不断碰撞、沟通和创作的过程,所以编辑和设计越早沟通越好,提纲与草图是很好的沟通工具,电子媒体没有字数限制,自由度更大。一个好的信息图示(infographic)作品,不仅需要理清信息的结构,用好的创意和设计表现结构,还需要前期文字信息梳理和后期创意可视化的完美结合。

摘要:网络信息化促进了“大数据”时代的来临,在大数据时代的推动下,新闻媒体中信息图示的运用能把复杂的信息和数据条理化、图形化,使受众能够快速消化和理解这些数据和信息。本文论述了大数据时代下,信息图示在新闻媒体传播中的重要性,以及未来如何让二者更好地融合发展的思考。

关键词:大数据时代,信息图示,新闻媒体

参考文献

大数据题目和答案 篇5

注:蓝色为正确答案,判断题正确为√,错误为×

1.根据涂子沛先生所讲,摩尔定律是在哪一年提出的?(单选题1分)A.1988年B.2004年C.1965年D.1989年

2.2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分)A.3万B.5万C.10万D.20万

3.以下说法错误的是哪项?(单选题1分)A.大数据的思维方式遵循因果逻辑推理 B.摩尔定律是戈登•摩尔提出的 C.图灵测试是阿兰·图 D.ENIAC于1946年诞生

4.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题1分)A.北大B.清华C.浙大D.复旦

5.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?(单选题1分)

A.2014年B.2015年C.2013年D.2016年

6.根据涂子沛先生所讲,哪一年被称为大数据元年?(单选题1分)A.2012年B.2010年C.2008年D.2006年

7.数据、信息与知识三者之间的变化趋势是(单选题1分)A.价值先增后减B.价值递减C.价值递增D.价值不变

8.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题1分)A.18B.16C.12D.6 9.“()大数据交易所”2015年4月14日正式运营,目前,交易所已有包括京东、华为、阿里巴巴等超过300家会员企业,交易总金额突破6000万元。(单选题1分)

A.毕节B.安顺C.贵阳D.遵义

10.()说明如果联网越多,从介入方式、技术上越来越突破,则网络规模越大、成本越低,网络的成本可能会趋向于零。(单选题1分)A.吉尔德定律B.摩尔定律C.梅特卡尔夫定律D.新摩尔定律 11.以下说法错误的是哪项?(单选题1分)A.大数据会带来机器智能 B.大数据不仅仅是讲数据的体量大 C.大数据的英文名称是large data D.大数据是一种思维方式

12.美国首个联邦首席信息官是下列哪位总统任命的?(单选题1分)A.克林顿B.奥巴马C.小布什D.老布什

13.截至2015年年底,全国电话用户总数达到()。(单选题1分)A.13.37亿户B.12.37亿户C.14.37亿户D.15.37亿户

14.2012年全国各城市支付宝人均支出排名中,位居第七位的是()(单选题1分)

A.嘉兴市B.台中市C.高雄市D.嘉义市

15.吴军博士认为过去五十年是()的时代。(单选题1分)A.科尔定律B.艾尔定律C.摩尔定律D.拉尔定律 16.ENIAC诞生于哪一年?(单选题1分)A.1946年B.1938年C.1940年D.1942年

17.梅特卡尔夫定律主要是描述信息网络,指出网络的价值在于网络的互联,联网的接点数与其价值呈现()的方式,联网越多,系统的价值越大。(单选题1分)

A.正比B.对数C.指数D.反比

18.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。(单选题1分)A.38B.21C.25D.30 19.2012年全国各城市支付宝人均支出排名中,位居第三位的是()(单选题1分)

A.嘉义市B.杭州市C.嘉兴市D.高雄市

20.政府2.0不以政府为中心,而是以公众为中心,建设()政府。(单选题1分)A.服务型B.节约型C.开放型D.创新型 21.我国农业物联网取得了比较快的发展,在农产品流通、()中间应用比较广泛。(多选题3分)

A.畜牧业养殖B.渔业生产C.园艺设施D.田作物生产

22.根据周琦老师所讲,以下哪些属于数据挖掘的内容?(多选题3分)A.补充与完善路网属性B.建立道路拥堵概率与拥堵趋势变化模型C.高德地图导航有躲避拥堵功能D.多维分析统计用户出行规律

23.关于大数据的来源,以下理解正确的是(多选题3分)

A.当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界B.我们每个人都是数据的制造者C.大数据是数据量变积累达到质变的结果D.数据的产生需要经历很长时间

24.大数据时代的五个无处不在,具体指的是()、服务无处不在。(多选题3分)A.软件无处不在B.计算无处不在C.大数据无处不在D.网络无处不在

25.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?(多选题3分)

A.农村综合信息服务平台发展迅速B.农村电子商务蓬勃兴起C.农业信息资源开发利用水平提高D.农村电子政务已经基本普及

26.关于大数据的内涵,以下理解正确的是()。(多选题3分)

A.大数据里面蕴藏着大知识、大智慧、大价值和大发展B.大数据还是一种思维方式和新的管理、治理路径C.大数据就是很大的数据D.大数据在不同领域,又有不同的状况

27.根据涂子沛先生所讲,有哪些因素推动了大数据的出现?(多选题3分)A.社交媒体B.摩尔定律C.数据挖掘D.普适计算

28.我国农业农村信息化基础设施不断完善,具体表现在哪些方面?(多选题3分)

A.农村网民迅速增加B.农村互联网发展迅速C.农村信息终端拥有量迅速增长D.电话网络向农村快速延伸

29.信息技术产品的演进遵循哪些定律?()(多选题3分)A.图灵定律B.梅特卡夫定律C.摩尔定律D.吉尔德定律 30.大数据作为一种数据集合,它的含义包括(多选题3分)A.变化很快B.数据很大C.很有价值D.构成复杂 31.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。(多选题3分)A.分布式B.密闭式C.密集式D.共享式

32.在web1.0阶段,主要强调的是()。(多选题3分)A.单位B.网站C.机构D.个人

33.大数据的来源包括()。(多选题3分)A.探测数据B.互联网数据C.传感器数据D.实时数据

34.农业部发布的《关于推进农业农村大数据发展的实施意见》提出,到2020年底前,实现农业农村历史资料的数据化、()。(多选题3分)

A.数据共享的便捷化B.数据采集的自动化C.数据分发的定期化D.数据使用的智能化

35.信息时代的三大定律指的是()。(多选题3分)A.牛顿定律B.摩尔定律C.麦特卡尔夫定律D.吉尔德定律 36.关于大数据的特征,以下理解正确的是(多选题3分)

A.重视事物的因果性B.大数据的价值重在挖掘C.大数据将颠覆诸多传统D.重视事物的关联性

37.大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?(多选题3分)

A.构成复杂B.数据很大C.蕴含大价值D.变化很快 38.信息技术(IT)主要包括()。(多选题3分)A.传感技术B.通信技术C.微电子技术D.计算机技术 39.信息技术发展产生了怎样的深刻变革?(多选题3分)A.信息技术发展推动了智能手机、家电等的普及 B.信息技术发展推动了工业生产方式的变革 C.信息技术发展推动了商品销售方式的变革

D.信息技术发展推动了人类社会获取信息方式的变革 40.目前疯狂产生的几大类数据有()。(多选题3分)A.组织数据B.交易型数据C.社交数据D.机器数据

41.互联网时代最为典型的特征是扁平化、单一向度。正确错误(判断题1分)

X42.根据涂子沛先生所讲,进入信息时代之后,数据成为了信息的代名词。(判断题1分)正确错误√

43.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。(判断题1分)正确错误√

√ 44.根据周琦老师所讲,高德交通信息服务覆盖110多个城市以及全国高速路网。(判断题1分)正确错误45.吴军博士认为凡是简单、重复的工作,在未来的时代里一定是机器做得比人更好。(判断题1分)正确错误46.2015年,中国联通用户上网记录每秒钟产生83万条。(判断题1分)正确错误√

X

√ 47.2015年,阿里平台完成农产品销售达到6000多亿元。(判断题1分)正确错误48.在智慧医疗方面,通过大数据,可以提高医疗质量,做好医疗监控。(判断题1分)正确错误49.2000年,全国涉农网站超过6000家。(判断题1分)正确错误50.“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。(判断题1分)正确错误51.吴军博士认为,所有未来的公司,某种程度上都是大数据公司。(判断题1分)正确错误√

√ 52.我国农业信息化基础条件坚实,表现为“农业信息化发展已具备基础”、“技术条件日益成熟”。(判断题1分)正确错误53.宁家骏委员指出,我国社保卡的发放和使用已经覆盖了全国7亿多人。(判断题1分)正确错误√ √

√ 54.依据黑龙江大农场的应用,精准农业技术能够将总成本降低15%-20%。(判断题1分)正确错误55.宁家骏委员指出,《促进大数据发展行动纲要》已被写进国家十三五规划纲要里。(判断题1分)正确错误56.我国国内行业之间的信息化发展水平差距比较大,农业信息化属于短板。(判断题1分)正确错误√

X 57.目前,我国农村信息化发展形势更加紧迫。(判断题1分)正确错误58.大数据仅仅是指数据的体量大。(判断题1分)正确错误59.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》指出,到2017年底,实现国家和省级人口健康信息平台以及全国药品招标采购业务应用平台互联互通,基本形成跨部门健康医疗数据资源共享共用格局。(判断题1分)正确错误√

√ 60.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。(判断题1分)正确错误

 1.第一个提出大数据概念的公司是()。(单选题1分)o o o

得分:1分

A.脸谱公司 B.谷歌公司 C.麦肯锡公司 o D.微软公司

 2.根据涂子沛先生所讲,以下说法错误的是哪项?(单选题1分)得分:1分

o o o o A.个人要把数据当做自己的遗产 B.数据垃圾对商业公司是一个挑战

C.国家要制定合适的法律来规范数据遗产继承的问题 D.中国社会不会面临数据遗产问题

 3.科学范式的发展路径:从观察到演绎分析、模型推导,到计算机分析、仿真模拟,再到()时期。(单选题1分)o o o o

得分:0分

A.数据计算 B.理论科技 C.数据科学 D.数据推导

 4.2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分)得分:1分

o o o o A.5万 B.10万 C.3万 D.20万

 5.2015年“双11”:阿里平台每秒钟订单创建()笔。(单选题1分)分:1分

o

得A.14万 o o o

 B.24万 C.34万 D.4万

6.关于大数据在社会综合治理中的作用,以下理解不正确的是(单选题1分)o o o o 得分:1分

A.大数据的运用有利于走群众路线 B.大数据的运用能够加强交通管理 C.大数据的运用能够维护社会治安 D.大数据的运用能够杜绝抗生素的滥用

 7.根据涂子沛先生所讲,社交媒体是在哪一年出现的?(单选题1分)得分:1分

o o o o A.1965年 B.1989年 C.2004年 D.1988年

 8.()指利用计算机处理信息的技术,是现代信息技术的核心。(单选题1分)o o o o 得分:1分

A.感测技术 B.通信技术 C.计算机技术 D.微电子技术  9.医疗健康数据的基本情况不包括以下哪项?(单选题1分)分

o o o o

得分:1A.个人健康管理数据 B.诊疗数据 C.公共安全数据 D.健康档案数据

 10.2014年,阿里平台完成农产品销售()元。(单选题1分)分

o o o o

得分:1A.283亿 B.383亿 C.183亿 D.483亿

 11.根据周琦老师所讲,以下哪项不属于数据挖掘的内容?(单选题1分)得分:1分

o o o o A.高德地图导航有躲避拥堵功能 B.建立道路拥堵概率与拥堵趋势变化模型 C.多维分析统计用户出行规律 D.补充与完善路网属性

 12.根据周琦老师所讲,高德早在()就开始投入资源来做全国交通信息的采集和发布。(单选题1分)o o o

得分:1分

A.2002年 B.2004年 C.2007年 o D.2005年

 13.吴军博士认为未来二十年就是()为王的时代。(单选题1分)分:1分

o o o o

得A.数据 B.文化 C.工业 D.农业

 14.以下说法错误的是哪项?(单选题1分)o o o o

得分:1分

A.机器产生智能的方式是通过数据、数学模型 B.机器的智能方式和人是完全一样的 C.机器的智能方式是结果导向的 D.机器的智能方式和人的智能不同

 15.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。(单选题1分)o o o o

得分:1分

A.30 B.38 C.21 D.25  16.()年3月1日,贵州·北京大数据产业发展推介会在北京隆重举行,贵州大数据正式启航。(单选题1分)o o

得分:1分

A.2014 B.2012 o o C.2010 D.2016  17.以下选项中,不属于信息时代的定律的是()。(单选题1分)分:1分

o o o o

得A.摩尔定律 B.麦特卡尔夫定律 C.达律多定律 D.吉尔德定律

 18.ENIAC诞生于哪一年?(单选题1分)o o o o

得分:1分

A.1946年 B.1938年 C.1942年 D.1940年

 19.Web2.0强调()。(单选题1分)o o o o

得分:1分

A.单位 B.网站 C.个人 D.机构

 20.摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍,性能也将提升一倍。(单选题1分)分

o

得分:1A.18个月 o o o

 B.24个月 C.12个月 D.6个月

21.20世纪中后期至今的媒介革命,以()的出现为标志。(多选题3分)得分:3分

o o o o A.计算机 B.数字化 C.互联网 D.自动化

 22.数据成为战略资源,未来的世界可能会划分为()这几个世界。(多选题3分)o o o o 得分:3分

A.微数据 B.小数据 C.大数据 D.无数据

 23.大数据时代的五个无处不在,具体指的是()、服务无处不在。(多选题3分)o o o o 得分:3分

A.计算无处不在 B.软件无处不在 C.大数据无处不在 D.网络无处不在  24.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。(多选题3分)o o o o

得分:3分

A.文化交流 B.农业生产经营 C.市场流通 D.质量安全控制

 25.“十二五”以来我国信息化发展的亮点包括以下哪些方面?(多选题3分)o o 得分:3分

A.信息产业的支撑性、保障性、带动性作用进一步增强 B.信息基础设施建设取得长足进步,为信息化全面深化发展提供了有力保障

o o

 C.电子商务异军突起,互联网经济发展速度超出预期 D.两化融合成为当前我国工业创新驱动、转型升级的时代特征

26.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(多选题3分)o o o o 得分:3分

A.从被动反应走向主动预见型管理 B.从单兵作战走向联合共享型管理 C.从柜台式管理走向全天候管理 D.从粗放化管理走向精细化管理

 27.关于大数据的内涵,以下理解正确的是()。(多选题3分)得分:3分

o o A.大数据还是一种思维方式和新的管理、治理路径 B.大数据在不同领域,又有不同的状况 o o C.大数据里面蕴藏着大知识、大智慧、大价值和大发展 D.大数据就是很大的数据

 28.关于大数据的内涵,以下理解正确的是(多选题3分)o o o o

得分:3分

A.大数据里面蕴藏着大知识、大智慧、大价值和大发展 B.大数据在不同领域,又有不同的状况 C.大数据就是很大的数据

D.大数据还是一种思维方式和新的管理、治理路径

 29.大数据的主要特征表现为()。(多选题3分)o o o o

得分:3分

A.商业价值高 B.处理速度快 C.数据类型多 D.数据容量大

 30.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是()。(多选题3分)o o o o

得分:3分

A.从柜台式管理走向全天候管理 B.从被动反应走向主动预见型管理 C.从粗放化管理走向精细化管理 D.从单兵作战走向联合共享型管理

 31.关于大数据的特征,以下理解正确的是()。(多选题3分)得分:3分

o A.重视事物的因果性 o o o B.大数据将颠覆诸多传统 C.大数据的价值重在挖掘 D.重视事物的关联性

 32.宁家骏委员指出,()主导了21世纪。(多选题3分)o o o o

得分:3分

A.云计算 B.移动支付 C.物联网 D.大数据

 33.信息技术发展产生了怎样的深刻变革?(多选题3分)o o o o

得分:0分

A.信息技术发展推动了工业生产方式的变革 B.信息技术发展推动了人类社会获取信息方式的变革 C.信息技术发展推动了智能手机、家电等的普及 D.信息技术发展推动了商品销售方式的变革

 34.党中央提出,要坚持走中国特色新型工业化、()“四化同步”的道路。(多选题3分)o o o o

得分:3分

A.信息化 B.农业现代化 C.数据化 D.城镇化

 35.人类历史上的五次媒介革命具体指的是语言出现、()。(多选题3分)得分:3分 o o o o A.印刷术

B.计算机、互联网、数字化 C.电话、广播、电视 D.文字出现

 36.美国大的猎头公司储备人才考虑的因素包括()。(多选题3分)得分:3分

o o o o A.情商 B.智商 C.经历 D.价值观

 37.大数据作为一种数据集合,它的含义包括(多选题3分)分

o o o o

得分:3A.构成复杂 B.数据很大 C.很有价值 D.变化很快

 38.当前我国信息化发展的主要问题体现在以下哪些方面?(多选题3分)得分:3分

o o o o A.网络和信息安全形势严峻 B.信息化发展不均衡 C.数据资源开放共享不够

D.传统产业跟互联网的全面融合发展明显不足  39.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?(多选题3分)o o o o

得分:3分

A.农业信息资源开发利用水平提高 B.农村电子商务蓬勃兴起 C.农村电子政务已经基本普及 D.农村综合信息服务平台发展迅速

 40.医疗健康领域的大数据有哪些来源?(多选题3分)o o o o

得分:3分

A.制药企业 B.临床数据 C.患者的数据 D.社保基金利用率

 41.感测技术指的是利用各种传感设备探测和感知信息的技术。(判断题1分)o o 得分:1分

正确 错误

 42.云计算相当于储有海量信息的信息库,大数据相当于计算机和操作系统。(判断题1分)o o

得分:1分

正确 错误

 43.传感器是构成物联网的基础单元。(判断题1分)o o

得分:1分

正确 错误  44.云计算是信息技术发展和集成应用到新阶段产生的新技术。(判断题1分)o o 得分:1分

正确 错误

 45.创新2.0的理念,就是在政府管理理念中实现自我管理、自我服务的状态。(判断题1分)o o

得分:1分

正确 错误

 46.根据涂子沛先生所讲,个人要把数据当做自己的遗产。(判断题1分)得分:1分

o o 正确 错误

 47.马化腾指出:“互联网+”战略就是利用互联网的平台,利用信息通信技术,把互联网和包括传统行业在内的各行各业结合起来,在新的领域创造一种新的生态。(判断题1分)o o

得分:1分

正确 错误

 48.20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。(判断题1分)o o

得分:1分

正确 错误

 49.宁家骏委员指出,大数据不等于传统的数据库建设。(判断题1分)得分:1分 o o 正确 错误

 50.大数据的价值重在挖掘,而挖掘就是分析。(判断题1分)分

o o

得分:1正确 错误

 51.目前,我国农村信息化发展形势更加紧迫。(判断题1分)分

o o

得分:1正确 错误

 52.未来农业信息化将会由孤立的单一系统闭环应用为主向开放兼容的网络化方向发展。(判断题1分)o o

得分:1分

正确 错误

 53.根据涂子沛先生所讲,大数据的项目5年之内会在中国遍地开花。(判断题1分)o o 得分:1分

正确 错误

 54.2000年,全国涉农网站超过6000家。(判断题1分)o o

得分:0分

正确 错误  55.未来,农业信息化在机制上,将由政府主导、企业参与向政府引导、企业主体、市场运作、多方协作的格局发展。(判断题1分)分

o o

得分:1正确 错误

 56.宁家骏委员指出,人们从信息的被动接受者变成了主动创造者。(判断题1分)o o 得分:1分

正确 错误

 57.宁家骏委员指出,越来越多的企业,通过部署云计算、开发大数据资源,实现了协同设计、协同制造。(判断题1分)o o

得分:1分

正确 错误

 58.发展医疗健康大数据应用,目标是助力健康医疗服务产业快速发展。(判断题1分)o o

得分:1分

正确 错误

 59.根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预测和实时躲避拥堵功能。(判断题1分)o o

得分:1分

正确 错误

 60.物联网的处理技术应用于农业上,可以对动物疾病、植物病虫害,通过传感器进行远程诊断。(判断题1分)

得分:1分 o o 正确 错误

1、(单选题)中华人民共和国全国人民代表大会是()。

A.唯一法律监督机关

B.最高普法机关

C.最高国家权力机关

D.最高执法机关

正确答案:C

用户选择:C

2、(单选题)法律和其他议案由全国人民代表大会以全体代表的()通过。

A.三分之二以上

B.三分之一以上

C.四分之三以上

D.过半数

正确答案:D

用户选择:D

3、(单选题)乡、民族乡、镇的人民代表大会每届任期()。

A.三年

B.四年

C.五年

D.两年

正确答案:C

用户选择:C

4、(单选题)全国人民代表大会根据()的提名,决定国务院副总理的人选。

A.国家主席

B.国务院办公厅

C.中央军委主席

D.国务院总理

正确答案:D

用户选择:D

5、(单选题)全国人民代表大会根据()的提名,决定国务院总理的人选。

A.中华人民共和国中央军委主席

B.全国人民代表大会常务委员会委员长

C.中华人民共和国国务院

D.中华人民共和国主席

正确答案:D

用户选择:D

6、(单选题)如果全国人民代表大会常务委员会认为必要,或者有()以上的全国人民代表大会代表提议,可以临时召集全国人民代表大会会议。

A.二分之一

B.五分之一

C.三分之一

D.四分之一

正确答案:B

用户选择:B

7、(单选题)最高人民法院()地方各级人民法院的审判工作,最高人民检察院()地方各级人民检察院的工作。

A.领导,监督

B.领导,领导

C.监督,监督

D.监督,领导

正确答案:D

用户选择:A

8、(单选题)全国人民代表大会每届任期()年。

A.一

B.五

C.十

D.三

正确答案:B

用户选择:B

9、(单选题)全国人民代表大会代表名额和代表产生办法由()规定。

A.行政法规

B.国际惯例

C.法律

D.宪法

正确答案:C

用户选择:D

10、(单选题)全国人民代表大会根据()的提名,决定中央军委其他组成人选。

A.中央军事委员会主席

B.国务院总理

C.最高人民检察院

D.国家主席

正确答案:A

用户选择:A

11、(单选题)中华人民共和国的国家机构实行()的原则。

A.三权分立制

B.联邦议会制

C.民主集中制

D.君主立宪制

正确答案:C

用户选择:C

12、(单选题)全国人民代表大会和()行使国家立法权。

A.最高人民法院

B.全国人民代表大会常务委员会

C.最高人民检察院

D.全国人民代表大会专门委员会 正确答案:B

用户选择:B

13、(单选题)宪法规定,我国的人民法院是()。

A.国家的仲裁机关

B.国家的司法机关

C.国家的法律监督机关

D.国家的审判机关

正确答案:D

用户选择:D

14、(单选题)宪法的修改,由全国人民代表大会以全体代表的()的多数通过。A.三分之二以上

B.四分之三以上

C.三分之一以上

D.二分之一以上

正确答案:A

用户选择:A

15、(单选题)中华人民共和国主席代表中华人民共和国,进行国事活动,接受外国使节,根据(),派遣和召回驻外全权代表,批准和废除同外国缔结的条约和重要协定。

A.全国人民代表大会的决定

B.全国人民代表大会常务委员会的决定

C.国务院的决定

D.全国人民代表大会和全国人民代表大会常务委员会的决定 正确答案:B

用户选择:B

16、(单选题)宪法规定,()在全国人民代表大会开会期间,有权依照法律规定的程序提出对国务院或者国务院各部、各委员会的质询案。

A.最高人民检察院院长

B.市人大代表

C.省人大代表

D.全国人民代表大会代表 正确答案:D

用户选择:D

17、(单选题)全国人民代表大会举行会议的时候,选举()主持会议。

A.主席团

B.全国人民代表大会常务委员会

C.秘书长

D.国家主席

正确答案:A

用户选择:A

18、(单选题)全国人民代表大会任期届满的()以前,全国人民代表大会常务委员会必须完成下届全国人民代表大会代表的选举。

A.两个月

B.一个月

C.六个月

D.三个月

正确答案:A

用户选择:A

19、(单选题)全国人民代表大会由省、自治区、直辖市、特别行政区和()选出的代表组成。

A.华人华侨

B.农民工

C.教育从业者

D.军队

正确答案:D

用户选择:D 20、(单选题)自治区主席由()担任。

A.自治地方的各民族公民

B.少数民族的公民

C.年满三十五周岁的公民

D.实行区域自治的民族的公民 正确答案:D

用户选择:D

21、(多选题)我国实行间接选举的有()。

A.乡人大代表

B.县人大代表

C.全国人民代表大会代表

D.省人大代表

正确答案:CD

用户选择:CD

22、(多选题)我国公民享有的()等权利,同时也是义务。

A.监督权

B.劳动权

C.受教育权

D.选举权和被选举权

正确答案:BC

用户选择:ABCD

23、(多选题)根据宪法规定,()应当由实行区域自治的民族的公民担任。

A.自治州州长

B.自治区主席

C.自治区人大常委会主任

D.自治县县长

正确答案:ABD

用户选择:ABD

24、(多选题)根据宪法的规定,下列哪些选项是正确的?()

A.国家可以对公民的私有财产实行无偿征收或征用

B.土地的使用权可以依照法律的规定转让

C.社会主义的公共财产包括国家的和集体的财产

D.社会主义的公共财产神圣不可侵犯 正确答案:BCD

用户选择:BCD

25、(多选题)关于全国人民代表大会职权,下列哪些说法是正确的?()

A.选举最高人民法院院长、最高人民检察院检察长

B.选举国务院总理、副总理

C.决定特别行政区的建置

D.选举国家主席、副主席

正确答案:AD

用户选择:AD

26、(多选题)依据我国宪法的规定,监督宪法实施的国家机关是()。

A.国务院

B.全国人民代表大会常务委员会

C.最高人民法院

D.全国人民代表大会

正确答案:BD

用户选择:BD

27、(多选题)国家从()等方面帮助各少数民族加速发展经济建设和文化建设事业。

A.精神

B.技术

C.物资

D.财政

正确答案:BCD

用户选择:BCD

28、(多选题)宪法规定,全国人民代表大会常务委员会的组成人员不得担任国家()的职务。

A.立法机关

B.行政机关

C.纪律检查机关

D.审判机关

正确答案:BD

用户选择:BD

29、(多选题)我国现阶段的爱国统一战线是由中国共产党领导的,由各民主党派和各人民团体参加的,包括()的广泛的爱国统一战线。

A.社会主义事业的建设者

B.全体社会主义劳动者

C.拥护社会主义的爱国者

D.拥护国家统一的爱国者

正确答案:ABCD

用户选择:BCD 30、(多选题)全国人民代表大会常务委员会的职权有()。

A.决定权

B.立法权

C.监督权

D.任免权

正确答案:ABCD

用户选择:ABCD

31、(多选题)根据我国宪法的规定,()的人大代表由下一级的人大选举。

A.直辖市

B.省

C.自治县

D.设区的市

正确答案:ABD

用户选择:ABD

32、(多选题)全国人民代表大会由()选出的代表组成。

A.特别行政区

B.军队

C.工人

D.省、自治区、直辖市

正确答案:ABD

用户选择:BD

33、(多选题)宪法规定,地方各级人民代表大会分别选举并且有权罢免本级人民政府的()。

A.乡长和副乡长

B.省长和副省长

C.市长和副市长

D.县长和副县长

正确答案:ABCD

用户选择:ABCD

34、(多选题)根据现行宪法和法律的规定,下列表述正确的有()。

A.民族自治地方的国家机关即民族自治机关

B.我国的民族自治地方包括自治区、自治州和自治县

C.劳动、受教育和依法服兵役都既是公民的基本权利又是公民的基本义务

D.公民在年老、疾病或丧失劳动能力的情况下,有从国家和社会获得物质帮助的权利 正确答案:BD

用户选择:ABCD

35、(多选题)地方各级审计机关依照法律规定独立行使审计监督权,对()负责。

A.本级人大常委会

B.上一级审计机关

C.上一级人民政府

D.本级人民政府

正确答案:BD

用户选择:BD

36、(多选题)地方各级人民政府实行()负责制。

A.乡长

B.省长

C.村长

D.县长

正确答案:ABD

用户选择:ABD

37、(多选题)根据我国宪法的规定,下列选项中()是可以提出宪法修改有效议案的主体。

A.全国人民代表大会的一个代表团

B.全国人民代表大会主席团

C.全国人民代表大会常务委员会

D.五分之一以上的全国人民代表大会代表 正确答案:CD

用户选择:CD

38、(多选题)根据宪法和法律的相关规定,下列哪几项是我国的选举制度的基本原则?()

A.直接选举和间接选举并用原则

B.无记名投票原则

C.平等原则

D.选举权利保障原则

正确答案:ABCD

用户选择:ABCD

39、(多选题)根据宪法和法律,下列哪些表述是正确的?()

A.自治州的人大常委会行使民族立法权

B.国家在必要时得设立特别行政区

C.全国人民代表大会常务委员会行使国家立法权

D.自治区的人大及常委会行使地方立法权 正确答案:BCD

用户选择:ABCD 40、(多选题)根据宪法规定,村民委员会的(),由村民选举产生。

A.主任

B.秘书长

C.委员

D.副主任

正确答案:ACD

用户选择:ACD

41、(判断题)宅基地、自留地、自留山属于公民个人所有。

A.对

B.错

正确答案:错

用户选择:错

42、(判断题)自治县是民族自治地方。

A.对 B.错

正确答案:对

用户选择:对

43、(判断题)国家维护社会主义法制的统一和尊严。

A.对

B.错

正确答案:对

用户选择:对

44、(判断题)禁止对任何民族的歧视和压迫,禁止破坏民族团结和制造民族分裂的行为。

A.对

B.错

正确答案:对

用户选择:对

45、(判断题)各民族自治地方都是中华人民共和国不可分离的部分。

A.对

B.错

正确答案:对

用户选择:对

46、(判断题)我国对非公有制经济依法实行监督和管理。

A.对

B.错

正确答案:对

用户选择:对

47、(判断题)土地的所有权可以依照法律的规定转让。

A.对

B.错

正确答案:错

用户选择:错

48、(判断题)自治州分为县、自治县、市。

A.对

B.错

正确答案:对

用户选择:对

49、(判断题)城镇中的手工业、工业、建筑业、运输业、商业、服务业等行业的各种形式的合作经济,都是社会主义劳动群众集体所有制经济。

A.对

B.错

正确答案:对

用户选择:对 50、(判断题)我国宪法明确规定,各民族都有使用和发展自己的语言文字的自由,都有保持或者改革自己的风俗习惯的自由。

A.对

B.错

正确答案:对

用户选择:对

1.第一个提出大数据概念的公司是()。(单选题1分)A.麦肯锡公司 B.谷歌公司 C.微软公司

得分:1分 D.脸谱公司

2.大数据元年是指(单选题1分)A.2011年 B.2012年 C.2013年 D.2010年

3.根据涂子沛先生所讲,摩尔定律是在哪一年提出的?(单选题1分)A.2004年 B.1965年 C.1989年 D.1988年

4.科学范式的发展路径:从观察到演绎分析、模型推导,到计算机分析、仿真模拟,再到()时期。(单选题1分)A.理论科技 B.数据科学 C.数据推导 D.数据计算

5.根据涂子沛先生所讲,哪一年被称为大数据元年?(单选题1分)A.2008年 B.2012年 C.2006年 D.2010年

6.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中

得分:1分

得分:1分

得分:1分

得分:1分 间的佼佼者。(单选题1分)A.8% B.10% C.7% D.9%

得分:1分

7.在十二届全国人大三次会议上,()首次提出来要制订“互联网+”行动计划。(单选题1分)得分:1分 A.王岐山 B.习近平C.张高丽 D.李克强

8.根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。(单选题1分)A.150亿 B.80亿 C.100亿 D.50亿

9.人类利用信息的历史,经历了()次革命,媒介革命催生了数据大爆炸。(单选题1分)得分:1分 A.三 B.四 C.五 D.六

10.()年,部分计算机专家首次提出大数据概念。(单选题1分)

得分:1分

得分:1分 A.2005 B.2010 C.2008 D.2011 11.根据涂子沛先生所讲,普适计算是由以下哪位提出的?(单选题1分)A.乔布斯 B.马克•维瑟 C.比尔·盖茨 D.摩尔

12.美国首个联邦首席信息官是下列哪位总统任命的?(单选题1分)A.小布什 B.老布什 C.克林顿 D.奥巴马

13.2012年全国各城市支付宝人均支出排名中,位居第二位的是()(单选题1分)1分

A.杭州市 B.嘉义市 C.嘉兴市 D.高雄市

14.大数据的本质是()。(单选题1分)A.搜集 B.挖掘

得分:1分

得分:

得分:1分

得分:1分 C.联系 D.洞察

15.社会成员或者用户之间社会成员之间共同参与信息的处理、信息的分享、信息的传播,这个活动就叫()。(单选题1分)A.政府计算 B.云计算 C.社会计算 D.高强度计算

16.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。(单选题1分)得分:0分 A.90% B.50% C.70% D.30% 17.以下说法错误的是哪项?(单选题1分)A.机器的智能方式是结果导向的

B.机器产生智能的方式是通过数据、数学模型 C.机器的智能方式和人是完全一样的 D.机器的智能方式和人的智能不同 18.()年被称为“大数据元年”。(单选题1分)A.2010 B.2013 C.2011

得分:1分 得分:0分

得分:1分 D.2015 19.2006年,个人用户迈进TB时代,全球共新产生约()的数据。(单选题1分)1分

A.80EB B.180EB C.280EB D.380EB 20.Web2.0强调()。(单选题1分)A.网站 B.个人 C.单位 D.机构

21.根据周琦老师所讲,高德地图有哪些功能?(多选题3分)A.智能计算到达目的地所需的时间 B.避堵路线方案规划 C.交通路况实时播报 D.为用户搜索地点

22.以下说法正确的有哪些?(多选题3分)A.大数据仅仅是讲数据的体量大 B.大数据对传统行业有帮助 C.大数据会带来机器智能 D.大数据是一种思维方式

23.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?(多选题3分)

得分:0分

得分:3分

得分:1分

得分:得分:3分

A.农村综合信息服务平台发展迅速 B.农村电子政务已经基本普及 C.农业信息资源开发利用水平提高 D.农村电子商务蓬勃兴起

24.云计算能够给我们带来什么?(多选题3分)A.弹性配给 B.进行资源汇集 C.按需硬性服务 D.按需自主服务

25.关于大数据的来源,以下理解正确的是(多选题3分)A.大数据是数据量变积累达到质变的结果 B.数据的产生需要经历很长时间 C.我们每个人都是数据的制造者

D.当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界 26.大数据在今天这个时间点上爆发的原因有哪些?(多选题3分)A.各种传感器无时无刻不在为我们提供大量的数据 B.各种监控设备无时无刻不在为我们提供大量的数据 C.各种智能设备无时无刻不在为我们提供大量的数据 D.互联网的收集和积累

27.根据周琦老师所讲,对大数据的管理和使用包括哪些方面?(多选题3分)分

A.大数据的挖掘

得分:

3得分:3分

得分:3分

得分:3分 B.大数据的存储 C.大数据的应用 D.大数据的运营

28.贵州电子商务的发展路径是:与阿里、京东、腾讯等电商企业强化合作,改善信息基础条件、物流条件,培育电商主体和平台,积极发展()。(多选题3分)A.电子商务+农村 B.电子商务+跨境 C.电子商务+社区 D.电子商务+物流

29.信息技术产品的演进遵循哪些定律?()(多选题3分)A.图灵定律 B.摩尔定律 C.梅特卡夫定律 D.吉尔德定律

30.根据涂子沛先生所讲,大数据对我们的生活有什么影响?(多选题3分)A.生活被数据驱动 B.进入人机共生的状态 C.机器跟网络会获得智能 D.生活越来越依赖网络、机器

31.医疗健康领域的大数据有哪些来源?(多选题3分)A.临床数据 B.社保基金利用率 C.制药企业

得分:3分

得分:3分

得分:3分

得分:3分 D.患者的数据

32.使用摩尔定律估算2033年的计算机有何种性能?(多选题3分)A.1PByte B.3PHzCPU(约1024核)C.0.25Tbps D.0.5EByte 33.信息社会经历的发展阶段包括()。(多选题3分)A.互联网时代 B.大数据时代 C.云计算时代 D.计算机时代

34.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(多选题3分)分:3分

A.从被动反应走向主动预见型管理 B.从粗放化管理走向精细化管理 C.从柜台式管理走向全天候管理 D.从单兵作战走向联合共享型管理

35.2015年10月14日,国务院常务会议研究加快农村电子商务发展的措施有哪些?(多选题3分)得分:3分

得分:0分

得分:3分

A.营造良好网络消费环境 B.改善农村电商发展环境 C.加大农村电商政策扶持 D.扩大电商在农业农村的应用 36.关于大数据的特征,以下理解正确的是()。(多选题3分)A.重视事物的因果性 B.大数据的价值重在挖掘 C.大数据将颠覆诸多传统 D.重视事物的关联性

37.贵州发展大数据的“八个一”建议包括()。(多选题3分)A.培养一批干部、出台一批政策 B.制定一个工作计划、建立一个领导机构 C.引入一批人才、聚集一批创客 D.谋划一批产业、引进一批项目

38.贵州发展大数据带动的衍生业态包括()。(多选题3分)A.智慧教育 B.智慧旅游 C.创客小镇 D.智慧健康

得分:3分

得分:3分

得分:3分

39.大数据时代的五个无处不在,具体指的是()、服务无处不在。(多选题3分)3分

A.软件无处不在 B.大数据无处不在 C.网络无处不在 D.计算无处不在

40.数据成为战略资源,未来的世界可能会划分为()这几个世界。(多选题3分)3分

得分:

得分:A.微数据 B.小数据 C.大数据 D.无数据

41.宁家骏委员指出,文字产生于公元3500年。(判断题1分)正确 错误

42.物联网目前还未实现对实时情况进行监测、感知。(判断题1分)正确 错误

43.大数据的价值重在挖掘,而挖掘就是分析。(判断题1分)正确 错误

44.目前,我国农村信息化发展形势更加紧迫。(判断题1分)正确 错误

45.吴军博士认为,所有未来的公司,某种程度上都是大数据公司。(判断题1分)1分

正确 错误

46.奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度。(判断题1分)正确

得分:1分

得分:

得分:1分 得分:1分

得分:1分 得分:1分 错误

47.根据涂子沛先生所讲,大数据的项目5年之内会在中国遍地开花。(判断题1分)分:1分

正确 错误

48.《促进大数据发展行动纲要》指出,要加快政府数据开放共享,推动资源整合,提升治理能力。(判断题1分)正确 错误

49.林雅华博士认为,“治理”是一个全新的政治概念,它既不同于“统治”,也不同于“管理”。(判断题1分)正确 错误

50.发展医疗健康大数据应用,目标是助力健康医疗服务产业快速发展。(判断题1分)分:1分

正确 错误

51.根据涂子沛先生所讲,进入信息时代之后,数据的内涵缩小了。(判断题1分)1分

正确 错误

52.吴军博士认为机器的智能方式和人的智能不同,它是一种结果导向的。(判断题1分)得分:1分

正确 错误

得分:

得得分:1分

得分:1分

得53.大数据面对的信息价值密度都是比较高的。(判断题1分)正确 错误

得分:1分

54.宁家骏委员指出,人们从信息的被动接受者变成了主动创造者。(判断题1分)1分

正确 错误

得分:55.贵州发展大数据是要实现“以大数据提升政府治理能力、以大数据推动转型升级、以大数据服务改善民生”三个目的。(判断题1分)正确 错误

56.宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。(判断题1分)分

正确 错误

57.2016年3月2日,云上贵州·大数据招商引智再出发活动,突出统一思想、产业对接、行业引领、创新创业,推动形成大数据大家干的良好格局。(判断题1分)正确 错误

58.宁家骏委员指出,到2020年,整个世界的数据量将达到35.2ZB。(判断题1分)得分:1分

正确 错误

59.宁家骏委员指出,大数据不等于传统的数据库建设。(判断题1分)正确

得分:1分 得分:1分

得分:

1得分:1分 错误

60.大数据应用的主要领域是政府和商业领域。(判断题1分)正确 错误

得分:1分

 1.第一个提出大数据概念的公司是()。(单选题1分)o o o o

得分:1分

A.脸谱公司 B.谷歌公司 C.麦肯锡公司 D.微软公司

 2.根据涂子沛先生所讲,以下说法错误的是哪项?(单选题1分)得分:1分

o o o o A.个人要把数据当做自己的遗产 B.数据垃圾对商业公司是一个挑战

C.国家要制定合适的法律来规范数据遗产继承的问题 D.中国社会不会面临数据遗产问题

 3.科学范式的发展路径:从观察到演绎分析、模型推导,到计算机分析、仿真模拟,再到()时期。(单选题1分)o o o o

得分:0分

A.数据计算 B.理论科技 C.数据科学 D.数据推导  4.2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分)得分:1分

o o o o A.5万 B.10万 C.3万 D.20万

 5.2015年“双11”:阿里平台每秒钟订单创建()笔。(单选题1分)分:1分

o o o o

得A.14万 B.24万 C.34万 D.4万

 6.关于大数据在社会综合治理中的作用,以下理解不正确的是(单选题1分)o o o o 得分:1分

A.大数据的运用有利于走群众路线 B.大数据的运用能够加强交通管理 C.大数据的运用能够维护社会治安 D.大数据的运用能够杜绝抗生素的滥用

 7.根据涂子沛先生所讲,社交媒体是在哪一年出现的?(单选题1分)得分:1分

o o o A.1965年 B.1989年 C.2004年 o

 D.1988年

8.()指利用计算机处理信息的技术,是现代信息技术的核心。(单选题1分)o o o o 得分:1分

A.感测技术 B.通信技术 C.计算机技术 D.微电子技术

 9.医疗健康数据的基本情况不包括以下哪项?(单选题1分)分

o o o o

得分:1A.个人健康管理数据 B.诊疗数据 C.公共安全数据 D.健康档案数据

 10.2014年,阿里平台完成农产品销售()元。(单选题1分)分

o o o o

得分:1A.283亿 B.383亿 C.183亿 D.483亿

 11.根据周琦老师所讲,以下哪项不属于数据挖掘的内容?(单选题1分)得分:1分

o A.高德地图导航有躲避拥堵功能 o o o

 B.建立道路拥堵概率与拥堵趋势变化模型 C.多维分析统计用户出行规律 D.补充与完善路网属性

12.根据周琦老师所讲,高德早在()就开始投入资源来做全国交通信息的采集和发布。(单选题1分)o o o o

得分:1分

A.2002年 B.2004年 C.2007年 D.2005年

 13.吴军博士认为未来二十年就是()为王的时代。(单选题1分)分:1分

o o o o

得A.数据 B.文化 C.工业 D.农业

 14.以下说法错误的是哪项?(单选题1分)o o o o

得分:1分

A.机器产生智能的方式是通过数据、数学模型 B.机器的智能方式和人是完全一样的 C.机器的智能方式是结果导向的 D.机器的智能方式和人的智能不同

 15.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。(单选题1分)

得分:1分 o o o o

 A.30 B.38 C.21 D.25 16.()年3月1日,贵州·北京大数据产业发展推介会在北京隆重举行,贵州大数据正式启航。(单选题1分)o o o o

得分:1分

A.2014 B.2012 C.2010 D.2016  17.以下选项中,不属于信息时代的定律的是()。(单选题1分)分:1分

o o o o

得A.摩尔定律 B.麦特卡尔夫定律 C.达律多定律 D.吉尔德定律

 18.ENIAC诞生于哪一年?(单选题1分)o o o o

得分:1分

A.1946年 B.1938年 C.1942年 D.1940年  19.Web2.0强调()。(单选题1分)o o o o

得分:1分

A.单位 B.网站 C.个人 D.机构

 20.摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍,性能也将提升一倍。(单选题1分)分

o o o o

得分:1A.18个月 B.24个月 C.12个月 D.6个月

 21.20世纪中后期至今的媒介革命,以()的出现为标志。(多选题3分)得分:3分

o o o o A.计算机 B.数字化 C.互联网 D.自动化

 22.数据成为战略资源,未来的世界可能会划分为()这几个世界。(多选题3分)o o o 得分:3分

A.微数据 B.小数据 C.大数据 o

 D.无数据

23.大数据时代的五个无处不在,具体指的是()、服务无处不在。(多选题3分)o o o o 得分:3分

A.计算无处不在 B.软件无处不在 C.大数据无处不在 D.网络无处不在

 24.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。(多选题3分)o o o o

得分:3分

A.文化交流 B.农业生产经营 C.市场流通 D.质量安全控制

 25.“十二五”以来我国信息化发展的亮点包括以下哪些方面?(多选题3分)o o 得分:3分

A.信息产业的支撑性、保障性、带动性作用进一步增强 B.信息基础设施建设取得长足进步,为信息化全面深化发展提供了有力保障

o o

 C.电子商务异军突起,互联网经济发展速度超出预期 D.两化融合成为当前我国工业创新驱动、转型升级的时代特征

26.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(多选题3分)o 得分:3分

A.从被动反应走向主动预见型管理 o o o B.从单兵作战走向联合共享型管理 C.从柜台式管理走向全天候管理 D.从粗放化管理走向精细化管理

 27.关于大数据的内涵,以下理解正确的是()。(多选题3分)得分:3分

o o o o A.大数据还是一种思维方式和新的管理、治理路径 B.大数据在不同领域,又有不同的状况

C.大数据里面蕴藏着大知识、大智慧、大价值和大发展 D.大数据就是很大的数据

 28.关于大数据的内涵,以下理解正确的是(多选题3分)o o o o

得分:3分

A.大数据里面蕴藏着大知识、大智慧、大价值和大发展 B.大数据在不同领域,又有不同的状况 C.大数据就是很大的数据

D.大数据还是一种思维方式和新的管理、治理路径

 29.大数据的主要特征表现为()。(多选题3分)o o o o

得分:3分

A.商业价值高 B.处理速度快 C.数据类型多 D.数据容量大

 30.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是()。(多选题3分)

得分:3分 o o o o A.从柜台式管理走向全天候管理 B.从被动反应走向主动预见型管理 C.从粗放化管理走向精细化管理 D.从单兵作战走向联合共享型管理

 31.关于大数据的特征,以下理解正确的是()。(多选题3分)得分:3分

o o o o A.重视事物的因果性 B.大数据将颠覆诸多传统 C.大数据的价值重在挖掘 D.重视事物的关联性

 32.宁家骏委员指出,()主导了21世纪。(多选题3分)o o o o

得分:3分

A.云计算 B.移动支付 C.物联网 D.大数据

 33.信息技术发展产生了怎样的深刻变革?(多选题3分)o o o o

得分:0分

A.信息技术发展推动了工业生产方式的变革 B.信息技术发展推动了人类社会获取信息方式的变革 C.信息技术发展推动了智能手机、家电等的普及 D.信息技术发展推动了商品销售方式的变革  34.党中央提出,要坚持走中国特色新型工业化、()“四化同步”的道路。(多选题3分)o o o o

得分:3分

A.信息化 B.农业现代化 C.数据化 D.城镇化

 35.人类历史上的五次媒介革命具体指的是语言出现、()。(多选题3分)o o o o 得分:3分

A.印刷术

B.计算机、互联网、数字化 C.电话、广播、电视 D.文字出现

 36.美国大的猎头公司储备人才考虑的因素包括()。(多选题3分)得分:3分

o o o o A.情商 B.智商 C.经历 D.价值观

 37.大数据作为一种数据集合,它的含义包括(多选题3分)分

o o o

得分:3A.构成复杂 B.数据很大 C.很有价值 o

 D.变化很快

38.当前我国信息化发展的主要问题体现在以下哪些方面?(多选题3分)得分:3分

o o o o A.网络和信息安全形势严峻 B.信息化发展不均衡 C.数据资源开放共享不够

D.传统产业跟互联网的全面融合发展明显不足

 39.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?(多选题3分)o o o o

得分:3分

A.农业信息资源开发利用水平提高 B.农村电子商务蓬勃兴起 C.农村电子政务已经基本普及 D.农村综合信息服务平台发展迅速

 40.医疗健康领域的大数据有哪些来源?(多选题3分)o o o o

得分:3分

A.制药企业 B.临床数据 C.患者的数据 D.社保基金利用率

 41.感测技术指的是利用各种传感设备探测和感知信息的技术。(判断题1分)o o 得分:1分

大数据和数据化思考 篇6

从2013年6月初,斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美国监控全球互联网计划,再到斯诺登到俄罗斯寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”。这个通过分析海量通讯数据获取安全情报的大数据案例,让围绕大数据的话题与反思不断发酵,也让2013被称为“大数据元年”。

从可以自动转弯和刹车的汽车,到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类,这项技术终将改变我们所居住的星球上的生活与生意。

一位居住在纽约布鲁克林的软件开发者 Federico Zannier“把自己卖了”,他通过发起“A bite of Me”项目,不断收集自己所有的数字轨迹,并挂到网站上销售。“那些公司在用我的数据赚钱,当你接受那些使用条款时,你就已经把这些数据的使用权白送给他们了。”

的确,亚马逊监视着我们的购物习惯,谷歌监视着我们的网頁浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。

大数据能够越来越精确地预测世界的事情以及我们所处的位置,我们却还没准备好接受它对我们的隐私和决策过程带来的影响。我们的认知和制度都还不习惯这样一个数据充裕的时代,因为它们都建立在数据稀缺的基础之上。在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。

“斯诺登效应”还在继续,大数据时代的生存规则也将被每一个生产数据的你和我来书写。

大数据背景下对数据可用性的思考 篇7

1 大数据有关概念解析

大数据实质上是指一个数的几何体形式, 其主要具备下面几点性质。第一, 大数据本身具有一致性特征, 在数据集合当中其涵盖的多元化信息都保持良好的相同性, 针对部分存在错误的信息或者难以与大数据信息相符合的信息资源, 其并不属于数据集合。一旦大数据集合当中的信息存在不一致的情况, 则证明大数据本身的安全性存在较大的文体, 需要进行相应的核查。例如, 某人的银行卡同一时间在两个区域进行刷卡消费, 并且刷卡消费的实际数据存在差异性, 则证明该银行卡本身出现了文体。第二, 大数据本身具备准确性的特征。数据集合当中每一个对应的数据代表着对应的实体, 其可以精准地反映出某个事件的具体信息与状况。第三, 大数据本身应当具备良好的完整性特征。大数据集合当中对应的数据需要涵盖各个方面的数据信息, 能够方便人们进行检索。例如, 医院所使用的数据库, 要想保证医疗工作能够有序地开展, 就必须保障医院数据库本身的完整性, 避免重要信息数据遗漏, 才保障医师判断的准确性。第四, 大数据本身应当具备时效性特征。要想保障大数据的有效使用, 就必须保障大数据集合当中的信息数据都能完全符合当前事物的发展状况, 始终保持数据能够实现与时俱进的目标, 使数据的先进性得以保障。第五, 大数据本身具备实体同一性特征。数据集合中对应的各个数据在进行描述的进程中具备同一性的特征, 并且享有相同的描述。

2 提升数据可用性的建议

2.1 收集与整合高质量的大数据

大数据集合主要包含以下三个来源: (1) Web当中分布的海量数据库信息; (2) 物理信息系统, 如智慧城市与智能电网等物理信息系统; (3) 观察数据与科学实验信息, 如空间观测数据、物理实验数据以及生物数据等, 其均简称为科学数据。一般情况下, 科学数据与物理信息系统当中的数据都是通过观测设施或者传感器组成的传感网进行获取。所谓大数据的收集与整合, 通常是指从Web数据库或者传感网当中获取数据以后, 通过处理加工, 最终储存在计算机系统当中的数据集合。收集与整合高质量的大数据是保障数据可用性的重要举措, 其主要通过Web高质量数据的收集与整合、传感网高质量数据的收集与整合这两个方面来实现。

2.1.1 Web高质量数据的收集与整合

Web当中蕴藏着极为丰富的资源数据, 通过从各个Web数据库当中获取相应的信息, 通过整合加工, 将其处理成自身所需要的数据集合, 这个进程一般被称为Web数据收集。Web数据集成过程中, Web数据源本身的数据质量会直接对集成数据信息的可用性产生巨大影响。如何针对各种Web数据库进行有效判断, 筛选出高质量的数据信息, 是Web高质量数据收集与整合的关键所在。

有研究提出, 各个数据源之间存在的数据复制关系可以有效帮助系统进行高质量数据源的选取, 切实提升数据集成本身的可用性。对于静态数据来说, 通过贝叶斯分析法, 能够针判断各个数据源之间的复制关系, 然后再进行收集与整合, 以此来提升数据集合的可用性[2]。

针对动态数据, 可以根据数据源当中数据的更新历史进行各个数据源之间的复制, 通过隐马尔可夫模型判定, 然后再通过贝叶斯模型针对数据获取进程实施优化, 从而有效保障动态数据的可用性。

2.1.2 传感网高质量数据的收集与整合

要想保障传感网获取数据的准确性, 就应当保障物理世界可以被准确近似, 有效保障信息数据的高精度。可以采用三次样条插值与Hermit插值技术, 通过采用两个面向物理进程的高精度变频数据收集计算方法, 可以在充分保障数据可用性的基础上, 保障传输到网络当中的数据量最小化, 切实减小收集数据所描述的物理世界与实物世界之间存在的误差[3]。

对于地理位置近似导致传感器节点当中数据存在冗余的现象, 可以采用位置数据敏感的获取措施, 通过数据源之间存在的地理关联特点, 能够将一些冗余的信息完全过滤掉, 切实提升获取信息数据在事件监测当中的可用性, 进一步降低误判的几率。

2.2 构建标准化的数据格式

当前, 虽然有关大数据可用性方面的理论还不够成熟, 然而针对某些特定领域当中的大数据, 要想保障大数据的可用性, 应当在构架标准化的数据格式基础上, 尽量呼吁广大使用者上传满足标准化格式的信息数据, 亦或是根据格式要求从数据库当中获取相应的信息数据, 删除处理一些不满足数据格式的信息, 最后通过专家知识库, 针对已有的数据集合进行真伪分别, 从而有效提升数据的可用性。比如, “10亿价格项目”当中的例子, 美国劳工统计局当中的人员在每个月都需要进行消费物价指数 (CPI) 的公布, 其主要是用于测试通货膨胀率, 而上述信息数据对各个商家与投资者而言, 都是极为重要的。在进行银行利率增减决策的过程中, 美联储通常都会充分参考当前的消费指数。只要出现通货膨胀的现象, 广大工人对应的工资也会大幅增加。美国政府在进行债券利息与社会福利方面的款项支付时, 也必须要综合考虑上述各项指标。而美国政府为获取上述各项信息数据, 通常会雇佣有关工作人员来统计全国多个城市, 统计的信息数据中包含各项价格资源通常能够达到80 000种左右, 当中甚至会包含出租车价格、蔬菜价格等等。美国政府每年应用于上述数据的采集通常都需要耗资两亿五千万美元左右。尽管上述这些数据是极为有序、精确的, 但是该信息数据的公布通常会存在几周的滞后性, 而2008年所爆发的经济危机充分证明这个滞后性是极为致命的[4]。从该例子可以看出, 虽然“10亿价格项目”隶属于大数据, 但是其所采用的措施仍旧是基于“小数据”的模式。所以, 针对大数据的可用性, 构建标准化的数据格式是切实可行的。

2.3 错误数据的自动检测与修复

针对数据错误的自动检测与修复, 当中主要集中于一致性错误与实体同一性错误两个层面。

2.3.1 一致性错误的自动检测与修复

针对条件函数依赖与函数依赖而言, 可以对集中存储的关系数据库, 采用SQI二语言来进行自动检测算法的设计。通过该种方法, 能够及时检测出违反条件包含约束与条件函数约束的元祖, 并判断和修复这些元祖, 以此来实现一致性错误的自动检测与修复[5]。

2.3.2 实体同一性错误的自动检测与修复

所谓实体同一性错误, 指在数据库当中存在描述同一个现实实体的n个 (n>1) 的数据元组。所以, 要进行实体同一性错误的自动检测, 重点在于针对数据库当中的相似实体进行有效地识别。当前, 针对实体识别方面的研究已经较为成熟, 主要包含以最大化识别精度为目标的实体识别方法、以最大化识别效率为目标的实体识别方法、实体识别系统的实现方法以及实体识别方法的测评[6]。

当前, 有关错误数据自动检测的研究仍然局限于一致性错误与实体同一性错误两个层面, 有关其他可用性维度方面的错误数据自动检测还需要进行深入研究。此外, 有关错误数据自动修复方面的研究, 也局限于一致性错误与实体同一性错误两个层面, 有关其他可用性维度方面的错误数据自动修复方面的技术仍然处于空白状态。

3 结语

当前社会是一个信息化技术迅猛发展的时代, 信息技术已经遍布各个角落。大数据已经成为各行各业共同关注的焦点, 其对提升我国国计民生水平、加强社会主要和谐社会建设都具有十分重要的现实意义。鉴于此, 必须要清楚地意识到各种劣质数据对大数据应用产生的危害, 深入研究提升大数据的可用性, 使高质量的大数据能够在社会各个领域中发挥重要作用, 切实推动大数据相关研究工作的有序开展。

参考文献

[1]孟小峰, 慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展, 2013 (1) .

[2]朱东华, 张嶷, 汪雪锋, 等.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理, 2013 (4) .

[3]秦晓珠, 李晨晖, 麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作, 2013 (2) .

[4]张兴旺, 李晨晖, 麦范金.变革中的大数据知识服务:面向大数据的信息移动推荐服务新模式[J].图书与情报, 2013 (4) .

[5]朱建平, 章贵军, 刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究, 2014 (2) .

大数据时代精准扶贫思考 篇8

2015年6月习近平到贵州省进行考察, 强调要科学谋划好“十三五”时期扶贫开发工作, 确保贫困人口到2020年如期脱贫, 并提出扶贫开发“贵在精准, 重在精准, 成败之举在于精准”。那么, 如何在扶贫过程中做到精准呢?这就需要借助大数据来深度了解地区贫困状况, 做出精准的决策。

一、大数据概述

(一) 大数据的内涵。“大数据”的概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写的《大数据时代》中提出, 指对采集到的所有数据进行分析处理, 而不是用抽样调查的方式对数据进行随机分析。人类可以花费更低的成本, 通过更加便捷的方式获取数据中隐藏的价值和信息, 也可以在分析数据的基础上进行二次开发。大数据时代给人类深入探究事件的规律, 获取潜在知识, 得到更有价值的商业信息提供了理论基础和技术支持。大数据有4V特点, 即Volume (大量) 、Velocity (高速) 、Variety (多样) 、Value (价值) 。

(二) 将大数据应用于精准扶贫的原理。在传统的数据分析阶段, 我们一般是采用抽样方式进行数据分析。这也就是说数据分析结果的准确性在很大程度上取决于数据样本选取的随机性, 但是在实际操作中是很难做到样本选取的随机性。

“大数据时代”的来临, 避免了数据样本选取随机的缺陷。“大数据”放弃了随机抽取样本的方式, 而是将所有的数据充分利用进行分析。我们可以运用这种思维, 在掌握所有贫困人口基本情况的基础上对贫困人口选取多重角度进行分析, 深入、透彻的研究贫困人口状况, 做出科学、精准的判断和决策。

(三) 将大数据应用于精准扶贫的技术支持。将大数据应用于扶贫, 首先要有关于贫困地区的人口具体情况、经济发展状况、资源开发利用情况、基础设施建设情况、交通便利程度等信息。上述信息的取得则依赖于网络、计算机和遥感测量等技术的应用。在信息采集过程中要求所收集的信息具有准确性、全面性, 还要考虑到实用性和重要性。贫困信息采集工作结束后要将信息进行数字化、信息化、网络化, 以便后期使用时便捷。

二、利用大数据实现精准扶贫的过程

(一) 利用大数据确定贫困对象。做到精准扶贫的关键点是确定精准扶贫的对象。粗放式的扶贫是通过样本数据的分析, 确定贫困标准后再选取合适对象, 这种方式的弊端在于样本的选择不具有严格的随机性, 容易产生偏差。大数据下的精准扶贫避免了粗放式扶贫在样本选择上的弊端, 其利用新技术摒弃了样本分析的方式, 转向对所有数据进行分析, 以数据的全面性和精准性为支撑。扶贫对象的确认原则是“县为单位、规模控制、分级负责、精准识别、动态管理”。在传统的粗放式扶贫阶段, 只有县级或村级政府对扶贫对象才有了解。大数据时代下的精准扶贫可以为每一村、每一户的贫困人员建档, 将贫困人员的基本信息、动态变化录入平台, 建立动态化的贫困人员信息平台。当然这种平台的初设阶段明显存在工作量繁多的弊端, 采集的信息全部需要录入到平台绝非轻巧。这就需要我们做好基础准备工作:第一, 建立信息录入小组, 按照层级分工进行数据的录入;建立监督检查小组, 对采集的信息进行分析、核实, 确保初始数据的真实性、准确性。第二, 可以发动群众的力量, 形成自下而上的申报、监督制度。民众可以按照国家颁布的贫困人员认定标准自行识别并确认自己、他人是够符合标准, 发挥民众的自治性、监督性。这种监督管理可以提高信息录入的精准性, 也提高信息录入的效率。

(二) 利用大数据对贫困对象进行动态化监管。第一, 利用采集的数据、信息建立贫困人员管理平台并进行信息化管理, 建立标准识别系统对贫困人员是否仍符合贫困标准进行动态化监管, 提高系统的精确性、准确性, 避免贫困人员认定的滞后性、静态性的缺陷。在动态化的监管过程中, 要做到对贫困人员的基本信息动态变化的全面把握与管理;第二, 在平台上建立资金管理系统, 全面监督贫困资金的流动情况, 确保资金的专项专用, 确保每一笔资金能够发放到每一个贫困家庭手中;第三, 平台要做到贫困人员有进有出, 体现扶贫的动态变化。不可能每个贫困人员永远都是贫困人员, 平台动态化的监管可以准确监控到已经脱贫的人员、仍处于贫困中的人员。实时更新或定期更新可以省去统计这项琐碎的工作, 也节省了人员设置。

(三) 利用大数据对贫困人员进行预测。依靠对贫困人员的动态化监管可以做到工作重心从信息采集向信息分析的转变。大数据的应用不仅仅局限于贫困人员的确定、平台的建立, 更重要的应用于对贫困人员的预测, 这也是将大数据应用于精准扶贫的核心作用。将贫困人员基本信息、贫困地区基本情况运用数学、统计方法进行计算, 对尚未发生事件进行可行性、可能性的预测。通过这种科学的预测, 准确把握扶贫工作的实施效果, 提高资源的利用率。数据的预测结果只是作为扶贫工作开展的辅助性工具, 真正行之有效的扶贫政策和形式还有赖于因地制宜的政策设置和决策实施。

三、精准扶贫工作实施过程中应注意的问题

(一) 建立工作责任制。2015年五中全会提出脱贫工作责任制理论, 要求强化脱贫工作的责任考核制度, 重点关注贫困地区脱贫工作实施效果。中央、省级政府加上财政支持, 贫困地区积极进行商业性融资, 整合财政支持和自筹资金研究开发和利用贫困地区的资源、为扶贫工作的进展提供新思路。工作责任制的建立不仅有利于脱贫工作的开展, 还有利于上级领导和广大人民群众对领导班子工作的监督、检查。工作责任制的建立有利于对资金的流向进行观测, 确保资金不得私用或滥用。

(二) 调动贫困人员脱贫的积极性。有些贫困人员已经习惯处于生活的底层, 也没有积极性和上进心自我脱贫。这就需要领导班子鼓励贫困人员积极采取一切方式进行自我脱贫, 增强贫困人员脱贫的内在动力。首先领导班子应该鼓励贫困人员之间建立合作关系, 结合优势进行互补;其次领导班子可以建立富足人员带动贫困人员的互助制度。

(三) 扶贫工作要彻底, 切勿虎头蛇尾。扶贫工作的开展不能一蹴而就, 应该细水长流式的抓住重点坚持不懈。随着“十三五”的到来, 实现全面建成小康社会的目标迫在眉睫, 扶贫工作进入了冲刺阶段、攻坚阶段。前期工作做得好, 也需要后期系统的工作和政策来延续和支撑。政策制定要连贯, 保障措施也要与时俱进, 针对工作中出现的新状况不断地修正和调整。

(四) 精准扶贫也要涉及到城市贫困人口。每当提起贫困人员, 多数人想到的是贫困县、贫困村, 而忽略了在城市居住人口中也存在一定比例的贫困人员。城市中仍然存在着大量的失业人员、无业人员、残障人员, 他们虽生活在城市中, 但依旧有可能生活在温饱的边缘, 甚至连最基本的温饱生活都达不到。这就需要在精准扶贫工作中涉及到城市中的贫困人口。为城市中的贫困人口设立专项基金, 对丧失劳动力的人口提供最低生活保障, 对残障人口提供医疗救助保障, 做到真正的精准扶贫。

(五) 扶贫战略思想的转变。传统的粗放式精准扶贫采取的战略思想是普惠式, 这种陈旧的方式容易造成资源浪费和扶贫效果差。为了提高扶贫工作的效率, 优化资源配置, 精准扶贫要求我们转变普惠式扶贫为适度竞争式扶贫。这种方式充分调动了贫困人口的积极性和主动性, 使贫困人口积极寻找致富途径, 使贫困人口自立门户、自力谋生、自力更生, 这样才是帮助贫困人口脱贫最有效的方式。

摘要:随着“十三五”的到来, 全面建成小康社会的任务日渐紧迫, 精准扶贫成为实现全面小康社会的关键之举。精准扶贫是相对粗放式扶贫提出的概念, 是指针对贫困地区的“特色”而制定专属性的扶贫计划。“大数据时代”的兴起, 为精准扶贫提供了新的视角, 可以使定位更加精确, 扶贫更加精准。

关键词:大数据,精准扶贫

参考文献

[1]公衍勇.关于精准扶贫的研究综述[J].山东农业工程学院学报, 2015.3.

[2]罗江月, 唐丽霞.扶贫瞄准方法与反思的国际研究成果[J].中国农业大学学报 (社会科学版) , 2014.4.

[3]刘永富.坚决打赢扶贫攻坚战[J].老区建设, 2015.3.

大数据环境下的数据查询和优化 篇9

随着信息技术的快速发展和数据爆炸式的增长, 传统数据库性能已经远远满足不了大数据时代对系统高性能的需求[1]。传统的并行数据库由于容错性和结点规模的限制, 已经不能满足日益增长的海量数据查询需求[2], 具有高扩展性、容错性和易用性的Map Reduce架构被提出[3]。但是Map Reduce架构在关系型数据查询性能上较并行数据库存在劣势[4], 主要原因是Map Reduce架构没有充分利用关系型数据模式, 导致网络开销大。本文提出的混合Map Reduce环境下基于数据划分的查询优化, 是通过结合并行数据库的查询优化技术和Map Reduee架构出色的容错性和扩展性来提升系统查询性能。

数据划分是混合Map Reduce环境下查询性能提升的关键。数据划分指在网络结点中数据存储的方式, 划分方法采用数据全复制、数据独立水平划分和数据协同水平划分等。一些关系查询操作, 如连接操作和聚集操作, 需要数据在结点之间进行重划分操作, 而重划分涉及到大量数据移动, 其网络开销和I/O开销非常巨大[5]。混合架构较Map Reduce架构的性能优势是将开销较大的关系查询操作下划到本地数据库中进行。对于连接操作, 若查询所涉及到的表采用协同水平划分, 则操作同样可以下划到本地数据库中进行。

传统的数据划分技术通常针对简单数据模型, 并且依赖人工分析, 对复杂的数据模型很难确定如何得到最优划分, 因此亟需自动化的数据划分方案。在分布式数据库领域, 文献[6]提出为数据划分提供建议工具, 即划分建议器 (partition recommender) 。但是针对混合Map Reduce架构还没有数据划分建议器的研究。

1 混合架构上的划分建议器

1.1 划分建议器的提出

划分建议器是针对预期查询任务流对数据的划分提出建议, 将系统的总开销最小化。划分建议器需要满足下列需求, 以期达到查询优化的目标:

1) 针对预期任务量给出最佳分区方案, 即对于一定的查询负载, 查询的总代价最小, 体现在所需的总的查询时间最小化。

2) 给出的划分建议是对表是否进行结点全复制, 或表根据属性列划分提出建议方案, 将相似查询负载的代价最小化。

3) 将划分建议器集成到并行查询优化器底层, 使系统依据数据划分建议和数据的具体划分决定查询优化方案。

混合Map Reduce架构上的划分建议器[7], 实现了Map Reduce和数据库混合架构上数据划分方案的智能化求解, 提升了系统查询效率。

1.2 划分建议器的处理流程

划分建议器作为混合架构系统插件, 以数据集和查询负载的统计信息为输入, 为混合架构系统提供最佳划分方案, 混合架构系统依据具体情况, 按照最佳划分方案进行Join优化, 提高了查询效率。

划分建议器与混合架构系统整合后的处理流程, 如下图所示。图中, 1) 为用户的查询输人流, 即具体的查询负载;2) 代表混合架构系统传递给划分建议器的系统信息, 包括系统网络传输速率、数据库扫描速度、Map Reduce网络开销和系统查询计划等, 划分建议器根据这些信息修改代价评估函数的参数, 根据代价评估函数来搜索划分方案空间;3) 表示划分建议器向混合架构提出最佳划分方案, 查询优化器根据划分建议决定优化策略;4) 代表优化器按照划分建议生成最佳查询计划, 返回用户查询结果。

划分建议器包含三个关键组成部分:

1) 生成包含所有划分方案的搜索空间。

2) 高效的空间搜索算法。

3) 划分代价评估函数。

1.3 关系连接优化

针对元信息管理模块和查询优化器模块增加数据划分配置文件, 记录每张表的划分情况, 在Hy DB的查询优化器上增加表划分约束, 按照表划分情况决定具体的查询执行计划。划分建议器得到最佳划分方案后, 需把最佳划分方案用于系统的实际数据划分中, 使混合架构根据具体划分策略进行查询优化, 保持查询方案与划分建议一致。

2 划分方案搜索算法

2.1 基于优先级的划分方案空间生成策略

划分方案空间为指定数据集所有的划分方案集合。对于复杂的数据集, 采用多叉树的方法来枚举所有划分方案, 得到划分方案空间。每一个非叶结点对应一张关系表的一种划分方式, 叶结点对应最终划分方案。如图2所示用多叉树的方法来描述一个划分方案空间。

图2所示是一棵划分方案树。从根结点到叶结点的路径就是一个完整的数据划分方案。在遍历树的过程中, 计算每个结点的代价, 从中选取代价最小的结点。当整棵多叉树遍历完成, 从根结点到代价最小的叶子结点的完整路径即为最优划分方案。

划分建议器采用基于优先级的划分方案空问生成策略, 根据查询负载中对表关键列的请求次数建立优先级, 涉及到查询越多的关键列的优先级越高。在生成划分方案空间时, 按照关键列的优先级决定其在兄弟结点中的排名, 优先级越高, 其位置越靠前。划分建议器深度优先搜索解决方案时, 先搜到的叶结点就是最佳划分方案。

2.2 空间搜索算法

算法采用分支限界法来减少所搜索的空间大小。深度优先搜索生成树并计算cost代价, 当生成第一个最终cost结点时, 将该代价存放在intercost中。然后搜索其他子树, 若计算的cost大于该intercost, 则剪除该子树。若到达叶结点后costd小于intercost, 则更新intercost。算法中增加了过滤条件, 减少了搜索空间。

3 实验结果与分析

实验对遍历搜索 (traverse) 、带剪枝的搜索算法 (pruning) 和基于优先级的生成树上的剪枝搜索 (priorityand pruning) 三种搜索算法进行对比。

遍历搜索 (traverse) 为了得到最佳划分方案, 每次都将全部节点搜索一遍, 遍历搜索的比例为1, 运行时间与搜索空间的大小有关, 遍历搜索时间最长, 剪枝算法 (pruning) 为节省开支, 剪去了一定的分支节点, 故剪枝算法搜索比例和算法时间都要优于遍历搜索。基于优先级的剪枝搜索算法 (priorityand pruning) 在生成树的过程中对划分可能进行了优化, 多叉树中靠左边的结点效率通常好于右边的结点, 其搜索的结点数目随数据增长变化不大, 实际搜索空间比例反而变低, 运行时间较前两种算法要短很多。通过空间搜索算法实验, 验证了本文基于优先级的剪枝算法的搜索效率优于其他两种算法, 在时间和空间上节省了开销。

4 总结与展望

本文提出并实现了混合架构上划分建议器模型。根据混合架构的特点, 对不同划分方案进行代价评估, 选择查询负载下总体时间代价最小的划分方案, 减少了系统查询开销。依据划分建议器模型, 提出了划分方案搜索算法, 采用剪枝和基于优先级的生成树策略等优化技术, 大大提高了算法的搜索效率。另外, 对数据划分后如何使各个结点负载均衡, 对数据集提出索引建议等, 都是未来研究的方向。

参考文献

[1]Dean J, Ghemawat S.Map Reduce:simplied data processingon large clusters[J].Communications ofthe ACM, 2008, 51.

[2]Stonebraker M, Abadi D, De Witt D J, et a1.Map Reduce andparallel DBMSs:friends or foes?[J].Communications ofthe ACM, 2010

[3]孙广中, 肖锋, 熊曦.Map Roduce模型的调度及袢错机制研究[J].微电子学与汁算机, 2007.

[4]周敏.Map Reduce综述:硕士学位论文.广州:暨南大学2008.

[5]Dean J, Ghemawat S.Map Reduce:a flexible data processingtool[J].Communications ofthe ACM, 2010.

[6]覃左言, 朱青, 李伏.Hy DB:结合Map Reduce和并行数据库的混合Saa S架构[J].小型微型计算机系统, 2012, 3 (3) :5l2.518.

大数据时代传统媒体转型的思考 篇10

1推动传统媒体的产业转型

我国的传统媒体大多数是以平面媒体为主,如报纸、电台等,尽管电视媒体算是传统媒体中比较有优势的媒体形式,但与大数据时代兴起的网络媒体相比也并非不可替代,这种传统媒体的产业形式必须得到改变才能够促进产业转型。传统媒体的产业转型有几个主要方向,第一是从媒体经营转变为经营媒体,而经营媒体也是大数据时代大多数新媒体的主要产业形式。事实证明,这种转变是可行的,也是必要的;第二是从信息资源平台转变为信息资源整合。在大数据时代,信息资源数不胜数,即使是现在能够提供较多的数据信息的新媒体也无法成为完善的信息资源平台,传统媒体在这方面更加没有优势,许多信息都是大家已经了解的,因此也不能再将传统媒体当作信息资源的传播平台看待,而应该将其看作信息资源的整合平台,为民众在大数据信息中进行有效信息的整合,这样才能体现传统媒体的优势;第三是从媒体资源技术支撑到技术创新的转变,传统媒体所拥有的资源技术已经不再是媒体中的代表,尤其是在大数据时代,媒体需要更多地数据挖掘与分析相关的技术,传统媒体在这方面的技术情况是比较缺乏的,因此应该调整定位,加强技术创新。传统媒体应该更加明确自身在大数据时代的实际定位情况,及时进行产业转型,才能够发挥出传统媒体的优势。

2提高数据开放程度,展现数据价值

在大数据时代背景下,数据信息具有非常重要的价值,越重要的数据越能够为媒体提供竞争的砝码。但我国的数据新闻发展较为缓慢,许多数据信息往往不对外公开,只向民众传达数据分析结果,事实上,适当地提高数据的开放程度,能够增强信息的真实性,能够更好地体现数据的价值。传统媒体在这时应该充分发挥自己的优势,在转型过程中应该注意数据信息的价值,在媒体节目中提高数据的开放程度,当然,并不是将所有的数据公开,而是将一些重要的关键数据公开,这样可以提高媒体分析的真实性和可靠性。传统媒体企业应该增强自己在数据挖掘与分析方面的技术水平,将复杂的数据进行分析提炼,总结出关键的数据信息,展现数据价值。

3与新媒体进行产业融合

大数据时代催生出的新媒体尽管与传统媒体具有竞争关系,但是新媒体的产生和快速发展同样为传统媒体的转型提供了思路,传统媒体可以充分利用新媒体的一些优势,实现与新媒体的产业融合。例如,传统的一些媒体节目同样可以利用一些新媒体平台进行自己的宣传。目前,我国大部分传统媒体都在微博、微信等平台上拥有自身的官方账号,不同的电视台、不同的节目都可以利用新媒体来进行宣传,通过这样的形式可以利用网络资源进行数据共享,是传统媒体的一种有效创新。这种简单的利用虽然有效,但是也只是停留在表面上的融合,传统媒体与一些新媒体企业还可以进行更加深入的产业融合,如技术支持、经验交流学习等。传统媒体通过与新媒体进行产业融合,可以加快自身的转型过程,同时充分共享资源,达到共赢的效果,共同促进媒体产业在大数据时代的发展。

4结语

在大数据时代背景下,传统媒体面临着严峻的市场形势,具有较大的竞争压力,传统媒体要在这样的挑战中抓住发展机会,就必须进行转型。传统媒体应该认清自己的定位,充分发挥自己的优势,推动产业转型、提高数据开放程度、加强与新媒体的产业融合,通过有效的转型措施实现传统媒体的创新转变,促进我国传统媒体行业的快速发展。

参考文献

上一篇:美国与中国的生命教育下一篇:输变电工程