大数据技术

2024-06-18

大数据技术（精选8篇）

篇1：大数据技术

大数据关键技术

大数据技术，就是从各种类型的数据中快速获得有价值信息的技术。大数据领域已经涌现出了大量新的技术，它们成为大数据采集、存储、处理和呈现的有力武器。

大数据处理关键技术一般包括：大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用（大数据检索、大数据可视化、大数据应用、大数据安全等）。

一、大数据采集技术

数据是指通过RFID射频数据、传感器数据、社交网络交互数据及移动互联网数据等方式获得的各种类型的结构化、半结构化（或称之为弱结构化）及非结构化的海量数据，是大数据知识服务模型的根本。重点要突破分布式高速高可靠数据爬取或采集、高速数据全映像等大数据收集技术；突破高速数据解析、转换与装载等大数据整合技术；设计质量评估模型，开发数据质量技术。

大数据采集一般分为大数据智能感知层：主要包括数据传感体系、网络通信体系、传感适配体系、智能识别体系及软硬件资源接入系统，实现对结构化、半结构化、非结构化的海量数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管理等。必须着重攻克针对大数据源的智能识别、感知、适配、传输、接入等技术。基础支撑层：提供大数据服务平台所需的虚拟服务器，结构化、半结构化及非结构化数据的数据库及物联网络资源等基础支撑环境。重点攻克分布式虚拟存储技术，大数据获取、存储、组织、分析和决策操作的可视化接口技术，大数据的网络传输与压缩技术，大数据隐私保护技术等。

二、大数据预处理技术

主要完成对已接收数据的辨析、抽取、清洗等操作。1）抽取：因获取的数据可能具有多种结构和类型，数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型，以达到快速分析处理的目的。2）清洗：对于大数据，并不全是有价值的，有些数据并不是我们所关心的内容，而另一些数据则是完全错误的干扰项，因此要对数据通过过滤“去噪”从而提取出有效数据。

三、大数据存储及管理技术

大数据存储与管理要用存储器把采集到的数据存储起来，建立相应的数据库，并进行管理和调用。重点解决复杂结构化、半结构化和非结构化大数据管理与处理技术。主要解决大数据的可存储、可表示、可处理、可靠性及有效传输等几个关键问题。开发可靠的分布式文件系统（DFS）、能效优化的存储、计算融入存储、大数据的去冗余及高效低成本的大数据存储技术；突破分布式非关系型大数据管理与处理技术，异构数据的数据融合技术，数据组织技术，研究大数据建模技术；突破大数据索引技术；突破大数据移动、备份、复制等技术；开发大数据可视化技术。

开发新型数据库技术，数据库分为关系型数据库、非关系型数据库以及数据库缓存系统。其中，非关系型数据库主要指的是NoSQL数据库，分为：键值数据库、列存数据库、图存数据库以及文档数据库等类型。关系型数据库包含了传统关系数据库系统以及NewSQL数据库。

开发大数据安全技术。改进数据销毁、透明加解密、分布式访问控制、数据审计等技术；突破隐私保护和推理控制、数据真伪识别和取证、数据持有完整性验证等技术。

四、大数据分析及挖掘技术

大数据分析技术。改进已有数据挖掘和机器学习技术；开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术；突破基于对象的数据连接、相似性连接等大数据融合技术；突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘涉及的技术方法很多，有多种分类法。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等；根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web；根据挖掘方法分，可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中，可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中，可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中，可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法，另外还有面向属性的归纳方法。

从挖掘任务和挖掘方法的角度，着重突破：1.可视化分析。数据可视化无论对于普通用户或是数据分析专家，都是最基本的功能。数据图像化可以让数据自己说话，让用户直观的感受到结果。2.数据挖掘算法。图像化是将机器语言翻译给人看，而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据，挖掘价值。这些算法一定要能够应付大数据的量，同时还具有很高的处理速度。3.预测性分析。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。4.语义引擎。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。语言处理技术包括机器翻译、情感分析、舆情分析、智能输入、问答系统等。5.数据质量和数据管理。数据质量与管理是管理的最佳实践，透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。

六、大数据展现与应用技术

大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来，为人类的社会经济活动提供依据，从而提高各个领域的运行效率，大大提高整个社会经济的集约化程度。在我国，大数据将重点应用于以下三大领域：商业智能、政府决策、公共服务。例如：商业智能技术，政府决策技术，电信数据信息处理与挖掘技术，电网数据信息处理与挖掘技术，气象信息分析技术，环境监测技术，警务云应用系统（道路监控、视频监控、网络监控、智能交通、反电信诈骗、指挥调度等公安信息系统），大规模基因序列分析比对技术，Web信息挖掘技术，多媒体数据并行化处理技术，影视制作渲染技术，其他各种行业的云计算和海量数据处理应用技术等。

篇2：大数据技术

虽然眼下十分火热，然而“大数据”概念并没有明确的范畴，时大数据的定义只是相衬于当前可用的技术和资源而言的，因此，某一个企业或行业所认为的大数据，可能衬于另一个企业或行业就不再是大数据，时于大的电子商务企业，它们眼中的大数据要比小厂商眼里的大数据“大”得多;同时，大数据也会特续地演进，现在被我们认为庞大和恐饰的数据在10年之后只是小事一桩，但那时候将会有那个时代的新数据源。然而，面衬这些源源不断出现的“大数据”，哪些事情是希望从中发掘机会的企业需要注意的?

新数据源是核心

欧博思分析师认为大数据的三个“V”特征，即Volume(规模)，Variety(种类)，和Velocity(高速度)，这些只是大数据的第二位要素。大数据真正重要的“V”是Value(价值)。那么是什么带来了大数据的价值?

答案是新的数据源。

过去，获取网络浏览数据的技术门槛和成本都很高，而现在获取这些数据已经很容易，企业可以通过了解消费者浏览数据中展示的偏好以及未来购买倾向，来给他们推出最合适的折扣优惠。这都是新数据源的力量，这才是大数据的价值核心。

但在客户的沟通实践中，常常发现:大多数时候，人们都将精力投注在如何在“大数据”时代优化处理模型，或者升级技术装备以希求能提升分析的效果。

但是真正能提升分析效果的方式，是搜集并加入完全崭新的信息源。一旦新的、和从前不同的数据源出现并且能够被收集，你最好将自己的注意力转到这些新的数据上去一一比起你将精力放在模型优化上，新的数据源将能带来更大的收获。因此，在大数据时代，建议就是，将你的精力放到不断寻求祈的数据源上吧。如今很多企业都会有很多新的数据源，如果正确使用的话，它们会带给企业非常有竞争力的优势。

小步快跑式

对大数据的另一个误解是，“大数据其实就是一个技术问题”。

事实上90%以上的企业可以用他们90%的现有需求和技术、工具来解决现在的大数据问题。企业并不是缺乏解决这些大数据难题的工具、技术甚至人才，他们真正面临的问题是，如何在公司建立一个和大数据相匹配的文化与流程，是缺乏对技术做投资的公司文化，他们的挑战是做出一个商业案例来证明技术升级是有价值的。

为了促进公司文化的转变，更建议一种“小步快跑”的运作方式，即在处理新数据源的过程中，企业内部的分析专家们应该积极寻找代价小、见效快的方法，不断向企业展示一些有价值的东西，来让人们保持对新数据源处理过程的兴趣。一个跨部门的大数据团队一定不能在组建一年之后，还对外宣称他们“正在试图搞明白”，要不时地迸发出想法，不管这一想法多么微小，然后迅速采取行动。

另外一个建议是，建立类似“创新中心”这样的地方，就是公司内部拿出少量的预算、人力资源、技术资源来做一些有一定未知风险的小实验，以小预算做试点，便于企业快速出击。

篇3：基于大数据的智能数据分析技术

当前世界依然迎来了大数据时代,随着多媒体等多种技术的应用,社会中的相关领域时刻都涌现大量的数据,增加了技术处理以及分析的难度。通常情况下大数据具有复杂性,而且还具有数量大、分布式的特点,这样就必须要采取新的技术方法对数据进行处理,因此智能分析技术在数据的处理中具有非常重要的意义。

二、几种常见的智能数据分析法

虽然在大数据时代传统的智能数据分析法已经不能适应当前的需求,但是依然有一定的相似性,相关理论和技术依然可以沿用,几种常见数据分析法:第一种方法是决策树。这种数据分析方法需要基于信息论基础上,这种方法实现的输出结果容易理解,精确度较高,效率也较快,但是它不能用来对复杂的数据进行处理与分析[1]。第二种方法是关联规则。这种方法主要是用于事物数据库中,通常带有大量的数据,当今使用这种方法来削减搜索空间。第三种方法是粗糙集。这种数据分析方法能够对数据进行主观评价,只要通过观测数据,就可以清除冗余的信息。第四种方法是模糊数学分析。这种数据分析方法能够对实际问题进行模糊的分析,与其他的分析方法相比,能够取得更为客观的效果。第五种方法是人工神经网络。这种数据分析方法具有自学习功能,在此基础上还具有联想存储的功能。第六种方法是混沌和分形理论。这两种理论主要是用来对自然社会中存在的现象进行解释,一般用来进行智能认知研究,还能应用于自动控制等众多领域中[2]。第七种方法是自然计算分析方法。这种数据分析方法根据不同生物层面的模拟与仿真,通常可以分为以下三种不同类型的分析方法:一是群体智能算法,二是免疫算法,三是DNA算法。群体智能主要是对集体行为进行研究,免疫算法具有多样性,经典的主要有反向、克隆选择等,而DNA算法主要使属于随机化搜索方法,它可以进行全局寻优,在实际的运用中一般都能获取优化的搜索空间,在此基础上还能自动调整搜索方向,在整个过程中都不需要确定的规则。当前DNA算法普遍应用于多种行业中,并取得了不错的成效。

三、大数据背景下的智能数据分析技术

大数据具有一定的复杂性,只有通过使用新的智能分析技术才能对数据进行有效处理。目前已经有专家针对大数据提出了新的智能分析技术方案,例如HAVEn、Teradata Aster分析平台,经过研究发现推出的一系列分析方案,基本上离不开Hadoop分析平台。Hadoop主要分为以下两大部分,其中一个部分是分布文件系统,专家称之为HDFS,另一部分是分布计算系统,专家称之为Map Reduce。一般来说HDFS主要是表现为主/从结构,其中主结构称为名字节点,主要功能是管理元数据,从结构通常称为数据节点。主要功能是用来存放,或者管理相关的应用数据[3]。一个HDFS系统能够支持的数据非常庞大,一般能够达到10PB数量级,因此HDFS系统能够应用于大数据处理分析中。同时为了能够更好的支持大数据,在HDFS系统的基础上,还继续构建Hbase系统,该系统的接口语言色设为Pig。并且还构建了Hivi系统,该系统主要是属于数据仓库。此外还构建了机器学习软件包,称为Mahout,这样就可以对大数据进行有效管理以及分析。这些新的智能数据分析融合了多种传统的技术,能够对大数据进行更为全面、高效的分析。

四、结语

传统中可应用的数据智能分析技术多种多样,常用的主要有七种方法,每一种方法都有自身的优势以及局限性,如果在大数据中单一使用一种方法,根本就不能达到理想的效果。但是凭借当前的技术水平还不能找到通用的智能分析技术方法,这就需要将传统的多种方法结合起来,这样就可以弥补各自的缺陷,而且还能充分发挥优势,这是当前大数据智能分析技术的重要研究方向。沿着这个方向,目前已经开发了hadoop,这个系统不仅集合了传统的方法,而且还结合了新型平台,是一种全新的技术,未来需要专家不断的进行探索与研究,继续开发更好的数据智能分析方法。

摘要：由于多媒体等多种技术的发展与应用,各领域都发生了很大的变化,每天不仅产生大量的数据,而且数据更新换代的速度极快。人们在处理以及分析数据的过程中,继续使用传统的智能数据分析技术已经难以实现理想的效果,专家开始意识到必须尽快开发新的技术。这就需要了解典型理论和技术,掌握不同种方法的特点,这样才能有效的避免各自的劣势,充分发挥优势达到互补的作用。本文在分析不同种传统数据智能分析方法的基础上,分析了结合新平台开发的新型分析方法。

关键词：大数据,智能数据,技术分析

参考文献

[1]杨舒林.智能分析技术发展现状及应用[J].中国公共安全.2015,08(14):207-209.

[2]顾君忠.大数据与大数据分析[J].软件产业与工程,2013(4):117-121.

篇4：大数据技术与档案数据挖掘

关键词：大数据技术；数据挖掘；档案管理

伴随着大数据时代的到来，数据挖掘技术在档案管理中的应用将进入一个新的发展时期。尽管档案学术界很早就提出知识管理与知识挖掘，但知识挖掘尚停留在概念和理论探讨阶段[1]。大数据挖掘，即从大数据中挖掘知识，大数据挖掘技术有效地解决了数据和知识之间的鸿沟，是将数据转变成知识的有效方式[2]。因此，有档案学研究者认为“档案馆的传统业务将向档案资源的数据分析、数据挖掘方向转移，对大量数据的分析处理将成为档案馆的主要业务”[3]，“档案信息服务的底层基础可能不再是检索，而是智能化的数据挖掘”[4]。

大数据时代给数据挖掘技术带来的根本性改变是使数据的深度挖掘成为可能，对大量数据进行分析处理和智能化挖掘，从管理角度来看，要达到最优的结果，不仅数据要全面、可靠、有价值，而且需要对数据进行深度挖掘。

1 数据深度挖掘是大数据技术应用于档案管理中的主要特点

数据挖掘技术是通过对海量数据进行建模，并通过数理模型对企业的海量数据进行整理与分析，以帮助企业了解其不同的客户或不同的市场划分的一种从海量数据中找出企业所需知识的技术方法[5]。数据深度挖掘，是一个对数据进行建模的过程，并对数据进行分类与统计，查找得出数据分布的关联性，这也是探索规律的过程。

如，档案人员想要做好档案编研选题，不仅要对用户利用档案数据，包括档案调卷数量、档案利用次数、复制档案数量、制发档案证明数量等进行深度挖掘，而且还需要对用户访问记录，包括网页采用的关键字、下载记录、检索词、用户利用网页时间和频度等信息进行深度挖掘，然后利用分类功能及数据分析，建立档案编研选题的用户模型，一是按需确定不同类型的编研选题，提供个性化的服务；二是根据档案用户需求特点，预测其未来趋向，结合社会热点选定档案编研题目，从而使档案编研部门推出用户满意的编研成果。在档案利用方面，对档案利用登记数据库进行深度挖掘，分别选取不同方面数据进行建模，可以得出不同档案利用形式的变化趋势，从而对档案利用趋势进行分析和预测，对利用频率高的档案进行全文数字化，既可以提高档案利用效率，又可以起到保护档案原件的作用。

因此，档案数据的深度挖掘是大数据时代的主要特点，档案学的发展历程告诉我们，每一次重大的技术变革都必然影响着档案学的发展，如计算机和网络技术的引入，引起了档案管理理念与实践的变革，改变了文件与档案的处理流程[5]。大数据技术对档案数据的深度挖掘为档案管理流程由粗放走向精细化提供了可能。

2 大数据技术对档案数据深度挖掘使档案管理模式走向精细化

大数据挖掘技术基于传统的数据挖掘，使用的是数据仓库，构造的是“泛关系”的聚分类模型，采取的是海量数据分析方法，机器与人类一样具备语义知识，提供的是可视化视图来揭示信息，可以说是传统数据挖掘方法的深化。由中国人民大学网络与移动数据管理实验室开发ScholarSpace，大数据处理的最基本流程由数据来源、数据抽取与集成、数据分析、数据解释等过程组成[6]，分析认为大数据技术对档案数据挖掘由数据采集层、数据整理层、数据分析层、数据展示层组成。

2.1 数据采集层收集高质量的档案数据，为档案管理精细化奠定基础。数据采集是大数据技术处理流程中最为基础的一步，高质量的数据是大数据技术发挥效能的前提，大数据技术只有在高质量的大数据环境下才能提取出隐含的、有用的信息。由于大数据具有实时与动态性特征，“在线”、“近线”和“离线”的各种数字资源均是采集对象。为了使所获得的数据更具有代表性，通过什么方式获取数据信息显得格外重要。数据采集层要收集不同数据源产生的数据，为档案数据挖掘的后续工作做好准备。

2.2 数据整理层改变传统数据处理方式，凸显档案管理精细化过程。经过各种渠道获取的档案数据种类繁杂、结构多样，通过处理、集成、存储可以做到：

一是将结构复杂的数据转换为单一的或便于处理结构的数据。现代互联网应用呈现出半结构化和非结构化数据大幅度增长的趋势，这些资源将成为馆藏的重要来源。如，对档案系统运行日志资料等数据，就需要转换成结构化数据，形成档案统一的语言。二是对采集到的数据进行“去噪”和“清洗”，以保证数据的质量和可靠性。由于原始数据中有噪声数据、冗余数据等问题，对数据进行解析、清洗、重构，以提高待挖掘数据的质量。三是对整理好的数据进行存储，建立专门的数据库分门别类地放置，减少数据查询和访问的时间，提高数据提取速度。

2.3 数据分析层对档案数据的精细分析，凸显档案管理精细化的思维模式。数据分析是整个大数据处理流程最为核心的部分。“相关性”分析是大数据技术重要的思维模式，通过对数据彼此关联性的分析，能够更清楚地看到隐藏在背后的看似不相关的数据之间彼此的密切联系，使档案数据挖掘从常规分析向广度、深度分析转变。

“相关性”分析可激活数字档案资源，大数据技术的核心作用就是挖掘出庞大的数据仓库独有的价值，不管是网络实时运算的“热数据”，还是非在线的“冷数据”，通过对档案数据的综合挖掘、深度整合和数据分析，激活休眠状态的档案资源，展现数据价值，创造出新知识、新价值。“相关性”分析能有效破除信息孤岛的数据壁垒，使各个孤立的、互不联通的数据库之间资源实现充分共享。

2.4 数据展示层为档案用户提供更加精准服务，凸显档案管理精细化“以人为本”的价值追求。对档案用户来说，最关心的不是数据分析处理过程，而是对大数据分析结果的解释与展示。若数据分析的结果不能得到精准的展示，会对档案用户产生困扰，甚至会误导用户。通过档案管理信息系统，将深度挖掘的数据可视化，可以使用户清楚地看到未来发展的方向，从而对决策结果作出评价，这也是决定整个系统挖掘技术是否成功的标准。

3 大数据技术对档案数据深度挖掘，将档案管理精细化发挥到极致

大数据技术在档案管理中的应用从两个方向进行描述：从横向上看，以大数据挖掘技术为中心沿数据收集、整理、分析到展示等技术解决方案；从纵向上看，以数据产品为中心沿档案资源挖掘、用户数据挖掘及关系洞察及趋势预测逐级递进。大数据技术对档案数据深度挖掘使档案资源与用户需求的双向控制达到最优化，凸显管理精细化趋势。

3.1 档案资源挖掘。由于缺乏综合数据挖掘和深度整合，档案资源存在着重藏轻用深度挖掘不够的问题，因此，通过对档案资源数据的深度挖掘，展现数据价值，创造出新价值。

首先，大数据时代树立“大档案”工作思路，重视数据积累，不仅要建立档案资源体系，还要建立数据资源体系观。其次，建立共享档案数据资源库。以省级为单位，建立集中的、规范的、可供共享的档案数据资源库，使各档案馆藏之间相互关联，成为一个内容丰富且不拘泥于实体存储的，信息互联共享的档案数据资源网。最后，利用云计算平台和处理技术构建档案数据资源网，可以用于实时性档案数据的接收，也可以对非实时性数据进行分类处理，使其成为档案用户提供服务的平台。

3.2 用户数据挖掘。通过对用户数据挖掘做到精确洞察，精准服务，提升档案用户认同感，实现档案服务价值。用户数据挖掘包括以下方面：

一是对用户信息进行数据挖掘。提取用户的信息需求，查看用户访问服务器时留下的日志文件，跟踪用户行为，推测用户兴趣，提供个性化利用服务。二是对用户统计检索和浏览记录进行挖掘。如，利用统计分析的方法，通过分析用户对档案目录的点击率，选取点击率高的档案进行数字化；通过分析用户检索时使用的档案检索词，充实和完善数据仓库中的检索关键词，以提高查准率；通过统计分析用户对网页的访问频率，进而开展深层次的信息服务。

3.3 关系洞察及趋势分析。无论是档案资源和用户数据，通过挖掘得到的仅是某一方面的数据，这些数据往往是孤立的数据点，因此，要使这些数据集成为一个完整的网络，必须对数据网络后面的数据关系进行深入分析。如，单单对档案收集情况进行挖掘，得到的仅仅是档案人员与档案之间的关系，对档案利用情况进行挖掘，得到的仅仅是档案与用户之间的数据关系。然而，要想精准洞察档案之间、用户之间及档案与用户之间关系，必须将以上各个孤立的数据点进行整合，得到一个完整的档案网络，才能使档案发展、社会服务等趋势的预测成为可能。

4 积极探索综合性的对策促进档案数据深度挖掘的实现

在融合数据，精细分析后，我们应通过综合性的策略保证大数据技术在档案数据挖掘中的应用落到实处，保障大数据技术在档案管理应用中的有效实现与良性循环。

4.1 建立以大数据技术为核心的数据资源体系，使档案数据挖掘具有时代特色。构建一个“以数字资源为主体，以文本、图片、音频、视频等为形式，为中华民族集体记忆的建构和传承提供文献支撑的‘中国记忆数字资源库”[7]，是时代赋予我们的目标与使命。

首先，扩大数据总量，构建现代化的档案资源体系，加强实体资源的建设，完善档案门类，优化馆藏结构。其次，加强数字资源建设，按照“存量数据化，增量电子化”战略，组建数字化档案资源库，加强电子文件的收集归档。最后，积极开放数据，整合数据资源，增强知识挖掘，实现数据增值。大数据技术为档案管理的深度挖掘提供了数据管理方面的保障，而对数据的深度挖掘使档案馆的功能扩展到发现与预测。

4.2 构建以人为本的用户关系管理，使得档案数据内在关联得以深度挖掘。大数据时代最大转变是放弃对因果关系的渴求，取而代之关注相互关系，只要知道“是什么”，而不需要知道“为什么”[8]，这一转变将使我们以新的视角去理解档案用户数据挖掘。

利用大数据技术可以掌握用户此前的行为、正在进行的实时行为，还可以对用户未来行为进行预测分析，深度挖掘数据内在关联，促进资源集成创新，实现档案数据资源的增值服务。借助大数据技术，对用户搜索方式、行为轨迹、使用习惯、利用兴趣、存储行为等数据进行分析，有效发现用户隐性诉求。如，针对不同用户，产生动态推荐超级链接列表。建立以用户名为单位的个性化数据库，把用户想要的东西、挖掘分析结果放入。

4.3 在挖掘数据同时保护数据隐私安全，为档案数据深度挖掘提供良好的环境保证。大数据时代的隐私保护面临着技术和人力层面的双重考验，如果将这些数据合理利用，将为档案预测决策提供必要的情报信息。如何在保护隐私的前提下对档案数据进行有效的挖掘，我们应做到：一是健全法律规范对个人的隐私权利给予保护，建立健全数据安全管理规划体系，避免因个人隐私数据被随意挖掘滥用而造成影响社会稳定的事件发生。二是使用保护数据隐私的数据挖掘方法，合理界定哪些信息是属于私人信息，在保护私人信息安全的情况下进行数据挖掘。

4.4 借力“智慧因子”完善大数据技术在档案数据挖掘中的应用。随着“智慧城市”的提出，智慧的概念涉及各个领域，智慧档案馆也应运而生，智慧档案馆的核心理念是智慧服务，在大数据技术中植入智慧因子，依托物联网技术将馆舍、档案、网络、数据以及用户统一在智能网络中，达到有效整合和深度挖掘，深层次推动档案服务智慧化。大数据技术不仅将档案资源、用户数据、关系洞察及趋势分析产生的各种数据资源进行汇聚融合，而且利用智慧服务理念创新开发个性化的服务手段，使得档案知识的隐性知识显性化，为用户提供精细化的服务体验，推进档案信息资源智慧服务和知识空间的构建。

5 结论

大数据时代，大档案、大服务、智慧档案等成为档案工作的新发展，随着档案管理创新的深入推进，大数据技术将真正落实到档案管理各个环节，数据挖掘技术将更加娴熟地在档案管理中得到运用。通过本文分析我们得出以下结论：

（1）档案数据的深度挖掘是大数据时代数据挖掘技术在档案管理应用中最主要特点，促进档案管理模式发生改变。因此，在开展档案管理流程研究时，应当立足于这一点，从而达到整体的最优化。

（2）大数据技术对档案数据的深度挖掘历经不同过程环节，我们应当在厘清各环节的基础上，采取有效措施促进整个过程的有效运行，实现整个过程的良性循环与互动。

（3）大数据技术对档案数据挖掘的实现除了依赖大档案数据资源作为基础外，还需要有“以人为本”的用户关系管理、智慧服务理念、规范化的数据安全管理环境等，因此，档案部门应当加强与各部门之间的协同合作，实现大数据技术在档案管理中的应用。

参考文献：

[1] 于英香.档案大数据研究热的冷思考[J].档案学通讯，2015（2）：5.

[2] 王雅洁等.大数据挖掘在食品安全预警领域的应用[J].安徽农业科学，2015（8）：332.

[3] 周枫.资源技术思维——大数据时代档案馆的三维诠释[J].档案学研究，2013（6）：63～64.

[4] 张芳霖，唐霜.大数据影响下档案学发展趋势的思考[J].北京档案，2014（9）：12.

[5] 曹莉.刍议大数据时代的数据挖掘与精细管理[J].经营管理者，2013（18）：191～192.

[6] 孟小峰，慈祥.大数据管理：概念、技术与挑战[J].计算机研究与发展，2013（1）：150～151.

[7] 冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯，2012（3）：6.

篇5：大数据时代下数据挖掘技术的应用

关键词：大数据数据挖掘挖掘技术

中图分类号：tp311 文献标识码：a 文章编号：1007-9416（2016）05-0000-00

1数据挖掘与数据挖掘技术的方法分析

“数据海量、信息缺乏”是相当多企业在数据大集中之后面临的尴尬问题，由此而诞生的数据挖掘技术其实就是用以处理这一尴尬问题的技术。数据挖掘实际上是相对比较新型的一门学科，在几十年的发展过程中，已经不可同日而语。其实数据挖掘技术的本质就是人工智能技术，而数据挖掘技术的利用相对应的就是指人工智能技术的开发与应用，也就是说数据挖掘其实是依赖技术的提升来实现数据的整体创新的技术，所以，整个数据挖掘技术实际上是非常具有信息价值的，它能够帮助决策者更快的得到重要信息并作出决策，提高效率和准确率，是非常重要的知识凭证，能够在一定程度上提高当下企业的整体竞争力。

数据挖掘技术的核心就是分析，通过分析方法的不同来解决不同类别的问题，以实现数据挖掘的潜在内容。简单来说就是对症下药以保证药到病除。

1.1聚类分析法

简单来说聚类分析就是通过将数据对象进行聚类分组，然后形成板块，将毫无逻辑的数据变成了有联系性的分组数据，然后从其中获取具有一定价值的数据内容进行进一步的利用。由于这种分析方法不能够较好的就数据类别、属性进行分类，所以聚类分析法一般都运用在心理学、统计学、数据识别等方面。

1.2人工神经网络

人工神经网络是通过大批量的数据进行分析，而这种数据分析方式本身是建立在一定的数据模型基础上的，因此通常都可以随时根据数据需求进行分类，所以人工神经网络也是当下数据挖掘技术中最常用的一种数据分析方式之一。

1.3关联性分析法

有时数据本身存在一定的隐蔽性使得很难通过普通的数据分析法进行数据挖掘和利用，这就需要通过关联性分析法完成对于数据信息的关联性识别，来帮助人力完成对于数据分辨的任务，这种数据分析方法通常是带着某种目的性进行的，因此比较适用于对数据精准度相对较高的信息管理工作。

1.4特征性数据分析法

网络数据随着信息时代的到来变成了数据爆炸式，其数据资源十分广泛并且得到了一定的普及，如何就网络爆炸式数据进行关于特性的分类就成为了当下数据整理分类的主要内容。在上文中提到的人工神经网络数据分析也属于这其中的一种，此外还有很多方法都是通过计算机来进行虚拟数据的分类，寻找数据之间存在的普遍规律性完成数据的特性分析从而进行进一步分类。

2大数据时代下数据挖掘技术的具体应用

数据挖掘技术的具体流程就是先通过对于海量数据的保存，然后就已有数据中进行分析、整理、选择、转换等，数据的准备工作是数据挖掘技术的前提，也是决定数据挖掘技术效率及质量的主要因素。在完成数据准备工作后进一步对数据进行挖掘，然后对数据进行评估，最后实现运用。因此，数据挖掘能够运用到很多方面。

2.1市场营销领域

市场营销其实就是数据挖掘技术最早运用的领域，通常根据客户的具体需求，进行客户分析，将不同的消费习惯和消费特点的客户进行简单的分类管理，以此来保证商品能够顺利销售，并提高个人销售的成功率和业绩。而销售的范围也从最初的超市购物扩展到了包括保险、银行、电信等各个方面。

2.2科学研究领域

科学研究与实验测试等都需要对数据进行关系分析为进一步的实验和总结失败做准备，而实验测试和科学研究产生的数据往往是巨大的，因此数据挖掘技术在科学研究领域也得以广泛运用。通常都是通过科学研究内容选择数据挖掘技术分析法进行计算来找到数据中存在的规律，实现数据挖掘的部分价值――科学知识的分析与运用。

2.3电信业领域

随着信息化时代的到来，电信产业也飞速发展起来，到目前为止，电信产业已经形成了一个巨大的网络信息载体，如何将其中信息数据进行整合就成为电信产业发展过程中的重要问题。而数据挖掘技术的运用则在一定程度上解决了这一问题，大量的数据通过数据挖掘技术得到了有效分类，并在这个过程中通过运算得出数据之间的关联性，运用规律进一步进行数据分类。

2.4教育教学领域

教学评价、教学资源、学生个人基本信息等组成了教育教学领域的数据库，利用数据挖掘技术来实现教学资源的优化配置，对学生的个人信息整理归档，从而保证教育教学领域中数据整理的良好运作。

3结语

篇6：大数据技术

在数据挖掘教学过程中，其流程主要是以下几点：首先做好数据准备工作，主要是在挖掘数据之前，就引导学生对目标数据进行准确的定位，在寻找和挖掘数据之前，必须知道所需数据类型，才能避免数据挖掘的盲目性。在数据准备时，应根据系统的提示进行操作，在数据库中输入检索条件和目标，对数据信息资源进行分类和清理，以及编辑和预处理。其次是在数据挖掘过程中，由于目标数据信息已经被预处理，所以就需要在挖掘处理过程中将其高效正确的应用到管理机制之中，因而数据挖掘的过程十分重要，所以必须加强对其的处理。例如在数据挖掘中，引导学生结合数据挖掘目标要求，针对性的选取科学而又合适的计算和分析方法，对数据信息特征与应用价值等进行寻找和归纳。当然，也可以结合程序应用的需要，对数据区域进行固定，并在固定的数据区域内分类的挖掘数据，从而得到更具深度和内涵以及价值的数据信息资源，并就挖掘到的数据结果进行分析和解释，从结果中将具有使用价值和意义的规律进行提取，并还原成便于理解的数据语言。最后是切实加强管理和计算等专业知识的应用，将数据挖掘技术实施中进行的总结和提取所获得的数据信息与评估结果在现实之中应用，从而对某个思想、决策是否正确和科学进行判断，最终体现出数据挖掘及时的应用价值，在激发学生学习兴趣的同时促进教学成效的提升。

2.2挖掘后的数据信息资源分析

数据信息资源在挖掘后，其自身的职能作用将变得更加丰富，所以在信息技术环节下的数据挖掘技术随着限定条件的变化，而将数据挖掘信息应用于技术管理和决策管理之中，从而更好地彰显数据在经济活动中的物质性质与价值变化趋势，并结合数据变化特点和具体的表现规律，从而将数据信息的基本要素、质量特点、管理要求等展示出来，所以其表现的形式十分丰富。因而在数据挖掘之后的信息在职能范围和表现形式方式均得到了丰富和拓展，而这也在一定程度上体现了网络拟定目标服务具有较强的完整性，且属于特殊的个体物品，同时也是对传统数据挖掘技术的创新和发展，从而更好地满足当前大数据时代对信息进行数据化的处理，并对不同种类业务进行整合和优化，从而促进数据挖掘技术服务的一体化水平。

2.3大数据背景下的数据挖掘技术的应用必须注重信息失真的控制

数据挖掘技术的信息主要是源于大数据和社会，所以在当前数据挖掘技术需求不断加大的今天，为了更好地促进所挖掘数据信息的真实性，促进其个性化职能的发挥，必须在大数据背景下注重信息失真的控制，切实做好数据挖掘技术管理的各项工作。这就需要引导学生考虑如何确保数据挖掘技术在大数据背景下的职能得到有效的发挥，尽可能地促进数据挖掘技术信息资源的升级和转型，以大数据背景为载体，促进整个业务和技术操作流程的一体化，从而更好地将所有数据资源的消耗和变化以及管理的科学性和有效性，这样我们就能及时的找到资源的消耗源头，从而更好地对数据资源的消耗效益进行评价，最终促进业务流程的优化，并结合大数据背景对数据挖掘技术的职能进行拓展，促进其外部信息与内部信息的合作，对数据挖掘技术信息的职能进行有效的控制，才能更好地促进信息失真的控制[2]。

3数据挖掘技术在不同行业中的应用实践

学习的最终目的是为了更好的.应用，随着时代的发展，数据挖掘技术将在越来越多的行业中得以应用。这就需要高校教师引导学生结合实际需要强化对其的应用。例如在市场营销行业中数据挖掘技术的应用这主要是因为数据挖掘能有效的解析消费者的消费行为和消费习惯，从而利用其将销售方式改进和优化，最终促进产品销量的提升。与此同时，通过对购物消费行为的分析，掌握客户的忠诚度和消费意识等，从而针对性的改变营销策略，同时还能找到更多潜在的客户。再如在制造业中数据挖掘技术的应用，其目的就在于对产品质量进行检验。引导学生深入某企业实际，对所制造产品的数据进行研究，从而找出其存在的规则，并对其生产流程进行分析之后，对其生产的过程进行分析，从而更好地对生产质量的影响因素进行分析，并促进其效率的提升。换言之，主要就是对各种生产数据进行筛选，从而得出有用的数据和知识，再采取决策树算法进行统计决策，并从中选取正确决策，从而更好地对产品在市场中的流行程度，决定生产和转型的方向。再如在教育行业中数据挖掘技术的应用，主要是为了更好地对学习情况、教学评估和心里动向等数据进行分类和筛选，从而为学校的教学改革提供参考和支持。比如为了更好地对教学质量进行评估，就需要对教学质量有关项目进行整合与存储，从而更好地促进其对教学质量的评估，而这一过程中，就需要采取数据挖掘技术对有关教学项目中的数据进行挖掘和处理，促进其应用成效的提升[3]。

4结语

综上所述，在大数据背景下，数据挖掘技术已经在各行各业中得到了广泛的应用，所以为了更好地满足应用的需要，在实际教学工作中，我们必须引导学生切实加强对其特点的分析，并结合实际需要，切实注重数据挖掘技术的应用，才能促进其应用成效的提升，最终达到学以致用的目的。

参考文献：

[1]李平荣.大数据时代的数据挖掘技术与应用[J].重庆三峡学院学报,,03:45-47.

[2]欧阳柏成.大数据时代的数据挖掘技术探究[J].电脑知识与技术,,15:3-4+9.

篇7：大数据开发运用的常用技术

大数据开发运用的常用技术

大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段，处理的数据量通常是TB级，甚至是PB或EB级的数据，这是传统数据处理手段所无法完成的，其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等，汇集了当前IT领域热门流行的IT技术。

想要学好大数据需掌握以下技术： 1.Java编程技术

Java编程技术是大数据学习的基础，Java是一种强类型语言，拥有极高的跨平台能力，可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等，是大数据工程师最喜欢的编程工具，因此，想学好大数据，掌握Java基础是必不可少的！

2.Linux命令

对于大数据开发通常是在Linux环境下进行的，相比Linux操作系统，Windows操作系统是封闭的操作系统，开源的大数据软件很受限制，因此，想从事大数据开发相关工作，还需掌握Linux基础操作命令。

3.Hadoop Hadoop是大数据开发的重要框架，其核心是HDFS和MapReduce，HDFS为海量的数据提供了存储，MapReduce为海量的数据提供了计算，因此，需要重点掌握，除此之外，还需要掌握Hadoop集群、Hadoop集群管理、YARN以及Hadoop高级管理等相关技术与操作！

4.Hive 老男孩IT教育，只培养技术精英

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行，十分适合数据仓库的统计分析。对于Hive需掌握其安装、应用及高级操作等。

5.Avro与Protobuf Avro与Protobuf均是数据序列化系统，可以提供丰富的数据结构类型，十分适合做数据存储，还可进行不同语言之间相互通信的数据交换格式，学习大数据，需掌握其具体用法。

6.ZooKeeper ZooKeeper是Hadoop和Hbase的重要组件，是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组件服务等，在大数据开发中要掌握ZooKeeper的常用命令及功能的实现方法。

7.HBase HBase是一个分布式的、面向列的开源数据库，它不同于一般的关系数据库，更适合于非结构化数据存储的数据库，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，大数据开发需掌握HBase基础知识、应用、架构以及高级用法等。

8.phoenix phoenix是用Java编写的基于JDBC API操作HBase的开源SQL引擎，其具有动态列、散列加载、查询服务器、追踪、事务、用户自定义函数、二级索引、命名空间映射、数据收集、行时间戳列、分页查询、跳跃查询、视图以及多租户的特性，大数据开发需掌握其原理和使用方法。老男孩IT教育，只培养技术精英

9.Redis Redis是一个key-value存储系统，其出现很大程度补偿了memcached这类key/value存储的不足，在部分场合可以对关系数据库起到很好的补充作用，它提供了Java，C/C++，C#，PHP，JavaScript，Perl，Object-C，Python，Ruby，Erlang等客户端，使用很方便，大数据开发需掌握Redis的安装、配置及相关使用方法。

10.Flume Flume是一款高可用、高可靠、分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。大数据开发需掌握其安装、配置以及相关使用方法。

11.SSM SSM框架是由Spring、SpringMVC、MyBatis三个开源框架整合而成，常作为数据源较简单的web项目的框架。大数据开发需分别掌握Spring、SpringMVC、MyBatis三种框架的同时，再使用SSM进行整合操作。

12.Kafka Kafka是一种高吞吐量的分布式发布订阅消息系统，其在大数据开发应用上的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理，也是为了通过集群来提供实时的消息。大数据开发需掌握Kafka架构原理及各组件的作用和使用方法及相关功能的实现！

13.Scala Scala是一门多范式的编程语言，大数据开发重要框架Spark是采用Scala 老男孩IT教育，只培养技术精英

语言设计的，想要学好Spark框架，拥有Scala基础是必不可少的，因此，大数据开发需掌握Scala编程基础知识！

14.Spark Spark是专为大规模数据处理而设计的快速通用的计算引擎，其提供了一个全面、统一的框架用于管理各种不同性质的数据集和数据源的大数据处理的需求，大数据开发需掌握Spark基础、SparkJob、Spark RDD、spark job部署与资源分配、Spark shuffle、Spark内存管理、Spark广播变量、Spark SQL、Spark Streaming以及Spark ML等相关知识。

15.Azkaban Azkaban是一个批量工作流任务调度器，可用于在一个工作流内以一个特定的顺序运行一组工作和流程，可以利用Azkaban来完成大数据的任务调度，大数据开发需掌握Azkaban的相关配置及语法规则。

16.Python与数据分析

Python是面向对象的编程语言，拥有丰富的库，使用简单，应用广泛，在大数据领域也有所应用，主要可用于数据采集、数据分析以及数据可视化等，因此，大数据开发需学习一定的Python知识。

篇8：大数据时代的数据挖掘技术与应用

1相关概念的简介

1.1大数据的概念

关于大数据的理念提出, 可以追溯到麦肯锡研究院于2011年发布的《大数据:创新、竞争和生产力的下一个新领域》, 其中阐述的观念就涵盖数据方面, 即数据已经融入到了人们的日常生活中, 也是生产运作的一个重要因素。而大数据的运用, 对于消费以及生产水平都是一种有效的提升提升, 根据美国曾经发布的《大数据研究和发展倡议》资料, 截至2011年一年, 全球总的数据就增加了1.8ZB, 而进行人均计算, 相当于每个人都具有至少200GB的数据资源, 而且这一数据还在呈现出日益增长的趋势, 根据统计计算, 这一数值将会按照约为50%/年的速度增长。

1.2数据挖掘

作为一个新型学科, 数据挖掘技术源于20世纪的80年代, 那时其效用与目前存在本质差异, 科学家最初研究大数据, 主要是用于一些人工智能技术的开发。简而言之, 技术层面上, 数据挖掘就是一个对数据进行发掘创新的过程, 即要求目标数据具有隐蔽性、挖掘价值以及挖掘潜力, 而且需要操作者在一堆冗杂的、随机的、模糊的数据库中进行挖掘;而对于商业层面上来说, 数据挖掘就是在一些大量的数据信息中获得规律以及价值信息, 从而为决策提供重要的知识凭据。

2数据挖掘的研究手段

对于数据挖掘而言, 不同的研究手段将是其开展的重要基础, 而研究手段的决定, 主要需要依靠科学的计算为依据, 分析和对比数据中存在的一些不为人知的规则, 然后通过研究手段的改变去应付不同的问题, 对于实际操作来说, 就是针对不同的数据找出不同的解决方法, 而常见数据挖掘的研究手段主要可以分为四类, 即聚类研究、分类和预测以及关联研究。

2.1聚类研究

将抽选的数据或者对象的库进行类似“分类”的聚类划分, 然后再将其中的相同或者相近的数据划分为一个组类, 由此建立起多个组类开展研究的过程。整个过程突出的是一种无知识基础、无监督管控的学习过程。而整个过程由于分类研究有本质的差异, 因为聚类研究在事先根本无法得到目标的重要属性数据, 而这种分析方法主要可以用于多个区域, 例如心理、统计、医药、销售以及数据识别等, 而根据其隶属度的取值, 有能将其分为两种研究方法, 即硬聚类与模糊聚类, 对于前者来说, 就是将目标按照影响标准进行划分, 即目标如果属于某类, 必定不属于其他类;而对于后者来说, 主要取决与隶属度的取值不同。而划分过程可能会将目标划分入多个聚类中。此外聚类的计算方法也能分为多种, 即包含密度算法、层次算法、划分算法、网格算法以及模型算法等等。

2.2分类与估测

对于分类与数值估测来说, 都是属于是问题预测方式, 其中前者要求估测各个类中的标号, 这些标号都是分散且无规律的, 而估测方法可以采用函数模型, 要求模型类型为连续值函数。分类估测作为数据挖掘的起始工作, 主要需要反应已经获知的训练数据库的特点, 从而根据以上基础完成其中对每一类的情况以及特点完成相应的分类操作, 而整个操作也是受到督促的, 对于一般的分类算法可以有决策树、粗糙集、贝叶斯、遗传等算法, 而估测主要是基于分类以及回归基础, 估测数据将来的动向, 即包含局势外推、时间序列以及回归分析几类。

2.3关联研究

关联研究是源于自然生物间微妙的关系, 而某事情的发生和发展也会引发连锁的事情发展, 也就类似所谓“蝴蝶效应”的定义。而关联研究的研究目标即是研究物与物之间的微妙关系, 包含一些依赖关系等等, 从而找出其中的规则, 基于规则, 分析将来的动向。以购物为例, 分析购物者的心理规律以及习惯, 可以从他们对于购物的一系列表现, 例如购物篮的物品类型、放置规律、购物消费理念、购物环境需求等等, 而掌握这些规律, 足以让一个销售企业获得巨大的消费市场以及商机。

3大数据时代的数据挖掘的运用

3.1数据准备

准备流程需要依附于研究者已经建立起长期且丰富数据资源的数据库, 而根据这些无规则的原始数据进行相应的挖掘前的准备的工作, 例如数据的处理、择取、清除、推敲以及转变, 作为基础的流程, 数据准备操作在整个流程中起到重要的基础作用。

3.2数据挖掘

开展数据挖掘操作, 需要根据挖掘对象的情况择选最优的计算方法, 从而获取其中的规律性, 例如对应采用决策树算法、分类算法、神经网络算法以及Apriori算法等。

3.3数据挖掘的模式评估研究

模式评估的对象主要是通过数据挖掘处理过程数据, 而评估流程是了解、研究且取得其中数据的规则, 然后对数据进行转变“翻译”成通俗易懂的语言, 供人们去研究和思考。

3.4数据挖掘的知识应用

知识应用是数据挖掘的最后一步, 通常知识运用就是一种现实运用的过程, 通过数据准备、挖掘、研究评估, 最后将结果数据或者规律用于现实中, 从而体现数据的本身的价值, 这就是知识应用的内涵。

4大数据时代的数据挖掘的运用

4.1市场营销方面

市场营销行业已经是目前数据挖掘采用最多的行业, 数据挖掘的作用主要体现在的对于消费者群体的消费习惯以及行为进行解析, 从而改变销售方法, 提升产品的销售量, 此外, 除了一些购物消费以外, 数据挖掘技术以及拓展到了各大金融行业, 例如保险行业、银行行业以及电子商务行业等等。例如:在市场营销方面, 采用数据挖掘中的聚类研究, 即客户一系列无规则、无意识的行为数据, 对他们进行识别, 即根据客户的忠诚度、消费意识进行分类, 帮助企业寻找其中的潜在客户以及固定客户群。

4.2数据挖掘的科学分析

科学本身就是一个寻找规律、发现规律以及利用规律的过程, 而且任何科学研究都是需要基于数据作为基础, 所以数据挖掘对于科学领域也具有重要的意义和价值, 特别是针对一些未知的事物、领域或者知识, 通过数据挖掘可以有效展示数据规则。例如对于太空行星的分析, 遗传基因DNA的数据以及遗传规律等。

4.3制造业

与其他行业不同, 制造业运用数据挖掘的目的主要是产品质量检查方面, 例如研究产品的数据, 找出其中规则。分析整体生产流程, 解析其中过程, 找出影响生产质量以及效率的问题, 然后通过对这些问题进行解决, 提升企业经济效益。对于制造业而言, 数据挖掘运用主要体现在决策方面, 即首先通过数据筛选, 获取有用的知识和数据, 然后采用决策树算法, 统计决策, 然后选择其中正确的决策, 即像根据目前产品的流行情况, 预测目前生产产品的受欢迎度, 然后决策生产的时间以及周期。

4.4教育方面

对于教育行业来说, 最重要的除了教师的教学方法以外, 学生的学习情况、心理动向以及教学评估都是十分重要的, 采用数据挖掘技术, 则可以有效将这些数据通过分类、筛选以及处理, 得出有效的数据规则, 供学校教学改革时进行参考。例如:教学质量评估数据挖掘模块的开发, 即将教学质量相关的项目通过QSL Sevrer进行整合和存储, 例如教学准备、教学内容、教学方式以及教学态度等, 最后学生可以进行自行浏览并且完成评估, 而评估结果则会上传系统进行最后通过数据挖掘, 筛选其中有用的信息, 再通过Apr1ori算法挖掘其中关联规律。

5结语

虽然数据挖掘技术不是一项新兴的技术, 但是其还具有较大的研究价值与运用前景, 特别是在特殊领域的运用, 对于一系列数据进行科学冗杂的处理, 然后分析其中规则价值, 可以有效提升各大行业的经济效益。

参考文献

[1]赵倩倩, 程国建, 冀乾宇, 戎腾学.大数据崛起与数据挖掘刍议[J].电脑知识与技术, 2014, 11 (33) :7831-7833.

[2]韩英.浅析大数据时代的数据挖掘与精细管理[J].成都航空职业技术学院学报, 2013, 12 (04) :63-71.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【大数据技术】相关文章：