我区电子商务大数据分析报告

2024-06-27

我区电子商务大数据分析报告(精选7篇)

篇1:我区电子商务大数据分析报告

大数据的意义在于提供“大见解”:从不同来源收集信息,然后分析信息,以揭示用其他方法发现不了的趋势。在利用大数据发掘价值的所有行业中,医疗行业有可能实现最大的回报。凭借大数据,医疗服务提供商不仅可以知道如何提高盈利水平和经营效率,还能找到直接增进人类福祉的趋势。

以下是大数据在医疗行业的一些常见用途,包括商业运作和健康管理:

1.分析电子病历:医生共享电子病历可以收集和分析数据,寻找能够降低医疗成本的方法。医生和医疗服务提供商之间共享患者数据,能够减少重复检查,改善患者体验。但目前,大部分的电子病历都无法共享,这在很大程度上是出于安全和合规的考虑,但找到一个安全的方法来挖掘患者数据,这能改善医护质量并降低医疗成本。

关键词:患者数据共享、信息安全、提高医疗质量、降低医疗成本

2.分析医院网络系统:不妨想想我们在分析入院治疗的趋势时获得的好处。例如,对儿科病房医疗设备的统合分析可以更早地识别潜在的婴儿感染趋势。或者,再想想减少术后葡萄球菌感染的好处。通过利用大数据,医院可以知道,医生在术后开的抗生素能否有效地防止感染。

关键词:入院治疗趋势分析

3.管理数据用于公共健康研究:医务人员会被铺天盖地的数据所淹没。诊所和医院会提交关于健康状况和免疫接种的数据,但没有大数据的话,这些数据毫无意义。大数据分析能够对患者的原始数据进行标准化整合,用以充实公共健康记录,而丰富多样的公共健康记录能催生更合理的法规,并提供更好的医疗。

关键词: 公共健康记录、患者数据

4.循证医学:大多数医院和急诊室都实行“食谱化医学”,也就是说,医生对收治的病人采用同一套检查项目来确定病因。而利用循证医学,医生可以将病人的症状与庞大的患者数据库进行比对,从而更快地做出准确诊断。在这里,大数据扮演的角色是从不同来源采集信息,并对数据实施标准化。在这种情况下,带有“高血压”的记录就可以映射到另一条带有“血压升高”的记录。

关键词:循证、患者数据库

5.降低再入院率:看病费用之所以上涨,原因之一是因为患者离开医院30天内,再入院率居高不下。利用大数据分析,按照过往记录、图表信息和患者特点,医院能识别高风险病人,并提供必要的护理,从而降低再入院率。

关键词:记录、分析患者特点、识别高风险病人、特殊护理

6.保护患者的身份信息:UnitedHealthcare等保险商利用大数据分析,使医疗诈骗犯和盗用身份者无所遁形。该公司对语音转文本的记录(比如打给呼叫中心的电话)进行分析,从而找出诈骗者。这家保险公司还利用大数据来预测哪类治疗方案更有可能成功。

关键词:患者信息保护、医疗诈骗

7.更高效的诊所:随着诊所的发展,协调医生和更多患者变得更具挑战性。以纽约州韦斯特切斯特县的Westmed Medical Group为例,该诊所的医生从1996年的16人增加到现在的250人,就医人数达到25万,年收入为2.85亿美元。随着规模的扩大,它必须提高效率才能保持优势。利用大数据,该诊所能分析2200余种医疗过程。因此,它能简化工作流程,把某些临床任务从医生转移到护士手上,减少不必要的检查,提高患者满意度。和其他行业一样,大数据指明了从哪里入手可以改善医疗过程。

关键词:简化医疗工作流程、提高医生工作效率

我国“互联网+医疗”现阶段的发展:

当前,以阿里巴巴和腾讯为代表的互联网厂商不断与线下医院对接试水创新应用;移动医疗应用也颇受资本市场青睐,据不完全统计,数百家医疗健康互联网公司都走在融资的道路上。2014年到2015年,我国“互联网+医疗”市场规模分别为29.5亿元、42.7亿元,增长率为44.7%。预计到2017年,这一数字将超过125.3亿元。

1.以挂号和支付起步

从8月9日开始,北京大学第一医院在支付宝中的服务窗向用户开放,它不但能实现在线预约挂号,还是全国首个应用“防黄牛模型”的医院线上服务。蚂蚁金服医疗行业总经理王博介绍:“利用实名信息,支付宝能精准匹配挂号人和就诊人。通过对用户的身份信息、行为特征、关系网络建立多维度的层次化体征体系,通过数据挖掘和建模,有效识别出黄牛身份,为医院建立‘黑名单’库。”

在线挂号正是“互联网+医疗”的绝佳“破冰”入口。以北京为例,北京市卫计委此前出台了多项措施:2016年底前,北京市属22家医院将全部取消现场放号,改为实施“非急诊全面预约”等,而预约的最主要途径就是互联网。在支付宝服务窗之外,腾讯同样在微信城市服务中,与包括“微医(挂号网)”在内的合作伙伴,共同推出统一挂号开放平台。据介绍,迄今为止,微信的挂号平台已经在60多个城市落地。

而在实现挂号预约后的下一步,则是支付。深圳市人社局局长王卫介绍说,从今年6月起,深圳成为全国首个通过互联网渠道完成医保移动支付的城市,参保人通过支付平台绑定加载金融功能的社会保障卡后,就可以在全市17家试点医院一键完成医保与自费的移动支付。“接下来深圳还将逐步探索扩大移动支付的使用场景,包括生育保险、大病门诊、住院、社康门诊、药店取药等,更加方便群众就医。”

2.硬件连接的慢病管理

9月20日,腾讯发布糖大夫二代智能血糖仪,新一代血糖仪不但支持WiFi无线连接,甚至支持联通3G网络。

9月20日,腾讯发布糖大夫二代智能血糖仪,新一代血糖仪不但支持WiFi无线连接,甚至支持联通3G网络。

糖尿病的数据化也成为互联网慢病管理的试水之举。丁香园创始人李天天表示:“互联网慢病管理有3个要素:一是要能收集数据。二是要能互动。比如患者可以收到微信提醒最近血糖控制得好不好,或者中秋节前提醒患者不能吃月饼。三是并非所有慢病都适合互联网管理,要挑选那些能管好的、容易的采集数据,能拉动互动的慢病先作探索。”

3.互联网医院未来之路

2015年12月10日,浙江大学医学院附属医院院长、心血管专家王建安教授,通过乌镇互联网医院的网上平台,为杭州患者黄女士开出全国首张在线电子处方。随着这张电子处方的开出,“互联网医院”真正走进公众视野。截至今年7月,乌镇互联网医院在线接诊量每天已超过2.1万人次;预计到今年年底,乌镇互联网医院的日接诊量将超过8万人次。乌镇互联网医院的开业,也让国内互联网医院如雨后春笋般出现。4月,微医、好大夫在甘肃、宁夏上线互联网医院;随后,七乐康与广州市荔湾区中心医院达成合作;6月,阿里健康网络医院落户甘肃金昌„„来自第三方的数据显示,截至今年9月,全国互联网医院试点已达35家。

互联网医院能干啥?所谓互联网医院,是指通过视频请医生诊疗,开具电子处方,药品快递到家的新型远程线上诊疗模式。其意义在于打破地域界限,既可以让偏远地区患者享受高水平的医疗服务,又可以提高大城市的医疗服务水平,还可以更合理地配置医疗资源。

我国“互联网+医疗”现阶段存在的问题:

我国目前医疗信息化的水平还比较低,患者的电子病历还没有充分建立起来,各医院的基本医疗数据没有实现互联互通,成了一座座“信息孤岛”,而且医院与患者之间也难以进行互动。这些都使得远程会诊、医疗大数据等发展得步履维艰。

互联网医疗要落地,必须建立在医疗信息化的坚实基础之上。医院要搭上互联网快车,就必须加强自身信息系统的建设。其中关键的一点就是要树立互联网思维,以需求为导向重塑医疗服务流程。信息化是工具,目的是满足人的需求,要以人为本。具体而言,信息化要理解患者的需求,减少他们在挂号、候诊、缴费等环节的负担;信息化更要助力医护人员的工作,有助于医疗服务水平和效率的提高。

篇2:我区电子商务大数据分析报告

下面是我对数据分析的一些格式及规范要求

数据分析应当包括以下几个主要部件:

1.样本情况分析及调查工具说明 2.调查结果分析 以图表加文字的方式呈现数据分析的结果,并对结果简单的解释与说明。

(1)表格设计的要求 表格应为三线表(自动套用格式中的 “简明Ⅰ型”),表格应当包括表序号、表题目,及数据内容。其中表格中的数据及文字小正文一号,表格序号在报告中进行统一设计与安排,且表格题目应当在表格的正中上方。

图表的设计要求,图表设计大小应当与正文的文字大小匹配,图表应当包括图序号,图题及图形。其中图序号在报告中也应当进行统一设计与安排,但不得与表格序号混用。图题目应当在图表的正中下方,图中的数据与文字也应当比正文文字小一号。

一些简单与明白的数据结果,仅以表格陈述就可以。但如果数据结果比较复杂,数据结果比较繁多,那么可以将表与图结合起来进行数据结果描述。这样既给读者具体的数据结果信息,亦能使数据信息以很具像的方式进行呈现。

(2)结果的分析应体现层次性。一般按大家的操作化结构,分专题进行结果分析。每个专题结束之后,应当进行简要的总结与归纳,突出其中一些主要或令人意外的结果。最后,在所有的专题分析完之后,应当有一个综合的分析,并在其中陈列本次调查结果中最具有价值的一些结果与结论。

(3)结果分析中,禁止用大量的文字对结果进行说明性的描述,请大家尽量使用简洁与简单的方式陈述结果,但也不能只为追求很少的文字,对一些内容结果进行有选择性的删除,务必做到二者的平衡。

(4)调查报告中,如果有引入统计符号,所有的统计符号均为斜体表示。

请大家先自学教材后面附录二中的社会调查报告实例,然后再参考下面的一份调查报告样例:

浙江农村广播调查报告

一、调查背景

……

二、调查方法

1.取样情况

本次抽样的范围?,抽样方式?,实施过程? 本次调查发放问卷?份,共回收问卷60份,有效率达到?,参与本次调查的受访者基本情况如表1所示。

由表1可知,参与本次调查的大部分为男性,受访者的教育程度均在高中或中专以上,且大部分均为乡镇广播台的工作人员。

表 1 调查样本的基本情况一览表(n n =60)

受访者基本特征 人数 百分比 性别 男 58

96.7

女 2

3.3 受教育程度 小学及以下 0

0

初中

0

0

高中或中专 5

8.3

大专或高职 34 56.7

大学及以上 20 33.3

缺失值

1.7 工作岗位性质 县级台 3

5.0

乡镇台 56 93.3

缺失值1.7 总计 60 100

2.调查工具

本次调查采取问卷方法收集资料。问卷由24个问题构成,23个问题为封闭式问题,1个开放式问题,主要询问了农村中影响最大的媒体、广播在农村中主要作用、农村广播的节目类型及自办节目情况、农村广播主要传播方式、“村村通”和“村村响”工程的建设情况、乡镇广播站的人员构成情况及建设情况、乡镇广播发展的现状及存在问题等,问卷调查项目具体情况可参见附录。

3.资料整理与分析

全部问卷资料由调查员检查核实后进行编码,然后输入计算机,利用SPSS11.0分析软件进行统计分析。分析类型主要为单变量的描述统计和双变量的交互分类统计。

三、结果与分析

1.农村建设中影响最大的媒体及农村广播的主要作用分析

农村建设中影响最大是哪类媒体,建国以来到目前,影响农村建设最大的媒体类型有无发生变化,这是本次调查首先关注的一个问题,调查结果见表2,图1。

表2和图1的调查结果表明,建国以来农村建设中影响最大的媒体主要有三类,即广播、电视和网络,其以广播和电视为主,且广播的影响力稍强于电视;在目前现阶段,影响最大的媒体则有两类,即电视和网络,且电视成为最主要的影响媒体。由上述比较可知,建国以来到现在,农村建设中影响最大的媒体已经由原先的广播变成了电视,且广播的影响力在目前现阶段受到严重忽视,其影响力甚至还不如网络。

表 2 建国以来及目前影响最大的媒体类型分布情况(n n =60)

广播 电视 网络 建国以来 33 26 1 目前 0 58 2

图 1 建国以来及目前影响最大的媒体类型分布情况

农村广播在农村建设中的主要作用是什么,建国以来到当前,农村广播在农村建设中主要作用有无变化,这是本次调查关注的另一个重要问题。调查结果见表3。

表3的调查结果显示,建国以来,广播在农村建设中主要作用表现在宣传方针政人数

策、重大突发事件应急作用、传播农业科技、发动群众、传播文化知识和发布新闻等方面,而在提供商品信息、法制教育、移风易俗、娱乐消遣和普及普通话等方面作用不明显;当前阶段,广播在农村建设中的主要作用表现在重大突发事件应急作用、宣传方针政策、传播农业科技、发动群体和普通普通话,而在提供商品信息、发布新闻、传播文化知识、法制教育、娱乐消遣休闲及移风易俗等方面作用不明显。

比较分析可以发现,无论在建国以来还是当前,宣传方针政策、重大突发事件应急作用、传播农业科技和发动群众一直是广播在农村建设中的主要职能;然而,随着经济和社会的发展,广播在农村建设中发布新闻、传播文化知识及提供商品信息等方面的功能日益减退,这可能是由于电视逐渐取代了广播成为农村中影响最大的媒体的原故。一个值得注意的改变是在当前,广播在农村建设中的普及普通话功能得到放大,且重大突发事件应急作用成为广播在农村建设中最重要的功能,这一点说明,广播在农村建设中仍是不可缺少的重要手段。

表 3 建国以来及当前广 播在农村建设中主要作用比较分析(n n =60)

位次 建国以来 当前 主要作用 百分比 主要作用 百分比 1 宣传方针政策 88.3 重大突发事件应急作用 76.7 2 重大突发事件应急作用 76.7 宣传方针政策 68.3 3 传播农业科技 68.3 传播农业科技 61.7 4 发动群众 56.7 发动群众 53.3 5 传播文化知识 51.7 普及普通话 41.7 6 发布新闻 48.3 提供商品信息 36.7 7 提供商品信息 33.3 发布新闻 35.0 8 法制教育 36.7 传播文化知识 31.7 9 移风易俗 23.3 法制教育 28.3 10 娱乐消遣休闲 13.3 娱乐消遣休闲 15.0 11 普及普通话 10.0 移风易俗 3.3 注:百分比数字表示选择该项的人数占总人数的比例,下同。

2.农村广播节目建设情况分析

农村广播节目建设情况调查的内容主要包括目前的农村广播中的节目类型,是否有自办节目,自办节目的类型及自办节目的播出时间长度等情况。调查结果如表4、表5、表6和表7所示。

表4的调查结果表明,农村广播最主要的节目类型有新闻节目、农业科技、农村新人新事、文艺娱乐及法制节目,而教育教学、体育节目及广播剧则相对较少。

表 5 的调查结果表明,有 47.5%的受访者报告他们的广播站没有自办节目,而35.6%的受访者报告他们的广播站有自办节目,还有 16.9%报告他们很少有自办节目。

这一结果说明,多数广播站没有在自办节目上进行建设。

表 表 4 4 农村广播中节目类型分析表(n n =59)

节目类型

百分比

新闻节目 94.9 农业科技 78.0 农村新人新事 67.8 文艺娱乐 59.3 法制节目 47.5 教育教学 32.2 体育节目 22.0 广播剧 20.3 其他 10.2

表 5 农村广播中自办节目情况分析(n n--59)

自办节目情况

百分比

没有 47.5 很有少 16.9 有 35.6

农村广播自办节目类型调查中,由于该题不是必答题,仅有 34 名受访者对该题进行了回答,本报告的结果仅依据 34 名受访者应答情况进行分析。

表6的调查结果显示,农村广播中自办节目类型中,农业科技、新闻节目、广播讲话及广告商品信息占多数,而法制节目、文艺娱乐、教育教学及其他节目相对较少。

表7的调查结果显示,大部分广播站的农村广播自办节目的播出时间 较长,有66.1%的受访者报告其所在的广播站自办节目播出时间长达3小时以上,仅有不到9%的受访者报告其所在广播站自办节目播出时间少于1小时。

表 表 6 农村广播中自办节目类型分析表(n n =34)

节目类型

百分比

农业科技 79.4

新闻节目 61.8 广播讲话 50.0 广告商品信息 47.1 法制节目 20.6 文艺娱乐 17.6 其他

8.8 教育教学

2.9

表 7 农村广播中自办节目的播出时间长度分析表(n n =59)

播出时间

百分比

1小时以下

8.5 1-2小时 10.2 2-3小时 15.3 3小时以上 66.1

3.农村广播“村村响”和“村村通”建设情况分析

农村广播“村村响”和“村村通”建设情况调查主要内容包括农村广播的主要传输方式、广播喇叭入户率、广播通响率及“村村响”完成程度。调查结果见表8、表9、表10和表11。

表8的调查结果显示,目前农村广播最主要的传输方式是广播电视共缆传输,音频传输、无线调频广播则利用较少。

表9的调查结果显示,农村广播喇叭入户率情况并不理想,仅有42.1%的受访者报告其所在乡镇广播喇叭入户率达到80%以上,但仍有31.6%的受访者报告其所在乡傎的广播喇叭入户率低于20%。

表 表 8 农村广播主要传输方式分析表(n n =60)

节目类型

百分比

广播电视共缆频传输 85.0 音频传输 3.3 无线调频广播 5.0 几种方式共存 6.7

表 表 9 农村广播喇叭入户率分析表(n n =60)

广播喇叭入户率

百分比

累积百分比

80%以上 42.1

42.1 60-79% 12.3

54.4 40-59% 5.3

59.7 20-39% 8.8

68.5 20%以下 31.6 100.0

表10的调查结果显示,农村广播通响率情况较为理想,63.6%的受访者报告其所在乡镇广播喇叭入户率达到80%以上,不到8%的受访者报告其所在乡傎的广播喇叭入户率低于20%。

表11的调查结果显示,“村村响”广播工程完成情况良好,91.5的受访者报告其所在乡镇已经基本完成,而仅有不到9%的受访者报告其所在乡镇的“村村响”广播工程没有完成。

表 表 10 农村广播通响率分析表(n n =60)

广播通响率

百分比

累积百分比

80%以上 63.6

63.6 60-79% 18.2

81.8 40-59%

7.3

89.1 20-39%

3.6

92.7 20%以下

7.3 100.0

表 表 11 “村村响”广播工程完成情况分析表(n n =59)

村村响广播工程完成情况

百分比

累积百分比

很好完成 32.2

32.2 完成 23.7

55.9 基本完成 35.6

91.5 没有完成8.5 100.0

4.乡镇广播站建设情况分析

乡镇广播站建设调查主要内容包括农村广播维护经费情况、工作人员编制情况、工作人员数量充足情况、广播费用收缴情况等。调查结果见表12、表13、表14和表15。

表12的调查结果显示,农村广播维护经费情况并不理想,仅有31.7%的受访者报告其所在乡镇的的农村广播维护经费有基本保障或充分保障,将近半数的受访者报告其所在乡镇的农村广播维护经费没有保障。

表 表 12 农村广播维护经费情况分析表(n n =60)

农村广播维护经费情况

百分比

累积百分比

充分保障 11.7

11.7 基本保障 20.0

31.7 部分保障 20.0

51.7 没有保障 48.3 100.0

表13调查结果显示,乡镇广播站工作人员中,绝大多数人员的编制为事业编制,其次为混合编制,而仅有少数人员的编制性质为合同制和临时工编制。

表14调查结果显示,乡镇广播站工作人员数量比较充足,73.7%的受访者报告广播站工作人员数量能满足需要或基本满足需要,仅有不到9%的受访者报告广播站工作人员数量严重缺编。

表 表 13 广播站工作人员编制结构分析表(n n =56)

工作人员编制性质

百分比

事业编制 60.7 乡镇干部编制

0 合同制

1.8 临时工编制

1.8 混合编制 35.7

表 表 14 广播站工作人员数量充足情况分析表(n n =57)

工作人员数量充足情况

百分 比

累积百分比

满足需要 21.1

21.1 基本满足需要 52.6

73.7 不能满足需要 17.5

91.2 严重缺编

8.8 100.0

表15调查结果显示,绝大多数的乡镇广播站对农村广播并不收缴费用,仅有10%的广播站会收缴或部分收缴广播费用。

表 表 15 广播费用收缴情况分析表(n n =59)

广播经费用收缴情况

百分比

收缴

1.7

部分收缴

8.5 不收缴 89.8

5.农村广播发展面临的问题分析

农村广播发展面临问题调查主要内容包括农村广播发展最需要的因素、农村广播发展面临的问题、村级广播室是否健全及广播室发挥的实际作用效果。调查结果见表16、表17、表18和表19。

表16的调查结果显示,当前农村广播发展最需要的是资金支持,其次是体制保障、人员保证和技术培训,相比之下,整体规划和设备设施更新的需求并没有十分迫切。

表17调查结果显示,当前农村广播发展面临的最主要的问题是资金不足,其次是领导不重视和待遇偏低,农村广播发展面临的其他问题还包括听众流失、技术落后及广播作用不大、节目质量低等。

表 表 16 农村广播发展中最需要的因素分析表(n n =60)

最需要 的因素

百分比

资金支持 86.7 体制保障 45.0 人员保证 35.0 技术培训 33.3 整体规划 23.3 设备设施更新 20.0 其它

1.7

表 表 17 农村广播发展面临的主要问题分析表(n n =60)

面临的主要问题

百分比

资金不足 76.7 领导不重视 38.3 待遇偏低 36.7 听众流失 23.3 技术落后 18.3 广播作用不大 18.3 节目质量低 16.7 其它 3.3

表 18 的调查结果显示,乡镇村级广播室情况并不理想,61.7%受访者报告其所在乡镇的村级广播室健全或基本健全,而 38.3%的受访者报告其所在乡镇的村级广播室部分健全或基本没有。

表 19 的调查结果显示,村级广播室实际作用情况并不理想,仅有 50.8%的受访者报告其所在乡镇村级广播室作用很大或有作用,44.1%的受访者报告其所在乡镇村级广播室作用一般,甚至还有 5.1%的受访者报告根本没有作用。

表 表 18 村级广播室健全情况分析表(n n =60)

乡镇村级广播室健全情况

百分比

累积百分比

健全 20.0

20.0 基本健全 41.7

61.7 部分健全 23.3

85.0 基本没有 15.0 100.0

表 表 19 村级广播室实际作用情况分析表(n n =59)

乡镇村级广播室实际作用

百分比

累积百分比

作用很大 16.9

16.9 有作用 33.9

50.8 作用一般 44.1

94.9 没有作用

5.1 100.0

6.调查结果分析综述

本次调查得到如下一些具有重要价值的结果:

(1)建国以来,在农村建设中影响最大的媒体是广播,而在当前农村建设影响最大的媒体是电视;无论在建国以来还是当前,宣传方针政策、重大突发事件应急作用、传播农业科技和发动群众一直是广播在农村建设中的主要职能;在当前,广播在农村建设中的普及普通话功能得到放大,且重大突发事件应急作用成为广播在农村建设中最重要的功能。

(2)农村广播中主要的节目类型有新闻节目、农业科技、农村新人新事、文艺娱乐及法制节目;多数广播站没有在自办节目上进行建设;农村广播中自办节目类型中,农业科技、新闻节目、广播讲话及广告商品信息占多数,农村广播自办节目的播出时间一般会比较长(3 小时以上)。

(3)目前农村广播最主要的传输方式是广播电视共缆传输,农村广播喇叭入户

率情况并不理想,农村广播通响率情况较为理想,“村村响”广播工程完成情况良好。

(4)农村广播维护经费情况并不理想,绝大多数人员的编制为事业编制和混合编制,乡镇广播站工作人员数量比较充足,绝大多数的乡镇广播站对农村广播并不收缴费用。

(5)当前农村广播发展最需要的是资金支持,当前农村广播发展面临的最主要的问题是资金不足,乡镇村级广播室情况并不理想,村级广播室实际作用情况并不理想。

下面给出一些数据分析的表格模板

1.T 检验

我们用 t 检验分析休闲活动动机在性别上的差异,结果表明:在积极-挑战型和不确定型二种休闲活动动机上,男女并不存在显著差异,但是在消极-恢复型的休闲动机上,男女却存在着显著的差异,女生将休闲活动作为一种缓解压力,放松心情的动机更强。具体结果见表 11和图 6。

表 表 11 休闲活动动机在性别上的差异比较

休闲活动动机 性别 人数 均值 t 值 df 显著性水平1 积极-挑战型 男 40 4.00 1.63 102.106

女 64 3.79 2 消极-恢复型 男 272 4.12-2.06 816.040

女 546 4.21 3 不确定型 男 17 3.21-1.43 39.160

女 24 3.55 33.544.5男 女积极 消极 不确定

图 图 6 休闲活动动机在性别上的差异比较

2.方差分析

我们对休闲活动动机在家庭收入上的差异进行了方差分析,结果表明:在积极-挑战型及不确定型二种休闲活动动机上,家庭收入的各水平间并不存在显著差异,但是在消极-恢复型休闲活动动机上,家庭收入的各水平间存在显著的差异,所在家庭月收入超过 30000 元以上的青少年具有的消极-恢复型休闲动机最强,其次为家庭月收入在 8000-11000 元之间,而家庭月收入不超过 5000 元的,其消极-恢复型休闲动机则比较低。具体结果见表 13 和图 8。

表 表 13 休闲活动动机在家庭收入上的差异比较

休闲活动动机 家庭收入 人数 均值 均方 df F 值 显著性水平1 积极-挑战型 2000 元以下 14 3.71

0.35 5 0.87.501 2000-4999 元 12 4.00

5000-7999 元 27 3.80

8000-10999 元 30 3.81

11000-29999 元 21 4.05

30000 以上 1 4.40消极-恢复型 2000 元以下 51 4.15

0.90 5 3.01.011 2000-4999 元 154 4.12

5000-7999 元 196 4.15

8000-10999 元 204 4.29

11000-29999 元 180 4.12

30000 以上 21 4.37不确定型 2000 元以下 3 3.23

0.45 4 0.80.531 2000-4999 元 5 3.54

5000-7999 元 12 3.41

8000-10999 元 9 3.75

11000-29999 元 11 3.18

33.23.43.63.844.24.44.6under 2000 2001 to 5000 5000 to 8000 8000 to 11000 11000 to 30000 over 30000积极 消极 不确定 图 图 8 休闲活动动机在家庭收入上的差异比较

3.相关分析

为了探究人格特质对休闲动机的影响,我们首先对人格特质与二种休闲动机进行相关分析。相关矩阵表明,除了情绪稳定性这一人格特征与积极-挑战型动机相关不显著之外,二类休闲动机与各人格特质都有显著的相关性;值得注意的是,情绪的稳定性这一人格特质与消极-恢复型动机呈现负性相关,而相容性的人格特质与积极-挑战型动机也呈现出负性相关。具体结果见 3-9。

表 表 3 3 - 9 人格特质与休闲动机的相关分析矩阵((n n =1019)

因素 1 情绪 2 外向 3 开放 4 相容 5 谨慎 6 积极 7 消极 6 积极-挑战型动机-0.036 0.255**

0.154**

-0.079*

0.189 **消极-恢复型动机-0.078*

0.288 **

0.268**

0.071*

0.203**

均值 2.804 3.588 3.440 3.374 3.596 34.552 40.382 标准差 0.629.0494 0.395 0.420 0.470 6.018 5.849

4.列联分析

为了探讨广告植入方式对其可识别程度的影响效果,对两者进行交叉列联分析,结果如表6 所示。

表 6 植入方式与可识别程度的列联分析结果(n n =965)

植入方式

可识别程度

很明显

一般

不明显

台词

9 0 道具

259 211 77 场景

89 36 音效9 4 形象2 3 总计

525(54.4%)320(33.2%)120(12.4%)278.86(0.001)p   

分析结果表明,植入方式对广告的可识别程度影响是非常显著的(p<0.001)。台词植入的广告是最容易识别的,其次为道具植入和场景植入,这两种植入方式也具有较高的可识别性;形象植入的广告具有隐秘性,其次为音效植入式广告。

篇3:我区电子商务大数据分析报告

目前存在的不足有以下几点。第一, 具有自行监测能力的平台数量不足, 不能及时获取全面准确的信息。第二, 我国目前环境信息化工作才刚刚起步, 部门信息化建设不完善, 导致无法充分地共享信息, 使得环境信息难以得到高效利用[5]。这说明我国的环境保护工作目前还处于发展和摸索阶段, 对于“智慧环保”物联网的应用, 挑战和机遇共存[6]。

本文研究目的主要有两个, 一个是提高信息资源共享水平和能力, 另一个是提高环境监管和应急防范能力。

1 数据挖掘技术

一般情况下, 数据挖掘技术需要经过问题定义、数据收集、数据预处理、数据挖掘算法等阶段[7], 其过程如图1 所示。

1.1 数据准备阶段

这一过程, 也可以分为三个不同的阶段:数据的选择、集成以及预处理。

1.2 数据挖掘阶段

该阶段主要包括以下四步:

第一, 确定怎样产生假设。

第二, 选择数据挖掘过程的合适算法。

第三, 获取数据的知识。

第四, 验证获得的知识具有有效性。

1.3 挖掘结果的表达和解释阶段

对数据集通过数据挖掘后所获得的知识进行评估是很有必要的, 因为有时候数据挖掘产生的结果也许实用价值很小或根本没有实际意义, 甚至可能会歪曲数据的实际意义, 所以就需要剔除用户不感兴趣的知识, 采用降低冗余模式的方法, 把对用户而言有实用价值和实际意义的知识给保留下来, 修剪或删除对用户而言没有价值和意义的信息, 最后通过决策支持工具把保留下来的信息传递给决策者, 对其决策提供支持。

2 关联规则算法

在实际操作中, 把挖掘流程分为如下两个程序:第一步, 事先找出事务数据项集当中所有的频繁数据, 这是主要步骤, 是衡量关联规则挖掘算法的主要标准;第二步是通过第一步产生的频繁项目集来得出强关联规则。

3 数据挖掘技术在智慧环保系统中的应用研究

3.1 选取数据和预处理

本文选取的数据集来自上海一家环境科技有限公司对某地电厂脱硫设施进行监测的数据, 在电厂脱硫设施工序中设置了4 个监测点, 分别为WL_DC_01、WL_DC_02、WL_DC_03、WL_DC_04。600MW是电厂脱硫设施机组的容量, 电厂脱硫设施采用的是石灰石石膏湿法进行脱硫处理。在不同时间对4 个监测点进行数据监测, 其时间间隔为1 小时。本次监测时间跨度为3 个月, 分别为2015 年5 月、2015 年6 月、2015 年7 月。

从具体的工况进一步筛选出主要监测参数数据, 进而把FGD出口处二氧化硫的浓度以及脱硫的效率当作过滤属性和分类属性的子集, 把FGD进口处二氧化硫浓度、吸收塔PH值等14 个属性作为主要的研究对象, 并且为了方便研究, 把这14 个属性设置为A1/A2/A3/A4/A5/A6/A7/A8/A9/A10/A11/A12/A13/A14, 关于这14 个参数的设置, 具体见表1。

确定表1 中的14 个属性作为主要研究对象, 清理掉其他的属性参数, 这种做法主要两个好处:首先使得数据的范畴得到了削减, 大大简化了数据的繁杂程度, 对数据挖掘的实际操作提供了很大方便;其次, 通过降低数据处理所要完成的工作总量, 来达到提高工作效率的目的。

3.2 脱硫设施的数据结构模型的建立

3.2.1 建立参数波动模型

对于每个参数属性的单个计算来说, 互相之间的关联性缺少一定的联系。利用经典关联规则算法中的a priori算法, 对14 个参数互相之间的相关性进行分析。通过对电厂脱硫设施WL_DC_01 获得的数据进行预处理之后, 经过差值计算, 可以得出脱硫监测设备在同时满足下面4 个条件时是正常工作的:

这个是脱硫监测设施的参数波动模型。其是由电厂脱硫设施1 号机组所获得的脱硫监测数据产生的, 同时利用WL_DC_02、WL_DC_03、WL_DC_04 这三个机组获得的数据, 验证参数波动模型, 也得出当脱硫监测设备同时满足以上4个条件时, 脱硫监测设备正常运行, 因此可以得出参数波动模型的有效性。脱硫监测设施运行是否正常, 可以利用这个模型得知。一旦发现非正常工作状态, 可以在第一时间做出应对, 大大提高脱硫效率以及降低污染物的排放。

3.2.2 建立参数预测模型

依照脱硫效率做出分类, 利用关联规则的属性进行参数选择, 其中评价算法选择CFS, 而搜索方法选择Best First。将得到的与脱硫效率有关的7 个属性参数通过多元线性回归方程进行计算, 进而预测脱硫设备的脱硫效率。

式 (4) 中, Z是预测的脱硫效率值。将式 (4) 定义为脱硫监测数据参数的预测模型, 可以将实际监测的数据通过该预测模型得出脱硫效率的预测值, 然后与脱硫效率实际值进行比较, 看是不是在允许的误差范围里。如果是, 那说明脱硫设施运行正常, 否则脱硫设施可能存在故障, 得及时做出检查, 避免污染物排放量过高。

3.3 预测结果与应用性评价

对于脱硫效果, 从电厂脱硫设施1 号机组WL_DC_01所获得的脱硫监测数据, 通过预测模型所得的预测结果和实际所监测的数据进行对比的散列图, 如图2 所示。

图2 中, 绿点代表脱硫效率的实际值, 红点代表脱硫效率的预测值。通过图2 可以看出, 在脱硫设施正常运行的情况下, 脱硫效率高于95.5%, 同时可以看出脱硫效率的预测值与实际值相差最大为4.0%, 由此可知参数预测模型是有效并且有实际意义的。

从电厂脱硫设施2 号机组WL_DC_02, 3 号机组WL_DC_03, 4 号机组WL_DC_04, 预测结果和实际监测结果进行对比的散列图如图3、图4、图5 所示:

通过图3、图4 和图5 可知, 所得预测结果和实际监测数据的对比散列图与图2 一致, 都可以看出脱硫效率预测值与实际值相差最大为4.0%, 所以验证了参数预测模型是有效的, 并且是有实际意义的。

本文所得出的参数波动模型和预测模型对于上海这家环境科技有限公司对电厂脱硫设施进行智能化管理有明显的效果, 对其他脱硫设施也许不是很吻合, 因为电厂脱硫设施中影响设备是否正常运行存在很多因素, 是特别繁杂的, 如果要开展最为精准的分析活动, 除了对脱硫设施中的各项数据参数指标的含义以及特点做到完全掌控, 对于参数彼此之间的关系和互相间的影响也要有全面的了解。如果更换脱硫处理方法, 改变机组大小, 那么脱硫效率会发生很大变化。对于其他脱硫监测设备, 可以采用本文的方法和模式, 来得出相应的参数模型, 为环境保护部门和电力公司做出决策提供准确根据, 最终实现社会、经济、环境多方面效益共同提升。

4 结语

本文利用数据挖掘中的关联规则算法对脱硫监测数据进行处理, 提出了脱硫设施参数波动模型、参数预测模型, 并且说明了模型的可行性和有效性, 起到了提高脱硫效率的作用。

尽管本文对电厂脱硫监测数据运用关联规则算法进行数据分析, 取得了良好的成效, 在解决实际问题中起到了重要作用。但此过程涉及到了繁杂的数据, 在数据处理中, 除了参考专家的建议和环境保护部门的意见之外, 与此同时不考虑一些目前短时间不关心甚至无序和杂乱的数据, 对脱硫设施中的脱硫监测数据采取了简单的手段, 这样操作可能会影响到结果的完整性。

摘要:在电力行业的废弃物中, SO2的排放是最令人头疼的, 为了更好地降低总量排放, 笔者通过数据挖掘技术中的关联规则算法, 经过数据预处理, 利用经典关联规则算法中的a priori算法, 评价算法选择CFS, 搜索方法选择Best First, 提出了脱硫监测数据参数波动模型和参数预测模型, 有效地寻找出数据之间的联系, 为“智慧环保”提供可靠依据。笔者最后结合实际所监测到的数据对模型进行论证, 验证了模型在实际脱硫设施中具有良好的作用, 其提高了脱硫效率, 降低了污染物排放。

关键词:智慧环保,数据挖掘技术,关联规则算法,脱硫监测

参考文献

[1]尹晓远, 李红华, 杨竞佳.智慧环保物联网及技术应用示范[A].《2012中国环境科学学会学术年会论文集 (第二卷》[D].2012.

[2]吴勇, 张红剑.基于大数据和云计算的智慧环保解决方案[J].信息技术与标准化, 2013:38-41.

[3]刘锐, 詹志明, 谢涛, 等.我国“智慧环保”的体系建设探讨[J].环境保护与循环经济, 2012:9-14.

[4]张新权.智慧环保体系建设及以湘潭市为例的实证研究[D].湘潭:湘潭大学, 2013:1-66.

[5]徐敏, 孙海林.从“数字环保”到“智慧环保”[J].环境监测管理与技术, 2011 (4) :5-7.

篇4:教育大数据管理模式变革分析论文

教育管理是教育主体在教育发展过程中运用相关的管理理念、管理手段和管理方式,对教育资源(包括人、财、物、时间、空间、信息)进行合理配置,使之有效运转,实现组织目标的协调活动过程。这是教育内外部资源聚合、分类、交互和转化的一个开放的复杂巨系统,其外化的形态是多样化、动态化的教育管理模式。教育资源中的任何一个要素或几个要素发生了变化,都会引起教育管理模式的相应的变革,尽管变革往往呈现出渐变性。

与我国科层行政结构一致,教育管理在组织结构上也是科层式,并且由于教育自身的特殊性,教育管理出现了学校管理与教育行政机构管理的二元矛盾局面,“校长负责制”一直处于理论主张或政治理念状态,其根本原因是学校的“行政化”.“教育资源公平配置”的呼声则是对教育行政机构职能转型的呼吁。笔者认同这样的观点:学校管理是教育管理的核心[1],但是问题解决的根本办法是“依法办学”和“职能转变”,在这两个方面,不仅需要充足的司法资源,更需要更合理、更科学的资源配置手段,使得学校管理和教育行政管理具有同向的逻辑,使后者成为前者的有力支撑。教育管理的改进和提升关键在于教育管理需要专业化的先进的管理工具和技术,以便教育管理的决策与服务是建立在充足的教育信息和科学的数据处理基础上,以便教育管理能充分挖掘和利用教育系统内外部资源,更好地实现教育发展目标。

局限于定性或“主观”判断等人为因素的传统教育管理模式,在信息化时代遇到的主要问题是如何利用现代信息技术手段和平台,对海量、复杂、多变的教育信息进行高效、专业化的数据处理,以便适应教育大变革的时代需要。

二、教育管理的工具理性向导

在管理学上,工具理性是指管理活动的实效价值取向,即工具价值,主张管理者“最重要的问题就是能够找到解决事情的方法、途径,它最大的兴趣在于选择最优方案、决策和手段,它关心技术上的可操作性。”[2]

这是西方管理科学的主流。自从20世纪80年代引进中国后,工具理性也逐渐成为我国管理学领域的主导观点。但是,西方的工具理性和价值理性,并非绝对的相互排斥,而是在于行为者所处的环境而有所侧重。我国的教育管理领域,由于长期的形而上的宏观目标主导,又缺乏相应的目标实现工具和路径,基本上偏向于价值理性。这是我们不能忽视的特殊语境。

但是,过去30多年来,教育管理中到处充斥着各种表现形式的“工具理性”,其中很多甚至可以称之为庸俗化的工具理性:对工具理性的泛化[3],将方法手段目的化,分数至上的评价导向,“应试教育”泛滥等等。正是这种对工具理性的误解、曲解和滥用,导致了教育的极端功利性[4],更混淆了教育管理者对工具理性的认知,将“工具”和“价值”断然割裂,一味批评甚至否定“工具理性”,造成了教育管理工具理性和价值理性的“必然”对立与矛盾[5].那么,在教育管理领域,正确的工具理性是什么?

教育管理是一个多要素复杂关系的实践过程,为分析方便起见,笔者提取教育管理的四个基本要素,构建了一个逻辑框架。

管理目标是一个综合的预期指标,包含教育的预期成果(技术指标)和教育价值期待,在管理过程中始终应发挥导向引领作用;教育发展和改革的任务是一个特定时期的教育实践过程,进行发展性评价和过程性管理;教育方法包含了为完成任务而应用的工具、手段及技术,是教育管理中的关键要素;对教育效益的评估,是多元化多样化的,评估主体有教育行政部门、教育评估专业机构、学校、教师、学生和家长等,评估对象包括区域教育发展、学校教育发展、学生综合素质发展、教师专业发展等。这些要素的信息含量不仅巨大,而且多样化,更重要的是要素之间存在复杂动态的数据关系。教育管理中关注的核心是教育品质,即教育管理的价值理性;但是,如何保障和提升教育品质,需要严谨、专业化的教育过程和方法。因此,教育管理中的工具理性尤为关键,只有以翔实专业的教育过程、方法和技术等“工具”要素为基础、载体、平台、保障,才会产生合格、优质的教育品质,实现教育的目标价值。

可见,现代教育管理中的这种工具理性,不以自身为目的,而是以价值理性的实现为使命。建立在现代科学技术基础之上的教育管理的一个重要属性正是工具理性,并随着“工具”-技术的不断发展升级而相应更新其内含和外形。以数字化、信息化为主要技术手段与平台的当今教育管理,其“工具理性”也将随之更新换代。

三、教育的大数据时代导向

把云端技术看作是基于超级储存服务器的一种软件技术,这只是网络技术发展进入崭新时代的一个表象,云端的革命性价值在于信息处理的高效率和低成本。由于“云”的产生,信息转型为“大数据”,于是,信息时代跨入了大数据时代。云技术和大数据处理,掀开了智慧世界的序幕。教育管理,也可称之为教育的信息处理过程。不可抗拒地也要进入大数据时代,进入智慧教育[6]的新天地。

教育目标、任务、过程方法、效益评估等诸多要素所富含的数据极为庞大复杂,形成了教育的大数据,也具有大数据的基本特征。即:

1.超级体量

从“数据”的角度看,教育管理所涉及的数据是庞大的,而大数据首先就是超级体量的数据。无论是教育的私有云(如一所学校),还是区域教育的公有云,其存储的教育数据无法使用目前的GB级资源服务器,显然也很难使用现有的数据库服务器来处理教育大数据。

2.类型繁多

体量宏大的教育数据,是教育过程中的每一个任务类型的活动信息数据化结果,教育自身是一个复杂多变的大系统,教育与社会各个领域、层面的交互所产生的数据也极为庞杂,如此庞大数据的教育体系以视频、音频、文本、图片等格式在云端上“读写”,形成了一个类型繁多的教育虚拟现实。

3.极速处理

面对大体量、多类型的教育数据,云技术的应用使得教育大数据处理变得高效率。理论上,基于云技术的大数据处理,速度极快,且具有很强的灵活性,能够快速处理复杂动态的教育大数据,节约教育管理和教育决策的时间成本。

4.低密价值

大数据几乎能对教育管理过程中所涉及到的信息进行“实录”,包含了大量的原始数据和信息,对教育管理行为而言,并非所有的数据都是有管理价值的,相反地,只有极少部分的数据会被管理行为利用。因此,数据处理的大量工作是用于甄别有价值的数据,从而用于教育管理的相关的数据挖掘和信息处理。

以上四个特点,将成为教育管理模式变革与创新的参照系。这是因为在大数据时代,教育管理必须统筹考虑以下几个问题:

1.教育资源的配置问题

教育研究者,乃至其他的社会人士,共识到教育改革的核心问题是教育体制。深入研究会发现,教育体制的实质内涵是对教育资源配置的制度性框架,核心是教育资源配置。在大数据时代,教育资源体量巨大,结构复杂,状态不稳定,专业的、合理的资源配置对教育管理者来说始终是最艰难的工作,如果以现今大多数的教育管理者用人工水平的手段和技术配置教育资源的状况来看,要胜任这项工作更是难以想象的。我们已经有了很好的理念--教育资源公平配置,我们需要实现这一理念的技术手段。这一问题的研究文献大多停留在政策理论或关联性问题研究上,如资源配置效率的研究等。对于如何实现教育资源的公平配置(核心是“公平”,而不是“效率”),现有的研究成果和实践案例难以提供问题解决的有效方案。

2.教育评估的价值取向问题

没有评估就没有管理,教育评估是教育管理的主要工具之一。评估是对教育目标的指标化计算和检验,衡量教育发展的质量和水平,发现和诊断教育发展问题,为教育改革提供科学依据。现代教育科学发展,已经研发了丰富的教育评估工具。但在教育评估实践中,面临的主要问题不是工具问题,而是价值问题。“应试教育”之所以经久不衰,是庸俗工具理性在不断发酵作用,教育管理者将考试的分数当成了教育发展的数据,用“分数面前人人平等”的伪命题来主张教育评估的价值取向,结果可能造成教育管理中的工具理性与价值理性的割裂。教育评估要以数据为资源支撑,这是毋庸置疑的,问题的关键是:什么是数据?如何处理数据?

教育数据的统计分析如何为教育目标的实现提供正确的导航?

3.教育决策的科技含量问题

教育决策是教育管理的高端行为,是对教育发展和改革的战略规划与策略计划。教育决策的可行性、合理性和实践性[7],取决于教育决策的科技含量,即教育决策行为的工具、手段、逻辑路线等科技要素的应用。有学者指出:“长期以来,地方教育管理部门往往热衷于制定和落实各式各样的政策,但政策评估却是薄弱环节。”[8]教育政策是教育决策的载现方式,这里的“政策”不应简单等同于“政治策略”,教育政策首先应以事实(数据)为依据,以结果(数据)为导向,以专业行动(数据处理)为手段,完成教育发展改革的任务,实现教育目标。

4.教育管理者的专业能力问题

归根结底,教育管理、教育决策的科学性源自于管理者决策者的专业性。“畜牧兽医局局长转任教育局局长”[9]的现象并非个别,在信息化时代,教育管理者的专业能力受到严峻挑战,农村地区更甚。多年来,教育行政领导的行政领导力不断被强化,而专业领导力则变得相当“软”,对此关注也极为罕见[10].“教育官员”在政策法律培训远远多于业务培训,信息技术应用的培训更是难以满足教育管理中信息技术应用的需要。

对以上两个层面进行交叉分析,可以发现:一方面,大数据时代对教育管理提出了严峻的挑战,后者仍然显得相当被动,应对挑战的策略偏重于“硬件”系统建设,忽视了管理者信息化能力提升问题;另一方面,教育管理迫切需要大数据处理,需要教育云的支撑,需要建设以人为本的智慧管理系统,以便快捷、高效地处理复杂的日常教育事务,科学、正确地引领教育发展。教育管理面临的大数据时代的挑战与机遇,是双重的考验。从教育信息化到智慧教育,从教育信息管理到教育大数据处理,会引发具有革命性意义的教育管理模式变革,会引起教育发展的断层式跨越,正如席卷全球的工业革命彻底改造了农业生活,数据革命也将很快颠覆传统的工业化生产生活方式,将掀开智慧时代的序幕。这个新时代里,大数据、云处理,成为互联网+的原动力。这个问题放在当今复杂多变的世界格局中审视,是一个刻不容缓的战略问题。

四、教育大数据管理模式

大数据对教育管理模式产生深刻的影响,对教育管理模式的构建提供了创新性的技术手段。教育管理的转型与建构也具有大数据的新特点。

1.教育管理的大数据特点

首先,大数据营造了教育管理的开放大环境。基于其开放性,与传统教育管理的科层结构相对应的条块分隔式的信息不对称将被平坦化的教育大数据供给关系取代,对教育管理决策环境的影响是深刻而巨大的[11];基于大环境,教育管理的顶层设计将不仅使用教育底层数据--诸如学生成长和教师发展的原始数据,而且大量、多变、生成性的教育系统外部的社会资源和数据,可能对教育管理决策产生某种程度的影响--干扰或促进。

其次,大数据的原始性与极速处理特征将促成教育管理的碎片化特点。教育管理与教育活动同伴而行,其对象数据包含了教育过程的最真实的主体、活动、结果等原始数据,需要即时处理,因而教育管理表现为碎片化的行为过程。

第三,大数据的低密价值特征促使教育管理的简约专业化。教育管理系统不仅是教育海量数据的云端储存库,更是教育大数据的专业化处理平台,各级管理层面将按照其管理策略要求,以核心管理要素建立简洁的数据模型,实现高效的管理目标。

2.教育大数据管理的模型构建

20世纪50年代以来,西方教育管理经历了若干种教育管理模式嬗变,从“正规模式”“学院模式”……到“文化模式”[12][13],不同的模式以各具特色的理论为依据,因而也各具不同的角度。过去三、四年,我国一些年轻学者(硕士、博士)也在研究中西方的教育管理问题,但多是做“理论研究”或者“理论思维模式”建构,基于教育管理实践或者教育管理实践研究(行动研究)的成果有待丰富。

正如2014年全国教育工作会议提出的,今后一个时期我国教育管理的目标是“加快推进教育治理体系和治理能力现代化”,我国的教育管理模式将发生质的变革。笔者抛砖引玉,尝试构建的是一种基于教育管理实践核心要素的教育大数据管理模型。

大数据支撑的教育管理模型:以“主体、对象、资源、目标”为核心要素,建立多级连通共享的教育云,构建教育管理复杂系统,利用云技术处理教育云端大数据,为教育公共服务机构、教师和学生提供全天候多终端个性化需求的教育资源服务、专业发展服务和综合素质发展服务,提升教育资源配置的合理性和公平性,提升教育决策科学化水平。大数据教育管理新模式。

在大数据时代,教育管理主体具有多元化和专业化的双重特性,决定了教育管理行为的多样性和专业性。教育管理体制的多元化,要“允许和鼓励”社会专业机构作为“第三方”参与教育管理过程,承担某些专门领域的教育管理活动,如教育评估;“校长”和“教师”作为管理主体,就是落实“校长负责制”或“第一责任人”的具体方式,让教师--尤其是优秀教师来管理学校,是校本管理的根本标志。

在教育管理中,人的因素是重要的教育数据,是一切教育数据的来源。除了教育系统内部的人员,还包括教育所涉及到的社会各方面人士,都是教育数据产生的来源,收集、整理和挖掘“人”的教育数据,将是大数据教育管理体系中最庞杂的行为。

教育资源的配置,首先要进行科学合理的资源分类。或许这样的分类还显得粗糙,但这是教育管理的基本资源配置:“人才资源”--教育人才和教育所培养的人才,这是核心资源;财物资源--可视为教育的硬件管理或物质配置,财力和物力是教育资源的基础配置;知识资源即教育知识,属于广义的资源,教育内容、教育理论、教育方法、教育经验等,是教育资源配置中的隐性资源,却是根本资源;技术资源是大数据教育管理的生产力资源,教育技术尤其是教育信息技术、大数据、云技术的应用,是管理主体满足教育服务需要,合理配置教育资源的应用型资源。

大数据教育管理的目标是建设以智慧教育为标志的现代教育治理体系:为人人提供适合其发展的教育资源,实现教育资源的公平配置;建立基于数据(Data-based)现代化教育公共服务体系;提升教育管理主体和教育服务对象的数据挖据利用的能力,从而实现教育管理模式的根本转变,推进教育的智慧化发展。

3.教育大数据管理的行动路线图

教育大数据管理是一个长远的伟大工程,从当前的教育信息化建设水平和面临的挑战综合考虑,还有相当长的路程要走。我们需要在思想上、理论上和实践上全面推进,迫切需要制订正确而长远的行动路线图。

这是三个层级的运行策略:底层是大数据教育管理的基础建设--教育云的建设,各区域应遵循国家教育数据标准,建设分布式教育数据中心(云)--资源库+数据库+数据关系逻辑的建构,为云端教育教学资源配置提供基础硬件支撑,进而建设三层智慧平台--智慧校园、智慧学堂(课堂)和智慧终端(尤其是移动终端)--应用平台建设,同样作为基础层级的是教育资源的大数据挖掘--对教育过程所产生的数据进行统计、分析、建模等处理,为教育管理决策提供数据应用;位于高层的是教育大数据管理的操作系统,从公共服务到学生个体发展,利用大数据进行教育资源的公平配置和个性化供给,推进教育发展与改革,使人人享有优质恰当的教育资源,促进教育的优质可持续发展,推进教育品牌建设和创新提升,形成高效绿色的教育文化。

五、结束语

综上所述,笔者初步认识:在当今大数据时代,教育管理应全面走向数据挖掘与大数据引向的教育变革,实现教育管理理论、手段、技术和文化上的方式转变与模式创新,这是大数据时代教育管理变革的基本航向,也是现代教育管理面临的重大策略课题。

参考文献:

[1]张新平。析教育管理问题说及其问题[J].教育理论与实践,2006,(3):15-18.[2]吕力。管理学的元问题与管理哲学--也谈《出路与展望:直面中国管理实践》的逻辑瑕疵[J].管理学报,2011,(4):517-523.[3]殷旭彪。论信息技术在教育应用中的技术理性[J].中国远程教育,2011,(2):26-29.[4]洪超。功利主义何时休?[J].江苏教育,2004,(5A):32-33.[5]张兴峰。教育功利化现象审视:工具理性的视角[J].教育发展研究,2008,(21):32-34.[6]唐斯斯。智慧教育与大数据[M].北京:科学出版社,2015.[7]黄忠敬。教育决策科学性的标准[J].教育理论与实践,2000,(2):20-23.[8]杨润勇。地方教育决策如何提高科学性之一[N].中国教育报,2014-01-02(06)。

篇5:大数据分析师究竟是干什么的

全民大数据的时代里,产生了一个新的职业。大数据分析师。那么什么是大数据分析师呢?大家都是知其然而不知其所以然。相信大家都会很好奇在大数据培训之后,我们的工作内容是什么吧。我们可能会去到的公司。那么,科多现在就带你一起,走进大数据分析师的世界。

现代生活中的我们,无时无刻不在产生着大量的数据,从咱们睁开眼洗漱的那一刻起就已经有数据开始产生并被记录。一直到晚上咱们关灯正式休息。可以毫不夸张的说,现代社会就是一个大型的数据库,咱们每个人都是一个数据源。每天咱们产生的数据被分类汇总到各类数据库中。当千千万万个我们这些数据源产生的千千万万的数据分类汇总到一起那就是大数据。而大数据分析师的工作内容。就是使用各种分析手段对大数据进行科学分析、挖掘、展现并用于决策支持的过程。

那么大数据分析师与传统的数据分析师之间有什么区别呢?数据分析可谓由来已久,举例说明一下。帐房先生在某种意义上讲也可以称之为数据分析师,分析着往来帐务、应收、支出等,传统的数据分析师只是基于自身数据的统计而已。所以相较于传统的数据分析师来说,大数据分析师首先要学会的就是打破信息孤岛利用各种数据源,在海量数据中寻找数据规律,在海量数据中发现数据异常。根据项目设计开发数据模型、数据挖掘和处理算法;通过数据探索和模型的输出进行分析,给出分析结果。

而现在大数据的发展深受国家和企业的重视,大数据的相关产业的发展也是成井喷式爆发。但是大数据的人才缺跟不上大数据产业发展的步伐。按照对于各大招聘网站的大数据统计,我国大数据人才的缺口在150万左右。大数据人才的平均薪酬也在15K左右,即便是实习生也是6K到8K.。国家和企业也越来越重视大数据培训,意在搭建自己的大数据团队。

在成都,科多大数据作为国家工信部大数据授权的人才培养基地、工信部大数据工程师授权认证中心中国智慧城市大数据技术创新联盟副理事长单位。成都大数据技术产业创新联盟会长单位也成为了贵阳大数据交易所、亚马逊大数据的认证合作培训机构。成都大数据技术产业创新联盟、成都大数据俱乐部的认证合作培训机构。其授课老师团队由国家大数据标准制定专家组成员、企业大数据总架构师、电子科大大数据研究中心教授们组成。

而现在的大数据分析师也不在仅仅是简单的IT工作人员,而是可以参与到企业决策发展制定中的核心人物。当然这都是譬如总架构师之类的大数据分析师了。普通的大数据分析师还是主要对各类大数据进行分析形成项目所需要的报告。

如果用举例子的办法来说明大数据分析师的工作的话,咱们的信用征信大数据。现在的支付宝和微信都是大家常用的支付软件,而在支付宝中也有各种类似蚂蚁花呗、借呗、分期等等金融产品,而且它还有一个芝麻信用,以芝麻信用来评估咱们的信用等级。那么芝麻信用是怎么判断的呢??它参考的大数据就是阿里体系内的电商交易数据、互联网金融数据、集团体系之外的公安网、最高法、工商、教育部门等公共机构以及其合作伙伴数据。还有咱们用户自己上传的数据。大数据分析师的工作就是对大数据进行用户行为分析,进行用户画像,使用分类算法及数据对比算法等一系列手段来进行风险评判与决策支持。充分利用大数据带来的价值,在进行数据挖据与展现后,呈现给企业决策者的将是一份清晰、准确且有数据支撑的报告。这就是大数据分析师的工作。这就是大数据分析师!

篇6:我区电子商务大数据分析报告

现象学不仅是哲学而且是方法,现象学从一般意义来说有先验、解释、发生三种,这三种现象学所采用的研究方法一般有先验研究、解释学研究以及体验研究。在大数据背景下,使用者三种方法看待实验室研究,这三种方法能否成功运用,一要看先验研究以及解释学研究中确立的“意向性”,二是这种“意向性”能否成功运用到体验研究。

1大数据实验室的现象学先验研究

实验室研究一般会被误认为就是实证研究,实验是使用理性的逻辑作用于具体的实物,研究者会受到具体经验以及假设观念理论的影响,并且强调将这些因素“不带偏见”的面对客观事实,在实验室研究中我们必须紧紧地围绕研究对象。在新时代背景下使用现象学先验视角审视大数据实验室研究。

何为先验,康德说:“先验包含了一切质的可能”也就是说,先验就是对具体经验的超越,它包含了具体经验的一切。那么在大数据背景下,实验室的研究是结合世界上所有的数据,包含进了一切的人类知识。大数据下的实验室研究不仅是少数人参与到实验室的研究,而是通过全球化的数据连接,将单个实验室的研究扩展到全球,使实验室研究社会化,它集中人类的知识、智力以及资源进行最优化研究,它囊括了一切人类知识的总量。

从另一个方面来说,现象学的先验研究注重主体性,研究对象要围绕研究人员转,研究人员用自己的视角假设去迫使研究对象显示真相。在大数据背景下,实验室研究人员首先要构建的自己假设前见,确立自己的研究视角,接着再从海量的信息中,抽取符合自己“意向性”的信息。就像胡塞尔所说的“向来人们都认为,我们的一切知识都必须依照对象;但是在这个假定下,想要通过概念先天地构成有关这些对象的东西以扩展我们的知识的一切尝试,都失败了。因此我们不妨试试,当我们假定对象必须依照我们的知识时,我们在形而上学的任务中是否会有更好的进展”。大数据时代背景下,实验室研究人员可以充分自由的构建自己先验世界,再根据自己的先验世界去提取相关的信息,用这些信息去达到对实验对象本质的暴露。传统实验室研究总习惯于根据实验对象来确立所使用的知识及方法,按照确定的步骤进行相关的操作,正因为此,传统实验室研究中总会受到诸多的限制,科研人员的思维以及思想难以有大的突破。现象学中的先验研究,首先在思维上要求研究人员充分的发挥思想的作用,实验室研究中所作的一切都要围绕这个思想服务,而不是让科研人员屈服于研究对象,这种新的研究思维及方式在一定程度会促进重大科学的发生及发现。就像牛顿研究宇宙,试图去理解上帝奥妙的时候,它也是充分的构建自己的先验世界,宇宙构造可能会有多种情况,其发现万有引律,就是一个典型的例了,使用新的路径出发时总会在意外之中有重大发现。

2大数据实验室现象学解释学研究

解释学现象学重视实验室研究人员凭借研究自己的主见和前见与信息或文本开展对话,使研究刘象围绕研究人员转,但这并不意味着研究人员不顾事实或曲解及歪曲对象甚者编造数据。如果实验室研究人员在实验室研究中发现原有的假设不符合事实,那么实验室研究人员需要调整原来的假设使其符合事实。当然,当我们的假设与实验研究对象出现短时间的不符合时,实验室研究人员不可轻率的抛弃先前的假设和独特的视角,不可围绕着实验对象跑而缺乏主见。

解释学现象学中实验室研究人员的主见或前见在一定程度上有其适当之处。海德格尔指出,“任何解释工作之初都必然有这种先入之见,它作为随着解释就已经‘设定了的’东西是先行给定的,这就是说,是在先行具有、先行视见和先行掌握中先行给定的”,即实验室研究人员在进行相关的解释,是通过这种先行的要素起作用的,把实验室研究中的某一物解析为另一物时,起主要作用是具有以及掌握先行的视见而确定的。伽达默尔接着指出,“前见其实并不意味着一种错误的判断,它的概念包含它可以具有肯定的和否定的价值,他认为前见首先是判断的方式,它并不因为见解上的错误而受到排除,相反,前见是给定于最后考察一切事情中的决定性的要素之前,在胡塞尔和海德格尔那,前见都有其合理性。可以说,前见在大数据下实验室研究具有重大价值,实验室研究人员的确使广大的实验室研究人员与信息数据对话,具有高度的创造性,可以按照自己的前见进行相关的实验活动而不必摇摆不定。正是因为实验室研究人员有了自己的前见,才敢于冒险,不断的激发实验研究人员的创造性,在与数据信息的对话交流中,达到了视界的融合,使研究人员和数据信息两者都重新获得理解。

3大数据实验室的现象学参与式和体验式研究

在大数据时代背景下,实验室研究人员可以充分地构建自己的先验世界,进行相对应的先验研究。但先验研究因为过于强调研究人员的主体性,在一定程度上会产生唯我中心论,那么此时参与式研究就成为了解决先验研究中不足的一种方法。大数据时代背景下的实验室研究,研究人员根据自己的需求挑选所需的数据信息,经过数据技术的分析,得到所需的结果。但这不意味着在大数据下,实验研究人员仅作为一个旁观者,或只是对象性研究。在面对海量信息得到实验结果后,更重要的是要参与到实验中,根据数据信息所给的步骤结果,真正的动手操作,与实验对象所接触,“知觉”实验刘象,与实验对象之间建立亲密的某种关系。与实验刘象融为一体,将实验对象的发生变化与特定的因素联系在一起,去认真思考,以便达到对大数据所给相关知识的理解。参与式的现象学研究实际上已由原来探求知识的认识论转化为以“知觉”或操作者使用为特点的存在论。

不过,现象学当纯真非主体的做法是体验研究。而实证研究则是多数以逻辑概念思辨或以量化的数据统计,是与体验研究对立的。参与式与体验式在现象学研究中的差别在于,从主体上说参与式研究是自己,是自己参与到实验对象中间;体验式研究则是实验的对象,相当于实验对象自己研究自己,研究者不直接参与到研究对象中去,不干涉研究对象,研究者退居幕后,让实验对象任其自由自在变化的发展。比如说,一个实验研究人员要研究某地人群疾病发生的致病因数,除了经数据信息分析以及在实验室检验和分析样本外,实验研究人员要置身于当地人的生活中去,并对当地人的生活不加以任何形式的干扰,详细记录当地人每天的日常饮居;跟当地人不断的交流情感,倾听当地人与邻居、家人以及亲人的交往故事;观察当地人的劳作,详细了解他们的饮食以及生活的自然环境,将这些因素的联系以及相关的数据数值进行详细的记录。体验式研究不单要求实验室研究人员倾听、了解以及记录实验对象的事,使实验对象的思考和言说显示为“非对象性的言与思”,而且要确使实验研究人员在记录和分析实验报告的过程中尽可能的避免过度的归纳与概括,进而保持记录的“非对象性的言与思”。

4大数据实验室体验研究的路径

现象学研究在人文社科类的研究倍受重视,现在我国每年召开一次现象学与科技哲学学术研讨有意将现象学的研究方法引用到科学技术因为传统的实证研究过于重视研究结果,对研会域的结果过于乐观,而对研究的过程相对比较轻视。实证研究者确信他们收集的相关事实经验能理解和说明自己的考察对象。而现象学方法在一定程度上则是对实证研究的不信任和怀疑。现象学对实证研究的质疑主要有:人不能保证自己所听或所看的信息数据就是对象的本质,研究人员所使用的实证研究得出的结论不一定与事实的本质相符,进一步说,我们怎么才能真正认识别者。比如说,实验研究人员可以通过测量一张桌了的重量、宽度、长度以及了解桌了的用途和木质以及颜色等,实验研究人员也可观察一个病人的气色,通过仪器了解病人内部发病的机理,但对桌了和病人自身的秘密实验研究人员却无法去认识。因为研究人员所认识的只不过是从外部特征对桌了或病人的主观解释,都源于研究人员的“主观”意见,对其内在的本质却无从得知。

那么要如何认识对象的本质呢?现象学的体验式研究思路是:

第一,将自己置身于研究对象本身的特定环境和特定条件下,重视研究对象之间的环境体系及历史的联系和精神的交流。传统的实验室研究中充斥着实验现象、结果、数据以及结论等种种的分析等方面的知识考究,而对于研究对象精神联系,以及实验的情感态度,内心体验却少有考虑。与之相反现象学的体验式研究,更关注研究主体以及研究对象的内心体验或内在的精神联系。实验室研究人员在实验研究的过程中,内在的感情思想以及对问题的思考、实验过程的灵感以及顿悟,这些在现象学体验研究中将受到重视,而不是像实证研究中,为了达到确定的目的,而往往将实验科研人员的这些因素忽视掉。在现象学研究中,它关注实验研究者跟实验对象精神以及情感之间的联系。如果实验对象是人,那么我们将更加注重对象的内心体验,重视对象的内心承受力,对对方予以重视和尊重;如果实验的对象是物,那么我们在做研究的过程中应该将物与所处的环境体系以及相关的历史背景联系起来,以及实验对象对人的情感价值和精神的交融。

第二,对实验对象的体验描述要通过语言及“象”的艺术化来替代概念化而保持其完整性和真实性。在现象学中存在语言表述的困难,因为物即使存在而被认识,也很难言说,现象学所做的努力依然是使物能“言”,现象学的体验研究要依赖实验研究者个性化和艺术化的语言。现象学方法也可以说是带有“艺术性”的方法。从另一角度上来说,现象学这一词重要不在于“现”,而在于“象”。现象学来源于却不直面于现实世界,它是重在用类比中某物“象”某物的思维来阐述和理解现实。“象”虽然不是通过归纳和演绎方法得出,而是使用常规的科学方法去推理演绎得出,但类比的想象可以使人在人与自然对话中获得理解,在观察和实验的过程中可以获得灵感,在先验和经验世界搭建沟通桥梁,从而使实验室研究达到对经验的超越。

第三,实验研究人员与实验对象建立某种紧密的存在关系,放弃实验研究人员的研究态度。为什么要实验研究人员与实验对象建立紧密关系呢?一是因为实验对象无法言说。即使能言说,实验对象的体验也不是最初的真实体验。二是实验研究人员的复述也无法言说。实验研究人员难以复述实验对象的体验,或者说当实验研究人员再次复述实验对象描述的体验时就离实验对象最初的体验更加遥远。从另一个方面来说,即使研究人员用艺术化替代概念化的语言去阐述实验对象的体验,这种阐述不能保证实验对象体验的完整性和真实性。概念化的归纳总结以及艺术性的总结都不能对实验对象的体验进行描述,体验式的现象学研究的重点是体验而不是研究。当实验研究人员与实验对象在一起时,实验研究的过程就可以理解为要与实验对象建立某种紧密联系,实验研究人员的研究要由认识论中“要认识你”的态度转变为存在论中的“和你在一起”的态度。

5结束语

对于现象学而言,大数据下的实验室研究在一定意义上说并不完全是实证研究,在一定程度上,实验研究人员应该是实验对象的倾听者、交流者以及陪伴者。那么此时现象学的意向性就体现为精神或情感的关系。从表面上,看精神与情感是来源于观察和了解经验事实的基础上,但真正的精神和情感是来自于人的先验意识。实验研究人员对实验研究的动物有感情与同情心,是因为动物是人类的朋友,而不是动物给他的研究带来多大好处;实验科研人员对某一方面的实验对象现象敏感察觉,是他先天所俱来的内心精神的本能,而不是他对这看了多少书、了解了多少事实的经验。

篇7:大数据实例及未来发展前景

大数据 (Big Data) , 也叫巨量资料。由于它所涉及的资料量规模巨大, 因此无法通过目前的主流软件工具, 在合理时间内进行撷取、管理和处理, 并整理成更加有助于企业经营决策的资讯。“大数据”是业内的热门词汇, 描述了企业大量积累、存储和挖掘大文件 (400GB到TB级) 的现象。随着信息质量、种类和丰富性达到新的水平, “大数据”的发展日臻成熟。

大数据的特点

对于大数据, 现在比较流行的是用4个“V”来总结其4个层面的含义:容量巨大 (Volume) , 数据已从TB级别跃升至PB级别;数据类型多 (Variety) , 从普通的文字、视频、图片到逐渐增多的地理位置信息等, 类型纷繁, 已无规律可循;价值密度低 (Value) , 以视频为例, 在连续不间断监控过程中, 可能有用的数据也许只有一两秒;处理速度快 (Velocity) , 实时分析对某些应用才更有意义, 而不是批量式分析, 即时处理已经成为一种趋势。

大数据管理技术

人们对大数据的关注度在不断升温, 而大数据管理的技术也层出不穷。在众多技术中, 有6种数据管理技术普遍被关注, 即分布式存储与计算、内存数据库技术、列式数据库技术、云数据库、NoSQL、移动数据库技术。其中分布式存储与计算受关注度最高。分布式存储与计算架构可以让大量数据以一种可靠、高效、可伸缩的方式进行处理。因为以并行的方式工作, 所以数据处理速度相对较快且成本较低, Hadoop和NoSQL都属于分布式存储技术的范畴。

内存数据库技术可以作为单独的数据库使用, 还能为应用程序提供即时的响应和高吞吐量, SAP的HANA是该技术的典型代表。

列式数据库的特点是可以更好地应对海量关系数据中列的查询, 占用更少的存储空间, 这也是构建数据仓库的理想架构之一。

云数据库可以不受任何部署环境的优势, 随意进行拓展, 进而为客户提供适宜其需求的虚拟容量, 并实现自助式资源调配和自助式使用计量。目前微软的SQL Server可以提供类似的服务。

甲骨文在2011年推出了Oracle NoSQL数据库。NoSQL数据库适合于庞大的数据量、极端的查询量和模式演化。企业可以通过NoSQL得到高可扩展性、高可用性、低成本、可预见的弹性和架构灵活性的优势。

移动数据库技术是移动计算的产物。随着智能移动终端的普及, 人们对移动数据实时处理和管理要求的不断提高, 移动数据库具有平台的移动性、频繁断接性、网络条件的多样性、网络通讯的非对称性、系统的高伸缩性和低可靠性以及电源能力的有限性等。

大数据的应用实例

实例1:《纸牌屋》

《纸牌屋》是全球最大的流媒体运营商Netflix首次自行制作, 并且完全依靠网络发行的电视剧, 它的热播使Netflix订户数超越了传统的HBO电视网。

《纸牌屋》的走红是必然的, 它是大数据分析在具体行业成功应用的经典案例。美国新闻网站Salon.com曾这样描述:用户只要登录Netflix, 其每一次点击、播放、暂停甚至看了几分钟就关闭视频, 都会被作为数据进入后台分析。这样一来, Netflix就能精确定位观众的偏好, 比如“最爱Kevin Spacey”, 或者“最爱政治剧”。Netflix在拍摄前事先分析了订阅用户们的观影数据和操作习惯, 保证其首部原创剧集可以精确命中最大量的潜在观众。Netflix在决定投资翻拍《纸牌屋》前做了两件与大数据分析紧密相关的事:挑选演员、决定播放形式。

追踪和分析订阅用户数据并不简单, 基于基础数据派生的扩展数据量非常大。这一过程不仅仅要分析观众喜欢看哪些主题的电影和偏好, 还要统计观众如何观看电影和观影过程、观影过程中暂停的次数、会在看到几分钟的时候关闭视频等等, 这些操作都会被作为数据进入后台分析。过去, Netflix只是用这些数据来做影片推荐。如今, Netflix会投其所好, 根据这些内容拍摄用户感兴趣的电影。

通过数据分析, Netflix发现喜欢观看1990版《纸牌屋》的影迷们同时喜欢看导演David Fincher的作品。另外, 他们会经常观看奥斯卡影帝Kevin Spacey的作品。因此, 新版《纸牌屋》邀请了David Fincher (制作人) 和Kevin Spacey (男主演) 加盟, 这完全是基于影迷数据分析得出的结论。

实例2:从4天到1个小时——大型在线扑克公司的反欺诈术

欧洲的一家大型在线扑克公司的员工在爱尔兰, 而机房却建在加拿大。在这家公司的网站上有虚拟牌桌, 6—10个人一桌在线玩德州扑克。该公司会从赢者那里提成0.5%, 在线玩游戏的人越多、玩得次数越多, 该公司的盈利就更有保障。

除了吸引更多人来玩在线扑克, 公司更重要的是做好反欺诈工作。玩这种在线扑克时的欺诈行为一般有三种类型:第一, 不同玩家线下串谋, 线上打配合以增加玩家自己获胜概率;第二, 洗钱, 通过信用卡故意将钱输给下家;第三, 外挂, 研究算法比较好的人会自己写程序然后挂到网站上, 可以同时玩100桌获得盈利。

该公司需要将这些欺诈行为全部找出来, 识别不同模式。例如, 他们通过分析玩家每一轮下了多少注、不同玩家之间下注的时间间隔以及非常规打法的记录等大量数据, 就可以判断这些玩家背后是真人在玩还是机器外挂在玩、是否有线下串谋等欺诈行为。

为了识别欺诈, 该公司请来了三位毕业于加拿大某学校的扑克牌专业的博士, 通过算法识别欺诈行为, 并开发反欺诈程序。过去, 他们是将这些记录的结构化数据压缩成一个文档放到数据库里, 需要分析时将文档调出, 用他们花费一年半时间开发的Java软件运行分析, 需要4天结果才能出来, 也就是如果星期一有人做了欺诈行为, 到星期五才能发现。而现在, 该公司用两天时间将算法移植到TeradataAster平台之上, 通过一个开源的解压代码把压缩的资料在库内做解压, 然后在数据库系统内运行欺诈分析。这种做法的好处是大批量的数据不用传来传去, 再加上算法优化之后, 原本需要4天的欺诈行为分析只要60分钟就可以完成了。

大数据的未来发展前景

一、推动信息产业创新

据国际数据公司的监测统计, 2011年全球数据总量已经达到1.8ZB (1ZB等于1万亿GB, 1.8ZB相当于18亿个1TB移动硬盘的存储量) , 而这个数值还在以每两年翻一番的速度增长。预计到2020年, 全球将拥有35ZB的数据量。

随着面向大数据市场的新产品、新技术、新服务、新业态的不断涌现, 大数据将加速信息技术产品的创新融合发展。对数据快速处理和分析的需求, 将推动商业智能、数据挖掘等软件在企业级的信息系统中得到融合应用, 成为业务创新的重要手段。同时, 物联网、移动互联网的迅速发展, 使数据产生速度加快、规模加大, 迫切需要运用大数据手段进行分析处理, 提取有效信息。大数据面临的有效存储、实时分析等挑战, 将对芯片、存储产业产生重要影响, 推动一体化数据存储处理服务器、内存计算等产品的升级创新。大数据应用也使基于云计算的业务创新和服务创新成为现实。

二、推动社会发展

大数据作为一种重要的战略资产, 已经不同程度地渗透到每个行业领域和部门, 其深度应用不仅有助于企业经营活动, 还有利于推动国民经济发展。麦肯锡研究表明, 在医疗、零售和制造业中, 大数据可以每年提高劳动生产率0.5-1个百分点。

宏观层面, 大数据使经济决策部门可以更敏锐地把握经济走向, 制定并实施科学的经济政策。微观方面, 大数据可以提高企业经营决策水平和效率, 给企业、行业领域带来价值。

上一篇:申请调薪的申请范文下一篇:赏月高中作文650字