数据共享服务的农业科学论文

2022-04-27

摘要:针对水稻生产中对品种搭配决策服务的迫切需求,应用铁岭、沈阳和盘锦地区1951—2014年温度资料和1992—2011年水稻产量数据,分析持续低温指数和水稻产量的变化特征。基于农业气候相似原理进行引种,通过持续低温指数估算中熟、中晚熟偏早型、中晚熟品种的水稻期望产量,并制定沈阳地区不同熟期水稻品种搭配策略。今天小编为大家推荐《数据共享服务的农业科学论文(精选3篇)》,希望对大家有所帮助。

数据共享服务的农业科学论文 篇1:

渔村特色信息服务平台构建

摘要:为了实现渔村经济与公共服务的同步发展,体现环渤海滨海地区渔村的个性化特色,本研究以山东省威海市西霞口村为例,通过调查现阶段渔村的信息服务需求,结合渔村的信息资源和发展特色,阐述了渔村信息服务平台的基本功能,按照需求为村民提供有针对性的信息服务及系统设计,研究开发一个适应渔村信息技术应用水平、符合渔村信息化建设要求、具有渔村特色的信息化服务平台。

关键词:渔村特色;信息服务;信息服务平台;山东威海

收稿日期:2013-10-08

基金项目:国家科技支撑计划(编号:2013BAJ10B11)。

作者简介:刘晓宇(1988—),女,山东聊城人,硕士研究生,主要从事农业信息技术研究。Tel:(0531)83178173;E-mail:sharrylxy@126.com。

通信作者,朱建华,研究员,主要从事农业信息技术研究,E-mail:zhujh@saas.ac.cn。季明川,研究员,主要从事生态经济与生态产业研究,E-mail:jmc6677@163.com。环渤海滨海渔村经济比较发达,但经济发展与公共管理未实现同步,文化观念与管理技术手段落后,一些突发事件的解决仍停留在经验判断阶段。本研究以山东省威海市西霞口村的信息资源和发展特色为基础,通过调查现阶段渔村信息服务需求,分析其建设工作中存在的不足之处,按照结构化系统分析与设计的思路,研究开发一个开放的、符合渔村信息化建设要求的、适应渔村信息技术应用水平的渔村信息化服务平台[1]。

1渔村信息服务需求分析

设计渔村服务平台的前提是确定村民的信息需求,按照需求为村民提供有针对性的信息服务及系统设计。为了了解渔村村民对信息的需求,利用德尔菲法,选取威海市成山镇西霞口村、河口村、落凤村以及蒲家柏村等4个渔村的村民进行问卷调查。共发放问卷200份,收回问卷192份,回收率为96%。剔除无效问卷7份后的有效问卷为185份,问卷有效率为92.5%。从调查结果可以看出,村民获取信息的主要渠道是电视、电话和互联网,具体如图1所示。

通过问卷调查的结果分析可以看出,实用科技信息、市场供求信息、农业政策信息、旅游资源开发以及气象与灾害预报防治信息等5类信息是村民最关心的,具体如图2所示。总体来讲,当前村民的信息需求呈现出多样性的特点。

通过调研的结果,可以总结得出村民信息需求的特点主要是:需求信息类别多样化、需求信息渠道多样化、需求信息层次不断深化。

2平台体系结构

系统采用以中间件为基础框架的B/S(Browser/Server)结构来实现,包括表示层、业务逻辑层和数据层。B/S模式的好处是可以在任何地方进行操作而不用安装任何专门的软件,其维护和升级比较简便,能够实现不同的人员、从不同的地点、以不同的接入方式(比如LAN、WAN、Internet/Intranet等)访问和操作共同的数据;系统的扩展也非常容易,成本降低,选择也更多[2]。

本研究在进行充分调查研究的基础上,通过数据库信息采集和实地调查研究获取信息资源,系统所采用的数据库服务器是SQL Server 2008,以Microsoft Visual Studio 2008为开发平台,以ASP.NET为开发工具,以C#作为编程语言,进行各个功能模块的组织,提供用户控制和操作界面。系统业务处理流程如图3所示。

3渔村信息服务平台综合设计

3.1功能模块设计

根据系统的总体需求分析和设计的要求,此平台要具有动态信息上传、信息管理、信息存储、信息交换、信息发布和搜索查阅等功能。

根据系统目标,渔村信息化服务平台可以分为2个部分,即前台发布和系统管理。按照结构化系统分析与设计的思路,前台发布又可以分为3个功能模块,即政务信息模块、资讯平台模块和网上办事模块。通过这些功能的整合,把成熟的信息化管理经验结合到渔村管理工作中,达到辅助管理和科学决策的目的[3]。系统的总体结构如图4所示。

3.1.1前台发布网站的前台主要是用于用户浏览信息和搜索信息。本系统允许2种用户浏览网站,一种是匿名用户,一种是注册用户。匿名用户只能浏览和搜索信息。注册用户可以登录系统,管理自己的基本资料信息,浏览信息、搜索信息、在论坛发表并回复帖子、发布供求信息以及招聘信息等。平台的前台发布分为3个模块,分别是政务信息、资讯平台和网上办事。政务信息主要包括本村概况、新闻政策、通知公告、应急管理以及党建工会等。资讯平台包括供求信息、劳务信息、旅游信息、实用科技、海珍品质量溯源、文化娱乐以及便民服务等。网上办事包括办事指南、表格下载、在线论坛以及投票系统。公众通过对办事指南及办事流程的了解,进行相关的表格下载。登录的用户还可以通过在线论坛发表自己对社会现象及个人关心事件的一些看法,为村民提供一个在线交流的平台。

3.1.2系统管理系统管理是渔村信息化服务平台的重要组成部分,包括用户管理、权限管理、日志管理和数据库管理等几个部分[4-7]。系统管理员通过对用户的管理,实现新增、修改、删除用户的功能。系统管理员通过对权限管理,对平台角色和权限进行管理,每个角色有相应的权限,角色的删除不影响其他角色的权限,只有管理员可对权限进行修改。系统管理员可对平台日常日志进行操作,并删除过期日志,也可将日志导出备份。对数据库的管理是可以进行数据导出、导入及备份等。

3.2数据库设计

本系统所选择的数据库引擎为SQL Server 2008。为了降低代码的重复率并方便维护,在Web.Config文件中写入常用的数据库连接字,在需要使用数据库的页面脚本文件中添加System.Configuration命名空间后,可以很方便地调用 Web.Config 文件中的连接字。当数据库变动时,只需在Web.Config文件中修改相应连接字即可。为了实现数据共享和减少冗余,在设计数据表时,以C#为宿主语言嵌入SQL语句,基于基本表设计了多个视图和存储过程,利用 ADO.NET 技术,较多地采用了GridView控件进行数据绑定和显示。

通过对本系统的功能和结构分析,本系统中涉及的数据信息主要有以下几个数据项:用户相关信息表、共享信息表、交流信息表、供求信息表、劳务信息表以及产品信息表等。主要的数据表包括表1所示内容。

3.3系统实现

3.3.1前台主界面村民登录渔村信息服务平台后访问的第一个界面就是首页,首页效果对于平台的后续访问量的影响不言而喻。所以平台首页的设计非常重要,应注重界面的简洁、明快和易用。系统界面图如图5所示。

3.3.2后台管理功能的实现此平台的后台管理主要涉及对新闻、图片、菜单、用户、日常信息、友情链接、日志、上传文件等内容的管理以及其他的基本管理。主要实现以下功能:(1)新闻管理。添加新闻,在发布新闻信息时管理员需要添加标题及其来源,选择所属栏目,可以插入图片、表格或者链接等;基本管理,对新闻标题、字号大小、来源、所属栏目以及具体内容的管理,可以对新闻进行推荐、置顶、修改或删除等操作;栏目管理,对栏目进行增加、合并、修改和删除等操作。(2)菜单管理。对菜单的名称、链接、排序、添加、修改、删除等操作。(3)用户管理。对用户权限的修改、用户名称和密码的保存或删除等操作。(4)上传文件管理。管理上传文件的分类、名称、储存位置,可以对上传文件进行修改、删除等操作。基于上述的功能需求,设计出的后台管理模块如图6所示。

4结语

本研究用C#编写页面,SQL Server技术构建数据库,建立了基于B/S架构的渔村信息化服务平台。目前在国内农业信息服务平台众多,本系统的特色是结合渔村发展现状,通过调查问卷的形式对渔民信息需求进行分析,在系统的分析与设计部分充分考虑渔村村民信息需求,研发出一个真正符合渔村发展现状的信息服务平台。另外,对平台的功能结构进行了进一步优化,为用户提供了形式内容更为丰富的信息。

参考文献:

[1]黄传尉,望勇. 广东特色农业信息化服务平台构建[J]. 广东农业科学,2009(12):212-215.

[2]刘涛,温晓莉. 基于C/S与B/S结合模式的农业专家信息服务平台设计研究[J]. 河北农业科学,2010,14(5):151-154.

[3]黎冬媛,周文辉,莫剑斌. 基于.NET的农业信息综合服务平台设计[J]. 计算机与现代化,2011,188(4):88-91,95.

[4]曾一,袁纲,张元平,等. 基于Web服务的电子政务数据交换中心的设计和实现[J]. 计算机科学,2007,34(11):98-102.

[5]杨晓霞,高媛. 基于CORBA 构件的农村信息管理系统[J]. 电脑开发与应用,2008,21(5):60-61.

[6]李园,陈世平. MVC设计模式在ASP.NET平台中的应用[J]. 计算机工程与设计,2009,30(13):3180-3184.

[7]王立舒,徐建中,杨广林.基于乡镇的农业信息网络化管理系统建立[J]. 数学的实践与认识,2008,38(15):64-69.

作者:刘晓宇 朱建华 季明川 杨萍 杨洁 王风云 尚明华

数据共享服务的农业科学论文 篇2:

基于农业气候相似原理的沈阳地区不同熟期水稻品种搭配策略

摘要:针对水稻生产中对品种搭配决策服务的迫切需求,应用铁岭、沈阳和盘锦地区1951—2014年温度资料和1992—2011年水稻产量数据,分析持续低温指数和水稻产量的变化特征。基于农业气候相似原理进行引种,通过持续低温指数估算中熟、中晚熟偏早型、中晚熟品种的水稻期望产量,并制定沈阳地区不同熟期水稻品种搭配策略。结果表明:3个地区持续低温指数均呈现出明显降低趋势,铁岭、沈阳、盘锦地区的降低幅度分别为12.4、4.9、11.1 d/10年;1992—2011年,铁岭、沈阳、盘锦地区的持续低温指数均呈现5年的周期振荡,铁岭和盘锦地区还呈现10年的周期振荡;水稻产量的波动变化具有明显的持续低温指数的周期变化特征。在85%保证率下,确定2016—2050年每5年为1个时段不同熟期水稻品种的搭配比例,2016—2020年、2021—2025年、2026—2030年、2031—2035年、2036—2040年、2041—2045年、2046—2050年中熟、中晚熟偏早型、中晚熟品种所占比例分别约为:11.4%、28.8%、59.8%,15.4%、23.8%、60.8%,15.8%、23.2%、61.0%,12.6%、27.6%、59.8%,18.2%,19.6%,62.2%,14.2%,25.4%,60.4%,19.6%,17.0%,63.4%。

关键词:品种搭配;水稻产量;持续低温指数;气候相似原理

尽管农业技术的进步已经显著提高了作物生产系统的生产力,但当今和未来气候变化仍严重威胁着作物生产力的稳定性和粮食安全[1]。2007年第4次联合园政府间气候变化专门委员会(IPCC)评估报告指出,过去的50年,中高纬度地区作物生长季延长,春播提前。全球气候变暖会使中高纬度地区某些谷类作物的产量增长[2]。在粮食產量供需增加以及可以耕作土地面积减小的背景下,为了减轻气候变化对农业生产系统带来的负面影响,或促进气候变化带来的潜在正面影响,人类必须寻求有效的适应性选择策略来应对气候变化,以确保粮食安全。

根据农业气候相似原理,在热量条件得到改善的地区,可引种偏晚熟品种,进而提高水稻产量。农业气候相似不仅包括气候平均状态的相似,也包括极端气候的相似。在当前东北地区热量条件得到改善的情况下,近些年东北地区作物结构和品种布局有了较大的调整,水稻面积及其偏晚熟品种不断向北部和东部扩展,水稻大范围延迟型冷害发生频率有所下降[3]。但是,障碍型冷害呈现频繁而且严重的趋势[4],且进入2000年以后,东北地区的冷害事件呈增多趨势[5],2001—2010年吉林南部和辽宁局部地区在孕穗期、抽穗期的低温冷害发生的次数较前1个10年明显增多[6],其中2009年损失最为严重[7]。当前东北地区引种偏晚熟的水稻品种,更多地是从平均热量条件改善的角度考虑引种的可行性,忽略了低温事件的影响,这是导致当前该地区水稻冷害事件增加的一个重要原因。

由于气候在变暖的同时,其时空波动也在加剧,遭遇严重的低温冷害年将使农作物的晚熟品种不能正常成熟,从而造成产量下降和品质变差[8],对粮食生产的稳定和安全构成严重的威胁。科学合理地搭配不同熟期水稻品种,是充分利用热量资源、规避低温冷害影响、降低引种气候风险的重要措施之一。基于农业气候相似原理,本研究以辽宁省铁岭、沈阳和盘锦地区的水稻产量数据作为当前气候情景下沈阳地区栽种的中熟、中晚熟偏早型和中晚熟品种的代表,评价低温冷害对不同地区水稻(即沈阳地区的不同熟期水稻)产量的影响,制定沈阳地区不同熟期水稻品种搭配比例。研究结果可为指导沈阳地区的水稻生产提供新的技术途径。

1材料与方法

1.1材料

本研究应用的气象资料为铁岭、沈阳和盘锦地区1951—2014年的日平均气温和日最低气温数据(资料来源于中国气象科学数据共享服务网)和上述3个地区的1992—2011年水稻单产数据(资料来源于辽宁省农业统计年鉴)。

1.2试验与设计

当前沈阳地区栽种的水稻品种主要为以沈农265、沈农8801、辽星1号为代表的中晚熟偏早型水稻品种,铁岭地区主要为以铁粳7号、铁粳11号、铁粳12号为代表的铁粳系列中熟品种,盘锦地区为以盐丰47、沈农606、沈农9816为代表的中晚熟品种。如图1所示,1981—2010年间,沈阳与铁岭、盘锦两地的年平均气温的差值介于0.94~1.26之间,沈阳地区年平均气温的标准差为0.58 ℃。沈阳地区的年平均气温服从正态分布,0.05的置信水平可引起沈阳地区平均温度约 1.14 ℃ 的改变,该数值同沈阳与铁岭、盘锦年平均气温差值的量级相当。根据文献及相关的统计数据,沈阳地区约有30%的年份存在不同程度的水稻低温冷害(其中严重冷害约占5%,一般冷害约占25%),本研究将沈阳地区分别按照30%、40%、30%的概率分为低温、正常、高温3类年景,将铁岭和盘锦地区分别按5%、25%、40%、25%、5%的概率分为严重低温、一般低温、正常、一般高温、严重高温5类年景。基于农业气候相似原理,就可得到沈阳地区种植的不同熟期水稻品种在低温、正常和高温年景的产量数据(具体的对应关系见表1)。

1.3研究方法

1.3.1水稻产量的分离方法

一般将作物的总产量分解成趋势产量、气象产量和随机产量,见式(1):

[JZ(]Y=Yt+Yc+Δ。[JZ)][JY](1)

式中:Y为单位面积产量,kg/hm2;Yt为单位面积趋势产量,kg/hm2;Yc为单位面积气象产量,kg/hm2;Δ为随机误差,一般在实际计算中可不作考虑。

趋势产量主要由社会因素(如生产力水平的改变、品种的更新等)和气候状况(如气候变暖等)决定,气象产量主要由气候状况年际间的不均一性等自然因素决定(如低温冷害、高温危害、洪涝、干旱等)。根据GB/T 21985—2008《主要农作物高温危害温度指标》估算,沈阳地区水稻高温危害很小,干旱对水稻的影响也可忽略,气象产量主要由低温冷害决定。

1.3.2冷害指标的选取

持续低温指数(consecutive cold day index,CCDI)定义为1年中(或某个时段,例如5—9月)至少连续3 d日最低温度低于该日多年日最低温度平均值 5 ℃ 的总天数。该项指标具有明确的生物学意义,对东北地区粮食产量也具有很好的低温冷害指示作用[9]。本研究为使CCDI能兼顾延迟型冷害和障碍型冷害的综合影响,将低温强度降低,并根据研究需要,将上述CCDI的定义修正为某地(铁岭、沈阳或盘锦)1年中至少连续3 d日最低温度低于该日沈阳多年日最低温度平均值2 ℃的总天数。

1.3.3其他分析方法

气候倾向率定义为预报量随时间变化的一元线性回归方程斜率的10倍[10],本研究采用气候倾向率评价预报量随时间的变化速率。应用谐波分析方法分析时间序列的周期波动。应用1951—2014年的CCDI统计各个级别的转移概率,按照一阶马尔可夫概型[11]估算未来某一年CCDI处于高、中、低级别的概率。

2结果与讨论

2.1CCDI与水稻产量的变化特征及二者之间的关系

如图2所示,1951—2014年铁岭、沈阳和盘锦地区CCDI均呈现出极显著的降低趋势(P<0.01),气候倾向率分别为12.4、4.9、11.1 d/10年,且3个地区CCDI的最低值、最高值分别为29、165、25、149、5、125 d,分别出现在2004、1957,1988、1969、1995、1957年,最高值与最低值差值分别为136、124、120 d,说明铁岭、沈阳和盘锦地区CCDI的年际间变化差异性很大。然而进入2000年以来,沈阳地区2000—2014年CCDI呈现显著增加趋势(P<0.05),铁岭和盘锦地区2007—2014年CCDI呈增加趋势(P<0.10),表明近些年由于气候波动的加剧,增加了农业生产中遭遇低温冷害的风险。谐波分析表明,铁岭、沈阳和盘锦地区CCDI均呈现出5年左右的周期振荡(P<0.10),铁岭和盘锦地区CCDI还呈现出显著的10年左右的周期振荡(P<0.05)。

应用HP滤波方法[12]对1992—2011年辽宁省铁岭、沈阳和盘锦地区水稻实际单产进行趋势产量和气象产量的分离,如图3所示。1992—2011年铁岭、沈阳和盘锦地区的趋势产量呈现显著增加的趋势(P<0.05),气候倾向率分别为 343.3、379.4、264.8 kg/(hm2·10年),铁岭、沈阳、盘锦地区的趋势产量分别可解释实际产量变化的 20.1%、25.9%、20.4% 信息。趋势产量的预测方程:

[JZ(]yt铁岭=34.328x-60 797;yt沈阳=37.94x-67 815;yt盘锦=26.482x-43 667。[JZ)][JY](2)

式中:x为年份。气象产量在0上下波动,年际变化曲线波动的正、负表明气候变化对水稻产量的影响时正时负,曲线波动的范围则表明气候变化对粮食产量贡献率的大小。谐波分析表明,铁岭(P<0.10)、沈阳(P<0.05)地区气象产量存在着明显5年左右的周期变化,与CCDI的年代际变化特征基本一致。

CCDI与辽宁省水稻产量呈负相关关系(P<0.20)[9]。本研究中铁岭、沈阳和盘锦地区水稻产量与CCDI的相关关系并不显著,低于上述研究结论。这与2个方面的因素有关:一是本研究选用的数据为地区空间尺度的数据,与省级空间尺度的水稻产量数据相比,其随机干扰因素更多;二是水稻产量对CCDI的响应关系并非是线性的,而是非线性的。本研究将水稻气象产量的分级数据与CCDI的分级数据进行独立性检验,结果表明分级后的气象产量与CCDI存在明显相关关系(P<0.10),加上水稻产量的年代际变化特征与CCDI一致,因此铁岭、沈阳和盘锦地区的水稻气象产量明显带有CCDI的信息。

2.2沈阳地区水稻品种搭配比例

本研究认为,水稻产量的年际波动变化主要归结于CCDI的限制,因此探讨CCDI与水稻产量的关系,实际上是研究CCDI与气象产量的關系。CCDI处于低、中、高3个级别时不同熟期水稻对应的气象产量平均值(kg/hm2)见表2。可以看出,在中CCDI年份,不同熟期水稻气象产量最高,高CCDI和低CCDI年份均会使其气象产量下降。

为了通过CCDI预测3个品种水稻产量,给出如下公式:

3结论

本研究根据1951—2014年铁岭、沈阳、盘锦地区日平均温度、日最低温度数据和1992—2011年水稻产量数据,基于农业气候相似原理,通过CCDI预测沈阳地区水稻期望产量,制定沈阳地区不同熟期水稻品种搭配策略,主要研究结论如下。

(1)铁岭、沈阳、盘锦地区CCDI均呈现出极显著的降低趋势(P<0.01),铁岭、沈阳、盘锦地区的降低幅度分别约为12.4、4.9、11.1 d/10年。1992—2011年铁岭、沈阳、盘锦地区的CCDI均呈现5年的周期振荡(P<0.10),其中铁岭、盘锦地区还呈现10年的周期振荡(P<0.05)。

(2)1992—2011年鐵岭、沈阳、盘锦地区水稻趋势产量呈现显著增加趋势(P<0.01),每10年增加幅度分别约为 343.3、379.4、264.8 kg/hm2,3个地区趋势产量与实际产量均呈现显著相关关系(P<0.05)。铁岭地区气象产量明显存在着5年左右的周期变化(P<0.10),沈阳地区气象产量存在着明显5年左右的周期变化(P<0.05),盘锦地区气象产量周期变化并不显著。气象产量的周期变化具有明显的CCDI周期变化信息。

(3)在85%保证率下,每5年制定沈阳地区不同熟期水稻品种搭配策略,2016—2020年、2021—2025年、2026—2030年、2031—2035年、2036—2040年、2041—2045年、2046—2050年中熟、中晚熟偏早型、中晚熟品种所占的比例分别约为114%、28.8%、59.8%,15.4%、23.8%、60.8%,15.8%、23.2%、61.0%,12.6%、27.6%、59.8%,18.2%、19.6%、62.2%,14.2%、25.4%、60.4%,19.6%、17.0%、63.4%。

参考文献:

[1]林尔达,吴绍洪,戴晓苏,等. 气候变化影响的最新认知[J]. 气候变化研究进展,2007,3(3):125-131.[HJ1.9mm]

[2]杨晓光,刘志娟,陈阜. 全球气候变暖对中国种植制度可能影响Ⅰ. 气候变暖对中国种植制度北界和粮食产量可能影响的分析[J]. 中国农业科学,2010,43(2):329-336.

[3]方修琦,王媛. 气候变暖的适应行为与黑龙江省夏季低温冷害的变化[J]. 地理研究,2005,24(5):673-680.

[4]王绍武,马树庆,陈莉,等. 低温冷害[M]. 北京:气象出版社,2009:23-40.

[5]王艳华,任传友,刘刚,等. 东北地区不同季节持续低温指数时空变化特征及其对区域温暖化的响应[J]. 资源科学,2013,35(5):1016-1023.

[6]胡春丽,李辑,林蓉,等. 东北水稻障碍型低温冷害变化特征及其与关键生育期温度的关系[J]. 中国农业气象,2014,35(3):323-329.

[7]马树庆,王琪. 2009年吉林省农业气象灾害及其对粮食生产的影响[J]. 吉林农业科学,2010,35(1):49-52.

[8]姚佩珍. 近四十年东北夏季低温冷害的气候特征[J]. 灾害学,1995,10(1):51-56.

[9]王艳华,任传友,韩亚东,等. 东北地区活动积温和极端持续低温的时空分布特征及其对粮食产量的影响[J]. 农业环境科学学报,2011,30(9):1742-1748.[ZK)]

[10]蔡福,张淑杰,于贵瑞,等. 基于空间化技术对中国近50年平均气温时空演变特征的研究[J]. 高原气象,2006,25(6):1168-1175.

[11]黄嘉佑. 气象统计分析与预报方法[M]. 北京:气象出版社,2004:239-243.

[12]杨建辉,张然欣. 基于HP滤波法和GARCH模型的股票价格趋势预测[J]. 统计与决策,2012(7):111-113.

作者:刘斌 任传友 王艳华

数据共享服务的农业科学论文 篇3:

基于开放获取的图书馆科学数据资源与服务

关键词:图书馆服务;科学数据;开放获取

摘 要:文章从科学数据与科学数据资源的开放获取,图书馆开放获取科学数据资源建设,图书馆开放获取科学数据的挖掘、分析与类比服务,图书馆开放获取科学数据的存储、翻译与可视化服务等方面,对基于开放获取的图书馆科学数据资源与服务进行了探讨。

1.1 科学数据及其解读

数据是人们通过计算、实验、试验、观察和测量等活动所得出的数值结果。根据所承载的载体和采用格式的不同,数据可以分为数字数据、文字数据、图片数据、声音数据、影像数据、三维虚拟数据、多媒体数据和可视化数据等类型,其中最简单的就是数字数据。数据可以用于科学研究、工程设计、调查取证、教育教学等各种用途。科学数据是指人类在从事科学领域的各种研究活动中所形成的数据,这些研究活动既包括基础科学研究,也包括应用科学研究,既包括教育教学研究,也包括生产和管理研究,还包括人类健康和生活研究。按照科学数据最基本的分类方法,可以分为科学基本数据、科学实验数据、科学试验数据、科学观测数据、科学探测数据、科学调查数据、科学统计数据、科学资料数据等各类数值型的原始基本数据以及按照不同领域的科研需求经过系统加工而生成的科学数据产品,如可视化数据和相关的科学数据集合。不仅如此,科学数据与其他信息资源还有一个不同点,就是科学数据可以具有实时性,即实时数据,便于用户随时随地地掌握和利用最新时间的科学数据信息资源。科学数据资源不仅是科学研究中不可或缺的重要组成部分,而且也是重要的科学研究成果产出[1]。

1.2 科学数据资源的开放获取

随着人类科学研究事业的加速发展和互联网海量信息的传播,每天都会产生体量巨大的科学数据资源,每天也都有难以计数的科学数据资源通过互联网传到世界各地的实验室和用户手中。然而,由于种种主客观因素的制约,尤其是大数据技术处理方面因素的影响,其中约有80%的科学数据没有得到很好的保护,在产生后的20年中就失去了踪迹。这种状况给科研工作带来了难以估量的巨大损失,由于科学数据的丢失,使得许多科研工作难以顺利地继续进行,为了找回所需要的科学数据,或者借助于相关的科学数据研究机构的先进技术进行科学数据的强行恢复,或者不得不返回来重复进行研究。因此,对于科学数据资源的建设、存储、管理、研究和服务,除了科研单位本身外,也成为图书馆,尤其是科研和高校图书馆在为科学研究和教学研究服务中开展创新型服务的重要工作内容之一。近十多年来,随着具有“学术共产主义”性质的国内外开放获取运动的迅猛发展,具有开放获取性质的科学数据呈现出爆炸性的几何级数增长,已经迅速成为引起学术界和科技界高度重视的一种创新模式的资源类型,成为大数据时代最强有力的支持资源。目前,世界各国政府和相关组织都已经从政策方面给予开放获取科学数据以最大程度的支持。各国政府通过成立国际开放获取数据联盟的形式[2],迅速扩大了开放获取科学数据的整体存量,目的是实现科学数据在更大范围内的开放共享利用。

2 图书馆开放获取科学数据资源建设

2.1 大数据时代图书馆的使命

当今,世界上的许多国家已经将大数据提升到国家的战略层面,认为未来国家层面的竞争力将在很大程度上体现在一个国家拥有数据的规模和运用数据的能力上。“数据是新的石油”,大数据时代的来临,正在深刻变革着人们的科研、生产、生活方式。对于各类科学数据的检索、开放、获取、共享、挖掘、存储、传送、分析与应用,不仅能推动社会各领域科学研究的发展,催生新的学科,而且能带动经济发展,造福社会。图书馆作为现代信息社会文献信息资源的集聚地和服务者,需要以全新的理念认识、理解、接受、投入到大数据时代,开展对科学数据,尤其是以免费全文获取为基本特征的开放获取科学数据的资源建设和服务中来,在大数据时代更好地体现自己在信息社会中的存在价值和意义。大数据资源的价值在于创新性应用,而前提则是对科学数据的有效收集、科学分析,从而使得科学数据的价值最大化,这就是在全球信息化发展的今天,大数据时代对于图书馆的必然要求。面对我国“互联网+”万众创新的时代号召,图书馆应当积极探索利用科学大数据服务大众创业的新途径和新方法[3]。

2.2 图书馆开放获取科学数据资源建设

图书馆为用户开展基于开放获取科学数据服务的一个重要前提条件,就是要建设相关的开放获取科学数据资源。由于这些开放获取科学数据资源全部都存在于互联网上,因此,互联网与开放获取科学数据资源是紧密相关的。随着全球互联网的快速发展,互联网用户的数量在快速增加,庞大的互联网用户群体成为创造互联网上各种科学数据资源的不竭源泉。因此,互联网上的科学数据资源类型在不断增加,科学数据的数量更是呈现出爆炸性的增长,即互联网上存在着实时动态增长的海量科学数据资源。互联网实际上已经成为全世界科学数据资源的巨大数据库,而这座巨大数据库就成为图书馆建设科学数据的最有力支持,因为图书馆可以根据用户对于科学数据的服务需求,从互联网科学数据库中检索和获取用户所需要的科学数据,为用户提供相关的服务。之所以要由图书馆来为用户提供科学数据服务,而不是用户自己寻找和检索科学数据,是因为用户在科学数据的检索和获取方面往往存在着较大的困难,而在这方面,却正是图书馆的优势所在,这也正是图书馆开展科学数据服务的主要原因。

3 图书馆开放获取科学数据的挖掘、分析与类比服务

3.1 科学数据的挖掘服务

李艳坤:基于开放获取的图书馆科学数据资源与服务

科学数据的挖掘服务指的是从海量的科学数据集合体中,将用户所需要的科学数据通过算法搜索,将隐藏在其中的有用科学数据信息挖掘、筛选和过滤出来,揭开包裹在这些科学数据之上无用的覆盖数据,过滤掉混杂在这些科学数据之中的干扰数据,清除去这些科学数据周围的附着数据,最后使得真正需要的科学数据可以清晰地出现在用戶的面前[4]。由于科学数据的挖掘服务工作需要具备一定的专业技术知识和水平,因此,图书馆从事科学数据挖掘服务的工作人员一般都需要经过较为严格和专业的培训方可胜任。在具体的服务方法上,往往需要综合运用计算机、互联网、大数据和云计算技术,利用科学数据检索、科学数据统计、科学数据分析、数据机器学习、数据专家系统和数据模式识别等技术方法,来最终实现图书馆科学数据挖掘的服务目标。图书馆科学数据挖掘服务的结果,可以为用户在相当广泛的领域中发挥作用,如科学探索、工程设计、生产控制、商务管理、市场分析、网络营销等。

3.2 科学数据的分析服务

对于绝大多数用户而言,挖掘出所需要的科学数据仅仅是所需完成任务的前奏,因为获得这些科学数据并非是用户的目的,仅仅是为了达到目的的先决条件。下一步需要进行的工作,就是要对已经挖掘出的科学数据进行统计和分析,以便从中发现和找出蕴含在大量科学数据之中的某些规律,从而得出所需要的最终结论[5]。对于科学数据的统计和分析步骤,是介于科学数据挖掘和发现其中规律的中间环节,也是最为关键的环节。因为如果没有科学合理的统计分析结果,就不会发现隐含在大量科学数据之中的规律,也就难以得出最终的结论。科学数据分析的工作,一般是由用户自己承担的,但由于人员能力有限、技术力量不足、任务紧迫等各种因素的影响,用户往往也会请求图书馆予以协助。在图书馆工作人员技术力量相对较高的情况下,也会被用户委以重托,帮助用户进行科学数据的分析,这也是各类科研系统图书馆的正常工作内容之一,高校图书馆也常常被请求协助用户对科学数据进行分析服务。

3.3 科学数据的类比服务

即根据已知事物与其他事物之间所具有的相同性、相似性和相近性等关系,通过对两类或两类以上的事物进行分析比较,找出它们之间所存在的各种联系,即共同点、相似点或相近点,从而找出其中所蕴含的规律性,用于指导和改进工作。图书馆开展科学数据的类比服务,是根据用户的需求,采用在科学研究方法中经常使用到的一种基本逻辑方法——类比法,将所获取的科学数据进行类比分析,力争通过寻找其中所存在的各种联系,找到和发现各种科学数据之间所具有的某种紧密联系、相关关系或相近性质,进而通过此类科学数据类推到彼类科学数据,帮助用户通过参照对比来加深理解,可以更加明显清晰地认知事物,尽快掌握蕴含在这些不同类别科学数据中的规律性。这种科学数据的类比服务,不仅适用于行业内科学数据的类比分析,而且也适用于国内与国外同类别科学数据的类比分析[6]。当然,这对于图书馆用户服务而言,科学数据的类比服务工作,同样是一种层次较高的情报类服务工作,同样需要较高专业技术素质的工作人员承担。

4 图书馆开放获取科学数据的存储、翻译与可视化服务

4.1 科学数据的存储服务

科学数据或者是真实反映一定历史时期的历史数据,或者是某些科学研究项目中所使用过的调查数据、测量数据、实验数据、试验数据、研究数据,或者是企业和机关单位在生产和工作中所形成的生产数据、管理数据,或者是国家和军事机关需要长期保密的秘密数据、机密数据、绝密数据等。因此,这些科学数据在一般情况下需要进行存储管理,目的是保存科学数据的历史价值、参考价值和档案价值,以便于在以后的各项工作中加以利用。除了国家和军事机关以及一些需要保密处理的科学数据外,大多数类型的科学数据和绝大多数的科学数据都是可以开放供用户使用的。因此,图书馆对于这些科学数据资源,在自己有权进行检索搜集、下载获取、分析管理的职权范围内,可以进行必要的存储管理。尤其是利用目前互联网时代的云存储技术,为图书馆科学数据服务工作的开展,为用户对于科学数据存储的需求,采用国际通行的开放存取模式,即在遵守科学知识开放共享协议的基础上,开展科学数据的互联网开放存储服务[7]。

4.2 科学数据的翻译服务

随着全球经济一体化进程的不断加快,科学数据也在世界范围内得以快速而大量地产生、流通、增殖、分化。对于那些来自于国外的科学数据,国内用户往往会由于外语水平的限制,难以很好地加以利用。即使懂得一些英语的用户,对于英语以外科学数据涉及的法语、俄语、阿拉伯语、西班牙语等众多的国外语言文字也同样会感到束手无策。因此,在这种情况下,就需要图书馆为用户提供对于来自国外科学数据的相关翻译服务,以便用户可以利用本国的母语语言文字,更加方便地利用来自国外的大量科学数据,并以此作为相关研究的参考数据和调研的依据数据。目前,图书馆借助互联网上的4大在线翻译系统,最多可以实现97种语言文字科学数据内容的在线翻译。在这4大在线翻译系统中,包括谷歌翻译系统的91种语言文字,其中44种语言可以实现语音翻译;必应翻译系统的44种语言文字,其中18种语言可以实现语音翻译;百度翻译系统的27种语言文字,其中11种语言可以实现语音翻译;有道翻译系统的7种语言文字,其中4种语言可以实现语音翻译。

4.3 科学数据的可视化服务

科学数据的可视化是利用视觉的方式,将原本表现为数量巨大、内容繁杂、形式枯燥的和具有潜在逻辑关系的科学数据展现出来,使用户发现其中的关联规律,继而进行深度挖掘和统计分析,最终得出所需要的规律性结论。所以,科学数据可视化是大数据领域所有价值的终极呈现[8]。科学数据可视化技术使科学数据的价值更为直观、浅显和易懂,适用于各种类型需要科学数据服务的机构和个人。图书馆使用相关的科学数据可视化软件如“大数据魔镜”“QlikView”等,都可以实现科学数据服务中的可视化服务。在大数据时代,科学数据的可视化是大数据产业链中非常重要的一个环节,如果企业员工都学会对科学数据的分析,就可以将企业数据的价值最大化,将数据资源变为企业实实在在可以看到的“真金白银”。

可视化科学数据可以帮助用户更加深刻地理解科学数据中所包含的意义,挖掘出蕴含在科学数据背后的价值。图书馆在开展科学数据的可视化服务中,可以协助用户使用相关的科学数据可视化软件,直接通过简单的拖拽就能一步生成数据分析模型,例如精准营销、客户分析、用户画像等,从而可以有力地支持管理者用户进行相关的决策,提高企业的核心竞争力。

参考文献:

[1] 杨京,王效岳,白如江.大数据背景下科学数据互操作实践进展研究[J].图书与情报,2015(3):97-102.

[2] 王艳翠,李书宁,李爱红.研究数据联盟:建立全球数据共享和数据交换的基础架构[J].图书馆理论与实践,2015(1):52-54,73.

[3] 肖燕.高校图书馆科学数据服务的新探索[J].办公室业务,2015(7):93.

[4] 张钰莎,梁欣祺.数据挖掘在高校图书馆服务中的应用研究[J].廊坊师范学院学报:自然科学版,2015(3):32-35.

[5] 程時星.基于云平台的大数据分析与高校图书馆服务研究[J].科技情报开发与经济,2015(14):38-39.

[6] 张涵,王忠.国外政府开放数据的比较研究[J].情报杂志,2015(8):142-146,151.

[7] 王剑,黄朝光.海量农业科学数据存储体系架构与方法研究[J].广东农业科学,2015(2):152-156.

[8] 王囝囝,杨树,毕焘.大数据时代数据信息可视化的研究[J].通讯世界,2015(14):185-186.

(编校:崔 萌)

作者:李艳坤

上一篇:治理机制下农业食品安全论文下一篇:基于临床路径的医学检验论文