创新工程数据知识管理论文

2022-04-26

摘要:借助《中文社会科学引文索引》(CSSCI)相关数据,对1998 ̄2007年问以创新为主题的被引文献进行内容研究与定量分析,研究表明:中国创新研究成果的学术影响力呈逐年快速增长的发展态势,技术创新、企业创新、制度创新、区域创新、集群创新、创新系统、创新能力、创新管理、知识创新、自主创新等是中国10年创新研究的热点。下面是小编为大家整理的《创新工程数据知识管理论文(精选3篇)》,欢迎阅读,希望大家能够喜欢。

创新工程数据知识管理论文 篇1:

政府数据开放平台数据创新性开发利用服务研究

摘要:[目的/意义]对政府数据开放平台在数据创新性开发利用中的服务功能进行分析,帮助有关部门更好地把握未来规划、建设、管理和服务的重点。[方法/过程]从服务方式和特点两个角度,对国内32家地方级政府数据开放平台的政府开放数据创新性开发与利用服务现状进行调研及分析研究。[结果/结论]共有23家平台已经在政府开放数据的创新性开发利用中积极作为,为社会公众开展政府开放数据的创新性开发利用提供包括定向数据、应用开发服务以及工具下载等多样化与全方位的服务。在今后的服务过程中,要制定具有可操作性的政策法规,加快海量政府开放数据的融通用,注重开发利用成果的落地,注重用户的需求分析和参与。

关键词:政府数据 数据开放 创新创业 开发利用 服务形式

分类号:G203

引用格式:莫富传. 政府数据开放平台数据创新性开发利用服务研究[J/OL]. 知识管理论坛, 2018, 3(5): 245-254[引用日期]. http://www.kmf.ac.cn/p/140/.

1 前言

随着人类社会进入大数据时代,拥有庞大公共数据资源的政府部门也已经从信息公开进入到了数据开放阶段。政府部门因其特殊性质和职能需要而生产或掌握着大量的数据资源,是最大的数据生产、收集、使用和发布者。推动数据开放共享与创新性开发利用,充分挖掘政府数据的价值,已经成为提高政府管理与服务效率、促进社会创新与经济增长、促进可持续发展与提高人民生活水平的重要措施。

2015年8月,国务院印发了《促进大数据发展行动纲要》,明确要求推动资源整合、加快政府数据的开放共享,在2018年底前建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等重要领域实现公共数据资源合理适度向社会开放,带动社会公众开展大数据增值性、公益性开发和创新应用,充分释放数据红利,激发大众创业、万众创新活力[1]。《促进大数据发展行动纲要》的印发,使建成政府数据开放平台成为我国重要的国家战略,也对政府数据开放平台在带动社会公众开展大数据增值性、公益性开发和创新应用,挖掘和释放政府开放数据价值,促进社会创新中所应发挥的作用提出了明确要求。

本文在对政府数据开放和创新性开发利用现状进行简要阐述的基础上,对政府数据开放平台在政府开放数据创新性开发利用中的服务功能进行分析,并结合国外推进政府开放数据创新性开发利用的经验,提出各地优化政府数据开放平台在政府开放数据创新性开发利用的几点建议,以期能够帮助政府数据开放平台规划者、建设者和管理者对我国政府开放数据创新性开发利用服务现状有较为清晰的认识,更好地把握未来规划、建设、管理和服务的重点。

2 政府数据开放利用相关研究

2.1 政府数据开放

关于政府数据的概念,开放知识基金会和联合国经济与合作组织(以下简称“经合组织”)从两个方面进行了界定:①政府数据是指由政府或政府控制的实体产生或收集的数据;②这些数据可被任何人免费使用、重新利用和再分配[2]。国内学者李绪蓉和徐焕良则认为“政府数据是对一切产生于政府内部或虽然产生于政府外部但会对社会活动、公共事务和普通民众有影响、有意义的数据资源的统称”[3]。A. M. Espinar在《开放政府数据:情景设置》中则将政府数据开放定义为“开发原始的公共领域的信息,以开放的格式和在非限制性许可的情况下进行利用和再利用”[4]。吴旻认为“政府数据开放作为一种哲学理念和具体实践,指的是按照公众特定的需求和一定的互联网协议,对不同来源、不同类型的Web数据进行存储和组织,最终实现政府数据在网络空间的开放与共享,以寻求数据最大可能的获取与重用”[5]。

经合组织2010年的报告指出,政府数据开放可以产生经济、社会和政治3个方面的价值:政府数据开放为大数据产业的发展创造良好的环境,有助于推动经济发展;有助于促进社会创新,改善公民生活质量;有助于提高政府公共服务水平、提高政府透明度和公民参与度[6]。黄如花等从开放政府数据的基本价值及在各基本价值基础上的子价值两个层面系统地分析开放政府数据的价值,最后发现开放政府数据的基本价值有政治价值、社会价值、经济价值和技术价值[7]。

政府开放数据本身没有价值,只有当它创造了公共价值才真正具有价值。欧盟委员会对开放数据的价值链进行了描述:数据开放后将被分析和处理,提供有价值的信息或被可视化呈现,推动新的数据产品或数据服务的形成,然后在此基础上开发出多样化的、更具聚合性与综合性的产品或服务[8]。夏义堃根据信息产品的演化规律和信息生命周期理论,从数据产品/服务的价值转换方式以及覆盖的用户群体类型等角度,将开放数据的价值实现过程划分为原料性生产与供应、核心数据产品开发和综合性开发3个阶段,基本涉及数据汇集、转换、浓缩、应用程序开发等开放数据流程的所有环节,各环节价值实现主要借助数据利用手段、方法与工具的创新,通过内容增值和应用程序软件等衍生数据服务产品的开发来逐步丰富开放数据产业价值链的内涵,并不断延伸数据开发利用价值链的长度,逐级递进地提升其利用效益和价值[9]。郑磊认为,政府数据是大数据不可或缺的重要组成部分,具有较高的增值开发和创新應用价值,在创造数据价值的过程中,政府、数据利用者、普通公众和外部环境的作用缺一不可,共同决定着开放数据的最终效果,构成一个生态系统[10]。郑磊和吕文增以上海开放数据创新应用大赛为例的研究认为,将公共数据作为一种公共产品开放给社会进行创新应用,发动公众参与和协作,共同解决公共问题,具有无穷潜力,可创造巨大的公共价值[11]。周志峰认为政府开放数据的开发利用与创新创业有着天然的联系,促进政府数据开放共享与开发利用契合了经济社会发展的需求和国家创新驱动战略,为创新创业者提供了丰富、权威的信息资源,为创新创业实践开展提供了新契机,能够激发创新思维、开拓创业渠道,产生较好的经济和社会效益[12]。沈晶等将政府数据开放的价值定义为利益相关者通过利用和再利用政府数据创造出的价值由利益相关者获取的过程,并认为政府开放的原始数据本身不足以产生价值,政府数据开放价值生成应分三步走:政府将数据开放出来是第一步,利益相关者通过对政府数据的利用与再利用创造价值是第二步,第三步则是创造出的价值被获取[13]。

2.2 政府开放数据创新利用

获取、挖掘和利用政府开放数据的经济、社会和政治价值,一方面要促进各政府部门之间数据的融合和共享,以实现政府开放数据的内部利用,优化政府部门业务能力、提高决策水平和政府透明度,有利于民主决策,实现政治价值和社会价值;另一方面要面向社会需求,促进政府开放数据的完整、原始、及时、可获得、机器可处理、非歧视、非私人和无须授权地对外开放,满足社会公众和企业组织进行进一步加工整理再提供给广大用户或自身使用的、以商业或者非商业目的再利用需求,创造经济价值和社会价值,让百姓的生产和生活更加有效和便利。在大数据时代,政府机构拥有海量和蕴藏巨大价值的数据资源,同时,政府开放数据具有不被其所激发的思想和创新所消耗的特性,相反可以为创新性应用提供无尽的源泉。因此,开放政府数据意味着不仅要促进各政府部门之间数据的融合与共享和面向社会需求对外开放,而且要提供系列分析工具和平台服务,便于社会公众和企业组织可以通过单纯的基础数据及通过基础数据与其他数据的结合,分析挖掘和获取政府数据资源更深层次、更有效能的价值,开发出各种创新应用程序、解决方案或数据服务衍生产品,以促进经济社发展、助力智慧城市的建设和人民生活水平的提高。

开放政府数据可以促进政府数据的重复性和创新性开发利用,因此,数据的利用、再利用和创新利用是数据产生价值的3个层次,其中创新利用是数据价值产生的核心。政府数据的开放、整合和分析,以及在此基础上的开发与创新利用,能发现新的知识,创造新的价值。政府数据开放的最终目的是通过数据资源的开放共享与开发利用,发挥政府数据价值,使政府部门更高效透明地开展工作,促进经济发展和社会创新,改善公民生活质量。

2.3 国外推进政府开放数据创新性开发利用的典型案例

发达国家十分重视政府数据生态环境建设,从组织、机制及活动等方面与私营部门和民间社会组织建立良好的公私合作伙伴关系,形成了政府主导型、企业主导型和公民主导型3种在政府主导下分工有序、合作共赢的多方参与模式,采取完善政策法规体系、创造创新开发利用的社会环境、举办创新应用程序大赛、完善组织机构等多种措施,持续推进政府开放数据创新性开发利用,取得了很好的成效,为我国提供了较好的借鉴。具体案例如表1所示:

3 我国政府数据开放平台数据创新性开发利用服务

3.1 服务形式

开放政府数据意味着既要促进各政府部门之间数据的融合共享和面向社会需求的对外开放,更要提供系列分析工具和全方位的平台服务。从世界范围来看,建设国家级专门和统一的数据开放平台成为推动政府数据开放共享和创新性开发利用的重要选择。自2009年美国率先建立政府数据开放网站以来,目前全球已经有大约60个国家和地区建立了统一的国家政府数据开放平台。上海市于2012年建成我国第一个政府数据服务网,标志着我国正式开始了政府数据开放平台的建设进程。政府数据开放平台是由政府牵头、各政务部门共同参与建设的平台,其致力于各政府部门可公开数据的下载和服务,为企业和个人开展政务信息资源的社会化开发利用提供数据支持,推动信息资源增值服务业的发展以及相关数据分析与研究工作的开展[14]。通过政府数据开放平台,社会公众可以免费地获取大量完整原始、机器可读、可重复分析和利用的政府数据,因而在为数据需求者获取数据、进行开发利用的过程发挥着关键性作用。

本文采取网络调研法,对国内已建成的32家地方级政府数据开放平台(不含港澳台地区)进行全面调研,重点对平台的应用开发、在线工具和数据提供的功能设置进行实践操作和效果分析。调研发现共有23家平台已经在政府开放数据的开发利用中积极作为,为社会公众开展政府开放数据的开发利用提供了多样化和全方位的服务,包括为政府开放数据创新应用竞赛提供定向数据、提供API服务、APP软件、开发者服务以及数据监测与分析工具下载使用等。这些服务为用户获取政府数据、进而开展开发与利用提供了便利。表2为所调研的我国23家政府数据开放平台的数据创新性开发利用服务形式详细展示:

3.1.1 应用开发服务

政府开放数据作为一种公共资源,具有非歧视性、非私人的、无须授权等特征[15],因此,任何人都可以对政府开放数据进行开发利用。政府机构也通过提供各种服务和便利,鼓励社会公众积极参与政府开放数据的开发利用。目前,软件开发人员已经在政府数据的价值揭示方面发挥了核心作用,通过构建移动和Web应用或APP,使用户通过移动设备或网络访问和交互数据及信息。为了帮助软件开发人员更好地开发应用程序,政府数据开放平台设置了“应用程序编程接口(API)”“开发者中心”“开发服务”“开发者社区”“APP”“应用成果提交”“用户帮助”等板块,为开发者提供包括海量数据下载、应用程序编程接口、开发方法及开发流程推荐、详细的开放者文档、常用开发工具下载等平台服务,以及开发者注册、创建应用、申请服务、应用推广、审核发布和管理应用等自助服务。

应用程序编程接口(application program interface,API),是一组定义、程序及协议的集合,是目前网站普遍運用供用户调用数据的方式,这种基于互联网的应用正变得越来越普及,在这个过程中有更多的站点将自身的资源开放给开发者来调用。对外提供的API 调用使得站点之间的内容关联性更强,同时这些开放的平台也为用户、开发者和中小网站带来了更大的价值。对于政府数据开放平台的API服务而言,API是政府开放数据平台向用户提供开发和利用数据的接口,其数量体现了平台数据的可开发程度[16]。对于政府机构来说,通过统一的对外接口,实现了政府开放数据从生成到收集和整理,再到开放共享、更新维护和获取利用的全生命周期管理,保证政府数据的原始性、真实完整性、可读性、开放性和安全性。对于普通数据需求用户来说,提供了政府数据的浏览检索和下载利用服务,用户可以通过API与数据开放平台进行交互,根据自己的选择标准或实际需求获取自己需要的政府数据。对于软件开发者来说,通过参数实时高效地调用海量的、适用于开发应用程序需求的政府开放数据,进而开发出基于政府开放数据的APP应用程序,面向公众使用。

随着移动互联网和APP软件开发技术的发展,移动APP成为公共部门发布最新数据信息和用户即时获取利用信息的重要方式。政府数据开放平台上提供了政府开放数据获取和利用APP简介和下载链接的功能,同时也支持用户对APP进行评价。这类APP是软件开发人员基于海量的政府开放数据进行开发的,可实时链接到海量政府开放数据,一般按照其所连接政府数据所属领域或主题进行分类,大部分是与社会公众交通出行、工作学习、休闲娱乐等密切相关,功能强大、使用方便。APP可以整合不同来源的数据或者允许用户在交互地图上查看数据,帮助用户便利而有效地利用了政府数据;同时,APP的推广与下载使用,也让公众更加深刻体会政府开放数据所带来的功能与实效。因此,APP软件的开发与对外发布,既促进了政府数据的重复性使用和利用,也很好地鼓励社会公众积极开展政府开放数据应用的进一步创新和创造。

通过应用开发服务,企业和社会公众可以基于海量数据,或者利用服务接口实时获取数据成为一名软件开发者,在自己感兴趣的数据应用领域进行开发移动端应用或接入外部应用以及方便地利用平台推广应用。

3.1.2 在线工具服务

(1)数据分析工具。数据分析是数据创新应用的基础环节,对原始数据进行分析有助于充分挖掘政府数据的价值。政府数据开放平台上提供了多种数据分析工具,帮助用户对数据进行初步管理和可视化分析。

北京政务数据资源网设置了“工具”栏,向用户介绍Hadoop、RapidMiner、Solr、Tableau等支持数据密集型分布式应用框架、数据分析、数据搜索、数据可视化等15款工具,以方便用户借助这些工具获取和处理政府数据。广州、哈尔滨、佛山、济南、南平、门江等政府数据开放平台设置“数据图谱”板块并为每一条数据提供“图谱”或“关联服务”选项指向数据图谱,贵阳市政府数据开放平台则在首页设置“专题图谱”“全局图谱”专栏并为每一条数据提供“资源图谱”选项,提供多种数据图谱可视化选择,实现可视化展示数据集的构成要素及数据集间的关联关系。广州、深圳、青岛、佛山、哈尔滨、济南、南平和宁波海曙区等政府数据开放平台则在每一条数据的详情页面提供“数据分析”“数据图表可视化”“数据初始化”“数据管理”“数据模型”或“描述信息”等选项,支持对数据进行初步管理和可视化分析。

(2)数据开放利用监测工具。对政府数据开放共享和获取利用情况进行监测,有助于平台管理人员和用户分析政府数据开放共享和获取利用情况,为进一步优化政府数据的开放和利用提供依据,最终改进服务方式,提升政府数据开放共享质量。

贵阳市政府数据开放平台提供了强大的数据监测工具——开放指数,提供包括平台访问来源追溯、访问次数、关注热度词云、用户注册类型分析、平台访问历史、数据评分统计、数据开放统计、需求分类比例、数据更新统计、资源格式比例、部门数据TOP10、数据下载TOP10和API调用TOP10等功能板块,对政府数据开放和利用情况进行全方位分析。北京、广州、青岛、济南和佛山顺德区等的政府数据开放平台则设置了“网站统计”“服务统计”“数据统计”等栏目,对政府数据的开放统计、访问统计、下载统计和评分统计等开放利用情况进行统计分析。佛山、哈尔滨、南平、门江等平台则设置“数据服务”“数据指数”或“数据分析”等栏目,从部门开放指数、主题开放指数和标签开放指数3个角度,分别显示平台上已梳理并开放的各政府部门数据开放和使用情况、当前部门数据的完善程度和基于标签值的关联数据集排行榜。上海则在“互动交流”栏提供数据概览,对开放数据的领域、类型和部门分布以及下载与访问情况进行可视化展示。

除了上述两类工具外,哈尔滨市政府数据开放平台在“数据服务”栏下的“数据工具”板块中提供加密/解密、MathML编辑测试、jQuery插件等6款在线工具,在线提供数据加解密、生成QR码、压缩、CSV转换为HTML表格、jQuery插件演示、MathML、LaTeX与数学公式等的在线编辑以及生成图片等服务。

3.1.3 創新应用竞赛定向数据服务

在开放数据之后,为推动数据的开发与利用,国内外的政府部门陆续举办了各种提供高额奖金的、以政府开放数据为“原材料”的开放数据创新应用程序研发或者解决方案的比赛,吸引社会大众参与到政府开放数据的开发利用中,实现数据利用的目标。政府开放数据创新应用竞赛能够将技术、创意以及商业模式进行全面的融合,大众根据自身专业领域、行业背景参与到开放数据的开发中,以独特的洞察力和创新思维发现数据的价值,挖掘开放数据中的价值“金矿”[11]。

(1)上海开放数据创新应用大赛。从2015年开始,上海成功举办了3次上海开放数据创新应用(Shanghai open data Apps,简称SODA)大赛,成为全国开放数据创新应用领域的品牌系列赛事。SODA大赛坚持开放创新的理念,以数据开放为切入口,采用“数据众筹、应用众包”的模式,以社会需求和社会热点痛点为导向,面向社会各方提供政务数据资源,通过政府搭台、政企合作、公众参与,依靠全社会力量,形成了服务数据开放者、产品开发者、应用需求者三方的完整价值体系,激发数据创新应用,发掘城市数据价值,推进政府数据资源的深度开发和增值利用[17]。2015年SODA大赛以“城市交通”为主题,上海政府数据服务网开放了24个交通类数据集;2016年SODA大赛以“城市安全”为主题,总计开放了29项超过2TB大赛专用数据;2017年SODA大赛以“城市治理”为主题,总计开放了23项大赛专用数据。

(2)中国研究生智慧城市技术与创意设计大赛。中国研究生智慧城市技术与创意设计大赛自2014年首次举办以来,至今已经举办四届。大赛以“创意启迪智慧、创新驱动发展”为理念,围绕智慧城市主题,激发研究生创新意识,提高研究生创新和实践能力,为国家、社会和企业培养创新型人才。北京市政务数据资源网设置“定向数据”栏和“往届活动”板块,为中国研究生智慧城市技术与创意设计大赛提供数据,并进行相关介绍。

(3)全国高校数据驱动创新研究大赛。首届全国高校数据驱动创新研究大赛于2017年12月至2018年3月期间开展,旨在鼓励各学科领域学子基于数据进行创新研究,促进研究数据的保存和共享。为支持参赛者设计作品,北京市相关政府部门通过北京市政务数据资源网提供定向开放和完全开放两类专题数据供参赛者下载使用。

此外,北京市信息资源管理中心于2014年主办了“北京市政务数据资源网应用创意大赛”,大赛以“政府数据开放,大数据创新应用”为主题,以北京市政务数据资源网开放的数据资源为主要的数据源,旨在进一步增进社会各界了解和使用政府数据,促进政府部门与企事业单位、个人之间的互动交流,并更大范围推广北京市政务数据资源网。上海市图书馆在2016年举办了以家谱为主题的“上海图书馆 2016 年开放数据应用开发竞赛”,并开放了馆藏家谱文献信息和内容信息,供参赛者使用。贵阳市交通管理局等部门在2016年举办了“交通事故成因分析竞赛”,贵阳市交管局为大赛开放了车管数据、交通违法信息、交通事故数据、交通天气状况数据、潮汐路道路交通管理及交通流数据等大赛定向数据。

3.2 优化对策

从上文政府数据开放平台数据开发利用服务模式的论述,可见政府部门非常重视政府数据的开放共享与再应用,为用户获取政府开放数据并在此基础上进行开放与利用提供了诸多服务和便利,但仍存在尚无专门指导政府数据创新性开发利用的政策法规、政府数据的多源异构、开发利用成果落地成效不显著等问题。受国外推进政府开放数据创新性开发利用典型案例的启发,本文认为各地政府数据开放平台数据创新性开发利用服务的优化,需要在以下几方面发力:

3.2.1 制定具有可操作性的政策法规

发挥政府开放数据的价值是一项系统工程,从技术上讲涉及数据采集、数据融合、数据加工、数据分析、结果呈现等内容,从政策法规上还涉及共享机制、开放政策、管理模式、交易规则、保障措施等问题,从主体上需要政府、企业、科研机构、个人等多方的共同参与和发力[18]。因此,随着政府数据开放和创新开发利用的深度发展,优化政府数据开放平台的数据开发利用服务,必然需要通过政策的颁布提供发展方向,通过相关法律规范的制定和实施提供坚实的保障。目前,我国还没有专门用于指导政府数据创新性开发利用、释放数据价值的国家政策,亟需从国家层面制定具有可操作性的政策法规,地方层面则需在国家政策法规体系的指导下,制定具体的地方行政法规和行动计划。

3.2.2 加快海量政府开放数据的融通用

一方面,政府数据开放平台拥有庞大的公共数据作为资源支撑;另一方面,政府数据开发利用需要以海量的数据资源为基础。但目前政府数据开放与创新性开发利用之间还存在一定的不匹配,就其原因,主要在于各级政府部门组织结构的条块分割和政府数据的多源异构。因此,政府数据开放平台要通过以多种格式开放政府数据、不断优化政府开放数据的组织与管理、提供多选择的数据检索方法和途径、支持通过API调用特定需求的数据资源、推广链接海量数据资源的APP应用等多种途径,使平台上海量的数据资源得到开发和利用,也使得社会开展政府数据的开发利用得到海量数据资源的支撑。同时,各级部门要启动数据“聚通用”攻坚会战,实施政务数据资源整合计划,加快建设政府数据共享平台,加强政府部门数据资源横向整合和管理,加强与国家有关机构的数据互换、信息互通,消除“信息孤岛”“数据烟囱”,积极推进政府部门数据互联共享。

3.2.3 注重开发利用成果的落地

政府数据开放的最终目的是通过数据资源的开放共享与开发利用,发挥政府数据价值,使政府部门更高效透明地开展工作,促进经济发展和社会创新,改善公民生活质量。在此过程中,开发成果的落地尤为关键。如果开发成果只停留于应用模型或者解决方案层面,则政府数据的价值仍旧无法发挥,政府透明、经济发展、社会创新、公民生活质量改善也只能成为空谈。因此,在具体实践中,政府数据开放平台的数据開发利用服务要以发挥政府数据价值为目标,力争实现开发成果的落地和产生实效。政府数据开放平台要进一步为社会公众和企业组织开展政府开放数据的创新性开发利用提供多样化和全方位的服务。创新应用大赛要积极贯彻开放合作的精神,将企业、高校和民间机构共同带入本市大数据生态建设,引入投资机构对优秀项目提供投资对接和孵化落地支持,推动成果转化,加速项目孵化落地,实现开放数据、创新应用、落地孵化三位一体目标,真正体现出开放数据对促进商业创新和经济转型发展的实质作用。

3.2.4 注重用户的需求分析和参与

政府开放数据平台的数据创新性开发利用服务非常强调用户的需求分析和参与。一方面要强调以用户为中心、需求为导向,通过多种分析工具和途径开展用户以及市场对于政府开放数据开发利用需求的调研和分析;另一方面强调开放性和公众性,重视公众的参与和互动,努力简化公众网上咨询和参与的流程,引入媒体合作,建立公众参与和反馈机制,提高用户体验。在用户的需求分析方面,部分政府数据开放平台提供开放指数工具或者设置“网站统计”板块,有助于帮助平台管理人员和用户分析政府数据开放共享和获取利用情况,为进一步优化政府数据的开放和利用方式、提升政府数据开放共享质量提供依据。在用户参与和反馈方面,对于普通数据需求者,提供数据分享、数据申请与定制、信息交流和用户个性化服务等功能,既为用户提供多种具有本地特色和用户个性化的服务,提升用户体验;也强调加强对公众的咨询,激发社会公众的“群体智慧”与创新创业活力,支持和鼓励大众参与到平台的建设和优化、政府开放数据的开发利用中。通过这些措施,建立高效的公众参与和反馈机制,保证公众的数据请求和咨询问答能够得到最快的响应,优先公开社会公众最迫切需要的数据资源,提高平台的服务效率和用户的满意度;对于应用开发者,则注重“互动交流”栏目的建设,设置信息发布、聊天交流、信息共享、提问反馈等板块,方便应用开发者之间的信息共享和交流反馈。

4 结语

进入大数据时代,向社会开放政府数据、充分挖掘政府开放数据以进行开发和利用,已经成为提高政府管理与服务效率、促进社会创新与经济增长、促进可持续发展与提高人民生活水平的重要措施。随着《促进大数据发展行动纲要》的印发,建成政府数据开放平台成为我国重要的国家战略,政府数据开放平台在带动社会公众开展大数据增值性、公益性开发和创新应用、挖掘和释放政府开放数据价值、促进社会创新中也开始积极作为。政府数据开放平台在社会公众开展政府开放数据的开发利用中提供了包括政府开放数据创新应用竞赛定向数据、API服务、APP服务、开发者服务以及数据分析与监测工具下载使用等服务,为用户获取政府数据并在此基础上进行开放与利用提供了便利。在今后的服务过程中,要制定具有可操作性的政策法规,加快海量政府开放数据的融通用,注重开发利用成果的落地,注重用户的需求分析和参与,使政府数据开放平台的数据创新性开发利用功能更好发挥,更利于有效挖掘和利用政府开放数据的巨大价值,有效满足“大众创业、万众创新”的需求,促进经济增长和社会可持续发展,不断提高人民生活水平。

参考文献:

[1] 国务院关于印发促进大数据发展行动纲要的通知[EB/OL]. [2017-12-10]. http://www.govcn/zhengce/content/201509/05/content_10137.htm.

[2] 卫军朝, 蔚海燕. 国外政府数据开放现状、特点及对我国的启示[J]. 图书馆杂志, 2016(11): 23-29.

[3] 李绪蓉, 徐焕良. 政府信息资源管理与开发[M]. 北京:北京大学出版社, 2005.

[4] ESPINAR A M. Open goverment data: seting the scene[R]. Gijón:W3C Spain Office/CTIC, 2012.

[5] 吴旻. 开放数据在英、美政府中的应用及启示[J]. 图书与情报, 2012(1): 127-130.

[6] OECD. ANNEX B.Reaping the benefits of cloud computing, Web2.0 and open data: OECD country experiences[J]. Sourceoecd science & information technology, 2010(14): 172-185.

[7] 黄如花, 何乃东, 李白杨. 我国开放政府数据的价值体系构建[J]. 图书情报工作, 2017, 61(20): 6-11.

[8] European commision. Elements of a data value chain strategy[EB/OL]. [2017-12-10]. https://ec.europe.eu/digitalagenda/en/news/elements-data-value-chain-strategy.

[9] 夏义堃. 开放数据开发利用的产业特征与价值链分析[J]. 电子政务, 2016(10): 41-50.

[10] 郑磊. 開放政府数据的价值创造机理: 生态系统的视角[J]. 电子政务, 2015(7): 2-7.

[11] 郑磊, 吕文增. 公共数据开放的产出与效果研究——以上海开放数据创新应用大赛为例[J]. 电子政务, 2017(9): 2-10.

[12] 周志峰. 创新创业视域下促进政府开放数据开发利用的对策分析[J]. 情报杂志, 2017, 36(6): 141-147.

[13] 沈晶, 胡广伟. 利益相关者视角下政府数据开放价值生成机制研究[J]. 情报杂志, 2016, 35(12): 92-97.

[14] 黄如花, 王春迎. 我国政府数据开放平台现状调查与分析[J]. 情报理论与实践, 2016(7): 50-55.

[15] The 8 principles of open government data[EB/OL]. [2017-12-10]. https://OpengovData.org/.

[16] 吴钢, 曾丽莹. 国内外政府开放数据平台建设比较研究[J]. 情报资料工作, 2016(6): 75-79.

[17] 上海开放数据创新应用大赛95万奖项今全部揭晓[EB/OL]. [2017-12-10]. http://www.sheitc.gov.cn/zxxx/672473.htm.

[18] 洪学海, 范灵俊, 洪筱楠, 等. 智慧城市建设中政府大数据开放与市场化利用[J]. 大数据, 2016(3): 17-26.

作者:莫富传

创新工程数据知识管理论文 篇2:

基于引文分析的中国10年创新研究发展动向探究

摘要:借助《中文社会科学引文索引》(CSSCI)相关数据,对1998 ̄2007年问以创新为主题的被引文献进行内容研究与定量分析,研究表明:中国创新研究成果的学术影响力呈逐年快速增长的发展态势,技术创新、企业创新、制度创新、区域创新、集群创新、创新系统、创新能力、创新管理、知识创新、自主创新等是中国10年创新研究的热点。

关键词:创新学研究;研究热点;研究趋势;引文分析

自1998年江泽民同志提出“创新是一个民族进步的灵魂,国家兴旺发达的不竭动力”的著名论断之后,创新研究受到学者的高度关注,中国科学学学界掀起了有关创新的研究高潮,有研究者运用词频分析法分别对2004、2005、2006年中国科学学发展动向进行研究,结果表明,创新作为科学学研究热点在专业核心期刊论文题名中出现的频次,由2004年排名第4位上升到2005年的第3位,2006年升为第1位,关于创新这一主题的论文数量在过去的几十年中已呈指数般增加,很少主题能像对创新重要性的认可一样得到研究者的一致同意,为了全面、准确地揭示10年来中国创新研究热点、发展趋势、基本特征和对社会科学研究的影响,本文采用文献计量学的引文分析法,借助《中文社会科学引文索引》(CSSCI)相关数据,对1998~2007年间以创新为主题的被引文献进行内容研究和定量分析。

1 创新研究成果影响力发展态势分析

研究成果是否被引用以及被引用的频次,是该成果在学术界产生影响与占有地位的重要测度,从实质上反映了某个研究领域的研究热点、重点和现状,对学科研究和发展具有重要的参考和指导价值,研究成果的题名是作者对文章主题内容最精练的表达,题名关键词是表达成果主题概念和核心内容的自然语言,某一时段研究成果题名关键词被引量的变化情况,可以显现出该研究领域的发展态势,笔者从1998~2007年CSSCI被引文献篇名(词)字段入口,键入“创新”一词,检索获得题名中含有“创新”一词的被引文献17 812篇,总计被引38 025次,被引创新研究成果的主要文献类型有:期刊论文、图书、报纸、会议文献、学位论文、汇编、报告、电子文献、其他,分别有12 471篇期刊论文、1 865部图书、1314篇报纸文章、245篇会议文献、282篇学位论文、526篇汇编文献、182份报告、691篇电子文献、236篇其他文献,分别被CSSCI来源作者引用22 945、10 640、1 706、275、406、786、207、767、301次,其篇均被引率分别为1,84、5,7、1,3、L 12、1,44、1,5、1,14、1,11、1,12,可见:①以创新为研究主题的图书的被引率远高于其他类型的创新研究成果,我国创新研究者对图书的倚重度强;②期刊论文的被引量居各类成果之首,它是我国创新研究领域中最具影响、最受关注、借鉴最多的一类研究成果,期刊论文的被引篇次占创新成果被引总篇数的60.34%;图书居第2,其被引篇次占被引总量篇次的27.98%,论文的被引篇数和被引篇次分别是图书的4.21倍和2.16倍;除图书、论文之外的8类创新成果的被引量相对较少,其被引篇次所占比例仅为11.68%;期刊论文的高被引量反映了我国创新研究者比较及时地追踪和把握国内外相关研究的最新动态;③进入21世纪后,被引文献中来自网络的研究成果迅速增加(从2000年的1篇次上升到2007年的759篇次),电子文献已成为学者们的重要参考资源,是创新研究领域中继期刊论文、图书(含汇编)、报纸之后的第四大引用资源,表1给出了1998~2007年各类创新研究成果被CSSCI来源文献引用篇次的统计数据。

从创新研究成果被引文献量的年代分布情况看,中国10年创新研究成果的学术影响力呈逐年快速增长发展态势,中国科学学创新研究处于高速发展期,1998~2007年创新研究成果分别被CSSCI来源文献引用510、961、1 346、2055、2 754、3 803、4 801、5 568、7 131、9 096篇次,2007年的创新研究成果被引量是1998年的17.84倍,10年平均被引量年增长率为39%,增长较多的年份是2003、2006和21)137年,被引量年增长逾千篇次,其中,2007年比2006年被引量增加近2千篇次。

2 具有重要学术影响的创新研究成果分析

如上所述,期刊论文和图书分别是我国创新研究者引用量最多和引用率最高的两类创新研究成果,因此,对被引创新论文与图书进行分析具有代表性,将同一篇创新研究论著在不同年份里的被引量进行合并统计,得到了每个成果的被引总量与年代分布情况,表2和表3分别给出了1998~2007年被CSSCI来源文献引用篇次排名前40位和50位的创新研究期刊论文和图书,对这些具有重要学术影响的创新研究论文和图书的主题内容和被引特征加以分析,即可看出10年来我国创新研究的热点、趋势、作用、贡献和学术影响力。

2.1高被引创新论文分析

在表2的41篇高被引创新研究论文题名中,出现频次较多的关键词是:企业/产业(15篇)、技术(12篇)、集群/集成(11篇)、区域(9篇)、能力(6篇)、模式(5篇)、网络(5篇)、管理(4篇)、知识(4篇)、制度(4篇)、环境(3篇)、理论(3篇)、评价(3篇)、系统(3篇)、自主(3篇)、过程(2篇)、投资(2篇)、政策(2篇)、案例(2篇),对这41篇论文题名关键词被引频次进行统计,发现1998--2007年高被引创新研究论文的主题内容集中在:企业创新(353次)、集群创新(257次)、技术创新(233次)、制度创新(229次)、区域创新(212次)、创新能力(129次)、创新管理(112次)、创新模式(112次)、知识创新(101次)、创新网络(101次)、创新理论(80次)、自主创新(74次)、创新系统(68次)、创新环境(62次)、创新评价(50次)、创新过程(45次)等方面,可见,企业技术创新的区域集群化是中国创新研究最明显的趋势,

通过对高被引创新研究论文的主题内容和被引量综合分析,可以得出如下几点,①企业作为创新主体倍受学界关注,41篇高被引论文题名中含有企业一词的论文就有15篇,其中,有9篇论文题名中出现集群、区域、网络等关键词,可见,企业的区域集群创新网络化是企业创新研究的显著特征;高被引企业创新研究内容还包括企业技术创新、企业创新管理和企业创新能力等,②集群创新作为一种新兴的创新模式得到学界的广泛认同,高被引集群创新论文于2000年后陆续发表,2002年开始引起学者的关注,并呈被引量逐年显著增加的发展态势,集群创新是中国2002年后创新研究领域中的最热点,刘友金关于企业集群的区域创新优势、集群创新的组织模式、集群创新形成与演化机理、集群创新行为4篇论文被列入高被引创新论文之列,成为我国企业集群创新研究领域影响力最大的专家,③技术创新研究呈现明显的综

合化与实证研究态势,高被引技术创新研究论文涉及经济、管理、法律、文化等研究领域,从企业、区域、集成、知识产权法、投入绩效与创新能力评价、学习与创新行为、风险管理等不同视角研究技术创新,研究主题呈现多样性和综合化,高被引技术创新研究论文中实证研究论文占有较高的比重,如:高建对1051家企业技术创新调查分析、盖文启以北京中关对地区为例研究区域的技术创新型模式、蒋殿春从外商投资对中国产业技术创新作用的经验分析等等,④侧重于地方政府制度创新与注重理论研究成为制度创新研究的特点,杨瑞龙的《我国制度变迁方式转换的三阶段论一兼论地方政府的制度创新行为》一文于2000--2007年间被CSSCI来源文献引用143篇次,在中国社会科学研究领域中产生较大影响,⑤区域创新研究论文被我国社会科学研究者较多借鉴,学者们主要从区域创新的集群、系统与网络、区域创新的能力、绩效与环境等方面进行区域创新研究,⑥我国创新能力研究起步较晚,但影响力较大,2005年以后对创新能力研究成果认知度迅速增温,高被引创新能力研究论文在2002年才有发表,2003、2004年开始引起关注,2005年后的被引量每年成倍增长,王一鸣的《关于提高企业自主创新能力的几个问题》于2005年发表后,2006和2007年分别被引12和16篇次,冼国明、柳卸林和江小涓关于创新能力的研究论文在2007年的被引量分别高达13、13、12篇次,⑦创新管理以企业集群创新管理和创新绩效评价管理为主要内容得到学术的高度认同,⑧知识创新与知识管理、区域集群交叉融合,形成知识创新研究的创新点,邱均平的《论文知识管理与知识创新》一文被引48篇次,为我国知识管理与知识创新研究作出了突出贡献。

2.2高被引创新著作分析

1998~2007年间创新研究图书被引量从1998年的160种次增长到2007年的2 054种次,总被引种次达10 640,图书总被引量和平均被引量增长速度都小于期刊论文,但每种图书的被引量(即被引率)则远高于期刊论文,表3中50种高被引著作10年间共被引用4027次,平均被引率高达80.54%,

在表3的50部高被引创新研究书名中,出现频次较多的关键词是:技术(20部)、企业/产业(12部)、管理(10部)、经济(8部)、理论(7部)、知识(7部)、系统(6部)、制度(4部)、精神(4部)、国家(4部)、集群/集成(3部)、区域(3)、优势(3部)、学习(3部)、科学(2部)、能力(2部)、组织(2部)、战略(2部)、模仿(2部)、金融(2部)、城市(2部)等,对这50部高被引创新研究书名关键词的被引频次进行统计汇总,得出1998--2007年高被引创新著作的主题内容集中在以下方面:技术创新(1 544次)、企业创新(1 183次)、区域创新(871次)、集群创新(795次)、创新理论(779次)、创新管理(553次)、创新经济(511次)、知识创新(441次)、国家创新系统(263次)、制度创新(246次)、创新精神(201次)、组织创新(185次)、创新政策(164次)、创新能力(161次)等。

对表2和表3的创新研究内容进行比较分析,发现高被引创新著作具有如下特点:①技术创新是中国创新研究领域的第一大研究热点,傅家骥的《技术创新学》于1998年出版,1999~2007年间被CSSCI来源文献引用了463次;②企业的技术创新问题成为企业创新中的重中之重,在11部高被引著作中,有一半以上的企业创新著作研究企业的技术创新问题;③2002年后关于区域集群创新著作的出版在国内掀起了区域集群创新研究的高潮,王缉慈的《创新的空间——企业集群与区域发展》一书达最高被引量643种次;④创新理论研究著作在学界产生较大的影响,有近1/5的高被引著作为创新理论研究,大多具有原创性;⑤创新管理尤其是技术创新管理和知识创新管理成为创新研究领域的热门话题,有10部创新管理著作被引553次;⑥创新经济学、创新与金融方面的研究著作引起学者更多的关注;⑦在知识创新、国家创新系统、创新精神研究方面,图书的影响力明显高于期刊论文,分别有7、4、2部知识创新、国家创新系统、创新精神方面的研究著作被引441、263、201种次,而高被引论文中只有4、1、0篇知识创新、国家创新系统和创新精神研究论文被引101、16、0次;⑧我国学者对国外学者所著创新图书的学习与借鉴明显多于外文期刊论文,表2中的高被引创新研究论文全为国内作者,而50部高被引创新著作中就有12部为外国人所著,国外高被引创新著作的理论性较强,主要是关于技术创新、创新经济学、知识创新、国家创新系统、创新精神与创新扩散方面的研究内容,这些著作具有较强的原创性,对中国的创新研究与发展产生了较大的影响。

从表2和表3中看期刊、出版社对传播创新研究成果的作用、贡献和影响,《科研管理》、《中国软科学》、《经济研究》、《管理世界》、《科学学研究》发表的9、9、2、4、3篇论文分别被引205、191、183、95、60次,这些期刊发表的创新研究论文质量较高、影响较大;《北京大学出版社》、《清华大学出版社》、《科学出版社》、《中国人民大学出版社》、《上海人民出版社》、《经济管理出版社》、《企业管理出版社》、《新华出版社》、《经济科学出版社》为传播中国创新研究成果作出了突出的贡献,如《北京大学出版社》、《中国人民大学出版社》各有4部出版著作进入表3,分别被引用827、305次,《清华大学出版社》、《科学出版社》各有6部出版著作进入表3,分别被引用793和344次。

再从作者的创新研究学术影响力与学术地位分析,除以上分析中提到的作者影响外,刘友金、王缉慈、陈劲、盖文启分别有4、3、2、2篇创新研究论文进入表2,他们分别被引103、63、47、36次;傅家骥有2部关于技术创新研究著作共被引562次,德鲁克有3部关于创新精神方面的著作共被引156次,魏江有2部著作被引用了125次;5E缉慈有3篇论文和1部著作、盖文启和陈劲都有2篇论文和1部著作、魏江有1篇论文和2部著作进入高被引统计中,杨瑞龙、许庆瑞、汪丁丁、柳卸林、高建、冯之竣分别有l篇论文和1部著作进入。

3 被引文献的创新扩散关键词分析

创新研究的概念扩散主要通过创新的下位关键词来体现,主要表征为与创新组配具有概念扩展意义的关键词,即以创新一词为中心前后搭配扩展的词语,它是一种语言组合轴上词语的有限组合方式,可以通过CSSCI被引文献题名中创新组配词出现的频次高低来确定创新研究热点和发展动向,观察创新研究的理论扩展程度和重要性。

本项研究采用自行选择创新组配关键词检索CSSCI引文信息的方法,获取创新扩散研究成果关键词的被引数据,选择了200多个常用创新组配关键词进行被引文献检索,并将同义词的被引频次合并处理,得到被引文献题名中的创新组配关键词被引排名,由表4可知,技术创新(7 994次)、制度创新

(3 291次)、创新系统/体系(2 639次)、创新能力(2 639次)、创新管理(1 639次)、国家创新系统(1359次)、自主创新(1 220次)、知识创新(1 056次)、科技创新(1 045次)、区域创新(1 032次)、企业创新(1 030次)等是中国10年创新研究的热点。

创新作为人们创造性劳动及其价值的实现形式可以分成知识创新、技术创新和制度创新三种类型,三类创新研究成果的被引量分别为7 994、3 291、10 576次,分别位于表4的第1、第2和第8位,技术创新最受我国社科研究界学者的关注,科技创新是科学与技术创新的简称,科技创新、科学创新科研成果的被引量分别为1 045和82次,分别位于表4的第9和第50位,可见,技术创新是中国10年创新研究的重中之重,科学创新研究成果的影响力远不及技术创新,技术创新既包括产品创新(被引331次)、过程创新(被引213次)、方法创新(被引129次)等技术领域的创新,也包括组织创新(被引586次)与管理创新(被引l 697次)等管理领域的创新,这些作为技术创新扩展内容的研究成果都受到学界的高度关注;制度创新以体制创新(被引530次)、创新政策(351次)、创新经济(292次)和创新管理(1 697次)等制度的革新为核心内容得到应有的重视;相对而言,我国学界对知识创新的关注度偏小,知识创新作为技术创新和制度创新的文化基础,其直接结果是新的概念范畴和理论学说的产生,应受到我国创新研究学界的更高度重视,知识创新研究中的创新文化(246次)、创新思维(176次)、创新环境(160次)、价值创新(90次)、创新意识(84次)等内容列入表4第28~49位。

中国10年创新研究与实践,使构建创新系统的理念深入人心,创新系统、国家创新系统研究成果的被引量高达2 639和1 359次,分别位于表4的第3和第5位,创新并非仅仅是指生产新知识和发明新技术,“它涉及了研究开发、技术管理、组织、工程、制造、营销、用户参与以及管理和商业活动等”,创新“可能只是已有技术的新组合而获得的市场新应用”,创新是由多种要素相互作用构成的复杂系统,在构成创新的诸多要素中,技术创新是国家创新体系的核心,企业是创新的主体,创新还涉及到政府、研发机构、中介组织、金融机构,创新既有与经济活动直接相关的因素,也有更广泛意义上的社会文化因素,创新系统概念涉及到的关键词有国家创新、技术创新、制度创新、管理创新、知识创新、企业创新、政府创新、组织创新、创新人才、创新政策、创新经济、产品创新、创新文化、市场创新等,都在表4之列,可见,10年间我国学者注重从系统的角度开展创新研究,从而形成了创新系统研究的热点。

含有表4所列关键词的创新研究成果的被引次数10年间呈逐年增长发展态势,在高被引创新扩散研究成果题名中,包含区域创新、创新人才、创新环境、创新扩散、结构创新、模仿创新、科学创新关键词的研究成果自1999年始被引用,其当年被引篇次分别为1、10、2、4、1、2、1次,发展到2007年,它们分别被引333、139、31、47、15、20、27次;题名中含有创新网络、体制创新、原创、合作创新、文化创新、创新思维、高校创新、持续创新、价值创新关键词的研究成果自2000年开始才被引用,即年被引篇次分别为2、5、2、3、3、5、3、3、2次,到2007年它们分别被引157、109、77、125、83、26、47、34、36次;题名中含有服务创新、创新绩效、方法创新关键词的研究成果2001年才被引用,当年被引7、2、2次,到2007年分别被引73、81、21次;题名中含有集成创新、政府创新关键词的研究成果2002年才开始被引用,当年被引10、2次,2007年其分别被引135、57次;2006年1月9日胡锦涛同志在全国科学技术大会上发表“坚持走具有中国特色的自主创新道路,为建设创新型国家而努力奋斗”重要讲话(该讲话被CSSCI来源文献引用31次),当年开始有题名中含“创新型国家”关键词的研究成果被引用,2006和2007年分别被引67和143次。

除此之外,10年被引篇次平均增长率较高的创新扩散研究成果题名关键词有自主创新、创新系统、知识创新、创新政策、市场创新、创新风险、创新主体、创新意识、创新模式、科技创新、创新战略、创新能力、创新行为、创新机制、创新活动、产品创新、企业创新、管理创新、理论创新、创新经济、国家创新、创新过程、创新精神、创新学等,其被引增长率由高到低依次递减,技术创新、制度创新研究成果被引增长率不高,中国创新研究10年中,技术创新与制度创新始终是最受关注的研究对象。

4 结束语

运用文献计量学的引文分析法进行研究热点和发展趋势分析,所依据的引文数据的质量对分析结果至关重要,CSSCI作为中文社会科学研究的评价工具,建设过程中十分注重数据质量,采取种种措施实行引文数据库的质量控制,但研究中仍发现存在各种各样的质量问题,为确保本项研究的有关数据相对准确,我们做了大量的数据一致性的校改工作,在采用创新组配词进行被引频次统计时,还进行了同义词合并处理,如:制度创新与创新制度、创新体系与创新系统、区域创新与地区创新、创新型人才与创新人才、创新能力与创造力或原创力、原创与原始创新和原始性创新等,将其被引词频合并统计,而将创新学的被引篇次减去创新学习的被引篇次等,数据处理工作量巨大并需较强的专业知识,且无法穷尽,只能做到尽可能地接近真理。

作者:纪蔚蔚

创新工程数据知识管理论文 篇3:

核电工程设计档案数据资源开发工作实践

摘要:为有效开发档案信息资源,提升档案利用用户体验度,深圳中广核设计有限公司开展了核电工程设计档案数据资源开发工作,通过“先行试点—经验总结—推广应用”的工作思路和“依托系统智能开发,辅以人工校验”的工作方法,深入挖掘核电工程设计档案数据信息,最大限度发挥档案价值,编制一批专题汇编报告提供给中广核设计院项目管理和专业设计人员使用,取得了良好的效益及影响。

关键词:核电工程;档案数据;开发利用

一、实施背景

核电工程设计档案在整个核电项目建设过程中扮演着极其重要的作用,是施工、安装、调试等工作的重要输入和依据。深圳中广核设计有限公司(以下简称“中广核设计院”)为使设计文件产生流程更加规范、档案信息利用更加便利,自主开发了工程文档管理平台(AE Document Management Platform,以下简称“AED”)和设计管理平台(Engineering Management Platform,以下简称“EMP”),设计人员通过EMP起草设计文件,按审签制度完成校核、审核、会签和批准,文档人员按照前端控制要求,对设计文件格式、元数据等进行规范性审查,确保所有设计文件元数据准确完整、格式规范。通过审查后,设计文件及其元数据自动同步至AED,完成文件到档案的转化。文档人员提前介入审查,极大地提升了设计文件出版质量,全面实现了文档一体化管理,为后续档案资源开发、利用工作的开展提供了良好的基础。这种电子文件归档方式将核电站标识、文件制作、流转、接收办理、分发、归档、鉴定等元数据纳入到核电工程设计档案管理全过程,但这种处理方式在档案信息资源开发和利用工作中存在着数据的设置相对侧重档案管理,不便于档案的查询利用,档案信息资源尤其是关键设计参数和核心数据的开发利用不够等问题。

为有效解决这些问题,在前期调研基础上,中广核设计院文件档案室(以下简称“文件档案室”)策划并组织开展了核电工程设计档案数据资源开发工作。

二、主要做法

为做好核电工程设计档案数据资源开发工作,文件档案室开展了广泛的前期调研,在此基础上明确了数据开发办法,以辽宁红沿河核电厂一期工程土建设计档案数据开發作为工作试点,对这些数据及参数信息进行加工,形成了一系列的专题汇编报告,主动推送给专业设计人员参考使用,并在试点基础上总结经验,逐步完成其他专业需求的数据资源开发编研工作。具体做法总结如下:

1.调研访谈

与主要设计部门(涉及系统、电气、仪控、设备、土建等专业)进行交流访谈,调研各专业对档案利用,尤其是档案内容及数据信息方面的需求,以及档案查询利用方面存在的困难,准确掌握了各专业设计文件出版的特点及各核电项目领域关于设计文件出版的要求。

2.项目实施

按照既定的工作思路与工作方法,文件档案室选择辽宁红沿河核电厂一期工程土建设计档案并按照“项目—机组—岛别—厂房—构筑物”的层次开展数据资源开发工作。

(1)确定核心数据类型。通过了解专业设计人员的数据需求,确定了“岛别、厂房代码、厂房名称、文件编码、卷标、版本、状态、中文标题、英文标题、机组号、厂房或建筑物代号、层位或区段代码、工程分类代号、工程分类代号说明、标高、分项描述、类型描述、房间标识、区域标识”等数据类型。

(2)文件准备。为了做好数据资源开发工作,利用AED客户端工具导出开发所需要涉及的辽宁红沿河核电厂一期工程设计档案,同时深入学习了《CPR1000项目工程文件编码系统》《厂房、建筑物、层位及房间的标识总则》《压水堆核电站主题词表》等参考资料。

(3)开发标准文档检查工具。在EMP中开发了标准文档检查工具,设置相应的文本识别和检索条件,针对具有标准格式的word、CAD格式转化的PDF格式的不可编辑档案进行内容爬取,显示爬取结果并与所需数据类型进行比对,将比对无误的数据信息记录为日志信息,提供数据导出功能。

(4)人工检查与校验。对于早期形成的非标准模板格式的设计档案,安排专人采用人工检查核对的方式,逐份档案提取所需数据,进行记录。为确保人工核对的准确性,同时安排了交叉检查及随机抽查。此外,对于通过标准文档检查工具爬取形成的数据,安排工作人员进行抽查校验。经检验,标准文档检查工具核对的全面性能达到100%,准确性高达95%以上。

(5)汇总核心数据清单。根据标准文档检查工具及人工校验形成的数据,汇总了辽宁红沿河核电厂一期工程土建设计档案共计182组厂房和建筑物,相关数据清单达28877条,其中核岛主厂房建筑群数据约占70%,常规岛主厂房建筑群数据约占10%,厂内和厂外辅助设施建筑物数据约占20%,完成15630条土建厂房和建筑物标高信息提取,占总比例的58%。通过对厂房和建筑物数据的分析、提取,对照《压水堆核电站主题词表》,汇总完成《辽宁红沿河核电厂一期工程厂房和建筑物代号总清单》。

(6)问题反馈与处理。针对在标准文档检查工具和人工校验中发现的2032条存疑的系统著录数据及文件实体问题进行了逐份核查,密切与档案产生者及项目管理部门沟通,处理电子文件错误、文件编码错误、文件标题错误、纸质实体模糊等问题432次,进一步保证了设计院档案的质量。

(7)组织专题报告编制。在汇总完成数据清单的基础之上,严格按照“项目—机组—岛别—厂房—构筑物”的层次,编制了《辽宁红沿河核电厂一期工程厂房和建筑物代号清单》《辽宁红沿河核电厂一期工程厂房、建筑物、层位及房间标识》两份专题汇编报告,并主动推送全院使用。

3.经验总结

通过开展辽宁红沿河核电厂一期工程土建专业设计档案数据资源开发工作,文件档案室进一步理解了核电工程设计档案的特性,熟练掌握和灵活运用相关工作程序,验证了标准文档检查工具的实施效果,充分采用《压水堆核电站主题词表》、利用标准文档检查工具进行数据爬取、人工对照文件实体比对、小组讨论、与专业设计部门沟通等工作方式,充分总结经验,形成良好实践,为下一步的推广应用奠定了坚实的基础。

4.推广应用

通过开展辽宁红沿河核电厂一期工程土建设计档案数据资源开发工作,文件档案室积累了丰富的经验,增强了做好核电工程设计档案数据资源开发工作的信心。在充分总结的基础上,相继开展了辽宁红沿河核电厂一期工程设备设计类、系统设计类、电仪设计类档案数据资源开发工作,并于组织编制了《辽宁红沿河核电厂一期工程设计档案主题词表》《辽宁红沿河核电厂一期工程设计档案核心数据词典》两份综合报告。

三、效果及影响

设计院文件档案室核电工程设计档案数据资源开发工作创造性地将信息技术手段与档案信息资源开发利用有机结合,在实践过程中证实了工作思路与工作方法的可行性,并为设计院创造了可观的经济效益和管理效益,提升了用戶体验,锻炼了组织人才,具体效果和影响如下:

1.提升了档案信息资源开发利用水平,创造了可观的经济效益。经过3年多核电工程设计档案数据资源开发工作,文件档案室在档案信息资源利用开发领域积累了丰富的经验,在核电工程建设档案信息利用领域形成了良好的口碑,通过积极推介,设计院文件档案室先后获得了多家公司的关键数据整合和利用合同,合同总额超过了1000万元人民币,为企业和部门发展带来良好的经济收益。

2.有效汇聚了设计院知识资产,为核电设计工作有序推进提供了重要的参考资料。工作组对核电工程设计档案进行深度挖掘,编制了一批专题报告,将“沉睡”在AED中的档案信息重新挖掘出来,在数据清单基础上,编制了主题词表和核心数据词典两份综合性报告,囊括了辽宁红沿河核电厂一期工程设计档案的大部分基础数据及设计参数。据统计,两份报告在线浏览量超过15万人次,为我国二代加改进型核电站的批量建设提供了重要且集中的设计输入信息,整体提升了相关核电工程设计工作的质量和进度。同时,辽宁红沿河核电厂一期工程设计档案数据大量用于数值校订检验和设计改进,其差值也便利了设计人员进行设计改进的理论论证和实验程序编制,为提升设计院整体设计能力提供了重要的原始信息。通过核心数据不断地积累、保护、创新和循环再应用,最大程度发挥了文件档案室作为设计院档案管理和知识资产管理的作用,推动了项目设计进展。

3.创造性地将信息技术手段和档案信息资源开发利用有机结合,为同行提供实践参考。核电工程设计档案数据资源开发工作所取得的良好经济效益和管理效益,验证了“先行试点—经验总结—推广应用”工作思路和“依托系统智能开发,辅以人工校验”工作方法的正确性,通过信息技术手段进行档案信息资源开发利用工作,节省人力投入,提升工作效率和质量,推动了档案管理的科学化、智能化水平,为企业档案信息资源开发利用提供实践参考。在执行数据整合和利用合同过程中,不断加强交流协作,促进兄弟单位档案管理和知识管理水平不断提高,推动行业知识资产开发利用水平持续提升。

4.提升了设计人员满意度,培养了文档人员知识技能。通过数据资源开发工作,丰富了核电工程设计档案元数据类型,基本消除了各专业间设计数据存在的“信息孤岛”问题,减少了非必要的提资工作。经测算,累计为设计人员节省提资时间2.3人工·年,设计人员可通过主题词表和数据词典,快速准确地在AED中查到所需档案,节约了时间,改善了对文档工作和文档系统的体验感和满意度。在项目推进过程中,与设计部门、项目管理部门密切协作,提升了文档管理部门在设计院的影响力,提高了全院员工的档案意识与知识管理意识。此外,通过项目锻炼,项目参与人员熟悉了核电基本知识、核电站设计过程、核电工程建设全业务链环节,对于设计院文件控制与档案管理工作有了更深刻的认识。在项目实施与推动工作中,积累了丰富的经验,提升了项目管理、沟通协调、系统开发测试和工作统筹安排的能力,起到了人才培养的重要作用。

作者:许建兵

上一篇:信息化发展管理会计的论文下一篇:高校音乐专业钢琴教学论文