普查数据

2024-07-24

普查数据（精选十篇）

普查数据篇1

关键词：水利普查,数据更新维护,技术手段,对策研究

0 引言

第一次全国水利普查, 获取了我国迄今最为全面细致、完整系统的涉水基础数据资源和规范权威的普查成果。为将普查数据资源和成果, 根据公开程度和适用范围, 以全面完整、形象直观、灵活方便的方式, 提供给社会公众、科研院所和政府相关部门使用, 确保水利普查的巨大意义和应用价值得到充分体现, 国务院水利普查机构在2013年度开展了“第一次全国水利普查成果查询及服务系统”建设, 目标是基于水利普查原始数据进行分析加工和概化提炼, 形成全方位反映水利普查内容的成果体系, 满足水利系统内外不同层面用户查询、共享和使用水利普查成果的需要[1]。该系统的建成将为建立国家基础水信息平台奠定坚实的基础。

水利普查数据具有一次性特点 (普查的标准时点为2011年12月31日, 时期资料为2011年度) , 然而, 水利普查对象本身是处于动态的变化过程当中的, 如果不考虑现势性特点, 水利普查数据和相关成果, 以及以此为基础建设的信息系统都会在不久的将来失去使用价值, 造成普查投入资源的极大浪费。为了确保水利普查数据能长效地服务于水利普查的总体目标, 有必要以第一次全国水利普查数据为基准, 在“第一次全国水利普查成果查询及服务系统”建设的基础上, 研究水利普查数据更新维护的长效措施及机制。

1 普查数据及成果应用面临的主要问题

1.1 数据更新是否及时

保持数据的现势性对信息系统而言至关重要。当前, 应高度重视全国水利普查数据后续更新问题, 缺乏现势性的数据将对后续信息系统查询、分析服务、决策判断产生误差或误判, 使得信息系统在实践应用中无法真正发挥作用, 逐渐失去使用价值。因此, 为了长期发挥水利普查数据及成果的使用价值, 需根据实际情况及时更新, 保证数据的常新常用。

1.2 数据质量能否保障

数据质量是信息系统发展过程中普遍遇到的问题, 数据质量的优劣决定着系统分析质量及应用的成败, 缺乏数据质量保证的信息系统将无法得到用户的信任, 并最终导致整个系统不可靠甚至无法使用。普查阶段, 水利普查数据的填写、汇总和上报等工作都经过严格的数据处理和审核验收环节[2], 数据质量是有保证的。但后续更新维护过程中的数据质量问题, 要求更高, 目前亦应重视后续数据质量的保障, 以防由于后续数据质量不合格导致整个普查数据及成果的可信度降低。

1.3 数据共享能否畅通

目前水利行业结合各项业务, 开发建设了一些专用数据库及相应的信息系统。但这些数据库及信息系统缺乏统一的规划, 也没有遵循统一的标准或规范, 数据库与具体的业务处理紧密绑定, 服务目标单一, “信息孤岛”问题严重, 难以满足多业务协同的需求, 为水利信息资源的深度挖掘、综合分析、决策支持的发展设置了障碍[3,4]。水利普查数据及成果涉及水利行业6大业务领域, 是各业务领域信息系统数据基础的重要来源, 也是整合各业务系统数据资源的一个契机, 因此如何保障数据及更新后的数据在各业务系统之间的共享, 是数据更新维护中需要重点考虑的环节。

1.4 现有数据能否满足需求

水利普查数据主要是涉水基本信息, 以及在此基础上形成的统计和相关主题成果, 仍然难以满足各业务深度开发及跨专业综合分析应用的需要。如果将水利普查数据作为未来发展国家基础水信息平台的基础, 需要满足不同层次和深度的用户需求。因此在后续的普查数据更新维护中, 以水利普查数据为基点, 将在此基础上研究或应用的成果数据充实到数据平台中, 才能充分发挥“滚雪球效应”, 逐步建立专家决策支持数据库, 充实和完善国家基础水信息平台。

2 普查数据及成果更新维护对策建议

2.1 更新维护的总体目标

遵循《全国水利信息化发展“十二五”规划》五统一目标中的“统一数据中心”[5], 以水利普查数据及成果为基础, 以完善的数据更新维护机制为保障, 构建“统一化、专业化、标准化”为特征的水利数据中心, 最终形成一体化的国家基础水信息平台。

2.2 更新维护的总体原则

普查数据及成果的更新维护机制不能仅仅针对普查数据及成果本身, 而应该站在水利数据中心的角度, 从水利信息系统顶层设计的高度看待普查数据及成果的更新维护问题, 因此, 在研究对策的过程中应把握以下原则:

1) 多样性原则。水利普查数据及成果涉及多个业务领域、多种数据类型, 因此数据更新维护应该根据不同的数据特点提供灵活多样的技术手段。

2) 适用性原则。水利普查数据及成果涉及的业务领域多, 数据量非常大, 因此数据更新维护应该结合业务工作流程, 制定切实可行的对策, 以防范由于不切实际无法实施的情况;也要防范仅为更新普查数据而更新的情况, 提倡在实施业务活动的过程中“顺带”更新普查数据。

3) 规范性原则。由于数据更新维护涉及多样化的技术手段和更新路径, 为了保证更新维护数据的质量, 必须通过标准、工作流程及管理制度等对数据更新维护的过程实施规范化管理和控制。

4) 协同性原则。水利普查数据及成果需要被信息系统应用才能体现其价值, 而信息系统的某些应用成果也可以充实水利普查数据及成果内容, 因此, 在数据更新维护过程中应考虑二者之间的协调处理。

5) 同步性原则。水利普查数据及成果不仅涉及原始数据, 还有在原始数据基础上形成的派生数据, 以及依据原始和派生数据生成的其他数据, 原始数据更新维护后还需考虑派生数据的同步更新问题。

2.3 更新维护的技术手段及路径

从“第一次全国水利普查成果查询及服务系统”的角度来看, 普查原始数据存放在关系数据库中, 成果数据存放在数据仓库中, 系统数据架构如图1所示。数据仓库是面向主题, 支持决策制定过程, 提供OLAP (联机分析处理) 查询的分析型数据库, 主要支持查询和聚集操作, 因此水利普查数据及成果的更新维护过程聚焦在原始数据这个部分, 主题数据作为派生数据可通过定期或人工启动ETL (数据抽取—转换—装载) 等过程重新加载。

从数据应用过程来看, 分为采集—传输—处理—存储—应用—展现几个阶段, 数据总体流向图如图2所示。图2中数据采集层是将各种数据通过自动量测或数据上报系统上送, 在水利数据中心建设并完善的情况下, 上送数据在数据交换层按照统一的数据接口完成数据结构的转换、数据的初步处理, 存储到数据平台层的相应数据库中, 然后通过SOA服务总线对各业务系统提供数据服务。然而, 目前由于各业务系统独立开发, 且没有统一的规范或标准, 业务应用与数据库捆绑紧密, 同时考虑到各业务系统的投资建设, 即便在水利数据中心统一规划和建设的过程中或建成后, 各业务系统也不可能同步退出服务, 重新规划建设。因此, 在目前乃至今后很长的一段时期内, 图2中的数据源层和平台层将共存, 目前的自动量测或数据上报系统直接与各业务系统数据库和普查原始数据库关联, 通过它们再将数据传送到数据平台层;同时, 各业务系统又将取用数据平台层的相关数据, 在各业务系统与数据平台层之间将存在大量的数据整合和交互。

按照数据应用的基本流向, 在研究数据更新维护的技术手段时, 可从以下几个方面考虑:

1) 扩大自动量测系统的覆盖范围。涉水数据中部分实时动态变化的数据, 包括水位、流量、流速、雨量、水质、供水水量等应该实现自动采集和传输, 按照流域重点区域、水利工程规模、山洪灾害发生频率等因素规划适度的水文/水位站网密度, 利用先进的传感技术逐步实现实时动态数据的全自动采集, 经由水利专网上传至各业务系统或水利数据中心, 实现水利普查中这部分数据的实时动态更新, 历史数据存储。

2) 丰富数据上报系统的终端应用。涉水数据中大部分属性数据, 可通过数据上报系统填写上报, 填报终端应考虑PC机、手机和平板电脑等的应用, 数据通过政务内网、无线网等方式上传, 数据上报系统多终端应用的目的是保证数据更新的便捷性和及时性。

3) 整合多业务系统数据。目前各业务系统数据库都是独自运行的, 即便针对同一业务对象, 在不同的业务系统中也可能由于命名编码不一致, 难以实现同一业务对象不同业务系统数据的整合。水利普查数据为各业务系统数据整合提供了一个良好的基点, 已有的业务系统可以在业务数据库与数据平台层基础数据库间建立业务对象的映射关系, 新建的业务系统各业务对象及基本属性直接来源于基础数据库, 这样可初步保证各业务系统业务对象的一致性。同时, 各业务系统有一些业务数据可供其他业务或中心决策所用, 这部分数据可通过标准的通信协议和数据接口充实到数据平台层的共享数据库中。应该说, 水利普查数据为各业务系统提供基础数据支撑, 同时各业务系统又对水利普查数据进行补充和完善, 相互之间的关系极为密切, 数据更新维护的机制或流程做好了, 将会相互补充, 充分发挥“滚雪球效应”, 反之则出现“一团麻”局面。另外, 在普查数据与各业务系统数据整合过程中, 可能出现同一数据多个来源且数值不一致的情况, 应尽可能从规范、标准入手, 排除造成数值不一致的因素, 如定义、分类不一致等, 对于某些统计数据, 应尽可能统一各业务系统的统计口径;同时减少来源渠道, 做到一源多用或通用。当然, 在多源数值都具备意义的情况下, 数据库表的设计应当满足存储数据多源特性的要求。

4) 设置唯一的数据发布途径。进入到数据平台层的数据及更新维护有很多途径, 包括普查原始数据库、各业务数据库或其他途径, 但是, 各层级用户、业务系统、信息系统使用数据平台层的数据只能通过服务总线提供, 保证数据发布的唯一性, 以便于数据管理, 有利于控制数据质量和保证数据的一致性或唯一性, 满足各业务异构系统对数据的需求和交互。

5) 部署分级分业务更新维护模式。不管是水利普查数据及成果, 还是未来的水利数据中心, 都将满足不同层级、业务用户的需求, 不同层级用户对数据内容的广度有所要求, 不同业务用户对数据内容的深度有所要求。从分级来看, 可分为国家、流域、省, 不同级别的数据中心涵盖范围不同, 省级数据中心仅包括本省详细数据和相关省份共享数据, 流域数据中心包括本流域详细数据和相关流域共享数据, 国家数据中心包括各流域和省份重要相关数据 (是否包括全国所有详情数据, 有待结合数据量、通道、性能、管理等因素进一步研究) 。因此, 数据的更新维护可考虑在本级数据中心的范围内实施。而不同业务深度开发数据由不同的业务主管部门负责管理及更新维护, 形成一个纵横交错的网格状数据管理及更新维护模式。

6) 采用数据预处理技术。为了保证数据平台层的数据质量, 应该在各类数据入库前严控入库数据的质量, 除了各种人工的审核流程外, 针对不同的数据类型和特点研究各种数据预处理技术, 提高数据质量的自动化检测水平及数据入库效率。

7) 开辟“水利数据bbs”。不管是水利普查数据及成果, 还是后续的补充数据, 虽然都经过审核或预处理环节, 但仍然不能保证所有的数据百分百正确, 在数据的使用过程中, 或多或少会出现这样那样的问题。那么, 应该考虑在水利数据及成果的使用者和管理者之间搭建一座沟通的桥梁, 建立用户反馈机制, 提供反馈数据使用情况、评价信息及质量问题的统一平台, 这样也便于及时收集并掌握数据存在的问题, 集中进行处理并更新完善, 以保证数据的权威性。

8) 利用关联业务校核。水利各项业务都是针对所有水利对象 (包括普查对象) 的, 因此, 各业务之间存在某些相关的联系, 深入研究各业务流程关联关系, 也能为某方面数据的更新维护提供帮助。例如, 规划计划业务已经下达了新建某个水库的计划 (水库编号******) , 建设开工时间****年**月**日, 该日期后水利工程管理业务并未查询到该编号水库情况, 说明数据尚未更新, 可由系统自动向该水利工程管理单位或负责人派送数据更新要求。

9) 研究先进的数据更新维护技术。在水利普查数据更新维护过程中需要考虑的一些技术问题, 并没有涉及具体采用的技术方法。水利普查数据量大、类型繁多、应用对象广泛、关联关系复杂, 还有空间数据和保密要求, 在数据更新维护技术方案的制定过程中, 不可能采用某一种技术方法包罗万象, 需要选用已有或超前的数据更新维护技术, 或者其他一些领域的相关技术, 深入研究其在水利普查数据更新维护过程中的适用性和可行性。

2.4 相关标准的研究制定

“标准先行”的理念在各行业发展中都已深入人心, 标准化是信息系统建设的重要基础, 是实现数据资源共享和各业务系统协同工作的重要保障。水利行业已经颁布了《水利信息化标准指南 (一) 》, 内容涵盖了分类编码、信息采集、信息传输与交换、信息存储、信息处理等10个方面[6], 但是在水利信息系统的建设发展过程中, 由于标准的适用性及重视程度不同等主客观原因, 标准的执行或多或少存在不足, 以至于目前各业务系统特别是在信息资源整合、数据交换和共享方面存在难点。水利普查数据及成果作为服务于多业务领域的公共数据资源, 设计、更新维护必须遵循相关的水利信息化基础标准, 在数据库/表结构、设备, 以及数据命名、接口、存储、交换及服务方面应确定一整套相关标准, 水利信息化基础标准不满足需要或不切合实际的, 应有针对性地进行修改、补充和完善, 最终通过数据资源层的标准化实现水信息平台的高度开放性。

2.5 相关管理制度及工作流程的研究制定

水利普查数据是经过清查、普查、填表、汇总、上报、审核、入库等程序, 在统一的管理制度和工作流程的指导下, 耗费大量人力获取的。即便今后水利普查数据库与其他业务系统相关联, 部分数据来源可以自动更新, 但是这部分数据所占比例极其有限, 大部分还需通过人工处理完成, 因此, 有必要出台一系列管理制度及工作流程, 以保证数据更新的及时性及入库数据的质量, 需要考虑的问题有以下几点:

1) 水利普查数据量庞大, 涉及专业及业务领域众多, 不宜将更新维护工作集中在水利数据中心 (普查数据库维护机构) 完成。适于采用分散更新、分级审批、集中入库的方式, 由各项目/工程/业务负责人提交变更申请, 省/流域/国家数据中心或相关业务司局审批, 流域/国家数据中心统一入库, 可以据此制定一套报送制度和网络化的电子工作流程。

2) 水利普查数据具有一定的保密要求, 专业性也比较强, 可以考虑将基础和共享数据库集中管理, 专业和业务数据库分散托管的方式, 谁管理谁审批入库。

3) 建立数据资源共享、维护责任共同的数据管理模式, 各级数据更新提交人员负责数据的及时更新, 审批人员负责控制上报及入库数据质量, 提交—审批—入库的关键环节都应有日志记录, 并且能方便地提供回溯追踪, 将谁提交谁负责、谁审批谁负责、谁入库谁负责的责任制度落实到每个关键环节。

3 结语

数据更新维护技术手段、标准、管理制度及工作流程, 是解决当前水利普查数据及成果应用可能面临主要问题的初步探讨, 力求为后续水利普查数据在水利信息系统的有效应用提供有价值的技术和管理参考, 这些措施和方法对水利其他数据的更新维护具有普适意义。由于任何一类技术手段或管理方式都难以独立支撑数据的更新维护过程, 今后更应关注多种措施的密切结合和协调配合, 以建立数据更新维护过程的长效机制, 确保水利数据资源得到充分利用, 进一步为水利数据中心乃至国家基础水信息平台的建设奠定良好的数据基础和保障环境。

参考文献

[1]国务院第一次全国水利普查领导小组办公室.第一次全国水利普查成果查询及服务系统项目申报书[R].北京:水利部, 2012:1.

[2]国务院第一次全国水利普查领导小组办公室.第一次全国水利普查实施方案[R].北京:水利部, 2010:7-13.

[3]蔡阳.现代信息技术与水利信息化[J].水利水电技术, 2009 (8) :133-138.

[4]刘恒伟, 柳林.水利信息孤岛再认识[J].海河水利, 2012 (5) :59-61.

[5]水利部信息化工作领导小组办公室.全国水利信息化发展“十二五”规划 (水规计[2012]190号) [R].北京:水利部, 2012:84.

农业普查数据审核工作要点篇2

各县（市、区）农普办、省级集聚区农普办：

根据《关于加强农业普查数据质量控制的通知》（浙农普办【2017】8号）文件要求，结合全省数据审核工作要求，现将全市近期数据审核工作要点明确如下，请各地农普办切实加强组织领导，确保高质量按时完成数据审核工作：

一、时间节点要求

3月25日前，完成省数据处理平台的数据审核修改工作；3月27日前，完成县级审核验收工作（乡级验收时间由各地掌握）；3月28日前，完成市级审核验收工作。3月底后新增的国家级数据审核差错修改工作，其完成时间另行通知。

二、数据处理流程

1.查漏补缺工作（重点结合温州市下发的“与农村处的数据比较表”和浙农普办【2017】8号文件的核评重点开展）；

2.PDA上报；

3.排重；

4.畸大畸小值校验（部分可以通过审核排除，未列入审核的要通过查询排序发现）；

5.省级审核错误修改（审核公式zj开头）；

6.国家级审核错误修改（近日审核公式会进行更新和添加）；

7.汇总结果评估（省处理平台已经有17张汇总表，以后会陆续增加。核实评估重点同查漏补缺工作）； 8.数据逐级验收。

三、具体问题说明

（一）删除和新增

鉴于现在修改都在数据处理平台,如果PDA重新上报会导致平台上的数据被覆盖,现对删除和新增的操作做以下说明

1.删除：目前除了重复的对象可以对比删除外，其他对象，等待国家授权来删除（可能会授权到地市级，到时候统一上报到市里，由市里删除）。

注意：除非所有的修改都在PDA上，否则不能用PDA上删除重新上报的方式来实现删除，会导致平台上的数据被该PDA覆盖。

2.新增：目前平台没有提供新增功能，只能在PDA上新增。请按照以下步骤操作：

①找一个全新的PDA，安装注册好终端管理及农普采集软件。如果没有全新的PDA，请找一台未录过该普查区的PDA，做好备份（最好将备份上传到市办），然后注销，重新在终端管理注册到相应小区。

②录入新增的对象，确保该对象编码（户编码或者单位编码）和平台上的不重复。

③审核通过后，上报。

（二）关于VPN使用

农普数据处理平台一律不准开放外网。有专线直接接入统计内网的乡镇，无需通过VPN，可以直接连接；没有专线接入统计内网的乡镇，只能通过VPN连接。

鉴于市局VPN服务器的连接数有限，目前同一个账号最多允许4台设备接入（农普数据处理结束之后，会恢复只允许一台），请各地在使用的时候，如果有闲置，请及时断开VPN的连接。

请各地农普办在抓好数据审核工作的同时，及时上报工作进度、工作动态和先进事迹。

温州市农普办

提高基层经济普查数据质量的对策篇3

【关键词】基层经济普查；数据质量；影响因素；对策

自2013年第三次全国经济普查以来，基本单位名录库及数据库系统已经初步建成，对于研究决定我国经济社会发展方向，改善宏观调控，优化经济结构，开拓新的就业途径，提升人们生活质量，构建和谐社会，均具有重大的意义。为了做好第三次经济普查工作，本文作者根据第一二次经济普查与其他普查的工作实践，针对如何提高基层经济普查数据质量提出了自己的几点拙见。

一、影响数据质量的主要因素

1.普查单位的重视、理解和配合程度差造成源生性错误

经济普查报表的内容主要包括了普查单位的一般情况、经营情况和财务状况，在市场竞争日益激烈的形势下，有的个体企业、私营企业，由于担忧税收加重的传统思想，对经济普查工作持不配合、怀疑的态度，不如实填写表格，无法真实反映企业的真实经营状况，这便是基层单位经济普查数据不准确的原因之一；其二，有的基层单位日常统计工作不规范，填表普查表的基础较为缺乏，无法准确填表。全部采用企业一套表，基层统计数据的采集方法变化较大，全部的普查数据都需要普查对象采用网络平台予以报送，普查对象的合作程度在一定程度上影响到了普查数据质量的准确性和可靠性。

2.基层普查人员素质较低，无法降低和防控数据差错

最近几年来，基层普查大多数都采取分点包片、任务落实到人的组织方式，然而大多数的基层普查员都是临时抽查的，有的基层普查人员普查工作经验较为匮乏，甚至并不具有相关统计知识和技能，这些人员承担着基层包点乡镇业务指导、培训、严格审查普查表的职责。这些基层普查人员虽然通过了正式的业务培训，然而却无法在那么短的时间内吸收消化，成为实践经验丰富、审核控制力较强的审查主力军，在普查对象的培训和指导过程中慌忙上阵，在很大程度上影响了普查表格正确填报。

3.相关部门的配合是确保普查数据质量的重要因素

经济普查不同于其他普查，其显著特征在于需要相关部门的积极培训，是一项复杂的系统工程。分析第一、二次经济普查工作得知：其一，只是从民政、工商、质检、税务、编办等部门着手，将参与经济普查登记的所有单位底数全部摸清，这是十分艰难的；其二，分析相关单位提供的单位记录分析，大部分的单位记录更新不及时、数据有误的现象时有发生。例如已经注销的单位并未及时予以注销，单位名称不同等现象屡见不鲜，这无疑是加大了单位核对工作难度。其三，证券、银行、铁路、保险等部门全部由于上级普查办负责统一组织普查，这些数据在经济总量占据着较大比例，这样普查数据质量也会直接影响到全部普查数据的质量。

二、基层经济普查数据质量控制的有效对策

1.做好入户登记工作，确保数据真实可靠

在入户调查过程中需要做好如下两方面的工作：

（1）准确划分归属行业

划分归属行业是经济普查工作的基础，也是控制数据质量的关键点。怎样科学合理地划分普查对象的行业属性，是基层普查机构、普查工作人员面对的重大考验。行业划分科学合理，便能提升数据质量，不然则会造成数据失真，纰漏较大，导致普查的数据与实际情况相差甚远。更加全面的了解产业组织、产业结构、产业技术的现状以及各生产要素的构成，进一步查实服务业、战略性新兴产业和小微企业的发展状况，摸清各类单位的基本情况，全面更新覆盖国民经济各行业的基本单位名录库、基础信息数据库和统计电子地理信息系统。

（2）根据调查对象配合程度不同，运用不同的调查方法

调查对象大致划分为如下两种类型：一种是农场所属的法人、分局和产业活动单位，另一种是配合程度相对较差的非国有单位。针对第一种类型的普查比较简单。这些单位自身拥有完善的财务账务和财务核算系统，普查数据能够从财务决算和会计账务中直接取得。对于第二种类型的单位，不仅需要基层普查机构和普查人员用心感化普查对象，广泛宣传普查现实意义，争取被普查单位的支持与配合。如果屡次不配合调查的单位，可以根据经济普查条例的有关内容，采用法律方法予以解决。另外，详细解决指标，全方位调查，在实际调查过程中，对于“三无”单位的疑难问题，最好采取判断和验证经济资料的合理性、准确性。在计算方式上最好采取税收资料倒推法、工资递算法、成本费用支出倒推法。同时可采用熟人调查法、直接观察法、分析对比法、经验推理法等等调查技巧。熟人调查法，即是针对不配合提供真实经营数据的单位，通过企业法人或财务人员的亲属或朋友掌握其准确、可靠的经营情况。经验推理法，即是采用以前掌握单位数据资料，按照经验对其经营状况进行合理推算的一种方式。分析对比法，即是对行业类型相同、规模相同、经营环节相同的企业进行对比的一种方法。在应用各种方法调查的过程中，还应该坚持突出重点、统一组织，创新手段的原则。准确评估个体数据指标情况，在评估的基础上对普查数据进行全方位验证，若发现存在问题，再回到每个单位去核对，从而有效控制数据质量。

2.加强宣传，注重培训

广泛宣传经济普查的重要性，引导每个普查对象都能够知道并明白自己的权利与义务。同时高度重视普查人员业务培训，尽可能降低人为差错。针对普查员的培训采用自上而下逐级培训方式，培训的重点在于組织开展普查活动，普查各项指标含义和统计标准，普查表的填写与审核、数据处理程序操作等等。另外，落实好清查摸底工作。采取“地毯式”清查方法，实地登记各个普查对象，构建清查名录库，保证不再出现重复审查对象。

3.实现普查部门的有机配合，形成强大凝聚力

为了保证基层经济普查数据的质量，其关键在于普查相关部门的有机配合。经济普查的调查对象和范围尤为复杂，这就需要基层政府的普查机构与保险、银行、证券、民政等部门积极合作，开展全方位的有效配合。另外，为了将普查工作真正贯彻落实，还需要设立专门的基层普查领导小组，科学合理地配置统计资源，立足于普查全局，并且对综合统计、部门统计与社会统计进行有效的协调与衔接，达到一体化管理。只有相关机构之间的配合达到了最佳状态，才能保证经济普查，尤其是单位清查才能够顺利开展。

4.严把质量验收关，确保普查数据质量

认真制定普查质量控制工作具体内容和普查表填写要求，同时严格遵守规定进行普查登记工作。每位普查人员入户调查时，要求被普查人员在填写每一张报表、每一项指标、每一个数据时必须根据相对应的目录和代码进行，确保准确可靠，使得表内、表间保持平衡。把普查登记的单位和企业与有关部门所制定的名录库进行一一核对，找出纰漏，探究问题所在；对于企业各项生产经营活动可能存在的问题，注重对核算企业增加值有关数据进行核查；对各个地区上报统计数据进行平衡，加大对大数据的审核力度，实现数出有据，符合逻辑，保证了普查数据的质量。

经济普查数据质量控制是一项光荣而艰巨的任务，贯穿于整个普查过程中，不管哪个环节出现问题都会影响普查数据的真实性。基层普查机构在普查过程中做好入户登记工作，确保数据真实可靠；实现普查部门的有机配合，形成强大凝聚力；严把质量验收关，确保普查数据质量，只有这样才能保质保量完成普查任务。

参考文献：

[1]杨卿，桂喜民，谢思远.关注重点扎实细致客观反映经济发展——对做好第三次经济普查的几点想法[J].统计与管理，2013，11（06）：214—216

[2]张来成.普查连着你我他搞好普查靠大家——访第三次全国经济普查领导小组办公室常务副主任、国家统计局总统计师李强[J].数据，2013，20（12）：116—119

水利普查数据质量控制的研究篇4

关键词：水利普查,数据质量,质量控制,数据处理,影响因素,对策

0 引言

国务院第一次全国水利普查,在全国范围内发动近百万的水利普查人员,按照统一的标准和操作规范,开展水利普查对象指标数据的采集与处理,形成水利普查数据。如何让近百万的水利普查人员在执行标准和操作规范上协调一致,形成全面、完整、一致和准确的水利普查数据,是水利普查必须解决的问题,也是保障水利普查数据质量所需。研究影响水利普查数据质量的因素,提出相应的解决办法或对策,对提高水利普查数据质量至关重要。

水利普查数据主要通过以下2种方式获得:1)利用1∶50 000 DEM,DLG,DOM数据,和分辨率为2.5 m的影像数据分析,提取河流湖泊及其相关参数数据,主要由少数专业人员在内业完成;2)按“在地原则”,对普查对象及其指标进行采集、填表、录入和逐级汇总审核,主要由广大水利普查员完成。本文主要针对后者获得水利普查数据的质量控制进行研究。

1 水利普查数据组成

国务院第一次全国水利普查按照专业门类涉及河湖、水利工程基本情况,经济社会用水、河湖开发治理保护、水土保持、水利行业能力建设等情况,以及灌区和地下水取水井专项。按自然与非自然、管理与被管理单元、社会和非社会组织等特性,水利普查对象可分为自然类、管理类、水利单位类、独立工程类和用水户类,共5大类,32个小类,318项水利普查或调查指标,2 258个数据项[1]。水利普查对象指标数据项的数据类型主要有位置型、时间型、数值型、枚举型和字符串型。

2 水利普查数据处理阶段与方法

水利普查数据处理广义上讲,包括从数据采集至最终形成水利普查成果数据的全过程。主要分为数据采集、表格填写、表格电子化、汇总分析4个阶段,每个阶段的数据处理因工作内容不同,工作方法也不相同。

2.1 基础数据采集方法

根据《第一次全国水利普查实施方案》和《第一次全国水利普查空间数据采集处理实施方案》,因水利普查对象及其指标特点不同,基础数据采集技术路线分为外业和内业2大类,主要有现场查勘、档案查阅、DEM提取、遥感分析和估算推算等[2]。采集的基础数据一部分将填写到水利普查表中,另一部分空间数据将采用相应系统直接形成电子数据,两者之间通过水利普查对象编码建立联系,保障两种数据的关联性和一致性。

2.2 表格填写方法

各类水利普查对象的普查表中,指标多样,涉及多个专业门类,对填写和审核表格的人员要求较高,最好具有一定专业背景。表格填写应由经过水利普查专业培训的普查员,根据基础采集数据和相关填写要求,据实填写水利普查表。以县级行政区为基本工作单元,按照不同专业门类,分类整理成册,再对其审核归档。

2.3 表格电子化方法

水利普查对象繁多、指标复杂,指标描述形式多样,加上首次开展水利专业性普查,很难在短时间内实现标准化,采用卡片式机读方法,完成表格数据的电子化,因此,表格电子化只能通过人工录入方式完成。

2.4 汇总分析方法

各级水利普查机构,根据逐级汇总表(县级、地级、省级和国家(流域)分别按照乡级,县级,地级和省级等水利普查区划为单元汇总),纵向与本水利普查区既往统计数据进行对比分析,对于发生较大差异的水利普查区应找出发生该情况的原因,并给出合理解释;横向对下级水利普查区之间结合自然和社会情况进行对比分析,对于自然和社会类似或相近水利普查区之间发生较大差异的,应找出发生该情况的原因,并给出合理解释。

3 水利普查质量控制对策分析

水利普查中不可调和的矛盾,即少数掌握标准的人无法在短时间内完成任务,大量的可在短时间内参与开展普查工作的人员对标准掌握达到完全一致存在困难。解决这一矛盾的最好办法是尽量简化执行标准和操作规范,让大多数人能够方便掌握和执行,这也是水利普查数据质量保障的重要措施,应该说是最重要的对策。

3.1 质量控制模型

水利普查数据质量控制是从采集、填表、电子化直至逐级汇总分析的递进的质量控制过程,决定这一过程的关键因素是人,以及需要人遵照执行的一系列行为规范和技术指标。从某种意义上讲,虽然可以通过培训解决人的问题,但是受时间、经费和人员素质的限制,通过培训所能改变的人的特质很有限,因此决定性的因素是需要人遵照执行的一系列行为规范和技术指标。由此,得到的质量控制模型如图1所示。

从图1可知,水利普查数据要经过采集、填表、录入和汇总(逐级)才能最终形成水利普查成果,每个阶段需要普查员、录入员和分析员等,分层次和范围,遵照不同方法、规定、要求和策略等控制数据质量。

3.2 基础数据采集阶段

水利普查涉及6个专业和2个专项,需采集的数据的复杂程度是可以想象的。根据《第一次全国水利普查实施方案》,水利普查对象指标数据项数据的获得因对象及其指标不同,需采用不同方法进行采集。该阶段最大问题是指标复杂,涉及多个专业领域,参与本阶段工作的人员最好具备一定的专业知识。工作的关键是对指标采集方法的把握,否则除了具体指标采集发生误差外,还有可能因规模等相关指标把握不准,造成大范围系统性误差,使得不同普查员普查的结果没有可比性。

本阶段影响水利普查数据质量的主要因素有数据采集方法、参与人员素质和技术手段,三者相互作用,最终决定整个水利普查数据质量。一般来讲,采集方法越简单、参与人员素质越高(良好的智商和一丝不苟的工作作风)、技术手段越先进(尽量避免人为因素,能客观反映调查对象指标信息),预期水利普查数据质量就越好。受水利普查工作范围大,时点和工作时间的限制,甚至受到所处历史时期的限制,只能就地、就时取材,使用现有的人力资源,在一定范围内,尽量使用有较高素质的人员,但选择的余地不大。就水利普查数据采集技术手段来讲,一方面采集指标多样,对于不同指标只能采用不同的技术手段和方法;另一方面,受到目前所处历史时期的限制,水利普查对象指标的采集方法不能超越该历史时期科学技术所能达到的水平。总而言之,水利普查对象指标数据的采集技术手段,不可能因为需要水利普查而有所改变。通常情况下,1个水利普查对象指标的采集可能有几种不同方法,为了便于参与人员掌握和应用,减少因人的能力和技术手段问题,造成个体、系统误差。在选择水利普查对象指标采集方法时,应充分考虑相关影响因素,尽量选择简单的数据采集方法,保障普查员采集得来的水利普查数据具有个体的准确性和系统的可比性,从而保障水利普查数据质量。该阶段数据质量是基础中的基础。

3.3 表格填写阶段

需要填写的表格主要是清查表、台账表和普查表。填写的各种表格,除了对水利普查对象各种采集指标进行规范登记外,更重要的是数据录入人员将利用该表形成水利普查电子数据,该阶段影响数据质量的主要因素有表格形式、指标描述和填写方式等。3种水利普查表格中,普查表是最复杂和具有代表性的表格,理清普查表中影响数据质量的因素是解决该阶段数据质量问题的关键。

水利普查对象所填普查表的指标可分为标识、关系和核心等3部分指标。理论上讲,唯一确定1个水利普查对象的是该对象的所有维度信息,但在一定范围内,实际上只要个别维度信息即可。水利普查对象的标识也是如此,标识指标仅仅用来在第一次全国水利普查范围内,唯一标识该水利普查对象,因此标识指标越少越好,同时还应通过对各类对象的分析和抽象,选取部分相同指标,用来标识所有水利普查对象,该部分指标也应是清查表所要的指标项。关系指标是指用来描述水利普查对象内外关系,在水利普查期间用于汇总分析保障水利普查数据质量;在水利普查结束后,用于对水利普查数据的开发利用,发挥水利普查效益。核心指标是在各类水利普查对象众多描述维度中,选择最重要的指标,通过对这些指标的汇总和分析,试图对该领域的情况进行较客观的描述。为此将水利普查所有对象类的调查和普查表格抽象设计成3段式(调查内容统一设计成标识、关系和核心3个指标段),2个部分(除调查内容外,再加上表格填写有关信息,如:填表人、审核人2个部分),这将给填表人员带来极大认知方便,做到知其一、明所有,无需逐类逐个地了解和熟悉水利普查表格。

指标描述是决定数据质量的重要因素。首先,水利普查对象每个指标名称是否简单明了,符合通常概念所认知的内涵和外延,将直接影响填表质量。如果使用的仅仅是少数专业人员所了解的名词,将来填写的准确性将大打折扣。其次,指标描述方式可以是文字,也可以是数字,若使用文字描述,受填写人员书写能力和工整性影响,将给未来的数据录入带来困难,最好将指标数字化,便于填写和录入,总体而言,除对象名称和所在地外,其余指标都应该数字化。

表格填写方式是影响水利普查质量又一重要因素。在指标数字化基础上,表格填写位置应相对固定,所有指标的编写应该在表格中相对统一位置,如:一律在表格的右侧,方便检查指标填写的完整性和全面性。为了方便开展填写表格的审核和具有一定校验能力,建议选择和数字化填写同时进行,用于进行填写校验,每个指标选择和填写数字一致,是表格通过验收的必要条件。

3.4 表格电子化阶段

目前,普查表格电子化通常有2种方式,一种是通过格式化的表格,采用卡片式阅读设备,自动将按照一定方式填写的表格电子化,这种方式需要对一系列事情规范化,如:纸张规格、表格形式、填写方法等,对水利普查而言,短期内很难做到;另一种是利用专用软件,由录入员将填好的表格录入计算机,对水利普查而言是可行的方案。

针对采用人工录入的表格电子化方式,影响数据质量的主要因素有表格形式、指标描述、填写方式、录入软件等。表格形式、指标描述和填写方式除了影响填表质量,同样也影响表格电子化录入数据的质量。录入软件功能和性能将是保障水利普查数据质量的突出问题。一般来讲,软件录入功能对过程的控制是明确和严格的,如果所有录入人员能够严格按照功能要求完成数据录入,数据录入质量应该是最高的,并不是软件功能和过程管理做得越灵活越好。可往往是,由于具体方案本身缺陷和大范围多样性问题交织在一起,要是严格按照功能和过程管理进行处理,软件一定不能胜任工作。为此,软件录入功能,应该做到功能适用,过程管理除必需管理外,适当放开对过程的管理,由录入人员根据需要灵活开展相应水利普查对象数据的录入。但是,要对必要的值域范围和相互关系进行检查和分析,提醒录入人员注意可能发生的错误。

3.5 汇总分析阶段

经过采集、填表和录入3个阶段,水利普查数据总体质量应该已经确定,汇总分析阶段是对前3个阶段的数据质量进行进一步的控制。因为水利普查对象指标多样,所以可以据此进行纵向和横向对比分析。影响该阶段数据处理质量的主要因素有基础资料及相应的汇总分析方法等。仅从各种指标的简单汇总,可以说有多少指标就有多少种汇总,如果盲目对所有指标进行所谓的汇总,不但不能起到质量控制作用,还会适得其反。

汇总分析在一定范围内主要用来发现某一指标的奇异值,并对其进行再确认和修订,同时对一定范围水利普查汇总数据与历年统计数据进行纵向对比分析,并给出发生偏离的合理解释;在一定范围之间主要用来进行横向单元之间水利普查汇总数据的对比分析,同样要给出发生偏离的合理解释。

由此可见,需要在历年统计项中开展汇总分析,如果历年没有进行统计或水利普查汇总单元与历年统计单元没有可比性,也是没有办法进行汇总分析的。对于横向各水利普查汇总单元之间,汇总数据应该与其他和水利普查有一定内在联系的社会统计指标项进行汇总分析,例如:某指标与人口、GDP、地貌、气象等具有一定关系,2个类似水利普查汇总区可以利用已经掌握的人口、GDP、地貌和气象等资料对2个水利普查汇总区的数据进行比较。

为了达到事半功倍的作用,首先应该对水利普查对象历年统计内容进行分析,并据此设计水利普查汇总表指导县级、地级、省级和国家级开展汇总分析;另外,分析水利普查对象指标与其存在一定联系的指标,编制相应的汇总表,开展不同水利普查汇总区之间的对比分析;再在不同水利普查汇总表中选择具有代表性的汇总表,按照汇总区分类,对部分主要指标的极值、均值、累加值进行汇总和计数,作为逐级汇总审核的重要依据。

4 结语

决定水利普查数据质量的因素和环节很多,但是主要环节是采集、填表、录入和逐级汇总。总体来讲,所有的方法、规定、要求和策略,应力求简单明了,便于广大水利普查人员理解和掌握,并容易实施,以减少可能产生错误的机会,这是水利普查数据质量保障的根本。为此,应对复杂方法、规定、要求和策略,进行分析、抽象,并给出主要和关键的方法、规定、要求和策略,降低相关软件系统的复杂度,提高系统的可用性,全方位提供质量保证。文中所有概念是在许多正反两方面经验和教训的启示下,逐步形成的,对于水利普查数据质量控制还要在水利普查实践中不断总结和检验。

参考文献

[1]程益联.水利普查对象关系研究[J].水利信息化,2012(1):23-27.

XXX水利普查空间数据总结报告篇5

（XXX水利普查办）

2011年XXX水利普查空间数据工作，严格按照《第一次全国水利普查空间数据采集与处理实施方案》要求，以质量为中心，精心组织、周密安排，经过全区普查工作人员的辛苦努力在对数据录入、外业采集及内业标绘等各项工作，达到了上级规定的具体要求，较好的完成了水利普查清查阶段的空间数据处理工作，现将XXX水利普查清查阶段的空间数据处理工作总结报告如下

一、数据处理情况

1、清查数据录入情况

XXX普查办数据处理工作完成如下：一是完成清查数据录入，水利工程XX处、经济社会用水调查对象XX个、河湖治理清查对象XX个、行业能力单位XX个、灌区XX个；二是完成乡镇典型居民生活用水户调查对象XXX户、地下水取水井清查对象XXX眼、规模以上地下水水源地XX处；

2、普查静态数据采集、录入情况

通过清查登记、审核对比、查缺补漏、数据处理、普查静态数据获取等工作流程，获取普查静态数据表XXX张，录入普查静态数据表XXXX张、静态指标XXXX个。按照全国水利普查空间数据采集与处理相关技术规定要求，空间数据采集是采用“内业为主、外业为辅”的方法，但为了提高空间数据的精度，最大限度地减小空间标绘的误差，采集小组对所有需要标绘对象的空间数据都进行了外业采集，并按要求规范填写《水利普查空间数据外业采集成果一览表》，对采集的坐标位置进行整理、汇总，采集数据完成GPS空间外业数据采集点XXX处，万亩灌区主干渠系四条完成普查静态数据采集100%、数据录入100%。

二、空间数据标绘情况

1、内业标绘情况对可以在电子工作底图上直接辨识的清查对象，参照《第一次全国水利普查空间数据采集与处理技术规定》，通过选取工作底图中的相应分类要素，完成该对象在电子工作底图上的位置、形态特征，若分类要素未表达该对象或表达的位置、形态与遥感影像存在较大差异，则结合已掌握的实际信息，以遥感影像为参考，做必要的调整。完成空间数据采集100%、标绘100%。

2、对象关系建立

XXX水利普查数据处理组，依据清查登记成果，结合基础资料等相关信息，利用配发的电子工作底图，借助水利普查空间数据采集处理软件，完成对象空间关系的建立。

三、涉密数据管理

XXX水利普查数据组为切实规范第一次全国水利普查涉密数据的使用管理，保障涉密数据使用安全防止国家秘密、商业秘密和个人隐私等泄露，根据《中华人民共和国保守国家秘密法》、《中华人民共和国保守国家秘密法实施办法》、《中华人民共和国统计法》和《水利部保密工作管理规定》等有关法规，结合我区水利普查工作实际制定《普查涉密数据日常安全管理细则》、《XXX普查涉密信息保密管理制度》并严格执行。对普查相关人员进出保密机房实行在册登记。

四、下一步工作打算

普查办数据组下一步打算，一是要严格按照普查时间节点要求，做好普查表数据审核、平衡处理、内业标绘工作。二是对今年工作经验教训进行系统总结，重点是完善各专项普查对象的空间关系建立。三是对空间数据，做到科学分析、认真标绘。

今后我们将在市普查办数据专项组的领导下，按照水利普查方案，严把时间节点，顺利完成XXX第一次全国水利普查工作空间数据处理工作。

普查数据篇6

关键词：地理国情；地表覆盖；数据质量

地理国情是指地表自然和人文地理要素的空间分布、特征及其相互关系，是基本国情的重要组成部分。地理国情普查是获取国情国力信息的重要手段，是掌握自然资源、生态环境以及人类活动基本情况的综合性、基础性工作。通过该项目的实施，可以全面查清我国自然和人文地理要素的现状和空间分布，为开展常态化地理国情监测奠定基础，为政府、企业提供决策依据，为公众提供地理信息服务。项目成果数据质量的好坏，决定着成果应用的成败。成果质量检查是一项非常重要的质量控制措施，通过成果质量检查发现错误进行修改完善，从而最终得到满足质量要求的成果。各级质量检查部门严把成果质量检查关对保证地理国情矢量数据的质量意义重大。

1地理国情普查矢量数据概述

1.1地表覆盖分类数据成果

按地表覆盖分类要求采集的反映地表自然与人文地理要素基本情况的空间数据成果。

1.2地理国情要素数据成果

以地理实体形式采集的道路、水域、构筑物以及地理单元四类地理要素数据成果。

1.3地理单元

按一定尺度和性质将地理要素组合在一起而形成的空间单位。普查的地理单元包括行政区划单元、社会经济区域单元、自然地理单元以及城镇综合功能单元。

1.4分类体系与数据分层

按照地表覆盖分类方式采集的内容包括其中的10个一级类，46个二级类和77个三级类；按照实体要素方式采集的地理国情要素内容包括其中的5个一级类，16个二级类和53个三级类。地表覆盖分类数据存储在LCA层中，地理国情要素数据根据要素类型存储在其他36个矢量图层中，矢量数据共37个图层，形成地理国情普查矢量数据库成果。

2成果质量元素

成果质量元素是成果满足规定要求和使用目的的基本特性，说明质量的定量、定性组成部分。地理国情矢量数据有空间参考系、时间精度、逻辑一致性、采集精度、分类精度、位置精度、属性精度、完整性、表征质量八个质量元素。

2.1空间参考系

空间参考系包括大地基准、高程基准、地图投影参数三个方面。

2.2时间精度

时间精度包括原始资料如影像数据、行业资料等数据源的现势性及成果数据的现势性。

2.3逻辑一致性

逻辑一致性包括概念一致性、格式一致性、拓扑一致性三个方面。概念一致性指的是数据集层的定义是否符合要求，层的属性项如名称、类型、长度、顺序数等定义符合要求。拓扑一致性指地表覆盖数据面缝隙、面重叠、面连续错误（面连续错误指属性一致、位置相邻图斑不连续），地理国情要素是否重合、重复、悬挂，伪节点、相交处是否打断等，以及国情要素与地表覆盖、国情要素内部要素之间的空间、属性逻辑关系等。

2.4采集精度

数据采集平面精度，即地表覆盖数据采集的地物界线和位置与影像上地物的边界和位置的对应程度。采集精度分为几何位移精度（即图斑边界与正射影像套合超限）、矢量接边（图斑几何位置接边超限）精度。

2.5分类精度

分类精度分为属性精度和完整性两项。其中属性精度也即分类正确性，指地表覆盖数据与正射影像、外调资料等比对检查图斑分类错误；完整性，指地表覆盖数据是否按要求分到子类，分类码是否为空，填写是否规范，接边错误、遗漏、多余图斑等图斑分类错误。

2.6位置精度

位置精度指国情要素与正射影像数据成果套合位置是否超限以及国情要素数据与地表覆盖数据套合合理性。

2.7属性精度

属性精度指国情要素分类正确性，即要素实体与正射影像、外调资料、基础地理信息数据、行业专题资料等比对检查分类正确性以及属性值填写正确性。

2.8完整性

完整性指国情要素是否存在多余或遗漏。

2.9表征质量

表征质量是图形几何表达方面的质量，指地表覆盖小的不合理面、面边界不合理，国情要素极短的不合理线、折刺、回头线、粘连、自相交等。

3质量检查方式与方法

地理国情矢量数据质量检查采用计算机自动检查和人工检查相结合的方法进行。计算机自动检查的内容主要有空间参考系、逻辑一致性、表征质量，人工检查的内容有采集精度、分类精度及其他需要人工核对的内容。数据质量检查分总体概查、采集精度与检查、分类精度检查、人工核对检查四个主要环节。

3.1总体概查

总体概查以辖区成果为单位运用质量检查软件对地表覆盖数据和国情要素数据进行自动检查，包括空间参考系、概念一致性、格式一致性、空间拓扑关系等。

3.2采集精度与位置精度检查

采集精度主要检查地表覆盖数据图斑边界与正射影像套合是否超限。影像上分界明显的地表覆盖分类界线和地理国情要素的边界以及定位点的采集精度应控制在5个像素以内。特殊情况，如高层建筑物遮挡、阴影等，采集精度原则上应控制在10个像素以内。如果采用影像的分辨率差于1米，原则上对应的采集精度应控制在实地5米以内，特殊情况应控制在实地10米以内。重点检查独立房屋建筑、道路、水面。对于国情要素的位置精度，应重点检查库塘、水渠、河流等水域的最高水位线采集是否合理，道路中心线、河流结构线采集是否正确，行政村、单位院落位置点采集合理性。

3.3分类精度检查

分类精度检查分为分类属性精度检查和分类完整性检查。分类属性精度，对于没有明显分界线的过渡地带内覆盖分类应至少保证上一级类型的准确性。分类精度的常见错误有要素漏采、要素混分、要素综合过大。容易漏采集的情况有大片水田中的坑塘、独立房屋建筑，房前屋后的旱地，林地中的草地，达到采集标准的农村道路，此外图幅接边处要素容易漏采集。由于概念理解差错、判别条件复杂或可识别程度影响等各种原因，地表覆盖中的一些类型容易混分。如旱地易与其他类型草地、园地、林地、温室大棚、水田、泥土地表混分，露天堆放场易与露天采掘场、堆放物、其他人工堆掘地混分，泥土地表易与碾压踩踏地表、硬化地表等混分。由于采集指標、归并尺度把握不当，容易造成某些地表覆盖类型综合过大。容易综合过大的要素类型有房屋建筑区。房屋建筑区内部实地连片大于1600平米或房屋建筑区毗邻的外围实地连片面积达到400平米的林地、草地，容易由于归并指标的掌握尺度不当，被归并到房屋建筑区中；由于影像可识别程度原因，房屋建筑区中容易将低矮房屋建筑区、多层以上房屋建筑区、高层独立房屋建筑综合到一起。此外，还要检查单位成果（图幅）、辖区对采集指标的把握是否一致，如影像纹理表现一致，分类属性不一致，且又没有进行外业核查的图斑。

3.4人工核对检查

地表覆盖、国情要素质量检查除了计算机自动检查外，还需人机交互进行属性精度、完整性核对检查。首先应对软件检查出来的错误进行人工排查，如国情要素的道路没有落到地表覆盖对应道路面内，图层LCA中的要素超出与其相交的最高水界范围，微小面是否位于图幅接边处，以及由于图幅裁切引起的错误。

地表覆盖和地理国情要素两套数据，同一个要素表达是否一致，如堤坝、尾矿堆放物、道路、达到采集指标的水渠与河流、库塘等是否在两套数据中同时采集，道路、水系在两套数据中分类、属性是否一致等。国情要素中县级及县级以上等级公路、桥梁、隧道，五级及五级以上的河流及相通的湖泊、水库与基础地理信息数据中的要素比对检查，查看其走向、分布是否一致，属性内容填写是否正确。

4 结束语

地理国情普查工作是一项技术要求高、质量要求高、综合性的系统工程。各项目任务承担单位应严格按照技术规定进行生产，认真落实过程检查和单位质检机构的最终检查工作。质检人员要严格执行普查标准和规定，严把质量关，确保普查成果质量。

参考文献

[1]国家测绘地理信息局.地理国情普查内容与指标[G].北京：国家测绘地理信息局，2013.

[2]国家测绘地理信息局.地理国情普查数据规定与采集要求[G].北京：国家测绘地理信息局，2013.

城市部件普查数据采集与建库初探篇7

城市部件普查是“数字城市”建设的重要基础组成部分。为保障普查工作的顺利进行, 提高工作效率及普查数据的质量, 对普查对象、普查的方式改进及对象指标进行编码是通行和有效的做法, 编码工作在普查工作中占有极其重要的位置, 编码的适应性将直接影响到普查的顺利进行, 乃至成败。城市部件普查编码的目的是以数字和字母代表城市部件普查对象和指标, 准确地识别和管理城市部件普查对象与指标, 通过编码简化对象之间关系的描述, 方便基层普查工作的开展及人工和计算机处理, 提高数据处理工作效率, 保障审核与汇总分析的顺利开展和最终普查数据的质量。

一、城市部件普查工作任务

城市基础设施数据普查与建库是数字化城市管理新模式的重要基础。城市部件普查的工作任务是:通过对城市部件普查、基础地理编码普查、万米单元网格划分及城市实景影像数据采集与建库等工作, 为市数字化城管管理提供精确度高、可用性强、实景可视化的基础数据平台。

1、工作底图准备

测绘单位在1:500电子地图数据上先进行整理, 并对无底图区域购买卫片进行矢量化处理, 按1km×1km分幅套合打印作为工作底图。

2、外业调查

根据普查技术规范对城管部件和地理编码进行拉网式普查。

(1) 部件调查:测绘人员根据工作底图结合现场调查。

(2) 地理编码调查:根据工作底图, 参照已有的地址信息, 由测绘单位野外逐项调查核实每个调查对象正确的地址描述信息。

3、数据处理与建库

(1) 部件数据建库:测绘单位将调查后的部件信息逐一核实后输入到部件软件数据库中。

(2) 地理编码数据建库:测绘单位将调查后的数据逐一核实后输入到数据库。

(3) 实景影像库建库

采用移动道路测量系统完成本标书规定范围内的城市实景影像数据的采集, 并建立影像库。可量测实景影像分辨率不低于1.92M, 清晰识别沿街部件, 并能完成对目标的几何尺寸进行测量。实现对海量影像数据的浏览、查询、 (部件) 标注、测量, 并将影像上的部件与部件数据库相关内容链接。

4、复核与验收

组织对测绘单位提交的各类成果资料进行抽查复核和综合验收。

5、最终成果数据要求

(1) 最终成果数据文件格式应为常用的空间数据格式;

(2) 调查形成的数据资料及成果 (包括:各类原始数据、统计数据、普查手册、图片图纸图册、数码及胶片照片、音像资料、数据库、城市影像库、总结报告等) ;

(3) 提交数据后, 再配合集成方进行数据集成和应用集成。

二、普查工作方案

1、总体考虑

城市部件基础数据普查与建库项目的工作内容包括:标准规范编制、单元网格与监督网格划分、部件与地理编码普查、数据处理与建库、实景影像数据采集、处理与建库、部件图集与手册编制、网格图集编制、地图格式的转制以及卫片的提供和矢量化处理等。

(1) 单元网格、监督网格划分

根据国家住建部和有关标准规范, 划分数字城管单元网格和监督网格。

(2) 部件与地理编码普查

地理编码普查对象要具有代表性、唯一性等特点, 通过普查获取对象的地址数据, 并以此建立城市管理地理编码数据库。

2、普查范围的界定

确定每个城市普查的地域范围多少平方公里, 界定好普查的工作范围。

3、普查的对象和内容

部件普查的对象为与城市管理相关的部件与设施, 具体为根据住建部相关标准规范设定的6大类 (分别为公用设施类、道路交通类、市容环境类、园林绿化类、房屋土地类和其它扩展类) 85小类。

4、数据处理与建库

对部件普查数据和地理编码普查数据进行处理, 并建立部件数据库、地理编码数据库、可量测实景影像库、360度连续全景影像库。

(1) 部件数据建库

将调查后的部件信息逐一核实后输入到部件数据库中。以常用的空间数据格式和属性格式对普查的图形数据和属性数据进行录入, 形成完整的部件库。

(2) 地理编码数据建库

将调查后的数据逐一核实后输入到地址数据库。

对普查的地理编码数据全部录入, 并采用与基础地图一致的空间参考。

(3) 数据处理

图形数据的处理

按照普查所得的城管部件内容以及对应得标识码进行图形数据录入, 并按照规定的符号进行符号配置, 完成图形数据的处理。

属性数据的处理

根据普查所得的部件的属性记录, 对照部件图形数据进行属性数据挂接。图形数据与属性数据一一对应, 属性内容全面。

实景影像数据处理

通过实景影像处理软件对实景影像数据、航卫片数据、二维地图数据、部件属性数据进行处理, 以及从外业普查、移动测量系统采集到内业数据处理成套的工艺流程和质量控制规程, 完成对实景影像数据的测量、整理、入库及数据集成。

结语

城市部件普查基本工作单元是万米单元网格, 在城市普查中根据网格的划分将网格内的城市部件分类做图层, 给各自的部件对象进行编码, 在引入高效率普查车辆进行全景式数据采集后, 大大提高城市部件普查效率以及普查准确率。本文是作者参与城市部件普查数据处理有关工作过程中产生的, 得到许多同事正反两方面意见的初步验证, 在此对他们给予的贡献表示由衷的感谢和敬意。

参考文献

普查数据篇8

1.1 资料收集

收集基础资料1∶10000DLG、1∶50000DLG、worldview影像数据、城镇地籍数据、土地利用现状数据等, 并根据项目需要对以上数据进行处理和整合。

1.2 多源遥感影像处理

将Worldview全色影像进行正射纠正处理, 进行匀光、分幅, 制作遥感正射影像和地理国情信息普查的解译底图数据。

1.3 基础地理信息数据处理

对收集到的1∶10000和1∶50000基础地理信息数据进行处理, 将与普查内容相关的数据通过数据提取、数据组织重构、分类代码转化、坐标系转换等工作整合改造成为符合《地理国情普查内容与指标 (试行稿) 》内容要求的数据, 作为普查道路、水体、构筑物、地理单元及界线数据的基础数据。

1.4 内业分类与信息提取

以正射影像为基础, 利用收集整合的参考数据, 采用人工解译, 参考基础地理信息、土地利用等资料, 以正射影像为基础底图, 开展内业判读与解译, 补充或更新采集水系、交通、居住小区等要素实体, 提取相关属性, 并进行地表覆盖分类, 分别按照要求形成相应的数据层。

内业分类数据在提交外业调绘前, 经过生产单位检查, 形成内业解译成果数据, 数据的基本数据结构、分层、完整性要达到成果数据要求。组织方式可以分幅组织, 并估算出地表覆盖数据判读的准确率以及地理国情基本要素数据属性必填项的填写率。

1.5 外业调查底图制作

在内业信息分类与解译提取的基础上, 基于正射影像, 叠加专题数据、判读解译成果等信息, 对矢量数据进行符号化, 并有选择性的对部分名称、属性进行标注, 制作外业调查底图, 为外业调查与核查提供工作底图。

1.6 外业调查与核查

利用外业调查工作底图, 对内业分类与判译工作中无法确定边界和属性的地理要素实体, 以及无法准确确定类型的图斑, 采用图上标绘形式开展实地核实确认和补调。同时, 实地采集影像解译分类样本。

1.7 内业整理

对外业调查与核查成果进行整理, 根据外业调查成果对各数据层进行编辑、修改, 形成地理国情普查数据集。

1.8 质量检查

质量检查实行两级检查一级验收制度, 对普查成果进行检查, 经修改形成最终成果数据。

1.9 元数据制作

影像数据的元数据依据《地理国情普查数字正射影像生产技术规定》的要求;地表覆盖分类数据和地理国情要素数据的元数据依据地理普查数据元数据信息表执行。

2 地表覆盖分类数据生产

基于0.5 m高分辨率遥感影像提取地表覆盖信息的方法包括计算机自动分类、人工解译、外业调查等, 各种方法的技术流程不尽相同, 适宜条件也不尽相同。项目伊始, 中心收集了大武口区城镇地籍数据, 结合原有第二次土地调查数据、1∶10000地形图数据, 部分区域0.5 m航片数据。鉴于国家下发的试点区域数据为0.5 m全色影像, 光谱信息单一, 进行人工解译的条件优于计算机自动分类和外业调查。

2.1 信息提取原则

信息提取过程中, 跟据实施方案和采集指标, 借鉴全国第一批试点经验, 制定以下四个信息采集原则。

2.1.1“所见即所得”原则

由于地表覆盖分类的基本依据是地表覆盖物的物理特性, 而非土地利用分类中侧重于土地的社会属性, 因此从分类判读的原则方法角度来说, 可以称为“所见即所得”。但是这一原则并不是绝对化的。由于地表覆盖和土地利用之间的耦合关系, 有时候很难严格区分某类型是属于土地利用还是土地覆盖类型。例如耕地, 严格从地表覆盖的角度来讲, 应该从生长的农作物来进行地表覆盖定义, 按照这一原则反应地表覆盖的客观状态, 一年中需要多期影像才能确定, 由于目前技术和经济可行性的原因, 这是不可行的。

2.1.2“应采尽采”原则

地表覆盖分类依据类型特定进行了基本要求。该要求只适用于勾绘或编辑地类边界过程中对一些难以确定类型的小图版进行“就近就大合并”时参照采用。根据采集指标, 不同地类的采集指标不尽相同, 有200 m2、400 m2、1600 m2等, 但是为了确保数据的使用价值, 我们按照“应采尽采”原则, 如果能够确保分类整正确, 不必参照就近就大合并, 即不受指标下限限制。比如最小图斑指标是1600 m2, 分出了400 m2的图版, 只要分类正确, 也应进行采集。

2.1.3“自然优先”原则

植被覆盖、裸露地表等类型中通过实地核查难以区分人工和自然的类型, 一般利用“自然优先”的原则进行归类。如人共繁育的树林或草场, 在实地业难以判断是园地还是人工草地, 优先归入林地或天然草地。又如野外长期堆积的砂子, 长年累月风吹雨淋, 已经成为自然地一部分, 从外观上已经难以判断其成因的, 归入裸露地表中的沙质地表, 而不是堆放物。采用自然优先原则的前提是难以判断其具体成因的地类, 即分不出是人工的还是天然的时候, 优先归入天然。从人与环境的关系角度来说, 人类的任何活动结果都将是自然的一部分, 因此在无法判定的情况下, 优先归入自然类别, 更符合自然规律。

2.1.4“高度优先”原则

对于不同高低植被立体覆盖的范围, 如乔木林下有灌木, 果树下面有蔬菜等情况, 以顶层树冠的优势类型确定其覆盖类型;对于树冠遮挡道路、树冠遮挡沟渠的情况, 地表覆盖中应归入植被类;对于高架路, 不考虑路下的情况, 按照上层道路归入路面;对于桥面跨越大面积水面, 归入水面类型;跨域峡谷, 按照地面的实际覆盖归类。

2.2 信息提取方法

根据信息提取原则和采集指标的要求, 严格按照地表分类定义, 使用纠正好的全色高分影像, 采用人工判读勾绘的方式进行地表覆盖数据提取和采集, 其中图形和属性都参考了宁夏第二次土地调查数据、大武口区城镇地籍数据、1∶10000地形图数据, 部分区域0.5 m航片数据等来补充。

2.3 小结

在实际生产过程中, 我们遵循信息提取原则, 尤其是严格遵循“应采尽采”原则, 确保能对绝大多数的地表覆盖进行合理分类。但是也存在一些问题, 有以下几处:

(1) 影像数据为全色且时相不佳, 造成自动分类及人工判读困难:

宁夏地处西北地区, 影像最佳时相一般在5~10月份, 而此次试点区域数据仅有极小一部分且为山地在此时间段内, 给地表覆盖分类造成了很大的困难, 大大的增加了外业核查工作量。

(2) 地表覆盖数据与第二次土地调查数据的分类体系存在很大的差异, 且第二次土地调查数据与作为解译、采集使用的影像数据存在时相差异、要素界线差异等。

3 地理国情要素数据生产

地理国情要素的生产采用综合提取法, 用内业人工解译和外业核实、补充调查相结合的方法进行信息提取。

3.1 道路要素信息提取

道路要素提取基于1∶10000基础地理信息数据, 利用高分辨率影像资料, 遵循“应采尽采”的原则, 对达到规定尺度要求的交通道路, 按照地理要素的要求采集其空间位置和属性信心, 形成完整的交通道路信息数据。

首先整合提取基础地理信息数据和交通路网数据, 生成道路普查基础数据和参考数据, 然后将其套合在遥感影像上, 依据影像进行调整更新, 提取相关属性, 缺少部分进行人工解译勾绘, 最后按技术要求形成道路要素数据集;将能确认的、有疑问待核查的、无法辨认的道路进行标绘, 方便制作国情要素调绘底图, 通过外业核查后, 对数据进行整理修改, 形成最终的道路普查成果数据。

地理国情要素采集道路中心线时, 与高等级公路相连的城市道路无论长短、宽窄均应采集;在路网中起连通作用的乡村道路无论长短、宽窄均应采集。

3.2 水系要素信息提取

水系要素信息提取的主要方法是:以正射影像为基础, 利用整理处理后的基础地理信息数据, 参考其他数据资料, 进行内业判读解译, 直接沿用或补充采集水系面状、线状要素, 并提取相关属性;对于内业判读中无法确定的范围线、结构线、中心线以及属性信息, 通过外业调查与核查进行确定;经过内业整理与质量检查, 形成满足要求的水系要素信息成果。

地理国情普查中, 河渠、湖泊和水库的实体编码属性依据《国家基础地理信息系统1:50000数据建库工程暂行规定河流、湖泊与水库名称编码原则》 (后简称《编码规则》) 的相关规定, 并扩充等外河流的代码。对于1∶50000、1∶10000地形数据库中存在编码的河流、湖泊、水库、干河床等, 地理国情普查数据库中的相应代码与其结构及内容保持一致;对新增的、有名称的河流、湖泊、水库、干河床等按《编码规则》进行编码, 并备案说明。

3.3 构筑物要素提取

针对地理国情普查中的构筑物要素特点, 采用了人工解译判别为主的方法进行提取, 部分构筑物参考已有的基础测绘成果和地表覆盖结果进行要素提取。

3.4 地理单元要素信息采集

地理单元要素提取, 主要以遥感影像为基础, 利用收集整合的专题数据、统计资料、土地利用数据和基础地理信息数据, 采用人工判读与勾绘的方法, 进行内业判读与解译, 提取相关属性并按照要求形成相应的数据层。通过外业调绘, 对内业分类和判译工作中无法确定的边界和属性的地理单元进行标绘, 并对缺失地理单元要素实体进行补调, 在内业将调绘数据整理, 最终形成成果数据。

3.5 小结

地理国情要素信息提取主要采取综合提取法, 整合基础地理信息数据和专题数据, 生成普查基础数据和参考数据, 然后将其套合在遥感影像上, 提取所需要的国情要素信息数据, 再进行人工解译, 提取缺少的要素信息, 通过外业调绘核查和补充, 最终形成普查成果数据。在此过程中, 专题数据的丰富程度直接决定国情要素信息提取工作量的大小。此次试点区域还存在一些问题:

(1) 专题数据不够丰富。国情要素数据涉及交通、水利、旅游、教育、医疗、国土等多方面的专题数据, 很多信息从遥感影像上无法获取, 只能通过外业调绘核查去获取。

(2) 矿区道路及尾矿堆放物很难正确采集。由于高分遥感影像数据为2011年数据, 而矿区部分道路和尾矿堆放物处于变化之中, 在影像上采集的要素信息, 到实地核查时已经发生变化, 只能参考影像进行勾绘, 精度难以达到1∶10000要求。

4 结语

本项目以大武口区为试点区域, 通过对试点区域的控制资料收集、遥感影像处理及DOM制作、影像解译、地理国情信息采集、外业核查、地理国情信息统计分析等工作, 全面掌握大武口区的各类地理国情信息, 并揭示当地经济社会发展和自然资源环境的空间分布及内在关系。同时, 为下一阶段全区地理国情普查工作的全面开展摸索出一条科学、可行的方法和路线。

参考文献

[1]国务院关于开展第一次全国地理国情普查的通知[EB/OL].中央政府门户网站, 2013-03-05.

普查数据篇9

2008年物流主体行业企业法人个数为148289家,与2004年相比增长了110%,其中道路运输企业增长了11 9%,水上运输企业增长了58%,装卸搬运企业增长了1 28%,仓储企业增长了71.9%。

从业人员1020.2万人,增长了35.2%,其中道路运输企业增长64%,装卸搬运企业增长68%,仓储企业增长28%。

资产总额74303.4亿元,增长105%,其中道路运输业增长165%,水上运输业增长121.7%,装卸搬运业增长223%,仓储业增长121%。

营业收入31168亿元,增长172%,其中道路运输业增长了268%,水上运输业增长了144%,装卸搬运业增长275%,仓储业增长237%。

营业利润3270.2亿元,增长220%,其中道路运输业增长了517%,水上运输业增长了143%,装卸搬运业增长298%,仓储业增长918%,

二、企业平均规模

与2004年相比,所有物流行业的单个企业人数都在减少,说明用人单位人数并没有随着资产的增长而同比增加。平均资产,道路运输业增长20.3%,水上运输业平均增长40%,仓储业平均增长29%;平均营业收入与2004年相比,道路运输业增长68%,水上运输业增长54%,装卸搬运业增长64.5%,仓储业增长97%;平均营业利润,道路运输业增长184%,水上运输业增长53.6%,装卸搬运业增长73.6%,仓储业增长495%,只有铁路行业平均利润下降94%。

从表三中我们可以看出,虽然仓储业的平均资产增长比例在所有物流主体行业中处于较低的水平,只有29.09%,仅高于铁路运输业,但是仓储业的平均营业收入增长比为96.9%,平均营业利润的增长比为494.83%,两者在所有物流主体行业中都处于第一的位置,这说明我国仓储业正处在快速增长期,与2004年相比仓储业在创利能力方面有了显著的提高。

三、行业效益比较

从表四中看出,仓储业的效益较2004年有大幅度提高,总资产利润率增长了356.52%,营业收入利润率增长207.69%,人均创利增长了696.61%,均远远高于其他物流主体行业。水上运输业则保持较高的收益水平,道路运输业虽然在2008年收入利润率为20.9%,但人均利润却仍低于水上运输业。

四、各省市仓储业情况分析

全国30个省市区发布的仓储业调查结果

1、盈利最高的省份是山东,盈利70.8亿元,其次是江苏为27.27亿元,辽宁为21.5亿元,福建为20.46亿元,河南为16.9亿元。有5个省区行业亏损,分别为青海、广西、西藏、宁夏、贵州,亏损额最大的是贵州省,亏损8.9亿元。

2、仓储企业数最多的是山东,为2883家,其次是上海1612家,广东1 1 63家,江苏1200家,河南1025家。长三角地区仓储企业数3367家,环渤海地区为2301家,珠三角地区1163家;上述三个地区6831家,占全国仓储企业数的40%,这一比例比2004年降低了10个百分点。

3、营业收入最高的省份是山东,为494亿元,其次是河南332亿元(本人对以上数字表示怀疑,因为这两省业务收入均高于有6亿吨港口货物吞吐量的上海),上海为228.5亿元,江苏为242.3亿元,广东为213亿元。

4、仓储业总资产最多的是内蒙古,为640亿元;其次是广东,为478亿元,北京442亿元,上海441亿元,江苏352亿元。

5、仓储业资产利润率最高的是山东,为66.95%,其次是重庆,为20.43%,海南16.07%,吉林14.22%,河南12.25%。

6、仓储业营业收入利润率最高的是重庆,为25.65%,其次是陕西为22.03%,湖南20.2%。吉林14.69%,辽宁14.65,山东14.25%。

7、万元资产收入最高的是山东,为46942.07元,其次是河北,为38629.41元,河南24105.07元,海南14821.43元,吉林9675.68元,重庆7967.68元,江苏6887.44元,西藏6806.72元。

8、平均每企业资产最高的省份是广西,为27927.17万元,以下分别是内蒙18497.11万元,北京6616.77万元,黑龙江4447.14万元,宁夏4285万元。

9、平均每单位用人最多的省份是黑龙江,为54.8人,以下分别是重庆50.63人,江西46.48人,湖南38.37人,贵州37.16人,河南36人。

注:铁路运输业、道路运输业、水上运输业、航空运输业均含客运,客货比例没有提供。

五、仓储业普查数据中的异常情况

我们没有足够的资料来说明部分数据异常的原因,但我们认为应把这些异常列举出来。

一是仓储业利润增长过快,四年间增长9倍多,这在正常的经济发展中是不可想象的。仓储业的主要收入来源于保管收入、装卸搬运收入、加工收入等,但这些收入都需要来自投资:土地投资、库房投资、设备投资等。在过去的四年中,仓储投资只增长了121%,从业人数增长28%,这一切都表明,仓储业的利润增长数不完全依赖于投资的增长。

二是仓储业每万元资产的业务收入为5305元,道路运输业为3752元,水上运输业为4761元,装卸搬运业为9140元。但是,河南仓储业每万元资产收入为24105元,山东为46853元,河北为38629.4,海南为14821元。如此高额的收入是与其资产量不匹配的。

三是仓储业的资产利润率为4.2%,而山东仓储业的资产利润率高达66.8%,不知道山东仓储企业都在做何种业务,才有如此高的利润率。

四是吉林省2004年资产总计为101.67亿元,2008年为37亿元,下降了63.6%,营业收入2004年为40亿,2008年为35.8亿,减少了10.5%,而利润却由2004年的亏损2.8亿上升至2008年的5.26亿。企业个数从228个增到555家,每单位的平均资产为666.67万元。资产减少、收入减少、利润激增,令人费解。

如果剔除异常省份数据,则全国仓储业平均资产利润率为2.37%,平均收入利润率为5.9%,分别比2004年增长158%和127%,这样的数据还靠谱。

人口普查中的数据库设计与建设篇10

随着计算机技术的发展,计算机的主要应用已从传统的科学计算转变为事务数据处理。在事务处理过程中,并不需要复杂的科学计算,而是需要进行大量数据的存储、查找、统计等工作,如教学管理、人事管理、财务管理等。这需要对大量数据进行管理,数据库技术就是目前最先进的数据管理技术。

二、数据库简介

所谓数据库,就是一个长期存储在计算机内的、有组织的、可共享的、统一管理的数据集合。它是一个按一定的数据结构来存储和管理数据的计算机软件系统。不同的用户可以按各自的需求使用数据库中的数据,多个用户可以同时共享数据库中的数据。数据库系统立足于数据本身的管理,将所有数据保存在数据库中,进行科学的组织,并借助于数据库管理系统,以它为中介,与各种应用程序或应用系统接口,使之能方便地使用数据库中的数据。简单地说数据库就是一组经过计算机整理后的数据,存储在一个或多个文件中,而管理这个数据库的软件就称之为数据库管理系统。数据库系统一般是由数据库、数据库管理系统、数据库应用系统及计算机软硬件、系统人员和用户等组成。

三、数据库设计在人口普查中的应用

在全国第六次人口普查中,数据库建设就发挥了很大的作用,它将我们调查到的各种数据全部集中在数据库管理系统中,使我们以后能更方便、快捷地进行查询、管理等工作。

建立一个数据库管理系统,首先,我们都需要一个数据库平台,现在我们常用的数据库平台大概有几种:Access、SQL server、oracle等。而对于第六次人口普查这种大型的项目,里面含有很多图形数据、图像数据、属性数据等资料的数据库,我们一般选择SQL server和oracle这种功能较强的关系数据库作为我们建立数据库的平台。这样就需要我们能够了解数据库建设的相关原理和设计过程。

数据库的设计就是指根据用户的需求,在某一具体的数据库管理系统上,设计数据库的结构和建立数据库的过程。一般来说,数据库的设计过程大致分为需求分析、概念设计、逻辑设计、物理设计、概念设计、数据库运行和维护6个步骤。

具体对于第六次人口普查项目来说,需求分析就是指调查和分析全区各乡镇、街道办事处的户口整顿与摸底入户工作,按照国家的分类要求和调查规范,建立一套完整的人口管理数据库。

概念设计是指对用户要求描述的现实世界,通过对其中住处的分类、聚集和概括,建立抽象的概念数据模型。在此次人口普查中就是指各个分类之间的相互关系,权属关系,具体来说,就是“县一乡一村”,由相同权属性质(座落权属代码)的图斑组成村,由村组成乡,由乡生成县。将属性信息和图形信息相互照应起来,就是数据库中常说的“E—R模型”。

逻辑设计是指将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。在人口普查中就是指将所在地区人口现状中的各年龄段、性别、职业转换成数据库管理系统能够识别的模式。并能让我们直观地查询出来。

物理设计是指数据库的存储结构和存储方法,数据库管理系统会根据具体的应用任务选定最合适的物理存储结构(包括文件类型、索引结构和数据的存放次序与位逻辑等)、存取方法和存取路径等。这一步设计的结果就是所谓“物理数据库”。在人口普查建库中,指定的管理系统会将我们的基础资料保存在适合的位置。

验证设计是指在上述设计的基础上,收集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。在人口普查中,验证设计就是在将数据库中的所必须的数据,图形,属性全部附上,建立一个完整的数据库,并实现各种查询功能,统计功能等。

数据库运行和维护是指数据库系统正式运行,标志着数据库设计与应用开发工作的结束和维护阶段的开始。运行维护阶段的主要任务有四项:(1)维护数据库的安全性与完整性:检查系统安全性是否受到侵犯,及时调整授权和密码,实施系统转储与备份,发生故障后及时恢复。(2)监测并改善数据库运行性能:对数据库的存储空间状况及响应时间进行分析评价,结合用户反应确定改进措施。(3)根据用户要求对数据库现有功能进行扩充。(4)及时改正运行中发现的系统错误。而对于人口普查的项目,就是指数据库的维护阶段,把数据库中各种数据,按照国家要求所需要的属性全部附在数据上。并且根据管理部门的要求,可以对数据库进行修改;另外实现数据库的备份,还原等功能。

这样,一个完整的数据库就建好了。其实在建设数据库的过程中,重要的内容在于前期数据的整理。对于人口普查来说,无论采用SQLserver或者oracle平台,数据库管理系统无论采用苍穹或者mapgis等,数据库的一个基本模式已经建立完整。我们只需要把我们的外部资料转化为数据库能够识别的数据就可以了。

在人口普查中,数据库的建设给调查部门人员带来了很大的便利,他能够让管理部门在堆积如山的土地档案资料中脱颖而出,方便快捷的实现查询、修改等管理功能,大大提高了我们工作效率,更保证了资料的准确性和现势性。

在社会高速发展的今天,充分利用好数据库,会给我们的工作,生活带来极大的便利。数据库也越来越发挥出他更大的作用。H

参考文献

[1]施伯乐,丁宝康,汪卫编著.数据库系统教程[M].2版.北京:高等教育出版社,2003.

[2]王能斌.数据库系统原理[M].北京:电子工业出版社,2002.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【普查数据】相关文章：