数据核对

2024-06-30

数据核对(精选五篇)

数据核对 篇1

烟草行业实施应用“决策管理系统”是烟草行业发展以及信息化建设发展的战略决策。该系统以“两打三扫”为手段,对卷烟工业生产、销售到商业购进等各个环节,进行实物实时流向的监控。该系统能及时、动态采集行业卷烟生产经营的主要数据,强化卷烟计划管理和专卖管理的力度,规范卷烟生产经营行为,提高了行业调控和管理决策的能力。纵观该系统在行业内运行多年的情况,该系统是一个相对独立的系统,与企业内部各业务系统之间没有直接联系。

目前,企业内部产、销、存等生产经营数据,以烟草行业“决策管理系统”采集的物流数据为准,并作为企业法定数据进行上报。但是,企业内部各系统都有各自的数据获取途径、数据统计口径和数据加工机制,因此导致了决策管理系统与企业内部各业务系统之间,存在数据不一致问题。

为实现数据一致性有效管理,提出基于决策管理系统、企业内部业务系统,构建生产经营数据核对平台,达到及时发现并解决数据差异问题的目的。

1 业务流程分析

1.1 核对对象界定

在行业“决策管理系统”中,数据采集涉及到企业内部的产、销、存数据。工业企业以打码量作为统计的卷烟产量 ;以工业出库扫码量作为统计的工业销量 ;以打扫码数量作为库存量核算依据。

在企业内部业务系统中,也同样存在产、销、存数据。如物流仓储系统的入库量对应于卷烟产量 ;ERP系统中销售合同量对应于卷烟销售量。

综上分析,需要核对对象应为卷烟生产量和销售量。

1.2 产量核对设计

通过集成打码软件的打码数据、报废软件的报废数据、件烟检测软件的检测数据、仓储系统的入库数据等,核对时以件烟条码关联各环节采集数据,按照车间打码的不同粒度(生产点、车间、班次)实时进行卷烟产量核对,针对核对结果(卷烟产量差异)给出处理建议,对于有些差异类型提供自动解决手段。同时根据核对结果以及件烟条码在各环节生命周期信息的采集,提供各种数据应用服务。

1.3 销量核对设计

通过集成工业出厂扫描软件的出库数据、ERP业务系统的销量数据(例如合同执行)等,核对时以合同或单据 ( 业务凭证号 ) 关联各环节数据,按照不同粒度(生产点、仓库)实时进行卷烟销量核对,针对核对结果(卷烟销量差异)给出处理建议,对于有些差异类型提供自动解决手段。同时根据核对结果以及卷烟销量执行等情况,提供各种数据应用服务。

2 系统设计

2.1 总体架构设计

如图1

系统分为三层结构 :采集层、核对层、应用层。

总体业务流程如下 :

1) 经过件烟检测系统剔除无码、重码、无法识别和已打印未打码等入库信息提供给核对平台 ;

2) 核对平台从决策管理系统中读取接口信息(包含打码、报废、出厂扫描信息);

3) 核对平台从ERP系统实时读取当日销售凭据信息 ;

4) 核对平台通过对入库信息、打码信息、报废信息汇总核对,给出件烟产量与入库检测系统可能存在的差异性并帮助找出原因给出合理性建议

5) 核对平台通过对出厂扫描数据、销售凭据信息的汇总核对,给出件烟销量与ERP系统可能存在的差异性并帮助找出原因给出合理性建议。

2.2 系统功能设计

如图2

2.3 接口设计

数据核对平台与多个系统存在数据交换,与各系统之间需要建立数据接口 :

(1)与决策管理系统管理机数据接口 :从决策系统中获取支持系统运行的相关基础数据以及基础代码,

(2)与打码软件间数据接口 :打码软件定期向核对平台发送打码执行情况,回送数据同“决策管理系统”,以便核对平台进行数据核对。

(3)与检测软件间数据接口 :检测软件需要从核对平台中获取支持系统运行的相关基础数据以及基础代码。

(4)与报废软件间数据接口 :报废软件在向管理机发送报废单据数据时,同时向核对平台传送报废单据数据信息,以便核对平台进行数据核对,正确核对出疑似报废的条码信息。

(5)与销售出厂扫描接口 :销售出厂扫描软件在向管理机发送出库扫描单据数据时,同时向核对平台传送出库单据数据信息,以便核对平台进行数据核对,正确出库的合同金额等信息。

(6)与仓储系统间数据接口 :仓储系统定期向核对平台发送入库扫描信息,将仓储入库信息发给核对平台,以便核对平台进行数据核对,正确核对条码状态。

(7)与ERP系统接口 :ERP系统将出库执行合同发送给数据中心,数据中心发给ERP执行出库的同时向核对平台传送报执行数据信息,以便核对平台进行数据核对,正确核对出库金额等信息。

3 结束语

数据核对平台建设涉及到多个信息系统的集成,需要从多个信息化系统获取数据,数据接口较多,实施存在一定的难度,需要各系统开发商技术支持。核对平台建设后,将能确保烟草行业“决策管理系统”数据报送的正确性。该核对平台是烟草行业“决策管理系统”在工业企业实施应用中的进一步完善和补充。

摘要:针对我厂实施应用的烟草行业“决策管理系统”与企业内部业务系统数据存在不一致问题,提出构建我厂生产经营数据核对平台。通过该平台核对生产经营数据,及时发现差异,并给出解决问题的建议,以保证决策管理系统与内部业务系统数据的完全一致性。本文着重从系统建设的业务流程分析、系统架构设计、功能设计等方面介绍。

数据核对 篇2

刘庙小学经过对2013年教育事业统计数据与学籍库数据核对,发现一至五年级2013年教育事业统计学生数为110人,学籍人数为103人,相差7人。

原因是一年级开学时有7人的实际年龄不足6周岁的入学年龄,按上级要求不能办理学籍。与学生家长协商,准备在一年级留级,因此未办理学籍。特此说明。

单位负责人:_______________(签字)单位:西华县皮营乡刘庙小学(公章)

数据核对 篇3

关键词:重复核对,可信度法

0 引言

在对检测程序检测到的病态数据修正过程中,十年的“核对”实践表明,核对工作不仅工作量巨大,而且由于现有的“穷举式核对方法”不经济、效率低,导致核对工作中存在大量的无效工作,尤其是冗余核对。我们把检测程序在运行中检测到的超出现有值域的数据单元称为无匹配项。对于无匹配项,只有通过核对才能确定其正确与否。而要减少无匹配项的冗余核对工作将是亟待解决的问题。鉴于此,本文就提出了基于不确定性推理的可信度法,用该方法对无匹配项的可信度进行计算,然后通过可信度由低到高进行排序,依次核对。

1 方法的提出

通过IPSDS检测得到的无匹配项数据单元,有以下两种来源途径:

(1)一个单位多次上报;

(2)多个单位同时上报。

在实际工作中,只在一个单位中出现的数据几乎不存在,即使存在,错误的可能性非常大,因此对于此类数据,排在第二种情况之前核对。本文重点对第二种情况进行排序,提出用不确定性推理的可信度法(简称可信度法)计算出数据的可信度值,依据可信度值进行排序。

所谓推理,是指从已知事实出发,通过运用相关知识逐步推出结论或者证明某个假设是否成立的思维过程。已知事实(也称证据)与知识是构成推理的两个基本要素。当已知事实不确定时所做的推理,即不确定推理。

而本文针对的无匹配项是不能直接确定其错误属性的,因此具有不确定性,从而符合不确定推理的条件。不确定推理的方法有多种,如可信度法、主观Bays法等。本文应用可信度法,通过公式计算确定无匹配项数据的可信度。

可信度法是肖特里菲(E.H.Shortliffe)等人在确定性理论(Theory of Comfirmation)的基础上,结合概率论等提出的一种不确定推理方法,并首先在专家系统MYCIN中得到了成功应用,并且该方法被很多系统所采用。

2 可信度的概念

可信性,是产品和工程项目质量管理的重要术语之一,它是使人们容易联想到产品质量的一种重要的性能特性。在IEC50(191)和GB/T 6583-ISO 8402中,其定义如下:“可信性(dependability),描述可用性及其影响因素:可靠性、维修性、维修保障等性能的一个集合术语。”

很显然,产品和工程项目中的“可信性”定义并不适合本文中将要描述的有关数据的可信性。因此,本文借鉴了一些在信息领域具有代表性的有关“可信性”和“可信度”的定义。

Peter P.Chen在《Information Credibility Assessment and Metadata Modeling in Integrating Heterogeneous Data Sources》中定义“可信性(believability)”为“人们对数据源和数据渠道的信任程度”。

李晓静博士在《中国大众媒介可信度指标研究》中将“媒介可信度”界定为:“中国的媒介机构/新闻从业者(来源)以及媒介新闻报道(信息)被当代中国受众所信赖的程度”。

周昌乐等人在《一种基于可信度的不确定性推理及其神经网络实现》中指出“可信度是指人们对某一事物(或事情)的某方面性质在主观上确信的程度”。

无论是“可信性”还是“可信度”,我们都认为所谓“可信”,即可以信任的意思。理论界对于信任概念的研究颇为热烈,不同的角度有不同的界定。其中具有代表性的观点有:一个是Gambetta对信任的定义:信任是主体对客体特定行为的主观可能性预期,取决于经验,并随着客体行为的结果变化而不断修正。另一个是在ITUX.509中对信任的描述:“一般说来,当一个实体A可以假设另一个实体B能够严格地按照其希望的那样行动时,这个实体A就信任另一个实体B”。

本文倾向于采用Gambetta对信任的定义,可信性是主体对客体的一个判断,该判断取决于主体的主观经验,但也受到后续结果的影响。可信性是一种属性,它与不可信性形成一个全集。可信度是可信性的度量,是表示该属性具体程度的量化值。

在本文中,可信性的定义为:“可信性是一种属性,是指人们对事物的真实性的肯定。可信性与不可信性,两者互斥且构成全集”。可信度的定义为:“可信度是衡量可信性的指标,是对可信性属性所能达到的程度的量化。”可信度用符号B表示。

3 可信度法的计算模型

该模型中,知识是用产生式规则表示的,一般形式是:

上式中,E是知识的前提条件,也是一个证据;H是结论;B(H,E)是该条知识的可信度,称为可信度因子(Certainty Factor)。B(H,E)的取值范围为[-1,1],它的值越大,表示通过该条知识可信度就越大,从而使得结论H越可能正确。例如:E=头疼流鼻涕,H=感冒,B(H,E)=0.7。该式表示如果病人有头疼流鼻涕症状时,那有七成的把握是感冒了。

结论是建立在知识和证据基础之上的,同样,结论的可信度是知识与证据可行度的乘积。即:

如果多条知识同时支持一个结论,知识模型就变成一个合成算法:

要计算出综合可信度B(H),可以分步进行计算:

(1)首先对每条知识求出Bi(H),i=1,2,3,…n。即:

(2)然后用下列公式求出E1与E2对H所形成的综合可信度B1,2(H):

得到B1,2(H)之后,再用同样的方法计算出B1,2,3(H),直到得到B1,2…n(H),即综合可信度B(H)。

而在本文要研究的“多个单位同时上报相同无匹配项”情况,对于各个单位来说,其所用“知识”的可信度是相同的,B(H,E)是常数,其取值为B(H,E)=0.05。那么要得到数据的综合可信度,需要确定每个证据B(E)的值。

B(E)是指证据的可信度,在本文中具体是指各单位上报数据的可信度。

举个生活中的例子:小王上班迟到了,其理由是“半路上自行车坏了”。就此理由而言,有可能真是车坏了,也可能车没坏,只是找个理由搪塞。对于其他人来说,对小王的理由可以完全相信,也可以完全不信,或者某种程度的相信,这需要根据小王平时的行为表现才能做出判断。

同样的,要确定各单位上报数据的可信度,同样要根据各单位历史表现———上报数据质量的总体水平。若某单位上报数据质量一直较高,则该单位上报数据的可信度就高,反之可信度则较低。所谓的上报数据质量较高,是指该单位数据的正确率高于其它单位,或者说错误率低于其它单位。可以说,上报数据的可信度与上报数据的正确率成正比。这里的正确率应当是衡量某单位长期以来上报数据质量的一个平均值。

可信度是无法直接确定的,但正确率却能够通过计算得到,因此,我们可以用正确率P'来替代可信度。即:

以某单位为例,设该单位第一年上报数据的数量为D1,检测出的错误数据数量为M1,则该单位当年的数据错误率为P1。依此类推,第二年的三个参数分别为D2、M2、P2,第N年的分别为Dn、Mn、Pn。设P为该单位N年来总的错误率,则。通过对多年检测结果的统计,发现各单位每年的数据错误率Pn都是围绕该单位总的数据错误率上下波动的,且出入不超过5个百分点。很明显,总错误率更能反映出单位的上报数据质量的高低。而相对的,总正确率P=1-,又P'=P,结合式(4),忽略由正确率替代可行度产生的误差,得到:

在IPSDS的不确定性问题中,由于是用正确率替代了数据的可信度,从而得到B(E)>0。那么结合公式(3),得到:

这样,将式(1)、(5)以及(6)组合到一起,得到:

至此,本文给出了解决IPSDS中无匹配项的可信度计算模型,即式(7)。针对多个单位上报相同无匹配项,可以两两结合计算,最终到数据的综合可信度。

4 应用举例

以光学仪器基本信息表中生产工厂为例,基本信息见表一。

GCZD(工厂字典)是一个IPSDS。假设上报数据中有生产工厂F、M、N与工厂字典不匹配,有两个单位上报工厂N,三个单位上报工厂M,四个单位上报工厂F,详细情况如表二所示。

假设单位1的总错误率P1=0.15,单位2中P2=0.20,单位3中P3=0.25,单位4中P4=0.17,单位5中P5=0.30,单位6中P6=0.32。取B(H,E)=0.5。用式(3-7)计算得到:

工厂N的可信度为B1,2(H)=0.655;

工厂M的可信度为B1,2,3(H)=0.784375;

工厂F的可信度为B1,2,3,4(H)=0.873859375。

通过计算结果可以看出,对于同一个数据,上报单位的越多,数据的可信度也越大,这也是符合客观规律的。

5 结束语

本文针对检测程序运行中检测到的无匹配项数据的冗余核对问题,提出了基于不确定性推理的可信度法,给出了IPS-DS中无匹配项的可信度计算模型公式。通过该模型,计算出各个数据单元的可信度值,从而根据可信度值由低到高排序,依次核对。该方法是在资源有限的前提下提出的,能够在一定程度上减少核对工作的工作量,最大限度的提高数据质量。

参考文献

[1]吴建明.病态信息理论及其在装备保障中的应用[D].石家庄:军械工程学院,2004.

[2]欧渊.武器雷达信息系统病态数据修正方法研究[D].石家庄:军械工程学院,2007.

[3]王永庆.人工智能原理与方法[M].西安:西安交通大学出版社,2003.

[4]咸奎桐.可信性管理GB/T19000.4—ISO9000-4实施指南[M].北京:中国标准出版社,1997.

[5]Peter P.Chen.Information Credibility Assessment and Metadata Modeling in Integrating Heterogeneo-us Data Sources[J].AFRL-IF-RS-TR-2002-298Final Technical Report,2002,(3).

出生日期核对星座 篇4

请您根据**年阳历的日期来核对星座: 白羊座: 3月21日------4月20日金牛座: 4月21日------5月21日双子座: 5月22日------6月21日巨蟹座: 6月22日------7月22日狮子座: 7月23日------8月23日处女座: 8月24日------9月23日天秤座: 9月24日-----10月23日天蝎座: 10月24日----11月22日射手座: 11月23日----12月21日摩羯座: 12月22日----1月20日

水瓶座: 1月21日-----2月19日

双鱼座: 2月20日-----3月20日

集团内部往来的核对 篇5

一、内部往来产生以下原因

1、资金调拨;2、代收代垫;

3、实物买卖;

4、提供服务;

5、其他内部往来款项。

二、内部往来所使用的会计科目

应收账款、预付账款、其他应收账款;应付账款、预收账款、其他应付款。

对3、4项属于购销、经营业务的计入“应收账款”、“应付账款”、“预收账款”、“预付账款”;对1、2、5项与企业经营业务无关的计入“其他应收款”和“其他应付款”。

三、内部往来按组织结构划拨核对

只在相邻的上下级之间发生。

对于大型企业集团来讲独立核算的公司特别多, 每个公司最多要挂6个往来科目, 对于吉粮集团下属划分为4个组织机构级次, 共有75家子公司, 其内部往来的核对, 除了要求科目对应, 即应收账款对应付账款;预收账款对预付账款;其他应收账款对其他应付账款外, 还需要按组织结构划分核对即4级子公司之间内部往来以及其与上属公司3级子公司之间的内部往来, 进行核对汇报到3级公司, 3级公司之间的内部往来及其与上属公司2级公司之间内部往来汇报核对到2级公司;直至2级子公司间内部往来及其与上属公司1级子公司之间内部往来核对汇报到1级子公司为止。采取逐级管理, 对于越级的像1级子公司向3级子公司拨款, 只对2级子公司划拨, 2级再对3级子公司划拨。内部往来划转只在相邻的上下属之间而不能越级。

四、记账科目时间和口径要对应

一方记账, 要将相关的原始凭证复印件及记账凭证一联交予对方, 以保证双方记账期间一致和记账科目对应。经营业务债权方记应收账款, 债务方必须记入应付账款;债权方记入预付账款, 债务方必须记入预收账款。与经营业务无关的, 债权方记入其他应收款, 债务方必须记入其他应付账款。

五、每月末债权债务双方要对账, 保证双方余额一致, 如有差异要调节一致, 填制集团内部往来调整表, 并经双方会计主管及财务经理签字加盖财务章予以确认

运用Excel表格编制程序可以实现自动对账, 其核心是“内部往来核对表”, “内部往来核对表”采用棋盘的形式, 即行和列的公司名称和顺序相同, 列里每个公司下面有上述的6个会计科目。每个公司都有一个工作表标签。

在“内部往来核对表”中, 比如“生态食品”的“应收账款”与“集团总部”的“应付账款”核对, 在Excel单元格H4中输入公式“IF (集团总部!H3=生态食品!B6, TRUE, FALSE) ”, 如果能保证科目和金额的对应则会在H4中显示“true”否则显示“False”。

从这个“内部往来核对表”中可以清晰、一目了然地看到核对哪家公司哪个科目没有核对一致, 哪些公司全部对应一致。找到没有对应的两家公司无论是科目还是金额进行调整一致。填制“集团内部往来调整表”

所有公司内部往来核对一致, 查看“集团内部往来汇总及合并报表的编制”, 即可快速地浏览程序所设置的编制合并报表的内部往来抵销分录, 非常方便快捷!

在上述B3中输入公式“集团总部!J3+进出口!J3+收储合并!J3+米业!J3+酒业!J3+宾馆!J3+生态食品!J3+西部产业园!J3”汇总所有公司的应收账款金额。

在D3中输入“集团总部!J6+进出口!J6+收储合并!J6+米业!J6+酒业!J6+宾馆!J6+生态食品!J6+西部产业园!J6”汇总所有公司的应付账款金额。

在B9中输入“=D3”, 在B10中输入“=B3”, 在D9合并单元格中输入“IF (B9=B10, TRUE, FALSE) ”

上一篇:轻型应用下一篇:防污染技术