电子文件格式管理

2024-08-15

电子文件格式管理(精选九篇)

电子文件格式管理 篇1

(一) 电子文件格式分类

1. 文本文件。

通过软件的编辑, 生成由ASCII标准代码、GB2312-80标准汉字代码等, 按相应文件格式标准构成存储内容的文件, 又分为字处理文件、数据文件、源程序文件。字处理文件是指使用文字处理系统生成的, 由字符、制表符、段落符等构成的文件。字处理系统是现代办公自动化中最常见的电子信息系统, 但不同字处理系统之间一般不兼容, 即生成的字处理文件不能交换使用。如果其生成文件时使用通用文件格式, 如txt、rnf等, 则可以做到相互兼容。数据文件是指那些记录设计参数、计算结果、分析结果、测试结果等数据信息的文件。一般指数据库文件, 也包括含有数据的电子表格文件。机关、企事业单位的各类信息都可以建成数据库, 如政策法规数据库、经济指标数据库、试验数据库、产品型号数据库等。数据文件因生产程序不同而具有不同的格式, 一般来说不同类型的数据文件之间需要通过转换程序才能进行信息交换。文件类型有dbf、mdb、xls等。数据文件中的原始数据具有很高的信息价值, 但不一定具备凭证价值。源程序文件是指用计算机编程语言编写的程序代码, 通过在相应的编译平台上运行, 生成计算机程序或软件。它是在计算机编程系统中生成的, 有的是由程序员编

刘晓玲

写程序代码输入计算机, 有的则是通过编程器自动生成, 不同编程系统间一般不兼容。程序代码具有可移植性, 一般不受计算机类型的限制, 但编译后的软件在不同类型的计算机上可能不兼容。源程序文件是软件开发人员智慧和汗水的结晶, 表明知识产权的归属, 具有很高的保存价值。

2. 程序文件。

程序文件是指源程序文件编译后生成的文件, 一般称之为计算机程序或软件, 是我们接触最多的电子文件。它对计算机硬件和操作系统有一定的要求, 如不兼容, 则可能不会正常运行。它既是生成电子文件的平台, 也是应归档的管理对象。如果程序文件是本单位自行开发的, 那程序文件与源程序文件在归档时应一一对应。

3. 图形文件。

是指用计算机辅助设计绘制出的图形电子文件, 如计算机设计产生的设计模型、地理信息系统生成的地图等。图形文件由代表绘图坐标的矢量和一些参数组成。

4. 图像文件。

是指用数字设备采集或用图像软件处理制作的文件, 如用扫描仪扫描得到的各种画面, 用数码相机拍摄的数字照片, 用Photoshop软件制作的效果图等。纸质文件、缩微胶片均可经过扫描转化成图像文件。典型文件格式有bmp、tif、jpg等。

5. 影像文件。

用视频设备获得的动态图像文件或用动画软件生成的动画文件。常见格式有avi、mov、mpeg、rm、dat。

6. 声音文件。

用音频设备获得的声音文件或用编曲软件生成的文件。常见的文件格式有wav、mp3、avi等。

(二) 标准中电子文件的通用格式

中华人民共和国国家标准《电子文件归档与管理规范》6.1.4条对用文字处理技术形成的文本电子文件提出了要求, 指出文字型电子文件以xml、rtf、txt为通用格式, 收集时应注明文件存储格式、文字处理工具等, 必要时同时保留文字处理工具软件;在6.1.5条中提出扫描型电子文件以jpeg、tiff为通用格式;在6.1.7条中提出视频和多媒体电子文件以mpeg、avl为通用格式;音频电子文件以wav、mp3为通用格式;在6.1.9条指出, 对通用软件产生的电子文件, 应同时收集其软件型号、名称、版本号和相关参数手册、说明资料等。专用软件产生的电子文件原则上应转换成通用型电子文件, 如不能转换, 收集时则应连同专用软件一并收集。

二、现行电子文件规范中存在的问题

现行电子文件规范中的这几种格式都有适合数字化档案保存与利用的一面, 如格式的通用性好、可移植性强等, 但也有明显的缺点:如txt文件不能插入图片, 容量也较小, 如果仅做为内部存档, txt格式还勉强可以胜任, 但由于实际工作中很少使用txt文件, 与外界进行交换时会受到较大限制。最重要的是这几种格式有一个共同缺陷:或易于修改而不能较好地保持档案的原貌, 或在格式转换过程中尽管保留了信息内容却将原信息格式进行了调整。如原来的档案是Word格式, 转换为《电子文件归档与管理规范》推荐的通用格式txt后, 必然会将原有的Word格式做很大的改变。这可能会造成数字化档案原始性、真实性的不确定性, 而电子文件核心问题是其真实性、原始性、可靠性的确认, 正是真实性、原始性的不确定性, 影响了电子文件的凭证作用。

因此, 《电子文件归档与管理规范》在推荐通用格式时更多地考虑了数字化档案的易识别性、可移植性与可迁移性, 而没有过多地考虑所选用的电子格式应保持档案的原貌问题。这虽然方便了不同用户的不同利用需求, 却给文件的保管和长期利用带来了难题。有些采用专门格式的电子文件在长期保存过程中由于技术荒废、软件不兼容变成打不开的“死档”。虽然可以对文件进行迁移、仿真、更新等, 但每种方法都存在一定的缺陷, 操作起来不是那么容易, 且费用相当昂贵。为了方便、经济地确保电子文件长期存储的真实性和可读性, 选择什么样的格式保管文件显得尤为重要。

选择专用媒体格式存储电子文件, 也必须考虑将来该格式的过时问题。为了确保电子文件的长期存取, 如果采用专用的电子文件格式, 会由此增添更大的复杂性。专用软件的应用常常升级至最新版本, 然而软件的功能却没有像版本变化那么明显。随着时间的过去, 电子文件格式累积的变化更为显著, 甚至危及格式逆兼容。对专用软件的维护显得很急迫, 但是存在的问题颇多。就像应用软件一样, 操作系统也得定期升级, 随着系统基本体系结构的发展, 将来不再支持专用软件, 不对专用软件支持就意味着产生新的安全问题的风险也在增加。

三、电子文件格式问题的解决策略

(一) 将电子文件连同生成该文件的软件及运行该软件的操作系统和硬件一道保存起来

电子文件是依附性很强的信息体, 电子文件保存从严格意义上说, 还要对其支持系统及运行环境做出明确标识, 并将电子文件的读取软件、系统说明文件及相关的纸质文件一并保存。否则, 随着计算机技术的不断发展, 一些文件脱离了原先赖以支持的硬件和软件, 就会变成无法识读的“死文件”。

(二) 对新型电子文件格式实行筛选

为了保证文件格式的兼容性和安全性, 在电子文件的生成阶段, 就要对其格式进行筛选, 这样能有效地促进后续工作的开展。在格式的选择上, 首先要求系统依赖度低, 能在不同语言的操作系统、不同硬件平台上使用, 不受硬件、软件平台的限制的格式;其次, 选择的文件格式要支持格式转换和迁移。

(三) 不断地将文件转换成当前通行的新文件格式

格式转换是解决电子文件长期保存和利用的一种基本方法。当文件存在过时危机时, 操作者可以通过数据格式登记系统获知应该转换的格式, 并且可以利用系统提供的转换工具直接进行转换。格式转换的优点是无论软硬件如何变化, 总是可以把过时的文件格式转换为可利用的格式, 使之不至于因为软硬件平台的过时而无法阅读。缺点是有可能改变文件的显示和结构, 无法保证数据的全部迁移, 可能会导致数据一定程度的缺失, 无法保证原有文件的真实性、完整性。另外, 当遇到大量文件需要转移时, 成本会很高。因此, 尽可能地减少转换频率很重要, 专家们认为长期保存的电子文件应采用开放的符合国家标准的文件格式。

(四) 建立格式登记系统

电子文件格式登记系统保存了各种常见的文件格式以及创建、运行和迁移这些文件格式的软件的相关技术信息。建立格式登记系统可以引导文件形成者选择适合文件长期保存的首选格式, 并且当文件存在过时的危机时, 可以通过系统的查询和自动提醒系统, 获知应当转换的格式, 并可利用系统提供的转换工具和服务进行直接转换。

(五) 国家完善相关的法律、标准, 使在电子文件格式管理实践中有法可依

当然, 这些方法都还不是解决电子文件永久可读性问题的万全之策。我们在实践中只能在以上方法中选择损失信息较少、可行性较大的方法来作为现阶段的对策。目前, 大多数人选择的方法是舍弃了对原文件结构、格式的追求, 而重点强调对原文件内容的忠实再现, 在可能的范围内使用较为通用的编码格式。而对于那些特殊的、没有标准格式的电子文件采用暂时将其支持系统一并保存下来, 等待有关标准的出台的方法。另外, 在目前电子文件数量较少的情况下, 采用对其格式进行筛选的方法。 (作者单位河南省信息管理学校) ■

浅谈电子文件长期保存格式DjVu 篇2

国家档案局首次将DjVu选为电子文件长期保存的一种标准格式写入了<电子文件管理细则>征求意见稿.Djvu是由美国AT & T实验室于成功开发的一项新的`图片压缩技术,它使得高质量的扫描图像在因特网上的发布更为容易.Djvu在中国也得到了广泛的认可,特别是其在中美百万册图书项目及杭州档案馆信息化建设等项目中成功应用后,更是引起了众多专业人士的关注.

作 者:范家如 Fan Jiaru  作者单位:肇庆医学高等专科学校,广东,肇庆,526020 刊 名:卫生职业教育 英文刊名:HEALTH VOCATIONAL EDUCATION 年,卷(期): 27(23) 分类号:G36 关键词:电子文件   格式   DiVu  

电子文件格式管理 篇3

1调查涉及部门的基本情况

调查涉及管理部门10个,占全部科室的21.74%;教学部门2个,占全部科室的4.35%;医技部门2个,占全部科室的4.35%:服务部门4个,占全部科室的8.7%。

2电子文件基本情况

该院参与调查科室形成的电子文件总量为54684件,135;46GB。

参与调查部门中现行文件中电子文件所占比例在80%以上的10个,占55.56%:在80%-50%与49%-20%的各2个,各占11.11;在19%以下的4个,占22.22%。

参与调查部门用于处理电子文件计算机使用的操作系统,windows 98/ME 1个,占5.56%;Windows2000/NT 2个,占11.11%;Windows XP 18个,占100%。

参与调查部门电子文件来源于电子政务系统平台的1个,占5.56%,系统外购;源于办公自动化(OA)系统的3个,占16.67%,系统全部外购;源于通用字处理软件的13个,占72.22%;源于扫描、数字照相、摄像等数字化方式所形成的7个,占38.89%;采用CAD技术形成的1个,占5.56%:源于各种业务系统中产生的业务数据4个,占22.22%,系统全部外购;源于其他方式的1个,占5.56%。参与调查部门中电子文件使用TXT格式5个,占27.78%;DOC格式14个,占78.78%;WPS格式4个,占22.22%;XML格式2个,占11.11%;HTML格式1个,占5.56%;PDF格式2个,占11.11%;JPEG格式7个,占38.89%;MP3格式1个,占5.56%;AVI格式2个,占11.11%;MPGE格式3个,占16.67%;DBF格式4个,占22.22%;XLS格式7个,占38.89%;其他格式1个,占5.56%。参与调查的部门中电子文件使用套印红头电子模板的1个,占5.56%;不使用的17个,占94.44%。所有部门均未使用电子印章。

参与调查的部门中电子文件管理责任人属信息技术人员的3人,占16.67%文件管理人员的4人,占22.22%;档案管理人员的2人,占11.11%;业务人员的8人,占44.44%;其他人员的4人,占22.22%。

3电子文件存储管理

参与调查部门使用的信息系统中有归档功能的2个(使用业务系统),占11.11%;无归档功能的16个,占88.89%。

参与调查部门已经归档电子文件的总量54684件,135.46GB。其中有7个部门没有填写,占所有调查表的38.89%。

参与调查部门电子文件归档时间采用办结后随时归档的4个,占22.22%;采用定期集中归档的10个,占55.56%;采用随办随归档的4个,占22.22%。

参与调查部门电子文件归档方式采用在线归档1个,占5.56%;采用离线归档17个,占94.46%。

参与调查部门电子文件向档案部门移交归档的3个,占16.67%;不向档案部门移交归档的15个,占83.33%。

参与调查部门电子文件元数据和背景信息归档的4个,占22.22%;不归档的14个,占77.78%。

参与调查部门归档电子文件中有文本文件的14个,占77.78%;电子表格的12个,占66.67%;电子邮件的3个,占16.67%;数据库文件的5个,占27.78%;视频文件的1个,占5.56%;图像文件的2个,占11.11%;程序文件的1个,占5.56%。

参与调查部门电子文件办理过程有实时记录的2个,占11.11%;没有的16个,占88.89%。

参与调查部门对电子文件加密保存的4个,占22.22%;不加密保存的14个,占77.78%。

参与调查部门制定有电子文件的归档制度或规范的6个,占33.33%;没有的12个,占66.67%。

参与调查部门制定有电子文件的保管期限表5个,占27.78%;没有的13个,占72.22%。

参与调查部门中电子文件归档责任部门属信息技术部门1个,占5.56%;文件管理部门1个,占5.56%;档案管理部门2个,占11.11%;业务部门4个,占22.22%;其他部门11个,占61.11%。

参与调查部门归档电子文件的统一存储格式为TXT的3个,占16.67%;DOC的12个,占66267%;WPS的5个,占27.78%;XML的1个,占5.56%;JPEG的4个,占22.22%;DBF的2个,占11.11%;XLS的3个,占16.67%;其他的2个,占11.11%。

参与调查部门中归档电子文件的存储方式采用在线存储的5个,占27.78%;离线存储的17个,占94.44%。

参与调查部门归档电子文件离线存储载体采用硬盘的14个,占77.78%;光盘的7个,占38.89%;其他的1个,占5.56%。

参与调查部门归档电子文件在线存储载体采用存储在独立的档案信息专用服务器中的3个,占16.67%;其他的14个,占77.78%。

参与调查部门中对电子文件管理与归档提出建议和要求的有4个,占22.22%。主要集中在安全性、格式统一、统一管理、操作简单、方便查阅五个方面。

数码录音电子文件长期保存格式研究 篇4

㈠支持真实性验证技术

目前, 验证电子文件真实性的技术有三种类型:数字签名技术、文件校验技术、数字水印技术。受音频电子文件格式、利用方式以及数字签名技术的限制, 现在数字签名技术还无法直接应用于数码录音电子文件。

1. 文件校验技术。文件校验技术通过一种消息摘要算法, 根据源文件的每一位 (bit) 最终产生一个一定位数的校验码值 (十六进制数) 。校验算法有:CRC32、MD5、SHA1等。目前确保数码录音电子文件原始性的可靠方法就是制作并验证其校验码。

2. 音频数字水印技术。音频数字水印技术就是将一些标识信息 (即数字水印) 直接嵌入音频数字信息中, 但不影响原音频数字信息的使用价值, 也不容易被人听到。通过这些隐藏在音频数字信息中的数字水印, 可以达到确认数字音频内容创建者、传送隐秘信息或者判断数字音频是否被篡改等目的。

㈡数码音质无损

数码音质即指数码声音的品质或质量。数码音质无损是指经存储、传输、处理后, 数码音频信号没有任何损失。数码音质无损技术要求有:

1.无损音频编码。数码录音的过程就是对连续的声波进行数字化采样、量化、数字编码 (即音频编码) 的过程。相对于连续声波的自然声音来说, 音频编码最多只能做到无限接近自然声音, 而无法完全还原自然声音。所以从本质上说, 任何数字音频编码方案都是有损的。

在计算机应用中, 能够达到最高保真水平的音频编码就是PCM, 亦称为“无损音频编码”。PCM编码没有对声音信号进行压缩。还有一种无损音频压缩编码, 即FLAC (自由无损音频编码) 。

2.无损音频压缩文件格式。无损音频压缩即指音频信息经过压缩后不受损失, 还能完全恢复到压缩前的原样。数码录音电子文件在无损音频压缩文件格式之间转换, 可以确保数码音质无损。常见的无损音频压缩文件格式有:FLAC、APE等。

3. 数码音质无损转换。要确保数码音质的无损转换, 数码录音电子文件格式就必须全面支持如下各项参数:

全频率, 频率的单位是Hz (赫兹) , 用于表示音调的高低。频率范围:4KHz~192KHz。全位数, 位数的单位是bit (位) , 用于描述声音波形和振幅。位数范围:4位~32位。全声道, 声道可分为单声道、双声道, 2.1声道~7.1声道。多声道用于获得立体声及环绕声音效。

㈢文件格式开放透明

1.文件格式开放。即有公开发表的文件格式标准和技术规范;有与产品无关的技术专家组和标准化组支持该文件格式。

2.文件格式源代码开放。

3.文件本身不加密。既不包含加密协议, 也不包含加密选项。

4. 文件格式通用。即符合相关的国际标准、国家标准或技术规范。被广泛应用和支持, 采用的技术成熟、稳定, 具有较强的生命力。

㈣不绑定软硬件

它是指能够被多种操作系统和应用软件支持, 与存储技术无关。当用户不能使用指定产品软件时, 可使用已有的插件读取。

㈤格式自描述

可以设置元数据, 描述对象的属性特征, 满足管理、保存、描述的需求。

㈥格式自包含

既不包含指定版本的格式之外的内嵌对象, 也不包含外部对象的链接。

㈦易于存储

格式紧凑, 数据结构合理, 数据占用字节数少。支持在一个文件中容纳大量数据, 不必把数据拆分成块。文件独立, 所有音频文件信息都应包含在单一的文件中。

㈧信息安全

符合国家信息安全政策, 规避技术壁垒, 维护信息安全。

㈨代价最小

选定的长期保存格式尽可能使电子文件的管护成本最小化, 这些成本包括使用、维护该格式软件费用、相关格式转换费用及人员培训费用等。

二、数码录音电子文件长期保存格式的筛选

㈠无损音频压缩文件格式要求

据此可以将众多的有损压缩音频文件格式排除在数码录音电子文件长期保存文件格式之外。例如, MP3、WMA、AAC等格式, 都属于有损压缩音频文件格式。

WAV格式支持许多压缩算法, WAV格式是否属于无损压缩文件格式, 则完全取决于它所采用的音频编码是否无损。采用PCM编码 (无损压缩编码) 的WAV格式属于无损压缩文件格式;而采用ADPCM编码 (有损压缩编码) 的WAV格式属于有损压缩文件格式。

㈡文件格式开放透明要求

文件格式开放的要求之一就是文件格式源代码开放。据此可以将不开放源代码的无损音频文件格式中的APE、OptimFROG、LA、TAK格式排除在数码录音电子文件长期保存文件格式之外。

㈢不绑定软硬件要求

不绑定软硬件的要求之一就是能够被多种操作系统和应用软件支持。据此可以将无损音频文件格式中的WAV (只有Microsoft Windows操作系统支持该文件格式) 、Apple Lossless (只有Apple软件支持该文件格式) 、WMALossles (只有Windows Media Player支持该格式) 等格式, 排除在数码录音电子文件长期保存文件格式之外。

㈣易于存储要求

易于存储要求文件独立, 所有音频文件信息都应包含在单一的文件中。而WavPack是分wv文件 (有损音频压缩文件) 和wvc文件 (修正文件) 两部分组合保存的音频文件格式 (有对应的wvc文件, wv就变成无损音频压缩文件格式了;而缺少wvc文件的wv文件就变成有损音频压缩文件格式) 。据此可以将WavPack格式排除在数码录音电子文件长期保存文件格式之外。

经过四轮筛选之后, 只剩下FLAC音频文件格式符合数码录音电子文件长期保存格式的要求。

三、数码录音电子文件长期保存格式——FLAC文件格式

㈠FLAC文件格式简介

FLAC属于无损音频压缩文件格式 (文件名为.flac) 。FLAC格式文件较小, 便于播放。

OGG计划支持FLAC, 也可将FLAC音频数据封装在OGG传输层中, 生成OGG FLAC格式文件 (文件名为.ogg) 。OGG FLAC格式文件较大 (比OGG Vorbis格式文件大得多) , 便于传输、编辑、播放。

㈡FLAC文件格式的论证

1. FLAC文件格式支持真实性验证技术。FLAC支持文件校验技术 (如MD5校验) 和音频数字水印技术, 符合支持真实性验证技术的要求。

2. FLAC文件格式数码音质无损。FLAC既是一种无损音频编码, 又是一种无损音频压缩文件格式, 支持线性PCM采样 (1Hz~655350Hz) , 采样位数可达16位以上 (16~32位) , 支持多声道 (1~8个声道) , 符合数码音质无损的要求。

3. FLAC文件格式开放透明。FLAC的源代码和格式完全公开, 与产品无关的FLAC工程组保留修改FLAC格式规范的权力。这符合文件格式及其源代码开放的要求。FLAC不支持任何复制保护方法, 既不包含加密协议, 也不包含加密选项, 符合文件本身不加密的要求。FLAC符合有关音频文件格式的国际标准、国家标准和技术规范, 采用的技术成熟、稳定, 具有较强的生命力。FLAC的应用和支持日益广泛, 符合文件格式通用的要求。

4. FLAC文件格式不绑定软硬件。FLAC兼容多种操作系统平台, 例如, Windows、Unix、Linux、Mac OS X、OS/2等;还提供了FLAC编码/解码器插件 (flac.exe) 、FLAC播放器, FLAC工具软件;FLAC被众多第三方软件支持, 符合不绑定软件的要求。FLAC已经获得一些硬件支持, FLAC格式文件可以直接在硬件设备中播放, 符合不绑定硬件的要求。

5. FLAC文件格式自描述。FLAC提供的免费工具metaflac.exe, 可对编码后的FLAC文件进行元数据的添加、修改和删除等操作, 符合文件格式自描述的要求。

6. FLAC文件格式自包含。FLAC是专门针对音频的特点设计的压缩编码, 既不包含FLAC格式之外的内嵌对象, 也不包含外部对象链接, 符合格式自包含的要求。

7. FLAC文件格式易于存储。FLAC格式紧凑, 数据结构合理, 数据占用字节数少, 符合格式紧凑的要求。可将一张CD—DA保存为一个单一FLAC文件, 符合在一个文件中容纳大量数据而不必把数据拆分成块的要求。FLAC格式文件是独立的, 所有音频文件信息都可包含在单一的文件中, 符合文件独立的要求。

8. FLAC文件格式信息安全、代价最小。FLAC的源代码和格式完全公开, 可用于任意用途, 符合文件格式开放透明的要求。FLAC文件格式及其相关的编码、解码算法均无专利, FLAC的各种资源都可以免费获得 (http://flac.sourceforge.net/) , 没有技术壁垒, 便于维护数码音频电子文件的信息安全, 符合信息安全的要求和电子文件管护成本最小化的要求。

通过上述论证, FLAC文件格式完全符合数码录音电子文件长期保存格式的各项要求。

参考文献

电子文件格式管理 篇5

为了有效保存电子文件,国家档案局与省档案局自2004年起将电子文件管理技术、方法列为科技项目的重点。事业单位整体信息技术水平虽然较高,但其档案机构的信息化水平、档案工作者运用信息化技术的能力、信息化环境下电子文件管理制度的建立还有相当的差距。本报告的调查数据就比较真实的反映出这种状况。

二、研究方法与过程

本项研究采用问卷调查方法。调查对象为开封市部分事业单位。调查范围为开封市及所辖区县。时间为2008年10月。为使本次与调查的结果与2006年的调查结果具有可比性,调查采用国家档案局2006年计划项目《电子文件种类格式及归档技术方法现状调查》使用的调查表。包括单位基本情况、电子文件基本情况、电子文件归档管理、电子文件存贮管理和建议与要求等5类25个问题。发放问卷50份,收回有效问卷38份,回收率76%。调查数据的整理与分析采用国家档案局2006年计划项目《电子文件种类格式及归档技术方法现状调查》专用统计软件。

三、调查情况

1、单位基本情况

调查涉及医院9个,占23.68%;学校16个,占42.11%;科研单位4个,占10.52%;其他事业单位9个,23.68%。

2、电子文件基本情况

参加调查单位电子文件总量66463件,1482.2GB。参加调查单位中现行文件中电子文件所占比例在80%以上的5个,占13.16%;在80%-50%的11个,占28.95%;49%-20%15个,占39.47%;在19%以下的7个,占18.42%。

参加调查的单位处理电子文件的计算机使用的操作系统,Windows 98/ME 7个,占18.42%;Windows 2000/NT 4个,占10.52%;Windows XP 33个,占86.84%。

参加调查单位电子文件来源于电子政务系统平台的3个,占7.89%,系统外购;源于办公自动化(OA)系统的5个,占13.16%,系统全部外购;源于通用字处理软件的38个,占100%;源于扫描、数字照相、摄像等数字化方式所形成的27个,占71.05%;采用CAD技术形成的9个,占23.68%;源于各种业务系统中产生的业务数据22个,占57.89%,系统全部外购;源于其他方式的8个,占21.05%。

参加调查单位中电子文件使用TXT格式9个,占23.68%;DOC格式34个,占87.79%;WPS格式19个,占50%;XML格式5个,占13.16%;HTML格式3个,占7.89%;PDF格式7个,占18.42%;JPEG格式13个,占34.21%;MP3格式2个,占5.26%;AVI格式3个,占7.89%;MPGE格式7个,占18.42%;DBF格式7个,占18.42%;XLS格式8个,占21.05%;其他格式9个,占23.68%。

参加调查的单位中电子文件使用套印红头电子模板的15个,占39.47%;不使用的23个,占60.53%。所有单位均未使用电子印章,原因是相关系统没有此功能或有此功能但没有开通。参加调查的单位中电子文件管理责任人属信息技术人员的13人,占34.21%;文件管理人员的5人,占13.16%;档案管理人员的7人,占18.42%;业务人员的10人,占26.32%;其他人员的3人,占7.89%。

3、电子文件存贮管理

参加调查单位使用的信息系统中有归档功能的4个(使用业务系统),占10.52%;无归档功能的34个,占89.48%。参加调查单位已经归档电子文件的总量56448件,315GB。其中有5个单位没有填写,占所有调查表的13.16%。

参加调查单位的电子文件归档时间采用办结后随时归档的9个,占23.68%;采用定期集中归档的22个,占57.89%;采用随办随归档的7个,占18.42%。参加调查的单位电子文件归档方式采用在线归档3个,占7.89%;采用离线归档35个,占92.11%。

参加调查单位的电子文件向档案单位移交归档的7个,占18.42%;不向档案单位移交归档的31个,占81.58%。参加调查单位电子文件元数据和背景信息归档的5个,占13.18%;不归档的33个,占86.82%。

参加调查单位归档电子文件中有文本文件的38个,占100%;电子表格的32个,占84.21%;电子邮件的11个,占28.95%;数据库文件的15个,占39.47%;视频文件的3个,占7.89%;图像文件的16个,占42.11%;图形文件的21个,占55.26%;程序文件的6个,占15.8%。

参加调查单位电子文件办理过程有实时记录的2个,占5.26%;没有的36个,占94.74%。参加调查单位对电子文件加密保存的12个,占31.58%;不加密保存的26个,占68.42%。参加调查单位制定有电子文件的归档制度或规范的6个,占33.33%;没有的12个,占66.67%。参加调查单位制定有电子文件的保管期限表15个,占39.47%;没有的23个,占60.53%。

参加调查单位中电子文件归档责任单位属信息技术部门5个,占13.16%;文件管理部门3个,占7.89%;档案管理部门7个,占18.42%;业务部门12个,占31.58%;其他部门11个,占28.95%。

参加调查单位归档电子文件的统一存储格式为TXT的13个,占34.21%;DOC的22个,占57.89%;WPS的25个,占65.79%;XML3的个,占7.89%;JPEG的14个,占36.84%;DBF的12个,占31.58%;XLS的13个,占34.21%;其他的12个,占31.58%。

参加调查单位中归档电子文件的存储方式采用在线存储的4个,占10.53%;离线存储的38个,占89.47%。参加调查单位归档电子文件离线存储载体采用硬盘的24个,占63.16%;光盘的13个,占34.21%;其他的1个,占2.63%。参加调查单位归档电子文件在线存储载体没有存储在独立的档案信息专用服务器中的,全部存储在其他服务器中。

四、结论

1、电子文件已经普遍存在,并在现行文件中占相当比重。从调查结果看,电子文件已经普遍存在于各类事业单位之中。单位现行文件中电子文件数占到的半数以上的已经超过40%,平均数量为1749件,39 GB。

2、操作系统单一,业务系统商业化比例高,电子文件与归档电子文件格式多样。计算机操作系统均Windows操作系统,近90%为Windows WP系统。由于分属不专业,事业单位政务、业务与办公系统多种多样,但均为外购,没有自行开发的。电子文件主要来源于通用字处理软件(100%)、扫描、数字照相、摄像等数字化方式形成(71.05%)和各种业务系统(57.89%)。电子文件格式超过了14种,以文本类、图形类、数据库类居多。归档电子文件中文本文件(100%)、电子表格文件(84.21%)、图形文件(55.26%)、图像文件(42.11%)和据库文件(39.47%)居多。

3、电子文件的权威性,电子文件归档的及时性与完整性不高。多数单位的电子文件使用没有使用套印红头电子模板(60.53%)。所有单位均未使用电子印章,原因是相关系统没有此功能或有此功能但没有开通。使用中的管理系统80%以上无电子文件归档功能。电子文件归档时间多数采用定期集中归档(57.89%),办结后随时归档次之(23.68%)。归档方式绝大多数采用离线归档(92.11%)。多数未档案单位移交(81.58%),80%以上档案的元数据和背景信息没有归档。

4、电子文件办理与归档管理制度尚不建全,执行不到位。电子文件办理过程多数没有实时记录(94.79%),且多数(68.42)没有加密保存。相当一些单位没有制定有电子文件归档制度(规范)与保管期限表。归档电子文件的统一存储格式以文本类为主。归档电子文件存储方式以离线存储为主(89.47),存储载体以硬盘为主(63.16),光盘为辅(34.21)。

5、电子文件日常归档管理上更多的依靠技术人员和业务人员。电子文件管理责任人以技术人员和业务人员,文件档案管理人员不到20%。归档责任单位属业务部门(31.58%)、信息技术部门(13.16%);文件管理部门与档案管理部门占25%左右。这与档案人员的技术与业务水平有关。

6、电子文件管理的安全性、统一性、易用性是基层同志关心的重点。参加调查单位中对电子文件管理与归档提出建议和要求的有33个,占86.84%。主要集中在电子文件时常收集、归档、保存过程中的安全可靠、格式转换、管理统一、简单易用、查阅方便几个方面。

摘要:电子文件归档与保存情况,现已成为档案工作的重要内容。本报告主要用于评估开封市部分事业单位电子文件归档与保存方面的状况,事业单位档案工作者实施电子文件归档管理的能力,了解《电子文件归档管理规定》在事业单位档案机构中落实的实际情况。

电子文件格式管理 篇6

配网系统结构简单,但覆盖面广,涵盖了整个城市的每个角落。这就造成配网系统线路改造比主网频繁,比如环网柜/开关柜的改造、开关线路走向的改变、馈线10Kv供电开关的转变等。配网线路改造导致配网数据模型的改变,必须对改造的部分进行重新建模。而电网系统由很多子系统构成,如EMS、PAS、DMS等,这将使DMS与其他系统间的模型交互频繁,如何准确、高效地导入电网数据模型是配网系统必须解决的问题。

1 CIM XML/RDF模型文件

1.1 CIM模型概述

公用信息模型CIM是电力企业应用集成的重要工具,它包括公用类、属性、关系等,其类(Class)及对象(Object)是抽象的,可以用于许多电力系统应用,它是逻辑数据结构的灵魂,可定义信息交换模型。CIM提供了一个关于电力能量管理系统信息的全面逻辑视图,是一个代表电力企业所有主要对象的抽象模型,包括了这些对象的公有类和属性,以及它们之间的关系。

类间的关系揭示了它们相互之间是如何构造的。CIM类之间的关系主要分为:泛化、简单关联和聚集。

1)泛化

泛化是一种继承关系,是一个较一般的类和一个更具体的类之间的关系。泛化使具体的类可以从它上层所有更一般的类继承属性和关系。

2)简单关联

关联是类与类之间的一种概念上的联系。每一关联都有两个作用,而每一个作用表示了关联的一个作用方向。有向作用描述了相对于源类(即施加作用类),目标类(即被作用类)所受到的作用。作用赋以目标类的名,可带可不带动词。每一作用还有对象重数或称为对象基数,用来指明有多少对象可以参与到给定的关系中。在CIM中,关联是不命名的。

3)聚集

聚集是关联的一种特殊情况。聚集表明类间的关系是某种整体—部分的关系,整体类由各部分类“构成”或整体类“包含”部分类,而部分类是整体类的“一部分”。部分类不像一般化,部分类并不从整体类继承。

1.2 CIM模型分类

CIM模型文件按内容分为全网模型和增量模型。

1)全网模型

全网模型包括整个电网比较详尽的信息,包括:Company、SubControlArea、BaseVoltage、Substation、VoltageLevel、PowerTransFormer、BusbarSection、Breaker、ConnectivityNode、terminal等。

2)增量模型

配网的线路改造是比较频繁,如果每次线路改造都进行全网模型导入,工作量很大,不利系统的使用。增量模型的出现解决这个问题,每次线路改造只需导入相应的增量模型即可。增量模型又分为部分模型和差异模型。

部分模型(拆分模型),顾名思义就是全网模型的一部分。按照拆分的条件不同可生成不同的部分模型。如按子控制区(SubControlArea)拆分,从一个大地区的模型中,分离出某一子控制区的数据模型(把子控制区包含的厂站分离出);按电压等级(VoltageLevel)拆分,把某区域里电压等级满足某一条件的信息分离出来(厂站的集合)。

差异模型是对部分模型的进一步简化,它只显示模型中变化的那部分。第一次导入全网模型之后,后续线路改造时只需导入变化的增量模型。差异模型描述了当前网络状态与全网模型间的差异。差异模型与全网模型合并之后即形成当前时刻完整的网络模型。

差异模型本身是类型为dm:DifferenCeModel的资源,它有如下几个特性:dm:forwardDifferenCeS,dm:reverseDifferenees,dm:preeonditions。DMS1000E系统中使用的特性为dm:forwardDifferenees和dm:reverseDifferenees。规定:

只在出现,表示新增。

只在出现,表示删除。

同时在两元素中出现,表示修改。

差异模型例子:

从模型中可以看出,”#111”为修改元件,修改后的名称为“开关A”;“#222”为新增元件;“#333”为删除元件,删除元件的子元素不需要给出。

1.3 CIM XML/RDF格式文件

将电网CIM模型导出为CIM XML/RDF格式,使用XML XML/RDF规范表示电力系统数据。CIM XML/RDF格式文件为每个对象分配唯一的RDF,关联的对象的RDF前加#标识。

1)属性的表示方法

CIM/XML中属性采用<类名+“.”+属性名>的形式表示。若类名就是本类名,表示该属性是自身的;如类名非本类名,表示该属性继承自父类,“.”前的类名就是该属性所继承的父类名。

2)关联的表示方法

CIM/XML中关联采用<类名+“.”+关联名>的形式表示。若类名就是本类名,表示该关联是自身的;如类名非本类名,表示该关联继承自父类,“.”前的类名就是关联继承自哪个父类。

下面是个简单的CIM XML/RDF格式文件,可以看出一个VoltageLevel对象拥有三个属性:从Naming继承来的name及自身的两个属性:highVoltageLimit和lowVoltageLimit。同时每个VoltageLevel对象属于一个Substation对象,且与一个BaseVoltage对象关联。

1.4 CIM XML/RDF格式文件解析

本文采用SAX方式解析CIM XML/RDF格式文件。

对CIM XML/RDF格式文件解析之前为每个CIM类分配一个内存,用来记录解析的类对象。解析时首先判断是不是CIM元件类,如果是则记录元件类型,并到对应的内存中查找,如果找不到则创建。根据CIM模型的层次结构特点,对CIM对象属性和关联解析时先解析基类的属性和关联,再解析自己的属性和关联。下面介绍VoltageLevel对象元素的解析。

由于VoltageLevel类继承了equipmentContainer类,所以先调用equipmentContainer类的解析函数把继承来的属性和关联解析出来,此处只有一个属性name。接着解析自己的属性和关联。解析属性时很简单就是把属性值转换为浮点数直接复制给对象属性,解析关联时,需要去掉RDF前的#再赋值。具体实现代码:

2 结论

CIM是电网系统间数据交互的基础,各个系统必须做到准确、高效地导入、导出CIM模型文件。配网自动化系统正处发展阶段,而且与其他系统的交互越来越多,所以做好配网系统的模型导入是很现实和必要的。文章最后给出如果运用SAX方式解析CIM XML/RDF格式文件。

参考文献

[1]IEC DRAFT,EMSAPI DOCUMENT1:COMMON INFORMATION MODEL(CIM),VERSION1[S].DECEMBER,1996.

[2]能量管理系统应用程序接口(EMS-API)第301篇:公共信息模型(CIM)基础[S].中华人民共和国电力行业标准,IEC61970-3011999.

[3]吴玉生,吴杏平.基于IEC6I970系列标准的数据库接口的研究[D].中国电力科学院,2003.

[4]林昌暖,吴健.基于RDF的CIM数据存储方案研究与实现[J].科学技术与工程,2007(12).

[5]朱见伟,丁巧林等.配电网CIM综合模型的构建与应用[J].继电器,2006(4).

电子文件格式管理 篇7

在开发前后两个版本文件收发软件过程中, 席位的设置如图1所示为树状结构。编程实现时在VC中分别用XML和INI格式管理树状结构的席位, 存储的同一个席位配置文件命名为position.xml与position.ini, 其格式分别如图2和图3所示。

可以看出, INI文件适合席位配置层级不多, 最好是只有两层的配置文件, 例如“1教室—计算机1”, “1教室—计算机2”, 等。这种管理方式对于层级处理简单的情况比较适用, 特点是加载速度快, 简单明了, 席位配置文件可以当作文本文件来使用, 编辑修改容易, 可在记事本、写字板等工具中编辑修改, 不需编写专门的席位配置工具。而使用XML文件可配置存储多个层次的席位, 例如“教室—1教室—计算机1”, “教室—1教室—计算机2”等, 包括3个层级。这种管理方式适用于较复杂、有众多继承关系的席位配置情况, 对于比较大的项目可以考虑使用XML进行各种配置文件的管理, 特点是使用XML加载后就包含完整的层次关系, 而且支持的层次关系可以包含任意多层。XML是目前最好的用于保存各种信息的格式, 而且现在对它的支持也越来越广泛, 所以最好选择用XML。

2 读写INI文件

主要采用Win32环境下的GetPrivateProfileInt () , GetPrivateProfileString () 等API来实现读取INI文件, 这里介绍读写INI生成席位树的方法。

3 读写XML文件

电子文件、电子档案的特点与管理 篇8

(一) 信息传递快

经济全球化把世界上不同国度、不同角落从事经济活动的人联系在一起。世界并不陌生, 也不显得遥远, 经济活动个体在短时间内就能了解自己的商务活动并作出反应。电子信息通过网络既可单向传播, 也可多向分散, 由电子信息生成的电子文件成为传播信息的重要渠道且波及面广, 无论是世界经济活动的前沿报道, 还是某一项经济法规的公布都可以通过电子文件公布出来, 很短时间内世界上便可晓得经济的最新进展。在没有电子文件、没有电子信息之前, 可以想象让全世界了解某项重要经济活动的运行、发展几乎是不可能的。

(二) 一体化趋势强

电子文件、电子档案具有记录范围广、传递信息快、保存方便的优势, 它不仅能纵向形成某项经济活动的纪要, 更能从横向范围内把反映某项经济活动议题影响的价值信息快速记录下来。电子文件、电子档案从记录的完整角色看, 更能充分做到“横不缺项、纵不缺限”, 无论是从时间角度还是空间角度都是完整、一体的发生作用。经济全球化也不是单向的, 国家之间、公司之间甚至个人之间进行的经济活动从对话到最后达成协议并不是孤立的发生作用, 它必然或无形中影响到其他国家或民众的关注。特别是关系国计民生的重要国际会议议题, 如改善卫生服务、改善居住环境、加快扶贫等一系列问题都会使其他国家或民众作出反应并出台相关政策应对经济形势的变化。从这层意义上讲经济全球化又是一体化的过程。电子文件、电子档案记录内容的完整性、一体化与经济全球化相对称, 它对国家根据国际形势变化探究经济趋势、推定经济走向、制定经济法规能产生重要影响, 对国家在经济全球化中开展国际竞争提供了更为宽广的信息来源。

(三) 保存与查询

经济的发展带动了档案工作的变革, 传统的纸质档案已不能完全适应经济形势的变化, 电子文件、电子档案通过网络变得更加便捷, 且保存简易。一旦纸质档案丢失, 便可通过电子文件和保存的电子档案进行查询, 尤其是当发生重大自然灾害, 如暴雨、雷电、地震等灾难时, 纸质档案一旦完全被毁, 如有电子档案异地备份保存, 只要进行原始电子文件恢复, 将起到其他方式再现历史不可替代的作用。特别是国家在经济全球化趋势中应对经济纠纷, 如有电子文件、电子档案保存, 它将会给国家提供法律依据, 打赢国际官司、挽回经济损失功不可没。

二、电子文件、电子档案的管理

(一) 提高认识, 加强领导

档案作为真实记录社会政治、经济、科技、文化等各项活动的第一手材料, 是人类社会记录、传递、留存信息的重要工具, 是一个国家或地区历史文化财富的重要载体。伴随信息技术的广泛应用而产生的电子文件和电子档案, 同传统的纸质文件、档案一样, 都是首都重要的信息资源和珍贵财富。各地区、各单位应提高对保存电子文件和电子档案重要性的认识, 加强对电子文件和电子档案工作的领导, 将电子文件和电子档案的管理纳入本地区、本单位的信息化建设规划。健全档案工作网络, 将对电子文件形成及管理全过程的要求相应纳入各级领导、电子文件形成部门和档案部门或人员的职责范围, 确保电子文件和电子档案的真实、完整及有效性。

(二) 做好办公自动化系统的开发设计和应用工作

各地区、各单位在开发设计办公自动化系统时, 应统筹考虑电子文件归档和电子档案管理问题。档案部门或人员应在系统开发设计人员的技术指导及对办公自动化环境下文件形成全过程充分调研的基础上, 全面、准确地提出电子文件归档和电子档案管理的功能需求。同时, 在办公自动化系统开发与应用的整个过程中, 系统开发设计和维护人员要与档案部门或人员密切合作, 以保证办公自动化环境下电子文件和电子档案的有序形成和安全保存。

(三) 及时做好电子文件的归档和电子档案的移交工作

各单位应将具有凭证和参考价值的电子文件纳入归档范围, 并在归档电子文件时, 同时归档同版本的纸质文件及保证电子文件长期可读的相关数据和背景信息。档案部门或人员负有对本单位电子文件形成、积累、整理、归档工作的监督职责。各单位还要按照同级国家综合档案馆的要求, 定期向同级国家综合档案馆移交电子档案。

(四) 加强人才队伍建设

电子文件管理的初探 篇9

1 构建统一的电子文件管理的基础框架

在新的时期, 加强法制建设, 依法管理电子文件, 逐步形成一套完善的电子文件管理法制体系。相应的法律法规是电子文件管理的一个重要前提, 目前电子文件管理不善, 同没有一个电子文件法规有着重要关系。因此, 一档案行政管理部门应会同政府信息产业部门联合制定电子文件管理法, 确认电子文件的法律地位, 明确档案行政管理部门和政府信息产业部门的职责, 统一电子文件的软硬件设施, 依法管理电子文件;二档案行政管理部门应逐步制定和完善电子文件全过程管理制度, 做到有章可循, 使电子文件的管理达到标准化、规范化、制度化;三为了承担不久将要面临的指导电子文件归档及其归档后形成的电子档案管理任务, 各级档案行政管理部门应增设相应的管理机构, 行使监督、检查、指导电子文件归档及电子档案管理的职权。

2 做好电子档案利用时的保密工作

电子档案在利用中的保密与安全是十分重要的。由于电子档案利用方式与所依赖技术的多样化, 导致了利用工作的复杂性。同纸质档案相比, 电子档案利用过程中的保密性与安全性更加难以控制。因此, 加强电子档案的利用管理, 就显得特别重要。从信息安全的角度出发, 在电子档案的利用中, 可采取两项措施:审核使用权限;划分密级层次。

3 完善电子文件管理运行模式

电子文件与纸质文件相比, 所涉及的问题更为广泛、受到的制约因素更多, 仅仅依靠档案部门是难以完成的。因此, 应当采取电子文件形成部门、档案部门、计算机与信息管理部门“三位一体”的电子文件管理运行模式, 各部门各司其职、各扬所长。电子文件形成部门熟悉业务, 了解电子文件历史联系, 对于鉴定电子文件的价值富有“话语权”, 是电子文件归档管理工作的主要责任者;档案部门既掌握电子文件归档的原则、方法, 又了解全局情况, 歌谣效地发挥统筹全局、把好关口的作用;而计算机与信息管理部门一方面作为电子文件的形成者;另一方面又作为设计与维护信息管理网络、管理电子信息的专业技术部门, 双重功能集于一身, 是电子文件归档制度化、标准化的组织者与实施者。这种“三位一体”的电子文件管理运行模式, 可以有效保证电子文件归档管理工作的质量。

4 档案管理工作提前介入

电子文件档案系统的设计, 对于电子文件与电子档案管理系统而言, 它和所有档案辅助管理软件有着根本的区别, 它承担了电子文件与电子档案从接收、鉴定、保管、利用等全部工作, 不仅要具有电子档案的管理功能, 而且还具有相当于实体档案库房的保管存储功能。把原来纸质文件管理系统中的许多后控制手段提到了最前端, 尽可能把文件各个阶段的管理要求放在设计阶段予以考虑, 以功能合理的电子文件、电子档案管理系统作为管好电子文件的先决条件。

5 建立动态的跟踪监控系统

电子文件的管理应当从每份电子文件产生之初起, 建立起一个与各部门紧密相连的系统, 对每份文件的形成、接受、利用进行跟踪控制, 以防止文件的丢失。这个系统应当以档案管理部门为核心, 电子文件管理者给予各种文件类型以代码, 任何部门未经档案管理部门同意, 不能擅自建立新的文件系统, 从而保证各类文件的产生均在档案管理部门的监控之下, 以确保档案管理者具备文件的领导权力。

6 提高档案管理人员的素质

电子文件管理要求档案人员必须加强自身学习, 全面提高理论水平, 熟悉电脑操作。

档案人员通常只是熟悉档案业务, 对于电脑操作并不熟悉。而电子文件管理就要求人员必须熟知电脑基本操作、相应软件运动等知识。因此, 在进行电子文件管理工作中档案人员会感到知识缺乏, 导致困难, 工作效率不高, 可以说, 电子文件对档案人员提出了更高要求。具体来说, 就是档案人员必须加强学习, 全面提高理论水平, 熟悉电脑, 了解相应软件的有关知识。对于档案人员来说, 仅有单一的档案专业知识已经远远不够, 社会发展要求档案工作者必须是知识全面的复合型人才, 只有这样, 才能使档案工作真正融入到社会的建设和发展中去, 档案工作才能真正体现其价值所在。

7 加强电子文件的利用

档案工作的根本目的在于利用, 首先, 必须建立起一整套科学、严谨、合理的电子档案管理制度, 实现电子档案管理的标准化和规范化, 使电子档案在产生、运行、管理过程中有法可依, 有章可循, 保障其工作顺利开展;其次, 要把好数据库质量关。在数据管理方面应建立健全数据质量管理体系, 根据本单位的实际情况, 制定严格的数据质量考核指标, 责任到人, 并定期检查, 常抓不懈;第三, 要做到馆室共建, 应将计算机录入工作分散到该立档单位的内设机构。由内设机构负责归档文件的计算机录入, 档案室在接收归档文件的同时接收电子目录, 并奖其合并为本单位的档案目录数据库, 同时将重要的文件原文扫描, 进而向档案馆移交电子目录, 形成档案馆的电子档案目录中心。对于档案馆来说, 其主要是负责对各立档单位电子档案目录库的形成、积累、保管、整理的指导和监督;接收和转换各档案室移交的电子档案目录, 形成目录数据库;第四, 充分利用信息安全技术, 切实保障档案信息数据库的安全, 如配置防病毒卡和查杀系统并且要不断升级;设置密码、密钥、防火墙、身份验证、防写保护等等, 确保电子档案的安全。因此, 档案人员知识结构的变革迫在眉睫。档案人员要适应信息技术和档案事业的发展必须采取积极措施抓好知识更新, 引进、消化、适应信息技术发展的需要。可以肯定, 加快档案人员知识结构的变革, 多途径、多层次培养人才, 是档案工作迎接信息技术革命最根本的对策。

总之, 在信息社会之中, 电子文件是信息记录的主要形式。网络之中的电子文件数量十分巨大, 需要人们加以科学地管理, 才能便于人们的利用。

参考文献

[1]王苹.浅谈电子文件归档管理[J].航空标准化与质量, 2010 (1) :55-58.

上一篇:数据库管理系统下一篇:在体验中获得自主发展