浅论信息资源检索

2022-09-12

信息无处不在, 汉语中的“信息”一词, 信与息两字的意思相近, 前者侧重于消息、征兆, 后者强调情况、音讯。最早见于《三国志》中“正数欲来, 信息甚大”;而唐代诗人李中的《暮春怀故人》中也有诗句“梦断美人沉信息, 目穿长路倚楼台。”英文“Information”一词, 有情报、资料、消息、报道之意, 中国大陆曾译为情报或信息, 后经国家有关部门核准, 建议该词一律译成信息, 在中国台湾、香港地区, 该词被译为“资讯”。关于信息资源的定义, 从上个世纪以来国内外学者多有论述, 目尚无统一公认的定义。但一般倾向于认为信息是所有事物客观存在的方式及其运动状态的表现形式。

人类正是通过信息对自然界、人类社会及思维方式与运动规律的认识与概括, 再经过大脑思维重新组合成系统化了的信息, 也就是知识, 它被某种载体记录下来, 可以打破时空且被传递, 不断积累, 不断更新。信息资源是经过人类开发与组织的存储于载体 (包括人脑) 上的已知或未知的可被利用的信息的集合。信息资源的定义与信息的定义一样, 目前仍是众说纷纭, 其核心是对“信息”、“资源”二词的理解及对二词语法结构的理解不同, 是信息化的资源, 还是资源化的信息?还是信息、资源二词仅为同位语?一般说来, 信息与信息资源可视为同义语, 但在有些场合, 尤其是二词同时出现, 需要严格区别。在英文中, “信息资源”一词为单数“Information Resource”时是指信息本身, 当该词为复数时, 常指信息及与信息有关的设备、人员等的集合体。信息资源包括信息生产者、信息和信息技术三个基本要素。

1 信息资源类型

按照信息资源的开发程度来分, 可分为潜在的信息资源与现实信息资源两大类。

1.1 潜在的信息资源是指个人在认知和创

造过程中储存在大脑中的信息资源, 其特点是只能为个人所理解和利用, 无法为他人直接理解和利用;易于随忘却过程而消失。因此是一种没有表达出来的、有限再生的信息资源

1.2 现实的信息资源可分为以下几类

1.2.1 口语信息资源

以口头语言如交谈、聊天、授课、讨论等方式获得的信息资源。特点是传递迅速、互动性强, 但稍纵即逝, 久传易出差异, 不十分准确与可靠。

1.2.2 体语信息资源

以手势、表情、姿势如舞蹈、体育比赛、杂技等方式所传递的信息资源。如“千手观音”。其特点是直观性强、生动丰富, 极富感染力, 印象深刻, 往往起到“此时无声胜有声”的效果, 但此类信息的容量有限。

1.2.3 实物信息资源

以实物如文物、产品样本、模型、雕塑等形式表示的信息资源。如“秦始皇兵马俑”其特点是直观性强、信息量大, 但需要通过知识、智慧、经验和工具挖掘隐含的大量信息。

1.2.4 文献信息资源

以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息。文献是指记录有知识的一切载体。新版《辞海》:“记录有知识的一切载体的统称, 即用文字、图像、符号、声频、视频等手段以记录人类知识的各种载体。”特点是较为系统、准确、可靠, 便于保存与利用, 但也存在信息相对滞后的情况。

按文献的载体形式可分为:书写型、印刷型、缩微型、声像型、机读型。

按文献的出版形式可分为十种:图书、期刊文献、会议论文、科技报告、专利文献、学位论文、政府出版物、标准文献、产品样本、档案。

按文献的加工形式可分为:一次文献、二次文献、三次文献。

1.2.5 网络信息资源

以电子形式存储于世界上成千上万台计算机组成的网络中的信息资源。特点是信息量大, 传递迅速、内容更新快, 但大量的信息中重复交叉较多, 垃圾信息不少。

网络信息资源按组织与揭示方式或分为几种:自由文本组织方式、超维组织方式、FTP组织方式、主题树组织与揭示方式、计算机索引数据库组织与揭示方式。

2 信息资源检索

广义的信息资源检索概念应包括现两个方面:其一, 将分散的信息按一定的方式组织起来进行有序存储, 其二, 根据情报用户的需要从该信息集合中找出有用信息的过程。信息检索是从大量相关信息中利用人-机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。信息检索包含存储与检索两个部分。所谓存储是对有关信息进行选择、并对信息特征进行著录、标引和组织, 建立信息数据库;所谓检索则根据提问制定策略和表达式, 利用信息数据库。只有将大量无序的信息通过一定的方法使之有序化, 检索才有可能。因此从这个意义上讲, 信息存储是信息检索的逆过程, 两者是不可分割的一个某一主题文献的线索查找出来的检索。检索结果不需要具体、唯一的回答用户与提出的问题, 只需提供课题有关的参考文献线索, 即来源信息, 它是一种相关性检索。

事实/数据检索:将存储与数据库中关于某一事件发生的时间、地点、经过等情况查找出来, 或者是在数据库中根据需要查出可回答某一问题的数据的检索。事实或数据检索提供事实、数据等信息的原始资料, 这是一种直接的确定性检索。

2.1.2按组织方式分

全文检索:是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章节、段、句、词等的信息, 也可进行各种统计分析。例如, 它可以回答“《红楼梦》一书中‘林黛玉’一共出现多少次?”的问题。

超文本检索:是对每个结点中所存信息以及信息链构成的网络中的信息和检索。它强调中心结点之间的语义联接结构, 靠系统提供的复杂工具进行图示穿行和结点展示, 提供浏览式查询, 可以进行跨库检索。

超媒体检索:是对存储的文本、图像、声音等多种媒体信息的检索。它是多维存储结构, 有向的链接, 与超文本检索一样, 可以提供游览式查询和跨库检索。

摘要:本文讨论了信息以及信息资源的定义, 介绍了信息资源的类型与信息资源检索的类型。

关键词:信息,信息资源,信息资源检索

参考文献

[1] 许家梁.信息检索[M].北京:国防工业出版社, 2004.

[2] 肖珑.数字信息资源的检索与利用[M].北京:北京大学出版社, 2003.

[3] 王国良, 等.信息资源检索与利用[M].沈阳:兵器工业出版社, 2005.

[4] 王怀诗, 李平稳.信息素质及及其提高途径[J].图书与情报, 2004 (1) :12~14.

上一篇:糖尿病患者合并结直肠癌的危险性分析下一篇:胃十二指肠溃疡穿孔腹腔镜修补术34例分析