信息检索练习题

2024-06-09

信息检索练习题(精选6篇)

篇1:信息检索练习题

说明:

①要求认真审题,独立完成,试卷雷同者、抄袭者和被抄袭者均不得分!!②可先在电脑上做好后再打印出来,字体为宋体五号字,注意排版整洁清晰。

1、网络搜索引擎(如百度)检索题。

(1)请用搜索引擎检索“OPEC”的含义?并说明“OPEC”有多少个成员国。

答:石油输出国组织,即OPEC——Organization of Petroleum Exporting Countries,中文音译为欧佩克。成立于1960年9月14日,1962年11月6日欧佩克在联合国秘书处备案,成为正式的国际组织。其宗旨是协调和统一成员国的石油政策,维护各自的和共同的利益。现有12个成员国是:沙特阿拉伯、伊拉克、伊朗、科威特、阿拉伯联合酋长国、卡塔尔、利比亚、尼日利亚、阿尔及利亚、安哥拉、厄瓜多尔和委内瑞拉。

(2)使用网络搜索引擎,检索有关“信息检索”方面的doc、pdf、ppt格式的文献,请分别给出检索式。(关键词+检索命令)

答:信息检索 filetype:doc 信息检索 filetype:pdf 信息检索 filetype:ppt

2、数据库(CNKI)检索题。

(1)利用中国知识基础设施工程(CNKI)中的《中国学术期刊网络出版总库》查找钱令希先生发表的文章有多少篇?其中钱老以第一作者发表多少篇?请把作者是钱令希先生在《大连理工大学学报》上发表的文章用标准参考文献著录格式写出检索结果的题录信息。(格式为:[1] 作者,作者.篇名[J].刊名,年(期):页码)

答: 钱令希先生发表的文章有99篇,其中钱老以第一作者发表63篇。

[1]栾茂田,钱令希.层状饱和砂土振动孔隙水压力扩散与消散简化解法[J].大连理工大学学 报,1995,02:216-221.[2]钱令希.特征值问题的一个算法[J].大连理工大学学报,1999,02:180-182.[3]隋允康,钱令希.具有连续梁型式的结构优化设计[J].大连理工大学学报,1991,05:521-528.[4]吴承伟,钟万勰,钱令希,孙苏明.润滑力学中的参变量变分原理──一维单面边界速度滑移问题[J].大连理

工大学学报,1992,01:22-29.[5]钱令希,钟万勰,张洪武.饱和土壤固结非线性有限元分析[J].大连理工大学学报,1993,01:1-8+104.[6]王志必,邓可顺,钱令希.圆环载荷作用下球壳的极限分析及其实验验证[J].大连理工大学学

报,1993,S2:141-147.[7]钱令希.弹性力学新开篇[J].大连理工大学学报,1996,03:127.[8]钱令希,钟万勰,裘春航,吴高峰.罐体群结构和轴对称基础整体分析的广义位移方法[J].大连理工大学学 报,1989,06:621-628+696.[9]吕宪,钱令希,林家浩,钟万勰.动态超单元子结构方法及结构树部分周游策略[J].大连理工大学学

报,1990,01:23-30.[10]裘春航,吴高峯,钟万勰,钱令希.广义对称性海洋平台结构与轴对称基础耦合振动分析[J].大连理工大学学报,1991,03:261-266.[11]张洪武,钟万勰,钱令希.基于μ-U方程的饱和土壤固结分析[J].大连理工大学学报,1992,03:249-254.(2)利用中国知网CNKI数据库中的《中国学术期刊网络出版总库》的“专业检索”查找作者单位为“清华大学”,论文题目包含“成本”、“控制”或者包含“质量”、“控制”,请写出检索表达式,并列出检中文献3篇。任意打开其中一篇文章,查看全文,并复制其题名、作者、摘要、关键词等信息。答:intitle:(成本*控制)+(质量*控制)-学报 site:CNKI*中国学术期刊网络出版总库 [8]张建成,黄立培,吴速.电压源型电能质量控制技术研究[J].电力系统自动化,2004,04:45-48+91.[9]张鹏,崔勇,孙磊.移动自组织网络服务质量控制机制综述[J].计算机应用,2009,03:625-632+642.[10]徐路宁,张和明.产品设计阶段成本控制的相关对策[J].工业技术经济,2005,03:75-77.【题名】电压源型电能质量控制技术研究 【作者】 张建成; 黄立培; 吴速;

【Author】 Zhang Jiancheng, Huang Lipei, Wu Su(Tsinghua University, Beijing 100084, China)(North China Electric Power University, Baoding 071003, China)(Beijing Timegroup Corporation, Beijing 100085, China)【机构】 清华大学电机系; 北京时代集团 北京市 100084 华北电力大学电力系; 河北省 保定市 071003; 北京市 100084; 北京市 100085;

【摘要】 设计了应用于配电网的电压源型电能质量控制系统,该系统主要包括整流器、三相逆变器、控制器、电压电流检测电路等。研究了提高用户电压质量的电压无功控制规律,设计了抑制电压波动和闪变的控制系统,并分析了控制系统的稳定性以及控制作用与网侧阻抗的关系。给出了谐波电压模拟检测电路并对其幅频特性和相频特性进行了仿真计算。通过电能质量控制系统与电网间同步运行试验和谐波电压抑制试验,实现了逆变器与电网的同步运行控制以及负载谐波抑制控制。

【关键词】 电压源; 电能质量; 配电静止同步补偿器; 逆变器; 陷波器;

篇2:信息检索练习题

第一章

练习

一、名词解释

1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

二、填空题

1.信号只是信息的(),信息是信号所载荷的()。载体、内容 2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(),(),(),(),()。口语信息资源、体语信息资源、文献信息资源、实物信息资源、网络信息资源

3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(),如果有长期开发的价值,往往会转化成()。网络信息资源、文献信息资源 4.()是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。文献 5.期刊按内容和性质划分,可以分为(),(),()。学术性期刊、检索性期刊、其他类型期刊 6.()是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。零次文献

三、判断题

1.情报只是一类专门的信息,是信息的一个子集。()

2.网络信息资源也称虚拟信息资源,是指以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的。()

3.机读型文献是以磁性材料为存储介质,采用计算机技术、磁性存储技术、激光技术,以键盘输入、文件拷贝、刻录或光学扫描等方法作为记录手段,通过计算机处理而产生的一种新的文献。()

4.缩微型文献是以印刷型文献为母本,以感光材料为载体,采用光学缩微技术将文字或图像记录存储在感光材料上而形成的文献。()

5.声像型文献是一种以磁性和光学材料为载体,将声音和图像记录存储在磁性或光学材料上的非文字形式的文献。()

6.书写型文献是指印刷术发明以前的古代文献和当今尚未正式付印的文献,主要以手写和刻划的方式,将知识信息记录在各种自然材料和布帛,纸张等载体上的文献。()7.三次文献具有综合性高、汇集性、工具性、针对性强、系统性好、知识信息面广的特点,有较高的实际使用价值,能直接提供参考、借鉴和利用。()

第二章 练习

一、名词解释

1.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

2.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

3.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。

二、填空题

1.信息检索根据检索的目的和对象的不同,可分为()、()、()三种。数据检索、事实检索、文献检索 2.信息检索工具按存储内容划分有()、()、()和()检索工具。目录型、题录型、文摘型、全文型 3.信息检索工具按载体划分有()、()和()检索工具。印刷型、缩微型、电子型

4.主要的布尔逻辑关系符有三种:()、()、()。逻辑与、逻辑或、逻辑非

5.截词检索的截词符一般用()或()表示。

?、* 6.目前信息检索工具中经常使用的检索语言主要有()和()。分类检索语言、主题检索语言

三、判断题

1.广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要查找出特定信息的技术和过程。()

2.数据信息检索(Data Retrieval)是以特定的数值性数据为检索对象的信息检索,又称数值检索。()

3.事实信息检索(Fact Retrieval)是以文献中抽取的事项为检索内容的信息检索,又称事项检索,是利用参考工具书、数据库等从存贮事实的信息系统中查找出指定事实的一种信息检索。()

4.文献检索是以文献为检索对象的信息检索,利用相应的检索方式与手段,在存储文献的检索工具或数据库中,查找检索用户所需文献的过程。()5.我国的《全国报刊索引》、《中文社科报刊篇名数据库》、《人大复印报刊资料》(含数据库)和美国的《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)等著名印刷检索工具及其相应的数据库均属题录型检索系统。()

6.布尔逻辑检索是指通过标准的布尔逻辑关系符来表达检索词与检索词间逻辑关系的检索方法。()

7.信息检索是要获得特定的信息,检索的内容和目标愈明确,范围越具体,掌握的线索越多,查获信息的可能性就越大。()

第三章 练习

一、填空题

1.中国期刊全文数据库提供了初级检索、高级检索、专业检索、分类检索和期刊导航等5 种检索途径。登录中国期刊全文数据库检索系统后,系统默认的检索界面为()。初级检索界面

2.万方数据资源由()、()、()、()、()、()等六个子系统构成。数学化期刊子系统、科技信息子系统、商务信息子系统、学位论文子系统、会议论文子系统和国家法律法规全文数据库子系统 3.“中文科技期刊全文数据库”以()和()的方式提供文献信息服务。光盘版、网络版

二、判断题

1.CNKI从1999年开始实施,由清华大学光盘国家工程研究中心、清华同方光盘股份有限公司和中国学术期刊(光盘版)电子杂志社联合立项。()2.万方数据资源系统是由万方数据股份有限公司建立的国内大规模的综合信息数据库系统,目前拥有近120个数据库,信息资源丰富,涉及期刊报纸、学位论文、会议论文、法律法规、成果专利、标准、企业、产品等各种文献。()3.“中文科技期刊数据库”(简称中刊库)由国家科技部西南信息中心重庆维普资迅有限公司研制,收录了1989年以来国内出版发行的12000余种期刊,核心期刊1800多种,基本覆盖了国内公开出版的具有学术价值的科技期刊。()

第四章 练习

一、名词解释

1.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库。

二、填空题

1.参考数据库主要包括()、()和()。书目数据库、文摘数据库、索引数据库

2.SCI是()的缩写,文献主要来源于(),还有少量的专著、会议录、书评、科技报告和专利文献。科学引文索引、期刊

3.Web of Science是大型综合性、多学科、核心期刊引文索引数据库,它包含了三大引文数据库()、()和()。科学引文索引、社会科学引文索引、艺术与人文科学引文索引

4.EI是()的缩写,90%的文献语种是()。工程索引、英语 5.EI收录期刊的三个档次为()、()、()。全选期刊、选收期刊、扩充期刊

三、判断题

1.SCI创刊于1961年,由美国科学技术信息研究所(Institute For Scientific Information,简称ISI)编辑出版。()

2.EI是世界上著名的工程技术综合性检索工具,创刊于1884年,由美国工程信息公司(Engineering Information Inc.)编辑出版,是获取工程技术类信息的最权威检索工具。()3.“中文科技期刊数据库”(简称中刊库)由国家科技部西南信息中心重庆维普资迅有限公司研制,收录了1989年以来国内出版发行的12000余种期刊,核心期刊1800多种,基本覆盖了国内公开出版的具有学术价值的科技期刊。()

第六章 练习

一、名词解释

1.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

2.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

3.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

二、填空题 1.()是专利制度的产物,反过来说又是专利制度的重要基础。专利文献 2.中国专利说明书包括以下几种类型:(),(),(),()。发明专利申请公开说明书、发明专利说明书、实用新型专利说明书、外观设计专利说明书 3.()(IPC)是目前惟一国际通用的专利文献分类和检索工具,为世界各国所必备。国际专利分类法

4.IPC将全部科学技术领域分为()个部。8

5.会议文献是指通过召开学术会议而产生的文献,包括()、()和()等三种。会前文献、会中文献、会后文献 6.会议文献的出版形式有很多,通常有以下几种:()、()、()、()。图书、期刊、科技报告、在线会议 7.按照多数国家的学位制度,学位论文包括()、()和()三种类型。学士学位论文、硕士学位论文、博士学位论文 8.各个国家都有自己的科技报告,最著名的是美国政府四大科技报告:(),(),(),()。AD报告、PB报告、DOE报告、NASA报告 9.()是对工农业产品和工程建设的质量、规格、检验方法、包装方法及贮运方法等方面所制定的技术规格。标准

三、判断题

1.特种文献的刊期不规律、印刷数量小、信息量大、不拘一格、形式多样,通过非正式渠道发行,流通面窄但内容丰富,往往包含着当前国内外工程技术、政治经济以及社会诸多领域的最新科研成果或最新学术动态的信息。()

2.由于特种文献出版形式不固定,出版时差大,信息内容具有保密性和隐蔽性,科研人员获取特种文献的难度很大。()

3.据统计,在人类所研发的新技术中,97%在专利文献中均有记载。()4.据统计,专利文献对发明成果的报导,往往早于其他科技文献。()

5.专利文献既是一种技术性文件,同时又是一种法律性文件,需按专利法的有关规定撰写。()

6.会议文献是了解各国科技水平动态、跟踪和预测科技的发展趋势、进行情报分析和情报研究的重要参考资料,是传递科技情报、交流科技成果与经验方面的重要科技情报源之一。()7.会议文献通过会议形式的交流可以最早在同行们中迅速传播,一般比在期刊上发表的论文 4 要早一年。()

8.学位论文是经过专业导师指导,由有一定权威的同行专家、学者审查的原始研究成果,是具有一定独创性的一次文献。()

9.方法标准指为一些通用的试验方法、检验方法、分析方法、抽样方法等制定的标准。()

10.经济管理标准主要是指工资标准、价格标准、利率标准等。()11.组织管理标准主要是指生产能力标准、资源消费标准、组织方式标准。()

第七章 练习

一、名词解释

1.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。2.电子报纸——多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

二、填空题

1.电子图书是()和()发展的产物。多媒体技术、超文本技术

3.目前,我国多家专门从事制作电子图书的商业机构,如()、()、()等以及一些专门出版网络电子图书的出版商如博库公司等都算得上是我国电子图书事业的先驱。超星图书公司、北大方正、书生之家 4.按制作与出版形式分类,电子图书可分()电子图书和()电子图书两类。数据库式、原生 5.目前,电子报纸主要有()、()、()和()等4种类型。网络版电子报纸、光盘版电子报纸(数据库)、手机版电子报纸、便携式电子报纸

三、判断题

1.按载体划分,电子图书可分光盘电子图书、网络电子图书和便携式电子图书三种。()2.超星电子图书数据采用PDG格式,首次检索,需先下载并安装最新版本的“超星阅读器”(SSreader)才能阅读图书全文。()

3.人民日报社的“人民网”是纸质报纸在网上设立独立的网站。()4.网上的“福建新闻中心”是组合了《福建工商报》、《东南电视台》等多家媒体的一个信息网络。()

5.网络版报纸的早期形态,如《羊城晚报》、《南方日报》、《科技日报》等在因特网上有独立的域名,是纸质报纸的电子版。()

第八章 练习

一、名词解释

1.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。2.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的出版物。

3.手册——是汇集某一方面经常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

4.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

二、填空题

1.事实和数据的检索是一种能提供具体答案的()。确定性检索 2.在数据库兴起之前,人们要解决事实与数据的查找问题主要是依靠(),而随着计算机技术以及互联网的蓬勃发展,()以及()已经成为人们解决该类问题的首选途径。参考工具书、事实与数值型数据库、网络资源

3.()是汇集语言里的词语,主要解释词语的概念、意义及其用法,并按照一定的方法编排,以便查阅的工具书。词典

4.荟萃人类一切知识门类或某一学科知识的完备的工具书称为()。百科全书

三、判断题 1.《美国百科全书》虽为国际版,但内容仍偏重于美国和加拿大的历史、人物和地理资料;人物条目和科技内容条目篇幅较大。()2.《不列颠百科全书》又称《大英百科全书》被公认为当今世界上最知名也是最权威的百科全书,同时,也是连续刊行时间最长、影响最大的综合性英文百科全书。()3.《科利尔百科全书》的方针是要成为一部适合于非专业人员、青年学生、家庭使用和阅读的百科全书。()4.《中国大百科全书》按学科分卷陆续出版,内容突出中国,并注重第三世界,自然科学和工程技术方面的内容所占比重较大,达到50%以上。()5.进入网络时代,很多著名的百科全书都推出了网络版。()6.维基百科全书是一部用不同语言写成的百科全书。()

7.网络上有很多字典、翻译资源,很多著名搜索引擎网站也增设了语言工具。()

第九章 练习

一、名词解释

1.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

二、填空题 1.()是通过计算机网络可以利用的各种信息资源的总和。网络信息资源 2.根据信息来源的不同,人们将Internet信息资源分为()、()、()三类信息资源。政府、公众、商用 3.根据信息资源利用的性质,人们将Internet信息资源分为()、()、()三类信息资源。开放式信息、注册信息、交流式信息 4.()与()是网络环境下文献资源组织方式的主流。数据库方式、超媒体方式

5.一般地,人们从()和()两个方面对Internet信息检索 方式进行分类。检索策略、检索工具

6.从广义上讲,搜索引擎应包括两部分:一是(),二是()。对信息的采集、存储和组织、信息检索

7.搜索引擎按其工作方式和原理的不同,主要可分为三种,分别是()、()和()。全文搜索引擎、目录索引类搜索引擎、元搜索引擎

三、判断题

1.KI中全文数据库的检索使用。

9.我们经常用搜索引擎查找资料,请说明全文搜索引擎的工作原理。10.如何调整检索策略,使从搜索引擎中得到的结果较为准确?

11.学术论文的撰写一般包含哪些流程。12.简述学位论文的结构和写作规范。

篇3:信息检索概述

(一) 信息检索的定义及基本原理

信息检索 (Information Retrieval) 是指将信息按照一定的方式组织和存储起来, 并根据用户的需要找出相关信息的过程。它包括两个部分:1.存储:将大量分散无序的信息集中起来, 经过加工整理, 使之有序化、系统化, 成为可以查询使用的信息集合。2.检索:借助于查询语言, 将所需要的信息从集合中查找出来。这是广义的信息检索, 狭义的信息检索仅指第3部分, 即从信息集合中找出所需信息的过程。

从本质上讲, 信息检索就是对信息集合与需求集合的匹配与选择。从图2-1的原理图我们可以看到, 要实现匹配与选择, 首先要对信息集合进行特征化表示, 即通过人工或计算机的方法对信息集合进行加工处理, 将原来隐含的、不易识别的特征显性化。这种加工处理工作被称为内容分析与标引, 其中, 用来表示文档特征的词条被称为标引词。另一方面, 在检索时, 也要对用户所提出的信息需求进行分析, 提取概念或属性, 并利用与标引过程相同的标识系统 (检索语言) 来表达需求中所包含的概念和属性, 然后通过匹配和选择机制, 对需求集合与信息集合进行相似性比较, 最后根据一定的标准选出符合需要的信息。

(二) 经典信息检索模型

信息检索的三个经典模型分别是:布尔模型、向量模型和概率模型。在布尔模型中, 文献和查询用标引词集合来表示, 因此, 称布尔模型为集合论模型;在向量模型中, 文献和查询用t维空间的向量来表示, 则称该模型是代数模型;在概率模型中, 用于构建文献和查询模型的机制是基于概率论的, 则称该模型是概率模型。

在过去几年中, 人们已经为每一种经典模型提出了各种不同的改进模型。在基于集合理论的模型中, 又提出了模糊集合理论模型和扩展布尔模型;对于代数模型, 衍生出了广义向量模型、潜在语义标引模型和神经网络模型;概率模型中的一个主流学派就是基于贝叶斯网络的信息检索模型。本文将简要地讨论三个经典信息检索模型。

1. 布尔模型

布尔检索模型的理论经过多年的发展已基本成熟, 被过去甚至现在许多检索系统采用。布尔检索模型表达提问的方式与人们的思维方式相近, 很多人习惯采用这种模式进行检索。传统布尔逻辑检索模型最显著的特点是将用户查询与文献标引进行逻辑的、非数值的比较而获得检索结果, 查询结果一般不进行相关性排序。

对布尔模型而言, 标引词权重变量都是二值的0或1, 查询q是一个常规布尔表达式。用qdnf表示查询q的析取范式, qcc表示qdnf的任意析取分量, 文献d j和查询q的相似度可定义为:

如果Sim (d j, q) =1, 则布尔模型表示文献dj与查询q相关 (实际上是被检索到, 是否相关需要进一步判断) , 否则文献与查询不相关。布尔模型只是判断文献要么相关、要么不相关, 无法描述与查询条件部分匹配的情况。

2. 向量空间模型

向量模型认为用二值权重存在着太多局限, 并提出一种框架以便能够进行部分匹配, 即通过给查询和文献中的标引词分配非二值权重来实现这个目标。这些词语的权重用于计算存储系统中文档和用户查询的相似度, 向量模型依据相似度值将检出文献以递减顺序返回。

在向量模型中, wij是一个正的非二值数, 用以表示索引术语ki在文档dj中的权重。wiq也是一个正的非二值数, 用以表示索引术语ki在查询中的权重。查询向量qv表示为, 文档dj的向量可以表示为, 即查询q和文档dj均可由t维向量表示。我们用文档向量udjv和查询向量qv之间的相似性来评价文档和查询的相似程度。这种关系可以定量表示, 一般用这两个向量间夹角的余弦值来计算, 即:

令N表示系统中的文献总数, in表示包含标引词ki的文献总数, freqij表示术语ki在文献dj中出现的次数。则文献dj中术语ki的标准化频率tfij为:

其中maxlfreqlj为文献dj中出现次数最多的标引词kl出现的次数。此外, 术语ki的逆文献频率为:

运用公式 (3) 及公式 (4) 可得wij的计算方法如下:

事实上, wij有多种计算方法, 上式是最著名的术语加权方案。对于查询术语的权值, Salton和Buckley指出可以采用如下方法计算:

其中freqiq为术语ki在查询q中出现的次数, maxlfreqlq为查询q中出现次数最多的术语kl出现的次数。很多时候, 查询中术语出现的次数是相等的, 均为1, 这种情况下, 公式 (6) 可改写为:。

3. 概率模型

概率模型多建立在相关性理论基础上, 基于对相关性的不同理解, 建立了不同的概率检索模型, 并由此导致不同的排序输出原则。可以说, 相关性原理和排序原理是概率检索模型的理论核心。

对于概率模型而言, 术语权重都是二值的, 即, 查询q是概念空间U的一个子集, 用R表示已知的相关文献 (或最初的猜测集) , 用表示R的补集, 即不相关文献集, 条件概率P (R|dj) 表示文献dj和查询q相关的概率, 表示文献dj与查询q不相关的概率, 则文献dj与查询q的相似度可以定义为:

根据条件概率:

P (dj|R) 表示从相关文献集R中随机选择文献dj的概率, P (R) 表示从整个文献集中随机选择的文献是相关文献的概率;表示从补集中选择文献dj的概率, 表示从整个文献集中随机选择一篇文献是不相关的概率。

因为对文献集的所有文献来说, P (R) 和都是一样的, 所以公式 (8) 可以写成:

(三) 经典模型的简单比较

从上面对三种经典信息检索模型的介绍可以看出:布尔检索模型是一种基于逻辑判断的检索模型, 不能实现部分匹配, 而后两种检索模型则都是把检索问题归结为一种数值比较, 以实现部分匹配。

概率检索模型与向量检索模型在对文献的表示方面, 都是用一系列标引词及其权值的组合来表达。不同之处在于概率检索模型的权值是自动标引时标引词在文献中出现的概率, 而在向量空间检索模型中, 所谓的权值是标引词反映主题的程度, 其中一种常见的方案就是用词在文献中发生的频率来计算, 因而二者又达到了统一。另外, 二者的用户查询也是以一组词及其权值组合而成, 只不过向量空间模型把它作为向量处理而已。最后, 在文献—查询匹配中, 概率模型是计算权值和;而向量空间模型则是依据相似系数。最后的检索结果都代表用户对检索文献的满意程度的一系列数据, 用户可通过设置阈值来控制。

由此看来, 在一定程度上可以把概率检索模型视为向量检索模型。因为概率检索模型都是在假设系统有反馈信息基础上, 并能做出正确的参数估计。在没有反馈信息时, 概率检索模型可视为向量空间模型, 是它的扩充。

参考文献

[1]Ricardo Baeza-Yates, Berthier Ribeiro-Neto.现代信息检索[J].北京:机械工业出版, 2005:24-42.

[2]孙登峰.XML文档信息检索技术的研究与实现[C].北京:国防科学技术大学硕士学位论文, 2002:11-15.

[3]杭月芹.基于文档查询信息的检索系统研究与实现[C].江苏:扬州大学硕士学位论文, 2004:11-15.

篇4:浅析网络信息检索

【关键词】网络信息;检索

随着信息技术的高速发展,信息资源的越来越显得重要,而网络信息资源也逐步成为这个信息时代的核心资源。信息检索技术也很快得到发展,在此网络信息检索随着网络的发展也应运而生。网络信息检索,就是将描述特定用户所需网络信息的提问特征,与信息储存的检索标识进行异同比较,从中找出与提问一致或基本一致的网络信息的过程。相对传统文献检索,网络信息检索显现出了很多的优越性,如不受时间地点的限制,检索方式多样化,多元化等。但是我觉得网络信息检索的发展还不是十分完善,仍存在些问题,如目前检索工具在信息搜集缺乏统一的规范管理,检索过程会出现很多雷同,甚至无用的垃圾信息等。以下从网络信息检索目前存在的问题,及针对问题面临的以后的发展方向进行了探讨。

随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求等烦琐操作,基于网络检索工具的检索工具产生了。

目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业搜索引擎集成链接,深受特定用户群欢迎。如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家” “网际瑞士军刀”等。

另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前国内现在还没有见到真正意义上的元搜索引擎。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。目前元搜索引擎技术主要有并行处理式和串行处理式两大类。并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。

从第一个元搜索引擎Metacrawler诞生至今,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。由于元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约,元搜索引擎比较理想的并不多见。信息检索专家邢志宇将元搜索引擎存在的问题归纳如下:(1)大多元搜索引擎不支持多语种,尤其是汉语检索;(2)一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;(3)部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;(4)大部分元搜索引擎仅支持调用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。

Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。我觉得未来网络信息检索技术的发展方向如下:

1.智能化

现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。

2.标准化

现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。

3.个性化

科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。

篇5:信息检索复习题

1.检索技术 布尔逻辑检索 三种运算符:

逻辑“与”(用AND或“*”表示),可以缩小检索范围; 逻辑“或”(用OR或“+”表示),可以扩大检索范围; 逻辑“非”(用NOT或“—”表示),可以缩小检索范围。

(1)布尔逻辑表达式:在职人员NOT(青年AND教师)的检索结果是(A)。A.检索出除了青年教师以外的在职人员的数据 B.青年教师的数据

C.青年教师和在职人员的数据 D.在职人员的数据

(2)检索“唐宋诗歌”的有关信息,正确的检索表达式是(A)。A.(唐OR宋)AND诗歌 B.唐AND宋AND诗歌 C.唐OR宋OR诗歌 D.唐AND宋OR诗歌

(3)为了提高查全率,往往通过采用(B)。A.提高检索词的专指度 B.多用截词符 C.增加使用逻辑“与” D.减少逻辑“或”

写出检索表达式:

(1)检索钱伟长在清华大学时发表的文章;

作者=钱伟长and单位=清华大学;

(2)检索钱伟长在清华大学时发表的题名或摘要中包含"物理"的文章。

作者=钱伟长and单位=清华大学and(题名=物理or摘要=物理)。

 位置检索

掌握DIALOG检索系统的位置算符的用法意义。

(1)对end(w)laster哪个执行结果是正确的(B)。

A.end AND laster B.end laster C.laster end D.laster AND end

(2)美国DIALOG检索系统的位置算符中,(C)表示其两侧的检索词必须是在文献记录的同一个字段中,而它们在该字段中的相对次序和相对位置的距离不限。

A.(S)B.(W)C.(F)D.(N)

 截词检索:掌握几种截词方式。截词符具有“OR”运算符的功能,能够扩大检索范围。 字段检索

基本索引字段:篇名、文摘、叙词、自由标引词四个字段。辅助索引字段:除基本索引字段以外的所有字段。

(1)下列字段属于基本索引字段的是(C)。

A.著者字段 B.文献类型字段 C.文摘字段 D.语种字段

 常用的检索方法有:工具法、追溯法和循环法。(1)针对研究课题处于兴旺时期的一段时间文献信息进行查找文献的方法是(C)。

A.顺查法 B.倒查法 C.抽查法 D.追溯法

(2)利用已知文献的引用文献或参考文献为线索,由近及远,进行逐一追踪的查找文献的方法是(D)。

A.顺查法 B.倒查法 C.抽查法 D.追溯法

 检索步骤:

(1)分析研究课题;(2)选定检索工具;(3)确定检索方案;(4)进行具体查找;

(5)提供文献线索、查阅原始文献。

 检索效果:查全率和查准率。(1)(A)是检出的相关文献与检出的全部文献的百分比。A.查准率 B.查全率 C.误检率 D.漏检率

 检索语言是根据信息检索的需要而创制的人工语言。 检索语言由词汇和语法组成。

 检索语言按其结构原理,可分为体系分类检索语言和主题检索语言。

(1)利用分类途径进行检索,其检索标识为(C)。A.主题词 B.关键词 C.分类号 D.分子式

(D)是按照文献内容的学科体系,根据图书馆采用的分类法组织而成的目录。

A.主题目录 B.题名目录 C.责任者目录 D.分类目录

(2)分类号位数每增加一位,则(B)。

A.分类级别更高一级 B.分类级别更低一级 C.分类级别不受到影响 D.以上不对(3)(D)属于表述文献内容特征的检索语言。A.篇名 B.文献代码 C.引文 D.关键词

 信息、知识、情报和文献的定义以及四者之间的关系。

 信息的特点包括:普遍性、传递性、多样性、时效性和共享性。 文献的主要作用是存储、传播、交流知识和信息。 文献由四个要素组成:所记录的知识、记录知识的符号、用于记录知识的物质载体、记录的方式或手段。

 文献的半衰期:是指某学科领域目前尚在使用的全部文献中,较新的一半所出版的年限。

 文献的载体类型:印刷型、缩微型、声像型、机读型。

 检索工具在检索过程中有两个方面的作用,一是存储,二是查找。 一次文献、二次文献、三次文献的含义、特征以及相互关系。

(1)三次文献是一次文献的浓缩,是对众多文献分析、综合归纳、整理而形成的。

 下列哪种文献属于一次文献(A)

A、期刊论文 B、百科全书 C、综述 D、文摘

(2)下列的文献信息的划分是按其加工程度划分的是(C)。A.图书 B.网络文本 C.二次文献 D.报刊

 专利审查方式:形式审查制、实质审查制、延迟审查制。

(1)在对发明专利申请的审查方式上,目前我国采用(C)。A.形式审查制 B.实质审查制 C.延迟审查制 D.以上三种制度交叉使用

(2)无论是国际标准还是各国标准,在编号方式上均遵循各自规定的一种固定格式,通常为(D)。

A.年代号+流水号+标准代号

B.流水号+标准代号+年代号 C.流水号+年代号+标准代号 D.标准代号+流水号+年代号

 如何缩小检索范围:(1)增加其他关键词进行二次检索;(2)增加其他检索入口进行组合检索;(3)运用逻辑非排除一些无用的结果;(4)运用位置算符修饰检索词。

 圣典E-BOOK电子图书的检索方式。

(1)分类导航。根据学科分类和中图法分类将电子图书分成两种不同的排列顺序,读者可根据个人的阅读习惯选择不同的分类法查找所需的图书。(2)简单检索。简单检索提供了书名、作者、出版社、出版日期、关键词、ISBN等多种单项模糊查询。

(3)高级检索。高级检索提供了书名、作者、出版社、出版日期、ISBN等多项复合查询。

 在万方数据资源系统的《中国学位论文全文数据库》中,检索标题含有“电机”并且全文含有“汽车”的记录,请写出检索步骤。

(1)选择数据库:进入相应栏目资源总览区,选取《中国学位论文全文数据库》(2)确定第一个关键词的检索方式,在数据库检索提问表单的第一个字段选择下拉列表框右侧单击下三角按钮,选择“论文标题”选项(3)输入第一个检索关键词,在数据库检索提问表单的第一个查询关键字文本框中输入关键词“电机”(4)确定词间关系,在逻辑运算选择下拉列表框中选择“与”(5)确定第二个关键词的检索方式,在第二个检索字段选择下拉列表框中选择“关键词”选项(6)输入第二个检索关键词:在数据库检索提问表单的第二个查询关键字文本框中输入关键词“汽车”(7)执行检索,单击“检索”按钮。

 参考工具书与一般图书的区别。 参考工具书与检索工具书的区别。 参考工具书按收录内容和功用可分为:百科全书、年鉴、字典、词典名录、手册、图表册等。

 搜索引擎的工作过程可分为:信息搜集、信息处理、信息查询。

篇6:信息检索复习题答案

1)有一定的政治倾向性

2)文献类型以专著和论文为主

3)有地区的或民族的特点

4)积累性,继承性强,具有较长的效用性

5)面广量大,相互交叉

2.人类社会信息交流的发展阶段。

人类社会信息交流的发展以所采用的交流媒介的发展为标记,经历了语言交流时代、文字交流时代、印刷交流时代、电子交流时代和网络交流时代五个阶段。

1.语言交流时代

语言是人类信息交流的主导媒介,语言使得思想得以表达和传承,智慧得以积累。

2.文字交流时代

文字的发明是人类文明的丰碑。由于有了文字,人们可以将有价值的信息记录下来,形成信息的体外载体,从而能够越过语言交流的时空障碍进行信息交流。

3.印刷交流时代

印刷术的重要性在于使得知识和思想的传播扩散范围更为广泛、速度更快、成本更低

4.电子交流时代

在电子交流时代,运用电磁波技术和电子传输技术进行文字、声音和图像信息的传播,人类的信息交流出现了同步特征。

5.网络交流时代

网络交流时代实现了信息共享和信息交流的全球化。

3.信息交流的功能。

1)信息交流对社会文化结构的影响 “信息交流是社会的黏结剂” – 维纳 人类文化的基本

结构包括了物质、精神和社会组织三部分。信息交流保持了各个部分的协调结合,形成一个整体,使人类文化得以持续发展。

2)信息交流对个体的影响

信息交流对个体有社会生活功能、心理功能和社会心理功能的影响。

3)信息交流的社会功能

施拉姆认为,在社会功能方面信息交流具有三个重要的功能: ①政治功能②经济功能③一般社会功能

联合国教科文组织:从信息交流的广泛意义上看,它具备的功能包括: ①获得信息②社会化③动力④辩论和讨论⑤教育⑥发展文化⑦娱乐⑧一体化

4.影响信息交流的因素有哪些?

一.社会因素

1.政治因素2.军事因素3.法规因素4.经济因素5.科技因素6.文化因素7.教育因素

二.语言文字因素

1.自然语言因素2.专业术语因素3.检索语言障碍

三.交流过程因素

1.发生的障碍

(1)信息时滞(2)语言的转化(3)形式化(4)干扰

2.传递的障碍

(1)信道容量(2)传输过程干扰(3)信息还原(4)信息时滞。(5)传递方式。

3.接收的障碍

(1)接收需求(2)接收能力

四.信息安全因素

1.信息污染2.信息泄密3.信息破坏4.信息侵权5.信息侵略

5.网络信息行为的影响因素有哪些?

个人的特质、人际关系和环境因素。

个人的特质包括人口特征、人格特征和认知形态三个方面。

6.现代文献的构成要素?

现代文献由四要素构成:文献信息、文献载体、符号系统和记录方式。文献信息是文献的内容,符号系统是信息的携带者,载体是符号赖以依附的“寄主”,而记录方式则是代表文献的符号进入载体的方法和过程,四要素缺一不可。

1.文献信息

文献所传递的信息是人对客观世界的反映,因而不一定完全符合真实内容。

2.符号系统

文献中的符号系统是指图画、文字、公式、图表、编码、声像和电磁信息等。

3.记录方式

文献记录方式是指将表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。

4.文献载体

文献载体必须适应于文献符号和相应的记录方式,同时又要有利于传播、整理和长期保存。

7.文献的主要类型有哪些?(分别依据载体、加工程度和文献类型划分)

1.载体形式----手写文献、纸质文献、缩微文献、视听资料、电子文献

2.出版形式----专著、报纸、期刊、专利文献、标准文献、会议文献、产品样本、档案资料、“灰色”文献和各种工具书.3.加工层次----一次文献、二次文献和三次文献

8.什么是检索工具?如何评价和鉴别检索工具?

①定义:检索工具是用于存储,查找和报道档案信息的系统化文字描述工具,是目录,索引,指南等的统称。

② 检索工具的鉴别与评价.信息收录范围与信息质量

信息收录范围是指工具中信息覆盖的学科面、信息类型及数量。信息质量是信息水平层次、真实性和准确性的集合。.著录的详略

文献信息的特征包括外表特征和内容特征。工具对文献信息特征著录或描述的详略程度决定了使用效果。.著录、标引的质量

著录、标引的质量主要体现在著录项目是否完全、内容的标引深度、著录和标引的准确性以及标准化等方面。.信息报道的时效

信息报道时效主要通过报道时差来反映。报道时差是指从原始信息发布到工具报道时间间隔。.检索功能

检索功能包括检索操作的简易程度、检索途径的多少、以及检索效果好坏。

6.另外可读性,权威性可作为参考型工具选择的辅助指标,而网络的速度和检索费用是机检工具选择必须考虑的因素。

9.分析网络用户信息行为状态。(检索、浏览、交互、选择)

10.ELIS行为的影响因素。

ELIS模型强调,信息寻求行为受情境和个人生活习惯的影响。

(1)资本

影响生活方式和生活支配的因素主要有:经济资本、社会资本、文化或认知资本等因素。

(2)目前的生活状况

行动因情境而产生,情境影响着人对信息的定义及使用。区分社会阶层差异的指标包括职业、收入、教育程度和说话方式等。但在同一阶层中,各成员之间存在一定的差异。

(3)价值和态度

不同的价值观和生活态度影响着个人的信息查询行为。

11.信息交流对个体的影响。

信息交流对个体有社会生活功能、心理功能和社会心理功能的影响。

1)社会生活功能:主要指传达信息的功能。通过符号,人与人之间交流信息、知识、经验、思想、情感,是群体之间共同生活的需要。

2)心理功能:人类进行信息交流活动的同时体现的也是心理的需要。研究表明,缺乏信息

交流的环境会使人产生强烈的痛苦和神经失调。在持续一段时间不能接受信息、无法与人交流的情况下,人的思维过程明显受到扰乱,智力测验水平严重下降。认知心理学也认为,信息是人类思维的原料,人的思维就是进行信息的加工。

3)社会心理功能:符号相互作用理论认为,个性是在同其他人的互相作用中形成的,而这

一过程的机制是以周围的人们对自己的要求来控制自己的行为的。社会和群体的生活由社会成员的协同作用来维持,这种协同需要通过符号的相互作用来建立。社会与个人通过符号相互作用互相影响、互相制约。

12.世界著名的百科全书有哪些?

1.《中国大百科全书》

2.《不列颠百科全书》

3.《新不列颠百科全书》

4.《美国百科全书》

5.《科利尔百科全书》

6.《世界图书百科全书》

7.《康普顿百科全书》

8.《优等生百科全书》

9.《国际社会科学百科全书》

10.《麦克劳﹒希尔科技百科全书》

13.信息贫困理论。

14.简述信息检索和利用的主要步骤

(一)分析问题

(二)选择检索工具

(三)确定检索入口

(四)获取原文

15.举例说明检索性工具书类型与作用

检索工具书是人们用以报道、存储和查找文献信息的工具,它一般是二次文献。主要有目录、索引、文摘等。

(一)目录

目录的主要功能,①是学术参考功能,它是一个时期或一定范围学术的总结和概括,能反映某一时期某一学科的面貌;②是情报功能,是报导科技动态、最新研究成果、提供文献线索的重要工具 ③是教育功能,主要表现在指导读书治学,普及科学文化知识进行知识教育等方面。

(二)索引

索引是将报刊书籍中某些重要的或者有意义的信息,如书名、刊名、篇名、主题、人名、地名等分别择录出来,按一定方式编排,并注明出处,以供检索的工具。索引的主要功能是提供文献线索,其检索文献速度快,反映问题深入。

(三)文摘

文摘是指对一份文献的内容所做的简略、准确的描述,通常不包含对原文的补充、解释或评论。

文摘的作用

(1)通报最新科学文献。(2)节省阅读时间。(3)引导检索原文。(4)克服语言障碍。

16.举例说明参考性工具书类型与作用

1字典和词典:字典是汇集单字,注明其字形,读音,意义和用法;词典主要是解释词的概念,意义和用法。

2年鉴和手册:年鉴的作用是向人们提供一年内全面,系统的事实资料,便于了解事物现状和研究发展趋势。手册的作用是提供相对成熟确定的事实和数据,便于查找。

3名录和表谱:名录的作用是汇集机构名,人名,地名等专名的基本情况资料,方便有特点对象的事业的进行。表谱的作用是将纷繁复杂的历史人物,时间,年代用简明的表格,谱系等形式表现出来。

4百科全书 :百科全书的作用是把人类积累的科学文化知识荟萃在一起,系统简要的加以阐述。

5类书、政书,传记资料和政府出版物

17.按照加工的程度来划分,文献信息源有哪几种主要的类型?各有什么特点?

1一次文献:是人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大,由于在内容上是分散的、无系统的,因此不便于管理和传播。

2二次文献:二次文献不是一次文献本身的汇集,而是一次文献特征的汇集,通过它们可以很方便地找到一次文献,或了解一次文献的内容。

3三次文献

三次文献具有系统性、综合性、知识性和概括性的特点,它从一次文献中汲取重要内容

提供给人们,便于他们高效率地了解某一领域的状况、动态、发展趋势和有关情况。因此,要在浩瀚的一次文献中查找所需资料,往往离不开二次和三次文献。

18.简述科技报告的主要类型。

科技报告指对科学技术研究结果的报告或研究进展的记录。

科技报告的类型:

(1)内容----基础理论、工程技术.(2)储存------报告书、技术札记、论文、备忘录、通报、技术译文等。

(3)进展程度----①初步报告②进展报告③中间报告④终结报告

(4)流通范围----①绝密报告②机密报告③秘密报告④非密报告⑤解密报告

19.分析新型工具书对传统工具书的影响(从介质、组织方式、内容、功能几方面)。

1)介质方面:工具书产生了光盘版,网络版,电子书,数据库。

2)组织方式:非线性文本结构,超文本链接,检索功能增强。

3)内容:增值服务,相关参考,外部链接,多媒体展示。

4)功能:附加功能,专家服务,论坛,网络书店,课程辅导,智力测试,邮件列表,今

日新闻,推荐站点。

20.说明数字图书馆与传统图书馆的联系与区别。

传统图书馆是把实体文献进行组织发布的机构,文献有各种载体,需要读者入馆才能得到服务。

数字图书馆是把各种载体的文献所记载的内容数字化,然后进行组织发布,通过网络传播,利用计算机使用。

联系:

1)传统图书馆及其馆藏文献资源是数字图书馆形成的基础,而数字图书馆的形成拓展了传

统图书馆的服务空间。数字图书馆的出现弥补了传统图书馆在信息资源贮存、传播,提供方面的不足,其所拥有的数字化文献和所提供的数字化服务是对传统图书馆工作内容的补充和延伸,是传统图书馆服务功能在网络环境下的发展。

2)数字图书馆和传统图书馆之间是继承的关系,是对传统图书馆的发展。

3)将来很长一段时间的图书馆形态既不是纯数字图书馆,也非纯传统图书馆,而是二者相

互渗透的一种新型图书馆——复合图书馆。

区别:

1)数字图书馆只能提供文献内容知识,而传统图书馆除了提供文献内容知识之外,还能根

据文献载体,比如纸张、胶片等研究当时的技术水平,版本等问题。

2)目前情况下数字图书馆所提供的文献内容在处理图表的时候(尤其是扫描的大幅图表)

使用起来不如纸质图书、地图,比如我们看到的百度、谷歌地图,会受到计算机屏幕大小限制,而挂图就没关系,另外对于一些设计图书等,扫描的不如纸张的,可以用尺子去测量(直观性差)。

3)传统图书馆是一个个单体,而数字图书馆是个集合,是无时空限制的一个图书馆,由各

个资源提供机构提供资源。

21根据文献信息内容特征进行检索的检索途径有哪些?

检索方法

(一)引文法

引文法就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。①由远及近地搜寻。②由近及远地追溯(追溯法)。

(二)交替法

(三)排除、限定和合取法

①排除法②限定法③合取法

(四)常规法

所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。常规法如果从时间上考虑有顺检法、倒检法和时间抽样法三种。

1、顺检法

就是从过去某一时间起往现在逐年逐月地检索。

2、倒检法

则是从现在往过去逐年回溯。用这种方法检索的用户比较注重新的信息,同时常有一些信息量上的要求。

3、时间抽样法

就是抽检某时段的信息。这种方法是利用事物发展的不平衡性来进行的。

上一篇:教学方法开题报告下一篇:镇委学习《廉政准则》征文体会