信息检索网络检索

2024-07-18

信息检索网络检索(精选6篇)

篇1:信息检索网络检索

i.记录检索结果

“网络信息检索及专利信息检索”实习报告

一、实习目的1、熟悉网络信息的基本检索方式,了解几种常用的搜索引擎

2、熟悉我馆现有的中文献题目:multifunctional data acquisition and control system for experimental aerodynamics

作者:Yu.K.Biokin-Mechtalin

出处:Volume 71,Number 11(2010),2455-2664 英文电子资源的使用方法。

3、掌握利用网络检索专利信息的方法

二、实习题目(每种途径任选一题):

1.环境与生态系统;2.胶粘剂的研制;3.抗癌药物研究;4.纳米材料的制备;5.金刚石的应用;6.汞污染处理;7.热固性塑料成型; 8.包装技术; 9.安全控制系统10.控制释放技术

三、实习内容:

1.网络科技信息检索(http://library.qust.edu.cn/)1)万方数据资源的使用

a.选择检索课题(目)为:胶粘剂的研制 b.选择检索途径为:关键字

c.记录检索结果

文献题目:有机硅改性酚醛环氧树脂耐高温胶粘剂的研制 作者:王丁 程斌 刘峰 江民涛 黄朝 出处:中国胶粘剂 2007年16卷第3期 2)CNKI的使用

d.选择检索课题(目)为:热固性塑料成型 e.选择检索途径为:关键字 f.记录检索结果

文献题目:热固性塑料成型新工艺——注射模压成型 作者:陈中一

出处:工程塑料应用1984年01期 3)Springer LINK使用

g.选择检索课题(目)为:安全控制系统 h.选择检索途径为:关键字

2.专利信息检索

检索工具:国家知识产权局网站(http://)1)主题途径(任选一题进行检索)

a.选择检索课题为:.包装技术 b.记录检索结果:

专利名称: 金属锶铝罐包装技术 专利发明(设计)人:梅小明

专利权人:南京云海特种金属有限公司

申请(专利)号:02113127.9

2)专利权人途径(青岛科技大学;山东大学;清华大学;上海交通大学)c.选择检索入口为:青岛科技大学 d.记录检索结果:

专利名称:固体废物陶瓷生态砖 专利申请人:朱海涛 陈磊

申请(专利)号:200710113223.9

3)申请(专利)号途径(02150457.1;88100410.3; 88106349.5)e.选择检索专利号为:88106349.5 f.记录检索结果:

专利名称: 连续生产胶料工艺方法和设备

专利发明(设计)人:诺伯特·来比格;曼夫利德·迪恩斯特 专利权人:海尔曼·拜尔斯托夫机械股份公司

实习人姓名:实习人班级:实习时间:

篇2:信息检索网络检索

——读《理解媒介:论人的延伸》有感

由于没读《世界是平的》,所以谈谈读《理解媒介:论人的延伸》对网络时代新特征的理解。加拿大传播学巨匠麦克卢汉的著作《理解媒介》中阐述的主要观点是:“媒介是人的延伸,思维的延伸。人类的思维交流从面对面,到了电话,到了网络,不断将世界拉近。” 的确,媒介的变化和改进深深地影响着人类社会的方方面面,甚至影响到社会的变革。麦克卢汉在1964年预言:随着电子媒介的发展,世界日益成为一个地球村。他认为人类社会的发展经历了一个部落化——非部落化——重新部落化的过程,最终整个世界成为一个新的“地球村”。在原始社会,口语是主要的传播媒介,由于听力有限,人们必须生活在小空间的部落群体之中,相互保持近距离的密切关系。文字和印刷媒介产生之后,人咧可以分散到广阔的地域,部落神会便发生了解体。电子媒介的普及再次改变了这种状况,谈们的床不速度和实时性再次将遥远的世界拉得很近,人与人的距离大大“缩小”,于是重新“部落化”,形成“地球村”。在电子媒介刚出现时,大多数人并不相信他的这一预言,但事实是新媒介正逐渐将这一预言实现。电子化的、通过电线、光纤、无线电等技术传送信息的网络使得任何种类的信息都可以突破时空的限制自由的传送。

当今,互联网的浪潮正以难以想象的速度和不可阻挡的势头席卷全球。我觉得甚至可以这样理解,第三次科技革命就是信息传播媒介的革命,网络计算机技术改变最深刻的就是传播和人们交流信息的方式。一方面,从传统的印刷技术到现代的数字化的通讯技术和通讯网络,信息传播的方式突飞猛进;另一方面,信息传播方式的革命正在改变经济增长方式以及世界经济格局,是企业进入数字经济时代。信息传播方式的革命促使人类的一切都可以虚拟化。逐渐出现的虚拟办公、虚拟企业、虚拟学校、虚拟图书馆、虚拟商城等,将改变人类经济与社会活动方式。甚至可以说,这种革命会影响到政治、文化等更生层次的领域。

麦克卢汉还认为,这种变化不仅仅是社会整体层面的变化,更是其组成单位——人的个体的变化。麦克卢汉说印刷媒介时代的人是割裂的、残缺不全的人,他认为是印刷文字的语法把人类分裂为相互独立的自私自利的派别,分裂为种和民族,分裂为情感的派别。他也相信,电子传播中网络那种统一的力量又可能使人类重新回到整合统一的状态。我觉得这种观点很有深度,也很有远见。

在互联网上,世界正在变成一个没有时差,没有距离的整体,变成一个超越传统是空的“网络时空”。在网络时空中,人们可以更多的利用网络娱乐,包括收听、下载音乐,观看电影,人们可以利用网络购物,订票,订酒店等等,网络承担起人类娱乐、休闲新载体的任务。另外,在网络时空中,人们还可以通过虚拟图书馆、博物馆、艺术馆等来收集需要的信息,在网络上学习,工作。

篇3:网络信息检索的探讨

信息检索包括信息的存储和检索两个方面。其中存储是为了检索, 而检索又必须先进行存储。

信息的存储过程实际上是对信息进行整序的过程, 信息的检索过程则是将信息特征标识与检索提问标识进行匹配的过程, 也就是对大量的分散无序的信息依据一定的方法和规则, 进行收集、加工、组织、存储, 建成各种各样的检索系统, 通过使用统一的检索语言和名称规范, 将与用户所需的检索课题要求相匹配的内容从检索系统中检出。

信息检索的原理是“相符性比较”和“匹配运算”。即首先必须对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储, 以建成各种检索系统 (如手工检索工具、计算机检索的数据库与搜索引擎) 。用户根据检索课题的需要, 将需求转变为系统所能识别的检索式, 再与检索系统中表征信息资源特征的标识进行逐一的相符性匹配与比较, 两者完全一致或部分一致时即为命中信息。

这就是信息检索的一般构成和原理, 其中的统一检索语言和名称规范是存储和检索人员所必须共同遵守的。

信息检索是获取科学知识的最佳捷径。掌握了信息检索的方法和技能, 就能够掌握获取文献的方法, 提高信息意识和信息观念, 最快捷、最有效地获取自己最需要的信息, 并利用这些信息顺利完成自己的工作任务。熟练地掌握文献检索的方法是缩短科研时间、提高工作效率的重要途径。科学研究是一种探索未知的活动, 信息检索可以使科学研究避免重复。

1 网络信息检索类型

以网络为平台的计算机检索被称为网络信息检索。与其他检索方式相比、网络信息检索的特点是:信息检索范围宽, 信息量大, 信息检索的时效性强, 但是处理的信息类型繁杂而载体形式多样。

根据网络的地域范围分类, 可分为局域网信息检索和万维网信息检索两种类型。

局域网中信息检索以传统的联机光盘检索系统为主, 指把单用户系统发展成多用户的局域网系统, 通过网络 (指局域网, 如图书馆网、校园网等) 连接多个用户终端, 用服务器管理多组光盘数据库及其检索系统。它可以连接到许多用户终端, 网上用户可以分时共享光盘数据库的信息。联机光盘检索系统由若干台微机、光盘驱动器、光盘服务器、光盘数据库、检索系统软件、管理系统软件等构成。

随着网络技术的发展, 具有全球性的分布结构、开放性的因特网为计算机检索提供了广阔的发展平台。这种检索方式可同时使用网上多个主机、甚于所有主机的某种资源而并不需要用户预先知道它们的具体地址。这就极大地拓宽了检索的空间和信息量, 包括各种文献信息资源及其指向的网络页面。其中这类信息检索技术也因技术不同分为:基于Web的数据库检索;基于Web的分类浏览方式和链接嵌套方式;基于Web的搜索引擎方式。

以上综合讨论两种检索类型的特点和功能, 现对它们在服务的主要方面进行比较, 见表1。Web版联机检索从信息量的存储和数据更新及通讯方式等方面具有更强的优势, 传统的联机数据库将更多的以Web版方式放到Internet网上。

2 搜索引擎技术

2.1 搜索引擎工作原理

搜索引擎具有对网络资源进行采集、标引并提供检索的功能, 其基本结构如图1所示。

数据采集模块:搜索、采集和标引网页。有人工采集和自动采集两种方式。人工采集由专门信息人员跟踪和选择有用的网页, 并按规范方式进行分类标引。自动采集则是通过软自动采集器来完成的。网页自动标引借鉴了文献标引过程中的这样一种观点:即文献的主要内容可以用一些关键句的集合来表达 (如摘要) ;关键句包含了最能反映文献主题的重要词汇;而词汇在文献中使用的次数, 即词频则反映了词汇的重要程度。基于这一观点, 网页自动标引是建立在词频统计基础之上的。目前几乎所有重要的搜索引擎都采用全文索引方式, 分析网页的所有词汇, 并依据词频、词汇在网页中出现的位置等确认词汇的权重, 由此来选择标引词。

数据组织模块:通过数据库管理系统来组织所采集的网页信息, 建立相应的索引数据库。索引数据库中的一条记录对应于一个网页, 记录的内容包括网页标题、关键词, 网页摘要及URL等信息。

数据检索模块:根据用户检索要求, 从索引数据库中检索出符合用户需要的网页。

此外, 还有一种被称为"页面搜索器"的检索工具, 工作原理类似于"Push"浏览器 (http://www.netmind.com) 。用户只要把自己感兴趣的页面地址输入“页面搜索器”中, 并提供自己的电子邮件地址, “页面搜索器”就会定期检索。一旦发现相关页面的地址, “页面搜索器”就会自动将结果送入用户邮件地址。搜索的文件类型可以包括“h t t p”, “F T P”, “Gopher”等。通过“页面搜索器”可以跟踪站点以及其内容的变化, 以便得到最新的信息。

2.2 评价搜索引擎解决的问题

1973年, Lancaster提出的对检索工具评价的涵盖范围、查全率、查准率、响应时间、用户方便性和输出格式6个方面的标准, 如今仍基本上适用于搜索引擎的性能评价。由于网络查询的多媒体表达和分布式体系结构等特点的变化, 对搜索引擎进行评价的角度、目的的不同, 评价指标也有不同程度的变化。

其中, 查全率与查准率 (又称召回率与精度) 这两个文献检索效率评价的传统指标, 仍然是搜索引擎检索效率评价的最主要指标。普遍表示为:查全率= (检索出的相关信息量/系统中的相关信息总量) ×100%;查准率= (检索出的相关信息量/检索出的信息总量) ×100%。前者是衡量检索系统和检索者检出相关信息的能力, 后者是衡量检索系统和检索者拒绝非相关信息的能力。两者合起来, 即表示准确率。

查全率与查准率之间存在着相反的相互依赖关系, 也就是说, 如果提高查全率, 那么就会降低其查准率, 反之亦然。实际上, 并不是每个用户都需要高查全率或高查准率。用户查找信息的目的各不相同, 对查全和查准的要求也不同, 有时, 寻找特定的事实并不关心一次检索中漏检了多少。查全率与查准率只是相对的概念, 正如有作者所称的“相对查全率、相对查准率”, 因此检索者可根据信息需求情况, 调整适当的查全和查准要求, 以达到检索的应有效果。

按照信息搜集方法和服务提供方式的不同, 搜索引擎系统可以分为三大类, 这三类系统根据不同的检索建立原理分别解决了不少信息检索的问题, 结合前面提到的6个标准总结其解决的问题:

(1) 目录式搜索引擎:以人工方式或半自动方式搜集信息, 由编辑员查看信息之后, 人工形成信息摘要, 并将信息置于事先确定的分类框架中。信息大多面向网站, 提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能, 所以信息准确、导航质量高, 缺点是需要人工介入、维护量大、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。

(2) 机器人搜索引擎:由一个称为蜘蛛 (Spider) 的机器人程序以某种策略自动地在互联网中搜集和发现信息, 由索引器为搜集到的信息建立索引, 由检索器根据用户的查询输入检索索引库, 并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预, 缺点是返回信息过多, 有很多无关信息, 用户必须从结果中进行筛选。这类搜索引擎的代表是:Alta Vista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:“天网”、悠游、OpenFind等。

(3) 元搜索引擎:这类搜索引擎没有自己的数据, 而是将用户的查询请求同时向多个搜索引擎递交, 将返回的结果进行重复排除、重新排序等处理后, 作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全, 缺点是不能够充分使用所使用搜索引擎的功能, 用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket等。

2.3 搜索引擎方式的新问题

(1) 注意提高信息查询结果的精度, 提高检索的有效性

用户在搜索引擎上进行信息查询时, 并不十分关注返回结果的多少, 而是看结果是否和自己的需求吻合。对于一个查询, 传统的搜索引擎动辄返回几十万、几百万篇文档, 用户不得不在结果中筛选。解决查询结果过多的现象目前出现了几种方法: (1) 通过各种方法获得用户没有在查询语句中表达出来的真正用途, 包括使用智能代理跟踪用户检索行为, 分析用户模型;使用相关度反馈机制, 使用户告诉搜索引擎哪些文档和自己的需求相关 (及其相关的程度) , 哪些不相关, 通过多次交互逐步求精。 (2) 用正文分类 (Text Categorization) 技术将结果分类, 使用可视化技术显示分类结构, 用户可以只浏览自己感兴趣的类别。 (3) 进行站点类聚或内容类聚, 减少信息的总量。

(2) 基于智能代理的信息过滤和个性化服务

信息智能代理是另外一种利用互联网信息的机制。它使用自动获得的领域模型 (如Web知识、信息处理、与用户兴趣相关的信息资源、领域组织结构) 、用户模型 (如用户背景、兴趣、行为、风格) 知识进行信息搜集、索引、过滤 (包括兴趣过滤和不良信息过滤) , 并自动地将用户感兴趣的、对用户有用的信息提交给用户。智能代理具有不断学习、适应信息和用户兴趣动态变化的能力, 从而提供个性化的服务。智能代理可以在用户端进行, 也可以在服务器端运行。

(3) 采用分布式体系结构提高系统规模和性能

搜索引擎的实现可以采用集中式体系结构和分布式体系结构, 两种方法各有千秋。但当系统规模到达一定程度 (如网页数达到亿级) 时, 必然要采用某种分布式方法, 以提高系统性能。搜索引擎的各个组成部分, 除了用户接口之外, 都可以进行分布:搜索器可以在多台机器上相互合作、相互分工进行信息发现, 以提高信息发现和更新速度;索引器可以将索引分布在不同的机器上, 以减小索引对机器的要求;检索器可以在不同的机器上进行文档的并行检索, 以提高检索的速度和性能。

(4) 重视交叉语言检索的研究和开发

交叉语言信息检索是指用户用母语提交查询, 搜索引擎在多种语言的数据库中进行信息检索, 返回能够回答用户问题的所有语言的文档。如果再加上机器翻译, 返回结果可以用母语显示。该技术目前还处于初步研究阶段, 主要的困难在于语言之间在表达方式和语义对应上的不确定性。但对于经济全球化、互联网跨越国界的今天, 无疑具有很重要的意义。

3 结论

网络信息检索范围宽, 信息量大, 信息检索的时效性强, 但是处理的信息类型繁杂而载体形式多样, 所以搜索引擎的研究应符合时代要求, 发展智能化, 个性化和高效化, 这是亟待解决的问题。

参考文献

[1]赵玉玲, 滕飞.试论信息检索途径的多样性[J].重庆图情研究.2007.

[2]乔振林.试论网络环境下的信息检索和服务[J].成功教育.2007.

[3]张帆等.信息存储与检索[M].北京:高等教育出版社.2003.

篇4:浅析网络信息检索

【关键词】网络信息;检索

随着信息技术的高速发展,信息资源的越来越显得重要,而网络信息资源也逐步成为这个信息时代的核心资源。信息检索技术也很快得到发展,在此网络信息检索随着网络的发展也应运而生。网络信息检索,就是将描述特定用户所需网络信息的提问特征,与信息储存的检索标识进行异同比较,从中找出与提问一致或基本一致的网络信息的过程。相对传统文献检索,网络信息检索显现出了很多的优越性,如不受时间地点的限制,检索方式多样化,多元化等。但是我觉得网络信息检索的发展还不是十分完善,仍存在些问题,如目前检索工具在信息搜集缺乏统一的规范管理,检索过程会出现很多雷同,甚至无用的垃圾信息等。以下从网络信息检索目前存在的问题,及针对问题面临的以后的发展方向进行了探讨。

随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求等烦琐操作,基于网络检索工具的检索工具产生了。

目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业搜索引擎集成链接,深受特定用户群欢迎。如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家” “网际瑞士军刀”等。

另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前国内现在还没有见到真正意义上的元搜索引擎。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。目前元搜索引擎技术主要有并行处理式和串行处理式两大类。并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。

从第一个元搜索引擎Metacrawler诞生至今,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。由于元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约,元搜索引擎比较理想的并不多见。信息检索专家邢志宇将元搜索引擎存在的问题归纳如下:(1)大多元搜索引擎不支持多语种,尤其是汉语检索;(2)一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;(3)部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;(4)大部分元搜索引擎仅支持调用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。

Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。我觉得未来网络信息检索技术的发展方向如下:

1.智能化

现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。

2.标准化

现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。

3.个性化

科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。

篇5:网络信息检索考察题

2010年6月8日

一、问答题

1.2.3.4.5.6.7.信息素养主要有哪些要素? 什么是信息检索?信息检索有哪些途径? 什么是布尔逻辑检索?它包括哪三种基本运算? 什么是搜索引擎?举出国内外常用搜索引擎各3个。温州大学图书馆有哪些电子图书数据库?其中,读秀提供了多少种电子图书? CNKI的英文全称是什么?其数据库收录了哪些资源?其中包括多少种国内期刊? 温州大学图书馆拥有国外全文综合数据库有哪些?全文专业数据库有哪些?二次信息库有哪些?

8.温州大学图书馆有哪些音像资源?我馆购买的“网上报告厅”中,有哪些学术报告类目?有哪些学术鉴赏类目?KUKE数字音乐图书馆收录了多少曲目?新东方多媒体学习库包括哪四个类目?

9.CASHL的英文全称和中文名称是什么?其人文社会科学外文资源涉及哪些学科领域?

10.NSTL的英文全称和中文名称是什么?其资源建设的近期目标是什么?

11.CALIS的英文全称和中文名称是什么?在其发展目标中,准备为中国高等学校建立哪六大数字服务环境

12.学术论文的特点是什么? 学术论文一般有哪些部分组成?

二、操作题

1.通过CNKI文献出版报表功能,查看您所学专业(如数学),有多少电子期刊、博士论文和硕士论文。

2.用万方数据库的快速检索功能,自拟一个您所学专业相关检索词,进行知识脉络检索,在检索结果中选择2-5个主题进行比较分析。将比较分析结果拷贝到试卷。

3.在中国经济信息网检索一篇篇名中含有低碳的文章,并复制一段文字到试卷。

4.在EBSCO数据库中,检索题名中包含“信息”并含有全文的期刊文献,并记录检索结果。

5.在Elsevier中,检索标题中包含Political Geography、发表时间是2005年至今的期刊论文,并挑选一篇,以PDF格式打开进行阅读。此外,记录此文的文章题目、表格图片数量以及参考文献数量。

6.在 Emerald中,用高级检索模式检索我馆购买的期刊文献,文章标题中含有political power。记录检索结果数量。

7.在新东方多媒体学习库 “四六级”模式下浏览“新四级基础深度精讲”,下载讲义。将讲义中的前两行拷贝到本题答案位置。

8.检索于丹的《论语》感悟并播放,浏览作者于丹的简介并将其拷贝到本题答案位置。

三、综合题

1.利用综合信息检索知识,检索并参考数字图书、纸质图书、期刊、学位论文、免费网络资源等,架构一篇学术论文。(论文主题自拟,最好和自己的学科相关,可以是自己的毕业论文)。具体要求:

⑴ 描述通过信息检索获得论题思路的过程

⑵ 列出论文提纲(论文标题及两级标题,可对提纲内容进行简短介绍)

⑶ 按照中华人民共和国国家标准(GB/T 7714-2005)” 所规定的文后参考文献著录规则,列出主要参考文献

篇6:论网络信息检索技术

摘要:20世纪以来,人类创生的信息量高速增长,浩如烟波。如何从这海量的信息里找出所需信息就成为信息检索的重任。随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。掌握信息检索的方法与技巧是非常有必要的,人们对快速、准确、有效地获取网络信息资源的需求是急切的,人们对网络信息的检索技术及其发展趋势进行探讨和研究,也是迫切而实用的。针对网络信息检索的各种方法与技巧进行了客观的分析与思考,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。关键词:网络、信息检索、检索技术、工具

0 引言

进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

什么是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。网络信息检索的现状以及策略

在这个高速发展的信息时代的社会,随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。用网络搜索一些信息,如了解时事、生活疑惑、寻医问病、自娱自乐等,通常都比较方便快捷。然而,网络信息资源相当丰富,多种多样,当人们进行专业信息检索时,结果往往不尽如人意。即便是经常上网高校的老师与学生也有常常搜索不到专业文献信息的时候。

由于信息资源数量庞大、各信息间又相互交叉渗透,使得一些科研课题资料的检索相当的有难度,因此,我们必须掌握合理的检索策略,这样才能保证我们能有满意的检索效果。所谓检索策略,就是正确的选择检索词、科学合理的提问等。首先应对要检索的内容进行细致的分析,将完整的主题分为一个个独立的检索概念,然后要注意选全、选好相关词。在检索英文资料时,还要注意英美不同的拼写形式以及检索词的单复数形式、缩写形式等,然后采用布尔逻辑的原理,将表达相关概念的各检索词组配起来,以转换成搜索引擎可以理解的信息提问式,在对其数据库进行搜索后,便可获得相应的结果。因特网上的信息浩繁庞杂,一些有价值的专业信息被大量无用信息所淹没,要想系统的、全面的、准确的获取有价值的信息,就需要学会科学的制定信息技术策略。

2网络信息检索的原理及方法

网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

①布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

②模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

要在网上获取信息,我们就需要找到提供信息源的服务器。首先找到各个服务器在网上的地址,然后通过该地址去访问服务器提供的信息。大致有以下几种方法: 2.1漫游法

这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。

用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的追溯检索,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。2.2直接查找法

直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。2.3搜索引擎检索法

此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。

2.4网络资源指南检索法

此方法是利用网络资源指南进行查找相关信息的方法。

网络资源指南类似于传统的文献检索工具————书目之书目或专题书目,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。2.5 在线数据库查询

利用网上的在线数据库进行查询。访问网络数据库是用户获取学术性信息的最有效方法。网上在线数据库有很多,比如:超星数字图书馆、万方数据库资源系统、中国维普数据库、CNKI中国期刊网数据库等。

3网络信息检索详论

3.1网络信息检索方式

其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式

只要能够进入html就能够通过浏览器,利用HTTP协议提供的万维网服务,浏览接触页面和通过Web页面提供的检索方式访问数据库。

(2)搜索引擎方式

搜索引擎是internet提供公共信息检索服务的Web站点,它是以一定的技术和策略在internet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以web形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。3.2网络信息检索工具

从20世纪80年代起人们就开发了诸如Archive、WAIS、Veronica等检索工具,从90年代中期起又出现了检索万维网络信息资源的搜索引擎技术,并以此构造检索所有各类网络信息资源的集成化支撑体系。据统计,各种各样的Internet网络信息检索工具已有数千个,按这些工具的检索机制、检索内容范围,以及检索工具的数量、检索资源类型,可将它们划分为以下各类:

(l)按检索机制划分

根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型检索工具。(2)按检索内容划分

根据检索工具的数据内容,检索工具可分为综合型、专题型和特殊检索工具书。(3)按包含检索工具数量划分 根据检索工具数量划分,检索工具可分为单独型和复合型检索工具。(4)按检索资源类型划分

根据检索工具针对的数据资源类型,可将检索工具分为万维网检索工具和非万维网检索工具。

3.3网络信息检索技巧

目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。最著名的搜索引擎有AltaVista、Excite、HotBot、Infoseek等;另一种是按主题分类指南进行检索,如Yahoo!就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。而后者的信息组织系统性较强,精确度较高。但主要问题在于获取率较低且很难反映信息之间的关联性。由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。

(l)检索关键词具体化;(2)运用词组检索;

(3)巧用Boolean逻辑词:AND、OR 和NOT。

4网络信息检索的技巧

在中国,用来获取中文信息的搜索引擎,主要是扬名华人世界的百度搜索引擎和全球闻名的Google搜索引擎。Google在外文信息搜索方面有绝对的优势,并较早推出了中文信息搜索,而百度专攻中文搜索,并在汉语特点研究等方面做出来很大贡献,近几年又推出了多种特色搜索服务,从而在中文网络搜索领域占据了绝对的优势。另外,我们常见的搜索引擎还有雅虎、网易有道、百度等。掌握网络信息搜索技巧对于很好地利用这些搜索引擎很有帮助,对自己搜索信息更是简单至极。通过互联网获取信息,如何避免在浩瀚的互联网海洋中迷失方向,掌握一些基本的网上搜索技巧可以说是必需的。网上的信息搜索技术如此的多,怎样才能高效迅速地找到问题的答案呢?有几种技术可以帮助你更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合起来使用会大大加快网页搜索进程。

网上的内容虽然很丰富,但必须先有人放上网。搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,很可能成为漏网之鱼。所以在使用搜索引擎之前,应该先花几秒钟想一下,我要找的东西网上可能有吗?如果有,又可能在哪里?网页上会含有哪些关键字?

一次成功的搜索由两个部分组成:一个设计优秀的搜索请求和一个准确可信的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题和网址,会帮你节省大量的时间。

比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND和OR或NOT,恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合。

如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。通过添加英文双引号来搜索短语词,这一方法在查找名言警句或专有名词时显得格外有用。很多搜索引擎都支持在搜索词前冠以“+”限定搜索结果中必须包含的词汇,用“-”限定搜索结果不能包含的词汇。

在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。

如果只给出一个单词进行搜索,经常会出现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND与逻辑结合起来,或者在每个词前面加上“+”,这种与逻辑技术大大地缩小了搜索结果的范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样的语法。一个带引号的词组意味着只有完全匹配该词组,包括空格的网页才是要搜索的网页。把这几种符号结合起来使用,能大大提高搜索效率。网络信息检索发展

5.1网络信息检索的现状与发展

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Solberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展。5.2 影响网络信息检索质量的因素

(l)搜索引擎在检索的实现过程中存在一些尚未解决的问题,影响检索效果(本身存在的问题)。

(2)页面的制作、组织过程中存在的欠缺会影响到被检索的信息质量。

(3)检索用户与搜索引擎的交互过程中,由于交互的背景不同,目的不同,会影响检索效果。

5.3网络信息检索工具展望

从最早的网络信息检索工具(如Archie)算起,它们作为一个整体只有不足十年的历史,而基于万维网的检索工具(如Yahoo!和AltaVista),出现的时间则更晚。可见,网络信息检索工具尚处于发展高峰期。

网络信息检索现今的主要问题是查准率太差。如今,人们正通过一些研究,设法使网络信息检索的空间在不影响查全率这一前提下,提高查准率,它们的未来充满希望。在网络信息检索环境中,检索、浏览和获取这三个过程相互交融,自由转换、合为一体,已展示出了信息检索的新趋势,为充分地利用网络信息资源创造了条件。

结语

人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。信息检索作为传递、搜索信息的手段发展愈来愈快。如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。所以,我们应充分利用信息资源,避免重复劳动。科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提。更新自身知识积累,适应社会发展需要。在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段。

参考文献

上一篇:毛泽东的小故事下一篇:大专函授毕业自我鉴定