将关系搜索引入图书馆检索服务中的可行性

2022-09-11

文献的产生于传承是无法脱离人而独立存在的, 作为社会性的智慧动物, 人与人的见闻、言论以及他们所熟悉的各种礼仪和自身的经历密切相关, 是生产信息的基本单位。如果在对文献和信息资源进行加工、组织和整理上, 以人为切入点, 提供对象级别的检索服务, 将会为图书馆阅读服务提供新的方法和思路。

21世纪是数字时代, 随着数字技术的不断深入发展, 人类信息的生产、组织、存储和传递方式发生了极大地改变, 传统意义上的物理图书馆逐步迈向数字图书馆, 图书馆信息资源服务模式发生了根本性的转变。

同时, 伴随着用户数字素养不断地提高, 用户不断适应社会发展需要和自我价值的实现, 图书馆信息检所服务面临着更大的挑战。

目前, 在互联网中, 诸如人立方、雅虎任务搜索、中国人同学录搜索、百度空间搜人等关系搜索已有广泛应用。

并且图书馆和情报科学的研究人员也已开始研究未来图书馆的模型。学者们开始认识到未来图书馆需要组织全球资源, 不仅仅要拥有自身资源馆藏, 尤其是因特网资源, 只有这样才能使这些资源价值最大化。由此本文对关系搜索引入图书馆检索服务中的可行性进行了研究, 以期能够充分利用这一技术, 为图书馆创新服务提供一定帮助, 从而更好地实现图书馆与用户交流互动的有效途径。

一、关系搜索概述

(一) 关系搜索的内涵

目前, 在学术界, 关于关系搜索还没有统一的定义, 笔者认为, 关系搜索是将人和人之间的关系抽取出来, 查找出目标人物之后, 围绕着目标任务给出的丰富信息, 并可以根据指定关系查看详情。

其与一般的搜索引擎服务不同, 包括人物简介、人物关系等内容, 在《社会网络搜索关键技术研究概述》中, 杜一鸣指出:“关系搜索是基于传统搜索的信息挖掘技术, 是一种以互联网上的海量信息为计算基础, 以人物为中心的信息聚合垂直搜索。”

相对于传统综合性搜索引擎的大而无序、深度不够等, 垂直搜索是一种新的搜索引擎服务模式, 是以结构化数据为最小单位, 结构化信息数据是从网页信息中的非结构化数据抽取出来的, 并且为了使结构化数据的搜索方式满足用户的信息需求, 要对结构化数据进行进一步的加工处理。

目前, 在互联网中, 关系搜索已有广泛的应用。如:2008年, 微软亚洲研究院推出的人立方、雅虎人物搜索、chinaren中国人同学录搜索、百度空间搜人等都属于关系搜索产品。

其中“人立方”和“雅虎任务”是关系搜索的代表产品, 上线比较早。并且借助微软强大的检索技术和直观绚丽的视觉展示, “人立方”成了该领域的领军产品。

目前, 人们对关系搜索越来越关注, 但是作为一种年轻的、极具创造性的搜索技术, 在图书馆领域中, 关系搜索还没有引起广泛的重视。笔者认为, 将关系搜索引入到图书馆工作中, 能够为图书馆研究读者行为、收集读者信息、掌握读者阅读主题并推行基于作者的书目推荐等服务工作提供了全新方法, 为图书馆组织、整合、集成和展示信息资源提供全新方式。

(二) 关系搜索主流产品介绍

人立方是对每一个人名与关键词直接的距离、数据大小以及具体的摆放位置等, 根据搜索关键词和与其相关的人名之间的关联度强弱自动地计算, 并为了展示其社会化关系, 通过一条标明了人际关系的细线连接他们。

聂再清博士介绍, 人立方关系搜索是通过算法自动计算出人名、地名、机构名以及中文短语之间存在关系的可能性, 并且这些关系是从超过十亿的中文网页中自动的抽取出来的;同时, 人立方关系搜索还索引了支持它们之间关系的网页文字。

另外, 对于人名之间最可能的关系描述词、与人名最可能相关的称呼、作品等词条, 人立方关系搜索能够自动找出。

从这些中文网页中, 人立方关系搜索自动地辨别出人名所对应的人物简介文字, 并对人物简介的可能性, 人立方关系搜索按照这些文字进行了排序。

为了将搜索结果展现在用户面前, 人立方关系搜索采用直观、动态、可视的方式, 通过对海量网页中的人名、地名、机构名的抽取, 深度挖掘互联网信息, 并对有关信息进行了相关度计算、排序。

目前, 人立方提供了一些核心功能, 如:展示了人的社会关系结构图景, 揭示了人的社会关系动态进程, 描述了人的社会关系、相关事件的具体内容等。

其中社会关系图景包括和检索对象有关的人物、地点和机构三个类别的关系信息。人立方是将具体的人作为信息搜索的逻辑起点, 将搜集的信息按照相关的密切程度进行级别分类, 把与此相关的信息收集起来, 其检索结果力图展示与搜索对象相关的各种信息之间的时间与空间关联, 从而在不同时间和空间中, 对相关互联的人与事存在的真实状态进行描述。为了直观显示各人物之间的关系情况, 人立方运用可视化技术进行绘制。这样的搜索逻辑启迪着人们对所需信息的认知广度和深度, 提高着人们收集和查阅信息的有效性。

雅虎人物搜索是以网页搜索为计算基础的信息挖掘技术, 是针对知名人士, 在基于传统搜索的基础上, 抽取人和人之间的关系, 包括人物简介、人物关系等娱乐化内容, 是围绕着知名人物给出丰富的信息。可以点击人物关系圈中的一个关系人, 根据指定关系查看详情, 从而查到以被点击的人为中心的关系圈。查看其中一个关系, 点击该关系, 就会得到详细情况。

如:在搜索“王志庚”的人物关系时, 中国国家图书馆的人际网络图可以给出雅虎计算得出的同名信息, 给出其人物关系, 通过查看“王志庚”的个人资料、资讯、图片等信息, 用户可以进行评论等。另外, 雅虎人际网的连线关系是由政府和相关机构、共同联系的实体名来命名。如:《中国哲学史》、《永乐大典》、《周易》等共同命名了任继愈的人际网关系。

二、关系搜索引入图书馆检索服务中的可行性

(一) 关系搜索的引入能够为读者阅读服务提供新的方式

首先, 在读者服务过程中, 图书馆虽然已经使用了基本的关系搜索技术, 但是仅仅是针对文献作者进行搜索, 没有对文献全部文字内容进行索引, 关系搜索概念相对狭隘。随着全媒体服务的推进, 移动终端阅读电子文献的需求日益增强, 如:平板电脑、手机等, 这为图书馆文献内容涉及的人物索引提供了条件, 为了使读者能够随时随地进行阅读, 促使图书馆将传统图片格式的电子书转换为文本格式。

同时, 进入21世纪以来, 数字图书馆建设日益增强, 图书馆提供的文献资源服务远远超出了馆藏目录的范围。

并且新技术飞速发展, 也促使读者越来越喜欢使用自建数据库、外购数据库、共建共享资源乃至互联网上部分资源。

由此, 图书馆面对这些庞大的信息来源, 为了将众多文献的创作者和文献中记载的人物相关信息加以阻止利用, 将关系搜索引入到图书馆检索服务是图书馆发展的趋势, 能够为读者阅读服务提供新方式, 从而产生了图书馆资源新的组织整合方式。

(二) 关系搜索的引入能够读者更快、更全面的获取信息

传统的检索服务包括纸本资源、电子资源和音像资源的检索, 是基于文献作者的检索服务, 其检索结果都为多个独立的文献信息。如:纸本资源的搜索, 在检索框输入“图书馆学”, 获得是与检索词匹配的著作信息。由此可见, 这些数据在系统中并没有建立任何联系, 是孤立存在的, 这类检索是基于文献书目数据进行的。读者只有不断地尝试新的检索词和检索字段, 才能获取大量的资源, 需要经过多次检索。并且就算搜索到文献, 但是读者的需求也未必能够满足。此时, 如果能够通过极少次数的检索, 智能地分析文献和作者的联系, 智能地分析文献内容中的人物关系, 就会尽可能多地获得文献信息, 由此这种检索服务成了用户最为期待的图书馆检索服务之一。进入21世纪以来, 随着网络技术的飞速发展, 各个信息单元已不再孤立, 信息量呈几何级增长, 并且它们彼此之间存在着错综复杂的联系。为了进行对象级别的信息搜寻, 就要以人为切入点, 增强图书馆组织与整合信息的能力, 才能帮助人们更快、更全面的获取信息。

(三) 关系搜索引入能够为文献内容设计人物索引提供机会

关系搜索引入图书馆检索服务的技术路径是在数字资源全文识别的基础之上, 依托图书馆庞大的馆藏资源, 对文献的全部信息进行语义分析, 如:题名、作者、单位、摘要、关键词、参考文献等等。其实现了基于内容的检索, 突破了简单的元数据检索模式。同岁关系搜索技术引入到图书馆检索服务中, 能够形成以人名为节点、人物关系为连线的可视化人物关系图, 将众多文献的创造者和文献中记载的人物相关信息加以阻止利用, 能够智能地分析文献内容中的人物关系, 进行深度地数据挖掘、分类、排序。关系搜索是一个年轻的、极具创造性的搜索技术, 目前学术界、图书馆界越来越关注关系搜索。但是在图书馆领域中, 该技术和理念尚未广泛应用。21世纪以来, 随着全媒体服务的推进, 读者利用各种移动终端阅读电子文献的需求日益增强, 这为将关系搜索引入图书馆检索服务提供了一定的环境基础, 促使图书馆将传统图片格式的电子书转换成文本格式, 为文献内容涉及的人物索引提供了机会, 能够为读者随时随地阅读提供了极大地方便。另外, 关系索引技术中清晰的人物关系图可以展现更多的文献资源信息, 并且关系图会随着文献信息的动态变化而处于动态的变化之中, 如:人物的所有著作、著者与参考文献的著者信息、同一机构人相同的研究领域和研究情况等。由此可见, 这种通过极少次数检索返回的检索服务, 能够成为用户最期待的图书馆服务之一。

三、关系搜索在图书馆检索服务中的应用

(一) 在读者行为信息方面的应用

目前, 在办理读者卡的时候, 图书馆对于读者的ID、姓名、年龄、学校、电话号码等信息已经有了一定的掌握。通过ID认证登录图书馆网站后, 读者会下载哪些文章, 检索过关键词, 阅读哪些文献?并且读者会浏览数据库和知识库, 产生一系列的文献检索和阅读行为, 在Library2.0服务产品中参与过哪些评论, 有哪些留言等。在一段时期内 (如一个月或半年) , 如果将读者的行为汇总整理, 能够形成详细的个人信息库, 并且这些行为信息对于读者非常宝贵。而利用计算机技术, 有助于图书馆了解读者, 可以了解到该读者的大概阅读时间段和平均每天的阅读时间等信息, 也可以分析读者在特定时间段感兴趣的文献主题、文献类型, 并根据读者的需求有目的地进行主题推送服务。另外, 为了分析读者本人的研究背景及领域, 研究读者关心哪些人物内容或哪些作者的文献, 对读者进行图书馆系统的日志信息进行深入的数据挖掘, 能够为读者建立自己的档案信息库, 并且只有充分了解读者需求, 采用计算机智能的自学习技术不断调整信息库内容, 能够有针对性地向读者提供更好的主题推荐和书目推荐服务。

(二) 在数字文化资源方面的应用

文化资源是以精神状态为主要存在形式, 而人物则是表现文化精神和气质的主体。目前, 为了使社会了解和利用文化资源, 国家图书馆通过举办各种展览和学术、科普、艺术等讲座, 使文化资源信息更加直观、更加系统、更加有效地呈现在读者面前, 充分发挥了社会教育和文化传播的职能。由此, 在数字文化资源服务方面, 关系搜索技术为图书馆提供了新的思路, 其通过建立数字文化资源特色人物数据库, 以实体人为主要契机, 整合象征某种精神状态的人物代表和人物优秀事迹后, 配以人物相关图片辅助展示, 能够使读者充分地了解到自己感兴趣的文化资源, 从而提升图书馆检索服务质量和效率。

(三) 书目推荐方面的应用

书目推荐是按同一作者或者研究领域有直接关系的作者群, 为读者进行书目推荐服务的一种方式。有直接关系的作者其研究领域较为相似, 如:师兄弟、导师、学生关系的作者。同一作者的研究领域则比较固定。在一段时间内, 读者的阅读主题一般比较专一, 因此, 为了向读者提供极大的便利, 将关系搜索引入到图书馆的检索服务中, 可以向读者推荐相同作者的书目或相关作者的书目。

(四) 读者阅读方面的应用

为了了解读者的阅读信息, 图书馆需要建立每位读者的档案库。并且将读者信息库作为原始数据信息, 利用计算机技术, 组织整理和数据挖掘原始数据, 然后为了指导图书馆的阅读服务, 利用模式识别技术归纳、分类某类读者的阅读行为特点。如:通过计算可以得出, 读者一般在什么时间进行经典阅读?倾向于经典阅读的读者比例是多少?并且这些读者的年龄是多少等, 结合阅读时间和年龄特点, 图书馆通过掌握这些信息, 可以提供相应的服务, 有目的地建立相应的经典阅读阅览室。

(五) 作者见面会方面的应用

对于一些著作的作者来说, 很多读者都存在着一种崇拜情节, 由此读者就会有很强烈的与作者见面的想法, 如:读者会对作者阐述的内容产生共鸣, 感觉能够使自己的精神更上一层楼。在这种情况下, 为了激发大部分读者的阅读兴趣, 图书馆可以利用关系搜索技术, 尝试定期地举行作者通读者的见面会活动, 促进阅读的目的。

四、将关系搜索引入图书馆检索服务中需要注意的问题及启示

(一) 需要注意的问题

首先, 在互联网上, 普通网民使用的关系搜索, 具有很强的娱乐性、趣味性, 信息多来源于网站的新闻报道、社区论坛、微博、博客链接等, 并且需要用户自己判断结果中哪些是相关的, 哪些是不相关的信息。

而图书馆的检索结果侧重于文献著作、研究成果等, 用户有明确的信息需求, 主要建立在馆藏文献的基础上, 是文献与人物作者之间相互关联的过程, 从而通过该文献的作者和参考文献等能够了解到更多的资源。从本质上来说, 这种检索是“去娱乐化”的, 用户不用自己再进行分析和判断, 提供的结果都是与用户需求相关的, 因此将关系搜索引入图书馆检索服务中, 需要注意着这两者之间的差异性。

目前搜索技术具有局限性, 是对互联网上海量信息的分析为计算基础的, 并且受各种主观与客观因素的制约, 关系搜索不可能将人与人之间复杂的社会关系尽揽其中, 不能精细地揭示人与人之间关系的密切度, 很多属于社会关系隐私范围的信息也无法成为基础分析数据。因此, 将关系搜索引入图书馆检索服务中, 需要注意其应用结果呈现出与预定目标相悖离的问题。

另外, 引入关系搜索要想发挥好功能, 就要建立在资源的全文识别基础上。但目前, 现有的条件并不能完成馆藏资源的全文识别, 很多方面几乎都具有无法逾越的障碍, 如:人员、资金、设备、技术等。为了达到事半功倍的效果, 可以在人名及人名关系呈现较为集中的部分引入关系搜索。

目前, 关系搜索技术还不成熟, 处于起步阶段, 这会导致在引入该搜索技术时, 会出现“水土不服”。

因此, 为了满足图书馆检索的需求, 我们还需要不断的探索, 使其快速融入并适应图书馆的环境, 从而促进其在图书馆领域更好的应用和发展。

(二) 启示

通过书目推荐服务, 关系搜索在图书馆阅读服务中的应用, 能够使读者更便利地获取所需资源, 帮助读者养成良好的阅读习惯。

基于读者阅读信息的多样性服务, 通过定期举办书友会, 能够使读者感受到更贴心的图书馆服务, 促进读者阅读的兴趣, 为读者和读者之间架起一道沟通的桥梁。

同时, 贴吧和空间是人主动搜索圈子的过程, 通过建立不同的贴吧主题, 采用图书馆关系搜索, 实现了众多领域圈子的自然形成。

并且通过计算机技术, 将同一领域的作者、文献、领域简介等知识汇聚起来, 自动第进行文献知识挖掘, 自然会沉淀为一个知识圈子, 从而提高读者索取文献的全面性和准确度, 为读者提供多维度、更小粒度的领域知识, 为图书馆全面实践Linbrary2.0提供广阔的平台。

另外, 图书馆的关系搜索形成了清晰的知识脉络图, 通过分析文献作者、机构、刊名、关键词、内容摘要和引证关系, 将文献的内在关联信息, 用直观可视化的方式展示给读者, 省去了读者大量的文献搜索工作, 知识体系完善, 脉络清晰。

摘要:将关系搜索引入图书馆检索服务中, 能够对图书馆服务平台的延伸和信息资源的检索产生较大的影响, 能够为图书馆组织、整合、集成和展示信息资源提供全新方式, 是一种将人和人之间的关系抽取出来, 查找出目标人物之后, 围绕着目标任务给出的丰富信息, 并可以根据指定关系查看详情。其与一般的搜索引擎服务不同, 包括人物简介、人物关系等内容。本文通过分析关系搜索的内涵, 主要对将关系搜索引入图书馆检索服务中的可行性进行了研究, 以期能够提升图书馆的服务。

关键词:关系搜索,图书馆,检索服务

参考文献

[1] 肖红, 吴茗.人物搜索在图书馆中的应用探讨[J].情报探索, 2015, (05) :108-111.

[2] 高钢.绘制人的社会关系信息图景的尝试及意义——“人立方关系搜索”预示了什么?[J].国际新闻界, 2009, (05) :80-86.

[3] 段文文, 严大香.从图像搜索引擎看图书馆检索知识传播的方式[J].农业图书情报学刊, 2015, 27 (03) :100-103.

[4] 王大玲, 于戈, 冯时等.面向社会媒体搜索的实体关系建模研究综述[J].计算机学报, 2016, 39 (4) :657.

上一篇:关于综合布线技术在智能建筑物中的运用下一篇:新型乳化炸药乳化剂的应用研究