资源组织与检索

2024-06-29

资源组织与检索(精选七篇)

资源组织与检索 篇1

关键词:网络信息资源,信息组织,检索工具

一、网络信息资源的分类和特点

1.网络信息资源的分类。

与传统的信息资源相比, 网络信息资源广泛分布在整个网络之中, 按照网络信息的内容, 网络信息资源可以划分为五类:网络数据库、联机馆藏目录库、电子出版物、政府机构信息和休闲娱乐信息。按照所采用网络信息的协议不同, 网络信息资源可以划分为三类:基于超文本传输协议的信息资源、基于文件传输协议的信息资源和基于远程登录的信息资源。

2.网络信息资源的特点。

与传统信息资源相比, 网络信息资源在数量、结构、分布、传播范围、类型、载体形态等方面都有着显著的差异, 也呈现出一些新的特点:第一, 网络信息资源数量的海量化。第二, 网络信息资源庞杂, 质量良莠不齐。

二、网络信息资源组织的定义及重要性

1.网络信息资源组织的定义。

网络信息资源组织, 就是指对网上的各种概念、数据 (包括声音、图像、软件等) 、事实、文献等, 通过分析、标引 (分类的和语词的) 、著录 (信息特征的描述) 、链接 (把相关的信息加以联系) 、排序、存储等手段, 形成一个有序的、便于用户理解和查询的信息系统, 这个系统揭示知识的整体联系和相关知识间的联系。

2.网络信息资源组织的重要性。

网络信息资源必须经过人选取组织、有序化才能有效地服务于用户。网络的成功来源于其开放性、分布性、自由性、共享性等特征。信息价值的实现也是有条件的, 信息不会必然地、自动地转变为“资源”和“财富”, 并且网上信息呈现着无限、无序、优劣混杂的发展状态, 因此, 只有对网络信息资源进行有效地组织, 才能降低人们对信息筛选、甄别和判断的难度, 提高准确信息的使用效果和网络信息资源的利用率, 才能创造有序的信息空间, 实现信息资源效用的最大化。

三、网络信息资源的组织方法

1.搜索引擎的信息组织方法。

搜索引擎是一种浏览和快速查找检索信息, 专门针对网络信息资源提供查询服务的一类检索工具。搜索引擎方式是目前互联网络对二次信息资源进行组织的主要方式之一。它通过访问网络中公开区域的每一个站点, 对网络信息资源进行收集, 经过加工处理而建库, 然后利用索引软件对收集的信息进行自动标引, 创建一个详尽的可供用户进一步按关键词查询的Web页索引数据库。

2.数据库组织方法。

数据库方式是将所有获得的信息资源按照固定的记录格式存储组织, 用户通过关键词及组配查询就可以找到所需的信息线索, 再通过信息线索找到相应的网络信息资源。利用数据库技术进行网络信息资源的管理有强大的优势, 能高速处理大量结构化的数据, 从而大大提高了信息管理的效率。

3.超文本链接方式。

超文本是一种管理文本的技术, 是网络信息资源组织的基础。它将网络上相关文本的信息有机地组织在一起, 以节点为单位, 节点间以链路相连, 再将这些节点链接成网状结构。它打破了顺序线形编排的局限, 采用非线形组织方式, 能提供非顺序性浏览功能, 比传统的信息组织方式更加灵活方便, 更符合人们思维联想和跳跃的习惯。

4.元数据组织方式。

元数据通常被定义为“描述数据本身基本特征的数据”, 是用来网上数字资源著录和标引的格式, 类似于图书馆的编目记录。组织Internet并促进Internet资源的发展是元数据的基本功能。它可以促进信息的组织和发现, 即可以帮助识别、描述和定位Internet资源。

四、网络信息资源的检索方式

1.布尔检索。

所谓“布尔检索”指通过标准的布尔逻辑关系词来表达检索词与检索词之间逻辑关系的检索方法。主要的布尔逻辑关系词有: (1) AND关系。也称为逻辑与 (逻辑乘) 。表示客观存在所连接的两个检索词必须同时出现在结果中才满足检索条件。一般地说, 检索式A AND B所表达的复合概念相当于包含检索词A的结果集与包含检索词B的结果集的重叠部分。 (2) OR关系。也称为逻辑或 (逻辑加) 。表示它所连接的两个检索词中任意一个出现在结果中就满足检索条件。一般地说, 检索式A OR B所表达的复合概念相当于包含检索词A的结果集与包含检索词B的结果集之和。 (3) NOT关系。也称为逻辑非 (逻辑减) 。表示它所连接的两个检索词中应从第一个概念中排除第二个概念。一般地说, 检索式A NOT B所表达的复合概念相当于包含检索词A的结果集中不包含检索词B的结果集的部分。

2.截词检索。

所谓截词检索就是指在检索式中用专门符号 (截词符号) 表示检索词的某一部分允许有一定的词形变化。因此检索词的不变部分加上由截词符号所表达的任何变化形式所构成的词汇都是合法检索词, 结果中只要包含其中任意一个就满足检索要求。

3.邻近检索。

在网络信息量相当庞大的今天, 单纯依赖关键词检索和布尔检索已难以满足多种检索需要。为此, 许多检索工具引进了邻近检索功能, 通过检索式中的专门符号来规定检索词在结果中的相对位置。邻近检索对提高检索的查全率和查准率有重要的作用, 但网络信息资源检索中基本只支持 (W) 和 (N) 检索式。

4.加权检索。

加权检索的侧重点不在于判定检索词或字符串是否在数据库中存在、与别的检索词或字符串是什么关系, 而在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。加权检索是对每一个检索词给定一个数值表示其重要性程度, 称为权值。在检索中, 先查找这些检索词在数据库中是否存在, 对存在的检索词计算它们的权值总和。只有当数据库记录的权值之和达到或超过预先给定的值时, 该记录才算命中。

五、网络环境下信息资源组织与检索工作存在的问题

同传统的文献信息组织与检索相比, 网络信息资源组织与检索面临着很多新问题, 其中网络环境与传统文献管理环境的不同是主要的。第一, 网络环境下, 信息资源组织与检索工作的对象有了很大的变化, 这在很大程度上是由网络信息资源本身的特点所决定的。网络信息资源种类繁多、动态性强、质量参差不齐, 在内容分布上有关新兴计算机技术、商业、娱乐等方面的信息比较多, 而在传统的知识信息方面则比较薄弱。并且, 网络环境中出现了如BBS、聊天室等新的及时性信息资源形式。第二, 网络环境下用户需求发生了很大的改变。网络信息资源的用户多为终端用户, 比传统文献用户范围更广, 用户在使用网络信息资源时, 一般不通过中介直接进行查找工作。第三, 信息资源组织与检索的技术环境有了很大的变化, 传统的文献组织主要编制手工检索工具, 基本上把文献组织成为线性结构, 而网络环境下, 信息资源组织工作以电子文本和超文本为主要处理对象, 使用链接技术能够按照文献主体之间的关系和用户需要以网状的方式, 灵活地、多维地组织信息。第四, 网络信息主要是由用户通过终端的屏幕获得, 这样, 在进行信息组织工作时, 还要考虑到对显示器屏幕的有效利用, 以使得用户能够更方便地利用网络信息。基于以上环境因素的变化, 网络信息资源组织者必须对原有的文献组织方法进行改进和完善, 建立适合网络环境的信息资源组织与检索方法。

六、网络信息资源组织与检索应采取的对策

1.加强信息工作标准化。

在网络环境下, 信息服务业中各部门相互依赖更强、关系更复杂, 信息系统日趋社会化和国际化, 为确保信息资源共享并最大限度地开发与利用, 必须高度重视信息工作标准化、规范化, 实现信息的最大效益。

2.加强国际合作。

对网上信息的加工制作是一项涉及面广、需要付出巨大代价的持久性工作, 没有各方面的合作, 没有众多的信息工作者参与就无法实现。由于网上一次信息数量庞杂, 新陈代谢快, 网上信息的组织就需要世界范围内的合作, 保证准确、及时地报道网上一次信息及其变动情况, 提高二次信息和三次信息的质量并实现规模效益。

3.重视用户培训。

由于网络日益普及, 越来越多的用户将直接通过自己的网络终端获取信息, 急需对用户进行培训, 使他们掌握网络操作技术, 了解网络信息的构成和分布状况, 熟悉网上信息查询工具和获取渠道, 以便及时、准确地获取自己所需要的信息。

参考文献

[1]张文波, 齐艳丽.浅述网络信息资源组织[J].现代情报, 2004 (7) .

[2]王本欣.网络信息资源组织研究[J].图书馆学研究, 2004 (5) .

《信息资源检索与利用》作业 篇2

课程:《信息资源检索与利用》作业

姓名:___________班级:__________学号:______________

1.简述文献检索的主要步骤。(15分)

2.简述信息、知识、情报和文献之间的关系。(15分)

3.按功能可将工具书分为哪几类(至少写出十类)?并各举一个例子说明。(15分)

4.常用的文献信息检索方法有哪些?(15分)

5.我校图书馆订购了哪些数据库资源?至少列举7个。(15分)

音乐信息资源的检索与利用 篇3

信息资源的检索是从网络、数据库、文摘、索引、目录以及馆藏文献中找出所需文献的活动,音乐信息资源由于其专业的特殊性,在检索与利用方面与其他学科有很大不同,本文即对与音乐信息资源检索相关的几个方面进行研究,并综合整理出适用于音乐专业师生实用的一套检索途径和方法。

一、音乐信息资源检索发展现状

笔者通过分析已出版的音乐检索类图书和目前开设音乐信息检索课程的院校两方面,概括出我国目前音乐信息资源检索的发展现状。

(一)音乐信息资源检索参考图书

综合信息检索类图书在市面上比比皆是,但音乐专业的信息检索类图书因为其专业的特殊性出版非常少。下表格是已出版的音乐专业信息检索图书的集合,从1989年至今只出版了6种可参考的图书(见后表)。

(二)国内开设音乐文检课院校

笔者通过调研我国影响力较大的九大音乐学院发现,目前设有音乐专业文献信息检索课程的院校非常少,专业音乐学院中只有少数的几家图书馆设有这门课程,更别说其他综合类院校了。

下面是开设此门课程的院校和相关课程的简介:

1.中央音乐学院:由本院图书馆参考咨询部教师开设资源检索课,并不定期面向全院师生开展各类培训讲座。

2.中国音乐学院:没有开设专门的信息检索课程。参考咨询部每学期据读者需求举办十次馆藏资源培训讲座,内容涉及各种数据库的使用和馆藏信息的介绍,每学期有讲座的安排表,并提供预约讲座服务。

3.上海音乐学院:网站上没有显示记录讲座培训的信息,通过CNKI文献检索发现上音图书馆开设音乐信息检索课程已有些年且积累了些经验,并有教师由此发表学术论文。

4.武汉音乐学院:设有音乐文献检索选修课,并可以在图书馆网站下载到音乐文献检索课的相关资料。

5.沈阳音乐学院:没有专门开设课程,利用新生入馆教育和不定期的“图书馆信息检索”讲座介绍馆内外资源。

6.西安音乐学院:没有开设专门的信息检索课程,图书馆主要通过新生入学教育、培训讲座、参观辅导、专题讲座等活动,帮助读者了解图书馆、熟练使用图书馆资源,面对不同的读者常年不定期开设不同类型的讲座。

7.天津音乐学院:没有开设信息检索课程,但提供预约讲座服务,讲座内容可根据读者需求,按学科、专题或数据库等开展;讲座时间与地点协商安排:预约讲座人数需超5人,需要提前两周预约。

8.四川音乐学院:没有开设专门的信息检索课程。面对不同层次读者开设不同类型的培训讲座,讲座内容涉及各学科领域文献信息资源利用、该校各种网络数据库的检索技术等,培训讲座分为定期和不定期两种。

9.星海音乐学院:网站检索显示没有开设文献检索课,且没有发现与信息检索培训相关的信息。

通过以上调研发现,我国的音乐信息资源检索虽有研究涉及,且在教学中实践了多年,但发展缓慢不成体系,没有形成一套适合于音乐专业读者检索与利用的方法和规范,音乐专业师生大部分对信息资源的获取不够重视,信息检索意识和思维不强,遇到需要查找的资料时比较茫然。已开设的音乐信息检索课程院校很少,但几乎每个音乐学院的图书馆都会对本院师生通过各种方式进行各类的信息检索培训,可见信息检索这门课程在音乐专业院校图书馆的重要地位已达成了共识,只是由于音乐专业的性质和学生的文化素质等因素在行业内还不能引起足够的重视与关注。

二、常用音乐信息资源的类型

音乐信息资源按照不同的分类方式可以分成多种类型,本文主要按照记录文献的载体把资源分成印刷型和非印刷型,印刷型包括图书、期刊、报纸、乐谱、工具书,非印刷型包括缩微型文献、视听型文献和电子型文献,视听、电子型文献在音乐专业学习教学的过程中占有相当大的比重。

(一)音乐专业印刷型资源

1.图书:音乐专业图书一般包括音乐各学科专业的专著、教材(也称教科书)、论文集、资料汇编和会议论文。中图法中的J6是音乐专业类图书。

2.乐谱:音乐专业最常用资源,是将音乐通过特定的符号记录在纸张等载体形式上的一种文献形式。乐谱的种类非常繁杂,按记谱法分,可分有工尺谱、减字谱、简谱和五线谱,按记录不同的乐器,可分钢琴谱、吉他谱、古筝谱、琵琶谱等。在中图法中乐谱也属于J6类。

3.期刊:音乐类期刊通过CNKI检索共有45种,其中核心期刊有8种,它们是:《音乐研究》、《中央音乐学院学报》、《中国音乐学》、《中国音乐》、《音乐艺术》、《黄钟》、《人民音乐》、《音乐创作》。

4.报纸:是一种计划无限期地按期出版的连续出版物,音乐专业报纸资源比较少,常用的只有《音乐周报>和《音乐生活报》。

5.工具书:依据其编制目的、收录内容和用途,一般分为参考工具书和检索工具书。参考工具书包括音乐百科全书、年鉴、手册等。检索工具书包括书目、表谱、文摘、索引和图录等。目前世界上最大的音乐类参考性工具书是《新格罗夫音乐与音乐家词典》

(二)音乐专业非印刷型资源

1.缩微型文献:是以感光材料为载体,采用光学缩微技术将文字或图像记录在感光材料上形成的文献,分有缩微胶片、缩微胶卷、缩微卡片和穿孔式卡片四种形式。在实际应用中需要使用专门的阅读机进行检索查阅,所以作为收藏保存比实际应用更有优势。

2.视听型文献:是采用磁录技术和光录技术等手段将声音、图像等多媒体信息记录在光学材料、磁性材料上形成的文献。主要包括唱片、录音带、录像带、幻灯片、激光视盘等。此类文献存储信息密度高,内容直观,表达力强,但制作、阅读需要专门的设备。

3.电子型文献:是以数字代码方式将图、文、声、像等信息存储到磁、光、电介质上的文献。此类文献种类多、数量大、内容丰富,如:各种电子图书、电子期刊、联机数据库、网络数据库等。特点是存储量大,出版周期短易更新,传递信息迅速,存取速度快,信息共享好,但需通过计算机或类似设备阅读使用。endprint

三、常用音乐文献的获取途径

本文主要探讨印刷型音乐资源和非印刷型音乐资源的获取,数据库的优势是全、新、专,劣势是价格不菲需要购买,网络资源的优势是可以免费获取,但资源的质量和检索到的结果都有一定的随机性,需要检索者对其进行甄别区分。

(一)音乐专业印刷型资源的获取

1.图书馆

印刷型音乐资源图书馆收录较全也较新,尤其期刊、报纸的更新几乎与世面同步,读者可以通过图书馆的文献检索系统对图书馆的这类文献进行检索与利用。要想熟练掌握快速检索到这类音乐资源的能力,必然要了解的是《中图法》,音乐类在《中图法》类目体系中是从属于“J艺术”大类的二级类目,其下按照《中图法》类目设置的一般规律分为:“论、史、法、演”,并设置艺术类特有的“作品”类,下边是J6音乐类目的一个简单介绍:

①“论”即理论类,分为一般理论和专业理论,一般理论的类目是J60-J608。

②“史”即历史类,分为综合历史和专门历史,《中图法》将综合历史的类目归入一般理论类,其类目有J609-J609.9。专门历史类归入相关各类,如:器乐史入“J62器乐理论与演奏法”下。

③“法”即方法类,分为一般方法和专业方法,《中图法》将一般方法归入一般理论类,如:“J604音乐创作方法和经验”,而将专业方法归入各相关专业理论类,专业理论和专业方法类目是J61-J619.4。

④“演”即演奏法,《中图法》中把各专业理论与演奏法放到了一起,首先分为西洋乐器和民族乐器,然后划分乐器的类型,最后按各种具体的乐器分,如:“钢琴”、“小提琴”、“琵琶”等类目,该类目是J62-J633/637。

⑤“作品”类分为“中国音乐作品”和“各国音乐作品”,下一级分为各种类型的“声乐乐曲”和“器乐乐曲”,最后按各种具体的声乐形式或乐器,如“群众歌曲”、“艺术歌曲”等设置类目。此分类下的类目有J64-J65。

2.购买

除了通过图书馆查阅印刷型的音乐资源,对于急需的资源有时我们会通过购买获得,笔者列出了一些购买音乐类资源的途径:

①实地购买

市面上出版音乐类印刷型资源的出版社非常多,但就其专业型和权威性来说只有以下的几家,读者在购买音乐资源时注意鉴别,下面对其——进行介绍:

“北京天天文化艺术音像出版社”:是目前中国最大的艺术教育音像教材出版发行商;拥有中国地区最具权威及规模的专业音乐连锁书店。

“人民音乐出版社”:出版社以“忠诚、敬业、创新、卓越”为企业文化。以创建“中国第一、世界一流”的出版社为目标。

“上海音乐出版社”:以“既富有文化品位,又符合市场需求”为出书方针。

“中央音乐学院出版社”:其建社宗旨是充分利用我国几十年,尤其是最近一二十年中央音乐学院和其他音乐院校所积累的教学和研究成果,将它们公开出版,实现音乐教育资源共享。

②网络购买

在网络普及的今天,网络购书不仅为我们带来了便利,还节省了宝贵时间。下面是网络上几家专业经营音乐图书的网站。

a.北京音乐图书网http:I/www.book51.org/

是一家专业的音乐艺术教育音像教材网络出版发行商。秉承“我们热爱音乐、热爱艺术”的理念,以“权威、全面”的市场定位,为广大客户提供及时、周到的服务。

b.中国音乐图书网http:llwww.musicbookchina.com/

是一家新兴的音乐图书出版、乐器经营、音乐教学、商业演出组织策划于一身的文化公司,主要从事音乐类图书的制作、编辑、出版、发行。

C.天天艺术网上书店http://www.tt-art.com/shop/in—dex.asp

分类详细,几乎涵盖音乐类图书的所有类别,就笔者考察发现天天艺术的实体店比天天艺术网上书店的更新要及时,且各专业的资源更全面,网上书店相对滞后一些。

d.当当网

http://category.dangdang.com/cp01.07.21.00.00.00.htrrd

以图书零售起家,如今已发展成为领先的在线零售商,目前已是综合性购物网站,在音乐类目下可以找到音乐专业书籍共12630种,但由于不是专业音乐图书网站,分类较粗资源也不是很全。

e.亚马逊http:llwww.amazon.cn/ref=gno_logo

同当当网一样开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,目前在此网站检索到音乐类书籍共11910种。

(二)音乐专业非印刷型资源的获取

1.图书馆数据库

(1)外国音乐数据库

①国际音乐期刊索引与数据库(IIMP)

互联网上最全面的音乐期刊资源。包括20多个国家、1 7种语言的四百五十多种国际音乐期刊的索引和文摘,以及140多种音乐期刊的全文下载。

②牛津格罗夫音乐在线数据库

牛津大学出版社出版的多种音乐著作的在线版全文数据库,是当今唯一被公认最具权威性的音乐学术与表演艺术的在线百科全书。

③ASP世界在线

拥有超过30万首世界各地各个时期的音乐。拥有完全版权,读者可以在线欣赏全部内容,同时提供约五十万页的音乐参考资料。

④国际音乐表演期刊(IIPAFT)

表演艺术领域重要的在线资源,提供逾279种国际期刊的索引,以及118种期刊全文。

⑤IMSLP

截止到2013年4月诞生于2006年,从一开始就以“自由公共领域的音乐图书馆”为目标,借助于互联网强大的交互性搭建起一个巨大的免费乐谱下载平台。2日乐谱总量已达234,000张,唱片有有23,000张。endprint

⑥新格罗夫在线词典http://www.oxfordmusiconline.com/subscriber/

(2)国内音视频数据库

①KUKE音乐数字图书馆

国内首家专业音乐数字音乐图书馆。整合拿索斯(Naxos)、马可波罗(Harco Polo)、瑞士唱片公司(AVC)、德国唱片公司(Countdown)、中国唱片总公司(CRC)等国内国际著名唱片公司音乐资源,提供正版音乐点播服务。

②KUKE音乐视频图书馆

汇集歌剧、芭蕾、音乐会现场、音乐纪录片、爵士等从中世纪到现当代400部优秀音乐视频作品。

③超星学术视频

超星公司拍摄制作的、具有学术前沿性的、拥有自主知识产权的网络学术视频网站,音乐学术视频有128个专题,由多位海内外名师学者主讲。

3.网络

随着互联网络的飞速发展,网上音乐资源已经达到了相当的规格和规模,网络音乐信息资源主要以音视频资源为主,籍由于此,本文介绍几种常见的音视频格式和网络音视频资源的检索方法和途径。

(1)音视频格式类型

①音频常用格式:

MP3常用的音频文件格式。优点是容量小。属于有损有压缩,所以在声音方面还是有些衰减的。

WAV大家最一般CD直转无损无压缩的格式就是这个。由于是无损无压缩,衰减的最少,理论上是不衰减,所以声音也是最好的,但是容量比较大。

APE是WAV的转压格式的一种,是无损有压缩。声音基本与WAV一样,但是容量约为WAV的2J3。

FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。它不会破坏任何原有的音频资讯,可以还原音乐光盘音质。

②视频常用格式:

AVl它的英文全称为Audio Video Interleaved,即音频视频交错格式,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,但是其缺点是体积过于庞大。

MPEG MPEG-1是我们熟悉的VCD制作格式,文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。

MPEG-2主要应用在DVD的制作方面,常用的DVD光盘就是采用MPEG-2标准压缩,这种视频格式的文件扩展名包括.mpg、mpe、mpeg、m2v及DVD光盘上的.vob文件等。

MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。这种视频格式的文件扩展名包括.asf、mov和DivX、AVI等。

FLV是FLASH VIDEO的简称,视频网站大都采用这种格式。FLV流媒体格式是随着Flash HX的推出发展而来的视频格式。它形成的文件极小、加载速度极快。

(2)网络音视频的获取

①音频

笔者列出常用的14家音频网站,网页的功能布局大体类似,都提供在线试听和下载功能,更新很快,大部分音频网站都做有自己的客户端,对于智能手机用户使用非常方便,音频格式提供mp3、wma、flac等格式,分有普通音质和高品质音质,但一般高品质音质需要收费才能下载。

百度音乐http://music.baidu.com/

搜狗音乐http://mp3.sogou.com/

酷狗音乐http://www.kugou.com/1153

酷我音乐http://www.kuwo.cn/

QQ音乐http:∥y.qq.com//type=1ndex

一听音乐网http:llwww.1ting.com/

九酷音乐http:llwww.9kU.COm/

九天音乐http:I/www.9sI(y.com/

365音乐网http:/A~ww.yue365.com/

SOSO音乐http://music.soso.com/1ndex.html

虾米音乐网http:llwww.xiami.com/

网易云音乐http://music.163.com/

多米音乐http:/Avww.duomi.COm/

咪咕音乐—移动音乐门户http:I/Www.migu.cn/

②视频

网络视频网站中的视频不仅种类繁多,内容也是鱼龙混杂,同时一部分的视频画面效果不清晰,但很多的最新音乐会、单曲等视频会有网友传到视频网站,大部分网站设有专门的音乐类别,这就需要检索者对其进行分辨甄别,视频网站的视频多是FLV流媒体格式,可以下载并通过搜索引擎检索。限于篇幅笔者仅列举出其中常用的9个网站:

优酷网http://music.youku.com/

爱奇艺http://music.iqiyi.com/

土豆网http://music.tudou.com/

搜狐视频http://tv.sohu.com/musiC/

迅雷看看http://yinyue.kankan.com/

新浪视频http://video.sina.com.cn/mv/

56网http://music.56.com/

酷6网http://mv.ku6.com/?hpsrc=1—8—6—7—0

乐视网http://music.1etv.com/

③其他音乐专业网站

网络音乐网站浩如烟海,笔者仅列出几个个人认为音乐专业常用,且不同专业方向的网站信息做以代表,包括钢琴、声乐、中外器乐等:endprint

周广仁钢琴艺术中心http://www.zgr.com.cn/

由周广仁教授与北京锡华集团共同创办的专业化钢琴艺术培训机构,网站上有不少值得学习借鉴的资源信息。

流行钢琴网:http://www.popiano.org

提供各种钢琴谱,钢琴曲,流行钢琴曲谱。论坛很不错,是目前国内所有钢琴论坛里讨论气氛最浓厚的。

虫虫钢琴:http://www.gangqinpu.com

是十年的老牌钢琴网站,特点是钢琴谱特别全,资源可以下载,需要注册。

星夜钢琴网http:llwww.cpiano.com

中国钢琴第一门户网站,拥有最热闹的钢琴交流论坛,设有钢琴教学、钢琴选购、音乐欣赏、钢琴曲、钢琴谱下载等栏目,需要注册。

青歌赛官网http://qgs.cntv.cn/1 5/1ndex.shtml

收录历届青歌赛视频,是声乐专业学习者值得查阅的地方。

天津音乐学院音乐资源库http:I/www.tjcm.edu.cn/yyzy/main.htm

类别丰富,几乎涵盖音乐专业所有类别,可以在线欣赏,音质完美。

中国乐器协会网http:IA~ww.cmia.com.cn/

可查阅到行业内最新新闻公告,各种乐器品牌发展现状。

中国古曲网http:llwww.guqu.net/

为中国古典音乐喜好者提供古典音乐试听、中国古典音乐欣赏,发扬中国古典音乐国之文化精髓,资源可在线试听并下载,需要注册。

中国二胡艺术网http://www.erhuart.cn/toplista.asp?id=262

提供与二胡相关的各类信息,提供音视频下载,需要注册。

中国古筝网http:llwww.guzheng.cn/

古筝门户网站,名家名曲这里都能够检索得到,并提供下载。

搜谱网http:I/www.sooopu.com/

全国最大的歌谱搜索引擎,是一个专业的歌谱搜索网站。

结话

在整理音乐信息资源的过程中笔者发现,要想把音乐资源的检索规范成体系课程。需要我们投入更大的努力,音乐文献信息资源检索是一项具有深远意义的工作,在信息技术高速发展的今天,我们图书馆工作者要不断学习,调整自己的教学检索模式,找到一条适合于音乐专业学习的信息检索道路。①邓珞华、董讯《音乐信息检索》,高等教育出版社2006年版。②徐波《音乐音响文献检索与利用》,哈尔滨地图出版社2007年版。③[EB]http://baike.baidu.com/link?url=dlRfwlJQmZmt4kyDDP6xP一

2Yut97SVSV9u0QpeM69Q019H6r5adL50i7nwQVGODe.马琳

石家庄学院音乐学科馆员

信息资源的开发与检索 篇4

随着互联网的发展, 网络信息资源已成为当今世界上最大的信息库和全球范围内传播知识的重要渠道。面对如此众多的网络信息, 人们如何在浩如烟海的信息海洋中快速、准确地寻找到自己所需要的有用信息?如何对网上的信息资源进行筛选, 去其糟粕, 取其精华?如何对有用的信息资源进行有序的组织、整理?本文就此问题进行探讨。

1信息资源的开发

1.1立足实际, 制定科学的开发原则

在网络环境下, 研究所应从实际出发, 根据自己的发展规划, 制定出科学的采集原则, 并以此作为采集工作的依据。所制定的采集原则, 必须体现以下要求:① 采集工作的重点必须随着工作重点的转变而转变, 及时地调整各专业、各层次、各载体类型的采集比例, 明确各类信息采集的先后顺序, 以满足发展变化的要求;② 所采集的信息, 在内容上要体现专业特色, 要具备一定的科研价值、参考价值和指导价值;在深度上要体现专业的最新前沿, 反映专业学科内容新进展和最新研究成果;③ 在有限经费的条件下, 首先要保证以重点专业建设为主的信息资源的采集, 根据重点专业的设置和变化, 及时调整采集结构, 形成有特色的信息资源布局, 从而发挥有限经费的效益, 真正满足重点专业建设的需要。

1.2熟悉网络信息资源特点及分布状况

了解常用信息资源的特点和分布方式, 如国内外著名的科研机构、信息发布机构的特点和网址, 及时准确地获得这些权威机构发布的信息, 可以帮助用户及时掌握最新科研动态。

1.3合理配置信息资源

由于对信息资源在时间、空间、数量3方面的配置存在不同程度的问题, 即在空间的分配不均匀, 时间的分配不合理, 数量的分配不均衡, 所以优化配置网络资源尤为重要。在空间上注重网络资源在不同地区、不同行业部门的分布, 在数量上对各种各样网络信息资源采取合理比例配置, 在时间上调整好网络资源在过去、现在和将来3种时态上的配置。

1.4加大电子文献的采集力度, 优化采集结构

电子出版物包括电子期刊、电子报纸、光盘图书、网络图书和软件读物等。与传统出版物相比, 电子出版物有着存贮量大、检索便捷、在网络环境下应用面较广等优点。电子文献由于具有体积小、容量大、检索方便等特点, 越来越受到广大读者的欢迎。电子文献的采集已经成为信息资源采集的一个重要组成部分, 而且所占的比例呈现出逐步上升的趋势。因此, 应根据自己的实际需要, 合理加大电子文献的采集力度。电子文献一般分为2类:① 普通电子出版物, 主要是指以普通光盘形式发行的电子文献;② 网络电子出版物, 主要是指利用计算机网络出版发行的电子图书、期刊和图像等电子文献。网络电子出版物可根据需要, 有选择地下载到数字图书馆的网站上, 或利用有关的检索和浏览工具, 查阅所需要的信息。普通电子出版物, 应侧重于各类光盘数据库的采集, 尤其是以采集一次文献数据库为重点。例如, CNKI中国期刊网络数据库是以各学科领域的带头期刊、核心期刊构成基本框架的全文信息检索系统, 收录了1994年以来的中文 7 000种学术期刊题录和3 500种核心期刊全文, 这类光盘是采集的首选。目前, 在光盘镜像上的技术也较成熟, 现在有大容量的光盘镜像服务器可以利用, 它可将上千片的光盘镜像到硬盘上, 而且多能提供局域网上检索。但是, 应当尽量购买能够用web浏览的电子出版物, 以满足各类读者需求, 实现最大程度上的资源共享。

1.5网上信息资源是信息资源采集的重要组成部分

在重视电子型文献采集的同时, 也要重视网上信息资源的开发利用。具体的做法主要有:① 借助搜索引擎。因特网上的信息量非常巨大, 为了方便利用因特网上的信息, 网络信息检索迅速发展起来, 其主流是万维网信息检索, 即搜索引擎。现有数百种搜索引擎投入使用, 供用户进行自动化的搜索。只要给出关键词, 搜索引擎就可以在数万计的网页中迅速地筛选出所需要的信息。根据发展目标和主要用户的要求, 借助百度、Google、Yahoo、EXCI TE、ALSTA和VISTA 等搜索引擎, 寻找、收集所需信息源, 通过资源指南查找各种相应的信息, 然后将检索获得的各种信息分门别类, 按一定的主题进行加工、整合, 形成特定用户需要的序列化的有效信息资源;② 利用软件的方式。如元数据编辑器和元数据生成器, 实现与全球计算机的自动联接, 将对方万维网服务器上的主页或文章等信息自动取回, 自动置于HTML文件或XML文件的META标记中, 并进行排序或索引, 形成一个庞大的主页信息数据库, 为用户提供所需信息;③ 建立指引库。利用在因特网上建立专业性的信息资源指引库的方法, 帮助用户集中查找网络上的专业信息, 这样可以大大节省用户的查找时间, 提高检索速度;④利用TRS信息采集系统。TRS搜索引擎由3部分构成:采集器、索引器和检索器, TRS智能化网络资源采集机器人担任网络信息或者企业内部非结构化信息的采集工作, TRS 全文数据库服务器提供海量信息的分布存储和即时索引, 并提供全文检索和多种特征检索功能, 和多种输出结果处理功能。利用TRS信息采集系统每天在指定网站上抓取所需信息, 将抓取到的信息经过筛选、分类、排序后存放在本地服务器上, 再发布到数字图书馆的工作网站上。

1.6比建立信息导航库

为了提高用户检索的检准率和检全率, 为了使网络信息有序化, 建立学科信息导航系统, 利用各种搜索引擎对某一主题信息上网查询、浏览并参考有关文献, 选择价值较高的信息资源, 由专业人员经过加工、组织、归类和设置类目, 形成新的知识关联, 产生更高层次上的综合信息产品, 方便用户查询。

由于网络信息资源具有数量巨大、种类繁多、分布广泛和变化频繁等特点, 读者使用网络资源受到各方面的限制。为了方便读者和建设本馆虚拟馆藏, 可以利用建立专业导航库的方式将与专业相关的网址、二次文献和一次文献、全文数据在网页上组织, 以简单、有效的方式提供读者使用。读者可不必再在纷繁复杂的网络资源中去寻找有所需的专业信息, 而只需进入图书馆提供的专业导航库即可检索到最新、最全的专业文献信息, 如研究方向、学者名录、电子出版物、会议信息、研究机构和学科介绍等。

导航库的组成主要有3部分:① 反映该专业国内外信息资源的网址;② 原始信息;③ 一套方便信息组织和用户查询的检索系统。导航库的建设是突破传统信息资源建设模式的一项关键技术, 也是对新型信息服务模式的一种探索。

1.7加强网上搜集, 增强针对性

对重点学科的课题除进行定期服务、跟踪服务和信息调研等服务外, 还要有针对性地广泛搜集实用网址。这样做, 不仅使用户从虚拟馆藏中得到现实的信息资源, 且深化了网络信息资源服务层次。

2信息资源的开发技术

2.1Push技术

所谓Push技术是一种基于客户服务器机制, 由服务器主动的将信息发往客户端的技术。与传统的拉技术 (Pull) 相比, 二者最为主要的区别在于前者的是由服务器主动发送信息, 而后者则是由客户机主动请求信息。作为Internet的一种新技术, Push技术提出了新的服务模式, 即核心点放在服务方, 在信息发布获取就用中它表现为Push服务器自动搜集感兴趣的信息, 并将其定期地传送给用户。其表现形式为:Web服务器扩展;客户代理方式;Push服务器方式。

2.2WWW信息挖掘技术

WWW的数据信息挖掘是指从大型数据库的数据中提取出用户感兴趣的文本型知识, 这些知识是隐含的、事先未知的、潜在的有用信息。而网上文本信息的挖掘是在已知的数据样本基础上, 得到数据对象词的内在特性, 并以此为依据在网络上进行有目的的信息提取。这种信息挖掘能自动地提取相关文献之间的有价值的关系知识, 并将这些知识以可视的、动态改变的方式反馈给用户。可视方式为用户提供了以直观的易于快速理解的知识掌握途径, 而动态改变的方式则满足了用户的及时性要求。它由特征提取、源信息采集和特征匹配3部分组成。特征提取负责根据一定的算法和策略, 从现有的样本文档中提取出其内在的特征, 即进行挖掘目标的特征提取;源信息采集负责从WWW上选择下载原始文档, 这部分工作一般由多个具有一定启发策略的Robot ( Robot是一个能沿着Web页面中的超链接进行自动漫游, 并通过HTTP等标准协议读取漫游到页面的程序) 完成;特征匹配是利用挖掘目标特征判断源信息的相似度, 即进行相关信息的提取。

2.3联机分析处理技术

首先联机分析处理 (OLAP) 与数据挖掘 (DM) 是基于数据仓库 (数据库) 技术而发展起来的信息分析与挖掘工具, 在实际应用中各有侧重。前者是验证型的, 后者是挖掘型的。OLAP建立在多维视图的基础上, 重在根据已有的模式将直接源自数据仓库中的不同信息源的大量相关信息联系起来, 以给分析人员一个清晰、一致的视图。DM建立在各种信息源的基础上, 重在发现隐藏在大量原始数据深层中的对用户有用的模式。被抽取的即知识, 具备可靠、新颖、有效、易于理解的特点。其次, OLAP与DM相结合, 即OLAM, 兼有OLAP多维分析的在线性、灵活性和DM对数据处理的深入性, 因而可在更高层次上满足网上信息分析与挖掘需求。联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取, 允许管理决策人员对数据进行深入观察。决策数据是多维数据, 多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作, 侧重对决策人员和高层管理人员的决策支持, 可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理, 并且以一种直观而易懂的形式将查询结果提供给决策人员, 以便他们准确了解对象的需求, 制定正确的方案。

3信息资源的检索

3.1网络时代信息检索的特点及变化

信息检索就其方式而言, 可分为委托检索和直接检索。在脱机和联机检索时代, 由于受设备条件和检索技巧等限制, 用户的检索多表现为委托性检索。 然而, 网络时代的到来使许多情况都发生了很大的改变。首先, 网络的触角已延伸至各个领域、各个地区, 并已开始走入寻常百姓家。其次, 大量的信息资源 (包括电子图书、电子期刊、数据库、各式各样的网站、讨论组等) 都被挂在网上, 面对如此众多唾手可得的信息, 信息用户激起了自己检索信息的欲望。第三, 评判检索效果有二个重要原则, 即相关性原则和适用性原则。相关性原则只是用于评判检索结果和用户提问之间的相关程度, 适用性原则才真正用来评判检索结果的有用程度。而委托检索往往会受用户表达方式、表达能力以及用户和检索人员的交互程度等的限制, 所用的检索提问往往不能准确地反映出用户的检索本意, 只有在用户的直接检索中, 用户才能即时通过自己的判断, 不断地选择、调整检索提问, 制定检索策略, 从而达到最好的检索结果。由此可见, 网络时代的用户检索, 将更多地表现为直接检索。

3.2引进全文检索数据库

网上信息资源以网络传输为主, 目前许多著名的数据库检索系统已经上网供用户检索, 常用的有DIALOG系统、STN系统、万方数据库资源系统、中国科学院科学数据库系统和CNKI中国期刊网络数据库等。其中最著名的是DIALOG系统, 它是世界上最大的联机检索服务机构, 有600多个数据库, 涉及到全文型、数据型、事实型和指导型的数据库, 有近3亿条记录。涉及的学科专业范围广、检索功能强、数据更新及时、文献数据时间跨度大, 是项目查新、文献调研、课题立项、论文撰写和专利申请等重要依据。它可通过Telnet方式联入, 也可通过WWW方式联机的超文本界面。

3.3网上信息直接检索方式的实现

检索的实质是检索标识和文献标识之间的匹配。文献标引为了避免产生歧义, 采用的是受控的人工语言。 作为标引的逆过程的检索同样也必须采用人工语言, 才能实现检索标识和文献标识的精确匹配, 而进行直接检索的普通用户却不大可能熟练地掌握人工语言, 因此, 必须在用户所采用的自然语言和文献标识采用的人工语言之间架起一座桥梁, 使普通用户能够在网上进行直接的检索。要实现这种网上资源的直接检索方式, 也必须利用上文所提到的分类主题帮助词表。用户在检索时可以用能体现自己检索意图的自然语言输入, 系统会自动提示和该自然语言相关的人工语言标识, 用户判断、选择后再按照范例提示合理组配检索标识之间的逻辑关系, 既可实现有效检索, 还可视检索的结果随时利用上位类、下位类标引词扩大或缩小检索范围;另外, 元数据标签中包含的其它信息均可作为检索途径, 和主题一起组成高级布尔逻辑检索、 加权检索、 限定检索等途径, 提供对网上资源的有效检索利用。

4结束语

随着计算机网络技术的不断发展, 网络环境下信息资源的组织也会不断发生变化, 不断提出新的挑战。新技术的出现为充分利用网络信息资源提供了有利的工具和基础, 如何将其充分利用到信息资源的采集和检索中, 为科技人员提供丰富的参考资料是进一步要做的工作。

参考文献

[1]程文娟.网上信息资源的开发利用[J].现代情报, 2004 (4) :16-17.

[2]魏仲建.开发网上科技信息资源的途径与方法[J].情报杂志, 2001 (8) :65-66.

资源组织与检索 篇5

当前,基于知识组织系统的文献检索方式主要是从文献关键词的语义角度出发,通过基于分类表和叙词表及知识本体的文献检索、基于文献关键词的标引和分词检索、基于关键词的语义检索以及叙词表重构式检索等检索方式,以自动化标引为检索手段,实现的文献检索服务。其中,借助叙词表中的概念语义关系扩展与精化的用户检索式,是各种网络信息检索工具提高其检索性能的常用方法。

此类文献检索服务以查阅、概念检索、词汇归纳等文本内容为核心,主要体现在文献信息的关键词语义扩展检索和文献信息的大众分类法的检索两种模式上。基于文献信息的关键词语义扩展检索模式,主要通过分析文献信息的关键词自身概念与语义概念间的关联性,并对文献信息关键词自身的词性进行标注,突出文献信息关键词的核心概念与语义,再借助关键词自身概念与语义概念的关联,实现基于关键词本体的文献信息语义检索。语义检索能处理信息的语义内容,实现基于语义的匹配和推理。该检索方式突出了文献信息中核心概念与文献信息关键词语义的串联,并将文献信息的核心价值通过文献的关键词标引进行充分的体现,使得检索结果与文献信息需求的关联度大幅增加,减少了用户需要筛选的检索结果数量,提升了检索的速率,提高了检索结果的准确度。而基于大众分类法的文献检索与传统分类法相比,更加注重检索者的检索习惯,通过依照知识组织分类法处理各项文献和检索用户自定义的自由词作为数字资源标注整理,实现检索与浏览的功能,使得检索过程更加便捷有效。

现阶段,对独立创建的知识组织系统的映射和服务协议是实现知识组织系统互操作的主要方式。当前,基于知识组织系统的文献检索研究主要是通过将关键词语义和文献分类法与文献的关联为基础,实现类似将分类主题词表和元数据集成在一起构造一个知识网络并在其上实施知识浏览和概念检索。这种检索模式在一定程度上提高了文献检索的便捷性和全面性。

资源组织与检索 篇6

一、网络建筑与土木工程信息资源的分布

(一) 网络电子出版物资源

从上世纪90 年代开始, 电子出版物便作为一种新形式的信息载体得到快速发展, 它在图书馆文献资源建设中起着至关重要的作用, 且很大程度上影响着学术交流, 以及图书馆信息资源建设。根据电子出版物的源文献体系, 可将其具体细分为以下这几种类型 (1) 。

(1) 汇编型。汇编型主要是通过将散列的印刷品集中收集在一起后, 再予以编排并制作成电子出版物。

(2) 原著型。根据印刷品的原著为依据, 制作的相关电子出版物, 便是原著型。目前很多期刊为了扩大宣传力度, 同时也为了使读者的检索和阅读更加方便, 都有在网上建立自家的网站。

(3) 检索型。检索型主要是将印刷型检索工具作为依据的电子出版物, 通常是在电子出版物出版的同时, 印刷品也随之进行出版。印刷品通常是这些检索刊物的最初出版形式, 在检索刊物的编排从以往的手工式转变为如今的电子化后, 其电子版本便作为附属品一起得到发行。并且, 随着社会信息化的加速进程, 计算机检索因其多途径和快捷性以及灵活性等特点, 受到广大用户的欢迎与喜爱, 致使原来是主要产品地位的印刷品形式已经成了附属品, 而原先作为附属品的电子版本占据了主要地位。

(4) 电子型。电子型的这种电子出版物一般没有印刷品, 随着科技的迅猛发展和信息化的快速进程, 如今电子型的出版物已经逐渐占据了市场的主导地位。

(二) 网上图书

现代社会已经逐步迈向信息技术化, 且国际互联网的普及范围也逐渐在全球普及, 信息的类型更加丰富, 信息量也更大, 网上相应而生了越来越多的电子图书。不得不说, 在网络变得普及化的今天, 信息的传阅及其记载早已不再仅限于传统的纸张上, 电子图书因其方便、快捷且价格更低等优势, 给传统图书带来了很大的威胁。网络上的图书形态也比较多, 网上图书馆、虚拟图书馆以及数字图书馆等等, 无一不给传统的图书和阅读模式带去了巨大的冲击。

(三) 科技成果类资源

(1) 科技成果。该成果主要是对研究工作进行报道, 以及开发调查工作的成果, 或是进展状况的一种文献类型。科技成果的内容通常都会在有关主管部门的检验和鉴定通过之后, 才予以出版发行, 而且传播速度快, 故而可靠性强、成熟度高、且题材也较为新颖, 是一种十分重要的学术信息资源。

(2) 专利。现如今, 人们的专利意识逐渐增强, 很多人都开始查找专利信息, 有些科技人员不太清楚正确的检索方法, 想在犹如满天繁星的文献中, 快速而准确的查找到自己需要的文献, 可以说是一项较为繁琐且极为耗费时间的工程。网络上的各种专利信息资源越来越丰富, 多半的文献资源都能被查找到, 而且还能将整个专利文献下载下来, 这毫无疑问给人们带去了更大的便捷。

(3) 标准。该项资源主要是基于科学、技术以及实践的综合成果基础之上, 在有关方面协商一致后, 主管进行批准, 而后以特定的形式发布出去, 并将其当做共同遵守的准则及其依据。

(四) 网上会议文献资源

科技情报的一项重要来源之处便是学术会议及其文献, 新产生但是还未成熟的科研情报便是通过它进行传递, 相比起科技期刊, 网上会议文献更为直接和快速。学科领域中那些新发现或是新发明的重大事件, 网上会议文献对其首次报道率最高, 它能让人们及时、全面的了解清楚有关学科领域的各项发展状况。

(五) 网上学位论文资源

学位论文即是指学生在由导师的指点与引领下完成的理论研究总结, 并通过系统的一种理论研究, 学位论文代表了专业的发展方向, 有着一定的前瞻性。

(六) 网上机构与名人类资源

该类资源代表了宣传科研机构的发展现状、科研成果, 以及获得个人情况和科学研究等比较权威实用的数据资源。

二、网络土建信息资源检索策略

(一) 检索工具的选择

对于比较具体的检索课题, 检索时应选择专业性高且学术型强的文献信息, 从而确保检索结果的权威与全面。此外, 对数据库的选择, 首先应按照具体的课题寻找对应的数据库, 并看它是否容易获取到原文;其次要看数据库的收入年限, 通常是时间距离现在越近越好;最后查看数据库的更新频率是否够快。

(二) 确定检索项

(1) 明确课题的专业范围和方向后进行检索, 并依据检索的具体要求进行检索。

(2) 在课题中选出最为合适的词语或句子, 以此为基准确定检索项。

(3) 为避免词句间出现逻辑混乱, 还应充分考虑好检索项间的逻辑组配, 并将检索表达式编制好。

结束语

总之, 随着全球信息化的加速进程, 世界各国都逐渐开始了信息化建设, 基于这种环境背景的支撑, 极大加剧了建筑与土木工程的网络文献增长速度, 大量的土木工程类文献资源均已被纳入到众多的大型综合性数据库中。不过网络文献在逐渐丰富的同时, 也变得更加分散, 那么为了获得更好、更专业的学术信息资源, 还得靠人们孜孜不倦的去探寻、去发现。

参考文献

[1]王瑛.基于网络的建筑与土木工程信息资源分布及检索策略研究[J].晋图学刊, 2010, 01:6-8.

[2]罗词兵.计算机远程网络检测系统在土木建筑工程中的应用[D].福州大学, 2002.

资源组织与检索 篇7

我们以多媒体图像教育资源为研究对象, 以多尺度图像内容检索技术为支撑, 探索适合于多媒体图像教育资源的检索与挖掘实际算法与技术, 对教育教学资源系统平台智能化的基础技术发展有着重要的理论意义。

教育教学资源系统平台的智能化是当前全世界的一个研究热点[1], 如何有效地提高现有的教育教学资源系统平台及其大量资源, 特别是图像资源的利用率, 是教育信息化中要迫切解决的一个难题, 而教育信息智能化则是解决这一难题的一个重要研究课题。教育教学资源系统平台的智能化目前正朝着海量信息的检索与挖掘的方向发展, 特别是对文本、图像、视频甚至动画等大量多媒体信息进行有效的检索与挖掘[2,3,4,5], 以为教师、学生提供真正需要的信息资源。

我们是从教育教学的实际需要出发来进行研究的, 其研究过程中所开发出来的软件对信息化过程中的教育教学有着相当的促进作用, 能够一定程度上满足多媒体图像教学资源的检索与挖掘实际需要。

1图像教育资源特征

从教育资源的角度来看图像, 我们关注的是图像的教育教学意义。一幅图像, 在不同学科的教育教学中可以有着不同的作用, 特殊的可以是图像的色彩、纹理等, 但在我们正常的教育教学中最自然的作用是其图像中的内容本身的意义, 是其中的人、物、风景等一个个的自然对象。在相当多的情况下, 我们甚至不在乎它是彩色的还是黑白的, 我们关注的是图像中的对象本身对本学科的影响, 这就是图像教育资源的面向对象特征。图像教育资源的面向对象特征是与人们观察与思考现实世界是一致的, 我们看到的世界就是从夸克到宇宙等大小不同层次粒度的对象, 这些对象也就自然而然地反映到我们的图像中来。

对于图像教育资源的面向对象特征我们有以下假定:

① 图像教育资源中的对象粒度根据各门学科不同的需要可以调整, 默认以普通粒度为标准。一般地, 一个人、一个物体、一棵树等为一个对象。对象要有相对完整性, 其粒度不能过小, 也不能过大。

② 对象部分残缺、被遮挡、模糊、形变 (变形和变换) 、噪声等在相当的限度内不影响人们对对象的认识, 也不影响其正常的教育教学意义。树少了一片叶子, 人缺了一只胳膊, 房子前站有个人, 及从不同角度得到这些对象, 都不妨碍人们对树、人、房子的认识, 这些对象我们都认为是有效对象。

③ 对象与坐标无关性。对象无论是在图像中哪一个位置, 旋转了哪一个角度, 被放大了或缩小了, 仍还是这个对象, 它不会因为时空变化而变化。我们认为经过平移、旋转、缩放后的对象是同一个对象, 它们并没有改变其内容上的教育教学意义。

④ 同一粒度下, 对象被分解成各子对象, 各子对象可代表该父对象。在进行相似性比较时, 父对象的比较可以转换为其各对应子对象的比较, 其对应子对象的比较方法可通过递归其父对象的比较方法来完成。

⑤ 相似度相近的对象的比较具有可替换性。一个对象的子对象, 被另一个对象的相近的子对象匹配了, 对匹配的结果没有本质的影响。

后面的工作都是面向以上假定展开的, 这些假定是对图像教育资源的面向对象特征理解的基本原则, 我们不加证明地默认了它们。

2图像教育资源描述

对图像教育资源的描述, 可以以文本的方式从基于教育资源规范的角度来进行描述[6,7], 还可以从其它角度来描述, 我们关注图像教育资源的面向对象特征的描述。对图像中的对象的描述, 可以是颜色、纹理等, 我们进一步关注其形状, 形状代表了对象的总体构型, 是对象最直观的教育教学意义。

对象的形状及其各子对象的形状由其各自的轮廓、内部区域特征及其骨架来表征, 具体如下:

① 对象形状仿射与射影变换不变性的表征 无论是从哪一个角度看对象, 该对象的基本教育教学意义是一样的, 不会改变该对象的本质意义, 其不变性由简比来表征, 相同简比的两个对象可以看作是相同的;我们无论是以何种深度的透视看对象, 该对象的基本教育教学意义是一样的, 不会改变该对象的本质意义, 其不变性由交比来表征, 相同交比的两个对象可以看作是相同的。

② 对象轮廓不变性的表征 对象轮廓代表对象形状的基本特征之一, 与对象的大小、位置、方向无关, 是一个对象区别于另一对象的基本标志, 我们在以下几个方面对对象的轮廓加以描述:

对象轮廓的粗糙性与不规整性由幅度变化S1、歪斜度S2、峭度S3与归一化中心矩S4刻画, 用边界序列矩[8]表示;对象轮廓的统计分布边缘相对不变矩[9]来表征;对象轮廓的频率系数由Fourier描述子表征, 归一化的Fourier描述子用d (u) =‖A (u) ‖/‖A (l) ‖表示;对象轮廓的均值、方差由Bandelet块小波系数[10]来表征。

③ 对象形状区域特征不变性的表征 对象区域代表对象形状的实体, 其与对象的大小、位置、方向无关的刻画也是一个对象区别于另一对象的基本标志, 我们在以下几个方面对对象的区域加以描述 (其面积A、周长L、能量Si均由像素来表示) :圆形度用F=‖B‖2/ (4πA) 表示;离心度用E=1+ ( (m0-m2) 2+4m1) /A表示;紧密度:S=A/L;伸长度: (体态比) Z=a/b;能量带[11];几何不变矩统计分布;Zernike正交矩描述子。

④ 对象形状骨架特征不变性的表征 骨架是区域的中心轮廓, 是对形状的支撑性的刻画。骨架特征不变性由Snake能量[12]来表征:

其中s是轮廓的参数, v (s) 是轮廓上的点;轮廓的内部Esnake=∫01Eint (v (s) ) +Eimage (v (s) ) +Econ (v (s) ) ds, 能量Eint (v (s) ) 表示由于弯曲而产生的样条的内部能量;图像能量Eimage (v (s) ) 代表由图像力产生的势能;Econ (v (s) ) 代表外部能量。

⑤ 对象形状复杂度不变性的表征 对象形状复杂度由对象的子对象个数N来确定 (不包含子对象的子对象) , 同时也表征了对象的凹凸程度。

以上特征参数的选取是依据图像教育教学资源的实际面向对象特征而定的, 我们由此来确定下面的面向对象的图像教育资源多尺度检索方法。

3面向对象的图像教育资源多尺度检索设计方案

小波分析因其超越于傅立叶分析的众多优点, 已成为继傅立叶分析之后的有力分析工具。小波分析在一维时所具有的优异特性并不能简单的推广到二维或更高维, 由一维小波张成的可分离小波只具有有限的方向, 不能“最优”表示含线或者面奇异的高维函数, 而事实上具有线或面奇异的函数在高维空间中非常普遍, 特别是自然物体光滑边界使得自然图像的不连续性往往体现为光滑曲线上的奇异性, 以Curvelet变换和Bandelet变换为代表的图像多尺度几何高维函数的最优表示方法解决了这个问题, 我们采用Bandelet变换来解决图像教育资源中对象的获取的问题。

对图像教育资源中对象的获取及对象区域、轮廓与骨架的获取是进行面向对象的图像教育资源多尺度检索的基础。面向对象的图像教育资源多尺度检索流程如图1所示。

① 图像小波多尺度分解。对原图像f (x, y) 进行二维正交或双正交离散多小波变换 (一般分解层数J ≥ 4 ) , 得到小波多尺度分解系数图f1, f2, …, fn (子带图像的子标标号规则为按水平方向优先由低频到高频排列) 。

② 对所有子带图像f1, f2, …, fn 进行能量计算, 能量小于或等于事先由直方图分析得到的某一阈值T 的, 认为不影响后续处理效果, 从而不作处理, 能量大于T的则标记作后续处理, 不妨设需要处理的子带图像为f1, f2, …, fj

③ Bandelet块获取。对需要处理的子带图像f1, f2, …, fj在各个尺度三个方向上的系数作二进四叉树剖分, 四叉树叶结点对应的剖分子区域即为Bandelet 块。

④ 四叉树的修剪。对需要处理的子带图像f1, f2, …, fj 进行软阈值函数去噪与平滑, 得到平滑去噪的图像S1, S2, …, Sj

x是小波系数, T是去噪量化阈值, 则x的软阈值函数[13]为:

η (x) =sgn (x) ×max (|x|-Τ, 0) Τ=Τs=argmins>nER (t) ER (t) =1Νi=1Ν (|Yi|^t) 2+σn2+2σn2Νi=1ΝΙ (|Yi|<t)

fθ表示二进剖分块内二维小波系数经过曲波变换的一维数据, 是fθ通过η (x) 去噪后, 对无噪信号的逼近结果。最小均分误差MSE 计算式为:

ΜSE=1n2i=1nj=1n (fθ-fθ^) 2

MSEN>MSEN1则进行合并即取Bandelet块剖分块替代该次小分块。

⑤ 对平滑图像S1, S2, …, Sj 作用梯度检测算子, 得到梯度图像T1, T2, …, Tj, 将梯度图像作为分水岭变换的初始输入图像, 进行分水岭线的标记, 得到初始分割图像W1, W2, …, Wj

⑥ 对合并后的图像进行逆小波变换, 得到重构图像S, 即与原始图像大小相同的分割图像, 最后输出分割图像S

⑦ 统计S的对象及其子对象的数目NNi

⑧ 对各对象中的子对象依据其大小排序, 由各对象中最多子对象的阈值Nmax确定参与相似度比较的各子对象。

⑨ 确定参与相似度比较的各子对象的形状及其各子对象的形状由其各自的轮廓、内部区域特征及其骨架等特征的参数。在上面的五大特征中, 其各自的相似度的确定采用归一化均值加权的方式进行。

⑩ 判断当前图像中对象数目Ni与待匹配图像中对象数目No大小, 不妨设Ni>No则相似度匹配法则为:从待匹配图像No中取1个对象m (mNo) 与匹配图像Ni中所有对象 (当前为n, nNi) 进行匹配 (以递推的方式处理各子对象) , 设相似度为 (m, n) , 取Sim (r) =min (m, n) , 反复至No比较完, 得图像匹配相似度为∑Sim (r) , r:1, 2, …, No

4面向对象的图像教育资源多尺度检索平台实现

封装、继承、多态是面向对象技术的基本特点。我们使用面向对象的技术来封装叶结点基本对象的图像内容语义知识, 得到实体对象特征向量;图像中的对像包含关系用继承机制来实现, 通过反向抽象, 从而得到更高一层的宏观对象。实现对象包含对象的思想, 其它关系在类中设置变量来表示, 进而把义原集合转化为面向对象技术中的类库, 只有叶结点上的对象是实体对象, 其它各高层对象为虚拟对象, 由多态机制完成各高层对象对其子对象的共同特征的获取;将对象词典表示为范畴性类的子类, 将图像对象形状特征知识转化为利用面向对象技术表的知识, 使得这些知识变得容易操作, 为图像形状特征相似度匹配提供便捷的服务。

对图像的处理, 特别是图像教育资源对象形状特征的获取, 需要耗费大量的时间。为了提高检匹配和检索的速度, 我们需要预先将图像处理好, 并保存图像其各自己的对象形状特征值, 从而在匹配时, 只要计算各对象及其子对象的特征向量, 能较快地得到检索结果。

面向对象的图像教育资源多尺度检索是一个系统的工程, 每一幅图像都由大量的对象及其子对象、子对象的子对象……构成。所以, 用什么样的数据库来存放这些图像及其特征是一个非常重要的问题。我们采用自定义的面向对象数据库来存放这一切。当一个对象包含子对象时, 其子对象至少有2个, 该对象本身可以看作为抽象对象, 即只有在叶结点上的对象才是实体对象, 其数据字典基本结构如下:

匹配时, 我们以叶结点上的实体对象特征向量为基础, 对象相似度由各自的子对象相似度归一化得到。

X={f1X, f2X, …, fnX}表示简单形状Xn个特征量, 对A={f1A, f2A, …, fnA}与B={f1B, f2B, …, fnB}而言, 我们可以用如下的特征距离disf (A, B) 来刻画相似度Similarf (A, B) :

disf (A, B) =i=1nωi (fiA-fiB) 2

其中ωi (i=1, 2, …, n) 为预先确定的常数, 反映了每个特征量的重要程度。disf (A, B) 越小, 表示Similarf (A, B) 越大。

每个形状对象的特征量与其形状数据本身分开存放, 在面向对象的图像教育资源多尺度检索实验平台中400多幅图像进行检索, 响应时间在4秒以内。我们在实验中, 单纯使用小波方法进行检索, 其得到查全率为90.5%, 查准率为76.6%;使用面向对象的多尺度方法后, 得到其查全率为91.5%, 查准率为95.3%, 可以看到, 该方法对查全率影响不大, 但其查准率有明显的提高。其结果如图2所示。

5结论

实验表明, 在面向对象的图像教育资源多尺度检索中, 我们的方法具有较高的检索精度和检索速度。但这对面向自然语言描述的高级语义图像教育资源检索来说还只是个起步, 接下来的工作主要集中在以下几个方面:进一步提高图像教育资源分割的准确性, 使分割后的对象尽可能地与高级语义一致;进一步提高图像教育资源对象特征描述的准确性, 尽可能使得特征参数如各种矩具有明确的物理意义;进一步完善图像教育资源面向自然语言描述的高级语义与对象特征之间的映射体系, 从而达到高级语义对象检索的目的。

摘要:从教育教学实际需要分析了图像教育资源的对象特征, 系统地给出了图像教育资源的与大小、位置、方向无关的描述子。以多尺度分割为基础提出了面向对象的多尺度图像教育资源检索设计基本理论, 最后以面向对象数据库开发为基础给出了面向对象的多尺度图像教育资源检索平台实现。

上一篇:秘书人员下一篇:除锈方法