语义Web技术

2024-06-30

语义Web技术（精选八篇）

语义Web技术篇1

关键词：语义网,本体,本体库

近些年来, 互联网技术的迅猛发展, 面对信息的海洋, 如何组织、管理和维护海量信息并为用户提供有效的服务也就成为一项重要而迫切的研究课题。

在2000年世界XML大会上, 万维网创始人Tim Berners-Lee对语义网这一概念进行了解释, 并提出了它的体系结构。本体是使Web具有语义性的关键技术。

1 本体的定义

从本质上说, 本体是概念化的形式化、显式规范, 概念化是通过识别世界中现象的相关概念而建立的关于现象的抽象模型;显式指概念的类型和应用的约束条件是显式定义的;形式化指机器可以理解、处理;共享指所要表达的概念化是某个领域所固有的, 别广泛接受的。

在构建一个知识库系统的时候, 不同本体扮演着不同角色, 通常可以区分为:领域本体、通用本体、应用型的本体、表示本体。

目前现有如下几种典型的本体形式, 包括词典、主题映射、体系分类法、WordNet等。词典 (Thesauri) 描述了概念 (如词性等) 以及概念之间的关系。

通常本体定义主要包括以下几个组成部分:

1) 类:领域和任务中的概念, 通常使用分类法组织在一起;

2) 关系:领域概念之间的一种联系类型。基本关系有四种:part-of, kind-of, instance-of和attribute-of。

3) 函数:一种特殊的关系, 在关系的N个元素中前N-1个元素决定了第N个元素。

4) 公理:一种关于事实的语句, 如果Student选修了课程A和B, 那么他就是二年级学生。

5) 实例:表示特定的元素, 如Peter是学生的实例。

图1是用一个简单的有向图来表示一个简单的运输本体, 在这里省略了函数、公理和实例。

2 语义Web的结构

在XML2000会议上, Tim Berners-Lee首次给出了语义Web基本构架, 它是个功能逐层增强的层次化结构。

第一层:Unicode和URI。Unicode是一个字符集, 这个字符集中所有字符都用两个字节表示。URI (Uniform ResourceIdentifier) , 即统一资源定位符, 用于唯一标识网络上的一个概念或资源。

第二层:XML+NS+xmlschema。XML是一个精简的SGML, 它综合了SGML的丰富功能与HTML的易用性。NS (NameSpace) 即命名空间, 由URI索引确定。XML

Schema是DTD (Document DataType) 的替代品, 它本身采用XML语法, 但比DTD更加灵活, 提供更多的数据类型。

第三层:RDF+rdfschema。RDF是一种描述WWW上的信息资源的一种语言, 其目标是建立一种供多种元数据标准共存的框架。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇, 其目的是提供词汇嵌入的机制或框架。

第四层:Ontologyvocabulary。该层是在RDF (S) 基础上定义的概念及其关系的抽象描述, 用于描述应用领域的知识, 描述各类资源及资源之间的关系, 实现对词汇表的扩展。

第五至七层:Logic、Proof、Trust。Logic负责提供公理和推理规则, 而Logic一旦建立, 便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证, 证明其有效性。通过Proof交换以及数字签名, 建立一定的信任关系, 从而证明语义网输出的可靠性以及其是否符合用户的要求。

3 本体库系统

目前, 语义Web虽然还未大规模实现, 但人们已开发出了多种本体。本体库是一种分组和重组各类本体的重要工具, 可实现本体的重用、维护、映射和版本化。为了实现共享和重用, 一个本体库它应具备以下三大基本功能:

1) 管理:本体库必须包括开发式存储、标识和版本化。任何本体的开发都是需要团队合作开发, 为了支持合作编辑本体, 本体库系统必须能够通过Web进行本体的存取。同时, 为了提高本体的查找、管理效率, 在库中对本体采用本体URL与名字空间机制对其加以标识, 并对系统中的本体进行适当模块化组织。

2) 适应性:为了有利于扩展和更新本体, 本体库应该为用户提供友好的查找、编辑和推理本体的环境。系统应该提供一个可视化浏览器以便用户进行查找、编辑。

3) 标准化:为了本体的有效共享和重用, 本体库系统应该遵循现有的本体标准, 例如:本体表示语言、本体分类法和本体结构等。

4 结语

从语义万维网的发展起源来看, 语义网是人工智能领域和Web技术相互结合的产物, 本体的构建是实现语义Web的关键环节。

参考文献

[1]GRUBERTR.translation approach to portable ontology specifications[J].knowledge Acquisition, 1993.

[2]Fensel D.Ontologies:A Silver Bullet for Knowledge Management andElectronic Commerce[M].Berlin:Springer-Verlag, 2001.

[3]T.Berners2Lee, J.Hendber, and O.Lassila.The semantic web.Scientific American, 2001.

提高网站排名需知的语义关键字技术篇2

对网站内容和链接策略来说关键词依旧非常重要。但因为语义搜索技术和人为因素，关键字搜索系统将会有所改变。

(一)什么是语义搜索?

从根本上来说，语义搜索是一门在用户在键入某些关键词时就试图确定用户的意思的技术。语义搜索技术检索这些词的语义或者是这些词隐含的意思。

例如，有人在搜索框中键入“笔记本电脑”，那么意味着：

· 他们想买笔记本电脑?

· 打算维修笔记本电脑?

· 笔记本电脑升级?

即便是讨论笔记本电脑，也含有完全不同的意思。所以，在实际生活当中，大多数的人一般不会只用一个搜索词进行搜索，因为多添加几个搜索词就会看到其他的效果。

即使是这样，搜索引擎也并不总会罗列出用户想要的搜索结果。谷歌猜测这是由于搜索结果取决于你所输入到搜索框中的搜索词。

因此，语义搜索技术将会考虑到这些词和其他的词是怎样关联起来的，并且会对你输入这些关键词的方式进行推理。

比方说使用智能手机在谷歌搜索引擎上查找“笔记本电脑维修”，语义搜索就会通过装在你手机上的GPS辨别出你当前所处的位置，然后为你提供基于所在地的“笔记本电脑维修”搜索结果。换句话说，搜索结果与“笔记本电脑维修+ [城市]” 有关。

(二)语义搜索技术是如何影响搜索引擎优化的?

在SEO方面，语义搜索就意味着你必须分辨出那些能够准确表达出用户意图的关键字，然后围绕这些关键字来创造内容以便为用户提供相关的问题答案。这就是语义关键字研究的用武之地。

在关键字研究的领域中，你需要找到搜索量最高的关键字，然后列出的关键词清单，并且其中的信息含义和创造的内容应该是对应的，也就是一对一的关系，例如：清单上的信息有：哪里维修笔记本电脑，那么你创造的内容就要维修笔记本电脑的地点有关。

在语义关键字技术领域，你需要建立一个数据库，在其中要涵盖关键字(人物、地方、事物)的所有含义，

这样，此“SEO策略工具”就可以用于匹配不同搜索者的使用的术语、上下文内容，最终达到了解用户正确意图的目的了。

(三)语义关键字研究的优势是什么?

利用语义关键字数据库来创建高转化率的博客文章不仅是一种优势，而且也有其他好处，如提高点击率和PPC优化，像WordStream网站解释到的：

·高点击率—无论是在你的电子邮件、登录页面、文本广告或者博客文章中，针对性高的语义关键字就会迅速地提高你的点击率。

·降低PPC过程的最低展现价格—语义关键字技术方面增强可以使得内容相关性更高并且针对性更强，那么PPC优化过程中的最低展现价格也随之降低。

·高质量得分—当你围绕语义关键字实现相关性高的内容时，搜索引擎将会因为这些高质量的内容，让你的网站有更好的排名。

(四)查找语义关键字的工具有哪些?

有一个实现关键字优化的计划是至关重要的。但你如何能找到这些关键词呢?下面介绍五种方法：

1.使用谷歌高级搜索

Google高级搜索工具提供了一种快速生成一些语义关键字的方式。只需键入一个查询内容，如“笔记本电脑优惠码”，然后点击“所有结果”。如下图所示，你就能在搜索结果中的下方的相关搜索中，看到所有“笔记本电脑优惠”的语义条件。

正如你在上图的搜索结果中看到的，当搜索者查询“笔记本电脑优惠”的时候，他们极大程度上会添加上某个品牌这一专业词语。

换句话说，“笔记本电脑”这个搜索词已经转变为一个品牌，同时不要忘记了使用谷歌的Google Instant这种搜索方式来进一步确定关键词，即用户在完全键入关键词之前，在搜索框的下拉栏显示的匹配结果。顺便提下，这些关键词是完整不同于使用“相关搜索”中所出现的搜索结果。

现在，让我们了解下一个使用语义关键字相对的例子。即我们可以通过查找近似“笔记本维修”的词：屏幕维修、品牌电脑维修和其他包含“检修”意思的词。

记住你的工作不是简单的将这些关键字加入你的数据库中就了事了。因为有时你需要判别出用户使用这些词进行搜索时的真实想法，有些意图并不是显而易见的。

你也可以使用谷歌搜索解析工具的类别功能来帮助你缩小关键字的范围。

2、语义关键字研究—社会化书签网站标识

第三代Web:语义网浅述篇3

WWW (World Wide Web) , 又称万维网, 简记为Web, 是构建在Internet上采用浏览器/服务器网络计算模式, 访问遍布在Internet计算机上所有链接文件。1989年, 在日内瓦欧洲粒子物理实验室工作的Berners-Lee发明了最初的Web。第一代Web发明了超文本格式, 把分布在网上的文件链接在一起。这样用户只要在图形界面上点击鼠标, 就能从一个网页跳到另一个网页, 使得通过互联网浏览文档成为可能, 这时的Web以HTML语言、URL和HTTP等技术为标志, 以静态页面的平台形式来展现信息。

2 第二代Web

第二代Web以动态HTML语言、Java script、VB script、Active X、API、CGI等技术为标志。它允许用户通过交互查询数据库并将数据库中符合要求的结果动态地生成页面, 展示给用户。这极大增强了Web处理大规模数据的能力。Web由一个展示信息的平台真正变成了信息处理的平台, 极大促进人们的信息交流与共享。

3 第三代Web

Web是一个庞大的知识库, Web已经成为人类获取信息和得到服务的主要渠道之一。但是Web并非已经尽善尽美, 仍然存在很多尚待解决的问题。

3.1 Web信息无法被自动处理。

当前的Web无论是静态的HTML网页, 还是动态生成的网页, 其目的都是供人阅读。以往的Web技术都忽略了计算机的处理作用, 计算机在其中主要扮演了展现信息的作用, 而没有理解和处理Web信息的能力。

3.2 Web信息无法被有效利用。

面对Web庞大的知识库, 对信息的有效利用提出了巨大挑战。基于传统技术的搜索引擎已经无法应对Web这个日益庞大的知识库。以最强大的搜索引擎Google来说, 它目前能搜索80亿之多的Web页面, 但这仅仅占整个Web规模的25%~30%, 也就是说还有大量的信息无法被搜索到。同时, 由于计算机无法精确识别Web上的内容, 当前搜索引擎返回的结果中, 存在许多垃圾信息, 搜索结果和质量并不令人满意。

由此可见, 现在的Web只是定位和展示信息的作用, 对信息的内容并不关心。而事实上, 人们真正关心的是信息的内容。只有对信息内容的含义进行描述, 才能实现智能化的Web服务。为此, Berners-Lee在2000年又提出了语义网。所谓“语义”, 就是文本的含义。“语义Web”, 就是能够根据语义进行判断的网络。简单地说, 语义Web是一种能理解人类语言的智能网络, 被人们称为第三代Web。在语义网环境下, Web上定义和链接的数据不仅能显示, 而且可以被机器自动处理、集成和重用。只有当数据不仅可以被人而且可以被机器自动地共享和处理的时候, Web的潜力才发挥到极致。

根据Berners-Lee的设想, 语义网是由一种分层的体系结构构成, 如图1所示。这是一个功能逐层增强的层次化结构, 由七个层次构成。

(1) URI和Unicode。URI是Web的核心概念之一, 它能够唯一地标识Web上的任意一个资源, 其思想是在需要的时候通过链接引用资源, 因此不需要对资源进行拷贝或集中管理。Unicode是一种新的字符编码标准, 它支持世界上所有的语言。无论在什么平台上, 无论在什么程序中, 无论使用什么语言, 每个字符都对应于一个唯一的Unicode编码值。因此, 它是语义网多语种支持的基础。

(2) XML、名称空间 (NS) 和XML Schema。XML提供文档结构化的语法, 实现了文档结构与文档表现形式的分离, 根据不同的目的同一个文档可以有不同的表现形式。XML名称空间是名称的一个集合, 用于文档元素和属性名有效性的验证, 由URI引用来标识。XML Schema是约束XML文档结构的语言。

(3) RDF (S) 。XML实现了文档结构化, 但文档信息并不包含任何语义。RDF数据模型提供简单的语义, RDF属性可以看作是资源的属性, 同时又表达了资源之间的关系, 因此RDF数据模型对应于传统的属性二值对, 又类似于ER图。RDF Schema为RDF模型提供了一个基本的类型系统, 其目的就是定义资源的属性, 定义被描述资源的类, 并对类和关系的可能组合进行约束, 同时提供约束违例的检测机制。

(4) 本体层。虽然RDF (S) 能够定义对象的属性和类, 并且还提供了类的泛化等简单语义, 但它不能明确表达描述属性或类的术语的含义及术语间的关系。本体层就是要提供一个能明确的形式化语言, 以准确定义术语语义及术语间关系。

(5) 逻辑、证明和信任。除了本体层定义的术语关系和推理规则外, 还需要有一个功能强大的逻辑语言来实现推理。证明语言允许服务代理在向客户代理发送断言的同时将推理路径也发送给客户代理。这样应用程序只需要包含一个普通的验证引擎就可以确定断言的真假。但是, 证明语言只能根据Web上已有的信息对断言给出逻辑证明, 它并不能保证Web上所有的信息都为“真”。因此, 软件代理还需要使用数字签名和加密技术用来确保Web信息的可信任性。

(6) 数字签名和加密。数字签名简单地说就是一段数据加密块, 机器和软件代理可以用它来唯一地验证某个信息是否由特定的可信任的来源提供。它是实现Web信任的关键技术。公共密钥加密算法是数字签名的基础。

语义Web最大优点是可让计算机具有对网络空间所储存的数据, 进行智能评估的能力。这样, 计算机就可以像人脑一样“理解”信息的含义, 完成“智能代理”的功能。使用语义Web搜索引擎搜索的结果比Web更为精确。

语义Web提供了一种崭新的信息描述和知识表达的手段, 而要在语义层次上实现信息的互操作, 就需要对信息涵义的理解达成一致。语义Web采用了本体 (ontology) 的思想, 本体描述的是具有共识的、概念化的事物, 它对实现语义层次上的知识共享、知识重用发挥着核心作用。

语义Web具有一些基本特征:a.语义Web不同于现有Web, 它是现有Web的扩展与延伸;b.现有的Web面向文档, 而语义Web则面向文档所表示的内容和语义 (独立于表示的语法) ;c.语义Web将更利于计算机“理解与处理”, 并将具有一定的判断推理能力。

语义Web的目标是让Web上的信息能够被机器理解, 从而实现Web信息的自动处理, 以适应Web信息资源的快速增长, 更好地实现人和计算机的交互与合作。近年来, 无论在国际上, 还是在国内, 人们对语义Web及其关键技术和应用的研究正在如火如荼, 语义Web的支撑软件与应用开发日益受到重视, 语义Web被看作是新一代的信息基础设施, 被人们称为第三代Web。

语义Web汲取人工智能、哲学和逻辑学等学科的研究成果, 试图对Web上的信息和获取方式进行重大改进, 解决目前Web存在的问题。虽然语义Web未来的发展难以预测, 但人类应该对所有的可能做出努力。也许正如语义网领域内的一种说法, 就算人类只能解决1%的问题, 随着Web的普遍使用, 也将会给社会带来巨大的效益。我们期待着语义网的美好明天将会早日到来。

摘要：简要介绍了语义Web的起源、概念、思想、架构、特征、目的和未来面临的挑战, 对深入了解语义Web, 有一定的参考作用。

面向语义Web的描述逻辑本体构建篇4

1面向语义Web的描述逻辑本体构建的涵义和内容所谓的面向语义Web的描述逻辑实际上是一种以对象为中心的将知识进行形式化表达的工具,其本质是一种逻辑系统,其内容包括语义语法和形式语义,而语义语法又包含推理。在采用面向语义Web的描述逻辑本体的构建中,将具有相似性质的对象统一用概念(Concept)一词进行描述,而对象的性质实际上是由角色或者关系(Role)来作为解释对象之间的二元关系的。简而言之,面向语义Web的描述逻辑本体的构建实际上就是通过描述逻辑进行推理设置,从而实现快速解答人们对于相关知识库的信息内容的查询。2面向语义Web的描述逻辑本体的构建2.1面向语义Web的描述逻辑本体构建的语言描述描述逻辑本体也可以称之为描述逻辑知识库,计算机语言表述为KB=<T,A>,是由TBoxT和ABoxA两部分内容组成的。描述逻辑本体构建的过程实际上就是如何使用本体语言OWL(Web Ontology Lauguage)通过逻辑推理设计,建立的描述逻辑知识库的过程。而OWL又包含OWL Lite、OWL DL和OWL Full三种Web本体语言标准。在OWL本体构建好,并且一致、不存在矛盾的前提下,OWL Lite语言描述逻辑同SHIF(D)是等价的,而OWL DL语言描述逻辑同SHOIN(D)是等价的,因此,我们就可以通过SHIF(D)和SHOIN(D)的推理机制实现对于OWL本体的推理算法和推理系统的构建工作。2.2面向语义Web的描述逻辑本体构建过程中存在的问题和解决措施2.2.1在构建描述本体的过程中主要存在的问题一个高效的描述逻辑本体的构建必须解决以下三方面的问题:l)构建描述逻辑本体(这里我们指OWL本体)应该使用什么方法;2)如何针对逻辑本体构建过程中的完备性进行考核和检验;3)如何确保构建的描述逻辑本体是不存在冗余性;3175Computer Knowledge and Technology电脑知识与技术第10卷第13期(2014年5月)计算机工程应用技术本栏目责任编辑:梁书2.2.2构建逻辑本体过程中的问题的解决措施对于上述的问题1),可以通过采用描述逻辑的非标准推理来实现辅助本体构建过程的这一新型概念进行解决。也就是说当用户知道一个概念而却不知道如何表达时,我们就可以通过列举一些实例的方式,再经过非标准推理计算为用户自动提供相应的概念内容或者对已有的相似概念进行优化和补充构建出一个新概念来满足用户的需求。构建方法的选择方面,非标准推理中的LCS(Least Common Subsumer)推理、MSC(Most Specific Concept)推理,重写(Rewriting)推理、匹配(Matching)推理和调试(Debugging)以及保守扩充(Conservative Extensions)等推理都可以作为构建逻辑本体过程中的方法和工具。对于问题2)的如何确定描述逻辑本体完备性的问题,有两种解决措施。首先,可以通过验证描述逻辑知识库中的TBox是否明确表达了不同领域知识和不同概念之间的所有相关约束的内容;第二种就是验证描述逻辑知识库中的ABox是否表述了同一领域知识范围内的所有相关个体。问题3)的无冗余性的描述,可以通过有穷基的问题进行相关解答,本体构建工程师可以利用有穷基开始进行有目的性的使用或者测试不同领域的本体知识库,以确认描述逻辑本体的冗余性问题。3面向语义Web的描述逻辑本体构建的实践应用3.1描述逻辑与构造算子之间的关系当前一些较小的描述逻辑本体系统的构建通常采用LCS推理和MSC推理,这类本体构建所选择的语义描述逻辑实际上是考虑到了构造算子和量词的问题。一般来讲,全称量词同无附加资格限制的无约束数量构造算子的运用就不需要考虑到有关需要带资格限定的约束类构造算子,同时也包括相应的传递算子、枚举算子和逆构造算子。本体的具体数据类型以及不同关系分层之间的描述逻辑语义的表达需要更具有深入性和研究性的非标准推理理论和算法来支持,也是实现描述逻辑本体构建最好的工具和方法。3.2面向语义Web的描述逻辑本体构建的完备性证明条件描述逻辑本体的完备性是构建本体过程中的重要环节。目前比较成熟的构建逻辑本体完备性的推理和算法的完备性背景条件是通过利用形式概念进行属性的分析、探索。其操作方法如:当不同概念之间的约束关系无法通过逻辑推理机制进行推理得到解决时,为了能准确的判断概念之间的约束关系是否条件充足,就需要人类的专业人士进行参与,并且假设该人士是专家类的,具有完备性,此时,专家就可以给出所有概念之间的约束表述关系。也就是说在人类专家知识完备的前提下,通过其提供的描述逻辑本体推理算法,来证明知识库的完备性。实际上,现实生活中的人是无法具备知识的完备性的,往往无法完全解答所有概念之间的约束表述问题,同时,也不能保证其给吃的回答都是正确的。为此,对于本体完备性的问题的解决可以尝试从反方向的不完备性进行研究和猜想,以便及时对知识库的概念进行补充和扩展。3.3面向语义Web的描述逻辑本体构建的无冗余性描述如何实现描述逻辑本体构建的最小且无冗余一直以来都是构建工程师最为关注的问题,也是工程师的重点研究方向。通过研究得出的描述逻辑的有穷基特性是描述逻辑概念中的一个包含公理的最小蕴含集合,也正是确保构建本体过程中知识的最小和无冗余性的关键内容。通常情况下工程师可以根据描述逻辑的有穷基特性从最小蕴含集开始采用这些蕴含式进行相应领域本体知识库的构建工作。正是描述逻辑的有穷基为逻辑本体构建过程中的知识工程师提供了无冗余和最小知识库的标准和依据。但是鉴于描述逻辑有穷基的研究还处于初级阶段,是否不同表达能力的描述本体都具有有穷基问题还需要进一步在实践中验证和研究。因此,接下来的重点可能要放在不同表达能力情况下描述逻辑本体是否存在有穷基和相应的计算方法的讨论和研究中,以便更好的解决逻辑本体的冗余性和最小性问题。4结束语综上所述,面向语义Web的描述逻辑本体的构建是一项涉及计算机语义应用范围广,需要采用多种推理语言的辅助的复杂性知识库搭建工作。在这个过程中,我们可以通过对已有的一些概念、定义和技术方法等进行优化和改造建立出一种更符合设计要求知识库。如何更好的解决面向语义Web的描述逻辑本体的完备性和冗余性问题为构建真正适用于语义Web的描述逻辑本体提供科学理论依据和有效推理算法有着十分重要的应用意义。

摘要：随着计算机技术和网络技术的不断发展,网络信息技术已经成了人们生活中不可分割的一部分,但是,如何构建一个更加科学合理的描述逻辑本体,方便人们在数以万计的网络信息中快速、高效的找出所需要的信息和资源是当前世界范围内的迫切性问题。该文就面向语义Web的描述逻辑本体的构建做相关的讨论和研究,希望为我国网络技术中的本体构建技术问题提供一些借鉴和参考。

关键词：语义Web,逻辑本体构建

语义Web技术篇5

随着网络的迅猛发展, 面向服务的计算将成为Internet的下一次浪潮, Web服务由于其便利性和兼容性越来越被广泛关注。UDDI (Universal Description Discovery and Integration) 是众多支持Web服务的解决方案中最受瞩目的一个。UDDI上的Web服务发现是通过对UDDI上的服务注册信息进行关键词精确匹配实现的, 主要是对服务ID或名称、或是服务的有限的属性值进行匹配。但是人们在感谢UDDI Web服务注册带来的Web服务发现便捷的同时, 也常常为查准率和查全率不高困扰。

针对Web服务发现使用关键词匹配, 导致服务查准率查全率不高的问题, 业界已有不少相关研究:文献[1]提出了一种基于过程本体论的Web服务发现技术, 通过描述服务过程的匹配来提高服务匹配的查准率和查全率。文献[2]提出以DAML-S语言描述服务, 通过服务的属性和接口的输入输出概念匹配, 得到匹配结果。文献[3]用DAML + OIL描述Web服务, 并给出相应的相似度计算方法, 该方法未定义输入输出和服务质量等参数, 在服务发现时存在明显缺陷。

针对上述问题, 本文将匹配策略改进为基调、规约和局部三个层次, 构造层次匹配模型。模型定义了输入输出等参数, 同时加入服务相似度计算, 显著地提升服务发现的查准率和查全率, 并提高了服务匹配的灵活性。最后, 在原型系统SWDRS上构造对比实验证明匹配模型的可行性和有效性。

1 Web服务层次匹配模型结构

图1从面向应用的角度描述了本文服务发现系统的整体结构。服务提供者使用UDDI将其Web服务发布到服务代理上, 使用Web服务描述语言 (WSDL) 来描述Web服务的语义信息[4]。UDDI发布者使用API来发布Web服务。当服务请求者需要调用服务时, 服务代理使用UDDI查询API来获得如何调用该Web服务的信息, 然后根据信息去调用服务提供者发布的服务。在本文中, 服务代理除了得到服务的基本信息以外还将获得UDDI提供的Web服务的语义描述。

当服务请求者从服务代理得到调用所需服务的信息后, 服务代理计算需要匹配的服务的相似度, 然后向服务请求者推荐服务。在这个过程中, 服务代理使用语义描述和领域本体信息。为了匹配到合适的服务, 需要一种语言来描述服务请求。例如输入、输出、约束、隐私和质量。本文使用XML语言描述服务。其原因在于, 以XML格式表示的消息易于阅读和理解, 并且XML文档具有跨平台性和松散耦合的结构特点。

2 层次匹配思想

2.1 匹配思想

借鉴传统的构件匹配理论[5,6], 按是否涉及服务行为和匹配严格程度, 将服务匹配划分为基调匹配、规约匹配和局部匹配三个层次。

定义1 Web服务匹配

设有服务请求T与服务描述C, 则存在T与C的服务匹配

Match (T, C) =matchbas (T, C) ∧

matchsig (T, C) ∧matchspec (T, C)

其中基本匹配matchbas (T, C) 表示比较两服务的服务名字和文本描述的相关性;基调匹配matchsig (T, C) 表示比较两服务的输入输出类型和方向的相关性;规约匹配matchspec (T, C) 表示比较两服务行为和约束信息的相关性。

定义2 Web服务基调描述

通过Web服务输入输出变量类型和方向来定义服务功能, 即表达接口的基调。

本文基于服务描述语言定义Web服务基调。在领域本体中详细说明服务输入输出类型和方向。为了使系统具有良好可扩展性, 利用本体来描述消息类型Type, 同时还支持约束描述。

定义3 基调匹配

Web服务描述C:输入IC={v1, …, vn}, 输出OC。服务请求T:输入IT={u1, …, um}, 输出OT。如果满足IT≤stIC和OC≤stOT则C与T基调匹配。其中IT≤stIC表示∀vi∈IC, ∃uj∈IT满足uj≤stvi。若有i≠k, uj≤stvi, ul≤stvk, 则j≠l。

每种类型变量都有子类型关系, 表示为:u≤stv。这种匹配策略在匹配过程中是基本和必须要求的, 如果没有了基调兼容性, 服务请求的输入变量就不能被服务发布者所接受。

定义4 规约匹配

服务描述C:输入约束C $_{Ι}^{C}$ ={C $_{Ι_{1}}^{C}$ , …, C $_{Ι_{k_{C}}}^{C}$ }和输出约束C $_{Ο}^{C}$ ={C $_{Ο_{1}}^{C}$ , …, C $_{Ο_{l_{C}}}^{C}$ }。C $_{Ι}^{Τ}$ ={C $_{Ι_{1}}^{Τ}$ , …, C $_{Ι_{k_{Τ}}}^{Τ}$ }和C $_{Ο}^{Τ}$ ={C $_{Ο_{1}}^{Τ}$ , …, C $_{Ο_{l_{Y}}}^{Τ}$ }是服务请求T的输入输出约束。如果C $_{Ι}^{Τ}$ ≤θC $_{Ι}^{C}$ , C $_{Ο}^{C}$ ≤θC $_{Ο}^{Τ}$ 。则T规约匹配C0≤θ表示约束的θ-包含关系。C $_{Ι}^{Τ}$ ≤θC $_{Ι}^{C}$ 表示∀C $_{Ι_{i}}^{Τ}$ ∈C $_{Ι}^{Τ}$ , ∃C $_{Ι_{j}}^{C}$ ∈C $_{Ι}^{C}$ , 则C $_{Ι_{i}}^{Τ}$ ≤θC $_{Ι_{j}}^{C}$ 。若i≠k, C $_{Ι_{i}}^{Τ}$ ≤θC $_{Ι_{j}}^{C}$ , C $_{Ι_{k}}^{Τ}$ ≤θC $_{Ι_{l}}^{C}$ , 则j≠l。由规约语言给出约束条件, θ-包含依赖于规约语言。

定义5 子句θ-包含

如果存在一个置换θ如C⊆θ (D) , 则子句Cθ-包含于子句D表示为C≤θD。

对于Web服务描述, 如果部分输入输出变量有子类型关系, 并且输入输出约束中的约束子句满足θ-包含关系, 则称这种匹配是局部匹配。

定义6 局部匹配

服务描述C:输入IC={V $_{Ι_{l}}^{C}$ , …, V $_{Ι_{v}_{C}}^{C}$ }, 输出OC={V $_{Ο_{l}}^{C}$ , ……, V $_{Ο_{m_{C}}}^{C}$ }, 输入约束C $_{Ι}^{C}$ ={C $_{Ι_{1}}^{C}$ , ……, C $_{Ι_{k}_{C}}^{C}$ }和输出约束C $_{Ο}^{C}$ ={C $_{Ο_{Ι}}^{C}$ , ……, C $_{Ο_{l}_{C}}^{C}$ }。服务请求T:输入IT={V $_{Ι_{l}_{1}}^{Τ}$ , ……, V $_{Ι_{m}_{Τ}}^{Τ}$ }, 输出OT={V $_{Ο_{l}}^{Τ}$ , ……, V $_{Ο_{m_{Τ}}}^{Τ}$ }, 输入约束C $_{Ι}^{Τ}$ ={C $_{Ι_{1}}^{Τ}$ , ……, C $_{Ι_{k}_{Τ}}^{Τ}$ }和输出约束C $_{Ο}^{Τ}$ ={C $_{Ο_{l}}^{Τ}$ , ……, C $_{Ο_{l}_{Τ}}^{Τ}$ }。如果满足下面条件则T局部匹配C。

∃V $_{Ι_{i}}^{Τ}$ ∈IT, ∃V $_{Ι_{j}}^{C}$ ∈IC, 则V $_{Ι_{i}}^{Τ}$ ≤stV $_{Ι_{j}}^{C}$

∃V $_{Ο_{i}}^{C}$ ∈OC, ∃V $_{Ο_{i}}^{Τ}$ ∈OT, 则V $_{Ο_{i}}^{C}$ ≤stV $_{Ο_{i}}^{Τ}$

∃C $_{Ι_{i}}^{Τ}$ ∈C $_{Ι}^{Τ}$ , ∃C $_{Ι_{j}}^{C}$ ∈C $_{Ι}^{C}$ , 则C $_{Ι_{i}}^{Τ}$ ≤θC $_{Ι_{j}}^{C}$

∃C $_{Ο_{j}}^{C}$ ∈C $_{Ο}^{C}$ , ∃C $_{Ο_{i}}^{Τ}$ ∈C $_{Ο}^{Τ}$ , 则C $_{Ο_{j}}^{C}$ ≤θC $_{Ο_{i}}^{Τ}$

2.2 匹配算法

匹配思想由基本匹配筛选的候选服务参与基调匹配, 合格的服务进一步参与规约匹配;如果部分满足则参与局部匹配。这就可以满足服务请求者不同层次的需要。

算法描述

3 Web服务相似度

用户对服务的理解是局部和片面的, 精确、可替代和包含等匹配类型大多是建立在完整信息的严格推理上, 因而缺少灵活性、实用性差。层次匹配模型采用数值计算来度量服务的相似程度, 通过判断是否大于预定阈值来选择服务。

相似函数计算匹配的服务在语义上与请求的服务的相似度。相似度通过计算语义距离数 (0-1) 来表示。

基调匹配需要计算输入、输出类型的相似度, 考虑定义3中的服务描述C和T, 函数F1 (C, T) →[0, 1], 可定义基调相似函数为

$F_{1} (C ‚ Τ) = \frac{\sum_{i = 1}^{| Ι^{C} |} f_{s t} (v_{i}, u_{j})}{| Ι^{C} |} (Ι^{C} \leq_{s t} Ι^{Τ})$

当vi≤stuj, fst (vi, uj) →[0, 1]是领域本体内vi和uj的类型距离。

输出部分基于同样原理, 定义函数F2 (C, T) →[0, 1]来计算输出类型距离。

规约匹配输入约束部分, 函数定义如下

$F_{3} (C ‚ Τ) = \frac{F_{θ}^{Ι} + F_{θ}^{Ο}}{| C_{Ι}^{C} | + | C_{Ο}^{C} |} (C^{Τ} \leq_{θ} C^{C})$

$\begin{array}{l} 其中 F_{θ}^{Ι} = \sum_{i = 1}^{| C_{Ι}^{C} |} f_{θ} (C_{Ι_{i}}^{C}, C_{Ι_{j}}^{Τ}) (C_{Ι_{i}}^{C} \leq_{θ} C_{Ι_{j}}^{Τ}) \\ F_{θ}^{Ο} = \sum_{i = 1}^{| C_{Ο}^{Τ} |} f_{θ} (C_{Ο_{i}}^{Τ}, C_{Ο_{j}}^{C}) (C_{Ο_{i}}^{Τ} \leq_{θ} C_{Ο_{j}}^{C}) \end{array}$

fθ (C $_{Ι_{i}}^{C}$ , C $_{Ι_{j}}^{Τ}$ ) →[0, 1]是C $_{Ι_{i}}^{C}$ 和C $_{Ι_{j}}^{Τ}$ 在领域本体中的语义距离。

最后计算C和T的相似度, F (C, T) →[0, 1]。

$F (C ‚ Τ) = \frac{\sum_{i = 1}^{| C |} F_{i} (C, Τ)}{| C |}$

根据相似度优先推荐相似度高的服务, 在服务发现的实际应用中非常重要。

4 系统性能测试

为了验证本文基于语义的Web服务匹配模型, 我们通过JAVA语言设计实现了原型系统SWDRS (Semantic WebServices Discovery and Rank System) 。现选取Internet上60个WSDL文档和6个不同领域的本体文件 (OWL格式) 进行如下测试来评价UDDI规范实现系统JAXR Regisry与原型系统SWDRS的查全率、查准率。系统运行在Windows 2000, JDK1.4.2环境下, 每个Web服务都有一个与在UDDI中相对应的服务描述, 选取3种测试:领域查找;具体概念查找;一般概念查找。

图2中基于层次匹配模型的查全率要高于JAXR Regisry基于关键字的匹配, 特别是在具体概念的查找方面。这是因为在具体概念方面可能包含的关键字数量不多, 而基于层次匹配算法可保证查全率。

查准率指查找到的相关的结果与整个查找结果的比率。图3中基于层次匹配的语义相似度计算保证查准率平均为94% (相似度阈值0.90) 。

从试验可看出, 层次服务匹配在Web服务发现效率方面达到了预期的效果, 这也证明了层次匹配的合理性和可行性。

5 结论

本文提出了一种Web服务匹配模型。多层次服务匹配对应不同层次的需求和不同特点的服务描述和请求, 给用户多种选择来灵活地处理不同的环境。模型中的约束部分相对独立, 用户能够加入任何约束语言。这样提供了整体灵活性和兼容性。针对现有服务匹配算法过多依赖于逻辑推理和缺乏匹配灵活性, 构造了相似函数度量服务相似程度。该方法将匹配过程转化为数值计算, 提高了匹配的灵活性和易用性。服务层次匹配提供了新颖的方法来发现和利用发布的Web服务。原型系统上进行的服务发现实验证明了本文所设计的Web服务匹配模型在实践应用中是可行的、有效的。

参考文献

[1]Klein M, Bernstein A.Searching services on the semantic Web using process ontologies[C].In:Proceedings of the International Semantic Web Working Symposium, Amsterdam:IOS Press, 2001:159-172.

[2]Terry R Payne, Massimo Paolucci, Katia Sycara.Advertising and matc-hing DAML-S service descriptions[C].In:Proceedings of the Interna-tional Semantic Web Working Symposium, Amsterdam:IOS Press, 2001:411-430.

[3]Gonzalez Castillo J, Trastour D, Bartolini C.Description logics for matchmaking of services[C].In:Proceedings of Work shop on Appli-cation of Description Logics, Vienna, Austria, 2001:582-586.

[4]岳昆, 王晓玲, 周傲英.Web服务核心支撑技术:研究综述[J].软件学报, 2004, 15 (3) :428-442.

[5]Zaremski A M, Wing J M.Specification matching of software compo-nents[J].ACMTransactions on Software Engineering and Met hodolo-gy, 1997, 6 (4) :333-369.

一种面向Web服务的语义匹配方法篇6

本体是“共享概念明确的形式化的规范说明”，可以定义概念并且表示各种概念之间的关系。

OWL-S是用本体来描述Web服务的标记语言，主要有3部分:

(1)服务简档(Service Profile)提供了服务的基本描述。

(2)过程模型(ProcessMode1)描述了服务中各子过程的逻辑执行顺序。

(3)服务基点(Service Grounding)描述访问服务的具体细节。

2 MSURAP匹配方法

2.1 概念间推理关系语义匹配计算

与文献[4]中采用方法相同，用Ad-vertise表示提供，Request表示需求，用匹配方法M(Advertise,Request)来计算概念Advertise与Re-quest之间的匹配度，对概念之间的继承、包含关系进行深层次的细分，使概念间的推理关系更加明确，从而得到更准确的匹配结果，具体如算法1:

算法1:

其中，Equivalent表示概念的相等关系，SubClassof表示概念之间是继承关系，而Subsumes表示概念之间的包含关系，此类概念间的推理关系可以直接运用推理机，例如Pellet reasoner进行计算。各个运算结果Exact,Plugin,Subsume,Intersection,Fail描述了概念间不同的匹配程度，用定量值来表示上述匹配关系，如表1所示，其中，w1>w2>w3>w4>w5,w5=0,w1≠0。

概念Request和Advertise的匹配度M(Re-quest,Advertise)的取值范围是[0,1]，设定方法如下:

(1)若M(Request,Advertise)结果为Exact,Request,Advertise两个概念语义完全相等，取w1的值为1，则M(Re-quest,Advertise)=1。

(2)若M结果为Fail,Re-quest,Advertise两个概念语义完全不相关，取w5的值为0，则M=0。

(3)若M结果为其他情况，w2,w3,w4分别对应不同的值，可根据具体情况调整，本文w2,w3,w4的值分别取为0.8,0.6,0.4。通过上述方法得到概念Request和Advertise之间继承、包含等推理层次的语义匹配度M。下面从概念的属性等方面对Re-quest和Advertise之间的语义匹配度进一步计算。

2.2 概念间属性语义关系比较计算

根据OWL语言的描述形式，本文从其概念的property,Disjoint With,Different From,Instances等几个语义层次进行考虑，利用定义1进行比较计算。

定义1：假如a和b分别为物体A和B的属性或者特征集，f表示属性或特征集的测量函数，(a-b)表示那些在a中但不在b中的属性集，反之，(b-a)表示那些在b中但不在a中的属性集，则A与B的相似性S(A,B)定义为:

其中，参数α与β分别表示属性集的不对称性，本文α与β的值都为0.5，表示A和B的属性集是对称的。首先分别抽取出概念Request与Advertise中的property,Disjoint With,Different From等几个方面的属性值，然后利用定义1，根据这些属性值计算得到概念间属性比较匹配度S(Request,Adver-tise)，其中f(Request∩Advertise)表示Request与Advertise中相同的属性元素个数，f(Request-A d-vertise)则表示那些在Request中但不在Advertise中的属性元素个数。

2.3 MSURAP综合计算

通过上述两种方法，得到概念Request,Adver-tise之间的语义推理关系匹配度M(Request,Ad-vertise)，属性语义比较匹配度S，然后进行综合计算得到概念Request,Advertise之间的语义匹配度match(Request,Adver-tise)，如算法2所示:

算法2:

其中w1,w2代表权值，和为1，可根据具体实验结果进行调整，match(Request,Advertise)的取值范围是[0,1]，可以设一个阈值，当match(Request,Ad-vertise)大于此阈值时，则认为Request和Advertise匹配，否则不匹配。

3 语义匹配度的计算

服务wsA与wsR分别表示Advertise和Request，以服务输入为例(输出类似)采用二分图方法计算服务之间的语义匹配度。服务wsA与wsR包含的输入元素分别记为In-putA=邀IA1,IA2,IA3，…妖，InputR=邀IR1,IR2,IR3，…妖，在对服务输入进行语义匹配时，对应元素之间的匹配值可以直接通过match(Advertise,Request)得到，对小于等于w4的匹配值不予考虑，服务输入的语义匹配有以下两种情况:

(1)对InputR的每个元素在InputA中有且仅有一个元素与其匹配(匹配值大于w4)时，则通过match(Advertise,Request)计算对应匹配值，然后利用下式求得服务wsA与wsR间输入匹配值(设n为InputR中元素个数>n′为InoutA中的元素)。

(2)当通过匹配计算得到不止一组匹配值对时，需要对这两组参数进行配对，也就是需要在这两个集合之间进行关联，在此利用二分图算法来进行两组参数的匹配，进而求得服务wsA与wsR间输入的最优匹配值。图1为服务wsA与wsR输入对应的概念语义匹配二分图。

图1中各边权值w1,w2,w3是通过函数match计算的匹配值，例如InputR中IR2与InputA1中的概念IA1的匹配度w2是由match(IR2,IA1)得到。由图1得到的服务wsA与wsR间输入概念语义匹配对为邀〈IR1,IA1〉，〈IR1,IA3〉，〈IR2,IA2〉，〈IR2,IA1〉，〈IR3,IA3〉，〈IR3,IA2〉妖，在此利用子二分图(定义2)方法进行匹配。

定义2：在二分图G=(V,E)中存在G′=(V,E′)，满足E′∈E，且G′中每个顶点最多只与一条边相关联，也就是不存在两条边e1,e2∈E′拥有共同的顶点，则G′是G的子分图。图2是图1对应的两个不同子二分匹配图。

由图2(a)可得匹配对为邀〈IR1,IA1〉，〈IR2,IA2〉，〈IR3,I-A3〉妖，图2(b)可得匹配对为邀〈IR1,IA3〉，〈IR2,IA1〉，〈IR3,IA2〉妖，每一组的匹配值可通过match函数求得，然后选出最大值作为最优匹配值返回。例如，通过图2可得，match1=(w1+w3+w1)/3,match2=(w3+w2+w2)/3，显然match1大于match2，则取match1的值作为InputR与InputA的输入匹配度返回。

4 结束语

MSURAP方法不仅充分利用概念之间的基本推理关系，而且对概念间的属性等语义关系进行比较，然后综合计算得到概念间的匹配度。提高了服务语义匹配准确度，相关实验说明，MSURAP在不影响性能的基础上提高了Web服务的查准率。

摘要：本文针对语法匹配带来的不足提出了一种新的语义匹配方法。

关键词：语义匹配,概念语义,查准率

参考文献

[1]孙萍,蒋昌俊.利用服务聚类优化面向过程模型的语义Web服务发现[J].北京:计算机学报,2008,31(8):1340-1353.

[2]Choi O,Han Sangyong,Abraham A.Semantic match-making s-ervices model for the intelligent Web services[2009-10-09].ht-tp://citeseerx.ist.psu.edu/viewdoc/downloaddoi=10.1.1.73.9386&-rep=rep1&type=pdf.

[3]Wang Gongzhen,Xu Donghong,Qi Yong,et al.A se-mantic match algorithm for Web services based on im-proved semanticdistance[DB/OL].http://ieeexplore.ieee.org/stamp/stamp.jspgtp=&arnumber=4700389&isnumber=4700362.2008-09-09.

语义Web技术篇7

Web服务被认为是一个被设计来支持网络上机器之间的可互操作的交互,具有一个清晰的、机器可读的、通用的标准描述(WSDL),其他系统以该描述中说明的方式与它交互,具有完全开放、松散耦合、标准协议规范和高度可集成能力等特征的一个软件系统,但传统的Web服务体系结构中[1],由于WSDL[2]对服务的描述接口是基于语法的以及UDDI本身是一种基于关键字的注册查找机制,都缺乏对服务中必要的语义信息描述,从而无法实现满足客户需求的Web服务的自动发现和组合,将语义网的相关知识应用到Web服务领域是一种有效的克服上述缺陷的方法。实现在因特网上,将处于异构环境下的多个单一的Web服务组合成满足用户需求的服务的应用需求。本文从增强Web服务语义信息角度出发,提出了通过对请求信息以及服务描述信息进行语义标注[3,4],再将服务请求同Web服务功能属性的语义描述相匹配。最后利用反向推理方法找出满足用户需求的服务组合的策略。

1 语义Web服务发现组合策略

1.1 语义标注在Web服务发现组合中的作用

在传统的Web服务逻辑框架下,底层协议如:UDDI,SOAP[8],WSDL可以满足跨平台的不同服务之间传递数据的作用,但在较高的层面上由于缺乏语义信息无法满足服务的语义查找和自动匹配合,因此参考旧有的Web services的框架,在不同的Web services协议栈的层次上加入语义信息,实现对Web服务的语义化[5]。本文提出的基于语义标注的Web services发现组合逻辑框架如图1所示。

框架各部分作用简介:

-Soap协议层:负责以XML格式传递各个服务间的消息

-Semantic Description:用OWL-S对WSDL中的Web服务相关的描述信息进行语义标注

-Publication:将语义Web服务发布到Web服务语义网

-semantic network of Webservices:一个相互之间具有内在联系的服务集合,每个节点对应一个具体的WEB服务,节点之间的连接线则根据不同Web服务的功能服务属性(input,output)之间的语义相似度测量值做上对应的标记。

-Discovery&composition:语义Web服务的发现和组合

-Semantic request:服务请求的语义标注

-Qo S:服务组合的Qo S指标参数

逻辑结构图中的semantic request中主要是通过领域本体对服务的input,output参数进行语义标注,Discovery/composition则利用服务请求中的语义信息和semantic network of Websevices中的服务之间的语义关联来实现服务的有效组合,semantic annotation则是通过OWL-S[6]对已发布服务的WSDL文件进行语义标注。整个系统工作流程如图2所示。

在进行有效的语义Web服务组合之前,首先建立一个语义Web服务元模型,该模型要考虑到服务的描述信息和其后用于服务发现和组合的功能信息以及用于服务选择的Qo S信息,故使用一种“原子模型”,将有利于增强Web服务的发现组合的有效性和准确性。该文将一个语义Web服务定义为以下四元组:

Sid:该服务对应的唯一标识符。

Sname:该服务的服务名称

Inputs:该服务的输入参数

Outputs:该服务的输出参数

Web服务的语义标注:以上四元组将用来描述所有的WEB服务,在WEB服务的语义描述中,

其中很重要的一点就是将其Inputs、Outputs参数进行语义标注并将它们对应到对应的语义模型中去,从而使WEB服务的功能属性具有语义信息。目前比较常用的就是使用W3C推荐的OWL-S本体描述语言来实现这一环节。OWL-S中通常由Service Profile、Service Model、Service Grounding[10]三部分组成,其中Service Profile主要是描述服务诸如服务名称,服务功能信息等一般信息,Service Model主要是服务提供者用来描述服务的内部流程,而Service Grounding它描述服务是如何被访问的,在这三部分中,Service Profile中的(Inputs,Outputs)将可以被用来进行服务的发现和组合,而Service Groundin中的atomic process,(Inputs,Outputs)同WSDL中的operation,Message是一种对应关系[7]。可用来对服务进行语义标注。

服务请求的标注:服务请求和Web服务应该对应到同一个语义模型中来进行,当服务请求提交后。通常经过解析,将对服务组合有用的参数信息提取出来。分别对应到inputs和outputs参数,这个解析过程的完成一般会通过相应的语法解析器,也可以通过用户页面直接提交的方式来获取。当代表服务请求的参数获取后,inputs和outputs将动态的连接到一个OWL描述的和Web services描述所共享的领域本体,从而消除服务请求同Web services语法语义上存在的二义性,为服务的发现和匹配扫清障碍。

1.3 Web服务组合策略

为了能自动找出满足查询要求的服务组合,本文考虑用反向推理的自动服务算法来查找服务组合。该算法的主要思路是利用目标outputs参数同后续服务inputs参数的相似性来进行。

算法如下:

1)将服务请求的outputs作为目标outputs

2)通过web服务语义网中查找和目标outputs相匹配(equivalent,opposite subsumption)的语义服务

3)将寻找到的语义服务的inputs作为新的目标outputs

4)在还未被查找过的语义服务集合内继续查找同新目标相匹配outputs从而查找到下一个加入组合方案的新的服务节点。

5)跳转到step3

6)所有outputs参数已经查找过或者再无法再找到满足匹配要求的outputs,服务组合结束。

本文采用反向推理的方法使得出的组合方案都是满足服务请求的,因此可以减少无用组合方案的产生。

该组合策略在课题组的前序研究中已经得到了初步验证,能较为快速有效的找出服务组合方案,其中推理机采用JENA,本体建模工具为protégé3.2,服务本体采用的是:http://www.mindswap.org/2004/owl-s/services.shtml中的实例。但在大量服务本体存在情况下的组合效果还需要进一步验证和研究。

2 结论

根据在Web服务发现和组合中增加语义信息有助于提高服务组合的准确性和有效性这一理论,本文采用对服务请求通过领域本体进行语义标注以及在服务请求提出之前利用本体概念间的语义匹配,对不同Web服务的inputs,outputs参数进行匹配,文中提出的利用反向推理机制的服务组合算法,能提高服务组合方案的产生效率避免无用组合方案的产生。该服务发现组合策略是在一些已经具有的标准之上提出的一套形式化方法和算法,因此具有较强的实用性。进一步的研究主要在服务本体的分类、不同类别Web服务语义网的建立、大量Web服务存在时组合算法的优化、考虑用户偏好的服务语义建模、服务的Qo S等非功能属性的匹配几个方面。

摘要：为Web服务的提供者以及服务请求者在服务描述以及服务请求中加入相应的语义信息能消除Web服务中服务的查找和匹配环节参数的语义上的模糊性.将有助于服务的自动发现和组合.提出通过语义标注的方法在服务发现组合过程中添加语义信息,构建语义Web服务网络.并利用Web服务功能属性之间的语义关联,使用基于反向推理机制的自动组合算法形成语义Web服务组合方案选出能有效满足客户需求的服务组合.

关键词：Web服务,语义标注,Web服务组合策略

参考文献

[1]Oasis,UDDI version 3.0.1[DB/OL].http://uddi.org/pubs/uddi-v3.0.1-20031014.html.

[2]W3C,Web services Description Language,version1.1[DB/OL].http://www.w3.org/tr/wsdl.

[3]Duo zhang,Juan-zi Li,XU Bin.Web Service Annotationusing ontology Mapping[C].Proc of IEEE Internationalworkshop on Service-oriented System Engineering,2005:243-250.

[4]Semantic Web Annotation&Authoring Community[DB/OL],http://annotation.semanticWeb.org.

[5]I.Arpinar,B.Aleman-Meza,R.Zhang,A.Maduko,Ontology-driven Web services composition platform[J],Inf.Syst.E-Business Management,2005,3.

[6]David Martin,Mark Burstein,et al,owl-s:Semantic Markupfor Web services[DB/OL].http://www.daml.org/service/owl-s/1.1/overview/.

语义Web技术篇8

关键词：树剪枝,语义Web服务,基于本体概念的相似度,服务匹配

1 概述

语义Web服务[1]是近年来Web服务领域热门的研究方向之一。在W3C组织提出语义Web服务描述语言OWL-S[2,3]之后, 卡内基梅隆大学的Massino Paolucci等人提出语义Web服务的OWL-S/UDDI匹配算法[4], 该算法为语义Web服务匹配的一个经典算法。基于本体概念相似度的语义Web服务匹配算法[5], 针对语义Web服务的OWL-S/UDDI算法匹配不精确的问题进行了改进, 但查询速度仍然很底。本文针对基于本体概念相似度的语义Web服务匹配算法的问题, 提出按照树剪枝[6]原理来实现的一种新的语义Web服务匹配方法。

2 概念

2.1 本体。

本体可以用OWL-S语言来描述, 是语义Web中的重要概念, 是描述语义Web中语义知识的建模手段, 它形式化定义了领域内共同认可的知识, 用语义Web中基于本体知识标识手段来描述Web服务的输入、输出、前提和结果中的信息, 使计算机可以理解Web服务。在本体中有四种基本关系, 分别是:part-of, kind-of, instance-of和attribute-of无论是哪种关系都可以被认为是概念之间的子类关系, 也称为继承关系。由子类关系定义了概念之间的包含关系, 而且这种包含关系是可传递的。概念之间的继承关系是单继承。所以本体可以表示成一棵分类决策树。

2.2 树剪枝。

这种方法使用统计度量, 剪去最不可靠的分枝。树剪枝的优点是剪枝后的树更小, 复杂度更底, 更容易理解。“树如何剪枝呢?”有两种常用的剪枝方法:先剪枝和后剪枝。

虽然后剪枝方法所需的计算比先剪枝方法多, 但是先剪枝方法的缺点为:该树叶可能持有子集元组中最频繁的类或这些元组的概率分布, 然而却被剪枝。在本文中, 该树叶为父节点的子树被剪到, 然而可能持有与用户请求服务相匹配的语义Web服务。在后剪枝方法中, 就避免了这种问题的出现, 所以后剪枝方法通常产生更可靠的树。本文中采用了后剪枝方法来实现基于决策树的语义Web服务匹配算法。

3 树剪枝的语义Web服务匹配算法

3.1 分析基于本体概念相似度的Web服务匹配算法。

对于表示本体的决策树, 可以用2个不同节点vp、vq之间的距离distance (vp, vq) 来衡量节点概念之间的相似度。

从上表1中可以看到在144个匹配中只有68个可达, 却有76个不可达, 计算机花大量的时间和资源来处理这些用户的匹配服务请求,

但是其中有一半多的时间是处理这些不可达的服务, 即计算机在一半多的时间里所做的功都是无用功。下面的基于树剪枝的语义Web服务匹配算法就是针对解决服务于用户请求不匹配而提出的。

3.2 树剪枝的语义Web服务匹配算法。

该算法的中心思想:如果从vp节点没有路径到达vq, 且从节点vq也没有路径到达vp, 则剪去该子树, 所以If distance (vp, vq) =∞then pruning vq including vq-children, 在OWL-S/UDDI注册中心不可能真的对此分类决策树进行剪枝, 所以设置标致哨为-1, 用标致哨来表示该节点以及其子树为不可达, 也就是此节点以及其子树节点与用户所请求的语义Web服务不匹配。对于分类决策树中其余节点计算其服务匹配的相似度, 按照精确匹配, 可替代匹配、包含匹配的顺序排列出来, 返回给用户。

举例:假设用户请求By-air服务, 则distance (By-air, traveling) =-2;distance (By-air, communication) =-1;distance (By-air, By-air) =0;distance (By-air, By-sea) =∞在By-sea节点处设置标志哨-1, 表示在OWL-S/UDD注册中心里剪去By-sea节点以及其子树;distance (Byair, By-land) =∞, 在By-land节点处设置标志哨-1, 表示剪去By-land节点以及其子树;distance (By-air, airplane) =1。在By-sea和By-land节点处设置标志哨-1。

经过剪枝后的分类决策树变小, 复杂度变底。使用基于本体的概念相似度公式得:Sim (By-air, traveling) =5/6;sim (By-air, communication) =1;sim (By-air, By-air) =1;sim (By-air, airplane) =1/2;按照从communication、到By-air再到traveling最后airplane的顺序返回给用户。

4 实验结果

用准确率和召回率来作为语义Web服发现性能的指标。分别用本文提出的算法和基于本体概念相似度的语义Web服务匹配算法进行测试, 得到的平均准确率为0.73和0.33, 召回率为0.85和0.47。实验结果表明本文提出的语义Web服务发现方法在准确率和召回率方面都优于基于本体概念相似度的语义Web服务匹配算法。

本文定义的相似度匹配算法主要是针对匹配消耗大量时间和资源问题而进行的设计的, 保持OWL-S/UDDI算法的匹配等级的合理性和保于本体概念相似度的语义

Web服务匹配算法的精确性基础上, 又提高了服务匹配的准确率和召回率, 同时使计算机不需要花大量的时间和资源就可以判断此节点为根的子树节点不匹配, 所以对于分类决策树表示本体的语义Web服务采用树剪枝的原理, 可以增强计算机的自动理解能力。

参考文献

[1]陈小平.语义网基础教程[M].北京:机械工业出版社, 2008.

[2]刘奎, 赵晓静.一种基于本体的Web服务发现框架[J].计算机技术与发展, 2008, 18 (2) :112-114.

[3]邬翠兰, 叶荣华.语义Web服务发现模型研究[J].计算机与现代化, 2008, 154 (6) :39-42.

[4]Paolucci M, Kawamura T, Payne T R, et al.Semantic Matching ofWeb Services Capabilities[C]//Proceedings of the 1st InternationalSemantic Web Service.Las Vegas.Nevada.USA:[s.n.], 2003.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【语义Web技术】相关文章：

语义Web服务组合05-04

词汇语义05-17

色彩语义05-25

语义特点05-31

语义设计06-08

语义特征06-10

语义模型06-16

语义查询06-20

图像语义07-02

框架语义分析05-23