模式匹配

2024-05-31

模式匹配(精选十篇)

模式匹配 篇1

为了有效地组织、管理数据, 提高数据库的逻辑独立性和物理独立性, 人们为数据库设计了一个严谨的体系结构, 模式是通过某些数据结构连接起来的数据成员集合, 是数据成员的逻辑级视图。数据库领域公认的标准体系结构是三级模式结构, 它包括外模式、模式和内模式。

1.外模式

外模式又称子模式, 对应于用户级。它是某个或某几个用户所看到的数据库的数据视图, 是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集, 包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录 (外模式) , 也可以利用数据操纵语言 (Data Manipulation Language, DML) 对这些数据记录进行描述和定义。外模式反映了数据库的用户观。

2.模式

模式又称概念模式或逻辑模式, 对应于概念级。它是由数据库设计者综合所有用户的数据, 按照统一的观点构造的全局逻辑结构, 是对数据库中全部数据的逻辑结构和特征的总体描述, 是所有用户的公共数据视图 (全局视图) 。它是由数据库管理系统提供的数据模式描述语言 (Data Description Language, DDL) 来描述、定义的, 体现、反映了数据库系统的整体观。

3.内模式

内模式又称存储模式, 对应于物理级, 它是数据库中全体数据的内部表示或底层描述, 是数据库最低一级的逻辑描述, 它描述了数据在存储介质上的存储方式与物理结构, 对应着实际存储在外存储介质上的数据库。内模式由内模式描述语言来描述、定义, 它是数据库的存储观。

在一个数据库系统中, 只有唯一的数据库, 因而作为定义、描述数据库存储结构的内模式、描述数据库逻辑结构的模式, 也是惟一的, 但建立在数据库系统之上的应用则是非常广泛、多样的, 所以对应的外模式不是惟一的, 也不可能是惟一的。

总而言之, 一句话, 外模式对应的是用户看到的信息, 例如视图;模式是一个全局的逻辑视图, 如基本表;内模式是对应的存储结构, 例如表的存储文件。

数据库的三级模式是数据库在三个级别 (层次) 上的抽象, 使用户能够逻辑地、抽象地处理数据而不必关心数据在计算机中的物理表示和存储。实际上, 对于一个数据库系统而言, 物理级数据库是客观存在的, 它是进行数据库操作的基础, 概念级数据库中不过是物理数据库的一种逻辑的、抽象的描述 (即模式) , 用户级数据库则是用户与数据库的接口, 它是概念级数据库的一个子集 (外模式) 。

用户应用程序根据外模式进行数据操作, 通过外模式与模式的映射, 定义和建立某个外模式与模式间的对应关系, 将外模式与模式联系起来, 当模式发生改变时, 只要改变其映射, 就可以使外模式保持不变, 对应的应用程序也可保持不变;另一方面, 通过模式一内模式映射, 定义建立数据的逻辑结构 (模式) 与存储结构 (内模式) 间的对应关系, 当数据的存储结构发生变化时, 只需改变模式—内模式映射, 就能保持模式不变, 因此应用程序也可以保持不变。

二、模式匹配

模式匹配是在作为输入的模式中有对应语义关系的元素间产生一个映射。给定两个模式, 根据可利用的信息, 发现语义对应的模式成员之间正确的映射关系的过程。模式是通过结构联系的一系列元素的结合, 模式匹配是数据交换的核心, 以两个模式S、T作为输入, 产生匹配对, 每个匹配对的一部分元素来自S, 另一部分元素来自T, 通过匹配表达式指出两部分元素如何关联, 例如, 模式T中的成员credit_limit_amount (信用额度) 与模式S中的成员credit_range存在映射关系credit_limit_amount=credit_range。模式T中的成员list_price与模式S中的成员price与tax_rate存在映射关系list_price=price* (1+tax_rate) 。由于准确的语义信息只有模式设计者才能掌握, 不能在表达式中完全表达, 所以模式匹配的自动实现是一个难于解决的问题。目前主要有基于模式内部信息的模式匹配和基于大规模数据和背景知识的模式匹配。

模式匹配的最终目标就是寻找两个或多个模式元素之间的语义上的对应关系。即给出两个模式S和T, 对S中的每个元素s, 利用所有可用信息 (包括模式信息、数据实例以及用户反馈信息等) 在T中找到与s在语义上最匹配的元素。在很多领域, 模式匹配都起着重要的作用, 例如Web数据源集成、电子简历、数据仓库的装载、数据库设计、站点的建立与管理、基于组件的开发等。模式匹配的定义从不同的角度有着不同的描述, 下面从几个不同的角度分别描述模式匹配的定义:

定义1 (解释和非解释的匹配) 令Mi=match (R (r1, r2…rn) …fm (sm) ) , 其中Mi是一个匹配结果, match是一个匹配算法, R是大小为n的一个元模式, s是一个大小为m的目标模式, fi是任意的一个一对一的函数, 应用于目标模式中i列的值。称给定的匹配算法match是一个非解释的匹配, 当且仅当在不考虑函数fi时两个匹配的结果M1和M2是相同的。相反, 如果两个结果是不同的, 就称为解释的匹配。

定义2 (元素匹配和结构匹配) 结构匹配算法利用表中列之间的关系, 而元素匹配算法仅考虑单一列的特性。

定义3 (1∶1的模式匹配) S和T是给定的两个模式, 其中, S={S1, S2…SN}, T={T1, T2, …Tm}, 对于模式S中的任一元素Si, 利用所有有用信息, 寻找模式T中与之语义相似度最高的元素Tj。

定义4 (复杂匹配) 给定S和T两个模式, O={O1, O2, …Ok}是一组在一定规则集R的约束下可应用到模式T上的操作集合, 对模式S中的每一个元素s, 寻找出与之相似度最高的元素t, t可以是T中的一个元素, 也可以是由T中的元素在规则R约束下构造的一个规则。

复杂匹配包括1∶n匹配, n∶1匹配和n∶m匹配。

三、模式匹配技术存在的问题

匹配操作研究在一定程度上解决了简单模式匹配中发现的问题, 但距其使用还有很大的距离, 除了当前的匹配方法不能较好的挖掘语义关系的原因外, 还有未充分研究匹配前的预处理, 匹配结果的动态维护, 自动匹配与用户参与的配合以及复杂模式中的匹配问题等因素。因此模式匹配在应用中存在以下问题。

1.匹配效率不高, 质量较差。

假设模式S有X个实体, M个属性, 模式T有Y个实体, N个属性, 如果仅考虑1∶1的成对属性匹配, 至少需要M*N次比对, 如果属性较少, 则工作量较小, 质量较好;如果属性较多, 则效率较低且质量较差。但实际应用中往往是属性和实体很多, 此外由此产生的匹配结果将是一个非常巨大的映射集合, 人工处理的工作量将是很大的。实际上, 直接成对匹配是没有意义的, 因为绝大多数比较计算都发生在语义无关的模式成员之间。

2.重复匹配。

在数据库中, 实体之间的联系通常通过主外键表示, 因此某些键码属性在多个实体中存在, 另外, 实际应用中为了方便查询和处理, 某些常用的信息可能存在冗余, 如果直接匹配会产生大量重复匹配。

3.同名异义的语义冲突匹配。

即名称相同或相似, 实际语义不同。例如, 在数据库建设中, 数据源S中的实体S1和实体S2都用属性amount描述金额, 但S1表示交易类信息, S2表示申请类信息;假设数据库模式S1中, 属性amount仅代表交易金额, 如果不考虑完整的语义和逻辑分类, 直接进行匹配, 很可能将S2中的amount与数据库中的相应属性建立匹配, 但实际上它们属于不同的语义背景, 毫无关系。

4.复杂匹配关系的处理难度加大。

史永翔:找到匹配的赢利模式 篇2

企业经营的目的是实现持续的赢利,而实现持续赢利的关键是内部能力与外部需求的结合,这个结合做得越正确企业的投入产出比越大;结合的越紧密企业管理效率越高;结合的越持久,企业的竞争力就越能打造成功。

而这个结合点的分析与设计就是企业的赢利模式。赢利模式分为内外两个部分:外部我们称之为机会、市场、趋势、消费者的变化;内部我们称之为能力,是企业固有属性、资产、软实力、经验等等。

找到企业匹配的赢利模式设计和管理,就要从三方面思考并执行。

第一、行业属性。

进行企业赢利模式设计,就要分析企业产品的赢利空间、成本结构,更直接的理解就是要分析企业的资产结构,弄清资产结构决定企业赢利能力的途径,找到企业赢利管理的出发点与核心点。而行业属性的不同,投资结构就会不同,这就会带来成本结构的不同,这些决定了需要消化的直接成本和固定成本。在这里你需要很好的测算你的成本动态。这里的固定成本,不仅包括固定资产投资也包括相对固定的费用支出(如:房租、管理人员等),

因此,你站在什么起始点上很重要!这就是赢利核心点,就是你所发现的正确道路。

第二、就是围绕赢利点设计赢利模式。

我们要强化围绕赢利点来设计战略步骤、营销方式和管理关注点,有机地将行业属性与企业战略、财务、营销相结合;并围绕此核心点展开,不要使方法之间产生对冲,保证在正确的道路上摆动。这样才能有效地将企业优势彻底发挥出来,从而避开高风险的打击。

第三、要设计运营步骤,并保证做到。

我们经常在企业管理中发现,很多方案、计划都没能做到;大部分都是因为我们忽视了设计行动步骤的重要性。而且,因为方案没能做到,我们就会怀疑做错了,设计错了!这就带来了更大的迷茫,脱离了正确的方向。所以,好的设计方案很重要,而坚决地执行力才是方案成功的保障!执行就要坚决!怕麻烦做事,想抄近路,只能导致失败。而坚决地执行力是要有清晰准确的行动步骤,并不断检查是否做到。从而保证在正确道路上持续努力。

4种不可不知的颜色匹配模式 篇3

图像的颜色匹配模式

根据ISO15076规定,ICC色彩管理转换共有4种颜色匹配模式:可感知颜色匹配模式、饱和度优先颜色匹配模式、相对比颜色匹配模式、绝对比颜色匹配模式。在Photoshop软件菜单栏中选择“编辑→颜色设置”,在颜色设置对话框中选择“更多选项”,在“转换选项”一栏的“意图”中就可以看到这4种颜色匹配模式,如图1所示。

1.可感知颜色匹配模式

选择可感知颜色匹配模式,颜色从源色彩空间映射到目标色彩空间时必须符合三个条件:①色彩空间以等比例压缩;②源色彩空间和目标色彩空间最大亮度处(即白点)重合;③其中的白点映射为标准观察者(光源为 D50,视场角度为2°)。

其工作原理如图2所示:沿着源色彩空间最外顶点G1与白点E的连线,G1点被压缩至G1’点,G2按相同比例被压缩至G2’点,同理,即使落在目标色彩空间的R1也以相同的比例被压缩至R1’点……

可感知颜色匹配模式的特点是从较大的源色彩空间映射到较小的目标色彩空间时,只有白点E的颜色保持不变,其他各点按比例压缩。这种色彩转换形式,能够有效地保留图像的色彩和阶调变化关系,使图像的阶调等比例再现,常用于将大色彩空间匹配到小色彩空间的转换。

2.饱和度优先颜色匹配模式

饱和度优先颜色匹配模式是指从源色彩空间映射到目标色彩空间时,以最大优先级保护甚至提高颜色饱和度的转换模式。

其工作原理如图3所示:G1和G2分别匹配到G1’和G2’,而G1’和G2’则重合于同一个点上,R1被匹配至R1’,B1被匹配至B1’,这些颜色都是以追求达到最高饱和度结果为原则,而且匹配的方向并不一定指向白点E。

这种匹配方式显然牺牲了一部分(尤其是目标色彩空间外的)色彩和层次,所以它主要应用于对阶调层次要求不高,只重视高饱和度、层次不太丰富的图像转换。卡通画、电影小丑画报等可采用这种转换方式。

3.相对比颜色匹配模式

选择相对比颜色匹配模式时,颜色从源色彩空间映射到目标色彩空间必须符合3个条件:①源色彩空间中最亮的白点映射到目标色彩空间最亮的白点上,目标色彩空间白点并没有进一步模拟;②源色彩空间中与目标色彩空间中相同的色彩保持不变;③超出目标色彩空间的颜色则以最接近的颜色替代。

其工作原理如图4所示:两个色彩空间的色域大致相同,且重合度比较高,其优点是可最大限度保留源色彩空间的颜色,图4中的G1、G2点分别处于目标色彩空间外,两点的匹配点G1’、G2’均落在距离自身最接近点,最终是两点重合,而位于目标色彩空间的R1点则保持不变,即R1与R1’重合。

这种匹配模式主要应用于小色彩空间向大色彩空间转换。二次原稿尤其是一些印刷类文物,由于工艺不同,源色彩空间总体上小于目标色彩空间,采用这种转换模式,能最大限度地再现源色彩,如保持文物特有的残缺美。

4.绝对比颜色匹配模式

绝对比颜色匹配模式与相对比颜色匹配模式基本相同,其必须符合三个条件:①源色彩空间中最亮的白点映射到目标色彩空间最亮的白点上;②源色彩空间与目标色彩空间中相同的色彩保持不变;③超出目标色彩空间的颜色则以最接近的颜色替代。其最大的不同在于目标色彩空间的白点是严格模拟承印物的白点(如纸白),如承印物的白点偏红则目标色彩空间的白点自动以偏红与之匹配,而不是试图另设白点。

其工作原理如图5所示:处于目标色彩空间的B1、B2两点的匹配点为B1’、B2’,并且同时落在B1与白点E的连线与目标色彩空间的边缘线相交处,而处于目标色彩空间内的R1与其匹配点R1’重合,也就是说匹配色彩保持不变。

该模式主要应用于从小色彩空间向大色彩空间转换。

图像颜色匹配模式的应用

在实际生产中,通过分析原稿图像的特点,结合具体生产条件以及复制图像的最终目标,选取合适的色彩匹配模式,可以使图像复制的质量和效果更好,生产进程更顺畅。下面笔者将从对上4种比较有代表性的图像色彩匹配模式进行说明。

1.可感知颜色匹配模式的应用

图6是汽车图片及其直方图,原稿种类是反转正片。通过分析可知,图片原稿最高密度达到3.4,经扫描后图像色彩模式为RGB,其阶调层次丰富、清晰度高,目标是用于广告海报印刷。参照上面4种色彩空间匹配原则选用可感知颜色匹配模式,将它从大色彩空间RGB转换到小色彩空间CMYK中,各色彩按等比压缩,可保持汽车图片上各个部位的细节,同时又保证印刷工艺能够顺利进行。

2.饱和度优先颜色匹配模式的应用

图7是枇杷卡通画及其直方图,该图片反差大,色彩明快,从直方图可以明显看到,图片有相当一些十分突出的彩色带状或线状的阶调,这说明图像的阶调层次简单且不连续,色彩模式为RGB,工作目标是用于制作小挂图。该图像可选用饱和度优先颜色匹配模式,将它从RGB模式压缩到CMYK模式,可最大限度地保持图像的饱和度,使画面色彩鲜艳,更具吸引力。

3.相对比颜色匹配模式的应用

图8是旧书籍图片及其直方图,该图片反差小,阶调层次简单,有明显色偏,而且有一定的残缺,色彩模式为CMYK,该图像将用于历史类书籍印刷。该图像可选用相对比颜色匹配模式,将它从源CMYK模式匹配到目标CMYK模式,由于客观条件限制,目标的色彩空间整体上比源CMYK色彩空间大,更有利于色彩的再现,同时目标色彩空间对于白点并不作模拟,所以可保护图像中的色偏,从而达到了再现旧书籍特有韵味的目的。

4.绝对比颜色匹配模式的应用

图9是红花图片及其直方图,该图像反差适中,阶调层次丰富,色彩模式为CMYK,将应于数码打样中。该图像可选用绝对比颜色匹配模式,将其从源CMYK模式匹配到目标CMYK模式,同时模拟打印介质的纸张白点,例如本图像最终将用于报纸印刷,那么这时模拟打印介质的纸张白点应以新闻纸白点为基准点,而数码样张就顺理成章地成为报纸印刷的样张了。

5.几点注意

以上图像色彩匹配规律和原则是基于严格控制生产条件(如印刷机、油墨和纸张等趋于理想化或可控)时进行的常规研究,在实际生产中可能有一定的偏差。

另外,在实际应用中应综合考虑各方面的因素,制定合理的工作方案,才能达到最佳效果。例如图7中的卡通图片在选取饱和度优先颜色匹配模式后,若采用GCR工艺,在黑版中可选取采用较少的黑版量,这样图像的饱和度可以更高,能达到更好的效果。

基于粗糙集的模式匹配方法 篇4

随着信息化技术和Internet的迅猛发展,信息规模不断变大,为了满足人们对信息的发现和获取的更高需求,异构信息集成是解决问题的关键。而异构问题的解决归根到底是语义冲突的解决。而模式匹配是解决语义冲突的一种重要手段。机器学习方法在模式匹配中有广泛的应用,如K-近邻分类算法[1],人工神经网络方法[2],朴素贝叶斯方法等,这些传统的方法在特殊领域中有较高的准确率,但各自仍存在不足。如神经网络,当网络规模较大、样本较多时,训练过程变得复杂而且漫长。粗糙集理论是一种新的处理模糊和不确定信息的全新数学工具,它可以从大量的数据中分析、推理、挖掘隐含知识及规律。为此本文结合粗糙集的属性约简和人工神经网络的优点,提出一种基于模式的匹配方法。该算法能够在不影响匹配精确度的情况下有效地提高效率。

1粗糙集理论

粗糙集理论[3]是波兰数学家Z.Pawlak于1982年提出的一种数据分析理论。粗糙集理论在信息系统分析、人工智能及应用、知识发现、决策分析、模式识别、模糊控制等方面提供了一种新的数学方法。粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为等价关系对数据的划分,每一被划分的集合称为概念。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理比较客观。下面给出粗糙集的一些定义:

定义1 知识库可表示为K=(U,R),其中R为论域U上的等价关系集合,则U/R表示RU分成的所有等价类构成的等价类簇。

定义2 给定近似空间均K=(U,R),PRPΦ,P中所有等价关系的交集称为P上的一种不分明关系(或称不可区分关系),记作IND(P),即:

[x]ind(p)=RΡ[x]R

定义3 给定近似空间K=(U,R),XUU上的一个概念,非空子集PR所产生的不分明关系IND(P)的所有等价关系的集合即U/IND[P]称为基本知识,相应的等价关系称为基本概念。

定义4 令R是一族等价关系,,若IND(R)=IND(R-{R}),,则称RR中不必要的,否则就是必要的。若每一个R∈R都是中必要的,则称R是独立的,否则就是依赖的或非独立的。

定义5 设RQP,如果Q是独立的,且IND(Q)=IND(P),则称Q为的一个约简。P中所有必要关系组成的集合称为P的核,记作core(P)。

2粗糙集神经网络模型

2.1方法概述

模式匹配可分为元素级匹配和结构级匹配,本文主要研究元素级的匹配。匹配指的是模式间元素的映射和语义的一致性。而属性的语义信息主要体现在数据字典(例如属性名称)、模式(如数据类型,长度,是否为主键,取值的约束条件等)和数据内容(如属性值等)上。其中模式匹配是属性语义匹配的关键,本文就模式匹配方法进行研究。在模式匹配中,由于异构数据库的属性描述的不一致,导致属性匹配有一定的不确定性。而神经网络在处理具有不确定性的属性匹配问题上有着独特的优势,能够充分考虑到属性实例值的信息,且有较强的推广能力和自适应能力。因而神经网络方法在模式匹配中应用较广。文献[4,5]提出并研究了用BP神经网络实现异构数据库间属性匹配的方法,并开发了异构数据库集成的原型系统SEMINT(Semantic Integration),属性的模式信息和属性值的信息作为判断属性是否相同的主要指标。作为神经网络的输入信息,属性取值及用于描述属性的元数据信息必须量化为数值表示,再通过转换函数将这些信息转换到区间[0,1]之间。该方法对异构数据库间的属性匹配有很好的效果,但是当神经网络输入特征向量维数过多时,匹配结果会有很大差异。而粗糙集方法可以弥补神经网络方法的不足,它可以通过模式元素本身的信息,约简冗余属性,大大降低神经网络输入信息空间维数,能够缩短神经网络训练和匹配的时间,还避免了当数据规模较大时收敛困难的问题。流程如图1所示。

首先系统从数据源系统抽取部分模式信息,如模式名称、属性集、功能描述等组成信息表(如表1所示),人工对模式进行分类,将分类结果添加决策属性生成决策表,作为训练样例。通过粗糙集约简后,根据约简结果构建BP神经网络模型,模型训练结束输入待匹配数据输出最终匹配结果。

2.2算法描述

阶段Ⅰ 数据预处理

Step1:输入数据源系统Db1,Db2,…,Dbm及其模式S0,S1,…,Sn

Step2:提取模式信息。为了便于后续算法的运行,提取后还需要将模式信息转换为粗糙集算法和神经网络算法可运行的数字信息形式。转换后的数据组成数据集。针对可能出现的空值采用平均值填充算法(Mean/Mode Completer)对数据集缺失数据填充。然后采用等频率法对填充后数据集离散化。

Step3:从中处理后的数据集中抽取K个向量X0,X2,…,Xk人工分类,根据分类结果构成决策表。

阶段Ⅱ 粗糙集约简

Step1:使用Rosetta工具对决策表约简,删除决策表冗余属性。

Step2:输出决策表子集A={A1,A2,…,Ap}。

阶段Ⅲ BP人工神经网络匹配

Step1:构建三层前馈BP神经网络,输入神经元数目等于约简后决策表属性数目,隐藏层神经元数目根据训练效果调整,输出层神经元数目等于分类数目。

Step2:训练神经网络。将决策表条件属性作为输入数据,决策属性作为目标数据,输入神经网络训练。

Step3:将其余数据输入形成训练规则的BP网络中,输出[0,1]间匹配结果。

3实例

为了检验算法的效果,我们采用成都飞机工业公司的“计算机辅助模、夹具工时定额系统”的新开发的数据库和其遗留数据库中的部分数据作为对象,选取遗留数据库中的3张表(标准零件信息表、人员信息表和车间信息表)和新开发系统中设计的标准件录入管理表作为实验对象。实验结果如表2所示匹配结果很理想。通过统计属性相似度结果如表3所示,相似与不相似之间的界限非常明显。结果表明,基于粗糙集神经网络算法是一种可行有效的方法。

4结论

本文介绍了一种基于粗糙集和BP神经网络的模式匹配方法,实验表明该方法能够保证匹配准确度的前提下提高算法效率。同时该算法具有很好的通用性,可以应用于Ontology等模式中。在制造业背景下的信息集成中,单纯的模式匹配方法仍有不足,将模式匹配和领域概念知识相结合是我们接下来研究的重点。

参考文献

[1]Cohen W W,Haym H.Joins that generalize:text classification using WHIRL.Proceedings ofthe Fourth International Conference on Knowl-edge Discovery and Data Mining(KDD98),1998

[2] Mitchell T.Machine Learning.McGraw Hill,1996

[3]Pawalk Z.Rough sets.International Journal of Computer and Infor-mation Science,1982;11(5):341—356

[4]Li WS,Clifton C,Liu SY.Database integration using neural net-works:Implementation and experiences.Knowledge and Information Systems,2000;2:73—96,2000(Springer-Verlag London Ltd)

模式匹配 篇5

关键词匹配模式

我们来看5种关键词匹配模式的解释:

精确匹配:仅当网民的搜索词与您提交的关键词完全一致时,您的推广结果才有展现机会。

短语-精确包含:当网民的搜索词完全包含您的关键词时,系统才有可能会自动展现您的推广结果。

短语-同义包含:当网民搜索词完全包含您的关键词及您关键词的插入、颠倒和同义形态时,系统才有可能会自动展现您的推广结果。

短语-核心包含:当网民搜索词包含您关键词或您关键词的核心部分,或者包含您关键词或您关键词核心部分的插入、颠倒和同义形态时,系统才有可能会自动展现您的推广结果。

广泛匹配:当网民搜索词与您的关键词高度相关时,即使您并未提交这些词,您的推广结果也可能获得展现机会。

对于没有做过竞价的朋友来说,看过以上百度官方的解释之后,第一感觉应该会选择广泛,百度官方强调“高度相关、获得更多展现机会”,现实情况也确实是很多中小企业竞价账户的关键词匹配模式为广泛,但是实际情况是,如果你设置关键词匹配模式为广泛的话,您的广告费中的至少百分之50以上是被浪费掉了,比如XX科技一个客户是做成人英语培训的,如果设置关键词“成人英语培训”匹配模式为广泛的话,那么则会匹配出“小学英语培训”、“小学英语培训班”、“初中英语培训”、“三年级英语学习班”等等大量关键词,而这些关键词显然与我们的服务内容没有关系。

那么设置短语-核心包含呢?同样会匹配出很多无效关键词,比如“在线成人英语视频教程”、“成人英语学习方法”、“成人英语等级考试”、“成人英语自学网”等,这也就是为什么您会感叹,每天来100多ip,关键词设置为“短语-核心包含”,居然连个咨询的都没有,真邪门,

那是不是我们设置为短语-精确包含和短语-同义包含就不会匹配出无效关键词了,同样不是的,如果你每天看你的竞价统计搜索词报告的话,您会发现关键词即使设置为这2种匹配模式,仍然会匹配出很多无效关键词,比如:“英语培训班”,则会匹配出“英语培训班宣传单”、“英语培训班招生简章”、“英语培训班招生广告”等,显然这些词依然为无效关键词,这些关键词带来的流量同样为垃圾流量,对于我们业务的提升是没有任何帮助的。

那是不是所有关键词都应该设置为精确匹配呢?如果全部关键词都设置为精确匹配模式的话,则会出现另外一个问题,会错过一些转化率极高的关键词,用户的搜索习惯是千变万化的,有些用户喜欢搜索很长的词,比如“郑州的短期英文培训”、“郑州成人学英语口语哪里好啊”、“成人到哪儿能学到系统的英语”,而另外一些用户则喜欢搜索“英语学习班”、“郑州成人英语”,这些关键词的转化率都是比较高的,我们在添加关键词的时候使用关键词工具会尽可能多的添加精准关键词,但是我们能做的也只是近可能的添加更多,永远不可能达到所有,记住,用户会使用各种各样的关键词搜索他们想要的信息,而其中的一部分搜索关键词,我们是很难挖掘到的,如果我们将关键词全部设置为“精确匹配”的话,那必然会损失掉一些高质量的客户,而设置为“短语-精确包含”和“短语-同义包含”的话就又会匹配出无效关键词,那么我们到底设置为哪种匹配模式比较好呢?

根据我们竞价团队多年的经验总结,一个竞价账户里的关键词匹配模式同时存在“精确匹配”、“短语-精确包含”和“短语-同义包含”,根据关键词的不同特点对应不同的匹配模式,这是一种比较完美的设置方法,结合“否定关键词”工具,保证所有关键词带来的流量为精准流量。

模式匹配 篇6

科学课程的基本理念是以全面提高学生的科学素养为核心,要求教师在教学中应面向全体学生,立足学生发展,体现科学本质,突出科学探究,反映当代科学成果。课程的总目标是科学素养,包括科学探究;科学知识与技能;科学态度、情感与价值观;科学、技术与社会的关系。因此科学教师必须摒弃陈旧落后的教学观念和教学模式,以全新的教育课程理念去实施科学教学,不断探讨教学过程的特点以及构建与教学过程相匹配的教学设计。

一、探讨新课标下的教学过程

1.教学过程是“整合”知识、科学“探究”的过程

“整合”不是简单地把不同学科知识之间的综合作为惟一追求的目标,而是通过对内容的整合让学生从整体上认识自然,从基本科学观念上理解科学内容。一是试图超越学科界限,保留带有结构性的基本内容,注意不同学科领域知识之间的贯通和连接。二是全面提高学生的科学素养,将科学知识与技能;科学态度、情感与价值观;过程、方法与能力进行结合与渗透,并力求反映科学、技术与社会的互动与关联。

科学探究活动是培养科学观念与能力的关键途径,也是培养创新精神与实践能力最有效的手段。故科学探究的具体设计力求突出科学素养,体现学生的主体作用,符合学生的心理特点,从学生身边熟悉的事物出发,为学生所喜爱,并让学生参与科学探究活动的开发。要围绕各领域的具体内容设计各种形式的探究活动,要注意不同领域的特点,在要求上各有侧重,相互补充,从而在科学方法与能力上给学生以较全面的训练。

2.正确科学地实施科学探究

要达到科学的探究活动就必须做好以下几个方面的工作:

(1)准确科学地理解科学探究的涵义。所谓科学探究应该包括两个方面:一方面是实验探究,是指由师生共同参与的动手动脑的实验或实践;另一方面则是理论探究,即是指阅读材料、资料、图片、数据、图表等有关信息进行处理和整合并进行概括和表达的能力。

(2)正确把握科学探究的原则。科学是一门综合学科,所涉及的知识包括物理、化学、生物和地理等学科领域的相关知识,而它们的最典型的特点都是从实践中来的,因此进行科学的探究和实践可以说是学习这一学科的最好方法。但是实施科学探究时必须把握好以下几个原则:

第一,理论联系实践的原则。科学源于实践,实践出真知,这是人的共识。那么在科学教学中就更应该得到重视和付之实施。在初中教学中,经常可以发现好动的学生在学科学时思维显得灵敏而活跃,经了解和调查发现那些学生的童年生活经历比较丰富多彩,他们的童年是在采野果、捕蝴蝶、垒沙堡、玩泥巴、燃落叶、用弹弓打鸟、把蚁穴捣开等活动中度过的,分析发现那些孩子的共同点就是爱玩耍,众所周知,玩耍本身就是实践的一种过程。那些學生在学习科学知识时往往在课堂上反应是最活跃、最敏捷的。因为这些看似不务正业的把戏,却开启了他们科学实践的先河。从那时起那些孩子就睁大了好奇的双眼,在探索着世界的奇妙:纸飞机怎样飞得更快?枯树枝怎样烧得更旺?蝌蚪怎么成长?等等也许当时他们找不到答案,但那种观察、思索,则为日后的学习奠定了基础。随着学习的深入,他们更加深刻地认识到实践的重要性。实践能把书本上烦琐而死板的知识点轻松而鲜活地刻画在脑海中。纵观新课改下对学生学业评价的考查中也可以发现,学业知识的评价也注重对学生的探究和实践能力的考查,并渗透着联系实际,学以致用的原则。

从中考的试题也可以发现,对于学生的学业的评价不纯粹是知识点的考查,而是综合考查。侧重于对学生的探究能力的考查,并且是与人们的生产、生活息息相关,与时代经济发展、环境保护密切相关的生活中的知识。

第二,角色转移和替换原则。所谓角色的转移和替换是指利用一些模型来进行相关科学知识的探究和实践。比如当学习我们生活的地球知识时,随着经济的发展,对环境造成的污染和给人类带来的灾难日益严重。那么不妨让学生自己扮演一个环境保护的责任人,把地球用生活中一件容易受损的物品来替换。建议可以让学生利用课外和课内的时间体验这样一个实验:要求每一位学生试着在一天中照顾一枚鸡蛋,保证鸡蛋完好无损。

不难想像,当学生体会了这一实践和探究之后,学生对地球的相关知识及对地球的保护意识必定会体现在自己的言行中,同时也会对自己所处的周围环境的维护有着一种强烈的责任感。

二、科学探究与实践的教学设计

从广义上讲,教学设计是一个“分析教学问题、设计解决问题,对解决方法进行试行、评价试行的结果,并在评价基础上修改解决方法的过程”,目的是“获得解决问题的最优方法”。为了有效地实施新课标下的科学教学,体现新课程的教学过程特点,科学教师必须构建与教学过程本质态度相匹配的教学设计。

1.教师教学设计的“意识”是相对于原先教师备课意识而言的

传统的备课将重心放在分析教材、梳理知识、强化考点等方面,其主要职能是实现与强化教材、教参、考纲的权威功能与诠释,缺乏教师自己的教学创意、教与学的互动设计、学生学习的激发等。用这种传统思维备课,课堂教学就很难有大的突破,所以新课标下教师教学设计的“意识”转变显得尤为重要。如将教材作为教学活动的团体和媒介之一,要从“施工图纸”式的教案向“探究”式的教学设计转变,要从知识性的备课向发展性的教学设计转变。

2.教学设计的“实质”是对科学课程的二次加工

课程是教学中师生探索新知识的主要“信息源”。教师和学生是课程相互作用的主体,是课程的创造者和主宰者,只有教师和学生共同参与课程的创造和改革,才能创造出教学可持续发展的空间,促使课程不断完善和升华,达到课程与教学的互融、转化和促进,教学由此变成一个动态的完整体系。不能认为课程和教学是两个互不相干的概念,也不能将课程变成教师教学过程中的“枷锁”,具有不可改变的“权威性”,这样会严重阻碍教师与学生的积极性和创造性。对科学课程内容进行适合于学生学习、有利于张扬学生的个性的任务已成为现代教学设计中的重要一环。由于不同地区、不同学校、不同班级的学生不仅在认知方面存在差异,而且在心理活动等方面也存在差异,因此新课程的内容并不是对每一个学生都具有“适应性”。为了促进学生的发展,科学教师在进行宏观和微观分析的基础上,结合对学生初始能力的诊断性评价的反馈信息,对开发出来的课程进行必要的再“加工”,即二次加工——对新课程的内容进行适合于学生学习、有利于学生发展的内容增删和重组,通过加工呈现出新的课程,即课程的重构,而不是传统意义上的一成不变地“复制”教科书上的内容。只有灵活处理课程,充分考虑教师特色、学生特点、现实环境特征,教学设计才能营造出耳目一新的课堂教学。

3.探究与实践的教学设计内容是“知情合一”的统一体

科学态度、情感与价值观是科学精神的重要内容,是科学课程目标的重要方面,科学态度、情感与价值观的培养应贯穿在科学探究和实践的全过程中。而传统的教学设计过分注重学生的智力因素,有意或无意地忽视了学生所必需的情感教育。教师在传统的教学设计中对学生学习任务的分析往往只涉及各知识点及其组成的知识结构、掌握知识所需要的基本技能等因素,而对教学过程的有效推进、学生的全面发展具有促进作用的因素考虑很少,这对学生人格的健全发展是不利的。由此可见,教学设计不仅要关注基础知识和基本技能,而且要挖掘有关情感等因素,使教学内容成为“知情合一”的统一体。

4.探究实践的“成果”是一个指导性的动态方案

传统的教学是以教师的教和书本知识为本位,从教师的主观判断或教学经验出发,往往侧重于教学过程的程序化,特别是细节化的准备。一般来说是一个倾向于“静态”的计划性的教案。这能适应教师单向的“传递”活动,但不能适应交互动态的真实教学过程。为了在教学过程中使师生之间达到平等交往、积极互动、共同发展的效果,现代教学设计应以学生的学习和学生的发展为本,体现出学生发展的全体性、主动性、独立性、创造性、差异性和持续性,从学生学习的实际出发,以粗线条的“静态教案”为基础,综合考虑教学过程中的各种不确定因素,使其成为具有指导性的“动态方案”——“弹性化的教学方案”。只有这样,在教学过程中,教师才有可能根据学生学习的反馈情况再作出详细的、适时的动态调整或调适。从而可以弥补在粗线条的“静态教案”中原先设定的教学流程可能不是实际的教学流程等缺陷。因此,教学设计的“成果”不应是一个计划性的“静态教案”,而应是一个指导性的“动态方案”。

新课程实施已多年,实践中我们认识到,初中科学教学没有现成的模式可循,需要我们继续去尝试、摸索、争鸣、总结、反思。惟有反思,才会有进步与提高。改革是在继承的基础上的改革,我们要辩证地对待传统教学中好的东西,只有学会继承才能发展、创新。

基于模式匹配的NACBM算法研究 篇7

关键词:入侵检测,模式匹配,算法。

1 引言

在基于主机入侵检测技术中, 应用比较多的是误用检测技术其核心多采用字符串搜索算法模式匹配技术。通过对目前广泛应用的BM算法[1]和AC_BM算法[2]的分析, 提出基于AC_BM算法的改进的多模式匹配算法NAC_BM算法。该算法综合了BM算法和AC_BM算法的优点, 改进了BM算法跳跃步长, 使得每次匹配获得最大的步长, 同时应用AC算法有限状态机模式匹配自动机构造模式树, 匹配过程中移动模式树, 减少了规则匹配次数, 为基于主机的入侵检测模式匹配技术提供了一种优化方法。

2 多模式字符串匹配算法

由于BM算法是一种单模式字符串匹配算法, 它每次只能完成对一个模式的匹配工作, 效率较低。虽然研究者对BM改进算法很多, 但是这些算法都没有改变BM算法的基本思想, 因此不能解决效率问题。

为了提高效率, 研究者提出了多模式匹配问题[3], 多模式匹配问题可以抽象描述为:设P={he, she, his, hers}是一个模式集合, 模式串Pi中的字母来自于一个固定的字母表∑。多模式匹配问题是发现P中所有模式在文本T中的所有出现, T=T1, T2, ...Tn, Ti∈∑。

3 A C_B M算法的改进—N A C_B M算法

通过分析AC算法和AC_BM算法, 在此提出一种新的算法—NAC_BM (New AC_BM) 算法, 其算法的基本步骤:

(1) 匹配起始位置。算法使模式树的最短模式的右边与输入串的最右边对齐, 匹配从左向右进行。

(2) 坏字符移动。如果出现了不匹配字符, 即模式树串P的某一模式P′的某一字符P′ (j) 与输入串T的某一字符T (i+j) 不匹配, P′ (j) ≠T (i+j) , 令b=T (i+j) 。a=P′ (j) , 那么移动输入串指针寻找输入串字符T (i+j) 的前一字符d=T (i) , 在整个模式树中第j位以后的串中查找与该字符d相匹配的字符e=T (i+j-2) 。若找不到与该字符所匹配的字符, 则移动模式树将模式树最小模式右端与该字符的前一字符对齐, 如图1所示。

若在模式树中找到了与该字符d相匹配的字符且前一位置字符f≠a, 则移动模式树相应距离, 使该字符d与模式树中某模式第1次含有该字符的位置对齐。在移动过程中最大移动距离不能超过最小模式的长度, 如图2所示。

(3) 好字符移动。如果模式树的某一模式某一字符P′ (j) 与输入串T的某一字符T (i+j) 不匹配, 且P′ (j) 之前的字符P′ (1) P′ (2) ⋅⋅⋅P′ (j-1) 与输T (i+1) T (i+2) ⋅⋅⋅T (i+j-1) 入串相匹配。令b=T (i+j) , a=P′ (j) , 再将T (i+1) 之前的字符T (j) 与已经匹配的串T (i+1) T (i+2) ⋅⋅⋅T (i+j-1) 一起构成一个新的启发函数字符串v=T (i+1) T (i+2) ⋅⋅⋅T (i+j-1) , 在整个模式树P中第j位以后的串中查找是否含有该字符串v, 若模式数中含有v, 则移动模式树使模式树该匹配位置与输入串含u串的位置对齐, 如图3示。

若模式树中不含v, 则在字符串v的前缀中查找与该模式树某字符串匹配的最长字符串v′=v′+d, 后移动模式树, 使之对齐。在移动过程中最大移动距离不能超过最小模式的长度, 如图4所示。

(4) 同时应用坏字符移动和好字符移动方法, 取其中最大移动距离长度。每个模式树都可以预先算并保存所有字符的“坏字符平移距离”和每位的“好字符平移距离”, 它们与输入串无关。

4 仿真实验分析

为了对各个算法的性能、效率做具体的评测, 在同一台计算机上分别对单模式匹配算法和多模式匹配算法进行了仿真测试。

在本测试中采用的搜索文件是来自麻省理工学院林肯实验室提供的“1999DARPA入侵检测测试数据集”[4], 长度为10000000Bytes的文本, 而匹配的模式串是随机抽取的。

由于对于单模式和多模式而言, 各有其不同的特点, 比如对于单模式匹配算法, 它的时

间开销与模式串的个数成正比, 不能用它们解决多模式匹配的性能问题。而对于绝大多数多模式匹配算法都要在执行搜索操作前, 对模式串集合进行预处理, 构造某种数据结构, 以便为搜索过程提供支持;相对于单模式匹配算法对空间需求可以根据模式串的长度而估算出来。本实验对匹配的模式个数对各种匹配算法性能的影响进行了仿真并给出对比分析。

图5中“*”号表示该项未测试。对于模式串为1 (即单模式串) 时, AC算法、AC_BM算法和NAC_BM算法没有必要测试它们对单模式匹配的性能。当模式个数大于1时, 多模式匹配算法扫描对象文本一遍, 而单模式匹配算法则要扫描对象文本多遍, 即对每一个模式串扫描一遍对象文本。对于模式串个数为1000时, 对单模式匹配算法是十分费时, 且其耗费时间也可估算出来。

从图5的结果来看, 多模式匹配算法比单模式匹配算法的匹配速度快得多。三种多模式匹配算法仍然比其他单模式匹配算法速度快, 而且AC_BM算法和NAC_BM算法比AC算法快, 这两个算法随着模式串数目的增加, 所耗费的时间仅有很小的增加, 而不是成比例地增长。从表中可以看出, NAC_BM算法比AC_BM算法在效率上有一定程度的提高。

5 结语

本文提出了一种改进的AC_BM算法:NAC_BM算法。该算法一是在BM算法的基础上, 改进了跳跃步长, 使得每次匹配获得最大的步长, 二是应用AC算法有限状态机模式匹配自动机构造模式树, 匹配过程中移动模式树, 减少了规则匹配次数。最后通过仿真实验对比得知:NAC_BM算法效率优于BM和AC_BM算法。

参考文献

[1]A Pattern Matching Model for Misuse Intrusion Detection[A].Sandeep Kumar, Eugene Spafford.In Proceedings of the 17thNational Computer Security Conference[C], 1995, 11-21.

[2]杨武, 方滨兴, 云晓春等.入侵检测系统中高效模式匹配算法的研究.计算机工程, 2004, 30 (13) .92-94.

[3]李志清.基于模式匹配和协议分析的入侵检测系统研究.广东工业大学硕士学位论文, 2007.4.20-26.

模式匹配 篇8

在传统管理模式下, 企业的管理成本随着企业规模的扩大而持续上升, 而随着社会生产力发展和互联网技术应用, 外部交易成本降低, 成熟企业不断面临着创新创业企业的不断挑战。从企业内部来看, 员工激励的成本越来越高, 员工对工作便捷性、自主性和创造性的要求也越来越高, 优秀员工离开企业开展创业活动并不鲜见, 企业面临人员流失和业务受损的风险。要应对这一挑战, 企业就必须将员工这个重要的利益相关者群体, 从完成企业分配的目标任务的劳动力要素, 转变为企业创新的动力来源的主体地位, 积极主动地为员工提供企业内部创业的平台。这样, 一方面能够使员工潜力和创造性得到激发, 在实现其个人价值的同时, 提升企业绩效;另一方面能够推动企业内部创业的基础条件的提升, 增加创业成功的概率, 实现社会资源的最优配置与利用。基于上述背景, 研究企业内部创业商业模式, 以及与之相匹配的组织管理模式, 就成为重要而紧迫的课题。

二、案例:海尔集团的实践与反思

海尔集团一直是商业模式和组织管理研究的热点企业。早期的苏慧文、魏梅和滕文志从业务流程再造的角度对海尔市场链管理机制进行了研究[1,2];王凤彬等从模块化组织模式的构建与运作角度[3], 宋云从实践基础角度[4]分别对海尔“市场链”再造进行了管理方法论方面的探讨;王水莲、刘莎莎对海尔商业模式演进的动力、载体、内容及其耦合关系等开展了案例研究[5]。这些研究主要是基于海尔既定的商业模式和经营管理实践, 从不同的研究视角进行了解读和分析, 但是对海尔管理实践中的相关机制、体系、措施的有效性的反思, 以及由此对企业商业模式和组织管理具有普适性的归纳与总结, 并以此指导企业制度设计实践的深入研究尚且不足。

纵观整个海尔的发展历程, 海尔坚持以导入市场机制、激活个体潜力为目标, 积极持续的开展企业商业模式变革与组织管理创新, 力图打破企业的固有边界, 在企业平台上培育出与外部市场完全接轨的内部市场化机制, 让每个员工都能够成为内部创业的主体, 从而激发个体活力, 推动企业的发展。除了通过实施“OEC (日清) 管理法”奠定了良好的企业管理基础之外, 在商业模式创新方面, 海尔大致可以划分为3个阶段, 这3个阶段的商业模式既有一脉相承的市场化机制的相通之处, 又在各阶段的意图和措施上有明显的差异。

第一阶段:建立内部市场链。通过流程再造将每个价值环节、每个员工带入企业满足市场需求的流程当中, 开始了“人单合一”市场链模式的探索, 提出“人人都是经营者”的理念。内部市场链更多的是通过建立精细化的内部核算体系, 以企业内部定价 (如核算、定额等) 和模拟市场规则, 如“SST (索酬、索赔、跳闸) ”制度, 来提高内部用户意见权重的内部服务的可替代性, 把面向客户的流程分解细化到每个业务环节甚至岗位, 以每个环节或岗位的会计核算体系来推动企业对市场的反应速度。

第二阶段:互联网转型阶段。2012年海尔开始互联网转型, 并提出了“三化”战略, 即“企业平台化、用户个性化、员工创客化”。将传统的组织机构划分为一级经营体 (包括研发、生产、市场等职能, 实行经营核算) 、二级经营体 (又叫平台经营体, 包含财务、战略、企业文化、人力资源、供应链等职能) 和战略经营体 (高层管理者) 。借助互联网的工具, 让经营体在平台的支持下取得更高的效率和更好的市场反应。

尽管“三化”战略试图建立平台化商业模式, 但海尔的平台化却有很大的不同。典型的平台化商业模式是把每个具备单独要素能力和价值增值空间的业务活动及其组合设置为经营体, 而把为业务经营体搭配具有规模经济效应的互补资源能力组合作为平台。因此经营体应该是面向客户, 能够承担全流程的经营责任和经营职能, 通过跨职能的组织整合和协同机制来创造价值, 而无需再通过层层传递市场需求。然而海尔的平台商业模式实践有所不同, 它将研发、生产、市场都作为经营体, 这种方式仍然是以专业分工为基础, 以经营体之间采用内部模拟市场交易的协同方式传递需求。与真正承担完全、独立责任的经营体相比, 海尔的经营体仍然只是企业价值链的一个环节, 而不是面向客户的完整价值链, 驱动协同的并不是真正的市场机制, 而是两大管理工具——OEC的执行力和经营体会计核算的绩效驱动力, 而内部定价也并不是一种低成本的管理制度。海尔所宣称的“平台化”模式, 更多的是“专业化+流程化”的组织, 而非客户化、市场化的从需求到交付整合的经营组织, 这或许是源于海尔对“内部市场链”机制的管理路径依赖。

第三阶段:“人人创客, 引爆引领”阶段。这个阶段海尔提出了更加大胆的构想, 企业要从管控型组织变成投资平台, 每个人不再是执行者, 而是创业者;整个组织从原来的传统组织变成互联网组织。在企业内部模拟出一个完全市场化的环境, 并与外部市场无缝对接, 企业边界变得模糊, 成为一个社会化的经营组织, 因而更具环境的适应性和企业的竞争活力。

然而, 由于海尔的“专业化+流程化”的组织惯性, 事实上这种投资创业模式在海尔的实施程度并不高, 有几个典型的案例可供解读。第一个是“车小微”的案例, 这个经营体整合了海尔6000家服务商的送装服务, 吸引了社会车辆加盟, 管理超过9万多辆配送车, 除了海尔的配送, 也承接其他品牌的配送服务。这其实是一个标准的外包服务模式, 与主营业务的商业模式创新和绩效增长并无实质性贡献。另一个案例是全国各地负责销售海尔及控股子公司相关产品的工贸公司转型为小微主体, 这是典型的职能型的经营主体, 经营体的利润除了销售业绩, 更多的则来自于成本的内部定价。而第3个典型的案例是雷神游戏笔记本, 由海尔电脑部门的3个年轻人创立, 针对市场需求, 通过整合研发、制造、物流等资源, 推出了游戏笔记本, 2014年实现2.5亿元销售, 并获得海尔内部的风险投资。这个案例属于真正意义上的完全市场化的经营主体创业, 而这一类经营体在海尔业务中的比重目前并不高。

从上述的回顾中我们可以发现, 海尔的内部创业商业模式其实具有多种不同的形态:第一类是在企业专业化分工的基础上, 按照价值链条进行经营主体的切割, 并通过精细化的财务核算和管理的执行力来提高组织内部的活力, 比如工贸公司的小微转型;第二类是通过内部职能发展壮大之后, 成为独立的外包业务, 比如“车小微”;第三类则是建立面向客户的具有完全经营责任与资源能力的经营体, 真正实现从需求到交付“端到端”的决策, 比如雷神游戏笔记本。这些不同的商业模式特征决定了该业务价值创造空间的大小、价值创造的来源, 以及价值创造的效率。

从企业绩效表现上来看, 在经营成果方面和同期同行业的格力电器 (000651) 做一个对比。考虑到海尔集团整体业务信息数据不详, 因此选择上市公司青岛海尔 (600690) 的相对数据同比来进行比较 (见表1) 。结果发现, 在营业收入增长率和扣非后的净利润增长率两项成长性指标方面, 青岛海尔并没有明显的优势。

从行业同比指标来看, 青岛海尔也没有更好的业绩表现和估值表现 (见表2) 。

更让人颇感意外的是, 2016年5月, 青岛海尔发布公告, 对核心员工实行股权激励, 这意味着核心员工获取的是整个公司价值剩余的间接性激励, 而不是通过经营体参与市场交易获得直接性的经营体利润激励, 这与此前海尔倡导和贯彻的市场机制和内部创业的商业模式显然出现了偏离。

海尔的案例值得深思, 如何划分不同类型的内部创业商业模式?不同商业模式的效果如何?其中的决定性的影响因素是什么?从组织管理模式的角度来说, 针对不同的商业模式应该匹配怎样的管理机制, 才能真正激发出企业和员工双方的潜力?这些都是极具实践指导意义和现实迫切性的命题。

三、企业内部创业的商业模式

商业模式是利益相关者的交易结构[7], 并且企业可以主动地构建更有利于自身发展的交易结构[8]。从海尔的案例可以看出, 企业内部创业的商业模式并不一定是唯一的, 在商业模式演进的过程中, 可以选择根据不同的业务活动特征而多种商业模式并存的状态。另一方面, 不同的内部创业商业模式的选择, 对绩效产生作用的方向和力度是不同的。同时, 商业模式也是一个业务活动的有机的系统[9], 内部创业商业模式的研究, 就是根据业务特征, 识别商业模式创新的内生的机会与障碍因素[10], 设计和选择创业团队适合的业务配置方式与制度体系, 与企业战略创新形式形成最佳的适配[11]。

企业内部创业的商业模式选择, 可以根据“业务标准化程度”和“经济责任独立性”两个指标划分为4种类型:业务链式、平台式、聚合式、分散式。如图1所示。

1.业务标准化程度

业务标准化程度指标主要影响企业对业务的可控程度。一般来说, 标准化程度越高, 创业团队在业务中的投入产出关系越接近透明, 容易衡量和判断, 由企业方面来主导确定的交易结构性要素就越多。标准化程度越低, 意味着创业团队拥有影响最终绩效的私人信息越多, 企业的最佳选择则是不参与过多的微观管理, 而由创业团队承担更大的经营责任和享有相对更大的经营溢价收益权, 业务的交易结构更倾向于市场主导的方式。

业务标准化程度可以用以下几个指标来衡量:

(1) 业务过程可控度

业务过程是否可控是指企业对于创业团队在工作过程中的标准、流程、投入与产出的判断与衡量的能力和成本。可控程度一方面与工作本身的属性有关, 例如生产类岗位的过程可控程度较高, 而非结构化的技术创新的可控程度则较低;另一方面也与实现可控的管理成本有关, 例如物流企业要对加盟的个体车主的车辆管理使用过程进行控制, 所需要的管理成本会很高, 因此也属于过程不可控。

(2) 员工能力可控度

员工能力是否可控是指企业对于承担创业价值活动的员工的能力是否可以通过批量化培训来复制。员工的工作能力越容易复制, 替代性越强, 创业团队的价值博弈空间就会越小;另一方面, 不同发展阶段的企业, 员工能力的可控度是不一样的, 比如当企业规模很小的时候, 一个强势的销售人员是难以替代的, 而当企业品牌影响很大的时候, 销售人员个体能力重要程度就会降低, 这将会影响同一问题在不同情境下的决策。

(3) 信息对称度与知识管理

信息对称度是指企业对业务相关信息的掌握程度与创业团队的一致性, 包括环境信息、工作本身的信息、员工投入产出关系等信息。工作信息对称度越高, 规则就越清晰透明, 经营结果也就越容易确定和衡量。反之, 信息越不对称, 经营结果越不确定, 难以衡量[12]。

(4) 贡献可衡量度

贡献可衡量度是指业务的结构性化程度是否便于企业衡量创业团队的价值贡献。企业根据价值贡献度, 来区分不同的价值归因, 从而决定价值分配额度与分配方式等具体要素。

2.经济责任独立性

经济责任独立性指标主要描述创业团队的价值衡量问题。经济责任独立性越高的业务, 创业团队能够创造的价值可能性空间越大, 同时在价值分配中的权重也就会越大, 反之亦然。因此企业创业商业模式设计, 就是要将企业与员工之间的权责结构确定在合适的状态, 一方面使其能充分发挥员工潜能, 承担更大的责任;另一方面从组织机制的角度, 选择恰当水平的激励机制。

经济责任的独立性可以用以下几个指标来说明:

(1) 客户属性

客户属性主要是区分创业团队面对的是内部客户还是外部客户。如果直接面对外部客户, 其所创造的收益就是企业的收益, 那么它所分担的就是企业最终经济责任。如果创业团队的客户是企业内部客户, 比如生产环节的下道工序, 或企业价值链的下一环节而非外部客户, 那么它仅能对自己所承担这个环节的投入产出的价值负责。

(2) 定价方式

企业内部创业有两种定价方式, 一种是创业团队所完成的工作成果能够通过市场来定价并完成交易;另一种则是企业内部定价, 如定额、内部交易定价等, 显然前者的经济责任独立性更高。

(3) 责任与风险承担

责任与风险承担是指企业和创业团队所承担的经营结果及其风险后果的比例。在不同的业务类型中, 创业团队承担的责任和风险程度差异较大, 创业团队的收益空间应与其责任和风险配置程度相对应。

(4) 价值来源

创业团队价值创造来源也是区分经济责任独立性的重要的要素。价值创造来源于企业内部挖潜, 如降低成本、简化管理、提高效率的, 其经济责任独立性往往较低;而来源于促进企业外部开拓的, 如技术创新、市场开拓、资源拓展等等, 经济责任独立性则比较高。

通过对业务标准化程度和经济责任独立性两大指标的解析, 企业可以判别内部创业团队所从事的业务的状况, 并据此选择合适的内部创业的商业模式。

四、组织管理模式的选择

企业内部创业的商业模式不同, 与其相匹配的组织管理模式也有很大的差异[13]。根据商业模式的特征, 对应的组织管理模式的匹配对应关系如图2所示。

业务链模式, 应该采用利润或模拟利润核算与内部交易的管理模式, 将纵向的管理指令转化成横向的损益核算的链条。平台模式, 应该采用合伙制的方式, 将团队按照平台资源和经营体结合的方式组织起来, 使团队发挥最大的能力与经验。聚合模式, 应该采用市场交易的组织管理模式, 而让这种交易稳定运行的核心, 是企业的控制力和吸引力。分散模式, 则应采用股权的方式, 使企业获得源源不断的新业务拓展的动力[14,15]。下面逐一进行具体说明。

1.业务链式

当创业团队所从事业务的标准化程度相对较高, 而所承担的经济责任的独立性相对较低时适用业务链商业模式。这种模式是将企业当前业务按照价值链、业务流程或价值活动分解成不同的价值创造环节, 明确每个环节的经营体的主体责任, 用内部定价方式, 建立核算关系链条, 用每个经营体管理会计的损益表代替传统的KPI考核表, 根据创业团队的经营业绩来进行激励。这种模式大多用于业务比较成熟、各项价值活动的收支定额比较明确、劳动相对简单并且具有效率优化空间的业务活动。它将原来通过外部监督管理和考核的多级委托-代理关系, 转变成依靠经营核算驱动的创业团队的自我管理行为。

(1) 商业模式价值

与传统组织管理模式相比, 这种模式带来的价值增值主要来自于两方面:一是通过创业团队的自我管理, 以及业务上下游核算与结算的钩稽制衡关系, 使得以信息传递、目标分解、监督管理和考核评估为主要职能的中层管理工作负荷大大减少, 将纵向指令管理转化为横向业务交易, 大幅降低管理成本;二是可以将创业团队涉及的完全的经营责任, 如质量、库存、成本等, 都通过损益核算落实到创业团队, 避免因为目标分解和指标权重考核不到位带来的责任流失。

(2) 组织管理模式匹配

业务链式的商业模式对应的是核算制的组织管理模式。采用这种模式可以将经营责任分解到最小经营单位, 直至分解到个人。由于业务相对成熟和标准化, 核算关系明确, 创业团队的绩效可以做到当期即时反馈。对创业团队的成员来说, 在合理的核算关系的引导下, 成员更加关注工作成果所创造的价值, 而不仅仅是劳动的投入成本, 这样能够有效地激发创业团队主动创新的积极性, 大幅减少监督成本和沟通成本。由于企业对工作任务的信息掌握程度非常充分, 因此企业支付的激励成本主要来自于团队所创造的增量价值。

(3) 适用范围

业务链式的内部创业商业模式在实践中, 大多应用在生产制造类的岗位, 如海尔的“内部市场链”和“人单合一”的商业模式。“人单合一”是将来自客户的定单, 按照既定的价值链进行分解, 各环节以自己在最终交付定单上所完成的贡献来计算创业团队的价值。在运营过程中, 工序或员工是创业团队的主体, 企业对于该环节确定的生产定额是经营团队的模拟收入, 企业对生产经营过程的信息完全掌握, 信息充分对称。这种方式一方面可以提高基层创业团队和员工的积极性, 提高劳动效率, 减少不必要的浪费, 另一方面通过创业团队的自我管理和上下游衔接, 使得中层管理的需求骤减, 因此海尔大量中层管理人员转岗或对岗位再定位, 实际上是把原来主要从事沟通和管理活动的中层, 转变成了从事经营活动的创业团队领导者群体。

这种模式的局限性在于, 如果创业团队所在的业务环节的价值增值空间不大, 那么对创业团队的激励水平就会受到限制, 并会对企业主导的内部定价提出质疑和挑战。同时, 这种模式需要充分发挥员工的主动性, 因此在实行的过程中应特别注意员工参与感、授权等非经济因素的激励措施, 否则员工会很快感受到创业团队发展的瓶颈。

2.平台式

当创业团队所从事业务的标准化程度相对较高, 同时所承担的经济责任的独立性也相对较高时, 应采用平台商业模式。平台商业模式将企业的价值活动分为两类, 一类是具有规模经济性和共享特征的活动, 这类活动由企业运营平台来完成, 包括企业品牌、行政支持系统、信息支持系统等资源性或支持性的活动;另一类适合发挥个体创造力和经验能力的活动, 由创业团队完成, 这类活动具备可划分、可衡量的经营责任, 在企业的共享平台上发挥创业团队的主动性, 并直接面对外部市场和客户获得收入, 创业团队的激励水平由其经营绩效决定。

平台式商业模式适用于人力成本较高, 且对人员素质要求也较高的业务。该类业务知识含量高、客户定制化要求高, 尽管这类业务有行业公共知识和工作惯例作为参照, 但不能完全标准化。咨询公司、律师事务所、设计公司等大多采用这种模式, 对于制造型企业而言, 研发、营销、产品事业部等具有较高的综合素质需求的工作团队都可以选择采用平台模式。

(1) 商业模式价值

与传统组织管理模式相比, 平台模式带来的价值创造主要是源于个体能力与创造力发挥带来的价值增量。在传统科层制组织管理模式下, 员工个体的能力和努力程度难以准确衡量, 而在平台模式下, 创业团队在公司平台支持下, 直接面向客户和市场获得业绩, 员工自我激励的动力较强, 更有利于其发挥出自身潜力。

(2) 组织管理模式匹配

平台式商业模式适应和匹配的组织管理模式是合伙制, 即对创业团队在工作边界和经营责任相对清晰的情况下, 通过合伙制让员工参与增量价值的的创造与分享, 从而激发员工工作的积极性、自发性和自我管理水平, 带来绩效增值。同时由于创业团队的经营责任完整而独立, 因此企业微观管理的参与度非常低, 甚至在一些情况下, 企业只需要设置创业团队的设立门槛而无须管理其目标与绩效, 由市场经营的成果来决定创业团队的优胜劣汰, 因此管理成本大幅降低。

(3) 适用范围

平台模式的变革被很多企业应用, 比如前文所述海尔在创客团队中表现比较突出的雷神游戏笔记本, 就是在企业构建的从设计、供应链到销售渠道在内的经营平台的基础上, 以产品管理团队的形式构建的经营体。这种经营体采用合伙制管理是最为有效的制度设计, 当团队取得高于平均水平的收益时, 以增量收益分成来奖励经营团队。这样既增加了经营团队提高收益水平动力, 也通过平台支持发挥了企业存量资源和资产最大化的效用。

当然如果企业的平台资源给予经营团队的支持不足, 或者支持的替代性较高, 那么创业团队对企业的依赖度和归属感就会变低, 对公司总体目标的关注度和责任感也比较低。因此平台模式需要企业在资源支持方面对创业团队具有足够的吸引力, 使得创业团队在平台支持下的收益高于单独运营的收益。

3.聚合式

当创业团队所从事业务的标准化程度相对较低, 同时所承担的经济责任的独立性也比较低时, 适合采用聚合模式。聚合模式是企业将价值链的某个环节以外包的方式交给创业团队, 并将其工作成果回购的方式。企业之所以采用这种模式, 是因为这个价值环节的责任更适宜于小规模的创业团队乃至员工个体去实现, 同时风险也更适合创业团队或个人控制, 创业团队通过企业支付的收入与提供资源的成本之间的差额来作为利润空间。而企业则要通过资源优势、规模效应、定价策略等, 对创业团队保持控制力和吸引力, 保证商业模式的稳定性和有效性。

企业的控制力主要来源于长期的承诺、解除合作的威胁、固定资产等资源锁定等。由于创业团队的独立经营程度低, 需要长期稳定订单的保障, 因此长期持续的合作就成为稳定企业与创业团队间合作关系的重要支持。而企业的吸引力则主要来源于企业能否依靠自身的规模和实力, 为经营体提供资源支持、风险担保, 以及合适的定价水平、收益规则等。

(1) 商业模式价值

聚合模式的价值来源主要是将传统管理模式下, 管理监督成本很高的活动转变成独立的经营体, 通过创业团队自组织与自我管理, 降低监督管理成本, 激发个体的努力程度, 改善业务绩效。

(2) 组织管理模式

聚合模式对应的组织管理模式是外包制, 将难以标准化的、没有规模经济的, 但是又具有较大业务量的价值活动通过外包的方式完成, 降低管理成本, 重新配置责任和风险, 将该环节企业所面临的较大不确定性的环节转由灵活分散决策的创业团队或个体来承担, 而企业在整个价值链条上, 通过外包的制度安排保证风险收益的合理配置。

(3) 适用范围

外包制的组织管理模式比较多的应用在农业生产环节、售后服务环节、物流车辆管理环节等。这些环节的共同特征都是劳动密集型、管理成本高、决策分散而灵活, 同时又是整个产业链中业务规模庞大, 对收益影响较大的环节。比如海尔的“车小微”, 在物流车辆的管理上, 就可以采用外包制的组织形式, 除了加盟的外部车辆, 即便是海尔自己购置车辆, 也应该采取员工反购或租赁的方式获得车辆的长期使用权而变成车主, 车主根据事前协定好的服务结算价格、服务条款、服务标准等, 按照企业要求完成指定的配送服务工作。对企业而言大大降低管理成本, 对车主而言, 降低成本、提高效率的驱动力增强。

在一些特别的情况下, 聚合商业模式也会存在局限性, 导致制度失效。比如创业团队的价值增值的空间是既定的, 而承担的责任和风险则是不确定的, 在收益有限而责任风险不确定的错配情况下, 容易出现违约风险。比如“公司+农户”的方式, 就是一种聚合模式, 但如果农户生产承担的不确定风险很高, 当收获季节农产品市场价格较高时, 农民就违反约定卖给市场;反之市场价低于约定收购价, 农民就要求执行协议卖给企业。

4.分散式

当创业团队所从事业务的标准化程度相对较低, 而所承担的经济责任的独立性相对比较高时, 适用分散的商业模式。分散模式主要是在企业目前主营业务价值链之外的环节开展弱相关或无关的多元化创业, 企业作为创业投资的孵化平台, 为创业团队提供资源支持和股权投资, 创业团队开展独立创业, 与原有业务形成协同、互补或无关完全的新业务。

(1) 商业模式价值

分散模式的商业模式主要针对不确定性较高的新业务, 即业务所需人才能力标准较高, 创业团队的能力对于业务的成功至关重要的业务。这种商业模式的价值来源主要是通过对创业团队的股权式激励, 激发创业团队长期的积极性和努力程度。作为独立经营的团队, 其创造企业价值的长期动机和行为导向特征更加明显。

(2) 组织管理模式

采用股权式的激励方式易于操作, 除了公司治理层面的管理外, 企业在对创业团队实施细节的业务管理监督方面具有较大的选择空间, 创业团队有较强的内在激励动力, 管理成本低。

(3) 适用范围

通过股权投资的方式的内部创业的案例较多, 从海尔的经验来看, 海尔要将企业从组织管控平台转化为投资管理平台, 就是要越来越倾向于采用股权投资的方式来激发员工的创造力, 在海尔小微平台孵化的企业, 具有一定的市场潜力和成长能力之后, 便可以获得股权投资, 以进一步发展壮大。当然股权投资的管理模式也有自身的局限性, 一方面, 在企业内部创业采用股权投资方式, 如果与当前业务的关联度较高, 则容易引发主营业务的员工群体的波动;另一方面, 创业的业务风险不确定, 失败概率较大, 企业的投资规模容易承诺升级。掌控好投资风险, 充分利用企业资源能力提高创业团队成功概率, 是非常重要的。

五、结论与展望

通过对海尔内部创业案例的分析和归纳, 对企业内部创业商业模式以及与之相匹配的组织模式得到以下结论:

首先, 企业内部创业的商业模式, 是由创业活动的特征决定的, 不同的业务类型和业务特征, 就应设计对应的商业模式。不同的商业模式设计, 给企业和创业团队带来的价值空间、价值创造、价值分配的模式和效果都不相同, 对应匹配的组织管理模式也不相同。

其次, 企业进行商业模式的创新和优化, 并不一定要拘泥于一种固定的模式, 而是在不同的时期采取不同的商业模式, 同时在同一时期可以结合不同业务而数种商业模式并存。当然, 无论哪一种商业模式的选择, 都要以客户价值最大化和管理成本最小化作为核心原则, 才能实现商业模式制度安排的有效性。

第三, 不同的组织管理模式的价值、效果和适用范围不同, 在企业发展过程中, 可以改变组织管理模式的要素, 反过来对商业模式的变革进行优化调整。比如企业的内部定价机制、经营体的组织结构设计与经营责任界定等, 通过组织管理模式的变革, 促进商业模式进行优化, 从而获得更大的企业增值。

基于散列函数的模式匹配算法 篇9

模式匹配是数据结构中字符串的一种基本运算, 给定一个子串, 要求在某个字符串中找出与该子串相同的所有子串, 这就是模式匹配。

假设P是给定的子串, T是待查找的字符串, 要求从T中找出与P相同的所有子串, 这个问题成为模式匹配问题。P称为模式, T称为目标。如果T中存在一个或多个模式为P的子串, 就给出该子串在T中的位置, 称为匹配成功;否则匹配失败。

模式匹配算法是文本处理领域中比较重要的算法, 一个简单、高效率的模式匹配算法对提高和模式匹配有关的软件的效率有很大帮助, 本文介绍一种基于散列函数的模式匹配算法, 该算法简单, 易于理解且具有较高的效率。

1 原理

令模式记为x=x[0..m-1], 长度为m, 文本串记为y=y[0..n-1], 长度为n。令算列函数:hash (x[0..m-1]=x[0]*2m-1+x[1]*2m-2+…+x[m-1]) mod q (式中q为系统最大整型值)

该散列函数具有以下特点:

1.1 易于计算

1.2 易于从hash (y[i, i+m-1]) 计算hash (y[i+1, i+m])

为提高运算速度, 乘以2的操作可通过左移1位实现, 对于给定的模式x, 2m-1是一个常数。在一个模式匹配的过程中, 若模式x在文本y中出现的位置为i, 则必定hash (x) =hash (y[i, i+m-1]) , 但要注意, hash (x) =hash (y[i, i+m-1]) 时, x[0..m]和y[i, i+m-1]未必完全匹配。因此, 模式匹配的过程就是hash (x) =hash (y[i, i+m-1]) (其中i=0, 1, …, n-m) 逐个比较的过程, 若hash (x) 和hash (y[i, i+m-1]) , 则将x[0..m]和y[i, i+m-1]逐字符比较, 若完全相等, 则模式匹配的位置为i, 否则不匹配, 继续比较hash (x) 和hash (y[i+1, i+m]) , 直到匹配或比较结束为止。

2 算法

下面给出用C语言函数描述的具体算法

3 结语

在预期情况下该算法的时间复杂度为O (n+m) , 在最坏情况下, 该算法的时间复杂度为O (n*m) 。尽管该算法在效率上不是最好, 但算法简单, 易于理解, 在对时间复杂度要求不是很苛刻的环境下, 还是一个简单高效的模式匹配算法。

参考文献

[1]罗大光, 郝玉洁, 刘乃琦.一种非常快速的字符串匹配算法[J].电子科技大学学报, 2005, 34 (06) :802-805.

[2]严大治.字符串匹配算法比较与分析[J].计算机光盘软件与应用, 2013 (02) :138-140.

面向入侵检测的模式匹配算法改进 篇10

随着互联网技术的快速发展, 在基于网络的入侵检测系统 (NIDS) 的实现中, 入侵检测引擎的设计是入侵检测系统设计的关键部分。随着网络流量和速度的不断增加, 快速性成为衡量检测引擎性能的重要指标。因而模式匹配的效率就成为提高入侵检测系统入侵检测效率的一个瓶颈。如何提高入侵检测算法的模式匹配效率也就成为当前学术界研究的热门课题。目前, NIDS大多采用的是单模式匹配算法, 本文着重对其中一种应用最多的BM算法进行了改进, 以更好地适应入侵检测系统对模式匹配算法高效性的要求。

1、BM算法的实现

BM算法是一种精确字符串匹配算法 (区别于模糊匹配) , 采用从右向左比较的方法, 同时应用到了两种启发式规则, 即坏字符规则和好后缀规则, 来决定向右移动的距离。

1950年, R.N.Horspool提出了改进与简化的BM算法, 称之为BMH算法。BMH算法在移动模式时仅考虑了“坏字符”策略。它首先比较文本指针所指字符和模式串的最后一个字符, 如果相等再比较其余m-1个字符。无论文本中哪个字符造成了匹配失败, 都将由文本中和模式串最后一个位置对应的字符来启发模式向右的移动。

理论上, BMH算法在最坏情况下复杂度为O (mn) , 在一般情况下, BMH算法比BM算法具有更好的性能, 它只使用了一个数组, 简化了初始化过程, 该算法在最好情况下的时间复杂度为O (m/n) 。

2、改进的BM算法

根据对BM算法及BMH算法的研究, 结合BM和BMH算法各自的特点, 提出一种改进算法E-BM算法。该算法事先引入一个数组F以标记模式串中每个字符出现的次数, 然后按模式串中字符出现频率大小顺序进行匹配, 增加失配几率及模式串在失配时向后跳跃的幅度, 从而有效减少匹配时间和匹配次数。

2.1 E-BM算法

该算法主要是针对匹配失败后文本串指针跳跃距离进行改进, 下面就移动距离计算方法进行描述:

从T[m]和p[m]开始自右向左进行比较, 根据比较结果执行 (2) 或 (3) 。

如果匹配成功, 就按照模式串字符频率的优先级别来继续比较其它相对应的字符, 同时检查其是否为模式串中出现频率为1的字符, 即使Q[i]=1的字符, 如果是, 就用一个变量flag记录下这次匹配过程中第一个Q[i]=1的指针位置i, 直到发生了不匹配。当匹配在某处失败之后, 就将文本串的指针修改为 (flag+m) , 再重新开始进行新一轮匹配, 如果匹配失败前Q[i]=1的值均不为1, 则表示匹配失败处之后的字符在模式串P中出现了多次, 则执行 (3) 。

如果匹配失败, 将文本串中和模式串最后一个位置对应的字符以及该字符的下一个字符作为一个整体字符M, 看其在模式P中是否出现。如果出现, 那么按照预先计算出来的偏移量移动文本串指针, 使得P中最右端的字符M与T中字符M对齐;如果不出现, 那么看该组合中第二个字符是否在模式P中, 如果在, 文本串指针移动量为m, 如果不在, 文本串指针移动量将为m+1。

2.2 E-BM算法时间复杂度分析

BM、BMH、E-BM算法的最大移动量分别是m, m, m+1位, 相差不大, 但最大移动量出现次数和字符比较次数相差较多。可见, 影响匹配算法效率最主要的因素不是最大移动量, 而是产生最大移动量的概率和字符比较次数。BM算法和BMH算法中产生最大位移量的条件为与模式串末位对齐的那个文本串字符在模式串中未出现;在E-BM算法中产生最大位移量的条件为与模式串末位对齐的那个文本串字符 (末字符) 的下一位字符在模式串中未出现, 匹配失败之前存在在模式串中只出现一次的字符, 末字符与下一字符的组合在模式串中未出现三种情况。所以, E-BM算法产生最大移动量的概率比BM、BMH算法大, 字符比较次数少。

由于入侵检测系统进行入侵检测的时候模式串即为入侵检测系统规则库中固定的规则, 所以只要在匹配前一次性将各个规则的字符出现频率计算好存入数组就行了, 不需要在每次匹配时都进行计算, 所以字符出现频率计算所花费的时间可以不计, 这样, BMH、E-BM算法在最好情况下的时间复杂度分别为O (n/m) 、O (n/m+1) , 相差不大, 但综合E-BM算法的最大移动量, 产生最大移动量的概率, 字符比较次数几个方面因素来看, E-BM算法比BM、BMH算法的匹配速率要高。

3、算法测试及结果

评价模式匹配算法优劣的主要指标是匹配结束时文本串指针的移动次数和算法的运行时间。现针对BM及E-BM算法的以上两个指标进行实验测试。实验环境为:Microsoft WINDOWS XP Professional SP3操作系统, 系统配置为Intel CPU2.00GHz, 内存为2G。每个算法分别执行50次, 运行时间取平均值。实验中所用数据为随机选取的一段纯英文自然语言文本, 长度为32.7万个字符, 大小为293.7 KB, 任意截取长度为14个字符的模式串。

测试结果:测试算法的字符比较次数结果如图1所示。测试算法的运行时间结果如图2所示。

4、算法评价

通过实验结果得出E-BM算法比BM算法、BMH算法的性能都有显著的提高。在字符比较次数上, E-BM算法比BM算法减少16.67%, 比BMH算法减少15%;在时间性能上, E-BM算法比BM算法提升14.29%, 比BMH算法提升425%。

综上分析, E-BM算法在不增加空间复杂度的情况下, 能够大幅度减少字符匹配次数和模式串移动次数, 提高匹配速度, 对字符串匹配计算有明显的加速效果, 有着比BM算法BMH算法更高的性能。因此, 有着很大的实用价值。

结束语

字符串匹配技术是入侵检测系统IDS中关键技术之一, BM算法被认为是速度最快的字符匹配算法, 然而在网络技术迅速发展的今天, 基于BM模式匹配算法的IDS存在着严重的性能瓶颈, 不能适应大流量网络环境的要求, 丢包率和漏报率也在不断上升, 本文对在对BM算法进行详细研究的基础上对其进行了改进, 并用实验证明了改进后的算法效率比原算法的效率要高。为今后入侵检测系统开发人员提高入侵检测效率提供了有价值的参考。

摘要:模式匹配算法是入侵检测系统中使用较多的一种算法。在检测过程中, 模式匹配算法的效率决定了入侵检测系统的性能。针对入侵检测系统中模式匹配算法效率不高的缺点, 在对入侵检测系统的BM模式匹配算法进行深入分析的基础上, 提出了一种针对BM模式匹配算法的改进算法E-BM算法, 通过实验测试结果表明该算法能够有效提高入侵检测效率。

关键词:模式匹配,入侵检测效率,E-BM算法

参考文献

[1]Yang Wang, Hidetsune Kobayashi.High PerformancePattern Matching Algorithm for Network Security[J].IJC-SNS International Journal of Computer Science and Net-work Security, 2006, 6 (10) :83-85.

[2]兰景英, 王永恒.入侵检测系统研究及BM算法改进[J].计算机工程与设计, 2008, 29 (9) :2199-2202.

[3]周延森, 汪永好.网络入侵检测系统模式匹配算法研究[J].计算机工程与设计, 2008, 29 (7) :1652-1654.

[4]刘胜飞, 张云泉.一种改进的BMH模式匹配算法[J].计算机科学, 2008, 135 (111) :164-165.

[5]康振勇, 田玉敏.BM算法的研究与改进[J].西安电子科技大学2005年研究生学术年会.西安, 2005年10月24日至2005年11月17日.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【模式匹配】相关文章:

多模式匹配06-18

字符串模式匹配06-05

对字符串模式匹配KMP算法的教学方法设计09-11

匹配战略05-05

匹配研究05-07

匹配理论05-11

性能匹配06-13

需求匹配06-24

组织匹配07-12

风险匹配07-16

上一篇:机电类工程能力培养下一篇:催化净化器