权重计算

2024-08-04

权重计算（精选九篇）

权重计算篇1

我国CPI计算中涉及权重的问题,国家统计局一般每年都会定时发布新的CPI数据,但是并没有公布权重是如何计算得到的。在2011年2月国家统计局主动公布了权重调整的详细情况以及权重调整对CPI数据的具体影响,在发达国家一般CPI权重调整工作两年进行一次,我国也会逐步将五年一调整的周期逐渐缩短。然而,人们在关注国家公布的CPI具体数据的同时,更关注其计算的过程,因为CPI的各项权重并不会以人的意志为转移,是在往年各项指数加权综合汇总的基础上计算而得的。

权重对CPI有着重要影响,特别是权重的确定方法一直是学者们关注的焦点,不少学者已经提出了颇有代表性的CPI权重计算方法。受以往工作成果的启发,本文基于对近年统计年鉴数据的搜集,主要使用了层次分析法———方程法中的矩阵转换,探讨具有客观性的CPI权重计算新方法。

2CPI权重计算方法思路

2.1数据的处理

目前统计年鉴公布了城镇居民和农村居民的人均消费支出,包括食品、衣着、居住、家庭设备及用品、交通通信、文教娱乐、医疗保健和其他共八大类。资料的分类与CPI分类比较相近,仅仅是最后一项中,CPI分类为烟酒及用品, 因此我们不妨将其他支出假设为CPI中的烟酒及用品类。

利用公布的各年全国城镇、农村居民人口平均数对公布的城镇居民和农村居民的人均消费分类支出进行加权处理, 得到各年全国人均消费分类支出,即表1中的rij。

利用各年全国人均消费分类支出及各年人口平均数进行加权计算,得到历年全国人口各大类支出平均数,即表1中的

年份k( k = 1,…,m) ,分类Aj( j = 1,…,8)

注: 表中数据均按可比价格计算。

2.2矩阵转化

将表1中的各分类均值转化为矩阵,即:

矩阵转化中关键的一步,是需要将

转化为aij。

矩阵中关于对角线对称的数字aij和aji必须满足两个条件,形成一个方程组:

通过求解上述方程组,根据实际情况,取正数解,即可得到aij和aji的值。

其中 ωij( i < j ) 是相比较的结果。即表1中对角线上方的每个指标系数均值分别按顺序与其后序各指标系数均值的比较。

2.3CPI权重的计算

2.3.1计算判断矩阵中各行元素之积

2.3.2计算Mi的7(即j-1)次方根

由于在判断矩阵A中对角线元素均为1,而1在计算乘法的过程中对计算结果没有影响,因此每一行实际有效的比较结果应是j - 1个即7个,故在求方根的计算过程中应该取j -1次方根。

2.3.3对Wi/进行正则化处理

正则化处理之后,可以保证各因素之和为1。

3CPI权重计算法实际应用

3.1实际数据处理

城镇居民和农村居民的人均消费分类支出,按上述方法进行处理得到表2。具体计算中选取三年实际数据,是基于实际数据对CPI权重影响的程度考虑,年数太多影响程度会被更平均化,影响CPI权重的实际有效性。

单位: 元

注: 实际资料中的其他类假设为烟酒及用品类。

3.2矩阵转化

按上述1中的计算方法可得到矩阵,见表3。

3.3CPI权重的计算

根据上述方法计算CPI权重得到表4。

表4中CPI权重计算结果虽然与统计局公布的权重存在一定的差异,但与实际消费构成是对应的,存在一定的可信度,因为实际CPI计算与居民各大类实际支出额存在密切关联。

4CPI权重计算新方法总结

4.1方法的优缺点

4.1.1优点

( 1) 具有可信度。本文方法是基于统计局公布数据计算的,具有较强的客观性。数据来源于客观实际,是实际的具有反映。利用实际数据计算,可信度高。

( 2) 不存在主观判断。一般权重确定方法在较大程度上建立在主观判断的基础上,存在明显的主观性,在一定程度上影响权重的有效性。本方法没有主观判断因素,不存在主观判断偏差的问题。

4.1.2缺点

( 1) 对客观数据依赖程度高。方法的计算完全依赖公布的数据,如果数据存在偏差将直接影响权重计算的效果。

( 2) 存在假设。由于统计年鉴公布数据与CPI分类存在不完全一致性,计算中假设公布数据其他分类为CPI中的烟酒及用品类,在一定程度上会影响权重的计算效果。

4.2需要探讨的方面

4.2.1主观与客观结合性

本方法强调计算的客观性,没有考虑主观判断性,如何将主观判断与客观相结合是一个需要探讨的问题。公布数据是过去的实际情况,完全依赖客观数据,在一定程度上影响权重的实际有效性。

4.2.2选取年份数

计算权重涉及选取年份数的问题,需要有一个量的概念,也是需要探讨的问题。

摘要：CPI计算中权重是一个重要因素,关系到CPI能否真实有效地反映居民消费价格的综合变动。努力寻求一个有效的权重计算方法,对CPI客观有效性具有重要的现实意义。本文通过对近年统计年鉴数据的收集和处理,将年鉴数据转化为矩阵,然后利用判断转化矩阵求解出相应的CPI权重,在实际应用过程中验证了该方法的可行性。

权重计算篇2

网页权重的计算依赖于基本权重、链接权重、用户评价权重三个方面。

网页基本权重：主要受到关键词的绝对权重、关键词频率、网页长度(与网页大小区分开)的影响。

1、绝对权重：搜索引擎会对任何一个新的网页赋予一个缺省的权重值(有兴趣的朋友可以了解下TF*IDF算法)，WEB标准化是提升基本权重的重要因素，一些标签将影响关键词的权重值，最终的基本权重值是这些因素进行相加得到的;

2、关键词频率：这一因素大家应该都非常清楚了，关键词频率的理论数据为2%-8%。关键词在网页中的位置都会存在一个权重值，对每个位置上的权重进行求和计算，则可以得到关键词在整个页面的权重值。

3、网页长度：上面提到的计算方式都很公平，但如果考虑到相同的关键词出现在不同的网页中，网页的长度越长，那么，关键词可获得的权重值就会越高，所以，某一关键词的权重值在一定程度上还受网页长度的影响。

网页链接权重：主要是内部链接和外部链接。

对于内部链接来讲，为了公平，搜索引擎一般不会给较多的权重分值，特别是一些固定位置的链接，这些的确有利用搜索引擎了解整个网站结构，但权重分值一般没有活动链接(内容链接)高，对于新的网页来将，搜索引擎在链接上会优先给予一个补偿值，这样有助于它获得更多的链接与用户评价，

外部链接对网页的影响就像关键词密度一样被大家所关注，链接文字所在页面的权重值、链接位置、链接数量都会在一定程度上给促进网页链接权重增加。

用户评价权重：主要是搜索引擎对搜索结果中网页的用户评价计算。当用户搜索某一关键词的时候，总是先浏览搜索结果的网页标题与摘要部分，最后再决定点击自己觉得有用的网页，若某个链接虽然在返回结果表上出现的位置不太靠前，但被选取点击的次数比较多，于是搜索引擎应该感到该链接是比较受欢迎的，其位置应该往前调。

对与这样的评价方式，对于那个排名考前的网页有很大的优势，而且用户并非只关注搜索结果第一页，第二页及后面的，也有可能被关注，那么，在这里，搜索引擎会对这些链接引入一个补偿值。这里的补偿值是根据用户点击搜索结果每页的概率来计算补偿因子，最后用这个补偿因子与用户评价权重值乘积求和得到。

随着时间的变化，用户关注度可能会发生变化，比如近期的“大运会”，在未开始之前，用户对大会的项目时间安排、参赛运动员关注度会很高，随着时间的变化，到大运进行时，用户可能会更关注比赛的结果，获奖运动员的情况。所以，搜索引擎还会引入衰减因子来解决这个问题。

文本分类中词语权重计算的改进篇3

随着各种电子形式的文本文档如电子出版物、各种电子文档、电子邮件和万维网等文本数据库等以指数级的速度增长,有效的信息检索、内容管理以及信息过滤等应用也变得越来越重要。文本的自动分类是有效的解决办法之一,并且已经成为一项具实用价值的关键技术。而文本分类所要解决的首要问题就是文本的形式化表示[1]。

在现有的几种文本表示模型中,向量空间模型(VSM)由于具有较强的可计算性和可操作性,得到了广泛了应用并且取得了较好的效果。在该模型中,文档的内容被形式化为多

维空间中的一个点,通过向量(vector)的形式给出[2]。因此,向量空间模型文本表示的形式化方法是基于文本处理的各种应用得以实现的基础和前提。基于此,本文针对向量空间模型中经典的词语权重计算方法的不足之处提出了一种结合信息论中信息增益的改进算法,并通过验证了其可行性和有效性。

2 传统的TFIDF

传统的特征权重计算主要考虑特征项的频率信息TF以及反文档频率信息IDF[3]。

2.1 特征项频率(Term Frequency,TF)

TF是特征项频率,它是指特征项在文档中出现的次数。特征项可以是字、词、短语,也可以是经过语义概念词典进行语义归并或概念词语权重计算方法后的语义单元。不同类别的文档,在某些特征项的出现频率上有很大差异,因此频率信息是文本分类的重要参考之一。它的计算公式为:

TF(ti)=特征项ti在类c文本中出现的次数

2.2 反文档频率(Inverse Document Frequency,IDF)

IDF以出现特征词的文本数为参数来构建特征项的权重。其计算方法的出发点是一个特征词文档频数越高,那么其包含的类别信息就越低,也就表示该特征词就越不重要。IDF的计算公式为:

其中N为文档集的总文档数,ni为出现特征项ti的文档数。计算对数时,由于我们计算的权重值是相对的,所以底数可为任意实数,这里用2作为底数计算。

一个有效的分类特征项应该既能体现所属类别的内容,又能将该类别同其它类别区分开来。所以,在实际应用中通常将TF与IDF联合起来使用。公式如下:

由于各类别文本的长度很难一致,各类文本包含的字数、词数可能差别会很大,对词频造成直接影响,因此通常对词频作归一化处理。TFIDF的归一化计算公式如下:

其中wi为第i个特征项在文本中的权重,TF(ti)是特征项ti在文本dj中出现的频数,n表示特征向量的维数。

3 传统TFIDF权重计算方法分析

TF.IDF权重计算方法主要从词语的频率TF和词语的反文档频率IDF两个方面进行考虑。计算公式的提出是基于这一假设:对区别文档类别最有意义的词语是在一个文档集合中出现频率足够高,并且在其它文档集合中出现频率足够少的词语。所以,向量空间模型的基础是词语的出现频率和出现文档频率。

这种方法中IDF值的计算是将训练文本集看作一个整体来考虑的,并没有考虑到特征项在类间的分布信息。比如说:如果某一类ci中包含特征项t的文档数为m,而其他类包含t的文档总数为k,显然所有包含t的文档数n=m+k,当m大时,n也大,根据公式可以得到,IDF的值就越小,则根据TFIDF的计算方法,权重值也会受到影响。但实际上,m大的话,表示t在ci类的文档中频繁出现,就说明t能够很好地代表ci类的文本特征,应该赋予较高的权重。

可以通过一个很小的文档集来说明权重计算方法TFIDF的利弊问题,假设有三个类别c1,c2,c3,每个类别中都各有5篇文档,为了计算方便这里只考虑三个特征项t1,t2,t3。

从表1可以看出:t1只有类别c1中出现,所以其分类能力应是最强的;而t2在三个类别中均出现了,所以其分类能力应是最弱的。但是我们来看看他们的IDF的计算结果。如表2所示。

从表中我们可以看到,t1、t2、t3三个特征项的IDF值是相同的,那么其权重大小就完全取决于TF的值,也就是特征项在每个类别中出现的次数,而这显然是很不合理的。出现这种情况的原因,主要是因为计算IDF是基于训练集合中所有文档来考虑的,没有区分特征项在不同类别中的出现的文档数,当然也就无法表示出特征项和类别间的关联性。

为了弥补这一不足,在计算权重时,引入信息增益的概念。

4 信息增益(information gain,IG)的引入

4.1 信息熵和信息增益

1850年,德国物理学家鲁道夫·克劳修斯首次提出“熵”的概念,用来表示任何一种能量在空间中分布的均匀程度,能量分布得越均匀,熵就越大[4]。1948年,信息论之父C.E.Shannon提出了“信息熵”的概念,解决了对信息的量化度量问题,并且第一次用数学语言阐明了概率与信息冗余度的关系[5]。

信息熵,又称Shannon熵,在随机事件发生以前,它表示结果不确定性的量度;在随机事件发生以后,它表示我们从事件中所得到的信息的量度(信息量)[6]。

信息论量度信息,是把获得的信息看作用来消除不确定性的东西,信息量的大小用被消除的不确定性的多少来表示。假设随机事情X在获得信息y之前的不确定性为H(X),获得信息y之后为H(X/y),信息y中包含的关于事件X的信息量为:

假如信息概率空间为,那么其不确定度可以表示为:

条件熵是H(X/y)获得信息y后X的不确定程度。

信息增益是信息熵的差,表示为:IG(X,y)=H(X)-H(X/y)

H(X)表示在获得信息y之前系统的熵。对于文本分类而言,其表示的是一个随机文档落入某个类的概率空间的熵,即类别集合X所能提供的信息量的多少。H(X/y)表示获得y后,此文档落入某个类的概率空间的熵,即观察到y之后所能提供的信息量。这种不确定程度减少的量也就是信息增益,代表y对分类所起到的作用,即它所能提供的分类信息量。

4.2 用信息增益来调整权重

我们从信息论的角度出来,把信息增益考虑进了词语在各文档中的分布比例对权重的影响中。将训练文档集看成一个符合某种概率分布的信息源,词语在文本分类中所能提供的信息量(也就是词语在分类中的重要程度)依靠训练文档集的类别信息熵和文档类别中该词语的条件熵之间信息量的增益来确定。并且将这种重要程度反映到了权重计算公式中,提出了如下TF.IDF.IG权重计算公式:

此处的IG计算公式如下:

其中,P(Ci)表示类别(Ci)出现的概率,P(t)是特征T出现的概率,用出现过T的档数除以总文档数,表示出现T时类别Ci出现的概率。

还是采用上文第2节的小例子,先计算各词语对于分类的信息增益情况。

IG的值越高,表示特征项对于分类所能提供的信息量就越多,从表3中可以看出,IG的计算结果与我们主观判断的结果是相同的。t1只在类c1中出现,所以其对于分类的结果应该是最重要的,t3次之,而t2由于是三个类别中均出现过,所以其对于分类的结果是最不重要的,它对于分类的信息增益值也是最小的。再来看看将IG考虑进权重计算公式后,词语的权重,并与传统的权重计算公式的结果相对比。

由表4中的权重计算结果可以看到,两种权重计算公式对于t1的分类能力都是给予肯定的。而对于t2,由于它在三个类别中均出现过,传统的TF.IDF的公式没有考虑到类别层次上,所以用传统公式计算时,它的权重是要大于t3的权重的。而在改进的公式中,明显可以看到t2对于三个类别都是没有分类能力的。

从上面的分析中,可以十分清晰地看到改进的TF.IDF.IG公式相对于传统公式的长处,以及其对于分类问题当中特征词权重计算的改善,结果表明这是可行的。

5 实验及结果分析

为了进一步验证改进公式的有效性,在实际的分类问题中再次对比两个公式的分类结果。本文选用搜狗实验室提供的中文文本分类语料库中的数据来进行本次实验。

现有的文本分类技术很多,比如贝叶斯分类、KNN的分类、支持向量机的分类以及决策树分类等。本文中选取改进的贝叶斯方法作为分类方法,此方法的详细内容在此就不赘述了。

从语料库中选取5个类别共计945篇的文本作为实验数据,其中财经类145篇,IT类201篇,体育类189篇,文化类234篇,旅游类321篇。另外,基于综合考虑文本分类的准确率与查全率,实验采用F1测试值作为评估参数,其计算公式如下:

实验中,分别采用传统的TF.IDF公式以及本文中改进的TF.IDF.IG公式对特征词进行加权,并根据此结果对测试文本进行分类,分类结果的F1测试值如表5所示。

从实验结果的对比可以看出,改进的TF.IDF.IG公式的分类结果相较于传统的公式,有明显提高。这足以证明该公式在文本分类中的可行性和有效性。

6 结束语

为了弥补TF.IDF公式在类别层次处理上的缺陷,本文在权重计算公式中引入了信息论中信息增益的概念,并通过实验验证了应用改进后公式的分类结果要明显优于应用传统公式的分类结果。在下一步的工作中,我们会将TF.IDF.IG公式更加完善,不光考虑到特征词在类别间的分布,更深一步考虑到其在类别内的分布情况。

摘要：文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型(Vector SpaceModel)中的TF.IDF文本表示是该领域中得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的类别分布比例量上的差异是决定词语表达文本内容的重要因素之一。但现在的TF.IDF方法无法把握这一因素,针对这一缺点,将信息增益公式引入文本集合中并提出TF.IDF.IG文本表示方法,并比较分析了其相较于传统TF.IDF公式的优点,用实验验证了其可行性和有效性。

关键词：文本表示,向量空间模型,词语权重,信息增益

参考文献

[1]徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181—183.

[2]鲁松,李晓黎,白硕.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6).

[3]Auen J.Natural language understanding[M].The Benjamin/Cummings Publishing Company,1991.

[4]周荫清.信息理论基础[M].北京:北京航空航天大学出版社,1993.

[5]宗成庆.统计自然语言处理[M].北京:清华大学出版社,2008:343-344.

权重计算篇4

1、看看服务器稳定与否

对于服务器这一块我想大家应该了解的应该蛮多了，很多时候我们都是把网站服务器搬上台面来讨论，对于网站服务器对网站排名的影响我想大家都知道，一旦网站服务器出问题，打不开，搜索引擎蜘蛛就无法抓取网站内容，对于这一现象，搜索引擎都是有详细记录的，长期如此往往就是降权的下场。

2、分析竞争对手

有时候网站排名下降并不是因为自己的网站出现了什么问题，而是竞争对手超过了我们，把我们的网站挤下去了，对于这种情况，我们大可以分析一下那些超越我们的网站，看看他们的优化方法，是通过那些方式来实现超越的，对于这些方法，如果说没有违背搜索引擎的意愿，我们都是可以据为己用的，为排名在此登上顶峰而努力。

3、以不变应万变

其实对于搜索引擎来说也并不是那么的准确，也会有出错的时候，在论坛上面我就看到很多搜索引擎在调整算法的时候把别人的正规网站k站，排名全掉，但是在下次调整的时候网站却又回来了，出现这种情况往往是由于百度的疏忽而导致的，如果说你的网站没有出现什么大的违规现象，而网站排名降得很厉害，对于这样的情况你大可不用担心，因为百度会给你一个合理说法的，

4、做好内容和外链建设

对于网站排名来说对其影响最大的莫过于网站内容和外链了，很多时候网站排名之所以下降就是因为网站内容和外链的原因，有可能之前我们做优化的时候对这个很上心，每天都是原创、高质量的外链，但是随着时间的推移慢慢的质量就下降了，从而导致排名下降，这时候站长们应该明白自己要做哪些事情了吧!

5、时时监控友情链接

友情链接相信大家都是有所了解的，往往很多时候都会因为友情链接的原因而导致降权，而且这种导致降权表现的也是最隐蔽的，很多时候都是降权之后站长们才后知后觉的明白是友情链接的问题，所以说，我们网站友情链接要时时监控，只有这样才能够防范于未然。

权重计算篇5

1 边际效益

目标性状的经济权重可以通过边际效益来实现。边际效益即在某一生产市场形势下。其他性状保持不变时, 某一性状发生一个单位的变化可引起的经济效益的改变。

2 成本收入分析

商品猪群的生产中存在市场成本价格体系、生产管理体系、遗传性能体系三个体系。其经济效益由商品猪成本、商品猪收入、母猪成本及母猪收入构成。商品猪的生长分为哺乳阶段、育成阶段和生长肥育阶段。其成本可剖分为以下几个方面: (1) 三阶段的饲料费用; (2) 三阶段的非饲料费用 (包括劳务、管理、畜舍、投资利息、水电、共同管理费用及其他一般性费用等) ; (3) 哺乳阶段的额外非饲料费用 (补铁、去势、去尾等项费用) 。

母猪成本由后备母猪的购买费用、基本的非饲料费用、基本的饲料费用 (维持和自身增重费用) 、分娩所需的额外费用 (劳务、管理、兽药、保湿及产房费用) 、配种费用、胚胎发育所需的饲料费用、哺乳期泌乳所需的饲料费用几个部分组成。商品猪的收入主要来自于屠宰后胴体价值。母猪的收入来自淘汰母猪胴体价值。

3 边际效益的计算

一般先计算在基本形势下商品猪生产的经济价值, 然后分别计算各性状发生一个单位改变后的经济效益, 得出各性状的边际效益。

公式为:经济效益=出栏猪收入+淘汰母猪收入-哺乳期仔猪成本-幼猪成本-生产育肥猪成本-母猪成本

3.1 哺乳期仔猪饲养成本

哺乳期仔猪成本=断奶仔猪总头数× (梅志断奶仔猪的非饲料费用+哺乳仔猪日采食量×哺乳仔猪的饲料价格×哺乳期天数)

断奶仔猪总头数=Σ (第i胎母猪头数×第i胎母猪产活仔数×哺乳仔猪成活率)

3.2 育成期猪饲养成本

幼猪成本=断奶仔猪总数× (1-0.5×幼猪阶段死亡率) ×幼猪每天的非饲料费用+幼猪日采食量×幼猪饲料价格) ×幼猪阶段天数

幼猪阶段天数= (幼猪重量-断奶仔猪重量) ×幼猪日增重

3.3 生长肥育期成本

生长肥育期成本=生长肥育期总数× (1-0.5×生长费与猪死亡率) × (生长费与猪每天的非饲料费用+生长费与猪饲料转换效率×生长肥育猪日增重×生长肥与猪饲料价格) ×生长肥育期天数

生长肥育猪总数=断奶仔猪总数× (1-幼猪阶段死亡率)

生长肥育期天数= (出栏猪体重-生长猪体重) /生长肥育猪日增重

3.4 出栏猪收入

出栏猪收入=出栏猪总头数×出栏猪体重×出栏猪屠宰率× (出栏猪标准胴体的价格+胴体价格调整系数)

出栏猪总头数=生长肥育猪总头数× (1-生长肥育猪死亡率)

胴体价格调整系数= (出栏猪胴体估计瘦肉率-60) ×胴体瘦肉率与标准相差1个百分点时的价格差+胴体肉质指数-70) ×胴体肉质指数与标准相差1个百分点时的胴体差价

3.5 母猪成本

母猪成本=有后备母猪购买费用+母猪基本的饲养费用+配种费用+分娩费用胎儿发育及分娩费用, 胎儿发育及仔猪哺乳所需饲料费用

后备母猪购买费用=购进后备母猪数×后备母猪的单只费用

母猪基本饲养费用= (牧猪媒体的基本非饲料费用+母猪基本的饲料需要×母猪饲料价格) ×母猪总饲养天数

母猪总饲养天数=Σ第i胎母猪头数×{第i胎由于乳房及肢腿问题而淘汰的母猪比例×此类淘汰发生的天数+第i胎由于发情问题而淘汰的母猪比例×此类淘汰发生的天数+第i胎由于流产而淘汰的母猪比例×此类淘汰发生的天数+ (1-第i胎母猪的总淘汰率) ×断奶发情间隔+妊娠天数+哺乳期天数}}

配种费用=母猪配种次数×每次受胎的配种费用

母猪配种次数=Σ第i胎母猪头数× (1-第i胎由于乳房及肢腿问题而淘汰的母猪比例-第i胎由于发情问题而淘汰的母猪比例)

分娩费用=母猪分娩次数×每胎固定的分娩费用

母猪总分娩次数=Σ第i胎母猪头数

胎儿发育的饲料费用=总产活仔数/ (1-死胎率) ×妊娠期胚胎发育所需饲料×妊娠母猪饲料价格

仔猪哺乳所需的饲料费用=总断奶仔猪头数×哺乳期由于仔猪哺乳所需饲料×哺乳期天数×哺乳母猪价格

3.6 母猪收入

母猪收入=淘汰母猪重量× (1-淘汰母猪死亡率) ×淘汰母猪胴体价格×淘汰母猪屠宰率

淘汰母猪重量=后备母猪体重+Σ第i胎母猪头数× (第i胎由于乳房及肢腿问题而淘汰的母猪比例×此类淘汰发生的天数+第i胎由于发情问题而淘汰的母猪比例×此类淘汰发生的天数+第i胎由于流产而淘汰的母猪比例×此类淘汰发生的天数+ (1-第i胎母猪的总淘汰率) ×断奶发情间隔+妊娠天数+哺乳期天数}}×第i胎母猪日增重

根据定义边际效益用公式表示为:ΔP=ΔR-ΔC= (R1-R0) - (C1-C0) =P1-P0 (其中ΔP—边际效益, ΔR—边际收入 (R1-R0) , ΔC—边际成本 (C1-C0) , P1—某一性状发生改变的经济效益, P0—在基本生产市场形势下的经济效益) 。

4 小结

经济权重明显取决于养猪生产的成本和预期收益, 但会因时间、消费行为和各种条件的改变而发生变化。当某些性状临近最佳水平时, 也会因猪的性能高低发生变化。例如, 猪若过肥时, 胴体瘦肉率的经济价值就会提高, 但当胴体脂肪趋于最佳水平时, 瘦肉率的经济价值就会降低, 甚至低至0。

各性状选育时投入和产出的时间不同, 只有通过贴现才有可比性。在杂交繁育体系中, 不同亲本群体生产性状和繁殖性状有很大差异。通过基因流动法计算得到经帖现的目标性状的标准化表现量值, 乘以性状的边际效益, 可以得到目标性状经济重要性的精确估计。

不同类型的生产性状对商品猪生产的收入成本的作用方式存在差别。通过改善繁殖性状使出栏数量增加, 使每头出栏猪分摊的母猪下降;缩短猪存栏的时间可降低饲养成本;改善胴体的性状提高出栏猪的收入;提高母猪的繁殖寿命, 可提高每头母猪终身的生产性能, 降低出栏猪平均收入和成本。另外, 提高母猪窝产子数, 提高生产肥育期日增重等措施都可产生边际效益, 这对商品化猪均无疑是一笔不小的收益。

权重计算篇6

目前,关键词权值的计算主要分为基于关键词自身的特征计算方式和基于文本结构特征的计算方式[2]。基于关键词自身的特征计算方式包括TF-IDF方法、CHI方法、IG方法和基于语义的方法等;TF-IDF此类权值计算方式最大的不足是将关键词作为独立的个体,忽略了关键词之间相互组合而产生的额外权值[3];基于语义的计算方式虽然从关键词本质特性出发进行权值计算,然而依赖于语义词典的准确性,语义词典的缺血性制约了这一方式计算的准确性[4]。基于文本结构特征的计算方式从文本的结构特征出发对关键词权值进行定义,这种方式对于结构较为规整的文本则较为有效,对于结构混乱的文本则相对效果不佳[5]。本文试图从关键词自身和文本的结构特征这两个方面出发展开研究。

本文以关键词固定权值为基础,以网页排序算法PageRank算法为理论支撑,将文本中关键词抽象为图模型中节点形式,节点之间以边进行连接。关键词与其邻接关键词构成投票模型,邻接关键词之间可以进行相互投票,关键词权值取与该关键词邻接的所有关键词对其的加权投票值与该关键词固定权值求和,经过有限次的迭代之后,关键词权值则趋于稳定,以稳定之后的权值作为关键词最终权值。

1 投票模型简介

投票模型将网络结构抽象为节点和边的形式,节点之间通过边进行连接,边上附带权值属性,附带的权值属性表示节点之间的相关性,则绝大多数的问题都可以转化为图模型的方式加以解决[6]。图模型很好的实现了数据之间的结构化呈现,通过边多跳关系属性可以反映节点之间的关联性。假设将图表示为公式1所示。

在公式(1)中,V表示节点集合,E表示边集合,A表示边上附带权值属性。各自的表示方式如公式(2)、公式(3)和公式(4)所示。

2 关键词权值计算

目前,文本中关键词的计算存在多种方式,包括基于关键词本身的TF-IDF方法、CHI方法和基于语义词典的方法,以及基于文本结构的结构化计算方法[7]。本文试图结合TF-IDF方法并对结构化计算方法进行优化,以期更加准确的实现关键词权值的计算。

2.1 TF-IDF算法

TF-IDF(term frequency-inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术[8]。TF-IDF是一种统计方法,用以评估字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。

TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现DF低,则认为此词或者短语具有很好的类别区分能力[9]。在一份给定的文件里,TF指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数(term count)的归一化,以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词数,而不管该词语重要与否)对于在某一特定文件里的词语ti而言,它的重要性可表示为公式(5)所示。

在公式(5)中,ni,j是该词在文件di中的出现次数,而分母则是在文件dj中所有字词的出现次数之和。

IDF是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到[10],如公式(6)所示。

在公式6中,|D|表示语料库中文件总数。|{j:ti∈dj}|表示包含关键词ti的文件总数,(即ni,j≠0的文件数目)如果该词语不在语料库中,就会导致被除数为零,因此一般情况下使用1+|{j/:ti∈dj}|。

2.2改进的关键词计算方法

本文在投票模型的基础上,试图将文本转化为图的表示方式,文本经过切词之后的关键词表征为图模型中关键词,关键词之间的顺序关系作为边关系用以填充图模型中边,以此可以将非结构化的文本转换为相互连接关系的图模型[11]。图模型中节点之间都可以通过边关系进行连接,这种方式可以很好地反映文本中关键词之间存在的结构相关性。

文本中关键词作为图模型中节点,节点自身所具备的权值通过TF-IDF算法计算关键词权值得到,节点之间的相互关联性通过边关系加以反映,节点之间边上的权值通过节点之间的投票关系加以体现,采用迭代计算的方式来动态地对边上权值进行更新,从而实现对节点权值的动态更新。关键词和关键词之间通过边关系进行连接构成的图模型示例如图1所示。

将文本表示为图模型的方式,文本中关键词对应于图模型中节点,关键词间的边采用关键词共现关系的方式加以体现,即关键词在共同出现,则表示关键词间存在边关系。则可以将文本表示如公式(7)所示。

在公式(7)中,文本被表示为邻接矩阵的方式,矩阵中各个元素对应于文本中关键词,若将出现于同一个文本中的多个关键词定义为存在边关系,则邻接矩阵的维度过于庞大,因此作如下定义:

定义:关系邻接点和目标节点存在H跳数的邻接节点存在相互之间的边关系,H表示目标节点和邻接节点之间间隔的关键词数目[12]。

在图模型中,将节点之间通过边进行关联,节点的权值可以通过迭代的方式动态的计算,迭代方式采用图模型中投票算法实现,目标节点的所有邻接节点通过边关系对该目标的权值进行投票,经过有限次的迭代之后,目标节点的权值趋于稳定,则认定该权值作为目标节点的最终权值,计算方法如公式(8)所示。

在公式(8)中,α表示比例参数,表示当前节点的权值在本次的迭代计算中占据的重要性,wt0表示目标节点当前的权值,N表示与目标节点存在边关系邻接节点,ti表示目标节点中某一个关系邻接点,Sum(ti)表示该关系邻接点ti的所有边总数,degree(ti)表示该关系邻接点与目标邻接点存在的边关系总数。

根据转换为图模型的文本结构化表示方式,以及对关键词权值的动态迭代计算方式,得到文本中关键词权值动态迭代算法如表1所示。

3 实验与分析

本文将改进的关键词权值迭代PTIA(Term Iterative Algorithm Based on PageRank)算法、传统关键词计算TF-IDF算法、基于语义词典[13]LTA(Term Algorithm Based Libary)算法和基于结构化STA[14](Term Algorithm Based Structure)算法分别用于计算关键词权值,算法作用的数据集为Reuters21578 Top10和20Newsgroup两个常用的文本处理领域的数据集[15]。实验选取TOP-N个关键词对,分别比较四种算法在计算关键词权值,关键词对之间的平均权值差异,从而判断改进的算法是否能够实现差异化关键词的作用,即通过增大重要关键词的权值和减小非重要关键词的权值实现特征关键词提取,在实验中,公式8的α的取值为0.2。

3.1 Reuters21578 Top10数据集

Reuters21578数据集是目前在文本处理领域比较权威也是使用最为广泛的测试集。数据集中共有21578个文档,共分为topics,organizations,exchanges,places和people五个大类,135个子类别。最常用的10个子类别称为Reuters21578 Top10,如表2所示。

根据表2给出的10大类别,分别采用四种算法比较每个类别中最大关键词权值和最小关键词权值差值,如图2所示。

在图2中可以看出,本文算法(TFIA算法)能够较为明显的差异化最大关键词和最小关键词之间的权值差异,从而实现特征提取的目的。TF-IDF算法相对而言,对于区分特征项比较弱,STA算法能较为准确地实现区分特征项,和本文算法在对特征项的区分能力上较为相似,本文同时对关键词之间的间隔距离(即跳数H值)进行不同的设定,实验对比图发现当跳数H=2时,对于区分关键词而言效果较为明显。

3.2 20Newsgroups数据集

20Newsgroups数据集也是目前文本分类领域比较常用的数据集,数据集中共分为20个类别,如表3所示。

与Reuters21578 Top10数据集的操作方式类似,本文从20Newsgroups数据集的20个类别中选取10个类别,每个类别选取最大权值关键词和最小权值关键词进行权值差值比较,如图3所示。

在图3可以看出,从20Newsgroups数据集中选取的10个类别中,本文算法PTIA算法当H=2时保持在较高的位置,说明本文算法在关键词差异化上能到达到相对较好的效果。

综合Reuters21578 Top10数据集和20Newsgroups数据集的实验结果,可以看出本文算法PTIA算法能够较为明显地实现关键词权值的差异化,从而实现区分文本中特征项的目的,本文算法在经典TF-IDF算法的基础上,综合考虑了关键词之间的相互关联性,即关键词间的结构相关性,所以在关键词权值的计算能够更为准确。

4 结束语

本文分析了当前文本中关键词权值的计算方式,综合分析了基于关键词自身的计算方法和基于文本结构的权值计算方法,提出在基于关键词自身的TF-IDF算法的基础上,以图模型中关键词间相互投票为基础,构建基于文本结构的图模型,将关键词间的结构关系转为图模型中边关系,并动态的实现对关键词权值的更新计算,实验结果表明,改进的算法能够较为准确地的反映关键词权值,从而实现差异关键词以进行文本中特征提取的目的。

摘要：关键词的权值计算绝大多数都是将关键词当作独立的部分,忽略关键词间关联性。试图从关键词间关联性出发,提出关键词的权值受到其他关键词的相互贡献作用,以PageRank算法中对于网页权值的迭代计算为理论基础,提出一种基于关键词间相互投票的权值迭代计算模型,将关键词抽象为模型中各个节点,关键词的初始权值采用经典的TF-IDF方法。将改进的关键词权值计算方法应用于Reuters21578 Top10和20Newsgroup数据集上,实验结果表明,新的算法能够较为明显地差异化关键词之间权值,达到区分文本中关键词重要程度的作用。

权重计算篇7

1 相关研究动态

在对我国农业企业的绩效评价中, 学者们根据各自研究以及现实的需要选取了不同的评价指标。曾丁文 (2005) 选用了企业的财务收益能力、资产营运能力、偿债能力和发展能力四个方面对农业企业的绩效水平进行了评价, 认为这是评价企业财务绩效的基本指标, 并选取企业的总资产报酬率、流动资产周转率、不良资产比率等财务比率作为农业企业绩效评价的指标。张凯 (2008) 在对我国国有企业的绩效评价中, 同样也选取以上四个方面的指标为评价指标。这些指标主要有企业的净资产收益率、总资产收益率、流动资产周转率、流动资产周转率、资产负债率、销售增长率、资本积累率等指标。

随着企业绩效评价要求的不断提高, 学者们对这些指标在评价企业绩效时的合理性进行了思考, 认为这些指标不足以反应企业的绩效水平。王玉玲、董青霞认为不能单以基本指标的内容对企业的线效水平进行评价, 而应该有针对性地对基本指标进行修正, 用修正后的财务指标作为企业线效评价的标准。

2 指标体系的构建

2.1 定量指标体系

本文基于前人的研究, 选择用资本增值保值率、主营业务利润率等指标对基本指标进行修正, 并用这些修正后的指标作为本文农业企业绩效评价的定量指标, 以此构建本文的定量指标绩效评价体系。

2.1.1 财务收益能力修正指标。

(1) 资本增值保值率:资本保值增值率是企业期末所有者权益总额与期初所有者权益总额的比率。资本保值增值率表示企业当年资本在企业自身努力下的实际增减变动情况, 是评价企业财务效益状况的重要指标。 (2) 主营业务利润率:主营业务利润率是企业的利润与主营业务收入净额的比率, 反映了每元主营业务收入净额给企业带来的利润。该指标越大, 说明企业经营活动的盈利水平较只有主营业务的获利能力强, 企业才真正具有很强的竞争实力和生存发展能力。 (3) 盈余现金保障倍数:盈余现金保障倍数是指企业一定时期经营现金流量同净利润的比率。它反映了一个企业当期净收益中有多少是有现金保障的, 体现了企业当期收益的质量状况。 (4) 成本费用利润率:成本费用利润率是企业一定时期的利润总额同企业成本费用总额的比率。通过成本费用利润率, 企业管理者可以对企业的收益状况予以合理评判, 促进企业加强内部管理, 节约支出, 提高经营效益。

2.1.2 营运能力修正指标。

(1) 存货周转率:也称存货周转次数, 是企业一定时期内的主营业务成本与存货平均余额的比率, 它是反映企业的存货周转速度和销货能力的一项指标, 也是衡量企业生产经营中存货营运效率的一项综合性指标。 (2) 应收账款周转率:也称应收款项周转次数, 是一定时期内商品或产品主营业务收入净额与平均应收款项余额的比值, 是反映应收款项周转速度的一项指标。应收账款周转率反映了企业应收账款变现速度的快慢及管理效率的高低。

2.1.3 偿债能力修正指标。

(1) 现金流动负债比率:现金流动负债比率是企业一定时期的经营现金净流量同流动负债的比率。该指标从现金流入和流出的动态角度对企业实际偿债能力进行考察。 (2) 速动比率:又称酸性测试比率, 是企业速动资产与流动负债的比率。速动比率过低, 企业的短期偿债风险较大, 速动比率过高, 企业在速动资产上占用资金过多, 会增加企业投资的机会成本。

2.1.4 发展能力修正指标。

(1) 三年资本平均增长率:三年资本平均增长率表示企业资本连续三年的积累情况, 体现企业的发展水平和发展趋势, 能够反映企业资本保增值的历史发展状况以及企业稳步发展的趋势。该指标越高, 表明企业所有者权益得到的保障程度越大, 企业可以长期使用的资金越充足, 抗风险和保持连续发展的能力越强。 (2) 三年销售平均增长率:三年销售平均增长率从企业主营业务连续发展水平的角度对销售增长率进行补充评价, 反映了一个企业的持续发展态势和市场扩张能力, 通过该指标, 我们可以看到一个企业主导产品在技术含量、质量水平、市场优势等方面的发展能力。

2.2 定性评价指标

定性指标的选取, 理论上来讲应当涵盖财务指标所不能包含的所有方面, 这样对企业来讲才是最全面的。但是现实中很少有企业能做到这点, 对企业尤其实是生产水平较为落后、管理制度不是十分科学完善的农业企业来说, 也完全没有必要这样去做。本文根据农业企业的现实情况, 选取企业的外部环境、市场占有能力、客户满意度、创新能力、生态功能和社会效益六个方面作为评议指标对该企业的定性绩效水平进行分析。

2.2.1 农业企业外部环境。

农业企业都是在一定的外部环境下进行经营的, 企业的经营活动经营总是处于一定的外部环境之下, 具体地计讲, 这些外部环境包括自然环境、政治环境、经济环境。

2.2.2 市场占有能力。

市场占有能力是指企业主导产品由于技术含量、功能性质、质量水平、品牌优势、营销策略等因素而拥有的占有市场的能力, 一般用企业销售收入净额与行业销售收入净额的比重来加以判断。

2.2.3 客户满意度。

是对服务性行业的顾客满意度调查系统的简称, 是一个相对的概念, 是客户期望值与客户体验的匹配程度。客户满意度与企业的绩效成正相关的关系, 客户满意度高的企业, 其绩效水平通常较高, 所以笔者在农业企业的绩效评价中, 将客户满意度作为一个重要的指标进行评价。

2.2.4 创新能力。

企业创新能力是指企业系统地完成各项活动的创新和改造的能力, 主要包括企业的技术创新、管理创新、和产品创新。在现代企业竞争日益激烈的情况下, 企业创新能力的强弱对于企业的生存发展和立足显得尤为重要。

2.2.5 生态功能。

农业企业的生产过程与周边的生态环境有着密不可分的联系, 总会对生态环境造成这样或是那样的影响。生态功能指标考核的主要是农业企业与自然生态之间的协调程度。

2.2.6 社会效益。

农业企业是社会再生产过程中的一个特定组织。它的稳定发展如同其他企业一样, 能够促使社会维持和扩大再生产, 保证企业出资人获得丰厚的投资报酬, 企业员工获得了稳定的收入来源, 政府征取到高额的税款, 给社会带来财富与稳定。

2.3 指标体系的最终构成

通过前文绩效评价指标的选取, 最终得到的农业企业绩效的评价指标如下表所示, 笔者认为下表能比较全面科学的衡量农业企业的绩效。

3 农业企业绩效评价指标权重的计算

3.1 权重计算方法

企业绩效评价的指标体系确立以后, 为了准确衡量农业企业绩效评价指标的权重, 本文运用层次分析法计算各个指标的权重系数。

层次分析法 (Analytic Hierarchy Process简称AHP) 是美国匹兹堡大学教授A.L.Saaty于20世纪70年代提出的一种系统分析方法。AHP将决策总是有关的元素分解成目标、准则、方案等层次, 在此基础之上进行定性和定量分的分析, 是一种能将定性分析与定量分析相结合的系统分析方法, 是分析多目标、多准则的复杂大系统的有力工具。

层次分析法是多目标决策的一个实用方法, 它以其深刻的数理背景、严谨的分析方法和简单实用的特点, 通过定性分析和定量计算相结合, 为难以定量的问题给出定量的处理方法, 既考虑了各指标的权重, 又避免了权重确定的主观性, 具有较好的科学性和合理性。AHP法的基本思想是:将一个复杂的无结构的问题分解为它的各个组成部分;将这些组成部分 (或称元素) 整理成为一种递阶层次的顺序;按照每个元素的相对重要性赋予其表示主观判断的数量值;然后综合这些判断以决定到底哪个元素有着最大的权重和如何影响问题的最终结果。

3.2 权重计算过程

在层次分析法实施过程中, 其关键步骤就是构造判断矩阵以求得权重, 而判断矩阵一般是通过专家咨询获得。本文选定10位专家对各指标对企业绩效的影响程度的分析, 将元素相对重要性进行比较, 使任何两两指标间通过专家意见, 形成一个判断值。将每个专家调查打分的结果输入层次分析软件, 我们可以得到各指标间的一致比例和对总目标的权重。根据所得的数据, 分别构建A~G七个判断矩阵, 每个矩阵的行列数为其元素的个数。

再次运用层次分析法软件yaahp, 将建立的矩阵输入软件, 分别计算出权重向量、最大特征根λmax、一致性指标CI、RI、CR, 一致性比率均小于0.1, 各判断矩阵均具有满意的一致性。得到的运算结果如下:

判断矩阵A一致性比例:0.0000, 对总目标的权重:1.0000;

判断矩阵B一致性比例:0.0906, 对总目标的权重:0.7500;

判断矩阵C一致性比例:0.0904, 对总目标的权重:0.2500;

判断矩阵D一致性比例:0.0805, 对总目标的权重:0.4877;

判断矩阵E一致性比例:0.0000, 对总目标的权重:0.0639;

判断矩阵F一致性比例:0.0000, 对总目标的权重:0.1144;

判断矩阵G一致性比例:0.0000, 对总目标的权重:0.0840。

最后, 计算出的各绩效指标的权重具体结果如表2所示。

4 小结

本文在借鉴前人绩效评价理论研究的基础上, 对农业企业绩效评价的指标体系进行改进, 希望可以对农业企业绩效评价指标体系进行一下必要的补充和完善, 本文运用AHP层次分析方法对其权重进行计算, 得到上表所示的各指标权重值, 可以较为科学合理地对农业企业的定量和定性综合绩效进行评价。

摘要：对农业企业绩效评价的指标体系进行研究分析, 重点在于评价指标体系的构建, 并运用AHP层次分析的方法, 对选取的指标进行权重的科学计算, 得出最终的农业企业绩效的指标体系及各指标权重, 可用于农业企业绩效评价的实践。

关键词：绩效,定量指标,定性指标,层次分析

参考文献

[1]曾丁文, 农业企业绩效评价研究[D].湖南农业大学, 2005.

[2]张凯, 国有企业绩效评价研究[D].江苏大学, 2008.

[3]王玉玲, 国内知识管理绩效评价综述[J].情报杂志, 2010, 3.

[4]董青霞, 浅析绩效管理中的问题及对策[J].经营管理者.2010.4.

[5]张丽颖, 农业企业内部夏季评估及协调分析[D].吉林大学, 2010.

权重计算篇8

1物流系统综合评价的多级次项目方案及各级次权重的建立

针对大型的物流企业的经营状况,评估时需分成三级指标及相应的权重函数。

第一级指标主要说明物流企业生产、服务的质量属性,包括订单量及订单处理质量A,成本控制质量B,财务指标质量C,配送服务质量D,库存管理质量E,客户服务质量G及企业发展潜力H等7项;相应的第一级指标权重数Fi是这7项属性的重要度的标志,且undefined。第二级指标和二级权重数Fij为第一级属性的子项目及其相对重要度,undefined;A和B中第二级指标中又有第三级指标及权重Fijk,且undefined。这三级的权重数均为评估专家讨论决定。物流企业综合评估体系和权重数见表1。

从表1可得以第三级权重向量矩阵有:

Fundefined=[F111F112F113]=[0.40 0.40 0.20];同理有:

Fundefined=[0.50 0.20 0.30]; Fundefined=[0.50 0.30 0.20]

Fundefined=[0.20 0.30 0.50]; Fundefined=[0.45 0.40 0.15]

Fundefined=[0.50 0.50 0.00]; Fundefined=[0.45 0.20 0.35]

第二级权重向量矩阵有:

Fundefined=[0.30 0.30 0.30 0.10];

Fundefined=[0.40 0.40 0.20 0.00]

Fundefined=[0.40 0.30 0.30 0.00];

Fundefined=[0.35 0.35 0.30 0.00]

Fundefined=[0.40 0.30 0.30 0.00];

Fundefined=[0.20 0.35 0.45 0.00]

Fundefined=[0.35 0.25 0.40 0.00]

第一级权重向量矩阵有:

F[1]=[0.30 0.25 0.15 0.10 0.10 0.05 0.05]

2某物流企业多级评估项目说明及专家评分

从表1可知,评价某物流企业指标体系共有7个第一级次,22个第二级次,20个第三级次,共计35个评估项,各项指标都在各类周、月、季、年报表及成本-收益等财务报表中有详细数据可供专家查阅。专家把该企业评估项目数据与市场中各物流企业平均数据相比较,得出评分值,分成很差(0,2),差(2,4),较差(4,6),及格(6,7),良(7,8),优(8,9),优异(9,10)等7个评分类别。

3物流企业综合评分的模糊数学计算

根据向量矩阵运算原理,从表2可得第三级评分向量矩阵有:

Mundefined=[3.0 4.0 8.0], Mundefined=[7.5 3.0 4.0]

Mundefined=[9.5 9.5 6.0], Mundefined=[9.0 7.5 9.0]

Mundefined=[3.5 4.5 6.0], Mundefined=[9.0 9.0 0.0]

Mundefined=[6.5 4.5 4.5]

根据模糊数学中的向量矩阵运算法则,A、B两项中第二级评分向量矩阵的计算为:

Mundefined=[FundefinedMundefined,FundefinedMundefined,FundefinedMundefined,FundefinedMundefined]

=[4.40 5.55 8.80 8.55]

Mundefined=[FundefinedMundefined,FundefinedMundefined,FundefinedMundefined]

=[4.58 9.00 5.40 0.00]

其中Fundefined为Fundefined的转置向量矩阵,其他表示都相同。从表2可知可知,其他第二级评分向量矩阵有:

Mundefined=[4.2 4.5 2.0 0.0],Mundefined=[9.5 9.2 7.0 0.0]

Mundefined=[9.0 9.0 81.0 0.0],Mundefined=[8.5 8.7 9.0 0.0]

Mundefined=[5.2 5.4 6.0 0.0]

同样计算法则,可计算第一级评分向量矩阵的计算式及结论为:

M[1]=[F[2]TAMundefined,F[2]TBMundefined,F[2]TCMundefined,F[2]TDMundefined,F[2]EMundefined,F[2]GMundefined,F[2]HMundefined]

=[6.465 6.520 3.630 8.645 8.730 8.795 5.570]

亦同样计算法则,该物流企业的总评分M:

M=F[1]T·M[1]=6.57

4该物流企业评估结论:

①从总评分M=6.57,有结论:该企业为合格等级企业。

②从第一级评分向量矩阵M[1]=[6.465 6.520 3.630 8.645 8.730 8.795 5.570],有结论,该企业在客户服务质量,库存管理质量与配送服务质量三个方面是属于优秀等级,订单量及订单处理质量和成本控制质量方面处于合格等级,其财务指标质量属于较差等级,企业发展潜力方面获得5.59分,可归于在合格等级。

③该评估的某物流公司是为长沙城市公共交通系统内的关联物流企业。M[1]中的指标数据反映了该企业的特色:重视仓储、配送和客服质量;有稳定的定单量及良好地处理定单质量;成本控制、收益能力一般;随着城市公交事业的发展,企业发展潜力亦不小。但该企业因从国营企业改制而来,其财务指标质量低下是今后必须重视和改进之处。

5多级次指标和权重的综合评估方法有如下创新之处

①物流企业综合评估多级次体系的建立的创新。最基级次评估项目都有真实数据作为评分的依据。从第三级指标评分计算出第二级项目的评分,再计算出第一级项目评分;最后才能得出准确的评估分值及评估结论。

②物流企业评估的多级次权重数的应用的创新。不同级次评估项在该级次评估中有不同的重要度,即各级评估项目都有相应级次的权重数,形成各级次的多级次权重向量矩。

③低级次权重转置向量与相应级次评分向量的乘积,获得较高一级次评分向量矩阵的一个元素值,再逐级上推计算,这方法是模糊数学中的向量运算法在评估中的新尝试。

摘要：对物流企业评估需建立一个由多级次评估项目和相应级次的权重数组成的综合评估系统。最基级次项目都应有真实数据作为评分标准。通过各级次评分向量和相应级次权重转置向量之积为上级次的向量矩阵中的一个元素的模糊数学计算,得出准确评估分。某大型物流企业的评估实例证实这套评估体系和计算方法都是准确、可行的。

关键词：综合评估体系,权重向量矩阵,评分向量矩阵,模糊数学运算

参考文献

[1]陈岱莲.基于Fuzzy-AHP的物流系统综合评价[J].物流科技,2010,(5):1-3.

[2]王瑛,孙林岩,陈宏.基于两阶段物流系统综合评价DEA/AHP[J].长安大学学报,2003,(5):79-84

权重计算篇9

市场比较法也称为交易实例比较法,即通过条件类似的土地成交价格来估算估价对象价格的方法,是目前对于金融商业及住宅用地常用的一种土地估价方法,其结果也相对直接较有说服力易于被人们所接受。

市场比较法通常需要选取多个可比地块进行比对,其核心内容为可比实例的选取、因素修正及各影响因素的权重计算。目前常用的影响因素权重计算方法为专家评判结合层次分析法得到,层次分析法是将人们的主观判断用定量形式表达和处理,是定量与定性相结合的分析方法,其基本步骤是比较若干因素对同一目标的影响,从而确定他们在目标中所占比重[1]。市场比较法中引入层次分析(AHP)法,有效地避免了在操作中的随意性和主观性[2],但这种通过模糊比较分析所计算出的权重为常权,而在实际情况中不同的对比对象会造成权重客观上的重新分配。例如当两块地其他所有条件都相同的情况下,其中对比地块几何形状良好,而待估价地块形状很差难以开展规划建设,假如按照常权的计算结果地块形状所占权重极小,这将使得最终两块地对比后的估计价格相对较为接近,但实际情况有可能是几何形状很差的待估价土地价格远远小于对比地块。这时候就需要我们根据不同的对比情况适当的加大或减小某(几)个影响因素的权重,也就是需要引入变权的概念。

1 模糊变权计算方法

通过适当的突出评估值较低的因素,以便引起决策者对其的重视度,主要方法就是加大其权重,变权法就是在综合评估中权数随评估向量(各因素评估值组成的向量)而改变的综合评判法。其计算过程如下:

假设对于目标系统而言,涉及x1,x2,…xn共n个因素,通过专家打分分别获得单因素评估指标为u1,u2,…un,它们均为无量纲或具有相同的计量单位,且同属于某个闭区间。uj可以理解为对总体而言因素xj的功能完善程度,同时约定uj的数值越高则因素xj功完善程度越好,取uj∈[0,um],常取um=1,10,100等,当uj=um时,说明因素xj十分完善;当uj=0时,说明xj已完全失去了应有的作用[3]。

设各因素x1,x2,…,xn分别通过专家分析取评估值u1,u2,…,un,则记因素xj相对于上一层而言的权重为Wj=Wj(u1,u2,…,un),j=1,2,…,n

即因素xj的权重依赖于各因素的单因素评估值,是各单因素评估值的函数。设x1,x2,…,xn分别取评估值u1,u2,…,un,记因素xj相对总体而言的权重为Wj=Wj(u1,u2,…,un),j=1,2,…,n,即因素xj的权重依赖于各因素的单因素评估值,是各单因素评估值的函数。其中引入记号表示总体功能十分完善时,因素xj的权重,称为基础权重,它可以通过层次分析法等得到。又令W0j=Wj(um,…,um,0,um…,um),j=1,2,…,n,w0j∈(0,1),表示xj的功能完全丧失,而其它功能十分完善时xj所占的权重。变权法需要加大受损严重因素的权重,所以W0j可以视为因素xj所占权重的上界。W0j按下式计算[3]:

为了能简便并且比较直观地获得Wj(u1,u2,…,un),再引入在[0,um]上定义的非负可微函数λj(u),使之满足λ’j(u)≤0。并记λj(0)=λ0j,λj(um)=λmj。λ0j,λmj分别是λj(u)(j=1,2,…,n)在[0,um]上的最大值和最小值。λj(u)可由下式进行计算[3]:

其中[1]:

则通过下式得到因素xj的变权值[3]:

2 实例分析

假设将对两宗地进行个别因素的比对,通过专家打分后运用层次分析法得出基础权重如表1。

经计算CI=0.0417,查表得RI=1.32,则CR=0.0316<0.1,满足一致性检验。

且有专家对各项因素评估分数如表2所示。

则根据变权计算过程,可得表3计算结果。

根据修正结果,其中基础权重较大的临街深度和宽度、土地级别以及宗地形状三个因素由于两宗地情况较为相似,从而其基础权重被小幅下降,而基础权重相对较小的使用年限、临街状况、面积和用途由于两宗地有一定差异,其基础权重均被小幅度增加,进一步突显示出几个要素在两宗地对比时的重要程度。总体上各影响因素的权重在比较过程中得到了更为符合实际情况的修正,结果较基础权重更为合理。

3 结束语

市场比较法实际上是一个对比的过程,这就需要我们根据不同的比对情况对各影响因素权重进行客观调整,即为变权而非常权。模糊变权的方法能根据实际对比结果更有效的修正通过层次分等方法计算出的常权值,使得各影响因素权重更为客观的反应对比地块之间的实际情况,但结合层次分析及变权法所得到的影响因素修正权重大多都建立在专家评判的基础上,这就对专家对各项因子的重要程度判断和地块之间的比对客观准确程度提出了较高要求。

参考文献

[1]李学全,李松仁,韩旭里.AHP理论与方法研究:一致性检验与权重计算.系统工程学报,1997,12(2):111-117.

[2]靳海亮,刘文锴,褚海林等.论层次分析法在市场比较法中的应用.焦作工学院学报,2000,1:57.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【权重计算】相关文章：

什么是网站权重？如何提高网站权重？05-24

权重指标05-12

服务权重05-13

权重确定06-05

模糊权重07-19

综合权重08-07

权重预测08-07