评价的方法

2024-08-04

评价的方法（精选十篇）

评价的方法篇1

随着机器翻译研究的发展,机器翻译评价也越来越重要。有效的评价方法不仅满足了推动机器翻译系统发展的需要,还为各机器翻译系统提供了公正的比较方法[1]。机器翻译评价方面的重要工作包括1966年ALPAC报告、1993年北京大学俞士汶教授孤立测试点测试方法、2000年ISLE ISLE/EAGLES体系、2002年IBM的BLEU方法等。

近年来,自动机器翻译评价及其应用研究日趋热门。本文研究的即自动评价问题。我们提出基于语言模型机器翻译评价方法,进一步对机器翻译评价方法的性能做分析,通过相关系数验证了该方法的可行性。

2. 基于语言模型的翻译评价方法

基于语料库的统计语言模型是使计算机借助于统计语言模型的概率参数,估计出自然语言中每个句子出现的可能性,从而应用于机器翻译的译文质量评价[2]。

假设一个句子可以被切分成一个字序列,记作S=w1w2…wn,其中每个wi为字典V中的一个字。令,则句子相应句子概率为:

根据公式(1),我们对语料库中的语句分别以单字和双字为单位统计其出现次数;然后分别得出机器译文中一元和二元的字频,进行数据平滑处理去除零概率事件,从而求出相应句子的概率,其结果用以实现对翻译译文的评价。

3. 人工评价与基于语言模型的翻译评价结果的比较

我们用人民日报语料训练语言模型,给6个商用翻译系统自动评分,并将分数和人工评分做比较。具体过程如下:

1)对6个系统的译文逐句计算概率;测试集合的所有句子的概率之和作为系统分数,取对数log(prob(MTS))。

2)将获取的概率对数进行归一化,使评分范围限制在[0,1]值域内,公式如下:

3)将人工分数取对数并归一化,和上述结果进行对比。其一致性反映了基于语言模型的译文评分方法和人工方法间的一致性[3]。

我们根据人工评分得出人工评价的排名。根据各翻译系统概率和求出自动评价的排名。将人工排名与自动排名在图中绘出,以观察不同评分方法的一致性。

统计相关性是评估两个变量的观测数据之间是否存在相关关系的一种手段,定义为

其中为变量取值的平均数。

根据上述定义,由上表计算得出人工排名与自动排名的相关系数=0.79,说明二者一致性很好。

4. 结论

以上是我们对基于语言模型的机器翻译评价的方法所作的初步研究和探索,实验证明我们提出语言模型用于翻译评价的方法是可行的,但是距离真正完美的翻译评价,我们还需要继续努力。当今大多数机器翻译系统采用一个已知的受限域语言模型训练系统[4]。接下来,我们将采用人工参考译文作为训练语料,用获得的语言模型对机器翻译系统进行评价,探讨测试语料的可限定性是否能够更好地提高语言模型的领域适应能力。

摘要：机器翻译质量的评价研究是近年自然语言处理研究的热点之一,对翻译系统的开发有重要的方向指导意义。本文以提高机器翻译评价方法的性能为目标,根据问题的特殊性提出了基于语言模型的翻译评价方法,并通过分数归一化,将自动评分和人工评分进行比较,获得二者的相关系数达到0.79。

关键词：机器翻译评价,语言模型,归一化,相关系数

参考文献

[1]Joshua S.Albrecht and Rebecca Hwa:A Re-examination of Machine Learning Approaches for Sentence-Level MT Evaluation.Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics,pages 880-887,Prague,Czech Republic,June2007.

[2]徐志明.统计语言模型研究及其在汉字识别中的应用.哈尔滨工业大学博士学位论文.2001:20～37

[3]姚建民.英汉机器翻译评价研究.哈尔滨工业大学博士学位论文.2004.

业绩评价的方法篇2

行为观察比较法，也叫行为观察量表法，是各项评估指标给出一系列有关的有效行为，将观察到的员工的每一项工作行为同评价标准比较进行评分，看该行为出现的次数频率的评估方法，每一种行为上的得分相加，得出总分结果比较。这种方法的优点是能够有一个比较有效的行为标准，可以帮助建立工作岗位指导书;缺点是观察到的工作行为可能带有一定的主观性。

行为锚定评价法，也称为行为定位评分法，是比较典型的行为导向型评估法。它由美国学者史密斯与肯德尔在美国“全国护士联合会”资助下研究提出的，兰迪特和吉昂在1970年证明它可用于工作动机的评估，所以在20世纪70年代，得到广泛的应用。它侧重是具体可衡量的工作行为，通过数值给各项评估项目打分，只不过评分项目是某个职务的具体行为事例，也就是对每一项职务指标做出评分量表，量表分段是实际的行为事例，然后给出等级对应行为，将工作中的行为与指标对比做出评估。它主要针对的是那些明确的、可观察到的、可测量到的工作行为。这种方法的优点是评估指标有较强独立性，评估尺度较精确;对具体的行为进行评估，准确性高一些。它的缺点是评估对象一般是从事具体工作的员工，对其他工作适用性较差;另外一个员工的行为可能出现在量表的顶部或底部，科学设计有助于避免这种情况，但实际中难免出现类似情况。

护理质量评价的方法篇3

护理质量评价中存在的问题

护理质量评价是护理质量管理的重要环节，多年来护理质量评价受到了传统观念的束缚，对护理质量评价上强调技术操作标准符合率等客观指标而忽略了护士自身以及患者的主观指标，结果是突出了过程，忽略了内涵。质量评价多有质量控制检查组单向检查，存在重检查轻环节控制的现象。

突出了终末检查，忽视了过程环节的控制，对护理质量评价上还强调了以护理管理者为核心的护理质量评价，而忽略了护士自身对护理质量的自我评价与参与。护士自我参与其中可以通过内在的改变而发挥作用，真正做到提高护理质量要从护士自身做起。因为人是护理活动中最活跃的因素，护理人员整体素质的高低，直接影响着护理水平。

机械性的判断和评价护理质量，传统的护理质量评价，往往注重于形式、走过程，如：对于护理部及护士长的监督、考核评价以及指出的不足，每一位护士是否愿意从主观上给予接受和改进呢。我想存在差异，如果工作忙或一些事物的干扰，而心情的不佳的状态下未必愿意接受。接受不了就意味着不能改进和提高，所以对护理质量的评价以及护理质量提高都是被动的。国内大多数护理质量控制检查时多对照质量标准进行评定或根据护士记录评定护理效果。护士把考核视为负担，考核时进行突击、应付检查，使得考评结果不能客观反映整体护理的实际效果，患者也不能真正受益。

护理质量评价的形式，护理质量评价有多种形式，大部分是制定具体的指标，局限于对临床护理技术项目和临床护理流程的评估，重视形式统一，强调标准化的传统模式，评价的内容以对技术指标的评价为主，评价目标主要看各类指标能否达标。

质量评价缺乏内涵重于形式，管理者往往把质量检查，质量评价看成一项机械形式，往往按表面形式的工作去完成，检查护理操作多，对护士能力的全面培养评价少，如新形式下的沟通能力，协调能力等，护理管理者来检查，护士应付过关，没有成为全员的自觉行为，其结果从表面上看提高了护理质量，但从根本上缺乏了实实在在的内涵，对护理质量的提高是不利的。

护理质量评价的对策

护理质量评价应以自身评价为基础。让他人评价转为自身评价，主动参与评价，找出真正的质量缺陷，以自身的不断努力来改变护理的服务意识，从根本上提高护理质量其做法如下：①随时性自我评价：护士在工作中对自己临时所做的每一件事情进行随时性自我评价，自己找出差距和不足，同时征求患者和家属以及同事的意见并看到自己的优点，这样使自己能够看到护理业务是否能满足患者的需求，找出怎样才能提高护理质量的对策。②回顾性自我评价是指自己1天的工作总结，下班后自己可利用较短的时间来回顾一下自己1天的工作情况，哪件事完成的比较好，哪件事完成的不好，做一下总结，给予自我评价、发扬成绩、纠正不足，努力提高护理质量。③阶段性自我评价，工作一段时间，可以是两个月，也可以是3个月，进行1次比较全面的护理质量的自我评价。把随时自我评价和回顾性自我评价的内容有机的结合起来，找差距明确改进措施。④参与性自我评价，请护理管理者，患者及家属以及自己的护理同行，都来参与自己的护理质量评价。指出自己存在的不足，找差距以及今后努力方向。这样更有利于提高护理质量，提高自我评价的效果，要以患者需求的满意为评价的标准，以患者的实际反馈结果为起点，提高患者对护理工作的满意率，建立良好的护患关系，减少医疗纠纷的发生。

讨论

组织智能的评价指标体系与评价方法篇4

Wilensky[1]在1967年出版的《组织智能》中首次提出“组织智能”这一概念,指出组织的智能就是在决策制定过程中所需信息的收集、处理、解释和传递的问题。在他之后,众多学者从不同的角度对其进行了研究。学者Stefan Kirn[2]将对组织智能的研究归纳为两个流派:一派是围绕系统科学夏威夷国际年会而确立,它开始于1987年G·P·Huber提出的关于智能化组织的指南;另一派起源于日本学者T.Matsuda开发的被称为组织智能的整体方法。T·Matsuda[3]、Chun Wei Choo[4]、K arl Albrecht[5]和William E·Halal[6]等分别建立了组织智能模型。

我国在组织智能方面的研究起步较晚。杜云波[7]较早提出了组织智力的含义、特点和衡量,之后白万纲[8]首创了组织智商评鉴系统,在此基础上,张鹏程[9]、周健[10]等分别对组织智力、组织智能进行了深入地探讨。从组织生态学的角度,齐振彪和齐振宏[11]提出组织智能的定义,即组织智能使一个企业作为一个整体,具有相应的能力,它使该企业能够搜集信息、组织学习、产生知识、自我进化,并依据所产生的知识采取有效的行动。据此,本文界定了组织智能的内涵,经过深入地分析和研究,初步建立了组织智能评价指标体系,并对其进行了相应的评价,为各组织了解其自身的组织智能现状和发现存在的问题提供理论依据和分析手段。

1 组织智能的内涵

组织智能与组织创新能力密切相关。组织智能是组织的一种整体能力,借助信息技术,这种能力使该组织能够感知变化、搜集信息、组织学习、自我改进、创造知识,并依据所创造的知识采取有效的行动,从而更好的适应外部环境,以实现组织目标[12]。根据这个定义可以认为,组织智能应具有以下特点:

(1)组织智能首先是内生的。国内外学者普遍认为组织智能是组织作为一个整体所具有的能力,这说明组织智能是不能引进的,其应用实践也已经证明组织智能是内生的,需要通过组织全体成员智慧的完美配合和互相之间默契的协作才能够获得。组织智能属于组织能力的范畴,这种组织能力是组织作为活动主体时,依靠各种资源的共同运用,组织成员的分工、合作与交流,而产生的组织整体能力。如人力资源的发掘能力、整合能力和转化能力等。无论是上述的哪种能力,都是一个长期的沟通和分享的过程。

(2)组织智能的主体是一个多元化的网络系统。组织智能的实现需要多方面的支持,尤其是其参与者。包括各级管理者、全体员工、利益相关者等智能主体,这些主体分工明晰、特色鲜明、功能互补、相互协同,并形成了一个多元化的网络系统。这种多元化的主体构成有助于加快信息的流动、做出全面的分析以及制定准确的决策。提升组织智能的关键是要使各种智能主体在运行的网络系统中优化组合、共同发展,产生“整体大于局部之和”的协同效应。

(3)组织智能是动态的、发展着的能力系统。动态能力反映了组织在既定路径和市场位势约束下,获取新竞争优势的一种综合能力。面对日益激烈的竞争环境,组织的竞争优势越来越依赖于组织对外部机会和威胁做出及时响应的能力。这就要求组织智能避免出现一成不变,必须随着组织自身的发展和外部环境的变化动态前进。

(4)组织智能必须与组织目标相协调。组织智能只有在与组织目标相协调时,才有发展和实现的潜力。由于组织各项工作的进行都是以组织的目标为依据,而且组织目标随时间、环境及地域等因素的变化,所以组织为了更好地实现组织的目标,必须不断地调整组织智能的发展方向,使组织智能与组织目标保持连续的一致性。

2 组织智能评价指标体系

以组织智能的概念和特点为基础,在建立评价指标体系的一般性原则指导下,从人力资源、知识管理、组织内部环境、资源运作、外部支持因素等五方面建立了组织智能的评价指标体系,如表1所列。

(1)人力资源。

在组织中,人是具有能动性、创造性的知识载体,也是组织智能的基本要素之一。人力资源是指组织主体所拥有的知识、技能、潜能等方面的总和。组织要创新,要突破,要发展,就必须培养高素质、高水平的人才,并且在最大程度上加强人才之间的合作和知识共享。

人力资源主要包括学历层次、培训投入、激励措施。学历层次是指人才受教育的经历和文化程度;培训投入由员工素质的提高状况体现;激励措施则通过个人和组织绩效反映。

(2)知识管理。

知识是智力发展的基础,只有通过领悟知识,才能发展智力。知识如果达不到一定的数量和质量要求,智力发展也不可能达到较高的水平。知识管理是指组织主体利用知识创造价值的过程。

知识管理主要包括知识储备、知识分享、知识更新三个方面。知识储备由个人、团队、组织及它们综合层次上的知识水平构成;知识分享是指汇集各方面知识,相互交流、激发、响应以共勉;知识更新则是根据组织需要,保持知识新鲜。

(3)组织内部环境。

组织内部的环境状况对组织内员工脑力劳动效率的提高、智力资源的增值有很大的影响。组织内部环境是指能使组织主体主动参与到组织中,产生与组织融为一体的感觉,并使其潜能充分发挥、激情得到焕发的环境。

组织内部环境包括工作环境、学习环境、成长环境。工作环境是否和谐、互助;学习环境是否有助于知识的获取、经验的交流等学习需求;成长环境是否能满足每位员工自我价值实现的需要。

(4)资源运作。

资源运作,反映的是组织对内外部资源的运作能力,包括:生产设备新度、劳动生产率、营运特点和组织文化。生产设备新度,反映了组织生产设备的新旧情况;劳动生产率,反映了组织生产发展水平和经济效益;营运特点,反映了组织所属的行业及其与运行环境的关联性;组织文化,反映组织的内部氛围和文化特征。

(5)外部支持因素。

外部的支持因素,是指对于组织智能起着重要的支撑、扶持作用的外部影响要素,它包括:金融支持、知识产权保护和产业政策。金融支持,是指金融机构对组织智能在资金等方面的支持;知识产权保护,是指对运用组织智能时产生的知识产权的保护;产业政策,是指政府从宏观层面对组织智能的扶持。

3 组织智能评价方法

3.1 组织智能评价的目的

对组织智能进行评价有两个目的:一是评价并分析某一企业或者某一类型企业的组织智能现状,并且在此基础上可以相互比较同类企业在组织智能上的差别,并找出存在差异的原因,进而可以有针对性地提出相应措施,以提高组织智能水平;二是在评价各种不同规模、不同行业企业组织智能的基础上,找出影响企业组织智能形成和发展的主要因素,为企业的经营决策和政府的政策制定提供参考依据。

3.2 组织智能评价的方法

一个区域或企业的组织智能状况如何,可搜集上述评价指标体系中各指标的的数据进行测度。目前,综合评价的方法有许多,如层次分析法、模糊评价法、关联矩阵法等。本文分别采用模糊综合评价法和灰色聚类分析法,对组织智能进行评价。

(1)模糊综合评价法。[13]

第一步,利用AHP法确定指标权重。

首先,将所分析的复杂问题分解为若干层次并建立层次模型;其次,对同一层次的各因素以上一层次的各因素为准则进行两两比较,根据评价尺度确定其相对权重,据此构造判断矩阵;再次,通过对判断矩阵的计算,进行层次单排序和一致性检验;最后,进行层次总排序和一致性检验,得到各因素相对于决策目标的优选序列,作为决策的依据。

第二步,模糊综合评价。

首先,根据评价指标体系建立相应的因素集和评语集,将评语集设置为V={V1,V2,V3}={高,中,低};其次,进行一级模糊综合评价,即对每一个二级指标进行单指标评价,并根据专家们的评价,得出模糊关系判断矩阵;最后,进行二级模糊综合评价,并得出最终的评价结果。

(2)灰色聚类分析法。[14]

首先,确定灰聚类评估单元(i=1,2,…,n),将表1评价指标体系中的16个二级评价指标作为聚类项目(j=1,2,…,16),设定灰类k={1,2,3}={强,中,弱};其次,由16个聚类项目的数据建立样本矩阵;第三,统一样本的极性,即对于负向性指标,取其倒数作为计算数据;第四,为了统一样本矩阵,将样本矩阵按α列初始化,即将矩阵每一列中的各数值除以该列中的最大数,得到初始化的样本矩阵;最后,计算白化权函数,并最终确定各样本的灰类评估值。

采用上述两种方法,可以较为客观和综合地评价组织智能。如模糊综合评价法,不仅可以对不同企业之间的组织智能进行横向对比分析,还可以对同一企业不同时期的组织智能进行纵向对比分析。但是,在使用上述两种方法对组织智能进行评价时,也存在一定的缺陷,即在设置模糊综合评价中的评语集和设定灰色聚类分析法中的灰类时,存在划分依据不准确的问题。这一问题可以借鉴人类智商评级的划分方法,即通过大量的实践调查,将得到的IQ分数标准化,则100分是人群的平均数(低于100和高于100的样本一样多),将低于100分且分数较为密集的区间作为正常范围,依此类推。

4 结束语

水质评价方法的探讨篇5

水质评价方法的探讨

摘要：现行水质评价方法为单因子评价法,该方法存在一定的不合理性.文章探讨了以多项水质参数综合评价方法中的`算术平均法为主要评价方法来评价水体水质,文章探讨的评价方法对评价因子的划分与《综合污水排放标准》(GB8978-)指导思想一致.作者：程文涛张奕李军 CHENG Wen-tao ZHANG Yi LI Jun 作者单位：湖北省环境科学研究院,武汉,430072 期刊：环境科学与技术 ISTICPKU Journal：ENVIRONMENTAL SCIENCE & TECHNOLOGY 年，卷(期)：, 30(z1) 分类号：X824 关键词：单项评价综合评价分类

综合评价方法的发展与不足篇6

综合评价方法的思想和作用

提到“评价”，自古就有“论功行赏、论资排辈、平心而论”之說，它是人类社会中一项经常性的、极为重要的认识活动。而在现实社会生活中，对一个事物的评价常常要涉及多个因素或方面。所谓综合评价分析，即“对评价对象的全体，根据所给的条件，采用一定的方法给每个评价对象赋予一个评价值，再据此择优或排序”。它不仅在宏观经济分析领域大显身手，如不同国家或地区间的经济实力、竞争力评价、现代化进程、社会发展监测、小康生活水平进程、环境质量监测、交通安全系统等领域的测评，其研究思想和方法也适用于微观分析，如企业的绩效评价、大学排名、居民购房购车选择、学生综合素质评价等。而目前，充斥于耳的各项指数，如天气指数、洗车指数、综合发展指数、CPI指数等也是综合评价结果的一种具体表现。

综合评价理论对于推进经济社会的建设、提升居民生活水平具有重要意义。具体表现为：一是通过定量分析评价方法，可以监测、揭示和分析经济社会发展过程中的问题及不足，从而采取相应对策；二是可以较为全面地掌握发展状态，防止以偏概全；三是便于进行动态发展的监测评价，为政府决策、宏观管理、居民个体消费提供参考依据。

综合评价方法的最新发展

随着科学的不断发展，不同领域知识的不断交叉、融合，综合评价理论因其自身的兼容并包性，使得综合评价模型可以吸收到运筹学、数据挖掘、模糊数学、管理科学等不同学科的多种方法之所长。系统的组成以“功能”为准则，只要是能用于综合评价的方法都可以看作为系统的成员。因此，综合评价作为一个多学科边缘交叉、相互渗透、多点支撑的新兴研究领域被专家和学者所推崇。

随着实际评价系统日益大型化、数字化、智能化和集成化，常规的综合评价方法，如线性规划法、专家评价法、综合指数法、层次分析法等已难以胜任复杂系统评价问题中所涉及的多层次、多因子的问题。目前，模糊综合评价、灰色综合评价、智能模型评价、组合评价成为解决实际评价的新的有效方法。

模糊综合评价（Fuzzy Comprehensive Evaluation）以模糊数学为基础，针对传统数学方法中“唯一解”的弊端，可以有效评价客观事物的差异在中介过渡时所呈现的“亦此亦比”性状态。有时，从一个等级到另一个等级间没有一个明确的分界，中间经历了一个从量变到质变的连续过渡过程，这个现象叫做中介过渡。而模糊数学理论的优势即在于解决“内涵明确，外延不明确”的“认知不确定”问题。比如，“年轻人”就是一个模糊概念，因为每一个人都十分清楚“年轻人”的内涵，但是要让你划定一个确切的范围，则很难办到。模糊综合评价则可应用模糊关系合成的原理，将一些边界不清、不易定量的因素定量化，从多个因素对被评价事物隶属等级状况进行综合性评价。但不足之处是其本身并不能解决评价指标间相关造成的评价信息重复问题，隶属函数的确定还没有系统的方法。

灰色综合评价（Gray Comprehensive Evaluation）以灰色系统理论为基础，包括灰色关联度评价方法、灰色聚类分析方法等。灰色系统理论以“部分信息已知，部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象，其特点是“少数据建模”，主要通过对“部分”已知信息的生成、开发，提取有价值的信息，实现对系统运行行为、演化规律的正确描述和有效监控。与模糊数学不同的是，灰色系统理论着重研究“外延明确，内涵不明确”的对象。比如说到2050年，中国要将总人口控制在15亿到16亿之间，这“15亿到16亿之间”就是一个灰概念，其外延是很清楚的，但如果要进一步问到底是15亿到16亿之间的哪个具体数值，则不清楚。灰色综合评价方法的主要工具是关联分析，即通过比较数列与参考数列的关联系数和相关度，来确定各种影响因素或备选方案的重要度，进而决定重要因素或最优方案。

智能模型评价方法主要指在系统评价过程中更多地考虑思维规律和人脑的智能特征，将定性分析与定量分析综合集成的评价方法。其包括了遗传算法的智能技术、模拟人脑结构的人工神经网络方法、模拟发散思维的蒙特卡罗方法、基于粗糙集理论的评价方法等。而目前应用较多地为BP人工神经网络的评价方法，它通过BP算法学习或训练获取知识，并存储在神经元的权值中，通过联想使相关信息复现，能够“揣摩”、“提炼”评价对象本身的客观规律，进行对相同属性评价对象的评价。由于智能模型评价方法具有自适应能力、可容错性，能够处理非线性、非局域性与非凸性的大型复杂系统，因此被越来越广泛地应用于涉及银行贷款项目、股票价格的评估、城市发展综合水平的评价等。

组合评价（Combination Evaluation）是对两种或两种以上的综合评价结果（或评价技术）进行集成的技术。较单一的评价方法更合理、更科学，因为它克服了不同类评价方法的缺陷，同时吸收了各自的优点，对评价对象作了更为全面、合理的评价。其主要包括评价过程中权重的组合、方法的组合、结果的组合三个关键环节的系统性研究。在现阶段的研究中，以层次分析法（AHP）与模糊综合评价方法、模糊综合评价与灰色综合评价几类组合评价较为普遍。

综合评价方法的局限性

尽管综合评价方法优势明显，但我们也应认识到它并非“百试百灵”，仍具有一定的局限性。第一，受到研究者对评价目标理解认识能力的制约，存在理论研究同实际应用的衔接差距问题；同时在选取评价指标时又受到统计指标可得性的限制，因此综合评价在设计之初并不能确保真正做到针对性和代表性，而具有一定的主观性。第二，虽然综合评价的结果用数字量化表示，但其评价结果并不具有数学意义上的精确性，而只能大体反映评价对象的特点，其评价结果的准确与否并不是绝对的。因此虽然综合评价方法复杂、手段多样化、应用广泛化，最终都需要结合定性分析进行合理分析。第三，学界对综合评价方法本身的效率评价及评价结果科学性的检验，一直属于理论研究的空白。第四，目前部分综合评价多起源于某一政策热点问题，研究者“一时兴起”而设计出一套评价指标体系用于评价，但对后续的追踪研究和完善则虎头蛇尾、不了了之。

对此，作为一名统计分析人员，笔者认为针对综合评价方法的局限性，十分有必要加强对自身“内功”的修炼，从而使对复杂问题的研究能“拨开迷雾终见天日”。第一，应加强对宏观政策理论的学习，多思考，广泛听取各方意见，分析研究对象的内外部环境和作用机制，进一步加深对研究对象特性的理解。第二，在综合评价方法的选择上，应尽可能地博各方所长而为我所用，多用一些方法来相互验证。第三，在对综合评价结果的解释上一定要做足功课，结合实际情况做到有理有据。第四，作为一名统计人，在大数据时代，对统计指标的解释和数据挖掘方面也应做到服务更加详细和到位，只有“站在一线”直面问题和挑战，才能促使数据使用者更加信任统计部门的数据质量。第五，作为一项评价方法，我们对综合评价的过程和结果都要采取系统性的质量管理思维，真正体现出科学性和可持续发展性，才能更好地为决策服务。

编辑：单之卉 / 邮箱：szh@bjstats.gov.cn

评价的方法篇7

一、绩效评价的含义及发展史

1、绩效的含义

在中国期刊全文数据库中,进行篇名关键词检索,与业绩评价有关的文章在1998~2007年的10年期间共有1655篇,其中2002~2007年6年间就有1490篇,占过去10年总数的90.03%。但是这些研究中对业绩评价明确做出定义的却不多,从而带来沟通上的障碍。因此,我们先简要讨论一下有关绩效评价的概念。

韦伯斯特新世界词典解释绩效的含义是:“(1)正在执行的活动或已完成的活动;(2)重大的成就。”因而,绩效既可以看作是一个过程,也可以看作是该过程产生的结果。现代汉语词典将绩效解释为:(1)建立的功劳和完成的事业;(2)重大的成就。可见,二者都强调绩效的结果性,而英文还强调绩效的过程性。财政部统计评价司认为,“企业效绩是指一定经营期间的企业经营效益和经营者业绩。企业经营效益水平主要表现在盈利能力、资产营运水平、偿债能力和后续发展能力等方面。”[1]冯丽霞认为,“企业业绩可以从两个方面来理解:一种是以结果为导向的业绩,是指在特定的时间内由特定的工作职能或活动产生的产出记录。一种是以行为导向的业绩,是指与企业目标有关的、可以按照个体的能力(即贡献程度)进行测量的行动或行为。”[2]笔者认为冯丽霞关于绩效含义的解释是相对比较完整的,包括了绩效的结果性与过程性两方面的特点。

2、对绩效评价的定义

财政部评价司认为,“效绩评价是指运用数理统计和运筹方法,采用特写的指标体系,对照统一的评价标准,按照一定的程序,通过定量定性对比分析,对企业一定经营期间的经营效益和经营者业绩,做出客观、公正和准确的综合评判。”[3]孟建民认为,“绩效评价是对企业占有、使用、管理与配置经济资源的效果进行的评判”[4]张涛和文新三认为,“企业绩效评价是评价理论方法在经济领域的具体运用,它是在会计学和财务管理的基础上,运用计量经济学原理和现代分析技术而建立起来的剖析企业经营过程,真实反映企业现实状况,预测未来发展前景的一门科学。”[5]笔者认为绩效评价过程应当能够记录企业经营管理过去的结果、反应当前的企业现状、指导企业未来的发展发向,在评价过程中既要对企业经营的结果进行测评,更应对经营过程起到控制和衡量的作用。

3、绩效管理系统的发展史

绩效管理系统经历过四个不同的发展阶段。如表1所示。

对以上绩效管理系统演变史的了解,可以给文中第一部分关于研究背景和意义的内容给予较为全面的感性认知和有力的理性支持。我们可以清晰的看到,绩效评价过程如同效绩管理系统一样,经历了由财务指标到综合指标、片面信息到较全面信息的利用、简单到复杂、结果导向到结果与过程双导向并重的发展趋势。

二、现有管理绩效评价方法的综述

1、基于目标管理(Management by Objective,MBO)方法的绩效评价模式

目标管理(Management by Objective)是美国管理学家彼得·德鲁克(Peter F.Drucker)于1954年提出的一种管理思想与一整套的管理方法。目标管理是指企业内部各层管理者通过重要工作目标的设立,以对其工作进度和工作效率进行自我控制和自我评价,从而使员工在工作完成后得到满足感,以激励员工的责任心和荣誉感,发挥工作潜能,进而提升企业效率的一种管理方法。MBO导向绩效管理通常分为四个阶段,它们分别是:计划、指导、考评和激励。这与目标管理的计划、执行、检查和反馈四个阶段相对应。

其他学者对于目标管理方法的评价既有正面的也有负面的。理查德·H·巴斯柯克指出了MBO的观点具有哥白尼般的突破性效应:“他注重管理行为的结果而不是对行为的监控,这是一个重大的贡献,因为经把管理的整个重点从工作努力———即输入———转移到生产率———即输出上来。”[6]而“质量革命之父”W·爱德华兹·戴明则认为,目标管理与质量是相抵触的:它只强调目标,而不是过程;它解决的是最终结果的问题,而不是实现这一结果所采取的手段的问题。一个组织可以用任何手段达到所需要的任何目的,这是一种短期行为。事实上,目标管理的方法在绩效评价过程中,其主要作用在于发挥员工的自我监督与控制能力,从而取代外部监控,并得到较之以前外部施压监管之下更好的绩效。然而,正如戴明所指出的问题一样,MBO并不能对于企业经营过程给予有力的追踪与控制。

2、基于关键绩效指标(Key Performance Indication,KPI)的评价模式

(1)关键业绩指标是通过对组织内部某一流程的输入端、输出端的关键参数进行设置、取样、计算、分析,并以此来衡量绩效的一种目标式量化管理方法。它对绩效管理的最大贡献是将企业业绩指标的设置与企业的战略结合在一起。它所关注的是指在某一特定发展阶段中企业所要要解决的战略性的最主要的问题。KPI符合“20/80原理”,即在一个企业的价值创造过程中,20%的员工创造企业80%的价值,必须抓住20%的关键行为,对之进行分析和衡量,这样就能抓住业绩评价的核心所在。(2)KPI具有以下特征:(1)把员工的个人行为与公司远景、战略与部门结合在一起,使个人绩效、部门绩效同企业整体效益联系在一起。(2)使员工的绩效和客户价值相结合。(3)依据企业的发展战略和流程,而非岗位和功能来设计员工绩效考核指标。(3)KPI的优缺点。一方面,战略性目标具有整体性特点,而且在沟通上面存在一定的困难,KPI则给企业各层管理者提供客观联系的标准和角度,辅助制定基于战略、支持战略的各级目标。另一方面,KPI可以使企业各层管理者意识到自身、本部门在组织战略实现中的位置与职责。KPI体系具有系统性特点,不同部门所承担的KPI对应代表着不同部门对整个企业的价值。这使得管理者从整个企业的角度去思考问题、制定策略,有利于打破部门本位主义。关键绩效指标的不足之处在于,它虽然提出了一套与战略实施密切相关的关键业绩指标,但是未能进一步将绩效目标分解到企业的基层管理及操作人员。而且KPI未能提供一套具有实践意义的完整的指标框架体系。

3、基于投资回报分析(Return on Investment,ROI)的方法

关于投资回报的分析,有财务的和非财务的评价方法。以往的研究多以财务评价方法为主,辅以非财务指标分析,非财务的分析方法并未得到足够的重视。在现阶段,非财务的分析方法越来越受到学者们和企业管理者的关注。投资回报分析通常是运用一定的投资回报率及相关指标,对企业经营管理活动实施前后的投资、成本、回报、收益、利润等项目进行追踪、测量和评价,并以此来作为绩效评价重要结果的绩效评价方法。这种方法非常直观,而且是在管理实践的过程中也最为常见。传统的评价投资回报的是一些金融和财务的方法,这些方法包括NPV(净现值)、ROI(投资回报率)、IRR(内部收益率)等。这些方法在衡量投资回报方面都有各自的优点。但是它们的主要缺点都在于把全部注意力都放在现金流和会计凭证上,因此不适于衡量无形的、间接的和战略性的领域。事实上,即使加入了非财务的分析方法与评价指标之间,ROI与MBO具有同样的不足之处,即只对于最终结果的评价,而忽视了对于经营管理过程的监督、控制和调整。

4、应用平衡积分卡(Balanced Scorecard,BSC)进行绩效评价

(1)平衡记分卡(Balanced Scorecard,BSC)是一套能使企业高层管理者快速而全面地考察企业的测评指标。它包括财务指标,也包括非财务指标,从财务、顾客、内部业务流程和学习与创新四个方面综合评价企业业绩。平衡记分卡使公司增加竞争力的各种措施同时出现在一份管理报告中,迫使管理者把所有的重要纯净测评指标放在一起考虑,从而防止次优化行为。(2)卡普兰和诺顿(1992)在《哈佛商业评论》上提出了BSC这一概念,它把评价过程分为三个层面:任务、目标和测量。不同的市场状况、产品战略、企业和竞争环境,需要用不同的记分卡去对应它们各自的目标、战略、技术和文化。BSC追求全部过程的最优化,它运用了一个平衡多种视角的观点,提供精简相关的、平衡兼顾的信息从而为给管理者的管理过程予以支持。(3)对平衡记分卡的评价。罗伯特·G·英格尔斯曾提出过新绩效指标体系建立的五项基本活动,它们分别是:(1)建立信息体系结构;(2)运用技术于体系结构以支撑其运转;(3)将新结构与激励机制挂钩;(4)吸引外部资源;(5)设计一个能保证前四项活动实施的程序。[7]平衡记分卡的实施过程正包括了这五项基本活动,从而体现了它作为一种绩效评价方法的合理性与适用性。平衡记分卡不仅仅是一种测评体系,它也是一种有助于企业取得突破性竞争业绩的管理体系。然而,高级微型设备公司(AMD)的平衡记分法并未能产生明显的效果,“因为公司管理并未利用它来推动变革的过程。[8]在BSC采用之前,高级经理们已经对公司的使命、战略和关键的绩效测评指标达成了一致意见。总的来说,BSC只是对经理们已经普遍掌握的知识进行了浓缩。”由此看来,BSC对于处于变革过程之中的企业更为有效,而对于非变革过程的企业作用并不明显。另外,平衡记分卡在具体运用的过程中,会受到企业现有信息化程度的制约。由于BSC的实施需求大量的关于企业经营各个重要领域的一手资料,因此企业运用它之前必须在信息的获取、整理和运用方面具备先天的优势。而这一必要条件是为许多中小型企业所并不具备的,事实上,即使是某些大型企业在信息系统的建设方面也还有许多工作有待完成,此外信息系统的建设本身也需要经历一个长期而复杂的过程。这就给BSC在实践过程中的应用带来的很大制约与不便。

三、提出假设及研究展望

绩效评价经历了由单一的财务指标到财务非财务指标相结合,由重结果到同时关注过程和结果,由静态评价到动静结合,由单一的管理控制到全面的战略管理工具发展演变的过程。然而现有的评价方法仍然存在着诸多问题,使得企业实践过程困难重重。无论是出于实践还是理论研究的需要,一种可以对企业经营全过程进行动态评价的,易于被企业掌握并运用的,可以比较全面地记录企业过去的经营状况、控制企业当前的经过过程、指导企业未来发展与变革方向的新的绩效评价方法的产生都是必要和必须的。

这种新的绩效评价方法应当具有以下特征:

1、绩效评价的过程导向与结果导向并重。

在以往的绩效评价过程中,对于经营过程的绩效评价往往得不到应有的重视。过程导向的绩效评价,可以有效地对于企业当前的经营状况给予有力的监督和控制,从而直接影响到未来的产出结果———远期的经营绩效。另外,以往绩效评价均以经营战略为起点,即在假设企业经营战略已经明确的前提下实施绩效管理和评价工作。事实上,战略的制定往往与企业自身能力、周边环境等多种因素密切相关,因此起始于战略制定之后的绩效评价工作并不能给予企业经营全过程的以充分的支持。笔者认为,新的绩效评价方法应当在企业纵向经营管理过程中再向后延伸一环———把目标与愿景包括在内。绩效评价所应包括的环节如图1所示。

从逻辑上来看,目标和愿景的制定会直接决定着企业所从事事业的内容、原则和方式,它也是战略制定的重要依据。目标和愿景表达了企业想要做什么的主观愿望,其中也包含了某种社会需求与企业自身资源与能力相匹配的这一因素,而战略则是帮助企业实现这一主观愿望的利器。有关战略的制定,现在已经有了大量的研究成果,为了使企业能够时刻明确自身所担负的使命,笔者认为在确定战略之前将目标和愿景加入到绩效评价过程之中去是必须的。

2、财务与非财务指标的充分结合运用。

财务指标与非财务指标的综合运用,是企业经营发展过程对于信息利用最大化要求的必然结果。二者中的任何一个都无法单独提供企业经营管理活动所需的更为全面的参考信息。然而在非财务指标的具体运用方面,仍然存在许多问题需要解决。非财务指标难以量化,其实际发挥的作用对于企业经营最终输出结果的影响过程具有复杂性和隐蔽性,因此对于非财务指标的选取是非常困难的。关键绩效指标(Key Performance Indication,KPI)评价模式是较早地引入非财务评价指标的绩效评价方法,然而它并没能解决财务与非财务指标如何匹配运用的问题,在指导管理实践方面,也没有能够提出具体的实施办法。

3、强调可操作性,具有较广的适用范围。

一套有效的绩效评价方法应当在管理实践的过程中易于操作,并且能够为众多的大、中、小企业广泛应用———这些企业可以依据自身的资源与能力、企业经营现状、行业特征等因素灵活运用这一方法。当然,这里提到的广泛的适用,并非就是要求开发出一套适合于任意情况和条件下的万能评价模式,而是指一种不受具体的企业个体特征所制约的评价方法,这种方法可以对于企业的绩效评工作给予理论上的有力支持。平衡记分卡(Balanced Scorecard,BSC)的方法最早源于通用公司的管理实践,在结果与过程导向、财务与非财务指标的结合方面都有独到之处,然而却由于对于信息系统的要求过高而无法为多数企业采用和实施。与其说这是绩效评价方法的实施条件不足,倒不如说是由于方法本身不具有普通适用性更为恰当。

摘要：关于绩效和绩效评价有众多学者都给出过各自的定义,为了便于讨论,本文先从这两个基本概念的含义入手,逐步展开讨论。在对现有绩效评价方法作出回顾之后,探索未来该领域的研究方向。

关键词：管理绩效,绩效评价

注释

1[1]财政部统计评价司,1999,企业绩效评价问答,经济科学出版社,第3页。

2[2]冯丽霞,2002,企业财务分析与业绩评价,长沙:湖南人民出版社,第216页。

3[3]财政部统计评价司,1999,企业绩效评价问答,经济科学出版社,第3页。

4[4]孟建民,2002,中国企业效绩评价,北京:中国财政经济出版社,第2~3页。

5[5]张涛,文新三,2002,企业绩效评价研究,北京:经济科学出版社,第3页。

6[6][美]杰克·贝蒂著,吴勇,江峰,方小菊译,管理大师德鲁克,上海交通大学出版社,1999年5月:第93页。

7[7]罗伯特·G·英格尔斯,“一种新的公司绩效测评方法”,《哈佛商业评论》,1991年1/2月号。

综合评价方法的评述篇8

我们在日常生活中经常会判断哪个学生的素质高？哪个高等院校的声望高？哪个地区的发展状况好？这些判断都涉及到一个词“评价”。现实生活中，对一个事物的评价常常要涉及多个因素或多个指标，评价是在多因素相互作用下的一种综合判断。

多指标综合评价方法需要将反映评价事物的多项指标的信息加以汇集，得到一个综合指标，以此来反映从整体上反映被评价事物的整体情况。这种方法包含了若干个指标，这多个评价指标分别说明被评价事物的不同方面，要对被评价事物做出一个整体性的评判，用一个总指标来说明被评价事物的一般水平。综合评价这种定量分析技术为人们正确认识事物、科学决策提供了有效手段。

二、综合评价的具体方法

2.1早期的评价方法

早期的评价方法有总分评定法、常规评价方法、指数综合法，最优距离法、功效系数法。这些方法在历史上曾起过重要作用，现在较少使用，因为主观性较强，只能用于较为简单的系统进行评价。

2.2运筹学和其他数学方法

(1）数据包络分析法：是根据多指标投入和多指标产出对相同类型的单位进行相对有效性或效益评价的一种新的系统分析方法。以相对效率概念为基础，以凸分析和线性规划为工具的一种评价方法。1978美运筹学家查恩斯A.Chames和库珀W.cooper等人首先提出。用来评价多输入和多输出的“部门”（称为决策单元）的相对有效性。DEA可看作是一种非参数的经济估计方法。实质：根据一组关于输入-输出的观察值来确定有效生产前沿面。应用于多种方案之间的有效性评价、技术进步评估、企业效益评价。

优点是不需要给出代表决策者偏好的权，也不需要给出输入输出的函数关系。缺点是不允许输入输出数据是随机变量，且没有反映决策者的偏好。应用范围限于一类具有多输入、多输出的对象系统难得相对有效性的评价。

(2）层次分析法：这种方法更强调人的思维判断在决策过程中的作用，是将决策问题的有关元素分解成目标、准则、方案等层次，在此基础上进行定性和定量分析的一种决策方法。是将人们的定性思维转化为定量分析的过程，很大程度上依赖于人的经验20世纪70年代著名运筹学家塞迪（T.L.saaty）提出的。

基本原理是将决策问题的有关元素分解成为目标、准则、方案等层次，在此基础上进行定性和定量分析的一种决策方法。在多指标的权重确定上应用广泛。该方法是一种定量和定性想结合的方法，在多指标的权重确定上应用广泛。

优点是可靠性高、误差小。缺点是因素众多、规模较大的问题时，容易出现问题，它的应用限于诸因素子集中的因素不超过9个的对象系统，此外其重要性等级通常由专家给出，这必然涉及各专家的主观判断的准确性问题。

(3）模糊综合评价法：模糊数学就是试图利用数学工具解决模糊事物方面的问题。就模糊数学为基础，应用模糊关系合成的原理，将一些边界不清、不容易定量的因素定量化，从多个因素对被评价事物隶书登记状况进行综合性评价。

涉及模糊因素的对象系统的综合评价方法，在模糊环境下，考虑多种因素的影响，为了某种目的对一事物做出综合决策的方法。它将评价对象和评价指标运用模糊数学方法转变为隶属度和隶属函数，通过模糊复合运算来得到模糊结果集。可以较好的解决综合评价中的模糊性，在许多领域广泛应用

(4）灰色系统理论：灰色系统理论主要是利用已知信息来确定系统的未知信息，使系统由灰变白。这种方法的特点对样本量没有严格要求，不要求服从任何分布。

许多客观事物之间、因素之间、相互关系地比较复杂、人们在认识、分析、决策时得不到全面、足够的信息，不容易形成明确的概念。因为这些都是灰色因素，灰色关联性在起作用，所以对灰色系统进行分析和研究时，要解决如何从随即性的时间序列中，找到关联性和关联性的度量值，以便进行因素分析，为系统决策提供依据。应用灰色关联分析法进行系统综合评价与分析时，需要建立比较数据列和参考数据列，这两类数据列由备选方案的评价指标构成。评价指标的建立主要应该考虑全面性、独立性和可操作性等基本原则。首先，应考全面性原则。其次独立性原则，另外还要考虑可操作性指标即要求实用和便于计算。

灰色关联分析法的基本步骤：建立比较数列、确定参考数列、计算关联度、较优方案的评判。

2.3统计方法

(1）主成分分析法：把多项评价指标合成少数几个主成分，再以这几个主成分的贡献率为权数构造一个综合指标，据此做出判断。要求有多个非线性相关的指标，指标太少的话，会在很大程度上影响评价的客观性。

(2）因子分析法：是主成分分析法的一种自然延伸，它在主成分分析结果的基础上，将多个变量综合为少数几个因子，从而再现原始变量与因子之间的相关关系。

一般方法是对原始数据进行标准化变换，然后建立因子分析模型。

(3）聚类分析法和判别分析法：用一定的原则对多维空间上靠近的点归为一类，而不同类别的距离尽可能大。将统计样本划分为不同的类别，给出综合评价结果。

优点：它是一种不依赖于专家判断的客观方法，因此可以排除评价中人为因素的干扰和影响，而且比较适宜于评价指标间彼此相关程度较大的对象系统的综合评价。该类方法的最大优点在于其评价模型生成过程中同时也生成了信息量权数，这是其他方法所不具备的。

缺点：无视指标的实际重要性，过于强调指标数据的客观性。这类方法的另一大缺点是其评价结论的相对性。样本构成变动将会导致评价结果的“逆序”，而这种逆序是不合理的。

2.4神经网络法

人工神经网络是由大量的同时也是很简单的处理单元广泛连续而形成的网络系统，最早开始于1943年MECULLOCH和PITTS提出的神经元的数学模型，反映了人脑功能的许多基本特征，是一个并行处理的非线形系统，是对人脑的行为做某些简化、抽象和模拟。最常用的是BP神经网络，它把一组样本的输入、输出问题变为一个非线形优化问题。

BP神经网络是一个可以自组织、自学习、自适应并具有容错和抗干扰能力的非线性系统通过学习训练可以连里各种输入和输出变量之间的映射关系，进而对实际系统进行评价和预测。可以排除设置权重和依赖经验公式等认为因素的影响，因而进行分裂和模式识别的结果客观可靠。BP神经网络的学习样本参数和模式识别的分类等级可根据需要灵活选择，因此该方法有较强的适应性，人工神经网络方法在环境质量评价的其他领域（如江河水质、大气污染、城市噪音、城市综合环境等）有广阔的应用前景。

BP神经网络对于复杂的非线性模型仿真从理论上来说其误差可以达到任意小的程度，最大优点是自适应性与学习能力强。缺点是学习速度慢、容错性下降、浮点溢出和网络不收敛等问题。

三、结论

1、目前的指标体系实际是在一个不完善的理论体系下建立起来的，只有在理论体系逐步完善的过程中，不断完善指标体系的建设，才能为综合评价奠定更为科学的基础。

2、一些具有代表性的指标难以量化。有一些指标在理论上认为有代表性，但却难以量化，如一些定性判断指标。指标难以量化，就无法进行科学比较采用，从而削弱了综合评价的完整性和科学性。

3、一些具有代表性的指标难以获取。如人均受教育年限能很好地反映一个地区的人口素质和教育发展水平，但对于一个人口较多的地区或国家，只有经过人口普查才能获得相关数据，这就为指标体系的建立和综合评价带来了一定困难。类似这样既重要、又难以获得的指标还有很多，这同样也为综合评价带来一定难度。

摘要：随着我国科学技术进步和社会经济发展, 人们对各类问题的考察从分析拓广到了综合评价。综合评价方法是一个多学科边缘交叉、相互渗透、多点支撑的新兴研究方法, 有的从统计学角度对其进行研究, 有的从系统工程学角度对其进行研究, 有的从具体的专业角度对其进行研究。由于研究出发点与基础不同, 研究观点、偏好也不尽相同, 使得综合评价这一重要技术仍然处于一种分散、零乱之中, 导致综合评价结果常常受到争议和怀疑, 人们通常重视对综合评价方法的创新与发展而忽略了对综合评价方法本身的评价。

关键词：综合评价,评述

参考文献

[1]、王其荣, 黄建.综合评价方法之评价.　知识丛林.2005, 8.

[2]、杜栋, 庞庆华.现代综合评价方法与案例精选.清华大学出版社.

[3]、郭亚军.综合评价理论与方法[M].北京:科学出版社, 2002。

中职数学课堂评价的方法篇9

课堂教学中形成性评价的含义及作用由于中等职业教育是为就业进行定向教育的, 学生职业兴趣定向较早, 他们一进校门就自觉或不自觉地将兴趣集中于固定的专业。因此在中职的数学教学中, 教师要始终把数学的意义教学贯彻在整个教学过程中, 使学生明确学习数学的目的, 理解数学的实际意义, 调动学生的求知需要。特别地, 教师要根据本专业学生的专业特点, 在数学教学中将数学知识与专业知识有机地结合起来。形成性评价是强调开展以调节教育过程, 保证教育目标更好地实现为目的的评价活动。同时是课堂教学的重要组成部分, 运用得当, 能有效地提高学生的学业成绩的有效方法。

二

中职数学课堂教学评价方法根据新课标的要求, 对数学课堂运用教学中形成性评价的方式进行了重新的审视及修改, 从而以新的评价方式推动教学, 评价的方法主要围绕三种方法来展开。兴趣是学习的先导。如果教师不能紧紧抓住课堂40分钟来激发学生学数学的兴趣的话, 他们的新鲜感很快就会消失, 从而失去了对数学学习的兴趣。由此可见, 激励学生学数学的兴趣是多么得重要。保护学生的自尊心以及树立学好数学的信心。对于数学的学习, 信心和自尊心是特别重要的。课堂上学生也许不善于表达自己, 说出的话语也许言不达意, 但如果教师注重了此时对学生的评价, 静静地等待, 给他一个鼓励的眼神, 一个期盼的微笑, 则会激励学生们去说, 即使他说错了, 也以同样地等待, 同样的眼神, 同样的微笑去激励他。

三

中职数学课堂教学评价的运用:

1、运用语言的多样性来评价从语言方面对学生课堂表现进行评价是最常用的方法。

恰当的评价语言, 能激活学生的学习激情, 稳定地促进学生学习状态。如课堂表现, 可以作出相关记录, 这主要是指教师对学生完成课堂教学活动的评价记录, 如在答问、比赛、讨论等活动中获得分值等, 可以对学生良好表现给予表扬, 既是是差生, 只要是有一点点进步也应及时给予口头表扬, 针对不同的学生要采取灵活多样的评价语言, 注重评价语言的多样性和真实性, 这样才能真正调动学生的学习积极性。

2、运用无声语言参与评价无声语言指的是人们借助身体、

动作、面部表情等来传递信息, 交流感情, 表达多种含义的信息传递和情感表达系统。课堂上, 无声语言不仅作为有声语言的补充和延伸, 还起着有声语言不可替代的作用。创造性运用无声语言来进行评价, 有助于调动学生的积极性, 增进师生感情。在数学课堂教学中, 目光语交流是非常重要的。当某个学生听课认真, 回答问题积极时, 可以投去赞许的目光, 表示赞许或认可, 希望他们继续发扬。注意教师在运用目光语时要自然亲切, 使学生感受到教师对自己的爱护和尊重。

3、在指导思想上提出符合素质教育的以学生的综合语言能力发展为目标的评价理念;

确定了学生在各类评价活动中的积极的参与者、合作者的主体性地位, 否定了以学科知识体系为目标的评价思路。理顺了教学与评价的关系, 两者应是在共同的教育教学目标协调一致、互为促进的教学评价行为。评价的内涵得到极大扩充。评价不等于考试, 考试知识评价的手段之一, 同时, 完整的学校教育评价体系既包括对学生的阶段成绩和发展状态的评价, 也是包括对教师的教学行为、自身素质等方面的评价, 还包括对学校教学项目等办学情况的评价与评估。

4、运用学生自我评价或相互评价, 建立课堂形成性评价记

录卡评价卡成为了学生成长的履历, 激发着学生的成长、积极情感、态度和价值观, 每次评价都成为学生的生长点。合作学习的方式在数学课堂中极为普遍, 合作的小组成员之间的评价可以起到相互督促、相互学习的作用, 有利于激发学生你追我赶的上进心。评价的内容可以包括学习态度、学习策略等方面。通过评价使学生体会到努力程度、学习方法与学习效果之间的关系, 从中受到启发。

四

优化数学课堂教学评价方法教学活动是需要师生共同协调一致才能完成的多边活动, 评价的内容包括:教师评价、学生自评和小组互评, 评价的重点不再简单地重笔头考试、中卷面结果。通过引入形成性评价的理念与方法, 使教学评价的手段得到极大的丰富和扩展;使对学生学习过程的全面、自主性监控和调整成为可能。形成性评价使用得当, 将有利于学生反思和调控自己的学习过程, 形成适合于自己的学习风格和学习策略, 对学生的长远发展是十分有益的, 对于提高教师教学水平, 把握好教学方向都是具有引导性作用的。

评价时既要关注学生学习的结果, 更要关注他们在学习过程中的变化和发展;既要关注学生数学学习的水平, 更要关注他们在数学实践活动中所表现出来的情感、态度、个性倾向。教学评价是教学活动的一个重要组成部分, 它不仅可以及时对师生教与学的状况作出价值判断和量化评估, 而且对课堂教学起着直接的导向作用。科学的评价体系有利于促进教学目标的实现, 它对教与学的活动有着巨大的导向作用, 这是不争的事实, 评价的理念、目的、内容、标准、方式和手段等无一不对教学产生深远的影响。

摘要：教学评价是指依据一定的客观标准, 对教学活动及其结果进行测量, 分析和评定的过程, 其中包括对学生学习结果的评价。中职数学课堂评价的方法及运用, 对于优化的课堂教学评价系统, 引起人人关注学生课堂学习状态, 达到提高课堂效益, 大面积提高教学质量的目的是非常有益的。

关键词：评价,方法,运用

参考文献

[1]黄光清, 《高职数学教学要突出应用性》, 数理化实验。

[2]刘建明, 《数学学习困难生转化刍议》, 当代教育论坛, 2005年第3期下半月刊。

关于雨量预报方法的评价篇10

雨量预报对农业生产、城市工作和生活有重要作用, 但准确、及时地对雨量作出预报是一个十分困难的问题, 广受世界各国关注。我国某地气象台和气象研究所正在研究6小时雨量预报方法, 即每天晚上20点预报从21点开始的4个时段 (21点至次日3点, 次日3点至9点, 9点至15点, 15点至21点) 在某些位置的雨量, 这些位置位于东经120度、北纬32度附近的53×47的等距网格点上。同时设立91个观测站点实测这些时段的实际雨量, 由于各种条件的限制, 站点设置不均匀。

雨量用毫米做单位, 小于0.1毫米视为无雨:

(1) 建立数学模型来评价2种6小时雨量预报方法的准确性。

(2) 气象部门将6小时降雨量分为6等:0.1~2.5毫米为小雨, 2.6~6毫米为中雨, 6.1~12毫米为大雨, 12.1~25毫米为暴雨, 25.1~60毫米为大暴雨, 大于60.1毫米为特大暴雨。

2 模型的假设

(1) 假设位于东经120度、北纬32度附近的53×47的网格点是等距的。

(2) 将预测点和实际观测点看作质点。

(3) 如果预测点与实际观测点间距最近时, 就把预测点看作是实际观测点。

(4) 忽略由非自然因素引起的降雨 (如人工降雨) 。

(5) 雨量用毫米作单位, 小于0.1毫米视为无雨。

L:表示观测点与最近网格点之间距离。

X:实际观测点纬度。

Y:实际观测点经度。

X0:位于东经120度、北纬32度附近一个网格点纬度。

Y0:位于东经120度、北纬32度附近的一个网格点经度。

dis1:用第1种方法预测雨量。

dis2:用第2种方法预测雨量。

wu cha:雨量误差绝对值。

fang cha:各个时段雨量误差的总方差。

fan gan du:公众反感度的平均值。

aij:第i天第j时段实际测得雨量 (i=1, 2, 3……41, j=1, 2, 3, 4) 。

Aj:第1种方法测得第j时段公众反感度平均值 (j=1, 2, 3, 4) 。

Bj:第2种方法测得第j时段公众反感度平均值 (j=1, 2, 3, 4) 。

Cij:第i天第j时段公众反感度 (i=1, 2, 3… …41, j=1, 2, 3, 4) 。

Aij:第1种方法第i天第j时段公众反感度平均值 (i=1, 2, 3…41, j=1, 2, 3, 4) 。

Bij:第2种方法第i天第j时段公众反感度平均值 (i=1, 2, 3…41, j=1, 2, 3, 4) 。

dis1 (i, j) :第1种方法第i天第j时段预测雨量 (i=1, 2, 3…41, j=1, 2, 3, 4) 。

dis2 (i, j) :第2种方法第i天第j时段预测雨量 (i=1, 2, 3…41, j=1, 2, 3, 4) 。

3 问题分析

3.1问题1

依常识, 只要实际降雨量与气象台预报的降雨量相近, 就可判断该气象台预报的准确性。因此本模型可从实际与预报之间的误差着手建立。文中所给的预报点有2491个, 而实际观测站点仅有91个, 因此该模型可分3步分析:

第1步:从2491个预报点中找出91个与实际观测站最近的点。

第2步:分时段求出实际观测雨量对应的预测雨量的绝对值平均误差。

第3步:分时段求出预测雨量相对实际观测雨量偏离程度 (即方差) 。

以上3步均利用数学软件Matlab编程计算得出。

3.2问题2

在考虑方差因素的情况下, 也需要考虑公众的感受。例如, 气象部门预测某天某时段为小雨, 但实际下大雨甚至暴雨。因此公众的反感度将有很大差异。平均反感度越低, 雨量预报则更准确。所以, 综合公众的反感度与预报误差2个因素能更好地评价雨量预报方法。平均反感度可由数学软件Matlab计算。

4 模型的建立与求解

问题1: (1) 确定91个预测点由91个观测站点的位置, 利用欧氏距离确定与观测站点最近的91个预测点位置。

(2) 分析并统计出预测雨量误差由相关数据, 找出实际观测点对应的预测点雨量, 建立模型求出两者的误差。

(1) 第1种方法。

第1时段雨量误差绝对值:

第2时段雨量误差绝对值:

第3时段雨量误差绝对值:

第4时段雨量误差绝对值:

(2) 第2种方法。

第1时段雨量误差绝对值:

第2时段雨量误差绝对值:

第3时段雨量误差绝对值:

第4时段雨量误差绝对值:

可套用以上公式, 算出41天的雨量误差, 用Matlab编程对此进行求解。

(3) 利用相关数据, 求出4个时段雨量总方差。

第1时段:

第2时段:

第3时段:

利用数学软件Matlab进行求解可得结果为:

第1种方法:第1时段雨量误差绝对值为1.3228, 第2时段雨量误差绝对值为2.2165, 第3时段雨量误差绝对值为2.2165, 第4时段雨量误差绝对值为2.2165。

第2种方法:第1时段雨量误差绝对值为1.4153, 第2时段雨量误差绝对值为2.2978, 第3时段雨量误差绝对值为1.1074, 第4时段雨量误差绝对值为0.7249。

由以上结果可看出:雨量预报方法第1时段的方差值均比雨量预报方法第2时段的方差值要小, 因此可确定第1种雨量预报方法更为准确。

问题2: (1) 根据题目中问题2所述, 把公众的反感度划分为7个等级, 实测雨量与预测雨量误差造成公众不同程度的反感度。

求得2种方法4个时段反感度平均值。

第1种方法:第1时段公众反感度平均值:, 第2时段公众反感度平均值:, 第3时段公众反感度平均值:, 第4时段公众反感度平均值:

第2种方法:第1时段公众反感度平均值:, 第2时段公众反感度平均值:, 第3时段公众反感度平均值:, 第4时段公众反感度平均值:, 最后算出41天的平均公众反感度。

(3) 利用以上所得2种方法41天平均公众反感度, 求出4个时段平均公众反感度的平均值。

第1种方法:第1时段平均公众反感度平均值:fan gan du=, 第2时段平均公众反感度平均值:fan gan du=, 第3时段平均公众反感度平均值:fan gan du=, 第4时段平均公众反感度平均值:fan gan du=

第2种方法:第1时段平均公众反感度平均值:fan gan du=, 第2时段平均公众反感度平均值:fan gan du=, 第3时段平均公众反感度平均值:fan gan du=, 第4时段平均公众反感度平均值:fan gan du=

利用数学软件Matlab编程得到2种方法4个时段最后的反感度为:

第1种方法:第1时段平均公众反感度平均值为0.1686, 第2时段平均公众反感度平均值为0.2281, 第3时段平均公众反感度平均值为0.1825, 第4时段平均公众反感度平均值为0.1911。

第2种方法:第1时段平均公众反感度平均值为0.1710, 第2时段平均公众反感度平均值为0.2402, 第3时段平均公众反感度平均值为0.1865, 第4时段平均公众反感度平均值为0.1938。

综合雨量总方差和公众反感度2个因素分析, 由以上所有数据可以看出, 雨量预报方法1明显要比雨量预报方法2准确度高。

为了简化模型的复杂度, 在取预测点时, 采用较笼统的取点方法。选取与观测站点最近预测点, 然后直接利用这些观测点所对应的雨量进行分析, 会产生误差。

5 模型的评价和推广

该模型简单易懂, 思路清晰, 在判断哪种雨量预报方法更为准确时, 运用了方差和公众的平均反感度, 使判断的结果比较客观、准确、科学。模型具有很好的实用性, 不仅可以应用在雨量预报中, 还可推广到气象预报中的其他方面, 如:风力、气温、海浪等。

摘要：文章首先利用欧氏距离, 找出与观测站点距离最近的预报点, 然后将它们对应的雨量进行误差分析, 最后统计这些误差分时段得出各时段方差, 进而精地评价雨量预报方法。全面分析直接将实测雨量对应的预报雨量数据, 结合不同的误差造成公众感受 (反感度) 的不同, 将反感度分为7个等级。再分时段统计出所有等级反感度的平均值, 综合方差和反感度2个因素, 进而评价雨量预报方法。通过Matlab软件的模拟, 该模型与现实情况拟合较好, 可为气象预测部门提供一定的参考。

关键词：欧氏距离,方差,误差,反感度

参考文献

[1]姜启源, 谢金星, 叶俊.数学模型[M].3版.北京:高等教育出版社, 2005.

[2]甘筱青.数学建模教育及竞赛[M].南昌:江西高校出版社, 2004.

[3]飞思科技产品研发中心.MATLAB 7基础与提高[M].北京:电子工业出版社, 2005.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【评价的方法】相关文章：