英语成绩测试

2024-05-07

英语成绩测试(精选十篇)

英语成绩测试 篇1

国内相关研究始于90年代初, 这些研究借鉴了前人研究的得失, 在研究的深度和广度上均有所发展。国内的研究有的探讨熟练者与非熟练者在学习策略上的差别, 有的研究背景知识对听力策略的影响, 有的分析学习策略与听力成绩的关系, 但是专门探讨英语听力适合性问题的研究 (即:在什么具体情况下使用哪种具体的听力理解策略最合适最有效?) 还未见报道。基于以上认识, 本研究就听力理解经常使用的题型进行分析, 旨在探究1) 中国非英语专业大学生针对不同的听力理解题型, 在听力策略的使用频率上会有什么不同?2) 中国非英语专业大学生在该题型中所使用的听力策略与该题型的成绩是否具有相关性?

1 研究设计

1.1 调查对象

为了让受试对象具有一定的代表性及广泛性, 笔者选取了山西师范大学160名即将参加国家四级考试的非英语专业二年级学生参加了本次调查。他们是该校四个英语教学班的学生, 分别来自于心理学、公共事业管理、学前教育、汉语言文学、物理、化学、计算机科学与技术专业。

1.2 调查工具

调查工具有两个:“听力策略调查问卷”和“听力测试卷”

1) 策略调查问卷此问卷由笔者自行设计。问卷题目参考资料有三个:一是Oxford (1990) 的SILL, 即Strategy Inventory for Language Learning (语言学习策略调查表) , 二是Ming Yee Carissa Yong (1997) 对英语听力策略进行的分类, 三是文秋芳的英语策略调查问卷。整个问卷包括38个问题, 每个问题下都会设有两种不同的情况, 即做多项选择题时与做复合式听写时, 每个问题均采用五级选项。该问卷设计完成后, 笔者用SPSS13.0对其进行了因子分析和信度分析, 分析结果表明该问卷具有一定的效度与信度。

2) 听力测试卷一份CET-4试卷的听力部分, 总分为35分。选择四级试卷的听力部分作为测试卷的原因是四级是国家的权威性考试, 其试卷可以保证一定的信度与效度。

1.3 数据分析

2010年10月13日至20日, 接受调查的学生填写了调查问卷并参加了听力测试。由于笔者的问卷在每个问题下均有两种情况, 所以为了让学生更清楚的按照自己的实际情况填写, 并根据做题经历真实地回答在做不同题型时他们的不同表现, 我们让学生先进行听力测试, 然后再按要求填写问卷。问卷测试后, 笔者运用统计分析软件SPSS13.0对问卷所得数据进行分析。

2 结果与讨论

2.1 听力策略使用情况

在多项选择与复合式听写两种不同的题型中, 学生对十五种策略的使用表现出差异 (见表1) 。根据表1所示, 在多项选择题中计划与自我监控策略接近经常使用的程度。利用上下文、选择性注意、联想策略处于有时与经常使用之间。情感策略、推断、关键词、自我评估策略属于有时使用, 其他六种策略属于不常或很少使用的范围。而在复合式听写中, 计划与自我监控虽已达到经常使用的程度, 但还是不如在多项选择题中使用的频率高。选择性注意和情感策略处于有时与经常使用之间, 这个与在多项选择题中该频率使用段的策略有所不同。联想、推断、利用上下文、关键词和自我评估策略属于有时使用, 这个也与在多项选择题中有所不同。其余六项策略虽与在多项选择题中一样处于不经常使用或很少使用的范围, 但其中的形式策略在两种不同题型中的使用频率有显著差异。

根据SPSS的分析结果 (见表2) , 除了在高频策略排序上的不同外, 在多项选择与复合式听写中, 有四种策略的使用频率存在明显差异, 他们分别是计划、形式策略、利用上下文与情感策略。其中计划与利用上下文在不同题型两个策略使用频率的比较中, 其平均数均为正值, 这说明在多项选择题中这两项策略的使用频率要显著高于在复合式听写中;而形式策略与情感策略在不同题型两个策略使用频率的比较中, 其平均数为负值, 说明在复合式听写中这两项策略的使用频率要显著高于多项选择题型。

2.2 听力策略与听力成绩的关系

为了探讨听力策略与听力成绩的关系, 笔者对两者进行了相关分析, 结果见表3。

如表3所示, 在多项选择题中, 关键词策略和推断策略与成绩的相关性最高 (r=.31, p=.000和r=.29, p=.000) , 其次是自我监控策略 (r=.26, p<.01) 、计划策略 (r=.25, p<.01) 和情感策略 (r=.24, p<.01) 。在复合式听写中情感策略与做笔记策略与成绩的相关性最高 (r=.23, p<.0和r=.22, p<.01) , 其次是小结策略 (r=.17, p<.05) 和形式策略 (r=.17, p<.05) 。

以上结果说明, 如果要获得好的成绩, 不同题型应该选择不同的策略。多项选择题没有给出相关材料而且只读一遍的特点, 使得计划、推断、关键词成为必要。而复合式听写给出了一份具有十一个缺失项的听力材料, 这就要求学生根据录音内容补全缺失的部分, 所以在完成该题时做笔记、小结与形式策略就变得非常重要了。

3 总结

本次调查得到了以下结果:

1) 我国非英语专业大学生针对多项选择与复合式听写两种题型所使用的听力策略频率的排序具有一定的差异。

2) 与多项选择题与复合式听写题的成绩具有相关性的策略不是很一致, 除了情感策略与两类题型都具有相关性外, 其他具有相关性的策略都是不相同的。

以上研究结果对听力教学与策略培训有一定的启示:

通过这次调查, 笔者发现学生在多项选择题与复合式听写题中经常使用的策略与跟该题型成绩相关的策略不是很一致, 也就是说学生在做这类题型时所使用的策略并不完全是正确、恰当、对取得好的结果有帮助的策略, 所以在今后的教学中教师应根据不同题型的特点对学生的策略使用给予指导, 使学生知道在什么具体情况下使用哪种具体的听力理解策略是最合适最有效的, 从而提高他们的听力水平。

摘要:该研究采用定量分析的方法, 对160名山西师范大学非英语专业学生在多项选择与复合式听写题中所使用的策略情况进行调查, 结果发现: (1) 学生使用听力策略的频率受题目类型的影响; (2) 听力多项选择题和复合式听写的成绩与听力策略显著相关。

关键词:听力策略,听力成绩,相关性,不同题型

参考文献

[1]Cohen A D.Strategies in Learning and Using a Second Language[M].London and New York:Addison Wesley Longman Limited, 1998.

[2]Krashen S D.Principles and Practice in Second Language Acqui sition[M].Oxford:Oxford University Press, 1994.

[3]Malley J M, Chamot A U.Learning Strategies in second Language Acquisition[M].Cambridge:Cambridge University Press, 1990.

[4]程晓堂.英语学习策略[M].北京:外语与教学研究出版社, 2002.

[5]黄子东.西方二语/外语听力理解策略研究述评[J].外语界, 1998 (2) .

谈校内大学英语口语测试成绩评定 篇2

【关键词】口语测试;形成性评估;终结性评估

Abstract: At present, College English reform is under way, with the emphasis on the speaking ability.It is worthwhile to attach importance to the scientific way to test students’ speaking ability by the end of a term in order to serve and promote teaching.The paper explores the nature of the oral English term-test, and points out theapproach to grading should be the integration of formative assessment and summative evaluation.Furthermore, the paper elaborates on key factors in summative evaluation.Key words: oral English testing;formative assessment;summative evaluation

1.引 言

在教育部新近颁布的《大学英语课程教学要求》中,听说能力的培养被放在了重要的位置。在新的教学目标中,口语教学成为了英语教学不可缺少的一部分,各大院校纷纷专门开设口语这门课程。这反映了社会之所需,时代之所趋,学生之所求。自从1999年5月大学英语开始在八个重点院校试点口试到今天,改革后的四、六级模式基本上反映了大纲中“语言测试应重点考核学生的语言基础和语言应用能力,要采用一定比例的主观试题”的要求。考试的目标不仅把语言看成一种知识体系来测量而且也强调对学生实际运用语言能力的直接考查。对于CET-SET(大学英语四、六级口试)更是如此。随着CET口语测试在全国范围内展开,各院校的口语测试的实施也在进行中。目前,据笔者所知,一般院校的教师大部分缺乏组织口语测试的经验和方法,对学生口语成绩的评定带有很大的任意性,缺乏科学的指导与规范。另外,关于测试方面的研究文章也多涉及大规模的测试,对于与一线教学有关的校内阶段性成绩测试或诊断性测试研究方面的论述甚少。本文将讨论校内英语口语测试的定位,以及如何科学公正地考察学生的口语成绩。

2.校内英语口语测试的定位

教、学和评估三者的结合体现了课堂教学的完整性。英语口试是语言交际能力测试的重要手段,考查的是学习者运用英语作为一种交流思想的口头工具的表现。它通过“说”这一言语行为测量学生实际运用语言进行交际的能力。作为校内英语口语测试,有别于大规模的CET-SET。校内英语口语测试是大学英语教学的一部分,不是全国统考。学生口语测试的学期成绩模块应该是形成性评估模块与终结性评估模块的有机结合。

形成性评估建立在正式和非正式评估方式之上,具有持续性特点,与诊断性测验直接相关。教师采用该评估方式作为正常教学和学生学习过程的有机部分,以便指导、促进学生的学习和理解。形成性评估注重学生的学习过程,强调活动过程的连续性、多样性。通过测试,教师可以迅速获取学生学习的反馈信息,从而作出判断,及时对教学内容予以调控。通过测试,学习者不断获得成就感,增强学习的自信心。

终结性评估是在学期末或学年末,针对某一课程进行的评估,它提供信息说明学生所学多少,比如,就测验结果得出的学生掌握状况和熟练程度。目的是做出教育效果的判断,从而区别优劣、分出等级或鉴定合格。终结性评价考察最终效果,因此它是对教育活动全过程的检验,一般在教育过程结束后进行,是用来对学生的学习做出结论和判断,或者用于证明和选拔的。CET-SET属于终结性测试,学生口语测试的学期成绩模块中的一部分也应该包含着终结性评估模块。

3.形成性评估模块

传统的大学英语口语对学生成绩的评定大多采用的是终结性评估。不可否认,通过该方式,教师能从某些方面检查学生的学习情况,但同时也存在着一些问题,如,教师不能对学习过程中的问题进行充分的、及时的分析和解决。相反,形成性评估的任务是对学生日常学习过程中的表现、所取得的成绩等做出评价,激励学生学习,帮助学生有效调控自己的学习过程,目的是使学生获得成就感、增强自信心。在教学过程中,教师可以加强对学生在学习过程中语言应用能力发展情况的检测。形成性评估可以使学生脚踏实地实现一个个分目标,可充分发挥其引导大学英语教学改革的作用。在平时教学过程中,教师可对学生英语口语能力进行评估,检查学生是否具备一定的口头表达能力,了解学生在口语表达方面的已有能力、欠缺和学习需求,看他们是否能够就某些交流性主题或交往场面、情景进行合适的表述,帮助学生进行自我分析、诊断,以利于他们的后续学习。

形成性评估有利于全面整体性地评价学生,在很大程度上冲淡了主观性极强的终结性口语测试;在另一方面,它还可以诊断教学活动中的问题,发现教学活动的症结,及时调整教学。所以,在整体的教学活动中它应该发挥重要的作用。

形成性评估的形式灵活多变,呈现的是一个多维的、立体的画面。该画面是具有动态性,不仅教师能看到学生的发展、变化和成长,学生也能从中看到自己的不足与取得的成就。它与学生课堂行为表现密切相关;可以是分散式也可以是集中式;可以是团队进行,也可以个别评测。在课堂教学的具体实践中,教师可以通过课前五分钟的值日生汇报或一至两组对话表演小剧的不同角色替换进行;也可以通过社会实践,如记者采访,英语购物等形式进行,目的是让不同层次,不同类型的学生都有机会在口语教学评测的实践中展现自己的才华培养自己的兴趣,树立自信心,为大胆说英语打好基础。

形成性评估可以把学生的外在压力的影响降低到最低限度。学生可以采取自评、互评的方式,参与评测全过程,变被测为自测。从根本上、客观上把学生从被动地位转向主动地位,充分体现主体参与性。在经常有准备的口语教学评测中,学生接受口语评测的心理负担减轻了,胆量也增大了。口语评测本身变成了一种学生与学生之间的人际交往和再学习的过程。使语言学习的效率大大提高。而且,这种形成性的口语评测的实施也切实为终结性口语评测打下了夯实的基础。形成性评估不仅是教师对学生的评估,更是学生自身的一次次学习和实践的机会,也培养了学生合作精神,提高学生语言运用能力的过程。

随着语言教学的不断改革和进步发展,形成性评估作为一个完整的语言评测体系中不可缺少的一部分,应该在教学中得到进一步的加强,这对将来英语口语教学,学生英语口语水平的提高,有着不可估量的作用与价值。

4.终结性测试模块

作为语言教学的工具,测试必须作为系统化、科学化。在各种语言测试中,口语能力的测试是困难的、复杂的。只有在准备、组织、评定等方面作周密而细致的工作,才能使测试结果具有信度和效度。由于口语测试本身带有主观性、任意性和随机变化性,测试过程又隐含一些不稳定因素:被测试对象的心理状态、测试者的主观任意性、测试内容的模测试方法及其外界干扰等,这些都会因此影响测试的信度与效度。信度和效度正是科学的语言测试的两个根本要求,只有具备了这两个度,才达到了语言测试的目标。从测试的结果、目标来看,语言测试涉及三大部分:测试结果、所测试的行为和目标能力。测试结果和所测试的行为之间的关系决定了语言测试的可靠性或可信程度,即信度,它表现为测试结果的一致性与稳定性。所测试的行为和目标能力之间的关系决定了语言测试的有效程度或正确程度,即效度。口语测试的包括四个关键环节:被试、任务、考官和评分标准。口语测试应采取多样化的方法,真正体现口语测试的价值。

4.1 被试

考试对被测试者或多或少都会产生一种心理压力。口语测试需要面对面地交谈和即时表达,对考生来说,心理紧张程度明显高于其他测试形式。有时进行测试,教师的一言一举,甚至一个表情或语调的变化都会给被测试者造成一种无形的焦虑,影响测试的进行,也影响测试的信度。所以,每一位测试教师都应了解考生的个体差异,尽量使考生消除紧张状态。

4.2 任务

语言是交际的工具,口语考试要准确地反映口语交际的能力。设计口语考试应达到考虑以下因素:

(1)提供现实生活中真实的交际场景。

(2)充分体现语言交际的交互性。

(3)测试的出发点是提供或获取信息,非语言形式。

校内口语测试的指导思想应该与《大学英语课程教学要求》所要求的目标和方向一致。口语表达能力的一般要求如下:能在学习过程中用英语交流,并能就某一主题进行讨论。能就日常话题和来自讲英语国家的人士进行交谈。能就所熟悉的话题经准备后作简短发言,表达比较清楚,语音、语调基本正确。能在交谈中使用基本的会话策略。较高要求的英语口语能力标准是:能够和来自英语国家的人士进行比较流利的会话,较好地掌握会话策略,能基本表达个人意见、情感、观点等,能基本陈述事实、事件、理由等,表达思想清楚,语音、语调基本正确。

在大学英语学习阶段,英语课程的总体目标是培养学生的综合语言运用能力。综合语言运用能力的形成是建立在学生语言技能、语言知识、情感态度、学习策略和文化意识等素养整体发展的基础上,口试的目标必须与此相一致,把考查目标能力,即检测学生的实际运用语言的能力作为测试的目标和指导思想并依此制定考试大纲。

试题设计是大纲的具体体现,是测试指导思想的载体,其内容是否能体现测试的指导思想,是测试效度的保证。因此,试题设计应以教学大纲为依据。试题设计的每一部分,都从考点、素材、题型、命题四个角度来谈。其基本思路是这样的:设计试卷时首先应该确定各部分需考查的内容,考查内容要覆盖学科的主干内容, 紧扣教学大纲和教材,并为考查到这些内容应该选择一些恰当的材料,选取适合不同测试情景的题型,最后则是筛选出能够测试目标的试题。

4.3 考官

在测试的场所中,考官不仅仅是考官,还是引导者、促进者,考试场所应是一个双向的语言交流场所,考生能在轻松愉快的谈话氛围中进行交流。语言测试的非自然性因素被减少到最低程度,这样学生的实际语言运用能力也就可能得到最大限度的真实再现,测试的效度就能得到保证。在测试中, 摆在考官面前的一个首要的问题是营造一个互动的、宽松的会话环境和气氛,让考生放下包袱,自如地发挥真实水平。考官的提问用语要自然简洁、口语化、准确无误。如果有可能的话,可由二位考官或多位考官参加测评。由多位考官参加评分可提高评分的可靠性和稳定性,但不同评分者的评分标准也会影响测试的信度,这就要求考官与考官之间保持评分一致,也要求同一个考官自身保持前后评分一致。如果同一考官测试前后所持的标准不一致,或不同的考官之间使用不同的评分标准,那就会在很大程度上削弱测试的可靠性。如何做到考官与考官之间保持评分一致,这可能需要口试考官进行统一培训,统一的培训可达到标准化,从而避免考官语言的难度和提问的焦点出现偏差,确保所有考生受到公平和平等的待遇。考官的语言表达的方式应被严格控制,以确保考生以同样的方式接受同样难度的提问。

4.4 评判的标准

如前所述,口语测试是主观型测试,对测试结果的评分需要评分人员的主观判断并受评分人员主观因素的影响。口语测试在很大程度上取决于是否有正确的统一的评分标准。根据大学英语教学的情况,可以采用两种常用的评分方法:整体评分法和分解评分法。保证测试的评分标准的稳定和一致,可采取制订统一的评分标准。采用百分制评分法或分解评分法(analytic scoring)与主观性较强的整体评分法

(holistic scoring)相结合。具体做法是:整体评分是总体的印象分,可从语言知识,连贯性,完成任务的优劣,交际方式恰当与否等角度来考察;分解评分标准可从语法与词汇、语音和互动交际等方面分项打分。这样细化评分标准,对评判不同分数段提供细致而周密的规定,可以使评分有具体的尺度,考官在评分时能有据可依、有据可查。采用两者相结合的方式,可正确处理好“宽”与“严”、精确与模糊的关系,从而最大限度地减少考官评分的主观性,而保证测试的信度。

5.结语

考试如同指挥棒,在教学中起到的作用是至关重要的。语言测试是为语言教学服务的。语言教学的任务是培养实际运用语言的能力,语言测试的任务则是正确评价运用语言的能力。测试作为教学过程的一个重要环节,如果设计科学、合理,会对教学产生有益的促进作用。我们必须承认,目前我国大中院校的学生口语的现状不容乐观,改进课堂教学,提高学生的实际运用英语的能力,行之有效的方法是加强测试的系统化,尤其是与教学更为紧密相关的校内英语口语测试。

参考文献

英语成绩测试 篇3

【摘 要】运用统计学知识对各类教学课程的测试成绩进行统计分析能客观有效地评价教学效果,促进教学改革。本文以湖北民族学院2014年12月份大学英语四级成绩为例证,对该校英语教学进行实证研究,分年级统计分析了测试成绩的百分比等指标。结果表明:该校二年级学生测试成绩最优,四年级又略优于三年级。最后,从教学氛围、课程设置等方面对统计结果进行了分析并给出一定的教学建议。

【关键词】大学英语     测试成绩

一、引言

在经济全球化发展的今天,英语能力水平的高低已经成为用人单位评价人才的重要依据。英语教学是当今各高校最重要的教学课程之一,大学英语课程教学的研讨和改革已成为众多学者的研究热点。同时,基于统计学的相关知识对英语教学效果进行评价也越来越受到重视,例如余礼娜等对大学英语分级教学的统计分析、柳映湖对多媒体英语教学效果的统计分析。

但是,在大学英语教学中,分年级从统计分析的角度对教学效果、教学方法进行探讨并不多见。然而,无论哪个专业,不同的年级都有各年级的培养目标。在这些不同的情况下,学生的外语水平在不同年级都存在一定的差异,而且目前很多高校都只在大学一、二年级设置英语的课堂教学,其余年级以课外自主学习为主,所以分年级对教学效果、教学方法进行探讨,对各年级英语水平的测试和评价有重要作用,可以一定程度反映出目前课程设置的效果,以及给教学管理者和教师带来一定的启示。要对大学英语教学进行统计分析,最重要的是选取合理的样本。大学英语四级考试(CET-4)则具有这样的合理性。它是由国家教育部高等教育司主持的全国性教学考试,已成为衡量一所大学英语教学水平和大学生英语掌握程度的重要标准之一,英语四级也成为大学生在社会上求职的一个最基础的证明。

湖北民族学院是一所地方民族院校,地处武陵山区——恩施州土家族苗族自治州恩施市,生源英语水平相对比较差。该校英语教学模式为大一、大二学生设置课堂教学集中授课,其余年级学生以自主学习为主,学校也开设了诸如“英语角”“英语电台广播”等课外学习园地。本文对该校最近2014年12月份大学英语四级成绩分年级进行差异性分析,选取百分比为指标,比较发现,大二英语成绩最优,大四次之,大三最低,其原因与教学设置、各年级学习氛围都有一定的联系。

二、样本基本情况

样本选取为参加2014年12月份全国统一组织的大学英语四级考试的湖北民族学院的大二、大三、大四学生。 学生来自医学(五年级除外)、农学、师范类、工程类、经济管理类等各学科专业11643人,其中缺考1864人,医学专业五年级报考人数为184人,除去大五及缺考学生的成绩,共有9595个有效成绩。以此为样本值,对一个年级成绩做比较分析。为直观有效地比较各年级的成绩值,选取百分比为比较指标,并将本次成绩分成甲(总分数的80%以上)、乙(总分数的79%-60%)、丙(总分数的59%-50%)、丁(总分数的50%以下)四个等级。

三、数据统计与分析

1.数据处理

首先用Excel 2007版软件对样本按年级进行分类,然后对各层级数据进行统计,得到全体学生分等级结果、大二、大三、大四学生分等级结果分别如表1、表2、表3、表4所示。

表1 全体学生CET-4成绩各等级上的人数及百分比 甲等 乙等 丙等 丁等 总计

人数 25 2032 3532 4006 9595

百分比 0.26% 21.18% 36.81% 41.75% 1

表2 大二学生CET-4成绩各等级上的人数及百分比

甲等 乙等 丙等 丁等 总计

人数 17 1621 1865 1999 5502

百分比 0.31% 29.46% 33.90% 36.33% 1

表3 大三学生CET-4成绩各等级上的人数及百分比

甲等 乙等 丙等 丁等 总计

人数 2 281 1169 1473 2925

百分比 0.07% 9.61% 39.97% 50.36% 1

表4 大四学生CET-4成绩各等级上的人数及百分比

甲等 乙等 丙等 丁等 总计

人数 6 130 498 534 1168

百分比 0.51% 11.13% 42.64% 45.72% 1

2.对比分析

从表1的数据统计来看,该校考生CET-4成绩在乙等以上的只占到了21.44%,绝大多数考生的CET-4成绩集中分布在丙等和丁等,占了总人数的78.56%。从总体的分布情况看,本次英语四级考试成绩并不高。对比表2、表3、表4,大二考生CET-4成绩在乙等以上的比例最高,为29.46%,高出平均值8.28个百分点,大四次之,为11.13%,大三最低,为9.61%。从丁等的成绩分布来比较,则刚好是大三学生比例最大占50.36%,而大四次之,为45.72%,大二的比例最小,为36.33%。表3、表4的结果表明:从本次测试成绩来看,大二学生英语成绩最优,大四学生又优于大三学生。

四、成因分析及教学思考

1.成因分析

英语能力的提高需要长时间的积累和训练,语言的学习绝不可能一蹴而就。学生的大学英语成绩受学生以前的基础影响较大。湖北民族學院为一所地方民族院校,生源来自全国各民族,而且偏远山区生源占有相当大的比例,相比发达地区而言,学生的英语基础就薄弱很多;而且到大学专业分类后,英语学习没有再像高中要参加高考那样得到学生的重视,有部分学生除了在英语课堂上学习英语外,课外几乎没有接触英语。这是导致本次英语测试成绩总体不高的重要原因。

分年级来看,大二学生的测试水平最优。从该校的课程设置看,各专业在大一、大二均以通识课程为主,学生少了专业课程的压力,更重要的是大一、大二阶段设置有英语课堂教学,学生可以得到英语老师的专业教育和辅导,自然呈现出较高的成绩。 大三、大四考生的成绩较低,其一是本身这些考生的英语基础相比较而言要更薄弱一些,因为多数在大二年级就已经通过国家英语四级考试(425分及格)的学生是不会再参加四级考试的。大三、大四专业课更多,学生的专业课程压力更大,同时又没有了英语课堂教学的训练,所以测试成绩就相对要低。

通过这次统计分析,可以得到一个有趣的结论:四级测试成绩并不是和年级高低成反比,因为大四学生反而比大三学生的通过率更高。通过查阅该校的课程设置发现,绝大多数专业大三是专业课最多的学年,课程任务相对更为繁重,学生在忙于专业课的同时很少花时间在学习英语上面。另外一个重要方面是,相对于大三学生,大四学生临近毕业,马上就要面对申请学位的问题,而该校学位毕业条件需要英语四级测试成绩达到一定的程度,因此大四学生在这种紧迫感之下,会更加倾向于自主学习英语。

2.教学思考

大学课程学习更加强调学生的自主性,这就要求学生要自主地重视英语能力的培养,要把英语学习提高到与专业课程学习同等重要的程度。同时,教育管理者和教师也要让学生意识到专业能力只有得到英语能力的辅助后才能在当今全球化的格局中有施展的舞台。

前面的分析说明,课堂教学的设置和毕业学位申请的压力是能够促进学生学习英语的。因此,在条件允许的情况下延长英语课堂教学的设置年限,坚持甚至是逐步提高学生申请学位的英语水平条件,都能够促进学生英语水平的提高。

【参考文献】

[1]曾玲.应用型大学英语教学改革探索[J].湖北经济学院学报(人文社会科学版),2014(11).

[2]张璐.提升文化软实力视角下的大学英语人才培养探论[J].学校党建与思想教育(下),2015(1).

[3]原嫄.大学英语考试改革具体实施和成效[J].时代教育,2014(7).

[4]周桂莲.我校2011年—2013年的大学英语四级成绩分析[J].吉林化工学院学报,2014(10).

[5]余礼娜,庞小琪,王科.高职高专大学英语分级教学探讨及统计分析[J].成都电子机械高等专科学校学报,2008(3).

英语成绩测试 篇4

一、体育专业学生英语水平状况

一般来说,在大学中体育专业学生英语水平普遍较差。这是由多方面的因素造成的:首先,考入大学的体育学生有两类,一类是经过高考考入大学的,这类学生很大一部分选择体育不是因为喜欢体育,而是因为学习成绩差体育专业录取分数低容易进入大学;而另一类是体校等中专生考入大学的,这类学生文化水平比较低,有些甚至没怎么接触过英语。另外,体育专业学生课程大部分是训练课,都是高强度、高运动量,这样,学生的体力精力消耗很大,难以投入到英语学习上。除此之外,学校对于体育专业学生的英语水平要求也不高,只需达到英语三级水平。并且,部分学校体育专业还规定只要参加全国比赛获奖就可以加分获奖学金,因此,在这种情况下体育专业学生对英语这类公共课程并不重视。这些情况都导致了体育专业绝大多数学生的英语水平过低。

二、大学英语成绩测试的重要性及其目前存在的问题

对于英语教学来说,测试是一个必不可少的环节。成绩测试是依据某一教学大纲及其相应的教材内容和要求来命题对学生进行检查的测试,是“用来考查个别或全体学生在学习外语的某一阶段或最终阶段的成功程度”(束定芳、庄智象,1996)。它包括了“期末测试和阶段性测试”(Hughes, 2000:10)。如本文开头所讲,非英语专业大学都要参加两种测试,大学英语四、六级考试及学校组织的校内考试。本文所谈的便是指校内考试,包括期中测试、期末考试等。

成绩测试目的在于检查和评定学生在一个教学阶段里学习上所取得的成绩,看其在教学大纲和教材所要求的范围内,外语水平达到的程度。研究表明:“有效发掘、延伸期末考试的正面反拨作用,可实现英语教学向课堂外延伸,帮助学生形成正确的学习方法,提高英语运作能力。”(赵亮,2002)“成绩测试不仅可促进学生对课本知识的掌握,而且有利于提高他们的整体语言水平”(原萍,2002)。

由此可见,成绩测试在大学英语教学中起着举足轻重的作用。在大学英语教学中,如何科学地运用成绩测试是必须解决的问题。刘润清(1991)说过,“有些语言教师开始掌握语言测试的理论和方法,也设计出了一些比较成功的试卷。……但从全局来看,我国的语言测试还相当落后”。目前,我国的大学英语成绩测试仍然存在一定的问题,设计试卷的科学性和测试结果的可靠性仍然难以得到保证。比较常见的情况是题型设计的不合理。如一些院校为了保证评分更加“方便、快捷、公正”,把试题大都设制成多项选择题,这就产生了很大的弊端,Hughes (2000:60-62)在谈到多项选择题时列举了其存在的六个方面问题:1)只能检测应试者的语言识别能力,不能全面真实反映其语言应用能力;2)猜测成分很大且难以确定其在得分中所占比值;3)严重限制了测试内容;4)设计出成功的题项很难;5)反拨作用往往不好;6)考生作弊更容易。

那么,在下面一节,本文以某校一份期末试卷为例,结合体育专业学生的英语学习状况,对该试卷进行了信度和效度分析。

三、信度与效度分析

这份试卷是2008年12月体育专业学生的期末试题。现将试题概况列表如下:

LC=listening comprehension, RC=reading comprehension, VS=vocabulary and structure, CL=cloze, WR=writing, M/C=multiple choice, O=objective test, S=subjective test

1. 信度分析

信度和效度,是衡量学期成绩测试质量高低最重要的指标。信度指的是测量数据和结论的可靠性、稳定性程度,也就是考试结果的可靠性,即测量的结果是否真实客观地反映了考生的实际水平。李筱菊(1997)认为,信度就是测试的结果是否可信。可信的测试结果应该能够准确地反映测试参加者的能力。准确地说,语言测试的信度就是测试结果对测试者的表现而言有多可信。影响测试信度的因素很多,就试题本身来说,信度取决于测试范围与题量;而评分的信度则取决于评分标准的客观性和准确性。

先看这份试卷的测试范围。这次试题对学生各个方面的能力都进行了考核。听力部分考核了数字、地点、人物关系等。阅读部分包括了推断题、主旨题、词义题、态度题等。词汇与结构部分主要考查了动词短语的用法、介词短语与其他词语的搭配,同义、近义词辨析等。完型填空部分是选词并用适当形式填空,主要考查了学生的理解能力,及其对词型变化的掌握。写作部分则是要求学生对目前学校进行的每学期一次的口语考试提出自己的看法,学生联系实际状况,与目前形势结合,以所学知识各抒己见。从题量上看,这份试题共有5大题81小题,考试时间定为2个小时。对于大学二年级的学生来说,即使是英语水平较差的体育专业学生,这次考试的题量和时间安排也是比较合理的。从评分标准来看,如表中所示,这次考试试卷的组成中客观题占了85%,主观题只占了15%,可以说,评分很大程度上兼具了客观性和准确性。

这样看来,这份试题的信度似乎比较高,但是,认真看这份试卷,发现阅读理解部分2篇文章选自课本后TEST阅读理解原文,另外2篇来自2002年大学英语4级考试阅读理解原文。课文中原文会使学生更方便作弊,而且学生可能会将答案记住参加考试而不是真正去阅读,4级考试的题目又远远超过体育专业大多数学生的英语实际水平,这样的测试并不能真实反映学生英语学习情况,不能达到测试的目的,测试可信度很低。还有完型填空部分,选自课文原文选段,测试的结果并不真实。

2. 效度分析

Henning (1987,引自Alderson, 2000)将效度定义为:“效度通常是指测试的恰当性或者测试的任何组成部分发挥出其测量的作用。有效的测试应该能够测试出其应该测试的东西。”他认为测试有各种作用与目的,不应该错误使用测试,如果错误使用了,测试就失效了。效度的概念有几个方面内容效度、标准相关效度、结构效度、表面效度等。其中内容效度是最重要的,如果测试内容不能测试被测试者的能力,那么这个测试就失去效度。内容效度研究有以下几个方面:测试内容是否和测试目标有关;测试内容是否有代表性;测试内容是否全面地、充分地体现了要考查的各方面内容;试卷中是否有足够的题目去体现所要考的各方面内容;测试内容是否适合测试对象等。

这份试卷的测试对象为大学二年级体育专业学生;测试目的是检验学生对本学期教学内容的掌握情况,了解学生在这一学期学习之后的英语水平;测试的范围是上海外语教育出版社出版的《大学英语精读》第二册5—10单元及第三册1—2单元。

试题听力部分分两种题型,Section A要求学生听10段简短对话,每一对话一道题目,Section B要求学生听3段小短文,每段短文3—4道题目。听力原文中并未出现生单词,且语法项目与学生学过的内容基本保持一致,仅在答案选项中有个别生单词,但是并不影响学生选择正确答案。因此,该部分的考核存在比较高的效度。

第二部分阅读理解,一共四篇文章。阅读理解题着重考查学生对语篇的理解,它能够考查学生根据所提供的语境提示,综合利用信息解决实际问题的能力。这四篇文章内容涉及多个领域,但是作为一次成绩测试,这四篇文章并不能反映学生的真实水平。Passage 1和Passage 2是《大学英语精读》第二册“Test yourself 2 (Units 6—10)”中选取的两篇阅读理解文章,并且题项完全相同。学生对于这种课堂上已经做过的题目在考试中只需凭自己的记忆选择正确答案即可。若是学生提前从老师口中得知考试题目会从课本Test中选取,学生会死记硬背正确答案,考场上找到对应的选择。并且,这样的题目更方便了学生作弊,产生不良后果。而Passage 3和Passage 4选自2002年1月大学英语四级考试,大学英语四级考试属于水平测试,而这份试题是期末考试,也就是成绩测试。选取四级考试的题目与测试目的不符合,并且,对于体育专业大多数学生而且,四级考试题目远远超过了他们的英语水平,并不能真正检验学生的英语状况。因此,阅读理解部分效度过低。

第三部分词汇与结构,共30题,有18道题目与本学期教学内容符合,均选自《大学英语精读》的课件中对重要词汇短语的讲解例句。余下题目考查了一些比较基础的语法知识,如动词时态的使用、连词的使用等。对于体育专业学生来说,这样的题目难易适中,既考查了学生对课堂讲解内容的掌握情况,也对其基础知识的了解进行了检验。因此,这一部分有效度较高。

第四部分完形填空,出题者选取了课本Unit 10的课文第4, 6, 14自然段,将这几小段组成一篇短文,让学生从给出14个单词中选择恰当的单词并用适当的形式补充短文空白处。需要补充的地方都是一些形容词、名词,没有对一些如介词短语搭配等进行考查,学生只是凭记忆选词填空,并且这样使学生更方便了作弊。这部分的测试并不科学,效度极低。

最后部分写作,题目为“Is a Test of Spoken English Necessary?”要求学生写100个词以上。对于体育专业学生来说,这个题目比较接近他们的实际,他们有一些自己的看法,能够有话说,而100个单词对于大二的学生并不困难。因此,作文部分能够比较有效地考查到学生水平,效度较高。

四、结语

总的来说,这份试卷设计并不科学,信度和效度都较低。对于体育专业学生,要根据他们的英语实际水平,设计有质量的科学合理的试题,从而能够真实有效地检验和考查他们的英语学习状况。

参考文献

[1]Alderson, J., Clapham, C., and Wall, D.Language Test Construction and Evaluation, Beijing:Froeign Language Teaching and Research Press, 2000.

[2]Hughes, A.Testing for Language Teachers, Beijing:Froeign Language Teaching and Research Press, 2000.

[3]李莜菊.语言测试科学与艺术.长沙:湖南教育出版社, 1997.

[4]刘润清, 韩宝成.外语测试和它的方法 (修订版) .北京:外语教学与研究出版社, 2000.

[5]束定芳, 庄智象.现代外语教学——理论、实践与方法.上海:上海外语教育出版社, 1996.

[6]原萍.成就测试对外语教学的正面反拨效应.外语教学, 2002, (4) :18-21.

测试成绩分析及反思 篇5

本次测试针对范围:前四单元。

分值100分,分为六个大题,27小题,题量过少。

试题难度:适中。考查效度:较差。

针对第一单元简易方程部分23分;第二单元多边型面积部分39分,第三单元因数与倍数22分,第四单元16分。

针对本学期前四单元重要知识覆盖率偏差大,方程作为重点部分考察题目过少,且题目分数过于集中。因数与倍数和正负数部分题目较多,分值过重,考察点相对较少。

二、学生成绩、出现问题和出错点:

一班优秀率32%,而且高分质量较高,但是优秀学生后面分数断层大,两级分化,待提高的学生较多,分数低;合格率58%,不及格人数集中在55分-50分较多。

二班优秀率22.7%,高分质量较一班差,分数无明显断层但,两极分化,待提高学生较多,且分数很低;合格率58%,不及格人数分数集中在55-40分较多。

1.填空:

(1)分解质因数出错较多。这类题需要复习且在练习中纠正。2分

(2)梯形内最大正方形面积属于中档偏上题,需要在课堂中特别作为难点通过作图讲解。2分

2.判断:

(1)等式性质1理解出错,需要对性质1和2进行辨析。2分

(2)自然数中质数和合数部分,1作为特殊,出错较少,仍需提醒。2分

(3)平行四边形的拼成,需要学生亲自操作,作图交流。2分

3.选择:

(1)质数奇数部分简单但知识点繁琐,需要在复习过程中有针对性的全面练习。2分

(2)正负数比较大小、三角形和平行四边形面积关系出错较多,需要了解下学生的理解情况。4分

4.解方程:

解方程3个题虽然都有学到练到,但偏向初中一、二年级学生习题难度。仍应坚持在课本习题难度上进行练习。12分

5.求面积:

学生出现的.问题是搞不清楚哪条边是底、高,这个应从定义出发,基础练习。10分

6.应用题:

(1)学生不看完题就做,未按照要求用方程解题;或者设、列式错误,此类题目必须通过一定的复习和归纳进行掌握。7分

(2)学生落入题目设计的陷阱,把“1格”当成1米。4分

(3)学生应试能力较差,不会尽力多得分而是找省劲,结果答题不全丢分。4分

(4)反映出计算能力较差,应该在平时的练习中注意学生这类问题的解决,让学生引起重视。8分

(5)不规则图形面积求法,学生基本能认识到,但方法不当。不能想到做辅助线,未在图上进行有效标示,结果做题时间长且做不对。针对此类高档题,需要在练习、作业上重重考察,找到学生的思维漏洞,这类题虽然难,但学生能多拿几分。9分

三、针对教学的反思

1.针对复习:

学生对基础知识重点遗忘较严重,需要在课堂上先行对知识点进行引领概括复习,再针对各个知识点进行练习巩固。雪需要学生自己思考的给予思考时间,或者讨论解决,并一定及时当堂提问或者练习检查是否掌握。

2.针对继续教学:

学生对知识点理解深度决定思维深度,在教学时减少教师引导时间,多给与学生思考讨论时间,尽量让学生多发现问题,多解决问题。先习题不必严格按照课前准备,可根据学生随时发现问题给予针对练习。

知识点较多较繁琐,难记忆,一堂课全部讲解完则练习时间较少的,直接改成2堂课,分别教学,分别针对练习巩固。

3.针对学生作业:

英语成绩测试 篇6

【关 键 词】 女生;800米测试成绩;现状;分析

随着人们生活水平的提高,心血管及心肺疾病越来越年轻化,有专家指出,改善这两大系统功能的最佳体育活动项目是坚持中长距离跑。因此,在对女生健康体质测试耐力项目中,绝大部分学校都选择800米。由于办学特色和专业导向,我校学生90%以上的都是女生,在耐力测试项目上同样也选定为800米。然而从对近三年测试成绩的比对分析,以及对老师、学生的问卷和访谈,我校女生耐力成绩不容乐观:学生对800米训练及测试认知不够,参与情感态度有待提高;少数老师重视不足,教学训练执行力度不够;鉴于某些客观原因,学校没有提供充足的场地器材需求等。

一、研究目的

通过对学生800米训练情况的总结了解,以及对近三年学校测试成绩的分析比对,寻找学生惧怕800米测试、成绩不够理想的原因,力争用有效的训练手段改善不利局面,更好地完成学生健康锻炼、达标竞优的学校目标。

二、研究对象及方法

(一)研究对象

在校女生800米的训练及近三年的测试成绩。

(二)研究方法

1. 数理统计分析法。分析比对同一届学生不同年的测试成绩,分析比对不同届同一年级时的测试成绩。

2. 问卷调查法。通过问卷调查法,了解学生惧怕800米训练及测试的原因。随机发放问卷100份,回收100份,回收率100%。

3. 访谈法。对教师和学生进行访谈,获得相关信息,并整理分析。

三、研究结果与分析

通过对我校2011级、2012级、2013级女生近3年800米测试成绩的比对分析,发现学生耐力素质呈现“一届不如一届”的下滑趋势,同时统计数据还显示,学生经过在校一两年的锻炼后,测试成绩只有细微的提高,如(表1)所示。

通过对学生800米项目锻炼参与意愿问卷调查的统计,统计结果如表2所示,从中我们不难看出,有高达59%的学生根本不愿意参加800米锻炼,仅有18%的学生乐于耐力训练,23%的同学持无所谓的态度。为什么会出现以上两种不正常的现象,个人认为有以下几方面的原因:

(一)学生生理、心理机能的影响

我校在校学生正处于青春期早期,这个时期的学生身体发育迅速,身体各器官系统渐趋完善,其中心血管系统及呼吸系统发育加速,应采取必要的耐力锻炼手段,促进青少年呼吸系统、心血管系统的发育,以提高各系统的机能。同时,这一时期的学生在心理上也出现了男女分别,女生更喜欢选择一些韵律性强、节奏明快、动作优美的活动。因此,女生对800米跑这种强度大、持续时间长、人体要在接近生理极限状态下的运动项目具有相当大的抵触心理。据中国学生体质与健康调研组对男女学生进行调查发现,有21.8%的学生不愿意参加长跑锻炼,这其中有76.7%的学生认为长跑太累了,而30.4%的学生是认为太枯燥。所以,在这一阶段,女生在心理上对800米这种长跑类运动存在消极的参与动机。

(二)师生结构的特殊性导致执行训练力度不够

我校体育教师中男老师占绝大部分,都面临着对女生班级耐力训练时执行力度不够的局面。每每课堂组织进行耐久跑练习时,就会有一部分学生找各种理由请假:“每月的特殊情况”“肚子疼”等等。对于学生直白的“理由”,男教师在很多时候只好做无奈的准予,结果就出现了“一说到跑步练习就请假”的现象。

(三)练习场地需求得不到充分的保障

学校基础设施建设工作很是到位,场地器材完备,但由于学校地处城区外,而老师们都居住在城区内,另外从运动场的安全管理角度出发,一到下班时间,学校运动场就处于关闭状态。这样一来就出现学生所说 “学校的田径场就如聋子的耳朵——摆设”的怪现象,学生课余锻炼的场地需求得不到保障,其锻炼习惯的养成教育也就得不到很好的实现。

(四)体育教师与班主任缺乏沟通

体育教育教学工作的顺利开展依赖于班主任的协助与配合。然而我校少数老师认为班级学生的身体训练就是体育教师一个人的事,极少主动与体育教师进行沟通,这在很大程度上阻碍了一些课外锻炼计划的制定与落实。

四、对策

(一)正确引导学生理性认识800米跑,激发练习欲望

耐力素质是指人体在长时间活动中机体克服疲劳的能力,其训练过程就是一个挑战自我、战胜自我的过程。加强耐力素质的锻炼,能有效促进呼吸系统、血液循环系统功能的提高,同时医学界也证明,人的寿命长短也主要取决于这两大系统的功能。800米跑是典型的耐力项目,我们体育教师除了用书面的理论知识正确引导学生理性认识800米跑外,还可以利用一些鲜活的事例和实践数据形象地来说明耐力训练带来的益处,激发学生的练习欲望。

(二)用心训练,调动学生参与训练的积极性

学生不愿意参加耐力训练,我们体育教师要找出原因,努力改良一些教学方法,调动学生的参与积极性:改变围绕田径场跑步的模式,在校园大道或林间小道进行练习,变换视野,感染身心;播放学生感兴趣的音乐,让她们在音乐的熏陶下享受训练;我们也可以和学生一起跑步练习,采用“跑在老师后面的就重跑或表演节目”等方式刺激学生的参与积极性;还可以采用分组比赛、耐力性的体育游戏等形式组织练习。总之,只要我们体育教师训练用心,相信学生参与锻炼的积极性是可以调动起来的。

(三)学校领导关注训练,关心学生的练习体验

从某种角度而言,学生健康体质测试成绩是衡量一个学校体育工作开展质量的直接表现。学校领导也很重视这一问题,同时学校还应关注学生课外自我锻炼活动,改革田径场管理制度,保障学生的活动空间。另外,在集会时鼓励学生克服练习中种种困难,利用这种领导效应,可能比我们体育教师花费更多时间进行教育的效果要好。

(四)注重体育教师、体育骨干、班主任三者的协同合作,共同完成“达标争优”的目标

学生健康体质测试的指导思想是“健康第一”“达标争优”。因此,我们体育教师要与班级体育骨干、班主任紧密联系,根据班级情况、个人实际,制定合理、长期的锻炼计划,并落实锻炼计划的考核工作,如组织全班进行晨跑,给予坚持锻炼者体育成绩基础分20分,这就需要体育骨干严格公正的考核,班主任要了解学生、关心学生,做好学生坚持锻炼的精神鼓励工作。

总之,只有通过各方面的共同努力,让学生坚持经常性的系统锻炼,培养其良好的锻炼习惯,才能达到增强学生体质,实现达标争优的最终目的。

【参考文献】

[1] 杨贵仁,盛志国. 国家学生体质健康标准解读[M]. 北京:人民教育出版社,2007.

外语成绩测试信度研究 篇7

本文拟分析的数据源自于某外语学院的英语专业学生的一次期中考试。这次测试旨在检测学生对于上半学期所学知识的掌握程度, 以便老师灵活的调整教学方法, 同时引起学生的重视及反思。为了使测试的结果更具有说服力, 该成绩测试本身的信度和效度是一个不容忽视的问题。为了提高考试的测试质量以及为该试卷的进一步优化提供理论支撑, 本文拟从信度方面来分析该成绩测试。

一.研究方法和数据收集

本研究的研究对象是某外语学院的26名英语专业在校大学生, 根据随机抽样原则, 在同一年级随机抽出的一个班级的学生。在测试和评分结束后, 将他们的试卷收集起来, 然后将从试卷中得到的数据输入M icrosoft Excel和SPSS软件进行相关分析。

二.研究结果和分析

描述某一测试具有信度即是指该测试具有准确性、稳定性、可靠性和评分公平性等特点。信度包括内部信度和外部信度。

由于学生只参加了一次考试, 因此没办法研究该测试的外部信度, 只能对内部信度进行检测。本研究通过比较克朗巴哈α系数来检测该期中测试的内部信度。克朗巴哈α系数的数值, 一般介于0-1之间, 当其达到1时, 说明测试的内部信度达到最高程度;当其降到0时, 说明测试的内部信度降到最低。测试的目的不同, 对α系数的要求也不尽相同, 就语言测试而言, 可接受的范围在0.3-0.7之间。我们把收集到成绩输入到SPSS系统中进行相关分析, 得到的克朗巴哈α系数值为0.707, 介于0.3-0.7之间, 属于可接受的范围, 但是离理想的克朗巴哈系数值大于0.9还有一定距离, 也就是说本次期中考试具有一定的可靠性, 但其信度仍有待于进一步的改进和完善。

要想进一步的改进和完善该测试的信度, 我们有必要考察一下影响此次考试信度的一些因素, 如:施测信度、内容信度和评分信度。

1.施测信度

所谓的施测信度是探讨测试的准备形式和测试过程中是否具有可靠性。本次期中测试是26名学生在同一时间同一教室中进行的, 这充分保证了测试的公平性和保密性。并且整个考试过程安静, 几乎无任何外界干扰, 这就排除了考试过程中的干扰因素。因此本次测试的施测信度比较高。

2.内容信度

影响内容信度的因素主要有三个方面:内容的长度、难度与区分度。

从理论上讲, 测试的内容题目越多, 长度越长, 能测试的覆盖面就越广, 其结果就越能反应学生的水平, 其信度就越高。有一定长度的测试还能够减少猜测带来的负面效应。

要考察本次期中考试的长度, 用Spearm an&Brown的预测公式进行计算得到的结果为3.9。根据这个结果得出结论, 从理论上讲, 本次考试的试题长度应再增加3.9倍, 会有助于增加该测试的信度。当然, 试卷的长度也不能绝对化, 毕竟考试时间有限, 如果试卷过长, 会给学生带来心理负担, 一旦这个负担超过学生的心理承受极限, 各种误差就会随之而至, 反而会影响到信度。

试题难度系数反应试题的难易程度, 即同一考生在一个试题或一份试卷中的失分程度。通常情况下, 难度系数的可接受范围为0.33-0.67之间, 最理想的值为0.50。如果某道题的难度系数低于0.33, 则被视为过于简单;其难度系数高于0.67, 则被视为难度系数过大。无论是难度系数过小或是过大, 都不利于检验学生的失分程度。

3.评分信度

影响评分信度的具体原因比较多:评分标准、考试者答卷的书写情况和答题差异性等。评分者信度是评估语言测试信度不可忽略的一个重要因素。评分者信度是相对于试卷中的主观题评分而言, 因为主观题评分不可避免地会受到评分者主观因素的影响, 而从理论上讲客观题的评分在任何情况下都应该是一致的。因此, 对评分者信度研究的意义在于如何最大限度地保证阅卷人自身以及阅卷人之间评分标准的一致性。评分者信度主要分评分者之间的信度和评分者本身的信度两种。本研究中, 该26名学生的试卷均由一位老师在统一的评分标准下进行评卷, 因此暂且不讨论评分员间的信度, 又因为数据收集的不完整, 也没办法对评分者本身的信度进行定量的分析。

根据上文的分析, 本次研究得出以下结论:

1.本次期中测试的内部效度为0.707, 也就是说本次期中考试具有一定的可靠性, 但其信度仍有待于进一步的改进和完善。

2.阅读理解的难度系数比较低, 区分度也不够, 还需要进一步的改进。客观试题最能简单、直接的反应应试者的语言掌握程度, 如果这部分题目的设置不合理, 将对整套试题的信度和效度产生很大的影响。

3.由一个老师评阅这26位学生的试卷, 可能会受到评卷环境、评卷效率和工作疲劳程度的影响, 从而影响评分员内部信度, 导致分数出现误差。

总之, 本次期中测试在信度上能达到较好的平衡。但对于如何提高测试试卷效度和信度仍旧有必要进行进一步研究, 才能使其更好的评估学生的语言水平, 为接下来的教学提供指导。

参考文献

[1]Arthur Hughes, Testing for Language Teachers, 北京:外语教学与研究出版社, 2000.6.

[2]David P.Harris, Testing English as a Second Language, New York:MacGraw-Hill Book Company, 1968.

[3]阿兰.戴维斯 (Davys, A) .著;任福昌等译, 语言测试原理, 北京:经济科学出版社, 1998.2.

浅析高中数学测试成绩点评的方法 篇8

(一) 育人

我们对测试成绩点评的目的在于体现对教学的过程管理。 教师搞教学的目的在于育人, 只有教育教学相结合, 才会更大地提高教育教学质量。 在这个过程管理中, 教师必须纪律严明, 对教学实施过程要进行全方位的规划和操控, 有效指导学生积极地投入到学习当中是很有必要的。 点评就是对学生的关注, 就是对学生的管理, 就是对学生的指导。 实际上就是育人的一个方法。 往往会有这样的现象, 当考试结束后, 由于高中教学时间紧, 教师为了节约时间, 拿到试卷后就发到学生手中, 然后用3课时扎扎实实讲解习题。 笔者认为这种做法欠妥, 效果并不佳。 笔者认为讲解用2课时就够了, 即采用1+1或0.5+1.5可能比较好。 1+1是指利用1课时点评, 1课时讲解, 适合难度系数较大时;难度系数较小时采用0.5+1.5。 也就是说, 采用点评和讲解相结合的方式, 对学生的学习过程起一个承前启后的作用, 实践证明效果比较好。 而缺乏点评的讲解或点评不到位的讲解实际上忽略了一个重要的过程即总结。 干任何事都应该有始有终。 过程是很重要的, 结果就是对过程的一个体现, 通过过程把握结果, 通过结果指导过程, 是教学中很有意义的事。 我们教育的目的并不是让学生变成学习的机器, 而是看到通过学习能够塑造学生的心灵, 影响学生的行为。 我们期待的是看到学生在学习的过程中体现他们的酸甜苦辣, 体现他们的追求, 进而有一个良好的习惯。 再者, 学生是活生生的人, 是有感情的, 不是机器, 需要的我们的关心和关注。因此, 点评是育人的一个比较好的方法。

(二) 未雨绸缪

机会总是留给有准备的人。 无论干什么事, 付出努力是一定的, 更重要的是, 付出代价也要找机会。 因此干任何事都需要提前打算, 学习也不例外。 高中数学知识环环相扣, 知识量大, 规律性强, 方法灵活, 点评的目的既在于现在, 更重要的在于将来。 恰当的点评是对全班的激励, 是对大家的鼓舞, 是对后进生的鞭策。 点评是未雨绸缪的一个行动, 其目的还在于:第一, 给学生说明高中学习状态变化很大, 教师只不过是引路人, 如果不努力, 随时都有退步的可能, 即使现在成绩比较差的学生, 如果加把劲, 相信将来定会赶上别人甚至会进入前几名的。 第二, 要让学生明白平时点滴积累量变引起质变的原理, 改变“临阵磨刀”“急来抱佛脚”的思想。 如果学生考差了, 教师需要引导学生尽量找出原因, 找出对策, 进而为将来的学习树立信心。

二、对高中数学测试成绩点评的方法

1.名次排列法。 每次考试结束后, 为了学生的自尊心, 同时也要让学生认清自己的学习状况, 教师在试卷的右下角表明学生单科成绩的名次, 这样就便于学生认清现实。

2.整体点评法。 整体点评包括最高分, 最低分, 平均分, 最高分与最低分的差距。如果再详细一点, 还包括每道题的得分率, 最简单的题出错最多的学生, 最难的题得分高或得满分的学生, 选择题大于或等于40分的同学, 填空题大于或等于12分的同学, 解答题大于或等于45分的同学。当然整体点评会花教师比较多的时间, 教师可以按情况有选择性的点评。

3.分数段点评法。 统计分数段方便学生检查自己是处于哪一个层次, 有利于教师确定培优转差的对象。

4.靠前落后点评法。 教师对进入前10名的学生和最后10位学生按成绩名次一一进行点评。对进入前10名的同学点评, 提出表扬, 一方面肯定他们的成绩, 满足他们想受到表扬的满足感, 另一方面可以对全班起到榜样、激励作用。 对后10名的同学也要点评, 不同的是指点成绩和性别或者姓名的笔画数, 一方面暗示教师对他们的期待, 另一方面暗示他们需要加把劲, 有的同学需要清醒了。 以上两个层次的学生虽然点评方法不同, 但是一定要点评, 不少教师会忽略这一点, 其实试想一下, 谁不爱听好话, 当教师的我们听到领导表扬我们或者肯定我们的劳动, 心里也乐滋滋的。另一方面, 即使我们很糟糕, 也需要有人关心。

5.榜样点评法。 点评时, 教师对平时行为表现好, 成绩进步比较大的学生或者是作业认真, 书写规范, 经常和教师探讨学习问题的学生应该加以肯定或表扬。这样就会很自然地引导大家向他们学习, 也会起到良好的作用。

6.务必要让学生反思。 无论做什么, 也无论什么人做, 难免都会有错误或者失误, 学生也一样。每次考试结束后, 教师都要引导学生、要求师生共同进行必要的反思。 且行且思, 养成好习惯, 会是一个人一生的财富。 如果引导学生反思, 反思自己平时的行为, 会对后期的学习产生一定的影响。

三、对高中数学测试成绩点评时应该注意的问题

1.点评要及时。 每次考试之后, 都应该把考试的状况和结果通报学生, 并且要对学生及时点评。如果不及时点评或者等过了一段时间再点评, 就没有多大意义了。 点评实际上就是对学生的管理, 也是对学生的关注。 比如盖一栋大楼, 如果管理不到位, 盖得楼的质量就可想而知了。我们要关注学生, 关注学生的变化, 关注学生的成长, 及时点评的话, 意义以小见大, 影响深远。

2.点评要注重实效性。 我们点评的目的, 就是要对学生的学习行为产生一定的影响或干预。 因此点评要注重实效性, 每句话要有根有据, 要有说服力, 切不可乱弹琴。

3.点评要有激励性。 激励是教师一辈子不可或缺的法宝。 对学生的激励, 体现了新型的教育理念, 体现了以人为本的理念。 及时对学生的激励, 是学生的动力。

4.点评要有公平性。 点评体现了对学生的整体关注。 那么我们既要点评学习好的学生, 也要点评学习差的学生。 但是, 点评要注意公平性, 对学得好的同学, 要提醒他们不要骄傲, 继续保持; 对学习差的学生不能挖苦讽刺, 要暗示他们不要气馁, 暗暗加油。 作为教师, 我们应该有份期待的心, 期待他们的变化, 期待他们有所追求就好了。 其实成绩的好坏虽然是判断的重要标准, 但并不是判断的唯一标准。 事实上, 多年以后, 能够对教师念念不忘的, 大部分会是那些当初学习比较差而曾经受教师关心关爱关注不歧视不放弃的学生。

英语成绩测试 篇9

1 普通高校体育专业录取方法及成绩要求

下面以我省部分高校为例, 对体育专业的录取方法及成绩要求进行分析。笔者针对省内部分高校2010年体育专业录取方法及成绩要求情况做了统计 (表1) 。

从上表可以看到, 各高校在体育专业考生的招生录取工作中, 都有各自的一套录取方法, 都是在投档考生中按各高校提前公布的的录取方法进行排序, 择优录取选拔人才。

2 普通高校体育专业招生成绩测试存在的问题

2.1 报考资格存在的问题

近十多年来我国许多地方取消了对报考体育专业考生的资格筛选, 只要愿意参加的高三学生, 均可报名。于是相当一部分文化成绩不是很突出的学生希望通过体育专业对文化分要求较低这一“捷径”进入大学, 中途改行, 临时突击训练报考了体育专业, 此类考生进入大学后很难适应体育专业的学习和训练, 很难真正成为合格的体育人才, 服务于社会。近几年来相当比例的没有体育基础的考生报考了体育专业素质测试, 大大增加了考试组织的工作量和难度, 也耗费了大量不必要的财力、物力和人力, 给许多考生家庭增加较大的负担, 对考试的公平、公正也产生了一定的影响。

2.2 录取方法选定上的差异

在高考录取工作中, 对于划定录取分数线我国各省、市都是根据本地生源考试情况和招生指标来确定的, 特别是要划定既有文化分数线又有专业分数线时, 就要看对这两条线的侧重与否, 是重视文化素质还是重视专业素质而进行划线, 这是高考中招生政策性的问题, 关系到各高校的生源质量。

比如表1中, 我省的综合一本学校目前采用的是体育专业素质成绩和文化课考试成绩都达到投档分数线的考生将两项分数直接相加由高到低录取;师范二本学校是按 (文化成绩+术科×2) 的综合成绩排序录取。由于一些高校体育专业素质测试总分为100分, 而文化考试总成绩为750分, 两项总分相差极大, 这些录取方法使文化成绩好的考生占尽了优势, 往往使一些体育分数刚“上线”但文化课成绩优秀的考生被录取, 而一些体育成绩优秀文化课成绩略差的考生被拒绝在大学校门之外, 造成许多考不上文、理科的考生突击转考体育专业。

2.3 体育专业素质考试项目设置的问题

目前我国的体育社会化程度不高, 基础教育阶段的学校体育发展滞后, 很多学生高中毕业也没有能够掌握一项可以作为终身体育锻炼的体育技能, 甚至有很多体育专业招入的体育考生除了考试测试项目也没有其它的体育技能。

比如, 我省体育专业素质测试的内容是5项素质测试, 该测试内容已经有十多年没有变化过, 目前很多考生在高中阶段的训练内容全是这5项考试内容, 其它的体育素质和技能基本没有接触过。在只考5项素质之前, 我省也进行过专项考试, 但由于专项考试以人工打分为主, 有一定的主观性, 同时也出现过个别考试工作人员受贿舞弊案件, 导致部分考生及家长对考试的客观、公正提出质疑。正是在这样的背景下, 省招生管理部门取消了专项考试。但在专项考试取消后的这些年里, 在学生进高校后的培养以及高校毕业后就业、工作中都显现出一些弊端。因此, 必须对体育专业素质考试的项目设置进行改革。

3 普通高校体育专业成绩测试改革措施

3.1 逐步提高体育专业考生录取的文化成绩要求

随着高等教育的发展, 普通高校体育专业的办学规模在不断扩大, 然而与此不相适应的是考生入学的文化成绩一年比一年低, 很难设想文化成绩低的学生, 进入高校后能成为高级的体育人才。目前, 在许多学校里, 文化素养低的体育专业学生, 已经给学校教育带来困难。由于上述原因, 一些高校体育专业已开始减少省内招生名额, 纷纷向外省录取质量较高的考生, 而省外普通高校在录取时, 也特别强调对考生的文化要求。特别对于体育专业本科招生大户, 是历年考生报考的热门院 (系) , 因此笔者建议, 对于这样的普通院校应试行本科招生计划数的2倍, 确定体育专业最低分数线, 然后按考生文化成绩由高分到低分录取。当然对个别专业成绩非常突出 (如专业成绩在86分以上) 的考生, 可适当放宽文化成绩至省内最低线, 但录取的总人数不得超过5%。普通高校体育专业招生成绩改的改革, 一方面可减轻体育招生考试的组织压力, 另一方面, 对中学体育尖子加强文化学习也是一种积极导向。

3.2 考试项目内容的设置

身体素质类项目测试:包括8 0 0米、1 0 0米 (为必考) 和跳跃、投掷 (随机抽取) 4项具体考试内容。这些内容基本上能较全面反映考生的耐力、速度、灵敏反应和力量等基本素质。特别是800米和100米跑对考生的体能、心理、技能以及克服困难的承受力和顽强拼搏精神等基本素质的反应。

专项项目测试:排球、足球、篮球、田径、武术、体操。通过我们的调查得知, 武术、体操专项入校的学生的专业基础较差, 素质较其他专项入校的学生的素质较单一, 而足球、篮球、排球专项入校的学生的素质更为全面。

纵观我国历年体育术科考试的基本情况和有关研究来看, 由于身体素质测试多是客观类标准的测试项目, 因此相对准确地反映了考生真实的身体素质状况。而专项素质既有客观类标准又有客观和主观类标准相结合的测试项目, 由于标准的不均衡性和考官主观上和客观上的原因, 一方面导致各专项群体考生成绩价值不对等, 另一方面容易导致考生对专项选择的迁移性。因此, 相关部门应组织力量在测试内容和测试标准上多下功夫, 提前预防, 并不断地进行修改和完善, 尤其是专项考试客观类和主观类标准, 使考试公平、公正。与此同时, 应加强考试前裁判员的学习, 统一尺度、统一标准。

3.3 在体育招生测试中扩大素质的内涵

在体育招生测试中扩大素质的内涵, 有利于全面实施学校素质教育中的“体育”教育思想, 从而不偏离学校素质教育方向。普通高校的招生考试历来对中小学的教育起着杠杆作用, 当前我国中小学体育教育所推行的新课程标准, 是要求学校体育教育贯彻“健康第一”的思想, 强调面向全体学生和促进学生个性发展, 而体育课要实现这一目标, 必须积极组织全体学生科学地进行体育锻炼, 开展形式多样、丰富多彩的体育活动, 而在新教材目录上田径、体操、武术、球类仍是基本教学内容。很显然, 新课程标准并没有以“健康课”替代“体育课”, 以“活动课”代替“项目练习”, 而是对体育课的教学提出了更高的要求。招生考试中的综合技术考试, 有利于中小学体育教育改革的健康发展, 有利于普通高校选拔综合技能较好的可培养人才。

参考文献

[1]覃朝玲, 等.重庆市高校体育专业招生术科测试成绩透析[J].西南师范大学学报 (自然科学版) , 2007 (5) .

[2]许贵泉, 张承欢, 许云前.高校体育专业招生身体素质测试评分方法的探究——以安徽省为例[J].军事体育进修学院学报, 2010 (4) .

[3]王美春, 费纪君.山东省普通高校体育专业考试标准的实践研究[J].山东师范大学学报 (自然科学版) , 2011 (4) .

英语成绩测试 篇10

一、实验的对象及方法

1. 实验对象

从安徽农业大学2007级女子健美操班抽取学生50人, 学生入学体检, 身体健康, 无妇科疾病, 平均年龄为18±1.28岁, 平均身高为158.2±3.52厘米, 平均体重为50.69±4.08公斤, 月经初潮平均年龄13±1.85岁, 月经持续天数平均为5±1.42天;

2. 实验方法

(1) 测试项目:台阶试验、1分钟仰卧起坐、50米跑、主体身心感觉变化。

(2) 实验设计:将月经周期分为:月经期、月经后期 (月经期后1-10天) 和月经前期 (在此之后的1-14天) 三个时相。分别在三个时相期间测试学生上述项目;主观感觉调查问卷包括情绪、睡眠、疲劳感和工作能力的感觉变化程度描述。

(3) 数理统计:测试结果用统计软件S P S S 11.5对数据进行分析处理。统计方法采用独立样本T检验和卡方检验, 数据以平均数±标准差表示, 检验显著性标准为:P<0.05。

二、测试结果比较与分析

1. 月经周期对体质健康测试结果比较

月经周期是女性特有的生理现象, 女子月经周期对运动能力是否有影响, 已有不少体育工作者对此做过探讨, 但相关研究结论尚不一致。本研究结合实验条件, 从《学生体质健康标准》中选取台阶试验指数、50米跑、1分钟仰卧起坐测试项目来探讨月经周期对《学生体质健康标准》女生测试成绩的影响。

从表1至表3女生月经周期三个时相阶段中, 台阶试验指数、50米跑、1分钟仰卧起坐测试成绩的T检验结果可见, 学生在月经期的各项测试成绩都明显低于月经前期和月经后期, 且差异都达到非常显著水平, 而在月经前期和月经后期的各项测试成绩略有差异, 但差异不显著。从具体测试数据来看, 在月经周期的三个时相阶段中, 月经后期测试成绩最好, 月经前期次之, 月经期各项测试成绩最差。

2. 月经周期对主体感觉问卷调查分析

主观感觉是机体在运动过程中对自身的努力、紧张性、舒适程度或疲劳程度的主观评估。其评价方法很多, 最常用的是数字等级分类法, 用数字表示主观感觉的等级。测试中要求受试者选择一个与当时主观感觉相对应的状态。由于月经周期变化会对女性生理产生一定的影响, 如腰酸、腹痛等现象, 因而可能会引起心理上的变化。通过主管感觉问卷调查发现女生月经周期三个时相阶段中, 学生主观感觉问卷调查卡方检验结果发现都存在显著差异, 说明学生在月经期的情绪状态、睡眠质量、疲劳感觉和工作能力的感觉上都有明显变化。从出现人数频率的具体数值来看, 表现出学生月经期:在情绪上易出现低落或兴奋;在睡眠质量上较差;在疲劳感觉上疲劳感强;在工作能力上有所下降等现象。分析认为这些不良感觉的变化可能是导致学生在月经周期中测试成绩不同的重要原因之一。

上一篇:截渗技术下一篇:大棚黄瓜嫁接栽培技术