价值增长评价――教师评价的新方法
20世纪80年代,为了更科学、有效地评价教师和学校,美国对教育评价进行了一系列改革。其中,田纳西州的威尔姆.桑得斯提出的价值增长评价获得了成功,并在20世纪90年代被广泛应用。
价值增长评价是指通过统计方法衡量学生经过一段时间的学习后所获得的有“价值”的学业进步或学业成绩增值。它既可用于评价学生,又可用于评价学校或教师。本文只从教师教学评价的角度讨论价值增长评价。
价值增长评价通常将学生每年在某科(如数学)历次考试中所取得的分数转化为标准分,然后通过综合这些标准分构建学生学业成绩曲线图(以考试次数为横坐标,以标准分为纵坐标)。虽然每个学生的曲线图的形状各不相同,但如果收集和比较大批学生的学业成绩曲线图,就可以发现它们存在着共同的曲线特征(如所有曲线图中某段曲线都上升或下降),据此就可以判断教师的教学工作,即鉴别教师能否使学生最有效地获得学业进步。[1]这种评价教师工作有效性的方法替代了传统的评价一个好老师的模式(同事评价或相关资格证书的鉴定等),使得教师评价基于教师的教学效果。因而,价值增长评价可以对教师进行更客观、科学的评价。
价值增长评价的产生
怎样才能判断某个教师能非常有效地使学生的学业成绩获得提高,一直是教育评价所关注的问题。
(一)教师教学评价中存在的难题
威尔姆•桑得斯通过研究发现,优秀教师所教学生获得的学业成绩与不合格教师所教学生获得的学业成绩有着本质的区别,这些区别足以影响学生未来的学习。[2]但问题是在教育评价实践中,我们很难将教师的影响(如教师本身所具有的技能、教师独特的教学方法)与学校的影响(如学校的资源、管理方法)、学生的影响(如学生的原有知识、能力)逐项区分开来;同时,如何测量教师对学生学业的影响程度也是一个难题。
(二)传统的教师教学评价中存在的困惑
以往,我们习惯于通过查阅教师被聘时的考核分数或资格证书(包括教师资格测验分数、专业训练的内容、学历)来确认教师已有的水平。它所追求的是对教师将来的教学质量的预测。然而,这种方法缺乏对教师的考核分数或资格证书的“含金量”的评价(如教师所受的训练是否包括必要的实践,对教师进行训练的人员配备是否充足等)。不仅如此,一位具备上述要求的教师是否就能很好地提高学生的学业成绩,也是个有待研究的问题。再者,评价教师教学工作有效性的传统方法是将学生成绩进行横向比较(与其他班级或其他学校的学生进行比较),显然,这种评价方法具有很大的片面性。
(三)价值增长评价的产生
价值增长评价的提出提供了一种解决上述问题的方法。从技术角度来说,价值增长评价就是对学生每年取得的学业成绩等重要的教育数据进行统计分析。这些数据既告诉我们学生最终能做什么和获得了什么,又体现了教师教学的有效性。
在评价教师教学的有效性方面,(1)价值增长评价摆脱了通过教师的自身能力来评价其工作效果的传统方法,转向于用学生取得的学业成绩或学业进步进行评价。(2)价值增长评价可以忽略学生具有的不同知识、能力、生活背景、经历等因素对教师教学评价的影响。它主要采用内部差异评价――将学生现有的水平和原有水平进行比较确定学生的学业获得。
价值增长评价将教师教学的有效性基于学生获得的学业成绩的增值这一重要结果,因此,它能较公平、客观地评价教师。
价值增长评价的实施条件
价值增长评价是用强有力的统计工具来支持的一种评价方法,其结果的有效性依赖于一定的条件。
(一)具有较高信度和效度的成绩测验
价值增长评价要求通过具有较高信度和效度的测验收集每年全校所有年级、所有学生相关的成绩测验分数。当然,较高信度和效度的成绩测验并不能涵盖学校教育的所有目标,所以,价值增长评价并不绝对排斥日常行为记录和其他资料收集形式。但用这些评价获得数据时要考虑它们的客观性,否则,价值增长评价的准确性和可靠性就会受到严重的影响。
(二)客观准确的测验题目
为了防止价值增长评价可能带来的过度重视考试分数和“为了考试而教”的负面影响,价值增长评价要求每次成绩测验的题目必须是新的且没有冗余。而且,每次测验题目必须具有同等的难度和良好的区分度(易于区分高学业成绩学生与低学业成绩学生)。制定这些要求的目的是为了保证题目的可靠性,减少评价过程中的人为因素;保证考试所测量的是学生的学业进步,而不是应试技能的提高。
(三)对被评教师的要求
价值增长评价并不能评价所有的教师,换言之,被评教师要符合一定的条件。否则,价值增长评价就会出现负面影响。
美国田纳西州的价值增长评价模式对被评教师作出了严格而详细的规定:被评教师固定教导一批学生的时间必须超过3个月,教师从事的是普通教育而不是特别教育服务(在美国,特殊儿童,如天才儿童、弱智儿童等,须通过“个别化教育计划”接受特别教育服务),教师所教科目必须每年都进行成绩测验(如艺术科和音乐科就不进行成绩测验)。
价值增长评价的优点
教育者运用价值增长评价可以解决一些传统评价方法所不易解决的问题。价值增长评价具有以下明显的优点:
(一)最大限度地保证教师评价的公正性
价值增长评价要求评价者每隔一段时间就将学生目前的学业成绩与其以前的学业成绩进行比较,衡量学生是否获得进步,以此来评价教师。但是,传统的教育评价方法(如将学生的学业成绩与平均成绩相比较)没有考虑学生原有水平的影响,所以会产生这种情况:基础较差的学生尽管获得了学业进步,但由于其考分相对较低,所以其辅导教师仍将受到消极评价;基础较好的学生尽管在学业上止步不前,但由于其考分较高,所以其辅导教师将受到积极评价。这样,必然使教师评价失去公正性。价值增长评价最大限度地避免了此类问题的产生。
(二)减少外在因素的影响
学生已有的知识和能力、家庭所处的社会经济地位、种族和其他一些已知或未知的因素都会影响学生的学业成绩。一些外在因素,如学生生病或一场自然灾害都会影响学生的学业进步。再如,提高学生家庭的收入或提供更好的医疗保健都会对学生的学业起到积极的作用。
无论使用何种其他的教育评价方法都不能排除上述外在因素的影响,但价值增长评价能将这些影响降到最低程度。首先,它的数据取自每个学生在一段时间内学业成绩增长的平均值,这使得外在的积极影响和消极影响可以相互抵消。其次,教师工作的效果可以与处于相同或相似条件下的其他教师进行比较,从而客观地反映教师工作的有效性。
(三)多种评价方法的整合
一个完整的评价方案既要考虑到学生学业成绩的增长,又要考虑到学业成绩与常模或标准的比较。价值增长评价主要采用内部差异评价,同时也不排斥相对评价和绝对评价。内部差异评价根据学生测验分数的增长情况判断学生学业进步的程度;相对评价将某一学生成绩增长的幅度与(其他学生)平均成绩增长的幅度进行比较,显示出该生的相对水平;绝对评价将学生取得的学业成绩与外在标准进行比较,以判断其是否达到了学业成功的外在标准。
这样,教师既能看到学生所获得的进步,又能看到学生的学业增长与常模及外在标准之间的差异。
我国多采用相对评价或绝对评价的方法对教师工作的有效性进行评价。相对评价和绝对评价有其长处,也有其明显的缺陷(如在同一所学校,如果使用相对评价的方法,那么在一般情况下,辅导尖子班的教师的教学有效性总是高于辅导普通班的教师,这样就会造成不公正的评价)。价值增长评价力图弥补这些缺陷,它的提出和应用给我们一个启示:只有根据实际情况综合运用各种评价方法,才能获得客观、真实的评价结果。
手工材料