为幸运的RTT州提供VAM政策课程

伟德1946英国

对于使用增值指标(VAMs)来判断教师绩效的准确性存在很多困惑。一年的数据足以判断业绩吗?VAM是否适用于评估所有教师的表现,还是只适用于评估那些处于极端状态的教师,即最好和最差的教师?

研究人员,彼得Schochet而且汉利蒋介石Mathematica政策研究挖掘来自全国各地区的VAM数据,并进行模拟,试图解决这些问题。他们展示的内容并不新鲜,但很有趣,也很有用。

例如,如果一个地区要针对表现达到或低于第18百分位的教师进行一些负面后果(例如缓刑、解雇、终身教职被拒绝),并使用三年的数据来计算该估计,VAM的估计将对四分之一的教师“错误”(这意味着这些教师实际上比三年计算显示的表现更强)。如果一个地区只依赖于一年的数据,VAM的估计对三分之一的教师来说是“错误的”。然而,如果一个地区尝试找出更少的处于底层的教师,比如说,在第8百分位或以下,并使用3年的数据,准确率将会大大提高。那么VAM的估计只对六分之一的教师是错误的。

离均值越远越准确

你可能会想:等等,如果老师教那些参加VAM测试的学生,他们怎么可能被错误分类呢?简而言之,老师并不是学生表现的唯一贡献者。一些教室可能有更多的资源,更少的干扰和/或更少的贫困学生,所有这些都会影响学生和教师的表现。必须控制课堂上的这种变化,以确保有效的计算和教师之间的比较。此外,一些学校可能会有更多的资源,更好的领导,更有能力的老师和/或更贫困的学生,这将系统地影响学校的表现。同样,VAM计算必须去除这些资源差异,以确保适当的比较。

尽管存在这些警告,但作者指出,vam与其他教师质量测量方法相比具有明显的优势:它们比证书、教育、经验甚至观察性测量方法更能预测随后一年的课堂结果。