拼图渐渐拼凑起来

伟德1946英国

根据考试成绩对学生进行课程分类可以提高他们在标准化阅读和数学测试中的表现。然而,这种对学生的非随机分类会使增值估计产生偏差,而增值估计并没有对学生进行控制。

在教育研究中,定量工作并不经常像最近的两篇工作论文那样相互补充。”分类学生能提高成绩吗?课堂构成分析"来自NBER和"跟踪学生是否会对教师的增值估计产生偏差来自Mathematica。

美国国家经济研究局的论文使用了来自135个三年级和四年级的9000多名学生两年的测试数据达拉斯ISD学校评估的影响排序的各种维度,如以前的测试表现,天才和天才状态,特殊教育状态,和有限的英语水平状态。在近四分之三的学校中,他们发现了学生使用至少一种特征进行分类的证据(40%的学校使用两种特征)。此外,他们“发现有力的证据表明,将学生分成更同质的组是有益的,特别是根据以前的考试成绩进行分类。”这对高分和低分的学生都适用。在其他维度上排序时,他们通常会发现混合的、无关紧要的结果。

Mathematica的论文使用了2011-2012学年6500名学生考试前和考试后的阅读和数学成绩哥伦比亚特区公立学校七至十年级的学生估计四个模型来量化和控制排序偏差。他们的基线模型是一种增值估计,控制了测试前分数(两个科目)和各种学生特征(免费/减少午餐资格,特殊教育状况和种族/民族)。另外两个控制学生排序的模型:(a)通过显式地使用指示课程注册的变量(在初中和高中阶段,排序通常是按特定的、命名的班级进行);(b)通过包括教室特征(平均教室前测试分数和教室标准偏差)。最终的完整模型包括显式跟踪和课堂级控制。

简而言之,作者发现,显式轨迹模型和课堂特征模型确实纠正了排序偏差,但每种模型都显著改变了教师层面的结果。例如,与基线相比,每位教师的增值估计的平均变化范围约为标准偏差的20%至30%。此外,完整模型降低了估计的精度(增加了置信区间大小)。所有规格都会导致增值分布的尾部(第10个和第90个百分位数)发生微小变化。

综上所述,这两篇论文指出了一条非常清晰的前进道路:考虑对学生进行排序,在估计增值措施时,假设这种排序是常见的做法,并明确地为其建模。