基于标准的评分批评

基于标准的评分只解决了一个问题的一半

经过授予威根真实的教育

ed注意:2015年5月26日,格兰特威根通过了。格兰特对教育的方法产生了极大的影响力,我们很幸运能够为他贡献他的网站。偶尔,我们将回去重新分享他最令人难忘的帖子。这是其中一个帖子。谢天谢地,他的公司,真实的教育,正在继续并延长授予所开发的工作。

本文于2014年首次出版,最近在2020年3月最新

在过去的几个月里,我已经曾在一些高中和中学工作,分级和评估实践只在标准世界中都不工作。学校并没有足够严格地进行局部评估,以通过低等级贬低学生的关注。该解决方案很简单:不一于不真思地将分数转化为等级。

问题。学校必须达到标准,当地评估应该准备孩子们处理PARCC和SB所测试的标准。但新的测试比大多数本地测试更难,更严格得分。因此,分数必须低。(任何人追随Naep结果已经知道这一年,唉。)这似乎始终陷入了漫长的评分传统,我们不想惩罚低年级的孩子(类似于急剧上学的愤怒,以策略措施急剧上升得分今年)。

然而,似乎没有替代:显着提高当地的性能标准似乎意味着我们必须降低学生成绩。或者,相反,我们可以将目前的平均平均A的学生在当地人身份,但随后对准备孩子的测试不那么严谨,并预测它们的结果(如果有效,那么当地评估肯定会这样做有用)。

请注意,所谓的“基于标准的评分”不是本质地解决了这个问题。仅仅因为我们转到基于标准的评分并不意味着分级是严格的。事实上,如果你看着使用基于标准的评级的学校,学生很少有人获得“得分”,这与“成绩”的范围大不相同(因此字母等级的替代品)在此前的这些学校。即,我们正在在标准引用的框架中进行基于标准的评分!当地失败是为了假设对标准的评估足以建立严格。但那是不够的;它不能自行工作。

什么是严谨?

教学不是建立的。因此,它不是通过框架教学来确定。严谨是我们的期望建立的:我们如何评估和评分学生工作。这意味着严谨由评估的三种不同元素建立:

任务或问题的难度

标准的难度,由rubrics建立

预期的成就水平,由“锚”或削减分数。

许多地区和学校现在甚至没有通过#1号码。常规,当我的同事和我审核本地评估时,测试比外部测试测试更容易 - 即使在相当良好的地区。通常的解释?公平分级的问题。

请注意,即使是艰巨的任务和高质量的标题甚至是艰难的任务,也不足以建立严格。该任务可能是挑战性和苛刻的标准 - 但如果学生产品或性能的期望非常低(由特定模型或本地规范建立),则评估并不严格。这就是为什么在国家测试中的“切割”得分为40或50的原因是一个可怕的解决方案 -如果目标是沟通基于标准的结果与找到一种传递大多数孩子的方法。

Think of the high jump or pole vault in track: you could enter a challenging event and be judged against the true criteria, but if the height you have to clear is absurdly low, then the assessment is not rigorous – even though it is ‘standards-based’ testing and scoring.

解决问题

一个解决方案?避免基于错误等效的思路计算。坚持曲目和场景来看解决方案:我们不需要,实际上,通过机械地转动它们跳入级别的高度,从来没有计算运动员的“成绩”,以任意,但易于使用的公式。为此,将较低的成绩大大降低,为少熟练的运动员提供强大的抑制措施。

相反,我们判断相对于早期跳高高度的进步和表现,并根据努力和高度收益寻找“适当”的增长。(我以前曾经读过这一点的长度这里这里。)但是,对所有跳线的期望都很高,不断增加。

如果将用于提醒学生,在学术界局部需要同样的解决方案,以便在不妨碍他们的情况下提醒学生。(这是落后的想法斯洛斯SGOS.在许多州。)所以,每年多次,他们的工作需要根据外部标准进行评估(由高质量测试和学生工作样本所建立)。“但我们必须在我们的在线成绩书中全年享受等级!”我知道。但是,由于一些不可思议的公式,我们将我们的智慧和判断在某种统一的基础上使用我们的智慧和判断来将他们的“得分”变成“成绩”。

例如,在针对国家标准的书写评估中,我们通过从释放的测试中剔除的国家样本来锚定评估。进一步假设使用6分量标。现在,假设在第一届政府中,10月份说,几乎所有学生都会得到一个1或2(那些是规模上的最低分数)。这是我们可能会说的分数给学生并变成了成绩:

“伙计们,我正在评分你的最佳写作。因此,您今年秋季的一年级将反映对您现在的位置的公平评估。分数为1将等于B-。分数为2将等于B +。在2上面的任何得分是A - 第一个学期的A - a -

“下一个学期,在冬季,获得同样的等级,您必须在规模上移动一个数字。并且春天,您必须向上移动2个数字以获得这些成绩。“

当然,这已经发生在AP和IB课程中。所以,在所有课程中都应该相对容易。我们所解决的问题:成绩成为公平,标准明确,随着时间的推移,有动力改善。

本文于2020年3月更新

这篇文章从帖子中摘录首先出现在格兰特的个人博客;可以找到补助金在这里的推特上;基于标准的评分只解决了一个问题的一半