Schulnoten lassen keine Vergleiche zu – ein Studienergebnis aus Deutschland
Im September 2023 ist in der Zeitschrift für Erziehungswissenschaften eine Studie erschienen, die untersucht, ob Schulnoten Vergleiche zwischen Schüler:innen zulassen:
Im Folgenden fasse ich die wesentlichen Einsichten zusammen.
In der Einleitung diskutieren die Autor:innen die klassischen Gütekriterien von Schulnoten und fassen die Forschung zusammen. Zugespitzt konstatieren sie eine »geringe Konstruktvalidität«, eine »mäßige Reliabilität« sowie »mangelnde Objektivität«. Einzig die Prognosevalidität von Noten scheint solide zu sein: Sie sagen zukünftige Erfolge besser voraus als Leistungstests; wahrscheinlich, weil sie Arbeitshaltungen und Anpassungsfähigkeiten ebenfalls ausdrücken können.
Die Untersuchung zu Vergleichbarkeit orientiert sich an zwei Perspektiven:
- Vergleichbarkeit von Schulnoten wird als »Abweichung zwischen der tatsächlichen standardisierten Leistung (Kriterium) und der auf Basis der Note (Prädiktor) vorhergesagten standardisierten Leistung« definiert (S. 10).
- Die »Abweichung zwischen der tatsächlichen Note (Kriterium) und der auf Basis der standardisierten Testleistung (Prädiktor) vorhergesagten Note« ist ausschlaggebend für die Beurteilung der Vergleichbarkeit (bzw. Nicht-Vergleichbarkeit) (ebd.)
Die Studie wertete Noten und Leistungstests in Englisch und Mathematik für über 30'000 Schüler:innen aus. Das Ergebnis fiel wie folgt aus:
Bei einer Betrachtung der Befunde wird zunächst deutlich, dass Noten insgesamt nur einen überschaubaren Anteil der Variation der Testleistung erklären können (ca. 19 bis 27%). […] Darüber hinaus zeigte sich, dass der überwiegende Anteil der Leistungsvarianz bei identischen Noten und der Notenvarianz bei identischer Testleistung aus Unterschieden innerhalb von Schulen resultierte, gefolgt von Schulunterschieden und Bundeslandunterschieden. (S. 26)
Die Einsicht, dass insbesondere Schulen einen wesentlichen Anteil an der Abweichung von Noten zu standardisierten Tests haben, zeigt, dass Unterschiede zwischen Bundesländern weniger wichtig sind als angenommen.
Abschließend äußern die Autor:innen Zweifel daran, ob Noten überhaupt vergleichbar gemacht werden könnten:
Auf Basis der vorliegenden Studie drängt sich schließlich auch die Frage auf, ob eine über alle beteiligten Ebenen hinweggehende Vergleichbarkeit von Noten (a) überhaupt realistisch ist oder es sich hierbei nicht eher um ein unerreichbares Ziel handelt und (b), ob sie überhaupt erstrebenswert wäre (wenn dafür z. B. eine deutlich höhere Standardisierung der Bewertungsprozesse nötig wäre, die z. B. keine sozialen oder individuellen Entwicklungsverläufe berücksichtigt). Die Frage nach der Vergleichbarkeit ist eng verknüpft mit der Frage nach den Funktionen von Noten. Sollen diese primär zum Mikro-Management innerhalb der Klasse eingesetzt werden, beispielsweise zur formativen Leistungsrückmeldung oder Motivierung, nicht aber, um Schülerinnen und Schüler über Klassen und Schulen hinweg miteinander zu vergleichen, besteht möglicherweise gar keine Notwendigkeit Vergleichbarkeit für pädagogische Prozesse einzufordern. Zudem erscheint es in Anbetracht der zahlreichen, nahezu unmöglich in Gänze kontrollierbaren Faktoren, die zur eingeschränkten Vergleichbarkeit von Noten führen, praktisch kaum möglich zu sein, Noten vollends „vergleichbar zu machen“. Sollen Noten also für Vergleiche verwendet werden, stellt sich hier grundsätzlich die Frage, ob das „Herumdoktern“ an der Notenvergleichbarkeit nicht immer in Teilen „vergebliche Liebesmühe“ bleiben wird, weil es sich hierbei um eine „notwendige, aber kontrafaktische Annahme“ handelt.