Was Noten verzerrt – die Wolter/Oggenfuss-Studie

Chantal Oggenfuss (Schweizerische Koordinationsstelle für Bildungsforschung) und Stefan Wolter (Universität Bern) haben über mehrere Jahre die Noten von 3000 Schüler:innen im Kanton Basel-Stadt überprüft und im Frühling 2025 die Ergebnisse veröffentlicht (mit ist nicht klar, weshalb mit Steuergeld finanzierte Studien weiterhin hinter Paywalls publiziert werden).

In zwei Fächern (Deutsch und Mathematik) haben sie dabei drei Grössen verglichen:

  1. Zeugnisnote im Herbstsemester
  2. standardisierte Testergebnisse, die den Lehrpersonen mitgeteilt wurden
  3. Zeugnisnoten im Frühlingssemester (nach der Bekanntgabe der Ergebnisse aus 2 an Lehrpersonen, Eltern und Schüler:innen.)

Dabei haben sich folgende Ergebnisse gezeigt:

  • Die Noten sind im Vergleich mit den standardisierten Tests durch mindestens drei Faktoren verzerrt:
    a) Geschlecht: Mädchen erhalten bessere Noten als Knaben
    b) Erstsprache: Kinder, die nicht Deutsch als Erstsprache sprechen, erhalten schlechtere Noten als die anderen
    c) Stärke der Klasse: der «Big Fish, Little Pond»-Effect spielt auch in der Schweiz. Je stärker die Klasse, desto schlechter die Noten einzelner Schüler:innen (und umgekehrt).
  • Die drei Faktoren wirken kumulativ, d.h. ihre Effekte addieren sich. Knaben mit nicht-deutscher Erstsprache in starken Klassen erhalten bis zu 0.6 Noten schlechtere Noten als Mädchen mit deutsch als Erstsprache in einer schwachen Klasse – bei identischen Leistungen in standardisierten Tests.
  • Die Verzerrungen sind persistent: Auch nachdem Lehrpersonen, Eltern und Schüler Einsicht in die standardisierten Testergebnisse erhielten, blieben die systematischen Unterschiede in der Notenvergabe bestehen. Dies deutet darauf hin, dass die allgemeine Rückmeldung von Testresultaten ohne explizite Sensibilisierung für Verzerrungen nicht ausreicht, um das Bewertungsverhalten zu ändern.

Die Studie bestätigt Ergebnisse einer Untersuchung, bei der bei 14'000 deutschen Schüler:innen auch weitere Verzerrungen festgestellt wurde: So hat auch der Name und das Körpergewicht einen Einfluss auf Noten.

Welche Schlüsse sollten wir aus diesen Untersuchungen ziehen?

  1. Noten sind nicht fair. Sie bevorzugen und benachteiligen – auch wenn Lehrpersonen das eigentlich besser wissen sollten.
  2. Es gibt privilegierte und diskriminierte Gruppen. Das Bildungssystem schafft Vor- und Nachteile für bestimmte Menschen.
  3. Zwei Vorstellungen bieten sich an, die den heutigen Zustand korrigieren könnten:
    a) Mehr Bewusstsein für Verzerrungen bei Lehrpersonen schaffen, z.B. in der Ausbildung.
    b) Für Bewertungen nur standardisierte Tests einsetzen.
    Ich bezweifle, dass diese Alternativen das Problem lösen können. Lehrpersonen verzerren Noten nicht bewusst, sondern aufgrund von unbewussten Vorurteilen und Wertungen. Solange sie bewerten müssen, werden sich solche Verzerrungen einschleichen. Dasselbe gilt für standardisierte Tests: Diese sind ja wiederum nicht objektiv/valide/reliabel. Sie können nicht alle Kompetenzfacetten neutral messen – wir nehmen einfach an, sie könnten das. Letztlich gibt es keinen Vergleichspunkt, weil wir nicht objektiv feststellen können, welchen Wert eine schulische Leistung hat.

Das Fazit ist wie immer: Die Ungerechtigkeit verschwindet nur, wenn Noten verschwinden. Sie stressen nicht nur, sondern sie sind ungerecht.

Subscribe to Beurteilung & Unterricht

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe
Mastodon