Haben Ziffernoten in einer Besseren Schule Platz?

Die SPÖ Wien hat vor einigen Tagen viele Grundsatzanliegen zum Thema Bildung und Schule bei der sogenannten „Wiener Konferenz“ beschlossen. In der Öffentlichkeit wurden daraufhin vor allem die Notwendigkeit der Matura und der Ziffernnoten diskutiert. Viele Aspekte kamen auch zu kurz, wie zum Beispiel Fragen der Inklusion oder die Forderung nach der Gesamtschule. Alle Anträge können hier in einem PDF heruntergeladen und nachgelesen werden. Es sind viele spannende Aspekte darin enthalten, die wir bei künftigen Gesprächen mit Verantwortlichen in Wien auch verwenden können, um auf Umsetzung zumindest in Wien zu pochen.


Wir wollen zum Thema Ziffernnoten hier einen fundierten und mit wissenschaftlichen Belegen untermauerten Beitrag zur Diskussion leisten. Dieser Text und die angeführten Quellen können auch als Argumentationsgrundlage dienen, wenn ihr in eurem Bekanntenkreis den Sinn von Ziffernnoten diskutiert.

Eignung von Ziffernnoten


Um die Eignung von Ziffernnoten zu bewerten, muss man zuerst einmal betrachten, welche Funktionen die Leistungsbeurteilung hat. Die wichtigste Funktion ist zweifellos die Rückmeldung an die SchülerInnen, die sich positiv auf den Lernprozess und die Motivation auswirken soll. Für die Eltern erfüllt die Leistungsbeurteilung eine Berichtsfunktion, indem sie zeigt wo die Schülerin steht und sie dient de facto der Selektion, der Auslese, denn die Noten entscheiden etwa über die Zulassung zu einer bestimmten Schulart.

Damit man Leistung überhaupt bewerten kann, braucht es immer einen Vergleichsmaßstab. Das heißt, die Leistung muss an irgendetwas gemessen werden. Es gibt im Grunde drei Maßstäbe:

die Leistung im Vergleich zu anderen,

die Leistung im Vergleich zu inhaltlichen Kriterien (gemessen am Lernstoff)

und die Leistung im Vergleich zum Wissen/Können früher (gemessen am Lernfortschritt)

Abhängig vom gewählten Maßstab wird dieselbe Leistung unterschiedlich bewertet.

Studien zeigen, dass in der Schule bei der Vergabe der Noten im Allgemeinen der Vergleich zu den Leistungen innerhalb der Klasse dominiert. (vgl. Brügelmann et al, 2006; Eder et al., 2009). Denn das Wissen im Vergleich zu früher, also den Lernfortschritt, in einer Note auszudrücken ist kaum möglich. Und sieht man sich den großen Umfang des Lernstoffs in einem Semester oder gar einem ganzen Jahr an wird ebenfalls deutlich, dass das Zusammenführen aller Leistungen in einer einzigen Note, kaum noch aussagekräftig ist.

Für den Lernprozess förderlich gilt aber Feedback auf genau jene Bereiche, die durch Noten nicht berücksichtigt werden (können): nämlich Feedback, bezogen auf den Lernfortschritt und bezogen auf den Lernstoff. Doch darauf werden wir später noch näher eingehen.

Qualität und Aussagekraft von Noten

Betrachten wir zuerst noch die Qualität der Noten und die Frage: Wie aussagekräftig sind Noten wirklich? Eine Reihe von Studien (Brügelmann et al 2006; Eder, Neuweg und Thonhauser 2009; Hesse & Latzko 2017; Ingenkamp & Lissmann 2008) untersuchte Noten anhand der wissenschaftlichen Kriterien Objektivität, Gültigkeit und Verlässlichkeit. Mit

Objektivität ist gemeint, ob die Leistungsbeurteilung unabhängig von der beurteilenden Person ist.

Mit Gültigkeit ist gemeint, ob das tatsächlich gemessen wird, was zu messen vorgegeben wird.

Mit Verlässlichkeit ist die Leistungsbeurteilung unabhängig von äußeren Umständen wie z.B. des Beurteilungszeitpunkts gemeint.

Zusammengefasst: die Studien belegen allesamt, dass es Noten an diesen Kriterien mangelt.

Was die Objektivität betrifft: Noten beruhen auf Lehrerinnenurteilen. Demnach sind sie in höchstem Maße personenabhängig. Bereits in den 70ern (Ingenkamp 1976) wurde nachgewiesen, dass für dieselbe Arbeit von unterschiedlichen Lehrpersonen die gesamte Notenskala ausgeschöpft wird. Dieser Befund konnte in vielen Studien der letzten Jahrzehnte repliziert werden. Das gilt übrigens nicht nur für offenere Formate wie Deutsch-Aufsätze sondern auch für Mathematik-Arbeiten. Darüber hinaus spielen sachfremde Informationen (wie z.B. der Sprachstil bei naturwissenschaftlichen Arbeiten) eine große Rolle und es gibt eine nachgewiesene, systematische Verzerrung der Notengebung durch Merkmale wie Geschlecht oder soziale Herkunft.

Die Frage nach der Gültigkeit, also ob tatsächlich gemessen wird, was zu messen vorgegeben wird, offenbart ein grundsätzliches Problem. Denn Noten geben vor, den Lernstand anzugeben. Nun ist der Lernstoff eines Semesters oder gar Jahres in den meisten Fächern aber so umfangreich, dass die Zeugnisnote den Lernstand einfach nicht adäquat abbilden KANN.

Andere Studien versuchten die Gültigkeit von Noten aufgrund ihrer Vorhersagekraft zu überprüfen. Das heißt, wie gut geben Noten darüber Auskunft, wie erfolgreich Schüler*innen in späteren Abschnitten des Bildungssystems sein werden? Auch hier ist der Zusammenhang und damit die Gültigkeit gering. (Eder et al 2009, Brügelmann et al 2006).

Schließlich mangelt es auch an Verlässlichkeit, also an der Unabhängigkeit von äußeren Umständen. So haben die Zahl von Prüfungen und deren Reihenfolge wesentlichen Einfluss auf die Noten. Dieselbe Arbeit wurde anders beurteilt, je nachdem ob sie nach sehr guten oder nach weniger guten Arbeiten bewertet wurde. Es konnte auch gezeigt werden, dass dieselbe Arbeit von derselben Lehrperson unterschiedlich beurteilt wurde, wenn sie mit zeitlichem Abstand zweimal benotet wurde. (Brügelmann 2006)

Basierend auf diesen Analysen erweisen sich Ziffernnoten als unzureichend. Welche Rückschlüsse lassen sich daraus also auf die eingangs erwähnten Funktionen Rückmeldung, Bericht und Selektion ziehen?

Erfüllen Ziffernnoten die Funktion einer differenzierten Rückmeldung?

Rückmeldung ist zweifellos die fundamentalste Funktion der Leistungsbeurteilung für das Lernen. Man geht heute davon aus, dass inhaltliche Rückmeldungen im Lernprozess überragend wichtig sind für effektives Lernen. Damit sie lernförderlich sind, sollten Rückmeldungen möglichst unmittelbar und lernbegleitend erfolgen. Sie sollten einen klaren Bezug zu den Lernzielen herstellen und in einem Dialog erfolgen. (Winter, 2015) Darüber hinaus wird Feedback erst wirksam, wenn sich der oder die Lernende auch tatsächlich damit auseinandersetzt (Hattie & Timperley, 2007; Nicol & Macfarlane‐Dick, 2006). Das alles spricht eindeutig für eine differenzierte Leistungsbeurteilung und gegen Ziffernnoten. (Beispiele für eine differenzierte Leistungsbeurteilung sind zb. das ADELE-System an der Integrativen Lernwerkstatt Brigittenau).

Aber wie ist es, wenn Ziffernnoten durch differenzierte Rückmeldungen ergänzt werden, wie es das Bildungsministerium seit 2018 vorsieht?

In einer neuseeländischen Studie von 2008 wurde die Wirkung von Noten und/oder Feedback auf die Lernfortschritte untersucht. Das Ergebnis war eindeutig:

Wer gar keine Rückmeldung erhält, lernt am langsamsten denn er/sie wird allein gelassen.

Wer nur Noten bekommt, lernt ein wenig besser.

Bei Noten und differenziertem Feedback wird schon deutlich schneller gelernt.

Wer nur differenziertes Feedback erhält, lernt mit Abstand am besten.

Der Grund dafür ist laut Studie, dass Noten die gesamte Aufmerksamkeit auf sich ziehen. Die Lernenden setzen sich durch Noten nicht mehr mit dem Inhalt des Feedbacks auseinander. Damit verblassen die Vorteile der differenzierten Leistungsbeurteilung.

In ihrer Berichtsfunktion sollen Noten vor allem die Eltern informieren, wo ihre Kinder stehen. Doch wie bereits dargelegt, KANN eine Jahresnote die tatsächlichen Leistungen in einem Fach nicht adäquat abbilden und ist deshalb nicht aussagekräftig.

Bezüglich der Auslesefunktion wird in einer zusammenfassenden Analyse angemerkt, dass die geringe Vorhersagekraft und die mangelnde Objektivität und Zuverlässigkeit, den Noten die Grundlage für Selektionsentscheidungen“ entziehen (ebd., S. 27). Deshalb müssen bei der Leistungsbeurteilung „die Förder- und Berichtsfunktion Vorrang haben“ (2006, S. 40).

Noten sind weder objektiv noch aussagekräftig oder zuverlässig. Sie geben maximal Auskunft über die Leistungsunterschiede innerhalb der einzelnen Klassen, taugen aber nicht als motivierende oder lerndienliche Rückmeldungen, was doch Sinn und Zweck von Leistungsbeurteilung ist.

Noten sind nicht „böse“ und wir wollen auch keine Schule, ohne Leistung, ohne sich anstrengen, ohne lernen.

Noten sind einfach das falsche Messinstrument.