Leistungsbeurteilung: Lerntheorien und Bewertungsmethoden

Einleitung

Wir wissen, dass Lernen inferentiell ist; wir beobachten es nicht direkt, sondern durch seine Produkte und Ergebnisse. Forschende und Praktiker, die mit Studierenden arbeiten, mögen glauben, dass die Studierenden gelernt haben, aber der einzige Weg, dies zu wissen, ist die Bewertung der Produkte und Ergebnisse des Lernens.

Bewertung beinhaltet “einen formellen Versuch, den Status von Studierenden in Bezug auf pädagogisch relevante Variablen von Interesse zu bestimmen” (Popham, 2008, S. 6). In der Schule ist die pädagogisch relevante Variable von Interesse am häufigsten die Leistung der Studierenden in Bereichen wie Lesen, Schreiben, Mathematik, Naturwissenschaften und Sozialkunde. Obwohl die Leistung der Studierenden schon immer von entscheidender Bedeutung war, wurde ihre Bedeutung durch den No Child Left Behind Act von 2001 der US-Bundesregierung unterstrichen (Shaul & Ganson, 2005). Dieses Gesetz enthält viele Bestimmungen (Popham, 2008). Zu den wichtigsten gehören die Anforderungen für jährliche Tests von Studierenden in den Klassen 3 bis 8 und erneut in der High School in Lesen und Mathematik sowie für Schulsysteme, um Steigerungen bei Studierenden nachzuweisen, die in diesen Fächern angemessene jährliche Fortschritte erzielen.

Zwei Punkte sind in Bezug auf diesen Text bemerkenswert. Obwohl Rechenschaftspflicht oft dazu führt, dass Tests das Mittel der Bewertung sind, umfasst letztere viele Messverfahren neben Tests (siehe unten). Forschende und Praktiker wollen wissen, ob Lernen stattgefunden hat, und es kann andere Verfahren als Tests geben, die Beweise für das Lernen der Studierenden liefern. Zweitens sind die Fähigkeiten der Studierenden in Inhaltsbereichen oft das bewertete Lernergebnis, aber Forschende und Praktiker können auch an anderen Formen des Lernens interessiert sein. Zum Beispiel möchten sie vielleicht wissen, ob die Studierenden neue Einstellungen oder Selbstregulierungsstrategien erlernt haben oder ob sich die Interessen, Werte, Selbstwirksamkeit und Motivation der Studierenden infolge des Inhaltslernens verändert haben.

Dieser Abschnitt behandelt Möglichkeiten zur Bewertung der Produkte oder Ergebnisse des Lernens. Zu diesen Methoden gehören direkte Beobachtungen, schriftliche Antworten, mündliche Antworten, Bewertungen durch andere und Selbsteinschätzungen.

Direkte Beobachtungen

Direkte Beobachtungen sind Instanzen von Schülerverhalten, die wir beobachten, um zu beurteilen, ob Lernen stattgefunden hat. Lehrkräfte setzen direkte Beobachtungen häufig ein. Eine Chemielehrkraft möchte, dass Schülerinnen und Schüler Laborverfahren erlernen. Die Lehrkraft beobachtet die Schülerinnen und Schüler im Labor, um festzustellen, ob sie die korrekten Verfahren anwenden. Eine Sportlehrkraft beobachtet Schülerinnen und Schüler beim Dribbeln eines Basketballs, um zu beurteilen, wie gut sie die Fähigkeit erlernt haben. Eine Grundschullehrkraft beurteilt, wie gut Schülerinnen und Schüler die Klassenregeln gelernt haben, basierend auf ihrem Verhalten im Unterricht.

Direkte Beobachtungen sind valide Indikatoren für Lernen, wenn sie unkompliziert sind und wenig Rückschlüsse durch Beobachter erfordern. Sie funktionieren am besten, wenn die Verhaltensweisen spezifiziert werden können und die Schülerinnen und Schüler dann beobachtet werden können, um festzustellen, ob ihre Verhaltensweisen dem Standard entsprechen.

Methoden zur Beurteilung von Lernen.
Kategorie Definition
Direkte Beobachtungen Instanzen von Verhalten, die Lernen demonstrieren
Schriftliche Antworten Schriftliche Leistungen in Tests, Quiz, Hausaufgaben, Arbeiten und Projekten
Mündliche Antworten Verbalisierte Fragen, Kommentare und Antworten während des Lernens
Bewertungen durch andere Beurteilungen von Lernenden durch Beobachter hinsichtlich lernindikativen Attributen
Selbstberichte Einschätzungen von Personen über sich selbst
Fragebögen Schriftliche Bewertungen von Elementen oder Antworten auf Fragen
Interviews Mündliche Antworten auf Fragen
Stimulierte Erinnerungen Erinnerung an Gedanken, die die eigenen Leistungen zu bestimmten Zeiten begleiten
Lautes Denken Lautes Verbalisieren der eigenen Gedanken, Handlungen und Gefühle während der Ausführung einer Aufgabe
Dialoge Gespräche zwischen zwei oder mehr Personen

Ein Problem bei direkten Beobachtungen besteht darin, dass sie sich nur auf das konzentrieren, was beobachtet werden kann, und daher die kognitiven und affektiven Prozesse umgehen, die Handlungen zugrunde liegen. Zum Beispiel weiß die Chemielehrkraft, dass Schülerinnen und Schüler Laborverfahren gelernt haben, aber sie oder er weiß nicht, was die Schülerinnen und Schüler denken, während sie die Verfahren durchführen oder wie zuversichtlich sie sind, gute Leistungen zu erbringen.

Ein zweites Problem ist, dass, obwohl die direkte Beobachtung eines Verhaltens anzeigt, dass Lernen stattgefunden hat, das Fehlen eines angemessenen Verhaltens nicht bedeutet, dass kein Lernen stattgefunden hat. Lernen ist nicht dasselbe wie Leistung. Viele andere Faktoren als Lernen können die Leistung beeinflussen. Schülerinnen und Schüler führen möglicherweise keine gelernten Handlungen aus, weil sie nicht motiviert, krank oder mit anderen Dingen beschäftigt sind. Wir müssen diese anderen Faktoren ausschließen, um aus dem Fehlen von Leistung zu schließen, dass kein Lernen stattgefunden hat. Dies erfordert die Annahme – die zuweilen unberechtigt sein kann –, dass Schülerinnen und Schüler normalerweise versuchen, ihr Bestes zu geben, und wenn sie keine Leistung erbringen, haben sie nicht gelernt.

Schriftliche Antworten

Das Lernen wird oft anhand der schriftlichen Antworten der Schüler auf Tests, Quizze, Hausaufgaben, Semesterarbeiten und Berichte beurteilt. Basierend auf dem in den Antworten erkennbaren Grad der Beherrschung entscheiden die Lehrkräfte, ob ein ausreichendes Lernen stattgefunden hat oder ob zusätzlicher Unterricht erforderlich ist, weil die Schüler das Material nicht vollständig verstehen. Nehmen wir beispielsweise an, dass eine Lehrkraft eine Einheit über die Geographie von Hawaii plant. Zunächst geht die Lehrkraft davon aus, dass die Schüler wenig über dieses Thema wissen. Ein Vortest, der vor Beginn des Unterrichts durchgeführt wird, wird die Annahme der Lehrkraft bestätigen, wenn die Schüler schlecht abschneiden. Die Lehrkraft testet die Schüler nach der Unterrichtseinheit erneut. Zuwächse bei den Testergebnissen veranlassen die Lehrkraft zu dem Schluss, dass die Lernenden sich Wissen angeeignet haben.

Ihre relative Benutzerfreundlichkeit und ihre Fähigkeit, eine Vielzahl von Materialien abzudecken, machen schriftliche Antworten zu wünschenswerten Indikatoren für das Lernen. Wir gehen davon aus, dass schriftliche Antworten das Lernen widerspiegeln, aber viele Faktoren können die Leistung des Verhaltens beeinflussen, selbst wenn die Schüler gelernt haben. Schriftliche Antworten setzen voraus, dass wir glauben, dass die Schüler ihr Bestes geben und dass keine äußeren Faktoren (z. B. Müdigkeit, Krankheit, Betrug) wirken, die dazu führen, dass ihre schriftlichen Arbeiten nicht das widerspiegeln, was sie gelernt haben. Wir müssen versuchen, äußere Faktoren zu identifizieren, die die Leistung beeinträchtigen und die Bewertung des Lernens trüben können.

Mündliche Antworten

Mündliche Antworten sind ein integraler Bestandteil der Schulkultur. Lehrkräfte fordern Schüler auf, Fragen zu beantworten und das Lernen anhand dessen zu beurteilen, was sie sagen. Schüler stellen auch während des Unterrichts Fragen. Wenn ihre Fragen ein mangelndes Verständnis erkennen lassen, ist dies ein Signal dafür, dass kein angemessenes Lernen stattgefunden hat.

Wie bei schriftlichen Antworten gehen wir davon aus, dass mündliche Antworten gültige Widerspiegelungen dessen sind, was Schüler wissen, was möglicherweise nicht immer der Fall ist. Darüber hinaus ist die Verbalisierung eine Aufgabe, und es kann Probleme bei der Übersetzung dessen, was man weiß, in seinen mündlichen Ausdruck geben, aufgrund von unbekannter Terminologie, Angst vor dem Sprechen oder sprachlichen Schwierigkeiten. Lehrkräfte können das, was Schüler sagen, umformulieren, aber eine solche Umformulierung spiegelt möglicherweise nicht genau die Art der Gedanken der Schüler wider.

Bewertungen durch Andere

Eine andere Möglichkeit zur Beurteilung des Lernens besteht darin, dass Einzelpersonen (z. B. Lehrkräfte, Eltern, Verwaltungsangestellte, Forschende, Gleichaltrige) Schülerinnen und Schüler hinsichtlich der Quantität oder Qualität ihres Lernens bewerten. Diese Bewertungen durch Andere (z. B. “Wie gut kann Timmy Aufgaben vom Typ 52 x 36 = ? lösen?” “Welche Fortschritte hat Alicia in den letzten 6 Monaten in ihren Druckfähigkeiten gemacht?”) liefern nützliche Daten und können helfen, Schülerinnen und Schüler mit besonderen Bedürfnissen zu identifizieren (z. B. “Wie oft benötigt Matt zusätzliche Zeit zum Lernen?” “Wie schnell beendet Jenny ihre Arbeit?”).

Ein Vorteil von Bewertungen durch Andere besteht darin, dass Beobachterinnen und Beobachter möglicherweise objektiver über Schülerinnen und Schüler urteilen als Schülerinnen und Schüler über sich selbst (Selbstberichte, die im Folgenden behandelt werden). Bewertungen können auch für Lernprozesse abgegeben werden, die Handlungen zugrunde liegen (z. B. Verständnis, Motivation, Einstellungen) und dadurch Daten liefern, die durch direkte Beobachtungen nicht zu erhalten sind; zum Beispiel: “Wie gut versteht Seth die Ursachen des Zweiten Weltkriegs?” Bewertungen durch Andere erfordern jedoch mehr Schlussfolgerungen als direkte Beobachtungen. Es kann problematisch sein, die Lernleichtigkeit, das Verständnis oder die Einstellungen von Schülerinnen und Schülern genau einzuschätzen. Darüber hinaus erfordern Bewertungen, dass sich Beobachterinnen und Beobachter daran erinnern, was Schülerinnen und Schüler tun, und werden verzerrt, wenn sich die Bewertenden selektiv nur an positive oder negative Verhaltensweisen erinnern.

Selbstauskünfte

Selbstauskünfte sind Einschätzungen und Aussagen von Personen über sich selbst. Selbstauskünfte gibt es in verschiedenen Formen: Fragebögen, Interviews, stimulierte Erinnerungen, Lautes Denken und Dialoge.

Fragebögen präsentieren den Befragten Elemente oder Fragen, die sich auf ihre Gedanken und Handlungen beziehen. Die Befragten können die Arten von Aktivitäten, an denen sie teilnehmen, aufzeichnen, ihre wahrgenommenen Kompetenzniveaus bewerten und beurteilen, wie oft oder wie lange sie sich damit beschäftigen (z. B. “Wie lange lernen Sie schon Spanisch?” “Wie schwierig ist es für Sie, geometrische Theoreme zu lernen?”). Viele Selbstauskunftsinstrumente fordern die Befragten auf, Bewertungen auf numerischen Skalen aufzuzeichnen (“Bewerten Sie auf einer 10-Punkte-Skala, wobei 1 = niedrig und 10 = hoch ist, wie gut Sie im Kürzen von Brüchen sind.”).

Interviews sind eine Art Fragebogen, bei dem ein Interviewer die Fragen oder Diskussionspunkte präsentiert und der Befragte mündlich antwortet. Interviews werden in der Regel einzeln geführt, obwohl auch Gruppen interviewt werden können. Ein Forscher könnte einen Lernkontext beschreiben und die Schüler fragen, wie sie typischerweise in dieser Umgebung lernen (z. B. “Wenn der Französischlehrer eine Lektion beginnt, was sind Ihre Gedanken? Wie gut werden Sie Ihrer Meinung nach abschneiden?”). Interviewer müssen die Befragten möglicherweise auffordern, wenn die Antworten zu kurz oder nicht aussagekräftig sind.

Bei der stimulierten Erinnerungsprozedur arbeiten die Personen an einer Aufgabe und erinnern sich anschließend an ihre Gedanken zu verschiedenen Zeitpunkten während der Aufgabe. Interviewer befragen sie (z. B. “Worüber haben Sie nachgedacht, als Sie hier stecken geblieben sind?”). Wenn die Leistung auf Video aufgezeichnet wurde, sehen sich die Befragten diese anschließend an und erinnern sich, insbesondere wenn die Interviewer die Aufnahme stoppen und Fragen stellen. Es ist unerlässlich, dass die Erinnerungsprozedur bald nach der Leistung abgeschlossen wird, damit die Teilnehmer ihre Gedanken nicht vergessen.

Lautes Denken sind Prozeduren, bei denen die Schüler ihre Gedanken, Handlungen und Gefühle verbalisieren, während sie an einer Aufgabe arbeiten. Verbalisierungen können von Beobachtern aufgezeichnet und anschließend nach dem Verständnisgrad bewertet werden. Lautes Denken erfordert, dass die Befragten verbalisieren; viele Schüler sind es nicht gewohnt, während der Arbeit in der Schule laut zu sprechen. Lautes Sprechen mag manchen unangenehm erscheinen, und sie fühlen sich möglicherweise befangen oder haben Schwierigkeiten, ihre Gedanken auszudrücken. Die Forscher müssen die Schüler möglicherweise auffordern, wenn sie nicht verbalisieren.

Eine andere Art der Selbstauskunft ist der Dialog, der ein Gespräch zwischen zwei oder mehr Personen während einer Lernaufgabe ist. Wie das laute Denken können Dialoge aufgezeichnet und analysiert werden, um Aussagen zu identifizieren, die auf Lernen hindeuten, und Faktoren, die das Lernen in der Umgebung zu beeinflussen scheinen. Obwohl Dialoge tatsächliche Interaktionen verwenden, während die Schüler an einer Aufgabe arbeiten, erfordert ihre Analyse eine Interpretation, die über die tatsächlichen Elemente in der Situation hinausgehen kann.

Die Wahl des Selbstauskunftsmaßes sollte dem Zweck der Bewertung entsprechen. Fragebögen können viel Material abdecken; Interviews sind besser geeignet, um einige wenige Themen eingehend zu untersuchen. Stimulierte Erinnerungen fordern die Befragten auf, sich an ihre Gedanken zu dem Zeitpunkt zu erinnern, als die Handlungen stattfanden; lautes Denken untersucht gegenwärtige Gedanken. Dialoge ermöglichen die Untersuchung sozialer Interaktionsmuster.

Selbstauskunftsinstrumente sind in der Regel einfach zu entwickeln und zu verwalten; Fragebögen sind in der Regel einfach auszufüllen und auszuwerten. Ein Problem kann entstehen, wenn Schlussfolgerungen über die Antworten der Schüler gezogen werden müssen. Es ist wichtig, ein zuverlässiges Bewertungssystem zu haben. Weitere Bedenken hinsichtlich Selbstauskünften sind, ob die Schüler sozial akzeptable Antworten geben, die nicht mit ihren Überzeugungen übereinstimmen, ob die selbstberichteten Informationen dem tatsächlichen Verhalten entsprechen und ob kleine Kinder in der Lage sind, sich selbst genau zu berichten. Indem sie garantieren, dass die Daten vertraulich sind, können die Forscher dazu beitragen, ehrliche Antworten zu fördern. Ein gutes Mittel zur Validierung von Selbstauskünften ist die Verwendung mehrerer Bewertungen (z. B. Selbstauskünfte, direkte Beobachtungen, mündliche und schriftliche Antworten). Es gibt Hinweise darauf, dass Selbstauskünfte ab etwa der dritten Klasse valide und zuverlässige Indikatoren für die Überzeugungen und Handlungen sind, die sie bewerten sollen (Assor & Connell, 1992), aber die Forscher müssen Selbstauskünfte vorsichtig verwenden, um potenzielle Probleme zu minimieren.