
„Sicheres Prüfen im Fernunterricht“, versprach ein auf Twitter und Linkedin geteilter Beitrag des Gymnasiallehrers Jürg Widrig im März 2020: Wer die von ihm konzipierte Software isTest2 nutze, könnte die Schüler:innen gleichzeitig dazu auffordern, sich mit ihrem Handy zu filmen. So sei es der Lehrperson über Zoom möglich einzusehen, ob Lernende unerlaubte Hilfestellungen beiziehen.
Widrig unterstützte mit seinem Beitrag Lehrkräfte, die Wege suchten, um Prüfungen „sicher“ durchführen zu können. Sicherheit bezieht sich dabei auf unterschiedliche Komponenten: erstens auf das technische Verfahren, das so verlässlich sein sollte wie schriftliche Prüfungen auf Papier, zweitens auf die Vergleichbarkeit der Lernenden, die alle individuell und ohne Hilfe die Prüfung bewältigen müssen, und drittens auf schulische oder rechtliche Vorgaben, welche die Modalitäten einer Prüfung festlegen, die gegenüber Rekursen „sicher“ ist.
Die Orientierung an Sicherheit lässt sich auch auf Hochschulebene beobachten: Sogenannte Proctoring-Systeme bieten verschiedene Formen von Überwachung an, die verhindern sollen, dass Studierende bei Online-Prüfungen betrügen können. Eine kritische Prüfung dieser Verfahren, wie sie etwa Lee und Fanguy (2022) vorgenommen haben, zeigt allerdings, dass sie eine Reihe von Konsequenzen haben. So werden überholte didaktische Settings, ein „teaching to the test“, bestärkt. Der Fokus auf Betrugsversuche beeinflusst die Beziehungen zwischen Studierenden und Lehrenden negativ. Und schließlich kann sich gesellschaftliche Ungleichheit auf das Ergebnis auswirken, denn Proctoring-Verfahren gehen davon aus, dass alle Studierenden Prüfungen unter idealen Rahmenbedingungen ablegen können. Wer aber mit Menschen zusammenlebt, die während Prüfungen laut sind oder im Hintergrund sichtbar werden, muss damit rechnen, als Betrüger:in ausgeschlossen zu werden.
Ein falscher Prüfungsmodus
Die technologische Entwicklung der Prüfungskultur beruht nicht nur auf schematischen und unterkomplexen Vorstellungen von Lernen und Wissensmanagement, sondern steht zudem in einem eklatanten Widerspruch zu den Merkmalen einer Kultur der Digitalität, wie sie Felix Stalder 2016 umrissen hat: Gemeinschaftlichkeit, Referentialität und Algorithmizität bedeuten grundsätzlich, dass Wissen in einer Kultur, in der das Netz Leitmedium ist, durch Zusammenarbeit, Kuration von bestehenden Texten und Verwendung von Programmen entsteht. Proctoring-Systeme werden hingegen eingesetzt, um gerade diese drei Typen von Verfahren bei Prüfungen zu verhindern und Menschen, die sie einsetzen wollen, zu bestrafen. Die Vorstellung einer Prüfung, in der Lernende in beschränkter Zeit, ohne Kommunikation mit anderen Menschen und ohne Beizug von Fachliteratur Aufgaben bearbeiten, steht in einem krassen Kontrast zur Problembearbeitung in professionellen Kontexten. Niemand erbringt heute eine Leistung so, wie das bei Prüfungen verlangt wird. Wer vor einer Herausforderung steht, begegnet ihr nie in dem Modus, der bei Prüfungen erfordert wird.
Wer auf diesen Gegensatz hinweist, wird auf Sachzwänge verwiesen: Einerseits würden Gesetze oder schulische Konventionen diese Formen von Prüfungen erzwingen, andererseits seien Noten für die künftige Ausbildung nötig. Wie aber ist diese Prüfungskultur, die im Grunde in einem Gegensatz zu konsensfähigen Vorstellungen von Professionalität und Leistung stehen, überhaupt entstanden?
„Spannungsreiche Logik“: Prüfungen als pädagogische Praxis
Prüfungen sind nicht primär aufgrund externer Faktoren ein zentrales Scharnier im Bildungssystem, vielmehr entsprechen sie der sich wandelnden Machstruktur der pädagogischen Arbeit.
Foucault hat in der Strafgesellschaft-Vorlesungsreihe darauf hingewiesen, dass die Logik der Prüfung die Probeabgelöst habe. Wurden an mittelalterlichen Universitäten oder in der Erziehung von Adligen Menschen erprobt, so wird diese Konzeption spätestens seit der Einführung des Abiturs in Deutschland am Ende des 18. Jahrhunderts von der Vorstellung des Bemessens und Beurteilens abgelöst. Die Struktur der Probe ist zweiteilig: Lernende erproben sich in etwas, oft in der Fähigkeit, selbst lehren zu können. Die Prüfung hingegen ist dreiteilig: Lehrende prüfen Lernende hinsichtlich ihrer Auseinandersetzung mit einem Lerngegenstand. Diese Struktur führt zu spezifischen Fragen und Aufgaben, die drei Funktionen erfüllen müssen: Erstens dürfen ihre Antworten nicht offensichtlich oder Resultat einer Beobachtung sein, zweitens sollten sie leicht beurteilbar sein und drittens müssen sie vom geprüften Individuum selbst hervorgebracht werden. Das zeigt etwa das preußische Abitur-Edikt von 1788, wo explizit festgehalten wird, dass Prüfungsaufgaben ohne Hilfe und in beschränkter Zeit zu lösen seien, damit sichergestellt werden kann, dass Schüler sie eigenständig bearbeitet haben und Lehrpersonen sie effizient korrigieren können.
Diese Struktur gibt allen drei Bestandteilen von Prüfungen eine spezifische Form: Wissen wird zu Prüfungsstoff, Lehrpersonen zu Prüfenden (die sich aber über die Prüfung auch selbst in ihrer Arbeit bewähren müssen) und die Lernenden zu Prüflingen, die nachweisen, über welche Kenntnisse und Kompetenzen sie verfügen. Die Prüfungsleistung wird dabei zum Symptom eines individualisierten Leistungsvermögens, das Schüler:innen zugeschrieben wird.
Noten machen Lernende zu Subjekten ihrer Prüfungsleistung. Sie ermöglichen pädagogisch seit rund zweihundert Jahren, das Selbstverständnis von Schüler:innen so zu prägen, dass sie sich anhand von geprüften Fähigkeiten sozial einordnen können. Noten sind ein zentrales Scharnier in der Schulsozialisation, Prüfungen strukturieren und standardisieren das Bildungssystem. Historisch verläuft die Entwicklung von Universitäten zu Gymnasien und von da zu den Volksschulen, wie Helmut Fend gezeigt hat.
Die Erfindung der Noten und die Medialität der Prüfungen
Die Einführung der Noten wird gemeinhin den Jesuitenschulen zugeschrieben, deren Prüfungskultur darauf ausgerichtet war, Ehrgeiz und Fleiß der Lernenden zu befördern. Der Jesuitenprofessor Joseph Juvencius hielt gegen Ende des 17. Jahrhunderts in seinen Lern- und Lehrmethoden fest, es genüge nicht, dass die „jungen Leute“ studieren, „sondern sie müssen studieren wollen, gebildet werden wollen“. Dafür gebe es einen „doppelten Sporn“, nämlich die „Furcht vor Beschämung“ sowie der „Wetteifer“.
Die mündlichen Prüfungen sind entsprechend wettbewerbsorientiert angelegt, damit die Schüler wahrnehmen können, wer bessere Leistungen erbringt. Juvencius hält fest, die Fragen sollten so gestellt werden, dass Konkurrenz möglich sei und andere bei Fehlern korrigieren und verbessern können. Diese „Beschämung“ ist es, die Lernende fürchten sollen. Die Jesuiten haben auch Preise für die besten Schüler eingeführt und Leistungsklassen unterhalten, welche ebenfalls dazu dienten, Anreize für den Wettkampf zu schaffen.
Das Wettbewerbsprinzip wird in der Jesuitenschule so stark gelebt, dass Schüler einander kontrollieren und überwachen. Prüfungen und Noten bewirken eine soziale Rangordnung, auf die sich die von Juvencius bezogene Motivation bezieht: Lernen ist direkt mit Konkurrenz und Status verbunden. Noten dienen in dieser Machtstruktur der Vergleichbarkeit von Lernenden.
Jesuitenschulen haben neben Noten und Wettbewerb einer weiteren Neuerung in der Prüfungskultur den Weg bereitet: die Einführung schriftlicher Prüfungen an den Gymnasien, die aber erst um 1900 flächendeckend erfolgte. Der Übergang von einem oralen in ein skriptografisches Paradigma in Bezug auf die Prüfungskultur hat gleichermaßen mediale Bedingungen und Konsequenzen. Die Verfügbarkeit von Papier erleichtert beispielsweise die Durchführung schriftlicher Prüfungen. Dadurch erhöht sich aber gleichzeitig der Komplexitätsgrad, da Prüfungen aus dem Kommunikationskontext gelöst werden. Protokolle von Konventen der Zürcher Handelsschule zeigen, dass dieser Paradigmenwechsel für die Lehrerschaft nicht ohne Probleme vonstattenging: Erfahrene Lehrkräfte wehrten sich gegen schriftliche Prüfungen, die für sie mit größerem Korrekturaufwand und der Möglichkeit der Einmischung von Eltern oder Behörden verbunden waren. Schriftliche Prüfungen erforderten zudem präziser und umständlich formulierte Aufgabenstellungen.
Der Übergang bzw. die Überlagerung von mündlicher und handschriftlicher Prüfungskultur zeigt, wie spät sich in Prüfungen mediale Verschiebungen in der Wissensorganisation manifestieren. Deshalb erstaunt es nicht, dass Typografie und Digitalität mit deutlicher Verzögerung in Prüfungen aufscheinen. Zugespitzt könnte man sagen, dass beide sich heute noch nicht durchgesetzt haben, zumal Open-Book-Prüfungen, wie sie das Paradigma der Typografie erfordern würde, weiterhin die Ausnahme bleiben. In den 1970er- und 1980er Jahren gab es an Gymnasien intensive Diskussionen darüber, wie sinnvoll es sei, Schüler:innen kopierte Prüfungen bearbeiten zu lassen, diktierte Aufgaben hielten sich bis in die 1990er Jahre, obwohl es technisch längst einfach möglich gewesen wäre, getippte Aufgabenblätter zu vervielfältigen.
Leitmedienwechsel bewirken eine Veränderung der Prüfungskultur, aber mit einem großen Rückstand und sehr langen Phasen der Überlagerung. Bezogen auf Digitalisierung, die im Sinne einer digitalen Transformation als Übergang von der Typografie in die Digitalität gelesen werden kann, könnte aus dieser Perspektive zu Geduld gemahnt werden: Verläuft die Entwicklung entlang historischer Muster, dann dürfte Digitalität mit ihren Merkmalen (Kollaboration, Referenzialität und Algorithmizität) erst relativ spät in Prüfungssettings wahrnehmbar und sehr lange parallel zu oralen, skriptografischen und typografischen Prüfungsformen entwickelt werden.
Bewertung als Experimentalanordnung: Der Einfluss der Naturwissenschaften
Prüfungen individualisieren und standardisieren gleichzeitig: Sie schreiben Einzelnen Leistungen zu. Damit diese Leistungen aber vergleichbar werden, müssen die Aufgaben, auf die sie sich beziehen, standardisiert werden. Im 19. Jahrhundert wurde dieser Zusammenhang mit statistischen und experimentellen Konzepten verbunden. Versteht man Prüfungen als Messungen, dann sind sie Teil einer Experimentalordnung: Mit Instrumenten wird etwas ermittelt, das der Wahrnehmung nicht unmittelbar zugänglich sind. Bei Prüfungen sind das Lernprozesse, und sie müssen so gestaltet werden, dass sie möglichst genau und störungsfrei zeigen, wie gut Schüler:innen etwas gelernt haben.
Diese Experimentalordnung basiert auf einer Reihe von Annahmen, die durchaus kritisch gesehen werden können. Um ein Beispiel zu nennen: Würden Prüfungen wie Instrumente in idealen Experimenten funktionieren, dürfte das Gemessene nicht von ihnen abhängen. Tatsächlich prägen Prüfungen aber Lernsettings.
Ein naturwissenschaftlich-experimentelles Verständnis von Prüfungen hat Konsequenzen: Messen Prüfungen natürliche Gegebenheiten, dann sollten ihre Ergebnisse statistisch normal verteilt sein. Daraus lässt sich die unter Lehrpersonen weiterhin verbreitete Vorstellungen erklären, Noten müssten „gut streuen“, und es sei „natürlich“, dass nur wenige Werte sehr klein und nur wenige sehr groß seien und viele nahe am Mittelwert liegen. So lassen sich zwei Phänomene erklären, die grundsätzlich seltsam sind: Weshalb haben nicht fast alle Schüler:innen gute Noten, wenn sie die Lernziele erreichen? Weshalb teilen Lehrkräfte Klassen den Durchschnitt einer Prüfung mit?
Die Vorstellung, Prüfungen seien ein Instrument in einem experimentellen Messverfahren, ist enorm wirkmächtig. Sie beschreibt aber nicht, wie Prüfungen funktionieren, sondern wie sich Menschen in Analogie zu einer positivistischen Vorstellung von Naturwissenschaften vorstellen, wie sie funktionieren könnten.
Kontrolle durch Unternehmenstechnologie: Die Zukunft von Prüfungen
In ihrer Kritik der Überwachung an Schulen hat die Bildungsaktivistin Audrey Watters darauf hingewiesen, dass digitale Bildungstechnologie durch ein grundsätzliches Misstrauen gegenüber Lernenden gekennzeichnet sei. Das erklärt sie damit, dass EdTech oft eine Übertragung technischer Lösungen sei, die in Unternehmen zur Kontrolle von Arbeitnehmenden entwickelt worden sei.
Teams, eine von Microsoft entwickelte Plattform, ist aktuell das Paradebeispiel für die Verschmelzung von Unternehmenstechnologie und Überwachung von Lernenden. Für Arbeitnehmende bedeutet Teams oft komplette Verfügbarkeit: Wer nicht aktiv an einem Termin teilnimmt, ist über Teams dennoch erreichbar. Vorgesetzte können alle Aktivitäten über Teams nachverfolgen und unabhängig vom Arbeitsort überprüfen, wie aktiv Mitarbeitende sind.
In Schulen wird Teams primär für Chats und Aufgaben verwendet: Lehrpersonen können Lernenden Aufgaben zuteilen, die in Teams abgegeben werden. So lässt sich nachverfolgen, wer die Aufgaben erledigt hat und eine verspätete Abgabe kann verhindert oder markiert werden. Lehrkräfte können Feedback, Beurteilungen und auch Noten direkt auf Teamserfassen und verwalten. Bei der Einführung von Teams haben sich Klassen an Gymnasien zunächst gegen die Nutzung des Tools gewehrt, weil es für sie mit den entsprechenden Einstellungen keine Möglichkeiten mehr gibt, Aufgaben nicht oder verspätet einzureichen. Seit der Phase des pandemiebedingten Fernunterrichts ist der Widerstand allerdings gebrochen. Da Teams auch auf mobilen Geräten verfügbar ist, sind die Lernenden praktisch rund um die Uhr erreichbar.
Teams ist nicht nur eine Plattform, auf der Prüfungen durchgeführt werden können (teilweise durch Einbindung spezifischer Prüfungstools wie IsTest2 oder Classtime), die Insight-Funktion könnte in Zukunft auch bestimmte Aspekte von Prüfungen ersetzen. Dieses Tool misst die Aktivität von Lernenden. Sie zeigt Lehrpersonen an, wer welche Dateien wie intensiv bearbeitet hat und wie lange jemand Teams genutzt hat. Die in der Arbeitswelt eingeführte Funktionalität zu Erfassung der Arbeitszeit kann umgelagert auf die Schule zu einer lückenlosen Erfassung der Lernaktivitäten führen. So wäre – eine etwas dystopische Aussicht – die Abschaffung von Prüfungen denkbar: Wird das Lernen lückenlos vermessen, muss es nicht mehr in ungenauen Prüfungen rekonstruiert werden, sondern kann direkt verglichen, beurteilt und klassifiziert werden.
Prüfungen sind eingebunden in die Geschichte der menschlichen Kultur und Gesellschaft – so weit, so trivial. Als Machtinstrument funktionieren sie konservativ. Die Vorstellung, in künstlichen und leicht rückständigen Arbeitsformen vermessen und verglichen zu werden, wird normalisiert. Das zeigt sich daran, dass die Vorstellung von prüfungs- oder notenfreien Lernumgebungen für viele utopisch wirkt. Sie löst Unsicherheiten aus, wie an Jesuitenschulen scheinen Noten als Ansporn alternativlos. Gleichzeitig schleicht sich über die Unternehmenstechnologie eine mächtige Alternative ein: Die Mikrovermessung von Tätigkeiten (nicht Persönlichkeitsmerkmalen) könnte Prüfungen dann ersetzen, wenn es darum geht, zu kontrollieren, wie produktiv Lernende sind. So schließt diese historische Überlegung mit einer pessimistischen Prognose: Die aktuell problematische Prüfungskultur wird sich nicht hin zu einem menschlich-dialogischen Umgang mit Lernen und Entwicklung wandeln können, weil dafür schlicht die Ressourcen fehlen, sondern technologisch durch subtile und umfassende Formen der Kontrolle und Datenauswertung abgelöst werden.