Leistungsnachweise
Generative Künstliche Intelligenz beeinflusst die Lehre und das Lernen zunehmend. Sie stellt alle Beteiligten vor neue Herausforderungen bei der Bewertung von Leistungen und der Gestaltung von Prüfungsformaten, die KI integrieren. Diese Seite bietet praktische L?sungsans?tze für den Umgang mit diesen Ver?nderungen.
Prüfen in einer Welt mit KI
KI-Tools sind bereits heute in der Lage, komplexe Aufgaben zu bew?ltigen. Neben Fachwissen und Fachkompetenzen rückt daher die F?higkeit in den Fokus, KI sinnvoll einzusetzen, kritisch zu hinterfragen und kreativ darüber hinaus zu denken.
Daraus ergibt sich, dass bisherige Leistungsbewertungen überdacht und an die neuen Rahmenbedingungen angepasst werden müssen. So k?nnen diese entscheidenden neuen Kompetenzen gezielt gef?rdert und gleichzeitig bewertet werden.

Zentral bei jeder Prüfungsform ist, dass die Studierenden transparent darüber informiert werden, ob und in welcher Weise generative Künstliche Intelligenz für Leistungsnachweise eingesetzt werden darf und wie die Deklaration des Einsatzes von GenAI zu erfolgen hat.
Die Nutzung generativer Künstlicher Intelligenz (GenAI) l?sst sich nicht rechtssicher nachweisen. Weder Software noch manuelle Prüfverfahren k?nnen zweifelsfrei feststellen, ob eine Arbeit vollst?ndig oder teilweise mit Hilfe von GenAI erstellt oder optimiert wurde.
KI-integrierende Aufgaben
Bei der Gestaltung und Bearbeitung von Aufgaben, die Künstliche Intelligenz einbeziehen, liegt der Fokus nicht darauf, ob und welche Inhalte von KI-Tools generiert wurden. Im Vordergrund steht vielmehr das erfolgreiche Probleml?sen unter Zuhilfenahme von KI-Werkzeugen sowie der daraus resultierende Kompetenzgewinn. Entscheidend ist, wie KI sinnvoll eingesetzt wird, um Lernziele zu erreichen und neue F?higkeiten zu entwickeln.
Diese Integration bringt einen bedeutsamen Wandel in der Leistungsbeurteilung mit sich: Es geht nicht mehr prim?r um die Bewertung des Endprodukts, sondern um die intensive Begleitung und Beurteilung des gesamten Entstehungsprozesses. Diese Neuausrichtung pr?gt eine ver?nderte Prüfungskultur, deren Facetten sich unter anderem in folgenden Ans?tzen zeigen:
Authentische Prüfungen spiegeln reale Aufgaben und Problemstellungen wider, mit denen Studierende in ihrem sp?teren Berufsleben konfrontiert werden. Ziel ist es, nicht nur Wissen abzufragen, sondern auch die Anwendung von F?higkeiten, kritisches Denken und Probleml?sungskompetenz in einem praxisnahen Kontext zu bewerten. Dieser Ansatz f?rdert tiefgreifendes Lernen und bereitet optimal auf die berufliche Realit?t vor.
Warum GenAI dies erfordert
Generative KI kann statische Wissensfragen mühelos beantworten. Authentische Prüfungen sind daher notwendig, um die tats?chlichen F?higkeiten der Studierenden zu bewerten – etwa Informationen zu analysieren, kritisch zu reflektieren und kreativ anzuwenden. Diese Kompetenzen gewinnen in einer zunehmend digitalen Welt stark an Bedeutung.
Konkrete Umsetzungsm?glichkeiten
Einige Wege, authentische Prüfungssettings zu gestalten, sind:
- Fallstudien-Analyse: Studierende bearbeiten komplexe, realistische Fallstudien und pr?sentieren ihre L?sungen sowie die zugrunde liegenden ?berlegungen.
- Projektbasierte Prüfungen: Bewertung anhand eines Semesterprojekts, das Planung, Umsetzung und Pr?sentation umfasst (→ projektbasierte Lehre an der ETH).
- Simulierte Beratungsgespr?che: Rollenspiele, bei denen Studierende eine beratende Rolle einnehmen und ihr Fachwissen praxisnah anwenden.
- Erstellung von Artefakten: Die Prüfungsleistung besteht in der Entwicklung eines realen Produkts, Plans oder Berichts.
- Reflexions-E-Portfolio: Studierende dokumentieren und reflektieren ihren Lernprozess sowie die Anwendung von Kompetenzen über einen l?ngeren Zeitraum.
Metakognitive Strategien sind Techniken, mit denen Studierende ihre eigenen Denk- und Lernprozesse überwachen und steuern. Solche ?bungen helfen ihnen, sich ihrer St?rken und Schw?chen sowie der für sie am besten geeigneten Lernprozesse bewusster zu werden. Durch die aktive Planung, ?berwachung und Bewertung ihres Lernens k?nnen die Studierenden ihr Verst?ndnis und ihre Probleml?sungsf?higkeiten gezielt verbessern.
Typische Elemente metakognitiver Strategien:
- Planung: Ziele setzen, bevor mit einer Aufgabe begonnen wird.
- ?berwachung: Selbstüberprüfung des Verst?ndnisses w?hrend des Arbeitsprozesses.
- Bewertung: Reflexion über das Ergebnis und darüber, was künftig anders gemacht werden k?nnte.
Warum GenAI dies erfordert
Die Integration metakognitiver ?bungen in Prüfungen ist notwendig, da sich der Fokus vom blossen Finden einer richtigen Antwort hin zur Demonstration kritischer F?higkeiten, Selbstregulierung und Bewertung verlagert. Da Studierende in der Lage sind, Informationen mithilfe von KI zu generieren, müssen Prüfungen sich weiterentwickeln, um ihre F?higkeit zu messen, diese Inhalte zu hinterfragen, zu verifizieren und sinnvoll zu adaptieren.
Konkrete Umsetzungsm?glichkeiten
Wie metakognitive Strategien in Prüfungs- und Bewertungssituationen integriert werden k?nnen, zeigen folgende Beispiele:
- Selbst- und Fremdbewertung: Studierende bewerten ihre eigene Arbeit sowie die eines Kommilitonen anhand klar definierter Kriterien.
- Reflexions-Portfolio: Studierende erstellen ein Portfolio ihrer Arbeiten und verfassen eine abschliessende Reflexion über ihren Lernprozess, die Herausforderungen und ihre pers?nliche Entwicklung.
- "Show Your Thinking"-Aufgaben: Die Prüfungsaufgaben verlangen nicht nur eine L?sung, sondern auch die schrittweise Dokumentation des Denkprozesses, einschliesslich der Begründung für die gew?hlten Strategien.
- Prozessorientierte Aufgabenstellung: Die Bewertung fokussiert sich prim?r auf den L?sungsweg. Studierende legen beispielsweise in einer Fallstudie die Phasen der Probleml?sung (Analyse, Planung, Umsetzung) detailliert dar.
- Reflexion nach der Korrektur: Studierende analysieren ihre Fehler in einer korrigierten Arbeit, erkl?ren deren Ursachen und entwickeln einen Plan, wie sie diese künftig vermeiden k?nnen.
Eine moderne Fehlerkultur in der Beurteilung versteht Fehler nicht als Scheitern, sondern als unverzichtbaren Bestandteil des Lernprozesses. Didaktisch bildet eine konstruktive Fehlerkultur eine zentrale Grundlage, da sie Lernprozesse f?rdert und die Entwicklung von Kompetenzen unterstützt. Mit dem Aufkommen von GenAI gewinnt diese Haltung deutlich an Bedeutung: Statt ausschliesslich das Endergebnis zu bewerten, rücken nun der Prozess, die Entscheidungsfindung und die kritische Interaktion mit der Technologie in den Fokus. So entsteht eine Beurteilungskultur, die gezielt Kompetenzen wie kritisches Denken, Probleml?sung und Anpassungsf?higkeit im Umgang mit digitalen Inhalten f?rdert.
Warum GenAI dies erfordert
Da GenAI den Erstellungsprozess beschleunigt, wird die Entscheidungsfindung, die Art und Weise, wie KI angeleitet wird (Prompting) und wie mit den Ergebnissen umgegangen wird, wichtiger als das finale Produkt allein. Eine Beurteilung, die ausschliesslich auf das Endergebnis schaut, verfehlt zentrale Lern- und Kompetenzbereiche, die mit dem Einsatz von GenAI verbunden sind.
Konkrete Umsetzungsm?glichkeiten
- Fehler als Diskussionsgrundlage: Fehler sollten nicht bestraft, sondern in Feedback-Gespr?chen als Ausgangspunkt für Lernprozesse genutzt werden.
- "Fail-Forward"-Mentalit?t: Etabliere eine Kultur, in der kontrolliertes Scheitern als Weg zur Innovation und Verbesserung verstanden wird. Siehe dazu auch Productive Failure als Learning Design.
- Prozess- statt Ergebnisorientierung: Die Bewertung fokussiert sich nicht nur auf das Endergebnis, sondern auch auf den kreativen und iterativen L?sungsweg.
Durch die Integration von KI in Aufgabenstellung und Leistungsnachweise ver?ndert sich die externe Seite Lehr- und Prüfungskultur. Der Lernprozess und das Lernen selbst rücken st?rker ins Zentrum. Dies macht die Einbindung überfachlicher Kompetenzen in die Lehre essenziell, wofür das ETH Kompetenzraster eine wertvolle Orientierungshilfe bietet.
KI-Werkzeuge im Prüfungskontext
Im Kontext digitaler Werkzeuge, die auf generativer KI basieren, lassen sich grunds?tzlich drei Hauptkategorien unterschieden werden. Die Landschaft dieser Tools entwickelt sich rasant und bietet eine breite Palette an M?glichkeiten, von bereits etablierten L?sungen bis hin zu massgeschneiderten Entwicklungen.
- Unter KI-Werkzeuge & Lizenzen sind die Standard-Tools aufgeführt, die sich auch im Prüfungskontext als nützliche Hilfsmittel bew?hren.
- Darüber hinaus existiert eine stetig wachsende Anzahl von Tools, die auf Künstlicher Intelligenz basieren oder diese in spezifischen Anwendungskontexten integrieren. Siehe dazu beispielsweise die externe Seite Linksammlung KI-Tools, Teaching Tools, UZH.
- Schliesslich entstehen verschiedenste Eigenentwicklungen, die neue Anwendungsm?glichkeiten von KI im Prüfungsbereich erforschen. Eine gute ?bersicht dazu findet sich im Abschnitt Projekte im Bereich KI in der Bildung.
Der Einsatz von GenAI kann Dozierende insbesondere in zwei Schlüsselbereichen unterstützen:
Der Einsatz generativer KI bei der Erstellung von Leistungsnachweisen bietet vielf?ltige Potenziale, die weit über das reine Generieren von Inhalten hinausgehen. GenAI kann Dozierende in verschiedenen Phasen der Planung von Prüfungs- und Bewertungsszenarien effizient unterstützen und gleichzeitig neue Lernm?glichkeiten für Studierende er?ffnen.
Konkrete Anwendungsideen umfassen:
- Ideenfindung und Optimierung von Prüfungsfragen: Von einfachen Aufgabenstellungen über Multiple-Choice-Fragen, Lückentexten und Wahr-Falsch-Aussagen bis hin zu komplexeren Formaten wie Fallstudien oder Problembeschreibungen. GenAI kann dabei unterstützen, Ideen für vielf?ltige ?bungs- und Prüfungsformate zu brainstormen, kritisch zu hinterfragen und gezielt weiterzuentwickeln.
- Unterstützung bei der Bewertungsplanung: GenAI kann wesentlich dazu beitragen, detaillierte Bewertungsrubriken, Bewertungskriterien und Musterl?sungen zu entwickeln. Dies f?rdert Konsistenz und Nachvollziehbarkeit in der Bewertung und verbessert die Qualit?t der Rückmeldungen an die Studierenden
Ein zentrales Ziel ist es, Studierende zu bef?higen, KI-Werkzeuge aktiv für ihr eigenes Lernen zu nutzen. GenAI kann dabei wertvolle Unterstützung leisten – etwa bei der Selbstüberprüfung, der Generierung eigener Quizfragen, der Vorbereitung auf mündliche Prüfungen oder der Kl?rung von Lerninhalten. So entwickeln Studierende wichtige Kompetenzen für ein autonomes und effektives Lernen.
GenAI-basierte Tools er?ffnen vielf?ltige M?glichkeiten, Rückmeldung zu geben und Korrekturen zu unterstützen. Schon die Standard-KI-Werkzeuge k?nnen hierbei eine effektive Hilfe sein. Darüber hinaus werden spezifische Projekte verfolgt, die mithilfe von GenAI Analysen und Bewertungen vornehmen.
Beim Einsatz dieser Werkzeuge sind folgende Aspekte zentral:
- Transparente Kommunikation: Der Einsatz von GenAI für Bewertungen und Rückmeldungen muss gegenüber den Studierenden klar und offen kommuniziert werden, wie in den Download Leitlinien zum Einsatz generativer KI in der Lehre (PDF, 75 KB) dargelegt. Offenheit schafft Vertrauen und erm?glicht es den Studierenden, die Rolle der KI im Lernprozess besser zu verstehen.
- Menschliche Kontrolle: Das Prinzip ?Human-in-the-loop“ gilt es konsequent anzuwenden: Die endgültige Bewertung muss unter menschlicher Aufsicht erfolgen, um Voreingenommenheit oder Fehlurteile zu vermeiden. Dies gew?hrleistet die p?dagogische und ethische Verantwortung der Dozierenden.
- Bef?higung zur Selbstkorrektur und zum Lernen: Studierende sollten aktiv dazu bef?higt werden, KI-Werkzeuge eigenst?ndig für ihre Selbstkorrektur und ihr Lernen zu nutzen. Die Tools k?nnen dabei nicht nur Feedback geben, sondern auch konkrete Verbesserungsm?glichkeiten aufzeigen, sei es bei grammatikalischen Fehlern, logischen Inkonsistenzen oder Wissenslücken.
Bewertungskonzepte
Der Wandel von der Bewertung ausschliesslich von Produkten hin zu einer intensiveren Begleitung und Beurteilung von Lernprozessen erfordert auch neue Bewertungskonzepte. Es geht nicht mehr nur darum, das Endergebnis einer Leistung zu beurteilen, sondern vielmehr den gesamten Lernweg der Studierenden zu begleiten, zu unterstützen und zu bewerten. Dieser Paradigmenwechsel macht innovative Ans?tze in der Leistungsbeurteilung notwendig, die sowohl die Entwicklung von Kompetenzen als auch die individuelle Lernreise st?rker berücksichtigen.
Im Folgenden werden drei alternative Bewertungskonzepte* vorgestellt, die diesen Paradigmenwechsel unterstützen k?nnen:
Bei diesem Ansatz basiert die Benotung prim?r auf dem erbrachten Arbeitsaufwand oder "Labor" der Studierenden basiert und nicht ausschliesslich auf der "Qualit?t" des Endprodukts. Es geht darum, dass Studierende die vereinbarten Aufgaben und Aktivit?ten in einem festgelegten Umfang erledigen. Dies f?rdert die aktive Teilnahme, das Engagement und die Risikobereitschaft im Lernprozess, da die Angst vor einer schlechten Note aufgrund vermeintlich "mangelnder Qualit?t" reduziert wird.
Praktische Umsetzung:
- Zu Beginn des Semesters wird ein "Vertrag" festgelegt, der den erforderlichen Arbeitsumfang für verschiedene Notenstufen (z. B. Anzahl der Entwürfe, ?berarbeitungen, aktive Teilnahme) klar definiert.
- Rückmeldungen konzentrieren sich auf den Lernprozess, das Engagement und die Entwicklung von F?higkeiten, anstatt auf die Bewertung der Endprodukte nach traditionellen Qualit?tskriterien.
Specifications Grading konzentriert sich auf die Beherrschung spezifischer Lernziele oder "Spezifikationen". Anstatt Punkte für einzelne Aufgaben zu vergeben, werden diese nach dem Prinzip Bestanden/Nicht bestanden (Pass/Fail) bewertet, basierend darauf, ob sie alle vorgegebenen Kriterien ("Spezifikationen") erfüllen. Studierende k?nnen oft mehrere Versuche unternehmen, um die Spezifikationen zu erreichen. Die Endnote ergibt sich aus der Anzahl der erfolgreich abgeschlossenen "Bundles" von Spezifikationen. Dies schafft Transparenz, erm?glicht individuelles Lerntempo f?rdert das Verst?ndnis der Inhalte.
Praktische Umsetzung:
- Für jede Aufgabe werden detaillierte "Spezifikationen" (Kriterienkatalog) bereitgestellt, die pr?zise beschreiben, was für ein Bestehen erforderlich ist, ohne Teilleistungen zu bewerten.
- Studierende erhalten "Tokens" oder Wiedervorlagem?glichkeiten, um Aufgaben bei Nichterreichen der Spezifikationen zu überarbeiten und erneut einzureichen, bis die Anforderungen erfüllt sind.
Dieser Bewertungsansatz misst den Fortschritt der Studierenden anhand klar definierter Lernstandards oder Kompetenzziele. Anstelle einer einzelnen Gesamtnote werden die Leistungen der Studierenden für jeden einzelnen Standard bewertet. Dies erm?glicht eine detailliertere Rückmeldung darüber, was die Studierenden bereits beherrschen, und wo sie noch Unterstützung ben?tigen. Der Fokus liegt auf der kontinuierlichen Verbesserung und der schrittweisen Beherrschung der Standards über die Zeit, anstatt auf dem Durchschnitt von Noten aus verschiedenen Aufgaben.
Praktische Umsetzung:
- Der Kursinhalt wird in spezifische, messbare Lernstandards oder Kompetenzziele unterteilt, die den Studierenden transparent kommuniziert werden und an denen sich alle Bewertungen orientieren.
- Regelm?ssige formative Beurteilungen dokumentieren den Fortschritt der Studierenden bei der Beherrschung dieser Standards, oft unter Verwendung einer Skala, die den Grad der Beherrschung angibt (z.B. "Grundlegend", "Weiterführend", "Umfassend").
Digitale Prüfungen sind an der ETH Zürich bereits seit L?ngerem etabliert und finden in einem kontrollierten Prüfungssetting statt. Dabei kommen bew?hrte Systeme zum Einsatz, die sowohl die Sicherheit als auch die Funktionsvielfalt w?hrend der Durchführung gew?hrleisten.
Die digitale Prüfungsdurchführung an der ETH Zürich stützt sich auf etablierte Softwarel?sungen, die sowohl auf ETH-Ger?ten als auch auf pers?nlichen Ger?ten (BYOD) eingesetzt werden. Der externe Seite Safe Exam Browser (SEB) sichert die Prüfungsrechner ab, indem er den Zugriff auf unerwünschte Ressourcen blockiert und gleichzeitig die Verbindung zum Moodle Testmodul herstellt. Moodle dient als zentrale Prüfungsplattform der ETH und ist für diese Zwecke speziell optimiert. Es unterstützt den gesamten Prüfungsprozess von der Fragenerstellung bis zur Korrektur und ist in der Lage, verschiedene Fragetypen sowie Integrationen für komplexe Aufgaben zu handhaben.
Weitere detaillierte Informationen zu digitalen Prüfungen an der ETH Zürich und den eingesetzten Systemen finden sich auf der Webseite von EduIT unter Digitale Prüfungen.
Mündliche Prüfungen erm?glichen eine direkte Interaktion zwischen Prüfenden und Prüfungsteilnehmenden. Die pers?nliche Anwesenheit erlaubt es, Antworten gezielt zu hinterfragen und situativ zu bewerten, bei gleichzeitiger Sicherstellung der Prüfungsregeln.
Diese Prüfungsform kann auch gut in Erg?nzung zu anderen Formaten angewandt werden, um eine pr?zise Einsch?tzung der tats?chlich erworbenen fachlichen Kompetenzen zu erm?glichen, da Verst?ndnis und Transferleistungen unmittelbar sichtbar werden. Zudem lassen sich durch mündliche Prüfungen auch überfachliche Kompetenzen wie Probleml?sekompetenz und Kommunikationsf?higkeit feststellen.
Gerade im Rahmen überwachter Prüfungen kann auch GenAI sinnvoll eingesetzt werden. Das kontrollierte Setting erm?glicht es, den Umgang mit GenAI durch Studierende gezielt einzubinden und gleichzeitig die Kompetenz zu f?rdern und zu prüfen, wie GenAI sinnvoll in Arbeitsprozesse integriert werden kann.
* Weiterführende Literatur zu alternativen Bewertungskonzepten:
- Clark, D., & Talbert, R. (2023). Grading for Growth: A Guide to Alternative Grading Practices that Promote Authentic Learning and Student Engagement in Higher Education. Routledge.
- Tomlin, A. D., & Nowik, C. M. (Eds.). (2024). Effective alternative assessment practices in higher education: Research, theory, and practice within academic affairs. Information Age Publishing.