Ebenso wie andere Fachdidaktiken sind auch Teile der Geschichtsdidaktik im Post-PISA-Zeitalter von einer bemerkenswerten Dynamik hinsichtlich der psychometrischen Vermessung der eigenen Disziplin erfasst worden. Nachdem die Stimmen, die dieser Entwicklung zurückhaltend bis kritisch gegenüberstehen, in den vergangenen Jahren lauter geworden sind [1], haben Geschichtsdidaktikerinnen und Geschichtsdidaktiker sowie empirische Bildungsforscher aus Deutschland, Österreich und der Schweiz in der HiTCH-Studie den Versuch unternommen, "einen Test zu entwickeln, mit dem sich die Kompetenzen historischen Denkens von Schülerinnen und Schülern in Large-Scale-Assessments erfassen lassen" (11). Der HiTCH-Test wurde auf der Grundlage des auch international renommierten Kompetenzmodells zur Förderung und Entwicklung eines reflektierten und (selbst-)reflexiven Geschichtsbewusstseins (FUER) konzipiert, ein Modell, das in der Geschichtsdidaktik seit mehr als einem Jahrzehnt diskutiert wird [2], das die Autoren im zweiten Kapitel ihrer Publikation hinsichtlich seiner Stärken eingehend würdigen und das vier Kompetenzbereiche unterscheidet: historische Fragekompetenzen, historische Methodenkompetenzen, historische Orientierungskompetenzen und historische Sachkompetenzen.
An der Haupterhebung des HiTCH-Tests nahmen 2.853 Schülerinnen und Schüler der 9. Jahrgangsstufe aus verschiedenen Schulen, Schulformen und Ländern beziehungsweise Bundesländern teil, deren historische Kompetenzen "objektiv, reliabel und valide mithilfe standardisierter Testaufgaben" (56, 82) gemessen werden sollten. Dabei wurde das FUER-Modell allerdings nicht vollständig in seiner Graduierungslogik adressiert, sondern es wurde angestrebt, "ein intermediäres, konventionelles Kompetenzniveau" (56) zu erfassen, weil der HiTCH-Test "qualitative Umschläge" hin zu einem elaborierten, transkonventionellen Niveau "nicht messen" kann (122). Dieser Test besteht in seiner finalen Fassung aus 91 Items (ursprünglich waren es 106), die sich auf 15 Aufgabenblöcke verteilen. Während sich acht Aufgabenblöcke auf den Bereich der Methodenkompetenzen (Re- und De-Konstruktionskompetenz) und vier auf die Dimension der Sachkompetenzen beziehen, gibt es nur einen Aufgabenblock zur Erfassung historischer Orientierungskompetenzen [3] und zwei, die den Bereich der Fragekompetenzen betreffen (89-91). Diese "leichte Schieflage" (119) hängt wohl nicht zuletzt damit zusammen, dass sich historische Frage- und Orientierungskompetenzen, die für historisches Denken von konstitutiver Bedeutung sind, offenbar nur sehr schwer mit standardisierten, nicht-offenen Aufgabenformaten erfassen lassen (118-119).
Soweit sich dies der Studie entnehmen lässt (91), beziehen sich die meisten der in diesen Aufgabenformaten verhandelten Themen auf die griechische Antike (zweimal Ostrakismos), die Frühe Neuzeit (dreimal Hexenverfolgung) und die Geschichte Nordamerikas (viermal). Insgesamt handelt es sich also im Wesentlichen um curriculumsnahe Themen. Da die Aufgaben selbst zur "Wahrung der Testsicherheit" (64) der "Geheimhaltung unterliegen" (117) [4], ist es nur möglich, sich anhand "'nachgebauter'" Aufgaben (64-75) einen Eindruck vom Format und von der Qualität des HiTCH-Tests zu machen.
Wenn man die theoretischen Beschreibungen der unterschiedlichen Kompetenzbereiche (32-35) mit den für die empirische Erfassung erforderlichen Operationalisierungen vergleicht (zum Beispiel 67-69, 74-75), ergeben sich teilweise Differenzen. Neben insgesamt überzeugenden Aufgabenbeispielen gibt es andere, die zu sachlichen oder konzeptionellen Irritationen führen. Wenn beispielsweise von der "Spaltung der katholischen Kirche durch die Reformation" (69) die Rede ist, so ist das eine Formulierung, die man in einschlägigen theologischen und historischen Publikationen wohl kaum finden wird, weil sie normativ einseitig und begrifflich missverständlich ist. Die Verfassung der USA trat nicht "1787 in Kraft" (75), sondern nach Ratifizierung durch neun von dreizehn Gründerstaaten im Jahr 1788, und es waren erst die seit 1791 geltenden Zusatzartikel dieser Verfassung (Bill of Rights), welche "die Rechte und Freiheit der amerikanischen Bürger" (75) garantierten. Im siebten Aufgabenbeispiel ist für Material 3 eine falsche Lösung angegeben (73-74). Und um das sechste Aufgabenbeispiel (72) richtig zu bearbeiten, müssten die Probanden wissen, in welchem Monat des Jahres 1917 die USA in den Ersten Weltkrieg eingetreten sind, sie müssten also über "ein bestimmtes inhaltliches Wissen" verfügen, das den Autoren der Studie zufolge aber keine Voraussetzung für die erfolgreiche Bearbeitung des HiTCH-Tests sein darf (120-121).
Fragt man nach dem zentralen Befund der HiTCH-Studie, so war eine "empirische 'Bestätigung'" des FUER-Kompetenzmodells zwar nicht möglich - stattdessen ist von einem "Generalfaktor 'historische Kompetenz'" (80) die Rede -, gelungen sei aber "die erfolgreiche Konstruktion eines Large-Scale-fähigen Tests der Kompetenz historischen Denkens im Ganzen" (119). Das ist, wie die Autoren bilanzieren, einerseits "ein wichtiger Zwischenschritt", weil auf diese Weise "die Herausforderungen zu meistern" gewesen seien, "die mit der psychometrischen Ausmessung einer komplex strukturierten kulturwissenschaftlichen Disziplin, wie es das Fach Geschichte darstellt, verbunden" sind (128). Andererseits bringt der auf quantifizierbare Ergebnisse fokussierte Zuschnitt der HiTCH-Studie aber auch erhebliche Limitationen mit sich, die die Autoren teilweise selbst reflektieren (116-123) und die sich zukünftig mit Hilfe eines Mixed-Methods-Designs [5] weitgehend kompensieren ließen.
Würde man das Design des HiTCH-Tests konsequent durch offene Aufgabenformate ergänzen, hätte dies mindestens drei wesentliche Vorteile. Erstens wäre es so möglich, auch ein elaboriertes, transkonventionelles Kompetenzniveau zu erfassen. Das wäre insofern besonders relevant, weil erst auf diesem Niveau der generative beziehungsweise kreative Charakter, der für Kompetenzen im eigentlichen Sinne spezifisch ist [6], zur Geltung gebracht werden kann. Zweitens könnten so die historischen Frage- und Orientierungskompetenzen, die im HiTCH-Test unterrepräsentiert sind, angemessen berücksichtigt werden. Das wäre deshalb wichtig, weil es erst so möglich würde, den in der menschlichen Lebenspraxis wirksamen und für Geschichte konstitutiven Zusammenhang von "Vergangenheitsdeutung, Gegenwartsverständnis und Zukunftsperspektive" (Karl-Ernst Jeismann) in den Blick zu nehmen, also "individuelle [historische] Orientierungen zu thematisieren", worauf der HiTCH-Test "bewusst [...] verzichtet" hat (74). Und drittens könnte man herausfinden, vor welchen Herausforderungen Schülerinnen und Schüler stehen, wenn sie versuchen, historische Kompetenzen zur Performanz zu bringen. Das ist für die Geschichtsdidaktik als "Wissenschaft vom historischen Lernen" (Jörn Rüsen) deshalb von grundlegender Bedeutung, weil sie nur auf diesem Weg einen Beitrag zur individuellen Kompetenzdiagnostik und Kompetenzentwicklung leisten kann.
Trotzdem ist die HiTCH-Studie ein Meilenstein geschichtsdidaktischer empirischer Forschung, denn wir wissen jetzt sehr viel genauer als vorher, mit welchen Chancen, aber auch mit welchen Herausforderungen und Grenzen die psychometrische Messung historischen Denkens verbunden ist.
Anmerkungen:
[1] Vergleiche unter anderem Wolfgang Sander: Die Kompetenzblase - Transformationen und Grenzen der Kompetenzorientierung, in: Zeitschrift für Didaktik der Gesellschaftswissenschaften 4 (2013), H. 1, S. 100-124 und Bruce A. VanSledright: Assessing Historical Thinking and Understanding. Innovative Designs for New Standards, New York / London 2014.
[2] Vergleiche unter anderem Bernd Schönemann: Bildungsstandards und Geschichtsunterricht. Ein Kommentar zu Waltraud Schreiber und Michael Sauer, in: Zeitschrift für Pädagogik 54 (2008), S. 218-221 und Michele Barricelli / Peter Gautschi / Andreas Körber: Historische Kompetenzen und Kompetenzmodelle, in: Michele Barricelli / Martin Lücke (Hgg.): Handbuch Praxis des Geschichtsunterrichts. Bd. 1, Schwalbach / Ts. 2012, S. 207-235.
[3] Die Angaben sind diesbezüglich nicht konsistent. Auf Seite 91 ist von einem Aufgabenblock, auf Seite 95 von zwei Aufgabenblöcken zur Orientierungskompetenz die Rede.
[4] Auch wenn es für Historikerinnen und Historiker eher irritierend erscheinen mag, die Quellen der eigenen Befunde geheim zu halten, ist das in den empirischen Bildungswissenschaften offenbar gängige Praxis.
[5] Vergleiche dazu Doren Prinz / Holger Thünemann: Mixed-Methods-Ansätze in der empirischen Schul- und Unterrichtsforschung. Möglichkeiten und Grenzen für die Geschichtsdidaktik, in: Holger Thünemann / Meik Zülsdorf-Kersting (Hgg.): Methoden geschichtsdidaktischer Unterrichtsforschung, Schwalbach / Ts. 2016, S. 229-253, vor allem S. 247-251, wo auch die wichtige empirische Pionierstudie von Karl-Ernst Jeismann et al. 1987 erwähnt ist, die von den HiTCH-Autoren nicht rezipiert wurde.
[6] Vergleiche Hans-Jürgen Pandel: Geschichtsunterricht nach PISA. Kompetenzen, Bildungsstandards und Kerncurricula, Schwalbach / Ts. 2005, S. 24.
Ulrich Trautwein / Christiane Bertram / Bodo von Borries u.a.: Kompetenzen historischen Denkens erfassen. Konzeption, Operationalisierung und Befunde des Projekts "Historical Thinkin - Competencies in History" (HiTCH), Münster: Waxmann 2017, 144 S., ISBN 978-3-8309-3598-8, EUR 19,90
Bitte geben Sie beim Zitieren dieser Rezension die exakte URL und das Datum Ihres letzten Besuchs dieser Online-Adresse an.