Hochbegabung verstehen

Beratung

Wann eignet sich ein Intelligenztest für die Begabungsdiagnostik?

Intelligenztests haben eine zentrale Bedeutung für die psychologische Diagnostik bei einer vermuteten Hochbegabung. Die Testverfahren müssen jedoch spezifische Kriterien für diesen Anwendungsbereich erfüllen.

Von: Anne-Kathrin Stiller


Bei der Auswahl diagnostischer Instrumente im Rahmen einer jeden psychologischen Diagnostik lautet die zentrale Frage, inwieweit eine Informationsquelle wie ein Intelligenztest für die Beantwortung der individuellen Fragestellung geeignet ist. Geht es um eine vermutete Hochbegabung, muss ein Test spezifische Kriterien erfüllen, um belastbare Aussagen über das mögliche Vorliegen einer weit überdurchschnittlichen Intelligenz treffen zu können. Nicht alle Intelligenztests sind für diesen Anwendungsbereich konzipiert und somit nicht gleichermaßen geeignet.

Im Fachportal Hochbegabung stehen rund 40 Rezensionen von Intelligenztests für das Kindes- und Jugendalter zur Verfügung, die von Expert:innen speziell mit Blick auf eine Eignung für die Begabungsdiagnostik bewertet wurden (Testrezensionen). Die Testverfahren wurden anhand allgemeiner und spezifischer Testbewertungskriterien geprüft. In jeder Rezension finden sich Informationen zur Eignung eines Intelligenztests für verschiedene diagnostische Fragestellungen im Bereich der Begabungsdiagnostik, zu möglichen Einschränkungen sowie zur Interpretation von Testergebnissen.

Bild: Westend61/photocase.de

Allgemeine Gütekriterien

Wie „gut“ ist ein spezifischer Test? Dafür gibt es klare Kriterien, sogenannte Testgütekriterien. Sie gelten für alle psychologischen Testverfahren, also auch für Intelligenztests. Die wichtigsten Kriterien stellen wir kurz vor:

Objektivität

Ein Gütekriterium, das auch Laien in der Regel ein Begriff ist, ist die Objektivität. Damit ist gemeint, dass ein Testergebnis nicht von der Person, die den Test leitet, oder von anderen Bedingungen der Testsituation verfälscht werden kann. Objektivität betrifft die Durchführung, Auswertung und die Interpretation der Befunde. Es braucht also eine hochgradige Standardisierung, die keinen Spielraum für absichtliche oder unabsichtliche Abweichungen lässt. Konkret heißt das, es gibt eindeutige, schriftliche Regeln:

  • wie der Test durchzuführen ist,
  • wie die Antworten auszuwerten sind und
  • wie ein Testergebnis mit Blick auf eine Fragestellung zu interpretieren ist.

Nur wenn ein Intelligenztest objektiv ist, ist ein Testergebnis wirklich unabhängig von den Bedingungen seines Zustandekommens gültig. Eine andere Diagnostikerin bzw. ein anderer Diagnostiker oder eine andere Testsituation führen dann zu dem gleichen Ergebnis. Voraussetzung dafür ist, dass alle Regeln auch eingehalten werden. Deshalb wird eine entsprechende Qualifikation für die Testanwendung benötigt. Eine automatisierte Testung und Auswertung ist maximal objektiv.

Reliabilität

Das Gütekriterium der Reliabilität bezeichnet die Zuverlässigkeit bzw. die Genauigkeit, mit der ein Test ein Merkmal misst, in unserem Falle die Intelligenz. Reliabel ist eine Messung dann, wenn sie wenig von Messfehlern betroffen ist. Das kann man sich bildlich etwa so vorstellen, dass beispielsweise ein Thermometer bei wiederholter Messung immer wieder dieselbe Temperatur anzeigt. Eine ungenaue Messung würde zu schwankenden Ergebnissen führen und wäre demnach nicht reliabel.

Bei einem reliablen Intelligenztest kann man davon ausgehen, dass unterschiedliche Testergebnisse von Personen (beobachtete Werte) auch wirklich auf deren unterschiedliche kognitive Fähigkeiten zurückgehen (sogenannte wahre Werte), und nicht auf unsaubere Messungen.

Validität

Bei dem Begriff Validität geht es um die Gültigkeit eines Tests: Misst er tatsächlich das, was er messen soll? Um diese Frage zu beantworten, werden mehrere Aspekte untersucht:

  • Ein Intelligenztest ist „inhaltsvalide“ (oder „kontentvalide“), wenn er so konstruiert ist, dass die Testaufgaben (sogenannte items) die kognitiven Fähigkeiten abdecken, die gemessen werden sollen.
  • Bei der Beurteilung der Validität ist es auch von Bedeutung, welche Intelligenztheorie einem Intelligenztest zugrunde liegt. Werden beispielsweise mehrere unabhängige Intelligenzkomponenten angenommen (verbal, numerisch, figural), wird geprüft, inwieweit sich diese Komponenten auch in den Messergebnissen einer Stichprobe nachweisen lassen. Gelingt dies, ist der Test „konstruktvalide“. Konstruktvalidität kann weiter überprüft werden, indem der Intelligenztest mit einem anderen thematisch sehr ähnlichen Testverfahren verglichen wird.
  • Weiterhin wird überprüft, ob die Ergebnisse aus dem Intelligenztest mit Außenkriterien zusammenhängen. Im Hinblick auf die Begabtenförderung sind beispielsweise Zusammenhänge mit Schulleistungstests, Schulnoten oder Schulabschlüssen von Bedeutung. Sind solche Zusammenhänge gegeben, ist der Test „kriteriumsvalide“.

Normierung

Um mithilfe eines Intelligenztests beurteilen zu können, ob ein individuelles Testergebnis „normal“, also dem Alter entsprechend im Durchschnitt, oder wie im Falle einer Hochbegabung weit überdurchschnittlich ist, wird eine Vergleichsgruppe benötigt, also eine Norm. Solche Vergleichsgruppen werden nach Alter gebildet, teilweise liegen darüber hinaus auch nach Geschlecht oder Schulform gegliederte Normen oder Normen für besondere Gruppen vor.

Im Idealfall sollen die für die Normierung eines Tests verwendeten Daten in Bezug auf die Verteilung von Geschlecht, Alter, Nationalität, Stadt-Land-Verteilung, Schultyp, Sozialschicht und Bildungshintergrund repräsentativ sein.

Ökonomie

Bei der Diagnostik ist es wichtig, dass der finanzielle und zeitliche Aufwand, mit dem eine Testung verbunden ist, gerechtfertigt ist. Deshalb spielt auch die Ökonomie eines Tests eine Rolle. Dabei ist es nicht unbedingt das Ziel, einen möglichst kurzen Intelligenztest zu konzipieren. Ein Test ist dann ökonomisch, wenn man der Fragestellung entsprechend angemessen viele Informationen innerhalb einer angemessenen Zeitspanne gewinnt. Der Test soll also nicht „unnötig lang“ sein, sondern „genau richtig“. Bei der Bewertung der Ökonomie spielt es ebenfalls eine Rolle, inwiefern die Erkenntnisse aus der Testung für die diagnostische Entscheidung hilfreich sind. Soll ein Test beispielsweise bei einer Schullaufbahnentscheidung herangezogen werden, werden viele, differenzierte Informationen benötigt, die ein sehr kurzer Test allein nicht liefern könnte.

Spezielle Anforderungen an Intelligenztests
für die Begabungsdiagnostik

Für die Begabungsdiagnostik gibt es besondere Anforderungen. Daher braucht es spezielle Kriterien für die Bewertung der Eignung von Intelligenztests in diesem Bereich.

Klassische Anwendungsfelder der Begabungsdiagnostik

In der Regel wird die Intelligenz eines Kindes abgeklärt, wenn ein konkreter Anlass besteht. In der Schullaufbahnberatung kann bei einer vermuteten Hochbegabung im Rahmen einer psychologischen Diagnostik unter anderem ein Intelligenztest durchgeführt werden. Ziel ist es, eine passende Bildungsmaßnahme zu wählen oder eine passende Bildungswegentscheidung zu treffen. Eine Intelligenzdiagnostik dient hier z. B. der Abklärung der Eignung für eine bestimmte Schule/Schulform, spezielle Klassen/Zweige oder Kurse und der Vorhersage des Schulerfolgs.

Auch bei der Auswahl von Schüler:innen für spezielle Bildungs- oder Förderangebote der Begabtenförderung (Selektionsentscheidungen) werden begabungsdiagnostische Informationen herangezogen. Bei der diagnostischen Abklärung von Underachievement oder Twice Exceptionality spielt die Intelligenzdiagnostik ebenfalls eine wichtige Rolle für die Ableitung passender Förder- und Beratungsmaßnahmen.

Idealmerkmale

  • Differenzierungsfähigkeit im oberen Leistungsbereich
  • Ein Intelligenztest, der zur Feststellung einer Hochbegabung im Rahmen einer psychologischen Diagnostik eingesetzt wird, muss auch im (extrem) hohen Fähigkeitsbereich noch zuverlässig und differenziert messen. Dies ist nur möglich, wenn der Test schwer genug ist. Ein ausreichender Teil der Aufgaben (Items) muss so konstruiert sein, dass nur (sehr) wenige Kinder in der Lage sind, sie zu lösen. Ist der Test zu leicht, entstehen sogenannte Deckeneffekte: Kinder im oberen durchschnittlichen Bereich und hochbegabte Kinder schneiden dann gleich gut ab. Es fehlen schwierige Items, die es ermöglichen, zwischen Kindern mit sehr guten, überdurchschnittlichen oder weit überdurchschnittlichen Fähigkeiten zu unterscheiden. Über eine mögliche Hochbegabung kann keine Aussage getroffen werden. Deckeneffekte sind für Testanwender:innen in den Normtabellen des Testmanuals ersichtlich. Entscheidend ist eine feine, gleichmäßige Schwierigkeitsabstufung der Testitems im hohen Leistungsbereich.

  • Hochbegabungsspezifische Interpretationshinweise
  • Um eine objektive Interpretation zu gewährleisten, sollten im Testmanual Hinweise für die Interpretation von Testergebnissen im Rahmen der Begabungsdiagnostik zur Verfügung stehen.

  • Hochbegabungsspezifische Aspekte bei der Validierung
  • Idealerweise sind Intelligenztestverfahren, die in der Begabungsdiagnostik eingesetzt werden, mit hochbegabten Stichproben erprobt und validiert, auch hinsichtlich der Messgenauigkeit in dieser Gruppe. Die Validierung sollte Schullaufbahnentscheidungen einbeziehen, da diese in der Begabungsdiagnostik häufig Thema sind.

  • Profilerstellung
  • Soll ein Intelligenztest für die Begabungsdiagnostik herangezogen werden, sollte er mehrere Intelligenzdimensionen messgenau erfassen. Dies ermöglicht die Erstellung eines Intelligenzprofils – eines Gesamtbildes der intellektuellen Stärken und Schwächen –, das bei der Ableitung individueller Förderempfehlungen hilfreich sein kann. Spezielle Testverfahren mit einem eingeschränkten Messbereich, die keine Profilerstellung zulassen, sollten immer durch ein mehrdimensionales Verfahren ergänzt werden.

  • Aktuelle Normen
  • Die Normierung sollte im Idealfall nicht länger als acht bis zehn Jahre zurückliegen, um mögliche Überschätzungen der Intelligenz aufgrund des sogenannten Flynn-Effekts zu vermeiden. Da Neunormierungen mit einem extrem hohen Aufwand verbunden sind, stehen nicht immer aktuelle Daten zur Verfügung. Daher bleiben Tests mit veralteten Normen aus Mangel an Alternativen häufig weiter in der Anwendung.

Sonderfall IQ-Screenings

Bei einem IQ-Screening wird anlasslos und ohne individuelle Fragestellung eine grobe Schätzung der Intelligenz – z. B. aller Kinder eines Jahrgangs – in Gruppentestungen mit einem dafür geeigneten Intelligenztestverfahren vorgenommen. Ziel ist es, bisher unerkannte Begabungen zu entdecken (Talentsuche) und damit die Grundlage und Motivation für eine begabungsgerechte Förderung zu schaffen. Screenings helfen dabei, die Begabungen von bislang in der Begabtenförderung unterrepräsentierten Gruppen zu erkennen.

5 Fragen an Dr. Petra Hank

Dr. Petra Hank ist Akademische Rätin in der Abteilung Hochbegabtenforschung und ‑förderung an der Universität Trier. Als ausgewiesene Expertin für Intelligenz- und Begabungsdiagnostik ist sie Teil des Rezensent:innen-Teams im Fachportal Hochbegabung.

1. Was sind spezielle Marker, die Sie bei einer Rezension berücksichtigen? Woran können Sie schnell und zuverlässig sehen, ob ein Test sich zum Beispiel nicht für die Begabungsdiagnostik eignet?

Der Test muss empirisch überprüft worden sein. Messungen mit dem Verfahren sollten sich als hinreichend reliabel – d. h. zuverlässig – erwiesen haben. Dies gilt insbesondere für die Leistungsdiagnostik im überdurchschnittlichen Fähigkeitsbereich, um Deckeneffekte ausschließen zu können. Bei starken Deckeneffekten können altersgemäße Ergebnisse nicht von überdurchschnittlichen Leistungen abgegrenzt werden, ein No-Go im Kontext der Hochbegabtendiagnostik.

Bei der Bewertung der Verfahren liegt mein Augenmerk besonders auf der Validität des Verfahrens: Ich schaue nach empirischen Belegen, die dafür sprechen, dass das Verfahren den hohen kognitiven Fähigkeitsbereich auch tatsächlich erfasst. Ich gehe also der Frage nach, wie im Entwicklungsprozess des Testverfahrens geprüft wurde, ob seine Aufgaben den zu messenden kognitiven Fähigkeitsbereich hinreichend abdecken, und ob das Verfahren in der Lage ist, einschlägige Außenkriterien vorherzusagen: Solche Kriterien sind beispielsweise schulische Leistungen, Zensuren, Studienerfolg oder auch Maße des beruflichen Erfolgs.

Weiter interessieren mich Befunde zur Beziehung zwischen dem im Intelligenztest gezeigten Leistungsverhalten und dem dahinter liegenden Fähigkeitskonstrukt: Dazu findet man in der Regel Ergebnisse statistischer Berechnungen im Testmanual. Sie geben Aufschluss darüber, inwieweit sich die theoretisch angenommene Struktur in den erhobenen Leistungsergebnissen zeigt. Ergebnisse, die das zu prüfende Verfahren mit einem bereits etablierten Test vergleichen, geben weiteren Aufschluss. So gelange ich zu einer Einschätzung, ob der Test für die intendierte Anwendung taugt. Außerdem sollten natürlich aktuelle und repräsentative Normen vorliegen. Der Test sollte die Intelligenz fair (d. h. verzerrungsarm, also ohne nennenswerten „bias“) messen.

2. In den Intelligenztest-Rezensionen im Fachportal Hochbegabung geht es unter anderem um die Eignung der Tests für Screenings. Damit sollen hochbegabte Kinder identifiziert werden, die bisher nicht erkannt wurden. Es handelt sich also um Tests für die „Talentsuche“. Was muss ein Test erfüllen, um für ein Screening geeignet zu sein?

Ein Screening muss ökonomisch sein, d. h. eine grobe Einschätzung mit möglichst geringem Aufwand erlauben. Ich erwarte von einem Screening-Verfahren eine hohe Trefferquote. Je geringer der Anteil von diagnostischen Fehlentscheidungen ist, desto größer ist der Nutzen eines Screenings. Das liegt auf der Hand, bedenkt man die Bedeutung einer Fehlklassifikation für die betroffene Person. Im Kontext der Begabungsförderung sollte insbesondere die Anzahl der als falsch-negativ Klassifizierten möglichst gering sein, d. h. es sollten nur wenige tatsächlich Begabte von dem Screening nicht erkannt werden. Andernfalls blieben talentierte Personen unentdeckt. Maßnahmen zur Förderung und Entfaltung ihrer Talente blieben ihnen unter Umständen versagt. Das sollte nicht passieren. Wenn eine begabungsgerechte Förderung ausbleibt, kann sich das negativ auf ihre Bildungs- und Berufsmöglichkeiten und auch auf das Wohlbefinden auswirken.

3. Wann ist ein Test für den Einsatz in der Schullaufbahnberatung im Kontext Hochbegabung geeignet und wann nicht oder nur eingeschränkt?

Schulische Anforderungen sind vielschichtig. Sie erfordern sowohl kognitive Basisfähigkeiten und Prozesse als auch akademische (schulbezogene) Fertigkeiten im engeren Sinne. Folglich sollten Intelligenztests eingesetzt werden, die ein breites Spektrum von kognitiven Fähigkeiten erfassen.

Voraussetzung für den Einsatz eines Intelligenztests in der Schullaufbahnberatung sind außerdem Zusammenhänge zwischen dem Testergebnis und Kriterien schulischer Anforderungen (z. B. Zeugnisnoten, Leistungsprüfungen in Schulfächern). Selbstverständlich sollte die Vorhersagekraft des Tests für diesen Anwendungskontext nachgewiesen sein, etwa anhand von praktisch bedeutsamen Zusammenhängen der erzielten Intelligenztestwerte mit zeitlich später erhobenen Kriterien, wie der Wahl des Studienfachs oder auch späteren Erfolgen in Ausbildung und Beruf. Ebenso wichtig sind in diesem Zusammenhang Befunde zur sogenannten inkrementellen Validität, die Auskunft darüber geben, wie gut die Vorhersagekraft eines Tests im Vergleich zu einem anderen ist.

Aus der anwendungsorientierten Perspektive sind im Ergebnis der Intelligenzdiagnostik Hinweise auf die Begabungsstruktur wünschenswert: Die Testkennwerte sollten das Leistungsprofil für die erfassten kognitiven Fähigkeitsbereiche, also individuelle Stärken und Schwächen, abbilden. Es gilt jedoch zu beachten, dass Profilinterpretationen nur unter bestimmten Voraussetzungen zulässig sind (u. a. hohe Zuverlässigkeiten der Einzeltests, hohe Test-Retest-Profilreliabilität).

ZitatZitat

Diese Voraussetzungen sind hohe Hürden, die von kaum einem Intelligenztest genommen werden. Profilinterpretationen sollten daher nur eine orientierende Funktion für die Schullaufbahnberatung haben.

ZitatZitat

Schließlich ist bei jeder Intelligenzdiagnostik die theoretische Grundlage der Verfahren zu berücksichtigen. Das ist wichtig, weil Intelligenztests meist nur eine beschränkte Auswahl an kognitiven Fähigkeiten erfassen, mit zum Teil beträchtlichen Unterschieden in den inhaltlichen Schwerpunkten. Um einen Test gezielt einsetzen und seine Ergebnisse sinnvoll interpretieren zu können, ist daher eine theoretische Einordnung der erfassten Fähigkeiten unabdingbar –  gleich in welchem Anwendungskontext.

4. Eine Entscheidung, die auf der Basis eines Tests getroffen wird, ist höchstens so gut wie der Test selbst. Welche praktischen Konsequenzen kann es für die getesteten Kinder oder Jugendlichen haben, wenn ein Test eingesetzt wird, dessen Reliabilität oder Validität nicht ausreichend gewährleistet ist?

Ein Beispiel zur Reliabilität einer Messung mag dies verdeutlichen: Eine genaue Messung mit hoher Reliabilität erlaubt eine präzise Schätzung der kognitiven Leistungsfähigkeit eines Kindes oder Jugendlichen. Hingegen ermöglicht eine ungenaue Messung mit geringer Reliabilität nur eine vage Schätzung. Der wahre Wert und der im Test beobachtete Wert können dann so bedeutsam voneinander abweichen, dass die wahre Fähigkeitsausprägung deutlich unter- oder auch überschätzt wird. Solch eine Messungenauigkeit kann eine fehlerhafte Entscheidung mit erheblichen Konsequenzen für die diagnostizierte Person nach sich ziehen. Denn Diagnostik ist immer zielbezogen: In der Regel dient die Diagnostik im Bereich Hochbegabung Bildungsentscheidungen, wie z. B. der Wahl der angemessenen Schule oder des passenden Studienfachs. Sie kann ebenso eine Berechtigungsfunktion haben, wenn beispielweise Ausbildungs- und Arbeitsplätze oder Zugangsberechtigungen nach der kognitiven Leistungsfähigkeit vergeben werden, unter der Annahme, dass dabei die Eignung abgebildet wird.

ZitatZitat

Die auf der Grundlage der psychologischen Diagnostik zu treffenden Entscheidungen können also eine sehr große Tragweite für die diagnostizierten Personen haben! Daher ist es angemessen, dass hohe Anforderungen an die diagnostischen Instrumente gestellt werden.

ZitatZitat

5. Welche Kriterien werden von zu wenigen Tests erfüllt? Wo sehen Sie demnach Verbesserungsbedarf?

Bei der Diagnostik von individuellen Begabungsschwerpunkten kommt der Interpretation der Intelligenzprofile eine besondere Bedeutung zu.

Diese setzt jedoch eine umfassende empirische Prüfung voraus, die von den Testkonstrukteur:innen nicht immer zufriedenstellend geleistet wird. Im Gegenteil: Oftmals laden sie zu unkritisch zu einer Interpretation der Intelligenzprofile ein. In den Testmanualen sollten Testanwender:innen umfassende Informationen finden, die sie darin unterstützen, bei der inhaltlichen Bewertung von Intelligenzprofilen korrekte Schlüsse aus den Testergebnissen zu ziehen. Mögliche Methodeneffekte wie Deckeneffekte sollten in den Manualen angemessen besprochen werden. Dort fehlen aber leider oft wichtige Angaben. [Für Testentwickler:innen und für manche Fachmenschen unter den Lesenden will ich konkret benennen, welche Informationen in den Manualen leider häufig fehlen: Neben Angaben zu den Reliabilitäten der Subtests und zu ihren Interkorrelationen sollten auch empirische Nachweise der Stabilität von Profildiskrepanzen und deren differenzieller Validität vorgelegt werden.]

Insgesamt stehen uns mit den Intelligenztests aber methodisch sehr gut fundierte Verfahren zur Verfügung. Wenn sie von dafür qualifizierten psychologischen Fachpersonen korrekt verwendet und interpretiert werden, haben sie einen unschätzbaren Wert für die Praxis der Begabungsdiagnostik – vor allem mit Blick auf die Vorhersagekraft –, der von keiner anderen methodischen Herangehensweise so geleistet werden kann. Die Testrezensionen im Fachportal Hochbegabung sind dabei eine wertvolle Informationsressource für Testanwender:innen.

Zum Weiterlesen:

Heller, K. (2000) (Hrsg.). Begabungsdiagnostik in der Schul- und Erziehungsberatung. 2. Auflage. Bern: Verlag Hans Huber.

Wyschkon, A. (2019): Normwerte in Leistungstests: Boden- und Deckeneffekte. Hogrefe. Online unter: www.hogrefe.com/de/thema/normwerte-in-leistungstests-boden-und-deckeneffekte (Abrufdatum: 11.12.2023; 13:45 Uhr)