Diagnostik mit Intelligenztests

Beratung

WNV – Wechsler Nonverbal Scale of Ability (Deutsche Bearbeitung)

Altersbereich: 4;0 bis 21;11 Jahre

Test-Typ: Einzeltest

Erscheinungsjahr: 2014

Verlag: Pearson, Frankfurt

WNV – Wechsler Nonverbal Scale of Ability (Deutsche Bearbeitung)

1 Beschreibung

1.1 Zielsetzung und Grundlagen

Die WNV dient der nonverbalen Erfassung allgemeiner kognitiver Fähigkeiten im Alter von 4 bis 21 Jahren.

Die WNV erfasst allgemeine kognitive Fähigkeiten anhand von nonverbalen Untertests mit bildhaften Instruktionen in zwei Altersgruppen (AG1: 4;0–7;11 Jahre; AG2: 8;0–21;11 Jahre). Intelligenztheoretisch ist das Verfahren an allgemeinen Intelligenzkonzeptionen (vgl. Spearman, 1904; Wechsler, 1939) angelehnt und setzt sich aus Testmaterial anderer Wechsler-Verfahren zusammen (z. B. Naglieri, 2003; Petermann, 2011; Wechsler et al., 2004). Besonderer Fokus liegt auf der Anwendung unter Berücksichtigung sprachlicher Einschränkungen (z. B. Sprachentwicklungsstörungen, andere Muttersprache).

1.2 Aufbau

  • Die WNV besteht insgesamt aus sechs Untertests:
    1. Matrizen-Test (MT),
    2. Zahlen-Symbol-Test (ZST),
    3. Figuren legen (FL),
    4. Formen wiedererkennen (FW),
    5. Visuell-Räumliche Merkspanne (VRM),
    6. Bilder ordnen (BO).
  • Es gibt zwei Testversionen mit Gesamt-IQ-Werten: Die 4-Untertest-Batterie (für AG1 bestehend aus MT, ZST, FL, FW; für AG2 bestehend aus MT, ZST, VRM, BO) und die 2-Untertest-Batterie als Kurzform (für AG1 bestehend aus MT und FW; für AG2 bestehend aus MT und VRM); jeweils basierend auf altersangemessenen Aufgaben.

1.3 Quellen

Petermann, F. (Ed.) (2014). Wechsler Nonverbal Scale of Ability — Deutsche Bearbeitung. Pearson Assessment.

2 Anwendung

2.1 Zusammenfassung

Die deutsche Fassung der WNV ist für die Anwendung im Bereich der Hochbegabungsdiagnostik kaum ausreichend (prognostisch) validiert und kann daher höchstens in Kombination mit komplexeren, validen Leistungsmessungen empfohlen werden.

Fehlende bzw. eingeschränkte Reliabilitätsbelege in Kombination mit mangelnder Konstruktvalidität im Sinne eines mehrdimensionalen Verfahrens müssen bei der Anwendung unbedingt beachtet werden.

Bei Einschränkungen im sprachlichen Bereich ergeben sich aufgrund des gänzlich nonverbalen Charakters (bspw. auch seitens der Instruktionen) spezifische Anwendungen für die Erfassung eines nonverbalen Gesamt-IQ-Werts im Sinne einer Schwellendefinition.

Für die US-Version liegt eine differenzielle Validitätsstudie mit Hochbegabten (n = 41) im Vergleich zu einer gematchten Kontrollgruppe vor. Die Untertestleistungen fallen deutlich und signifikant zugunsten der Hochbegabten aus (.47 ≤ d ≤ 1.29). Selbiges gilt für die Gesamt-IQ-Werte (d = 1.52 für 4-Untertest-Batterie, d = 1.40 für 2-Untertest-Batterie).

Um Deckeneffekten vorzubeugen, gibt es Zeitgratifikationen für schnellere Bearbeitung (Untertest FL). Insgesamt sind in der deutschen Normstichprobe Gesamt-IQ-Werte zwischen 30 und 170 abgebildet.

2.2 Eignung als Screening

Als Screening eingeschränkt geeignet

2-Untertest-Batterie als Kurzform liefert ökonomisch (20 min) reliablen Gesamt-IQ-Wert.

Keine Gruppentestung möglich.

2.3 Eignung zur Profilerstellung

Fähigkeitsprofil möglich

Ipsative Zusatzanalysen auf Untertestebene ermöglichen Identifikation individueller Stärken und Schwächen über kritische Differenzwerte (α = .05 bzw. .15) für

  1. einzelnes Untertestergebnis im Vergleich zum Mittelwert übriger Testwerte,
  2. stärkstes vs. schwächstes Untertestergebnis,
  3. Ergebnisse der beiden Untertests im Rahmen der 2-Untertest-Batterie.

2.4 Eignung für die Schullaufbahnberatung

Für die Schullaufbahnberatung eingeschränkt geeignet

Nur in Kombination mit zusätzlichen Merkmalen mit hoher prädiktiver Validität im schulischen Bereich (z. B. mathematische oder verbale Fähigkeiten) geeignet.

Für die US-Version liegen prognostische Validitätsbefunde zum Wechsler Individual Achievement Test (WIAT-II; Wechsler, 2005) vor (s. Wechsler & Naglieri, 2006).

Prognostische Validitätsbelege für Schulleistungen für die deutsche Fassung fehlen.

Fähigkeitsprofile für 4-Untertest-Batterie in Form kritischer Differenzwerte von Untertests zum Mittelwert übriger Untertests möglich.

2.5 Eignung für Selektionsentscheidungen

Für Selektionsentscheidungen eingeschränkt geeignet

Nur in Kombination mit zusätzlichen mehrdimensionalen Intelligenztestungen sowie nicht-fähigkeitsbezogenen Merkmalen (z. B. Leistungsmotivation, Schulleistungen) geeignet.

Für die US-Version liegen prognostische Validitätsbefunde zum Wechsler Individual Achievement Test (WIAT-II; Wechsler, 2005) vor (s. Wechsler & Naglieri, 2006).

Prognostische Validitätsbelege für Schulleistungen für die deutsche Fassung fehlen.

3 Normierung

3.1 Vorbemerkungen

Keine speziellen Hinweise

3.2 Aktualität der Normen

Überprüfung/Aktualisierung der Normen in den nächsten Jahren erforderlich

Normierungszeitraum: Februar–Oktober 2013.

(US-Normierung: n = 1.323; Normierungszeitraum: Oktober 2003.)

Gestaffelte Altersgruppennormen für AG1 (4;0–7;11 Jahre) und AG2 (8;0–21;11 Jahre): im Alter von 4;0–5;11 Jahren in 3-monatigen Abständen, im Alter von 6;0–16;11 Jahren in 4-monatigen Abständen, sowie eine Gruppe im Alter von 17;0–19;11 Jahren und eine Gruppe im Alter von 20;0–21;11 Jahren.

3.3 Repräsentativität der Normen

Repräsentativität der Normen weitestgehend gegeben

Die deutsche Normierungsstichprobe (n = 1.449) wurde über öffentliche Einrichtungen (z. B. Kindergärten, Sportvereine) in zehn deutschen Bundesländern (nRegion Nord = 380, nRegion Ost = 239, nRegion Süd = 456, nRegion West = 374) akquiriert. Stratifizierung nach Alter, Geschlecht, Bildungshintergrund der Eltern (bei Kindern und Jugendlichen), Schulform bzw. höchstem Bildungsabschluss (bei Erwachsenen selbst) und familiärem Hintergrund. Befragte Eltern hatten vorwiegend Abitur (33.6 % der Mütter, 34.1 % der Väter) bzw. Realschulabschlüsse (38.4 % der Mütter, 28.9 % der Väter). 

4 Objektivität

4.1 Vorbemerkungen

Keine speziellen Hinweise

4.2 Durchführungsobjektivität

Durchführungsobjektivität gegeben

Detaillierte Durchführungshinweise inklusive mehrsprachiger, wörtlicher Instruktionen (deutsch, türkisch, russisch, spanisch, arabisch) sowie Erläuterungen zu Gesteneinsatz im Rahmen bildbasierter Durchführung.

4.3 Auswertungsobjektivität

Auswertungsobjektivität gegeben

Detaillierte Auswertungshinweise im Manual und Protokollbogen enthalten. Auswertungsschablone für ZST vorhanden.

Berechnung von Normwerten sowie zusätzliche Analysen auf Untertestebene werden klar beschrieben.

Hohe Interrater-Reliabilitäten in kanadischer und US-Normierung nachgewiesen (.88 ≤ IRR ≤ 1.00).

4.4 Interpretationsobjektivität

Interpretationsobjektivität gegeben

Altersgestaffelte Normtabellen und detaillierte Interpretationshinweise inklusive Fallbeispielen für alle im Zuge der Testung ermittelten Testwerte (T, IQ, R), Konfidenzintervalle (90 %, 95 %) und ipsativen Untertest-Analysen (kritische Differenzwerte). Außerdem Textbeispiele zur Ergebniskommunikation.

Die qualitative Beschreibung der IQ-Werte („weit unterdurchschnittlich“ bis „weit überdurchschnittlich“) erfolgt auf Basis der Gesamt-IQ-Werte mit der Empfehlung der Berücksichtigung von Konfidenzintervallen im Zuge der Interpretation. 

5 Reliabilität

5.1 Vorbemerkungen

Keine speziellen Hinweise

5.2 Paralleltest-Reliabilität

Paralleltest-Reliabilität entfällt

Kein Paralleltest vorhanden.

5.3 Testhalbierungsreliabilität

Angaben zur Beurteilung der Testhalbierungsreliabilität fehlen

5.4 Retest-Reliabilität

Retest-Reliabilität eingeschränkt gegeben

Korrigierte Retest-Reliabilitäten (rtt) für n = 100 (nAG1 = 22, nAG2 = 78) Kinder und Jugendliche bei im Mittel 16-tägigem Retest-Intervall (SD = 14 Tage, range = 4 – 40 Tage) liegen vor.

Für Gesamt-IQ-Werte in AG1 fallen Stabilitäten gering aus (.77 ≤ rtt ≤ .78; zum Vergleich AG2: .78 ≤ rtt ≤ .85).

Auf Untertestebene niedrige Stabilitäten für ZST (rtt = .76 in AG1 bzw. .72 in AG2), FL (rtt = .70 in AG1) und BO (rtt = .73 in AG2) sowie auffällig hohe Stabilität des MT in AG1 (rtt = .95 in AG1, rtt = .78 in AG2).

Retest-Studien mit größerem Umfang in Stichprobe und Retest-Intervall erforderlich.

5.5 Interne Konsistenz

Interne Konsistenz eingeschränkt gegeben

Für Gesamt-IQ-Werte gegeben (.83 ≤ Rel ≤ .95 für AG1 / AG2 bzw. Rel = .90 insgesamt).

Auf Untertestebene teilweise für Leistungsmessung zu niedrige Werte (.60 ≤ RelBO ≤ .78 für AG1 / AG2, RelBO = 72; .67 ≤ RelZST ≤ .82 für AG1 / AG2, RelZST = .76; .74 ≤ RelFW ≤ .84 für AG1 / AG2, RelFW = .78).

5.6 Profilreliabilität

Angaben zur Beurteilung der Profilreliabilität fehlen

6 Validität

6.1 Vorbemerkungen

Im Testmanual Verweis auf fünf externe Publikationen für „Informationen und Ergebnisse zu einzelnen Untertests der WNV“ (Petermann 2014, S. 43).

Altersgruppe 2 (8;0–21;11 Jahre) stellt aufgrund der zu großen Altersspanne aus entwicklungspsychologischer Sicht keine valide Gruppierung dar. Dieses konzeptuelle Problem kann durch die gestaffelten Altersnormgruppen innerhalb der AG2 teilweise aufgefangen werden.

6.2 Konstruktvalidität

Konstruktvalidität überwiegend nicht gegeben

Faktorielle Validität:

Zum Nachweis der internen Struktur wurden alle Untertestergebnisse auf einen allgemeinen Faktor zurückgeführt (g-Faktor-Modell) und mit konfirmatorischen Faktorenanalysen in beiden Altersgruppen (4;0–7;11 Jahre, 8;0–21;11 Jahre) geprüft.

Teilweise gute Modellfits (.94 ≤ CFI ≤ .95) mit Einschränkungen bzgl. Fehlermaßen (.071 ≤ RMSEA ≤ .144) sowie teilweise niedrige g-Ladungen einzelner Untertests (z. B. λMT = .42 für AG1, λZST = .44 für AG2).

Inhaltlich problematisch ist die Nutzung eines einfachen g-Modells unter der Auffassung, bei der WNV handele es sich um einen „mehrdimensionalen Intelligenztest“ (Petermann, 2014, S. 7).

Konvergente und diskriminante Validität:

Subtest-Interkorrelationen ohne ausreichende Hinweise zur Beurteilung der konvergenten und diskriminanten Validität der WNV.

Für die US-Version liegen konvergente Validitätsbefunde zu anderen Wechsler-Tests sowie dem Naglieri Nonverbal Ability Test (NNAT-1; Naglieri, 2003) vor (s. Wechsler & Naglieri, 2006).

6.3 Kriteriumsvalidität

Angaben zur Beurteilung der Kriteriumsvalidität nicht ausreichend

Keine Angaben zur konkurrenten oder prognostischen Kriteriumsvalidität der WNV in Form von Korrelationen mit geeigneten Außenkriterien (z. B. Schulerfolg).

Differenzielle Validität:

Eine klinische Validierung des nonverbalen Ansatzes für Kinder und Jugendliche mit Sprachentwicklungsstörungen (n = 46) bzw. Lese-Rechtschreibstörungen (n = 82) erfolgt im Vergleich mit geeigneten Kontrollgruppen. Überwiegend kleine, nicht signifikante Effekte zugunsten der Kontrollgruppen (d < .20), mit Ausnahme des Untertests VRM mit deutlich niedrigeren Werten für Kinder und Jugendliche mit Sprachentwicklungsstörungen (d = .99, p < .05).

Für die US-Version liegt ein differenzielle Validitätsstudie mit Hochbegabten (n = 41) im Vergleich zu einer gematchten Kontrollgruppe vor. Die Untertestleistungen fallen deutlich und signifikant zugunsten der Hochbegabten aus (.47 ≤ d ≤ 1.29). Selbiges gilt für die Gesamt-IQ-Werte (d = 1.52 für 4-Untertest-Batterie, d = 1.40 für 2-Untertest-Batterie).

6.4 Prognostische Validität

Angaben zur Beurteilung der Prognostischen Validität fehlen

Für die US-Version liegen prognostische Validitätsbefunde zum Wechsler Individual Achievement Test (WIAT-II; Wechsler, 2005) vor (s. Wechsler & Naglieri, 2006).

7 Ökonomie

7.1 Vorbemerkungen

Keine speziellen Hinweise.

7.2 Durchführungsökonomie

Durchführung ökonomisch

4-Untertest-Batterie: 30–50 min;

2-Untertest-Batterie: 20 min.

Altersspezifische Startpunkte und Abbruchregeln verkürzen u. U. die Testdauer.

7.3 Auswertungsökonomie

Auswertung ökonomisch

Aufgrund geringen Umfangs und detaillierter Auswertungshinweise insgesamt wenig Auswertungsaufwand.

Ergänzende Analysen auf Untertestebene ebenfalls ökonomisch.

Computergestützte Auswertungsmöglichkeit nicht vorhanden. 

8 Weiterführendes

8.1 Vorgängerversion

Englischsprachige Originalversion:

Wechsler, D., & Naglieri, J. A. (2006). Wechsler Nonverbal Scale of Ability. Harcourt Assessment.

8.2 Literaturangaben

Naglieri, J. A. (2003). Naglieri Nonverbal Ability Test — Individual Administration. Harcourt Assessment.

Petermann, F. (Ed.) (2011). Wechsler Preschool and Primary Scale of Intelligence — III, deutsche Version (Second Edition). Pearson Assessment.

Spearman, C. (1904). “General Intelligence,” Objectively Determined and Measured. The American Journal of Psychology, 15(2), 201–292. https://doi.org/10.2307/1412107

Wechsler, D. (1939). Wechsler-Bellevue Intelligence Scale. Psychological Corporation.

Wechsler, D. (2005). Wechsler Individual Achievement Test — Second Edition. Psychological Corporation.

Wechsler, D., Kaplan, E., Fein, D., Kramer, J., Morris, R., Delis, D., Maerlender, A. (2004). Wechsler Intelligence Scale for Children – Fourth Edition, Integrated. Harcourt Assessment.