APM – Advanced Progressive Matrices

Altersbereich: Ab 12 Jahren

Test-Typ: Einzel- und Gruppentest

Jahr: 1998

  • 1. Beschreibung

    • 1.1 Zielsetzung und Grundlagen

      Die APM dienen der sprachfreien Erfassung der allgemeinen Intelligenz mittels figuralem Aufgabenmaterial (Matrizenaufgaben) bei überdurchschnittlich begabten Jugendlichen ab 12 Jahren und Erwachsenen.

      • Die Raven-Matrizentests wurden zur Erfassung der allgemeinen Intelligenz im Sinne des Intelligenzfaktors „g“ in Spearmans Intelligenzmodell (Spearman, 1904) entwickelt. Erfasst werden soll insbesondere die edukative Komponente des g-Faktors. Diese umfasst die Fähigkeit zur Entwicklung, Ableitung oder zum Herausfiltern neuer Einsichten oder Informationen aus dem, was eine Person wahrnimmt oder bereits weiß und damit letztendlich induktive Fähigkeiten und Denkprozesse (Raven, Raven & Court, 1996).

    • 1.2 Aufbau

        1. Die meisten Aufgaben (Ausnahme: Aufgaben 1-4 in Set I) bestehen aus 9 geometrischen Figuren (Anordnung als 3 x 3 Matrix), von denen die neunte fehlt. Aus 8 Antwortalternativen ist diejenige zu wählen, die das Muster korrekt ergänzt.
        2. Separate Aufgabenhefte für 2 Aufgabensets: Set I mit 12 Aufgaben und Set II mit 36 Aufgaben.
        3. Die Aufgaben in Set II sind schwieriger und komplexer als die in Set I.
        4. Set I kann zur Vorbereitung auf Set II bzw. als Screeninginstrument für das weitere Testvorgehen (Einsatz von SPM oder APM?) eingesetzt werden.
        5. Es gibt eine Computerversion im Rahmen des Wiener Testsystems der Firma Schuhfried.
        6. Es existiert kein Paralleltest.

    • 1.3 Quellen

      • Heller, K.A., Kratzmeier, H. & Lengfelder, A. (1998). Matrizen-Test-Manual, Band 2. Ein Handbuch mit deutschen Normen zu den Advanced Progressive Matrices von J. C. Raven. Göttingen: Beltz.

        Raven, J.C., Raven, J. & Court, J.H. (dt. Bearbeitung und Normierung von H. Häcker und S. Bulheller) (1998). Raven’s Progressive Matrices and Vocabulary Scales – Manual Teil 4: Advanced Progressive Matrices. Frankfurt a.M.: Swets.

  • 2. Anwendung in der Hochbegabungsdiagnostik

    • 2.1 Zusammenfassung

      • Die Prüfung der Aktualität der Normen bzw. eine Neunormierung sind erforderlich. Die Ergebnisinterpretation muss daher mit Vorsicht erfolgen; insbesondere ist eine Überschätzung von Fähigkeiten wahrscheinlich.

        Aufgrund der Eindimensionalität des Verfahrens und des damit eingeschränkten Messbereichs eignen sich die APM zur Hochbegabungsdiagnostik nur in Kombination mit mehrdimensionalen Testverfahren.

        Zur Beurteilung der kognitiven Fähigkeiten sollten nur die Ergebnisse von Set II herangezogen werden (Heller et al, 1998).

        Für hochbegabte Jugendliche ab Klasse 8 und Studierende ist mit Deckeneffekten zu rechnen (Preckel, 2003).

        Der erreichbare Höchstwert liegt bei IQ=145.

    • 2.2 Eignung als Screening

      Als Screening eingeschränkt geeignet

      • Der von den Autoren vorgeschlagene Einsatz von Set I als Screening ist aufgrund der nicht ausreichenden Reliabilität von Set I nicht zu empfehlen. Der Einsatz von Set I und II dauert mind. 60 Min.

    • 2.3 Eignung zur Profilerstellung

      Kein Fähigkeitsprofil

      • Aufgrund der Eindimensionalität der APM ist die Erstellung eines Intelligenzprofils nicht möglich.

    • 2.4 Eignung für die Schullaufbahnberatung

      Für die Schullaufbahnberatung eingeschränkt geeignet

      • Erst ab 12 Jahren normiert.

        Aufgrund des eingeschränkten Messbereichs (fluide Intelligenz mit ausschließlich figuralem Aufgabenmaterial) nur in Kombination mit mehrdimensionalen Tests geeignet; insbesondere Ergänzung um Tests verbaler Fähigkeiten als wichtige Prädiktoren für Schulerfolg (Vock, 2008).

        Bei hochbegabten Jugendlichen ab der Mittelstufe mögliche Deckeneffekte beachten.

    • 2.5 Eignung für Selektionsentscheidungen

      Für Selektionsentscheidungen eingeschränkt geeignet

      • Bei hochbegabten Jugendlichen ab der Mittelstufe und Studierenden mögliche Deckeneffekte beachten.

  • 3. Normierung

    • 3.1 Vorbemerkungen

      Keine Normdifferenzierung nach Geschlecht trotz Hinweisen zu Vorteilen männlicher Testpersonen aufgrund geschlechtsspezifischer Leistungsunterschiede im räumlichen Denken (Irwing & Lynn, 2005).

    • 3.2 Aktualität der Normen

      Überprüfung/Aktualisierung der Normen erforderlich

      • Zwei verschiedene deutsche Normierungsstichproben vorhanden.

        Heller et al. (1998), Normierung: 1996/97

        Altersnormen (T-Werte, IQ-Werte, PR) für Schüler/innen ab 12 Jahren und schultypspezifische Klassennormen; Altersnormen für Studierende ab 20 Jahren und studienfachspezifische Normen.

        Raven et al. (1998), Normierung: 1997

        Prozentrangnormen für Altersgruppen ab 13 Jahren, die Gesamtstichprobe sowie für Bildungsgruppen, getrennt für Set I und Set II; von einer Transformation in IQ-Werte wird abgeraten, da die Verteilung der Testwerte in keiner der untersuchten Stichproben einer Normalverteilung entsprach.

    • 3.3 Repräsentativität der Normen

      Repräsentativität der Normen eingeschränkt

      • Heller et al. (1998)

        921 deutsche Schüler/innen aus Grund-, Haupt- und Realschulen sowie Gymnasien in BY (Auswahl anhand der Grund- und Strukturdaten 1995/96 des Bundesministeriums für Bildung, Wissenschaft, Forschung und Technologie; keine Angaben zur Geschlechterverteilung; 12-19 Jahre).

        581 Studierende aus drei Universitäten in München und dem Münchner Umland aus verschiedenen Fachrichtungen (keine Angaben zur Geschlechterverteilung; 19-53 Jahre, im Mittel ca. 24 Jahre).

        Eine abschließende Beurteilung der Repräsentativität ist aufgrund von unzureichenden Angaben zur Stichprobe nicht möglich.

        Raven et al. (1998)

        1142 deutsche Schüler/innen und Erwachsene aus unterschiedlichen Gebieten Deutschlands mit Schwerpunkt in NRW; keine Angaben zur Geschlechterverteilung; 13-75 Jahre, wobei überwiegend jüngerer Personen (80 % < 30 Jahre); Überrepräsentation höherer (angestrebter) Bildungsabschlüsse.

        Eine abschließende Beurteilung der Repräsentativität ist aufgrund von unzureichenden Angaben zur Stichprobe nicht möglich.

  • 4. Objektivität

    • 4.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 4.2 Durchführungsobjektivität

      Durchführungsobjektivität gegeben

      • Standardisierte verbale und nonverbale Instruktion für die Papier-Bleistift-Version vorhanden.

        Standardisierte schriftliche Instruktion in der Computerversion.

    • 4.3 Auswertungsobjektivität

      Auswertungsobjektivität gegeben

      • Genaue Auswertungshinweise vorhanden.

        Die Auswertung der Computerversion erfolgt automatisch.

    • 4.4 Interpretationsobjektivität

      Interpretationsobjektivität gegeben

      • Normtabellen und zusätzliche Interpretationshinweise vorhanden.

        Unhandlich, da zwei verschiedene Manuale (Heller et al., 1998; Raven et al., 1998) zu Rate gezogen werden können.

  • 5. Reliabilität

    • 5.1 Vorbemerkungen

      Kleine Stichproben schränken die Aussagekraft der Befunde zur Reliabilität ein

    • 5.2 Paralleltest-Reliabilität

      Paralleltest-Reliabilität entfällt (Kein Paralleltest vorhanden)

    • 5.3 Testhalbierungsreliabilität

      Testhalbierungsreliabilität gegeben

      • Heller et al. (1998)

        Schüler/innen, Normierungsstichprobe; ausreichende bis sehr gute Split-half-Reliabilität für den Gesamttestwert (.59-.92), keine Angaben für Set I und II;

        Studierende, keine weiteren Angaben; akzeptable bis gute Split-half Reliabilität für den Gesamttestwert (.67-.82), keine Angaben für Set I und II.

        Raven et al. (1998)

        Stichprobe unklar; gute Split-half Reliabilität für Set II (.83–.87); keine klaren Angaben für Set I.

    • 5.4 Retest-Reliabilität

      Retest-Reliabilität weitestgehend gegeben

      • Heller et al. (1998)

        128 Schüler/innen, keine weiteren Angaben; bei Testwiederholung nach drei Monaten gute Stabilität des Gesamtwerts (.80);

        41 hochbegabte Gymnasiast/innen, keine weiteren Angaben; bei Testwiederholung nach einem Jahr akzeptable Stabilität des Gesamtwerts (.70);

        20 Ingenieursstudierende, keine weiteren Angaben; bei Testwiederholung nach zwei Wochen akzeptable Stabilität des Gesamtwerts (.70; Diemand, Schuler & Stapf, 1991);

        20 Studierende verschiedener Fachrichtungen, keine weiteren Angaben; bei Testwiederholung nach zwei Wochen gute Stabilität des Gesamtwerts (.80; Koch & Locher, 1996).

        Raven et al. (1998)

        Stichprobe unklar; veraltete Daten (erhoben zwischen 1947-1962)

    • 5.5 Interne Konsistenz

      Interne Konsistenz weitestgehend gegeben

      • Heller et al. (1998)

        Schüler/innen, Normierungsstichprobe; mangelhafte bis niedrige interne Konsistenz für Set I (.34-.78), gute bis sehr gute interne Konsistenz für Set II (.70-.88) und Gesamttest (.75-.91);

        Studierende, keine weiteren Angaben: mangelhafte interne Konsistenz für Set I (.55), gute interne Konsistenz für Set II (.82) und Gesamttest (.83).

        Raven et al. (1998)

        Angaben zur internen Konsistenz fehlen.

    • 5.6 Profilreliabilität

      Profilreliabilität entfällt (keine Profilerstellung möglich)

  • 6. Validität

    • 6.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 6.2 Konstruktvalidität

      Konstruktvalidität weitestgehend gegeben

      • Eindimensionalität der APM konnte faktorenanalytisch nicht bestätigt werden (Heller et al., 1998).

        Eine Vielzahl von Forschungsbefunden stützt die Konstruktvalidität der APM (Preckel, 2003).

    • 6.3 Kriteriumsvalidität

      Kriteriumsvalidität gegeben

      • Heller et al. (1998)

        Zusammenhänge mit anderen Intelligenztests

        KFT 4-13+ (Heller, Gaedike & Weinläder, 1985):

        59 Gymnasiast/innen der 10. Klasse; höhere Korrelationen mit den quantitativen (.44) und nonverbalen (.26) KFT-Skalen als mit den verbalen Skalen (.03);

        98 hochbegabte Schüler/innen der 9. und 10. Klasse; höhere Korrelationen mit den quantitativen (.40) und nonverbalen (.51) KFT-Skalen als den verbalen Skalen (.28)

        CFT 20 (Weiß, 1978):

        108 Schüler/innen der 8. und 9. Klasse; mittlere Zusammenhänge mit CFT 20 (Set I .47, Set II .56);

        68 Studierende, keine weiteren Angaben; mittlere Zusammenhänge mit CFT 3 (Set I .26, Set II .33)

        ZVT (Oswald, & Roth, 1978):

        114 Schüler/innen der 8. und 9. Klasse; mittlere Zusammenhänge (Set I .34, APM II .33)

        Zusammenhänge mit Schulnoten

        223 Schüler/innen der 8. und 9. Klasse; mittlere Korrelationen mit Mathematiknoten (Set I .34, Set II .35) bzw. Deutschnoten (Set I .23, Set II .27).

        Nullkorrelation mit der Abiturnote bei retrospektiver Erhebung bei 290 Studierenden.

        Raven et al., 1998

        Zusammenhänge mit anderen Intelligenztests

        WAIS (Wechsler, 1955): n = 13, keine weiteren Angaben; mittlerer Korrelation mit Handlungs-IQ (.55), Verbal-IQ (.42) und Gesamt-IQ (.55).

    • 6.4 Prognostische Validität

      Angaben zur prognostischen Validität fehlen

  • 7. Ökonomie

    • 7.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 7.2 Durchführungsökonomie

      Durchführung ökonomisch

      • Powertest ohne zeitliche Begrenzung, ca. 10 Min. für SET I und 40 Min. für SET II; insg. ca. 60 Min. (inkl. Instruktion).

    • 7.3 Auswertungsökonomie

      Auswertung ökonomisch

      • Auswertung dauert nur wenige Minuten.

  • 8. Weiterführende Informationen

    • 8.1 Vorgängerversion

      • Kratzmeier, H. & Horn, R. (1980). Manual Raven-Matrizen: Advanced Progressive Matrices. Weinheim: Beltz.

    • 8.2 Literaturangaben

      • Diemand, A., Schuler, H. & Stapf, K.H. (1991). Zum Einsatz eines Lerntests bei Ingenieursstudenten – eine Pilotstudie. Zeitschrift für Arbeits- und Organisationspsychologie, 35, 15-22.

        Heller, K.A., Gaedike, A.-K. & Weinläder, H. (1985). Kognitiver Fähigkeitstest (KFT 4-13+) (2. Aufl.). Weinheim: Beltz.

        Irwing, P. & Lynn, R. (2005). Sex differences in means and variability on the progressive matrices in university students: A meta-analysis. British Journal of Psychology, 96, 505-524.

        Koch, J.-J. & Locher, J. (1996). Sind Lerntests brauchbare Instrumente der Erwachsenen-Diagnostik? Zeitschrift für Differentielle und Diagnostische Psychologie, 17, 119-125.

        Oswald, W.D. & Roth, E. (1978). Der Zahlenverbindungstest (ZVT). Göttingen: Hogrefe.

        Preckel, F. (2003). Diagnostik intellektueller Hochbegabung. Testentwicklung zur Erfassung der fluiden Intelligenz. Göttingen: Hogrefe.

        Raven, J., Raven, J.C. & Court, J.H. (1996). Manual for Raven’s Progressive Matrices and Vocabulary Scales. Oxford: Oxford Psychologists Press.

        Spearman, C. (1904). ‘General intelligence’ objectively determined and measured. American Journal of Psychology, 15, 201–293.

        Vock, M. (2008). Non-verbaler Intelligenztest (SON-R 2½-7). Dt. Standardisierung von P.J. Tellegen, J.A. Laros & F. Petermann. Unter Mitarbeit von Nina Janke, Norbert Karpinski und Anja Renziehausen (2007) [Testinformation]. Diagnostica, 54, 112-115.

        Wechsler, D. (1955). Wechsler Adult Intelligence Scale Manual. New York: Psychological Corporation.

        Weiss, R. (1978). Grundintelligenztest CFT 20. Skala 2. Braunschweig: Westermann.