BEFKI 8-10 – Berliner Test zur Erfassung fluider und kristalliner Intelligenz für die 8. bis 10. Jahrgangsstufe

Altersbereich: 8. bis 10. Klasse (ca. 13;0 bis 17;11 Jahre)

Test-Typ: Einzel- und Gruppentest

Jahr: 2009

  • 1. Beschreibung

    • 1.1 Zielsetzung und Grundlagen

      Der BEFKI 8-10 erfasst allgemeine kognitive Fähigkeiten im Sinne fluider und kristalliner Intelligenz bei Schülerinnen und Schülern der Jahrgangsstufen 8 bis 10.

      • Als theoretische Grundlage für die Konstruktion des Verfahrens wurden die Theorie fluider und kristalliner Intelligenz von Horn und Cattell (1966) sowie die Drei-Stratum-Theorie der Intelligenz von Carroll (1993) herangezogen.

        Bei der Operationalisierung der kristallinen Intelligenz orientierten sich die Autoren dabei stärker an Horn und Cattell (1966), bei der Operationalisierung der fluiden Intelligenz stärker an Carroll (1993). Die kristalline Intelligenz wird über Allgemeinwissen bzw. deklaratives Wissen in 16 Bereichen abgebildet, die fluide Intelligenz über schlussfolgerndes Denken im verbalen, numerischen und figuralen Bereich.

    • 1.2 Aufbau

        1. 4 Subtests im Multiple-Choice-Format: (1) Schlussfolgerndes Denken – verbal (16 Aufgaben), (2) Schlussfolgerndes Denken – numerisch (16 Aufgaben), (3) Schlussfolgerndes Denken – figural (16 Aufgaben) und (4) Allgemeinwissen (64 Aufgaben aus Natur-, Geistes- und Sozialwissenschaften).
        2. Die Subtests 1 bis 3 erfassen die fluide Intelligenz (verbal, numerisch, figural), Subtest 4 die kristalline Intelligenz (deklaratives Wissen).
        3. Testung in Langform (Subtests 1-4) oder in Kurzform (Subtests 1 & 4) möglich: Die Autoren empfehlen die Durchführung der Langform.
        4. Pseudoparallelformen verfügbar (bei den Tests zur Erfassung der fluiden Intelligenz ist die Reihenfolge der Antwortalternativen vertauscht).

    • 1.3 Quellen

      • Wilhelm, O., Schroeders, U. & Schipolowski, S. (2014). BEFKI 8-10. Berliner Test zur Erfassung fluider und kristalliner Intelligenz für die 8. bis 10. Jahrgangsstufe. Göttingen: Hogrefe.

  • 2. Anwendung in der Hochbegabungsdiagnostik

    • 2.1 Zusammenfassung

      • Eine abschließende Bewertung des BEFKI 8-10 ist nicht möglich.

        Die Items sind für die Differenzierung im oberen Begabungsbereich zu leicht. Bei Verdacht auf intellektuelle Hochbegabung ist nach Aussage der Autoren eine genauere Abschätzung mit der Testform ab Jahrgangsstufe 11 zu empfehlen (BEFKI 11+; jedoch noch nicht publiziert).

        Der BEFKI 8-10 sollte ausschließlich bei Schülerinnen und Schülern mit ausreichenden Deutschkenntnissen Anwendung finden.

        Der erreichbare Höchstwert liegt bei IQ>145.

    • 2.2 Eignung als Screening

      Als Screening eingeschränkt geeignet

      • Als Gruppentest durchführbar. Durchführungszeiten von 40 Minuten (Kurzform) bis 70 Minuten (Langform; sollte bevorzugt verwendet werden, ist aber zu lang für Screening).

    • 2.3 Eignung zur Profilerstellung

      Fähigkeitsprofil eingeschränkt möglich

      • Zur Erstellung eines Intelligenzprofils auf Ebene der Subtests nur eingeschränkt geeignet: mögliche Deckeneffekte müssen beachtet werden. Keine Angaben zu kritischen Differenzen.

    • 2.4 Eignung für die Schullaufbahnberatung

      Für die Schullaufbahnberatung eingeschränkt geeignet

      • Normierung nur für Jahrgangsstufe 8 bis 10. Die Validität wird über Zusammenhänge mit sprachlichen Kompetenzen und Schulnoten gestützt, jedoch fehlen Angaben zur Vorhersagevalidität.

    • 2.5 Eignung für Selektionsentscheidungen

      Für Selektionsentscheidungen eingeschränkt geeignet

      • Aufgrund der möglicherweise eingeschränkten Differenzierungsfähigkeit im oberen Begabungsbereich nur in Kombination mit anderen Verfahren geeignet.

        Die internen Konsistenzen liegen z. T. unter .70; damit fallen die Konfidenzintervalle relativ groß aus, was Selektionsentscheidungen, die auf bestimmten Grenzwerten basieren, erschweren kann.

  • 3. Normierung

    • 3.1 Vorbemerkungen

      Die Verwendung der Klassenstufennormen ist der Verwendung der Altersnormen vorzuziehen.

    • 3.2 Aktualität der Normen

      Aktualität der Normen gegeben

      • Normierung: April bis Juni 2008.

        Alternsnormen (Z-Werte, PR, Vertrauensintervalle, IQ) von 13;0 - 17;11 Jahre in Ein-Jahres-Intervallen, auch getrennt nach Geschlecht.

        Klassenstufennormen (Z-Werte, PR, Vertrauensintervalle, IQ) für die Klassenstufen 8, 9 und 10.

        Für die Klassenstufen 9 und 10 existieren zusätzlich schulartspezifische Normen (Gymnasium, nicht-gymnasiale Schularten).

    • 3.3 Repräsentativität der Normen

      Angaben zur Beurteilung der Repräsentativität der Normen nicht ausreichend

      • n = 5708 Schülerinnen und Schüler der Jahrgangsstufen 8-10 aller Schularten des allgemeinbildenden Schulsystems in allen deutschen Bundesländern mit Ausnahme von Bremen.

        Die Schülerinnen und Schüler bearbeiteten zwischen ein und vier Untertests.

        Aufgrund ungleichmäßiger Stichprobenverteilung über Klassenstufen und Schularten erfolgte eine entsprechende Gewichtung der Daten zur Berechnung der Klassenstufennormen (9 & 10) und Altersnormen nach amtlicher Schulstatistik. Bestimmte Altersgruppen konnten dabei nur unzureichend abgebildet werden (insb. 14 und 17 Jahre).

        Für die 8. Jahrgangsstufe liegen lediglich Normen für Schülerinnen und Schüler, die einen Hauptschulabschluss anstreben, vor.

        Eine abschließende Beurteilung der Repräsentativität ist aufgrund von unzureichenden Angaben zur Stichprobe nicht möglich.

  • 4. Objektivität

    • 4.1 Vorbemerkungen

      Auswertungs- und Interpretationshinweise verzichten gezielt auf Fachtermini, so dass sie direkt zur Ergebnisrückmeldung verwendet oder bei der Erstellung von Gutachten genutzt werden können.

    • 4.2 Durchführungsobjektivität

      Durchführungsobjektivität gegeben

      • Standardisierte Durchführungsinstruktionen und Zeitvorgaben vorhanden, zusätzlich schriftliche Instruktion im Testheft.

        Es werden konkrete Hinweise für die Gestaltung des Durchführungssettings gegeben.

    • 4.3 Auswertungsobjektivität

      Auswertungsobjektivität gegeben

      • Auswertungshinweise (mit Beispielen) sowie Bewertungsregeln und Auswertungsschablonen vorhanden.

    • 4.4 Interpretationsobjektivität

      Interpretationsobjektivität gegeben

      • Normwerte und ausführliche Hinweise zur Interpretation (inkl. Fallbeispiel Hochbegabung) und Ergebnisrückmeldung vorhanden.

  • 5. Reliabilität

    • 5.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 5.2 Paralleltest-Reliabilität

      Entfällt (Kein Paralleltest vorhanden)

    • 5.3 Testhalbierungsreliabilität

      Angaben zur Testhalbierungsreliabilität fehlen

    • 5.4 Retest-Reliabilität

      Retest-Reliabilität weitestgehend gegeben

      • Hülür, Wilhelm & Robitzsch, 2011: n = 225 Schülerinnen und Schüler, Korrelation zwischen echt parallelen Testformen (weitere Angaben fehlen) nach 20 Monaten (erste Testung zu Beginn der 9. Klasse); befriedigende Stabilität des Gesamtskalen (.74 bis .79), unzureichende Stabilität der Subtests (.50 bis .68).

    • 5.5 Interne Konsistenz

      Interne Konsistenz weitestgehend gegeben

      • Ermittelt an gewichteter Normierungsstichprobe.

        Gute Werte für Gesamtstichprobe und Klassenstufen 9 und 10: Die interne Konsistenz der Skala der fluiden Intelligenz liegt bei .84, die der Skala der kristallinen Intelligenz bei .88. Die internen Konsistenzen der Skalen für die Klassenstufen 9 und 10 liegen zwischen .82 - .85, für die Klassenstufe 8 jedoch nur bei .68 und .69.

        Die Autoren weisen auf eine systematische Verzerrung für Klassenstufe 8 hin, da hier nur Schülerinnen und Schüler getestet wurden, welche einen Hauptschulabschluss anstrebten.

    • 5.6 Profilreliabilität

      Angaben zur Profilreliabilität fehlen

  • 6. Validität

    • 6.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 6.2 Konstruktvalidität

      Konstruktvalidität gegeben

      • Konfirmatorische Faktorenanalyse mit den Daten der Normierungsstichprobe. Die fluide Intelligenz lässt sich durch eine dreifaktorielle Struktur (verbal, numerisch, figural) am besten beschreiben. Die kristalline Intelligenz lässt sich gleichermaßen gut über ein ein- und ein dreifaktorielles Modell beschreiben.

    • 6.3 Kriteriumsvalidität

      Kriteriumsvalidität weitestgehend gegeben

      • Zusammenhänge mit anderen Intelligenztests:

        n = 599 Schülerinnen und Schüler der 8. - 10. Klasse aus 2 Gymnasien, 2 Haupt- und 3 Realschulen, 50% Mädchen, Durchschnittsalter 15.0 Jahre.

        Zusammenhänge der fast endgültigen Fassung des BEFKI 8-10 mit 2 Untertests des Kognitiven Fähigkeits-Tests (KFT 4-12+R; Heller & Perleth, 2000), dem Mehrfachwahl-Wortschatz-Intelligenztest (MWT-B; Lehrl, 2005) und dem Wortschatztest (WST; Schmidt & Metzler, 1992): Analyse der Daten mittels Strukturgleichungsmodell; hohe latente Korrelationen von ρ = .99 zwischen Faktoren der fluiden Intelligenz aus BEFKI und KFT sowie von ρ = .93 zwischen dem BEFKI-Faktor kristalline Intelligenz und einem übergeordneten Faktor Wortschatz (konvergente Validität).

        Zusammenhänge zwischen BEFKI-Faktor der kristallinen Intelligenz und KFT-Faktor der fluiden Intelligenz sowie zwischen BEFKI-Faktor der fluiden Intelligenz und dem Wortschatzfaktor fielen geringer aus (diskriminante Validität).

        Zusammenhänge mit Tests sprachlicher Kompetenzen

        Zusammenhänge mit unterschiedlichen sprachlichen Kompetenzen (Lesen, Zuhören, Orthografie und Schreiben in Deutsch; Lese- und Hörverstehen in Englisch; Tests aus DESI Studie): Normierungsstichprobe; hohe Zusammenhänge über alle Kompetenzbereiche hinweg mit fluider Intelligenz (.72 - .78) und kristalliner Intelligenz (.71 - .80).

        Zusammenhänge mit Schulnoten

        Noten in Deutsch, Englisch und Mathematik: Normierungsstichprobe; niedrige bis mittlere Zusammenhänge für alle drei Fächer mit fluider Intelligenz (.27 - .36) und kristalliner Intelligenz (.28 - .34).

    • 6.4 Prognostische Validität

      Angaben zur prognostischen Validität fehlen

  • 7. Ökonomie

    • 7.1 Vorbemerkungen

      Keine speziellen Hinweise

    • 7.2 Durchführungsökonomie

      Durchführung ökonomisch

      • Langform (70 Minuten); Kurzform (40 Minuten)

    • 7.3 Auswertungsökonomie

      Auswertung ökonomisch

      • Angaben zur Auswertungsdauer fehlen, doch dürfte diese nur wenige Minuten betragen.

  • 8. Weiterführende Informationen

    • 8.1 Vorgängerversion

      • Keine

    • 8.2 Literaturangaben

      • Carroll, J. B. (1993). Human cognitive abilities: A survey of factoranalytic studies. New York, NY: Cambridge University Press.

        Dimitrov, D. M. (2003). Marginal true-score measures and reliability for binary items as a function of their IRT parameters. Applied Psychological Measurement, 27, 440-458.

        Horn, J. L. & Cattell, R. B. (1966). Refinement and test of the theory of fluid and crystallized intelligence. Journal of Educational Psychology, 57, 253-270.

        Hülür, G. Wilhelm, O. & Robitzsch, A. (2011). Multivariate Veränderungsmodelle für Schulnoten und Schülerleistungen in Deutsch und Mathematik. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 43, 173-185.