- Probabilistische Testtheorie
-
Die Probabilistische Testtheorie (Item Response Theory, auch engl. latent trait theory, strong true score theory oder modern mental test theory) untersucht, wie man aus zugrundeliegenden manifesten kategorialen Daten (z. B. den Antworten auf Testitems) auf zugrundeliegende latente Variablen (z. B. Persönlichkeitseigenschaften der Probanden) zurückschließen kann. Das Wort "probabilistisch" leitet sich dabei aus der stochastischen Beziehung zwischen dem Antwortverhalten der Probanden und der latenten Variable ab.
Abgrenzung: Je nachdem, ob die latente Eigenschaft als metrische (z. B. Intelligenz) oder als kategoriale Variable (z. B. klinische Syndrome) konzipiert wird, unterscheidet man zwischen den hier beschriebenen Latent-Trait und Latent-Class-Modellen (siehe auch Latentes Variablenmodell).
Das wohl bekannteste und mathematisch-statistisch am besten fundierte Latent-Trait-Modell ist das auf Georg Rasch zurückgehende Rasch-Modell, das die Wahrscheinlichkeitsdichte der Antwortvariablen als logistische Funktion zweier Parameter modelliert, von denen einer die zugrundeliegende Fähigkeit der Probanden und der andere die Schwierigkeit der Items misst. Diese Modellannahme hat eine Reihe von Konsequenzen, die das Rasch-Modell in pragmatischer, statistischer und wissenschaftstheoretischer Hinsicht gegenüber allen anderen Latent-Trait-Modellen auszeichnen:
Das Rasch-Modell ist notwendig und hinreichend dafür, dass die gesamte Information über die latente Personenvariable in den Summenscores der Probanden enthalten ist; es ist notwendig und hinreichend für die Schätzung der Modellparameter mittels der bedingten (conditional) Maximum-Likelihood-Methode; und es ist notwendig und hinreichend für die wechselseitige Unabhängigkeit (spezifische Objektivität) der Vergleiche zwischen Messobjekten (Probanden) und Messinstrumenten (Items): Die Aussagen, welche über die Relationen zwischen n = 1,2,3... Probanden gewonnen werden, sind davon unabhängig, welche Items ausgewählt und dem Vergleich zugrundegelegt wurden. Umgekehrt sind die Aussagen, welche über die Relation zwischen k = 1,2,3... Items gewonnen werden, unabhängig davon, anhand welcher Personenstichprobe sie gewonnen wurden.
Sind die Modellannahmen des Rasch-Modells verletzt, so ist die Verwendung des Summenscores mit einem Informationsverlust verbunden, der so weit gehen kann, dass die in den Antworten der Probanden enthaltene diagnostisch relevante Information gänzlich verloren geht. Statt auf die Scores muss die diagnostische Entscheidung dann auf die Antwortmuster der Probanden gegründet werden. Dies leistet die auf Paul Lazarsfeld zurückgehende Latent-Class-Analyse, mittels derer typische Antwortmuster identifiziert und die Probanden danach klassifiziert werden, welchem dieser Typen ihr Antwortverhalten am besten entspricht. Namentlich in der Einstellungsmessung, wo schon geringfügige semantische Variationen der Itemformulierung völlig andere Reaktionstendenzen der Probanden auslösen können, hat sich diese Vorgehensweise gegenüber der immer noch gebräuchlichen Scorebildung als deutlich leistungsfähiger erwiesen.
In Reaktion auf Siegfried Kracauers Kritik, wonach es nicht so sehr die Häufigkeit bestimmter Textmerkmale ist, welche die Bedeutung eines Textes ausmachen, als die Muster, welche sie bilden, hat die Latent-Class-Analyse über die psychologische Diagnostik hinaus auch in der quantitativen Inhaltsanalyse ein wichtiges Anwendungsgebiet gefunden.
Literatur
- Embretson, S. & Reise, S. (2000): Item response theory for psychologists. Mahwah, NJ: Erlbaum.
- Fischer, G. H. (1974): Einführung in die Theorie psychologischer Tests. Grundlagen und Anwendungen. Bern [u. a.]: Huber.
- Gernot, F. (1993): Probabilistische Testmodelle in der Persönlichkeitsdiagnostik. Frankfurt am Main [u. a.]: Lang.
- Heyer, D. (1990): Booleschwertige und probabilistische Meßtheorie : Methoden der Fehlerbehandlung in psychophysikalischen Theorien. Frankfurt am Main [u. a.]: Lang.
- Kempf, W. (2008). Forschungsmethoden der Psychologie. Band II. Quantität und Qualität. Berlin: regener.
- Lind, D. (1994): Probabilistische Testmodelle in der empirischen Pädagogik. Mannheim [u. a.]: BI-Wiss.-Verl.
- Lord, F. M. (1980): Applications of item response theory to practical testing problems. Mahwah, NJ: Erlbaum.
- Müller, H. (1999): Probabilistische Testmodelle für diskrete und kontinuierliche Ratingskalen. Bern: Huber.
- Rasch, G.(1960, 2nd ed. 1980): Probabilistic models for some intelligence and attainment tests. (Copenhagen, Danish Institute for Educational Research), expanded edition (1980) with foreword and afterword by B.D. Wright. Chicago: The University of Chicago Press.
- Rost, J. (1996, 2., vollst. überarb. und erw. Aufl. 2004): Lehrbuch Testtheorie - Testkonstruktion. Bern [u.a.]: Huber.
- Steyer, R. & Eid, M. (2001). Messen und Testen. Berlin: Springer. [Kap. 16 - 18]
Siehe auch
Weblinks
- D. Lind: Modelle zur Leistungsbewertung Vorlesungsskript (PDF; 548 kB)
Wikimedia Foundation.