- Psychologisches Testverfahren
-
Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann.
Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte umrechen, welche mit der Verteilung einer referenzierenden Stichprobe verglichen werden.[1] Darüber hinaus gibt es auch qualitative Tests, die Verhalten „provozieren“, welches durch eine Fachperson qualitativ bewertet oder gedeutet wird (Deutungstests).
Allen Tests gemeinsam ist, dass Verhalten mehr oder weniger standardisiert erfasst wird und die darauf erfolgenden Reaktionen bewertet werden. Durch diese Standardisierung liegen wissenschaftliche Erfahrungen vor, wie die verschiedenen möglichen Verhaltensweisen auf vergleichbare Auslöser bewertet werden können.
Alle Psychologischen Tests gehören zur Psychologischen Diagnostik. Bei der Anwendung von psychologischen Tests sind die Kriterien der Qualitätssicherung in der Psychologischen Diagnostik für die Auftraggeber, die Diagnostiker und die Diagnostizierten zu beachten. Im deutschsprachigen Raum sind schätzungsweise mehrere tausend Psychologische Tests verfügbar, von denen einige breite Verwendung finden, andere für sehr spezielle Anforderungen entwickelt wurden.
Inhaltsverzeichnis
Kriterien
Gemäß der Definition von Lienert und Ratz muss ein psychologisches Testverfahren die folgenden Kriterien erfüllen: Es muss
- wissenschaftlich fundiert sein
- unter Standardbedingungen routinemäßig durchführbar sein
- eine relative Positionsbestimmung eines Individuums bzgl. Gruppe oder Kriteriums ermöglichen
- empirisch abgrenzbar sein, d. h. keine versteckten Merkmale und Phänomene erfassen wie z. B. das Unbewusste in der Psychoanalyse, sondern beobachtbare und messbare Eigenschaften (Konstrukte), also erlebnis- und verhaltensanalytisch, phänomenologisch und nicht nur rein begrifflich abgrenzbare Eigenschaften
- ein zu untersuchendes Merkmal eindimensional und metrisch abbilden (man beachte aber Testbatterien)
Außerdem gelten für Tests Testgütekriterien.
Formen Psychologischer Tests
Die Zahl der vorhandenen psychologischen Tests allein im deutschen Sprachraum kann auf mehrere Tausend geschätzt werden. Qualität und Stand der Entwicklung kann dabei sehr unterschiedlich sein. Bezüglich der Einteilung von Tests sind verschiedene Systeme üblich, in einigen werden die Kategorien vermischt.
Man kann Tests grundsätzlich nach folgenden Kategorien unterscheiden, welche Merkmale gemessen werden (Intelligenz, Gedächtnis, Konzentration, Persönlichkeit, Einstellungen, Motivation u. a.), auf welche Art die Merkmale gemessen werden (Urteil/Beurteilung, Leistungsmessung, Deutung) oder für welche Fragestellungen die Tests einsetzbar sind (Eignungstests, Tests zur Identifikation psychischer Störungen, Schultests u. a.).
- Der Grad der Standardisierung kann sich unterscheiden: vollstandardisiert (Fragen, Antworten, Auswertungsregeln sind fest vorgegeben), halb- oder teilstandardisiert (Teile sind flexibel, zumeist muss der Diagnostiker dann die Ergebnisse beurteilen) oder unstandardisiert (z. B. einzelne Zeichentests).
- Tests sind entweder für alle Personen gleich oder adaptativ/adaptiv, d. h. der Ablauf des Tests wird durch die vorher gegebenen Antworten beeinflusst.
- Bei Urteilsverfahren wird danach unterschieden, ob es sich um eine Selbstbeurteilung oder eine Fremdbeurteilung (durch Angehörige, Vorgesetzte, Lehrer, die Diagnostiker usw.) handelt.
- Bei einer Testbatterie werden mehrere Tests, die für einen Sachverhalt von Bedeutung sind, durchgeführt. Diese können auch unterschiedlichen Kategorien angehören.
In den meisten Testklassifikationen werden diese Aspekte vermischt. Kategorial können Leistungstests, Persönlichkeitstests (im engeren Sinn), Motivations- und Interessenstests, anamnestische Fragebögen und weitere spezielle Testverfahren unterschieden werden. Des Weiteren unterscheidet man zwischen Norm- und Kriteriumsorientierten Testverfahren.
- Als Leistungstests bezeichnet man alle Psychologischen Tests, die den Probanden mit ansteigenden Anforderungen an seine individuelle Leistungsgrenze führen. Diesen Tests ist gemeinsam, dass sie im oberen Bereich so anfordernd werden, dass sie von den meisten Probanden nicht mehr oder nur noch selten erfolgreich bis zu Ende bewältigt werden können. Hierzu zählen z. B. Intelligenztests, Konzentrationstests (d2-Test) oder Reiz-Reaktions-Belastungstests (RST 3), bei denen jeweils die Leistung in einem oder mehreren Teilbereichen erfasst werden. Die Teilbereiche selbst sind Konstrukte, d. h. empirisch ermittelte Messbegriffe wie Intelligenz oder auch Problemlösefähigkeit oder Konzentration.
- Unter Persönlichkeitstests fasst man Tests zusammen, die nicht leistungsbezogen sind, sondern individuelle Merkmalsausprägungen hinsichtlich ihrer Verteilung in der gewählten Grundgesamtheit einordnen. (z. B. 16PF, NEO-PI-R, MBTI, BIP) messen ausgewählte Persönlichkeitseigenschaften (traits) des Menschen.
- Spezielle Testverfahren (z. B. wie die SCL-90 in der klinischen Psychologie) sind auf spezielle Probandengruppen oder Untersuchungszwecke zugeschnittene Verfahren. Diese Tests werden meist nicht für die allgemeine Verwendung, sondern für die Klärung spezieller Fragestellungen entwickelt.
Bei den Persönlichkeitstests wird zwischen Fragebogen- und projektiven Verfahren (z. B. Rorschachtest) unterschieden. Während im Fragebogen der Proband sein eigenes gewohnheitsmäßiges Verhalten und Erleben beschreibt (so genannte Selbstbeschreibung), wird er im projektiven Verfahren um eine gestaltende Deutung der Testvorlage gebeten. Die Zusammenstellung der Testverfahren ist dabei von der jeweiligen Untersuchungsfrage abhängig.
Erhebungsmethoden
Bezüglich der Erhebungsmethode sind mindestens drei Arten zu unterscheiden, die sich mit dem Fortschreiten der Technik entwickelt haben.
Wenn der Proband selbst schriftlich auf Papier antwortet oder Arbeitsblätter ausfüllt, spricht man von Papier und Bleistift. (engl. P & P, paper and pencil) Dieser Begriff entstand, als für viele Tests computerisierte Versionen verfügbar wurden und die in Papierform verbleibenden Verfahren eine eigene Bezeichnung benötigten. Viele ältere Testverfahren sind Papier und Bleistift, allerdings werden auch moderne Tests oft noch in einer solchen Version konzipiert und geeicht, z. B. wenn sie sich an Klienten richten, die mit dem Computer nicht umgehen können oder praktische Überlegungen im klinischen Alltag nicht für eine Rechnerstützung sprechen. Auch qualitative Tests sind heute oft P & P. Diese Tests gelten allgemein als arbeitsaufwendiger in der Auswertung. Es existieren allerdings oft hybride Lösungen, bei denen der Proband auf Papier arbeitet, die Ergebnisse aber vom Testleiter in ein Programm eingegeben werden, damit die Werte berechnet werden können. Manche Tests können generell nur in Papierform absolviert werden, wie beispielsweise Zeichenaufgaben in der Diagnostik bei Schlaganfalls-Patienten. („Malen sie bitte ein Haus mit Fenstern, Tür, Schornstein und Dach.“) Auch strukturierte Interviews werden heute oft als Papier und Bleistift durchgeführt.
Computerunterstützte Tests liegen vor, wenn der Proband selbstständig am Bildschirm, der Tastatur oder einer eigens entwickelten Eingabeeinheit arbeitet. Diese Tests gelten als weitaus ökonomischer, sind aber nicht für jeden Zweck verwendbar. Eingabe-Einheiten können vereinfachte Tastaturen sein, aber auch mechanische Geräte wie Fußpedale, Joystick oder große Knöpfe oder Regler.
Ebenfalls als Computertest bezeichnet man Verfahren, bei denen die Antworten dem Protokoll führenden Testleiter mündlich mit (z. B. Sätze ergänzen) mitgeteilt werden, der sie darauf hin in das Programm eingibt.
Testkonstruktion
Psychologische Tests sind Messinstrumente, die nach wissenschaftlichen Kriterien konzipiert, evaluiert und geeicht werden. Die Herstellung eines Test ist überaus arbeitsaufwendig, erfordert ein genaues Quellenstudium, ein belegter theoretischer Hintergrund, eine exakte Definition der Begriffe sowie die Erhebung einer größeren, repräsentativen Stichprobe. Für viele Tests gibt es Folgeversionen, die auf einander aufbauen.
Tests können nach der klassischen Testtheorie oder nach der probabilistischen Testtheorie konstruiert werden. Die Konstruktion ist aufwendig.
Für die Abfolge der Arbeitsschritte gibt es mehrere Möglichkeiten. Einmal kann eine dezidierte Theorie über menschliches Verhalten vorliegen (z. B. psychoanalytische Theorie oder Intelligenztheorie). Davon ausgehend werden dann Fragen (Items) generiert, die mittels mehr oder weniger aufwändiger statistischer Verfahren auf ihre Güte geprüft werden (Messgenauigkeit, Objektivität und Validität). Man bildet hypothetische Klassen oder Gruppen, die man mit Namen belegt oder ermittelt diese Klassen mittels statistischer Verfahren (z. B. Faktorenanalyse). Diese kann man dann nach Intensität oder Häufigkeit kontinuierlich oder diskret abstufen (z. B. sehr, etwas, wenig). Die resultierenden Messwerte stehen dann für die Ausprägung des Merkmals.
Ein weiteres Verfahren nennt sich externale Konstruktion. Dieses nur auf den zweiten Blick einleuchtende Verfahren funktioniert so: Man betrachtet zwei unterscheidbare soziale Gruppen (z. B. Alkoholabhängige vs. nicht Abhängige). Diesen Gruppen werden inhaltlich breit gefächerte (heterogene) Items vorgelegt. Diese werden beantwortet. Schließlich werden diejenigen Items ausgewählt, die beide Gruppen statistisch abgesichert voneinander trennen. Davon ausgehend wird dann der Test zusammengestellt. Nun kann (mit einer gewissen Fehlerwahrscheinlichkeit) eine korrekte Einordnung in die eine oder andere Gruppe (an anderen Personen) vorgenommen werden. Mitunter werden durch dieses Verfahren Items generiert, die mit dem, was ich wissen möchte, inhaltlich wenig gemein haben. Der Test wird „undurchschaubar“. Ein Beispiel wäre das Minnesota Multiphasic Personality Inventory (MMPI, Hathaway und McKinley, 1951), ein Persönlichkeitstest.
Die induktive Konstruktion ist an sich keiner Theorie verpflichtet. Hier stellt man „blind“ Items zusammen, die inhaltlich zueinander passen. Diese Items sollten möglichst zusammenhängen (korrelieren). Mit Hilfe von weiteren Zusammenhangsüberprüfungen kann dann entschieden werden, ob die so entwickelte Skala valide ist.
Durchführung
Anerkannte Psychologische Test werden immer mit einer genauen Handlungsanweisung an den Anwender geliefert und können nur aussagekräftig durchgeführt werden, wenn die vorgeschriebenen Instruktionen vom Testleiter eingehalten werden. Meist ist außerdem eine genaue Kenntnis der Fragen (Items) sowie eine hohe Selbstsicherheit und verbale Schlagfertigkeit während der Gespräche erforderlich. Bei vom üblich erwarteten Antwortverhalten abweichenden Reaktionen der Klienten sind oft genaue Anweisungen vorhanden, die sicher beherrscht werden müssen. Die Durchführung muss deshalb oft geübt werden und zählt in Deutschland zum Angebot des wissenschaftlichen universitären Psychologiestudiums.
Viele Tests sind nicht wiederholbar. In der Praxis führt deshalb Fehlverhalten seitens der Testleitler auch dann zu unbrauchbaren Ergebnissen, wenn dies vom Klienten nicht bemerkt wird. Hierbei ist entscheidend, inwieweit der Proband (im nicht erfassten Ausmaß) in der Lage ist, die Testleistung durch Lernen (auch während der Testsituation) zu beeinflussen. Der Lerneffekt kann insbesondere bei Persönlichkeitstests erheblich sein, bei Leistungstest ist er allgemein etwas geringer, aber ebenfalls wirksam. Für einige tradierte Test werden sogenannte Parallelversionen angeboten, die wiederholt oder alternativ eingesetzt werden können. Hiermit können im Einzelfall fehlgeschlagene Durchgänge wiederholt werden, aber auch dann ist die Testdurchführung an dieselben Regeln gebunden, die der jeweiligen Handlungsanweisung entnommen werden müssen.
Literatur
- M. Bühner: Einführung in die Test- und Fragebogenkonstruktion. 2., aktualisierte Auflage. Pearson Studium, München 2006. ISBN 9783827371935.
- G.A. Lienert, U. Raatz: Testaufbau und Testanalyse. 6. Auflage. Beltz PsychologieVerlagsUnion, Weinheim 1998.
- H. Kranz: Einführung in die klassische Testtheorie. 5. Auflage. Klotz Verlag, Eschborn 2001.
- H. Moosbrugger, A. Kelava: Testtheorie und Fragebogenkonstruktion. Springer, Heidelberg 2007, ISBN 3540716343.
- W. Sarges, H. Wottawa (Hrsg.): Handbuch wirtschaftspsychologischer Testverfahren – Band I: Personalpsychologische Instrumente. 2., überarbeitete und erweiterte Auflage. Lengerich 2004, Pabst Science Publishers, ISBN 3935357559.
Siehe auch
- Psychologische Diagnostik (Grundlagen dazu)
- Psychometrie (Methodischer Ansatz)
- Persönlichkeits- und Differentielle Psychologie (zugeordnete Fachdisziplin)
- Psychologie (Fach)
- Diagnostik (allgemeine Methodologie)
- Interview, Umfrage, Pretest (spezielle Kategorien)
Weblinks
Theorie und Grundlagen
- Vorlesung Testtheorien – Komplette Vorlesungsaufzeichnung „Testtheorien“ an der Uni München, Department Psychologie, Dr. Tobias Constantin Haupt
- Klassische Testtheorie – schöne, übersichtliche Einführung der Universität zu Würzburg
Allgemeine Testverzeichnisse
- Katalog der Testzentrale (kontrollierter Vertrieb)
- Testinform Testkatalog des Hogrefe TestSystems Übersicht über computergestützte Verfahren
- Datenbank PSYNDEX der ZPID
Fußnoten
- ↑ Nach Lienert und Ratz (1998) ist ein psychologischer Test ein „… wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung“.
Wikimedia Foundation.