- Psychologischer Test
-
Als psychologischen Test bezeichnet man Verfahren, die Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen können. Gebräuchlich ist auch die Bezeichnung psychologisches Testverfahren.
Viele psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte umrechnen, welche mit der Verteilung einer referenzierenden Stichprobe verglichen werden.[1] Darüber hinaus gibt es auch qualitative Tests, die Verhalten „provozieren“, welches durch eine Fachperson qualitativ bewertet oder gedeutet wird (Deutungstests).
Allen Tests gemeinsam ist, dass Verhalten mehr oder weniger standardisiert erfasst wird und die darauf erfolgenden Reaktionen bewertet werden. Durch diese Standardisierung liegen wissenschaftliche Erfahrungen vor, wie die verschiedenen möglichen Verhaltensweisen auf vergleichbare Auslöser bewertet werden können.
Alle Psychologischen Tests gehören zur Psychologischen Diagnostik. Bei der Anwendung von psychologischen Tests sind die Kriterien der Qualitätssicherung in der Psychologischen Diagnostik für die Auftraggeber, die Diagnostiker und die Diagnostizierten zu beachten. Im deutschsprachigen Raum sind schätzungsweise mehrere tausend Psychologische Tests verfügbar, von denen einige breite Verwendung finden, andere für sehr spezielle Anforderungen entwickelt wurden.
Inhaltsverzeichnis
Kriterien
Gemäß der Definition von Lienert und Ratz muss ein psychologisches Testverfahren die folgenden Kriterien erfüllen: Es muss
- Wissenschaftlich fundiert sein
- Unter Standardbedingungen routinemäßig durchführbar sein
- Eine relative Positionsbestimmung eines Individuums bzgl. Gruppe oder Kriteriums ermöglichen
- Empirisch abgrenzbar sein, d. h. keine versteckten Merkmale und Phänomene erfassen wie z. B. das Unbewusste in der Psychoanalyse, sondern beobachtbare und messbare Eigenschaften (Konstrukte), also erlebnis- und verhaltensanalytisch, phänomenologisch und nicht nur rein begrifflich abgrenzbare Eigenschaften
- Ein zu untersuchendes Merkmal eindimensional und metrisch abbilden (man beachte aber Testbatterien)
Wissenschaftlich fundierte Tests müssen bestimmte Testgütekriterien erfüllen.
Formen psychologischer Tests
Die Zahl der vorhandenen psychologischen Tests allein im deutschen Sprachraum kann auf mehrere Tausend geschätzt werden. Qualität und Stand der Entwicklung kann dabei sehr unterschiedlich sein. Bezüglich der Einteilung von Tests sind verschiedene Systeme üblich, in einigen werden die Kategorien vermischt.
Man kann Tests grundsätzlich nach folgenden Kategorien unterscheiden, welche Merkmale gemessen werden (Intelligenz, Gedächtnis, Konzentration, Persönlichkeit, Einstellungen, Motivation u. a.), auf welche Art die Merkmale gemessen werden (Urteil/Beurteilung, Leistungsmessung, Deutung) oder für welche Fragestellungen die Tests einsetzbar sind (Eignungstests, Tests zur Identifikation psychischer Störungen, Schultests u. a.).
- Der Grad der Standardisierung kann sich unterscheiden: vollstandardisiert (Fragen, Antworten, Auswertungsregeln sind fest vorgegeben), halb- oder teilstandardisiert (Teile sind flexibel, zumeist muss der Diagnostiker dann die Ergebnisse beurteilen) oder unstandardisiert (z. B. einzelne Zeichentests).
- Tests sind entweder für alle Personen gleich oder adaptativ/adaptiv, d. h. der Ablauf des Tests wird durch die vorher gegebenen Antworten beeinflusst.
- Bei Urteilsverfahren wird danach unterschieden, ob es sich um eine Selbstbeurteilung oder eine Fremdbeurteilung (durch Angehörige, Vorgesetzte, Lehrer, die Diagnostiker usw.) handelt.
- Bei einer Testbatterie werden mehrere Tests, die für einen Sachverhalt von Bedeutung sind, durchgeführt. Diese können auch unterschiedlichen Kategorien angehören.
In den meisten Testklassifikationen werden diese Aspekte vermischt. Kategorial können Leistungstests, Persönlichkeitstests (im engeren Sinn), Motivations- und Interessenstests, anamnestische Fragebögen und weitere spezielle Testverfahren unterschieden werden. Des Weiteren unterscheidet man zwischen Norm- und Kriteriumsorientierten Testverfahren.
- Als Leistungstests bezeichnet man alle Psychologischen Tests, die den Probanden mit ansteigenden Anforderungen an seine individuelle Leistungsgrenze führen. Diesen Tests ist gemeinsam, dass sie im oberen Bereich so anfordernd werden, dass sie von den meisten Probanden nicht mehr oder nur noch selten erfolgreich bis zu Ende bewältigt werden können. Hierzu zählen z. B. Intelligenztests, Aufmerksamkeitstests (oder Reiz-Reaktions-Belastungstests, bei denen jeweils die Leistung in einem oder mehreren Teilbereichen erfasst werden. Die Teilbereiche selbst sind Konstrukte, d. h. empirisch ermittelte Messbegriffe wie Intelligenz oder auch Problemlösefähigkeit oder Konzentration.
- Unter Persönlichkeitstests fasst man Tests zusammen, die nicht leistungsbezogen sind, sondern individuelle Merkmalsausprägungen hinsichtlich ihrer Verteilung in der gewählten Grundgesamtheit einordnen. (z. B. 16PF, NEO-PI-R, MBTI, BIP, Gießen-Test) messen ausgewählte Persönlichkeitseigenschaften (traits) des Menschen.
- Spezielle Testverfahren (z. B. wie Verfahren zur Symptomerfassung in der klinischen Psychologie) sind auf spezielle Probandengruppen oder Untersuchungszwecke zugeschnittene Verfahren.
Bei den Persönlichkeitstests wird zwischen Fragebogen- und projektiven Verfahren (z. B. Rorschachtest) unterschieden. Während im Fragebogen der Proband sein eigenes gewohnheitsmäßiges Verhalten und Erleben beschreibt (Selbstbeurteilung), wird er im projektiven Verfahren um eine gestaltende Deutung der Testvorlage gebeten. Die Zusammenstellung der Testverfahren ist dabei von der jeweiligen Untersuchungsfrage abhängig.
Neben den Tests von Personen gibt es auch Tests von Personengruppen und Organisationen. Die Bundesanstalt für Arbeitsschutz und Arbeitsmedizin listet in ihrer „Toolbox“[2] verschiedene Verfahren auf, wobei unter dem Stichwort „Gestaltungsbezug“ zwischen zwei Einsatzbereichen für Fragebogenverfahren unterschieden wird:
- Beurteilung von Personen zur Verhaltensprävention: Verfahren zur Beurteilung beispielsweise der individuellen psychischen Beanspruchung, Beanspruchbarkeit (Resilienz), Arbeitsfähigkeit usw.
- Beurteilung von Organisationen zur Verhältnisprävention: Verfahren für die im Arbeitsschutz erforderliche Beurteilung von psychischen Belastungen, die von dem Arbeitsplatz (also von der Organisation) ausgehen und auf die Mitarbeiter wirken.
Erhebungsmethoden
Bezüglich der Erhebungsmethode sind mindestens drei Arten zu unterscheiden, die sich mit dem Fortschreiten der Technik entwickelt haben.
Wenn der Proband selbst schriftlich auf Papier antwortet oder Arbeitsblätter ausfüllt, spricht man von Papier und Bleistift. (engl. P & P, paper and pencil) Dieser Begriff entstand, als für viele Tests computerisierte Versionen verfügbar wurden und die in Papierform verbleibenden Verfahren eine eigene Bezeichnung benötigten. Viele ältere Testverfahren sind Papier und Bleistift, allerdings werden auch moderne Tests oft noch in einer solchen Version konzipiert und geeicht, z. B. wenn sie sich an Klienten richten, die mit dem Computer nicht umgehen können oder praktische Überlegungen im klinischen Alltag nicht für eine Rechnerstützung sprechen. Auch qualitative Tests sind heute oft P & P. Diese Tests gelten allgemein als arbeitsaufwändiger in der Auswertung. Es existieren allerdings oft hybride Lösungen, bei denen der Proband auf Papier arbeitet, die Ergebnisse aber vom Testleiter in ein Programm eingegeben werden, damit die Werte berechnet werden können. Manche Tests können generell nur in Papierform absolviert werden, wie beispielsweise Zeichenaufgaben in der Diagnostik bei Schlaganfalls-Patienten. („Malen sie bitte ein Haus mit Fenstern, Tür, Schornstein und Dach.“) Auch strukturierte Interviews werden heute oft als Papier und Bleistift durchgeführt.
Computerunterstützte Tests liegen vor, wenn der Proband selbstständig am Bildschirm, der Tastatur oder einer eigens entwickelten Eingabeeinheit arbeitet. Diese Tests gelten als weitaus ökonomischer, sind aber nicht für jeden Zweck verwendbar. Eingabe-Einheiten können vereinfachte Tastaturen sein, aber auch mechanische Geräte wie Pedale, Joystick oder große Knöpfe oder Regler.
Ebenfalls als Computertest bezeichnet man Verfahren, bei denen die Antworten dem Protokoll führenden Testleiter mündlich mit (z. B. Sätze ergänzen) mitgeteilt werden, der sie darauf hin in das Programm eingibt.
Testkonstruktion
Psychologische Tests sind Messinstrumente, die nach wissenschaftlichen Kriterien konzipiert, evaluiert und geeicht werden. Die Entwicklung eines wissenschaftlich fundierten Tests ist aufwändig und erfordert sowohl theoretische Vorarbeiten zur Definition von Gegenstand, zu erfassenden Merkmalen und Items als auch empirische Erprobungen an ausreichend großen und für den zukünftigen Anwendungsbereich repräsentativen Stichproben. Normen eines Tests als Vergleichsmaßstäbe müssen regelmäßig überprüft werden, ob sie noch gültig sind.
Tests können nach der klassischen Testtheorie oder nach der probabilistischen Testtheorie konstruiert werden. Die Konstruktion ist aufwendig.
Für die Abfolge der Arbeitsschritte gibt es mehrere Möglichkeiten. Einmal kann eine dezidierte Theorie über menschliches Verhalten vorliegen (z. B. psychoanalytische Theorie oder Intelligenztheorie). Davon ausgehend werden dann Fragen (Items) generiert, die mittels mehr oder weniger aufwändiger statistischer Verfahren auf ihre Güte geprüft werden (Messgenauigkeit, Objektivität und Validität). Man bildet hypothetische Klassen oder Gruppen, die man mit Namen belegt oder ermittelt diese Klassen mittels statistischer Verfahren (z. B. Faktorenanalyse). Diese kann man dann nach Intensität oder Häufigkeit kontinuierlich oder diskret abstufen (z. B. sehr, etwas, wenig). Die resultierenden Messwerte stehen dann für die Ausprägung des Merkmals.
Ein weiteres Verfahren nennt sich externale Konstruktion. Dieses nur auf den zweiten Blick einleuchtende Verfahren funktioniert so: Man betrachtet zwei unterscheidbare soziale Gruppen (z. B. Alkoholabhängige vs. nicht Abhängige). Diesen Gruppen werden inhaltlich breit gefächerte (heterogene) Items vorgelegt. Diese werden beantwortet. Schließlich werden diejenigen Items ausgewählt, die beide Gruppen statistisch abgesichert voneinander trennen. Davon ausgehend wird dann der Test zusammengestellt. Nun kann (mit einer gewissen Fehlerwahrscheinlichkeit) eine korrekte Einordnung in die eine oder andere Gruppe (an anderen Personen) vorgenommen werden. Mitunter werden durch dieses Verfahren Items generiert, die mit dem, was ich wissen möchte, inhaltlich wenig gemein haben. Der Test wird „undurchschaubar“. Ein Beispiel wäre das Minnesota Multiphasic Personality Inventory (MMPI, Hathaway und McKinley, 1951), ein Persönlichkeitstest.
Die induktive Konstruktion ist an sich keiner Theorie verpflichtet. Hier stellt man „blind“ Items zusammen, die inhaltlich zueinander passen. Diese Items sollten möglichst zusammenhängen (korrelieren). Mit Hilfe von weiteren Zusammenhangsüberprüfungen kann dann entschieden werden, ob die so entwickelte Skala valide ist.
Durchführung
Fundierte psychologische Tests werden mit einer genauen Handlungsanweisung an den Anwender geliefert und können nur aussagekräftig durchgeführt werden, wenn die vorgeschriebenen Instruktionen eingehalten werden. Dies gilt besonders für Tests, die von einem Testleiter interaktiv durchgeführt werden. Für mögliche Besonderheiten bei der Durchführung müssen Anweisungen vorhanden sein, wie dann zu verfahren ist. Die Durchführung von Tests muss deshalb vor dem ersten Einsatz geübt werden und zählt in Deutschland zum Angebot des Psychologiestudiums.
Viele Tests sind nicht wiederholbar, weil die Bekanntheit des Tests die Ergebnisse verfälschen würde. Für einige Tests werden äquivalente Parallelversionen (gleicher Messgegenstand, unterschiedliche Items) angeboten, die wiederholt oder alternativ eingesetzt werden können, wenn z. B. in Leistungstests beim zweiten Mal die Lösungen leichter zu finden wären oder in Gruppentestungen Nachbarn nicht voneinander abschreiben oder auffällige Befunde noch einmal überprüft werden sollen.
Literatur
- E. Brähler, H. Holling, D. Leutner, F. Petermann (Hrsg.): Brickenkamp Handbuch psychologischer und pädagogischer Tests. 3. Auflage. Hogrefe, Göttingen 2002, ISBN 3-8017-1441-1.
- M. Bühner: Einführung in die Test- und Fragebogenkonstruktion. 3., aktualisierte Auflage. Pearson Studium, München 2010, ISBN 978-3-8689-4033-6.
- G. A. Lienert, U. Raatz: Testaufbau und Testanalyse. 6. Auflage. Beltz PsychologieVerlagsUnion, Weinheim 1998.
- H. Kranz: Einführung in die klassische Testtheorie. 5. Auflage. Klotz Verlag, Eschborn 2001.
- H. Moosbrugger, A. Kelava: Testtheorie und Fragebogenkonstruktion. Springer, Heidelberg 2007, ISBN 3-540-71634-3.
- W. Sarges, H. Wottawa (Hrsg.): Handbuch wirtschaftspsychologischer Testverfahren – Band I: Personalpsychologische Instrumente. 2., überarbeitete und erweiterte Auflage. Lengerich 2004, Pabst Science Publishers, ISBN 3-935357-55-9.
Siehe auch
- Psychologische Diagnostik (Grundlagen dazu)
- Psychometrie (Methodischer Ansatz)
- Persönlichkeits- und Differentielle Psychologie (zugeordnete Fachdisziplin)
- Personaldiagnostik
- Psychologie (Fach)
- Studienwahltest
- Diagnostik (allgemeine Methodologie)
- Interview, Umfrage, Pretest (spezielle Kategorien)
Weblinks
Fußnoten
- ↑ Nach Lienert und Ratz (1998) ist ein psychologischer Test ein „… wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung“.
- ↑ http://www.baua.de/de/Informationen-fuer-die-Praxis/Handlungshilfen-und-Praxisbeispiele/Toolbox/Toolbox.html
Kategorien:- Methode der Psychologie
- Psychologische Diagnostik
- Psychologisches Testverfahren
Wikimedia Foundation.