Testgütekriterium

Jede wissenschaftliche Messmethode muss bestimmten Gütekriterien (im Sinne von Qualitätskriterien) genügen. Objektivität und Zuverlässigkeit sind Forderungen für nahezu alle Messungen. Im engeren Sinne sind diese Kriterien für psychologische Tests verfeinert worden – sie sind Spezifikationen mehr oder weniger allgemeingültiger Gütekriterien für wissenschaftliche Erkenntnismethoden.

Unterschieden werden Haupt- und Nebengütekriterien.

Als Hauptgütekriterien gelten in sich ausschließender Reihenfolge (d. h. jede nachfolgende Stufe ist nur nach Erfüllung der vorhergehenden zu erreichen):

Objektivität (Sind die Ergebnisse unabhängig von Einflüssen der Untersucher oder der Untersuchungssituation bei Durchführung, Auswertung und Interpretation zustandegekommen?)
Reliabilität (Wird das Merkmal zuverlässig gemessen oder ist die Messung in zu großem Ausmaß mit Messfehlern behaftet?)
Validität (Misst das Verfahren tatsächlich das gewünschte Merkmal? Ist das Verfahren für die Messung des Merkmales tauglich?) In der Psychologischen Diagnostik werden die einzelnen Messmethoden hinsichtlich ihrer Validität in zwei Beziehungen beurteilt:
- Wird das gewünschte Merkmal durch die Methode gemessen (z. B. wird tatsächlich Intelligenz oder Konzentration oder Extraversion gemessen)?
- Ist mittels dieses Merkmales eine diagnostische Entscheidung mit entsprechender Güte zu treffen (z. B. kann aufgrund des gemessenen Testwertes eine Zulassungsentscheidung für ein Studium getroffen werden oder kann aufgrund des Konzentrationswertes auf Aspekte der Fahrtauglichkeit geschlossen werden)?

Nebengütekriterien sind unter anderem

Utilität (Ist das Verfahren nützlich oder tauglich für die Beantwortung einer speziellen Fragestellung?). Dies wird manchmal auch als externe Validität (der Messung für die Entscheidung) bezeichnet.
Testfairness (Werden Personengruppen z. B. nach Alter, Geschlecht, Regionen u. a. gleich behandelt, haben sie die gleichen Chancen auf ein entsprechendes Testergebnis?)
Testökonomie (Steht der Aufwand der Verfahrensanwendung im Verhältnis zum Nutzen durch das Verfahren, wird die Information des Verfahrens für die diagnostische Entscheidung wirklich benötigt?)
Transparenz (Beinhaltet das Verfahren verständliche Instruktionen? Kann der Kandidat sich vorher genügend mit dem Verfahren vertraut machen (ggf. sogar durch Übungsitems)? Gibt es danach ein angemessenes Feedback?)
Unverfälschbarkeit (Ist das Verfahren so konstruiert, dass der Kandidat seine Ergebnisse möglichst nicht gezielt steuern oder verfälschen kann?)
Zumutbarkeit (Belastet das Verfahren den Kandidaten in zeitlicher, psychischer und körperlicher Hinsicht nicht über Gebühr?)
Normierung (Die Normierung eines Tests liefert das Bezugssystem, um die individuelle Testergebnisse im Vergleich zu denen einer größeren und meist repräsentativen Stichprobe von Testteilnehmer einordnen zu können)

Beispiel Schulnoten als Anwendung in einem anderen Bereich

Objektivität: Sind die Noten frei von Willkür, z. B. durch unterschiedliche Bewertungsmaßstäbe?
Reliabilität/Zuverlässigkeit: Werden gleiche Leistungen in einer Arbeit gleich bewertet und drücken sich Leistungsunterschiede von Personen angemessen in Notenunterschieden aus?
Validität/Gültigkeit: Ist eine Fach-Note aussagefähig für einen entsprechenden Wissensstand für ein bestimmtes Fach?
Fairness: Gibt es Benachteiligungen für bestimmte Personengruppen?

Literatur

Gustav A. Lienert, Ulrich Raatz: Testaufbau und Testanalyse. 6. Auflage. BeltzPVU, Weinheim 1998, ISBN 3-621-27424-3 („Klassiker“ in diesem Bereich).
M. Amelang, L. Schmidt-Atzert: Psychologische Diagnostik und Intervention. 4 Auflage. Springer, 2006.

Siehe auch

Qualitätssicherung in der Psychologischen Diagnostik (allgemeine Standards, Verfahren, Prozesse und beteiligte Personen)

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

Itemanalyse — Eine Itemanalyse verwendet ein Bündel statistischer Verfahren, um die Eignung einzelner Items, derer Werte beispielsweise durch Fragen einer schriftlichen Umfrage generiert wurden, im Hinblick auf die Zielsetzung der Befragung zu untersuchen.… … Deutsch Wikipedia
P & P — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Paper and pencil — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Papier und Bleistift — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Projektive Tests — (auch: Persönlichkeits Entfaltungsverfahren) sind eine Gruppe psychologischer Untersuchungsmethoden, die meist anhand von auslegungsfähigem Bildmaterial (z. B. standardisierten Tintenklecksen beim Rorschachtest mit der Frage: Was könnte das sein? … Deutsch Wikipedia
Psychologische Tests — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Psychologisches Testverfahren — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Psychotest — Als Psychologischen Test bezeichnet man allgemein ein Verfahren, das Eigenschaften bzw. Merkmale von Personen, Personengruppen oder Organisationen erfassen kann. Viele Psychologische Tests sind Messinstrumente, die Merkmale erfassen und in Werte… … Deutsch Wikipedia
Thematischer Apperzeptionstest — Der Thematische Auffassungstest (Thematischer Apperzeptionstest) ist ein 1935 von Henry A. Murray und Christiana D. Morgan entwickelter projektiver Test, der als Persönlichkeitstest oder, in der Motivationspsychologie, zur Messung von Motiven… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Testgütekriterium

Beispiel Schulnoten als Anwendung in einem anderen Bereich

Literatur

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Testgütekriterium

Beispiel Schulnoten als Anwendung in einem anderen Bereich

Literatur

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link