- Reliabilität
-
Die Reliabilität (dt.: Zuverlässigkeit) ist ein Maß für die formale Genauigkeit bzw. Verlässlichkeit wissenschaftlicher Messungen. Sie ist derjenige Anteil an der Varianz, der durch tatsächliche Unterschiede und nicht durch Messfehler oder die Fluktuation des gemessenen Merkmals erklärt werden kann. Hochreliable wissenschaftliche Ergebnisse sind nahezu frei von Zufallsfehlern, d.h. bei Wiederholung eines Experimentes unter gleichen Rahmenbedingungen würde das gleiche Messergebnis erzielt. Reliabilität ist also eine Voraussetzung für die Replizierbarkeit von Ergebnissen unter gleichen Bedingungen.
Die Reliabilität stellt neben der Validität und der Objektivität eines der drei wichtigsten Gütekriterien für empirische Untersuchungen dar. Gute Reliabilität ist eine Voraussetzung für Validität, wobei zu hohe Reliabilität zu Lasten der Validität geht (Reliabilitäts-Validitäts-Dilemma).
In der psychologischen Diagnostik wird sie zu den Hauptgütekriterien von psychologischen Tests gerechnet. Sie gibt an, wie genau ein Persönlichkeits- oder Verhaltensmerkmal gemessen wird.
Typen
Die Reliabilität kann mit verschiedenen Methoden geschätzt werden. Je nach Methode wird von anderen Reliabilitäts-Typen gesprochen.
- Paralleltest-Reliabilität
- Die Paralleltest-Reliabilität wird im Paralleltest-Verfahren bestimmt. Sie gibt an, ob ein vergleichbares Messverfahren identische Ergebnisse liefert. Anstelle gleichwertiger Testverfahren können auch Parallelformen des Tests verwendet werden (zum Beispiel dürften die Aufgaben 3 + 4 = ? und 2 + 5 = ? gleichermaßen dazu geeignet sein, die Fähigkeit zur einfachen Addition zu messen).
- Split-Half-Reliabilität/Testhalbierungsmethode
- Bei der Split-Half-Reliabilität wird der Test in zwei Hälften unterteilt. Bei hinreichend großer Ergebnismenge sollten die Mittelwerte und weitere statistische Kenngrößen gleich sein. Da man, mathematisch gesehen, in diesem Fall jedoch eigentlich nur die Reliabilität des „halben“ Tests erhält, muss das ursprüngliche Ergebnis mit der Spearman-Brown-Korrektur korrigiert werden.
- Odd-Even-Methode
- Ähnlich der Split-Half-Methode (Test in zwei Hälften) kann der Test auch so eingeteilt werden, dass jede zweite bzw. jede ungerade Frage extra getestet wird.
- Retest-Reliabilität
- Beim Test-Retest-Verfahren wird geprüft, ob eine Wiederholung der Messung bei Konstanz der zu messenden Eigenschaft die gleichen Messwerte liefert. Die Retest-Reliabilität gibt den Grad der Übereinstimmung an. Für viele Tests ist eine Wiederholung entsprechend dem Test-Retest-Verfahren nur theoretisch möglich, da die mit dem Test einhergehenden Erinnerungseffekte das Ergebnis beeinflussen. So ist eine mathematische Aufgabe in einem Intelligenztest nicht zweimal zu lösen, da der Proband sich an die Lösung der ersten Aufgabe erinnert. Mit der Retest-Reliabilität können keine systematischen, versuchsbedingten Fehler entdeckt werden.
- Interne Konsistenz
- Die Interne Konsistenz ist ein Maß dafür, wie die Items einer Skala miteinander zusammenhängen. Interne Konsistenz stellt gewissermaßen einen Umweg dar, die Messgenauigkeit eines Instruments zu erheben, wenn kein Retest oder Paralleltest zur Reliabilitätsbestimmung zur Verfügung steht. Es erfolgt die Reliabilitätsmessung also intern, wobei jedes Item gewissermaßen als Paralleltest behandelt wird. Die Güte eines Items kann hierbei ermittelt werden, indem die Interne Konsistenz berechnet wird, wenn das Item nicht in der Skala enthalten wäre. Eine gebräuchliche Kenngröße für die Interne Konsistenz ist Cronbachs Alpha und die Kuder-Richardson-Formel.
- Interrater-Reliabilität
- Die zum gleichen Zeitpunkt oder in Bezug auf dieselben Testobjekte ermittelte Übereinstimmung zwischen Beurteilern/Beobachtern bezeichnet man als Interrater-Reliabilität. Weitere gängige Werte sind der Übereinstimmungskoeffizient nach Holsti und Cohens Kappa.
Literatur
- Krauth, Joachim (1995): Testkonstruktion und Testtheorie. Weinheim: Psychologie Verlags Union. ISBN 3-621-27286-0
- Lienert, G. A. (1989): Testaufbau und Testanalyse. Weinheim: Psychologie Verlags Union, 4. Auflage.
- Lienert, G. & Raatz, A. (2001): Testanalyse und Testkonstruktion. Weinheim: Beltz.
- Wirtz, M.; Caspar, F. (2002): Beurteilerübereinstimmung und Beurteilerreliabilität. Göttingen: Hogrefe
- Bühner, M. (2006): Einführung in die Test- und Fragebogenkonstruktion. München: Pearson Studium
Weblinks
Wiktionary: Reliabilität – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen- http://www.uni-leipzig.de/~jenderek/tool/tool.htm (MS-Excel-Makro zur Berechnung verschiedener Reliabilitätskoeffizienten)
Wikimedia Foundation.