- Valid
-
Mit Validität (von lat. validus: kräftig, wirksam; engl. „validity“, Gültigkeit) wird in erster Linie das argumentative Gewicht einer (vornehmlich wissenschaftlichen) Feststellung, Aussage, Untersuchung, Theorie oder Prämisse bezeichnet.
Wird Wissenschaft als System zur Erzeugung und Verfeinerung von Annahmen über Ursache-Wirkungs-Zusammenhänge verstanden, bezeichnet Validität die Gültigkeit bzw. Belastbarkeit dieser Annahmen. Im Gegensatz zur grundsätzlichen Falsifizierbarkeit (Widerlegbarkeit) und Verifizierbarkeit (Belegbarkeit) einer wissenschaftlichen Aussage ist Validität ein (abgestuftes) Gütekriterium für die Belastbarkeit einer bestimmten Aussage. Im Rahmen empirischer Untersuchungen bezieht sich Validität aber auch auf die Güte der Operationalisierung der in den Kausalmodellen beschriebenen einzelnen Faktoren, den Konstrukten.
Validität meint also einerseits die Belastbarkeit der Operationalisierung („Inwieweit misst das Testinstrument das, was es messen soll?“), andererseits die Belastbarkeit der auf den Messungen beruhenden Aussagen oder Schlussfolgerungen („Inwieweit trifft es zu, dass X Y beeinflusst?“).
Inhaltsverzeichnis
Validität als Gütekriterium für Messinstrumente
Damit überhaupt Aussagen über die von der Wissenschaft in den Ursache-Wirkungs-Modellen beschriebenen Konstrukte getroffen werden können, müssen diese operationalisiert, das heißt messbar gemacht werden. Die Validität stellt dabei neben der Reliabilität (Messgenauigkeit) und der Objektivität (Beobachterübereinstimmung = Interrater-Reliabilität) eines der drei wichtigsten Gütekriterien psychodiagnostischer Verfahren dar. Diese bauen aufeinander auf; ohne Objektivität keine Reliabilität, ohne Reliabilität keine Validität. Drei Arten der Validität für Messinstrumente sind Inhaltsvalidität, Konstruktvalidität und Kriteriumsvalidität, von denen „historisch und praktisch gesehen […] die kriteriumsbezogene Validität der bedeutsamste Aspekt“ (Lienert & Raatz, 1994, S. 220) ist.
- Beispiel:
- Als Standardbeispiel wird oft der Intelligenzquotient herangezogen. Betrachtet man die drei Gütekriterien Objektivität, Reliabilität und Validität, so sei für dieses Beispiel angenommen, dass die ersten beiden Gütekriterien gut erfüllt seien: Der Intelligenzquotient ist so konstruiert, dass er sich (fast) unabhängig vom Beobachter feststellen lässt (Objektivität) und das Testergebnis sich auch wiederholen lässt (Reliabilität). Die Validität, also die Gültigkeit, des Testverfahrens wird aber oft bezweifelt, wenn kritisiert wird, dass der Intelligenztest keine (genaue) Aussage über die wahre Intelligenz (das heißt das Konstrukt „Intelligenz“) mache und sich Intelligenz also gar nicht auf diese Weise messen lasse.
Inhaltsvalidität
Diese wird angenommen, wenn ein Verfahren zur Messung eines bestimmten Konstrukts oder Merkmals alle Aspekte dieses Konstrukts ausreichend erschöpft. So sollte zum Beispiel ein Test zur Rechenleistung zumindest alle Grundrechenarten enthalten und sich nicht nur auf Addition und Subtraktion beschränken. Lienert & Raatz (1994) unterscheiden dabei zwei Aspekte:
- Augenscheinvalidität (oder auch triviale Validität):
- Der Test erfasst das Zielmerkmal offensichtlich. Kritisch wird dieser Aspekt der inhaltlichen Validität beispielsweise bei projektiven Tests gesehen. Dieser Aspekt ist insbesondere für eine hohe Akzeptanz beim Probanden wichtig.
- Logische Validität:
- Der Test stellt eine repräsentative Stichprobe des zu erfassenden Merkmals dar.
Konstruktvalidität
Unter dem Begriff "Konstrukt" werden theoretische Eigenschaftsdimensionen (latente Variablen) verstanden. Konstruktvalidität bezieht sich auf die Zulässigkeit von Aussagen aufgrund der Operationalisierung über das gesamte dahinter liegende Konstrukt. Dies ist in der Regel dann der Fall, wenn davon ausgegangen werden kann, dass der Bedeutungsumfang des Konstruktes präzise und nachvollziehbar abgebildet ist. Als empirische Indikatoren der Konstruktvalidität gelten die konvergente und diskriminante (oder auch: divergente) Validität:
- Konvergente Validität:
- Die Messdaten von Testverfahren, die dasselbe Konstrukt abbilden, müssten hoch miteinander korrelieren.
- Diskriminante Validität:
- Die Messdaten von Testverfahren, die verschiedene Konstrukte abbilden, sollten nur gering miteinander korrelieren.
Sowohl konvergente als auch diskriminante Validität müssen gegeben sein, um einen vollständigen Nachweis der Konstruktvalidität zu gewährleisten. Das empirische Vorgehen bei der konvergenten und diskriminanten Validität sind Spezialfälle der Kriteriumsvalidität.
Bei der Multitrait-multimethod-Analyse werden die konvergente Validität als auch die diskriminante Validität anhand einer einzigen Stichprobe miteinander verglichen. Dabei wird verkürzt gesagt erwartet, dass die konvergente Validität (Korrelation zwischen gleichem Konstukt, das mit unterschiedlichen Methoden gemessen wurde) größer ist als die diskriminante Validität (Korrelation zwischen verschiedenen Konstrukten mit gleichen oder verschiedenen Messmethoden).
Kriteriumsvalidität
Kriteriumsvalidität bezieht sich auf den Zusammenhang zwischen den empirisch gemessenen Ergebnissen des Messinstruments und einem externen empirischen Kriterium. (Schnell, Hill & Esser, 2005, S. 155). Zum Beispiel: Ein Forscher untersucht den Zusammenhang seines neuen Intelligenztests mit den Schulnoten der Probanden, um die Gültigkeit seines Tests zu prüfen. Von ‚innerer (Kriteriums)validität‘ wird dabei dann gesprochen, wenn als Kriterium ein anderer, als valide anerkannter Test herangezogen wird. Sofern als Kriterium ein objektives Maß (zum Beispiel psychophysiologische Maße oder ökonomische Größen) oder ein Expertenrating herangezogen wird, wird von ‚äußerer (Kriteriums)validität‘ gesprochen. Auch lässt sich unterscheiden nach dem Zeitpunkt, zu dem Übereinstimmung mit dem Kriterium vorliegen soll:
- Konkurrente/Übereinstimmungsvalidität (concurrent validity):
- Messung und Erhebung des Außenkriteriums (etwa ein anderer Test) werden zeitgleich durchgeführt. Das Vorgehen zur Ermittlung der konvergenten und diskriminanten Testvalidität sind Spezialfälle dieser Kategorie.
- Prädiktive/prognostische Validität/Vorhersagevalidität (predictive validity):
- Die Messdaten werden zu einem Zeitpunkt erhoben, der vor der Erhebung des Außenkriteriums liegt. So kann der Grad bestimmt werden, in dem die Messdaten das Kriterium vorhersagen. (zum Beispiel kann im Rahmen eines Assessment-Centers eine Prognose für beruflichen Erfolg gestellt werden).
Validität von Aussagen über Kausalzusammenhänge
Aufbauend auf den auf einzelne Konstrukte bezogenen Operationalsierungen ziehen in den meisten empirischen Studien Forscher erst in der statistischen Auswertung und danach im Hinblick auf ihre Kausalhypothesen Schlussfolgerungen über Ursache-Wirkungszusammenhänge. Die Begriffe der statistischen, internen und externen Validität beziehen sich auf das Zustandekommen, die Gültigkeit und Übertragbarkeit dieser (induktiven) Schlüsse. Der Validitätsgrad dieser Schlüsse lässt sich jeweils nur diskutieren und abschätzen, niemals beweisen, und es ist darum – wie gehabt – sinnvoller, eher vom „Validitätsgrad“ zu sprechen als vom Vorhandensein (oder Nicht-Vorhandensein) dieser Validitätsformen.
Statistische Validität
Für Aussagen oder in empirischen Studien gezogene Schlussfolgerungen (in der Regel über Ursache-Wirkungs-Verhältnisse) wird ein hoher Grad an Statistischer Validität angenommen, wenn die Reliabilität und Teststärke der Messinstrumente und gewählten statistischen Verfahren hoch ist und allgemein die Fehlervarianz begrenzt wurde, die mathematischen Annahmen der statistischen Methoden nicht verletzt wurden und nicht einzelne Signifikanzen (zum Beispiel aus einer Korrelationsmatrix) ‚herausgefischt‘ wurden (Fishing).
Interne Validität
Für Aussagen oder in empirischen Studien gezogene Schlussfolgerungen wird ein hoher Grad an Interner Validität angenommen, wenn Alternativerklärungen für das Vorliegen oder die Höhe der gefundenen Effekte weitestgehend ausgeschlossen werden können. Interne Validität (oder Ceteris Paribus-Validität) liegt vor, wenn die Veränderung der abhängigen Variable eindeutig auf die Variation der unabhängigen Variable zurückgeführt werden kann (keine Alternativerklärung). Um dies zu gewährleisten, müssen Störvariablen kontrolliert bzw. durch verschiedene Methoden, wie Elimination, Randomisierung, Konstanthaltung und Parallelisierung ausgeschaltet werden.
Externe Validität
Für Aussagen oder in empirischen Studien gezogene Schlussfolgerungen wird ein hoher Grad an Externer Validität angenommen, wenn sich die Resultate (a) auf die Population verallgemeinern lassen, für die die Studie konzipiert wurde und (b) über das konkrete Setting der Studie hinaus auf andere Populationen, Designs, Instrumente, Orte, Zeiten und Situationen übertragen lassen, also Allgemeingültigkeit, Verallgemeinerungsfähigkeit „besitzen“.
Wie bei anderen Validitätsformen hat das Forschungsdesign einen großen Einfluss auf die Zulässigkeit und Gültigkeit dieser Schlüsse, darum werden sie oftmals im Rahmen von experimentellen und quasi-experimentellen Forschungsdesigns diskutiert.
Siehe auch
Literatur
- D. T. Campbell, D. W. Fiske: Convergent and discriminant validation by the multitrait-multimethod matrix. In: Psycholocial Bulletin. 56/1959. S. 81–105.
- Martin Kleinmann, Bernd Strauß (Hrsg.): Potentialfeststellung und Personalentwicklung. 2., überarbeitete und erweiterte Auflage. Verlag für angewandte Psychologie, Göttingen 2000
- Rainer Schnell, Paul B. Hill, Elke Esser: Methoden der Empirischen Sozialforschung. 8., unveränderte Auflage, R. Oldenbourg Verlag, München 2008
- Lienert, G.A., Raatz, U.: Testaufbau und Testanalyse. 5., völlig neubearbeitete und erweiterte Auflage, Weinheim, Beltz, 1994.
- Liebert, R. M. & Liebert, L. L.: Science and behavior: An introduction to methods of psychological research. Prentice Hall, Englewood Cliffs, NJ 1995
- Shadish, W., Cook, T. und Campbell, D.: Experimental and Quasi-Experimental Designs for Generilized Causal Inference. Houghton Mifflin, Boston 2002
- A. Diekmann: Empirische Sozialforschung. 18. Auflage, Reinbek bei Hamburg 2007
Weblinks
Wikimedia Foundation.