Kontingenzkoeffizient

Kontingenzkoeffizient

Der Kontingenzkoeffizient C (nach Karl Pearson) ist ein statistisches Zusammenhangsmaß. Der Pearsonsche Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen zwei (oder mehreren) nominalen oder ordinalen Variablen aus. Er basiert auf dem Vergleich von tatsächlich ermittelten Häufigkeiten zweier Merkmale mit den Häufigkeiten, die man bei Unabhängigkeit dieser Merkmale erwartet hätte.

Inhaltsverzeichnis

χ2-Koeffizient (Chi-Quadrat-Koeffizient)

Der χ2-Koeffizient (auch quadratische Kontingenz)[1], auf dem der Kontingenzkoeffizient beruht, ist ein Maß für die "Stärke" des Zusammenhangs der betrachteten Merkmale:

\chi^2=\sum_{i=1}^k  \sum_{j=1}^m   \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}

Die Aussagekraft des χ2-Koeffizienten ist gering, da seine Obergrenze, d.h. der Wert, den er bei vollkommener Abhängigkeit der betrachteten Merkmale annimmt, abhängig von der Größe (Dimension) der Kontingenztafel (d.h. von der Anzahl der Ausprägungen der Variablen) und der Größe der untersuchten Gesamtheit n ist. Eine Vergleichbarkeit von Werten des χ2-Koeffizienten über verschiedene Kontingenztabellen und Stichprobengrößen ist daher nicht gegeben.[1][2] Bei völliger Unabhängigkeit der Merkmale ist χ2 = 0.

Es gilt:[3]

0 \leq \chi^2 \leq n \cdot \min\{k-1,m-1\}

mit k\, die Anzahl der Zeilen und m\, die Anzahl der Spalten der Kontingenztabelle

Verwendung

Die χ2-Größe wird benötigt, um den Kontingenzkoeffizienten C zu ermitteln. Auch bei statistischen Tests findet die χ2-Größe Verwendung (siehe Chi-Quadrat-Test).

Beispiel

Es sei folgende Kontingenztafel aus einer Befragung entstanden:

Limousine Kombi     Summen
Arbeiter 19 18 37
Angestellte 43 20 63
Summen 62 38 100

Berechnung des χ2-Koeffizienten:

\frac{(19 -\frac{37 * 62}{100})^2}{\frac{37 * 62}{100}}  +  \frac{(18 -\frac{37 * 38}{100})^2}{\frac{37 * 38}{100}}  +  \frac{(43 -\frac{63 * 62}{100})^2}{\frac{63 * 62}{100}}  +  \frac{(20 -\frac{63 * 38}{100})^2}{\frac{63 * 38}{100}}  = 2{,}83

Mittlere quadratische Kontingenz

Ein weiteres Maß, um die Stärke der Abhängigkeit der Merkmale in einer Kontingenztafel anzugeben, ist die mittlere quadratische Kontingenz, die im Wesentlichen eine Erweiterung des χ2-Koeffizienten darstellt:

\frac{\chi^2}{n}=\frac{1}{n} \sum_{i=1}^k  \sum_{j=1}^m   \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}

Je größer dieses Maß ist, desto stärker ist der Zusammenhang zwischen den zwei analysierten Merkmalen. Sind die beiden Merkmale unabhängig, so wird jeder Summand durch den Zähler des Bruches zu 0, das Maß selbst damit auch. Im Falle einer (2x2)-Kontingenztafel ist das Maß normiert und nimmt Werte im Intervall [0,1] an.

Kontingenzkoeffizient nach Karl Pearson

χ2 kann grundsätzlich sehr große Werte annehmen und ist nicht auf das Intervall [0,1] beschränkt. Um die Abhängigkeit des Koeffizienten vom Stichprobenumfang auszuschalten, wird auf Basis des χ2 der Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson ermittelt:

C=\sqrt{\frac{\chi ^2}{\chi^2 + n}}.
mit n der Stichprobenumfang.

Dieser kann Werte im Intervall [0,1) annehmen. Problematisch ist, dass die obere Grenze des Kontingenzkoeffizienten C abhängig von der Anzahl der betrachteten Dimensionen ist:[4]

Es gilt C\in \left[0,\sqrt{\frac{k-1}{k}} \right], mit k = min( | I | , | J | ) das Minimum aus der Anzahl der möglichen Merkmalausprägungen der untersuchten Variablen.

Korrigierter Kontingenzkoeffizient

Um zusätzlich zum Einfluss des Stichprobenumfangs auch den Einfluss der Dimension der betrachteten Kontingenztafel (der Anzahl der Merkmalsausprägungen) auf die Obergrenze des Koeffizienten auszuschalten und damit die Vergleichbarkeit von Ergebnissen zu gewährleisten, wird der korrigierte Kontingenzkoeffizient Ckorr (häufig auch K * ) zur Messung des Zusammenhangs genutzt:

C_{korr}=\sqrt{\frac{k}{k-1}} \cdot C = \sqrt{\frac{k}{k-1}} \cdot \sqrt{\frac{\chi ^2}{n+\chi ^2}},

mit k wie oben.

Es gilt 0 \leq C_{korr} \leq 1: Ein C_{korr}\, nahe 0 deutet dabei auf unabhängige Merkmale hin, ein C_{korr}\, nahe 1 auf ein hohes Maß an Abhängigkeit zwischen den Merkmalen.

Für das Beispiel ergibt sich ein korrigierter Kontingenzkoeffizient C_{korr}  =   \sqrt{\frac{2}{2-1}}*0{,}166    = 0{,}234 .

Cramérs V

Cramérs V (englisch auch: 'Cramér's V') ist ein Kontingenzkoeffizient, genauer ein χ2-basiertes Zusammenhangsmaß. Es ist benannt nach dem schwedischen Mathematiker und Statistiker Harald Cramér.

Cramérs V ist eine vom Stichprobenumfang unabhängige χ2-basierte Maßzahl. Cramérs V ist eine symmetrische Maßzahl für die Stärke des Zusammenhangs zwischen zwei oder mehr nominalskalierten Variablen, wenn (mindestens) eine der beiden Variablen mehr als zwei Ausprägungen hat. Bei einer 2x2-Tabelle entspricht Cramérs V dem Phi-Koeffizienten.

Vorgehen

V = \sqrt{\frac{\chi^2}{n (\min[r, c]-1)}}.
n: Gesamtzahl der Fälle (Stichprobenumfang)
min[r,c] ist der kleinere der beiden Werte "Zahl der Zeilen (rows)" und "Zahl der Spalten (columns)"

Interpretation

Cramérs V liegt bei jeder Kreuztabelle – unabhängig von der Anzahl der Zeilen und Spalten – zwischen 0 und 1. Er kann bei beliebig großen Kreuztabellen angewandt werden. Da Cramérs V immer positiv ist, kann keine Aussage über die Richtung des Zusammenhangs getroffen werden.

Das Effektstärkemaß w von Cohen ist definiert als:[5]

w = V * \sqrt{(min[r,c] - 1)}.

Für Cohens w gelten konventionell der Wert 0,1 als klein, 0,3 als mittel und 0,5 als groß.

Phi-Koeffizient \boldsymbol{\phi} \;

Der Phi-Koeffizient (auch Vierfelder-Korrelationskoeffizient, Vierfelderkoeffizient)) \phi \, (auch  \widehat{r_\phi}) ist ein Maß für die Stärke des Zusammenhangs zweier dichotomer Merkmale.

Berechnung

Um die Vierfelderkorrelation zwischen zwei dichotomen Merkmalen A und B zu schätzen, stellt man zuerst eine Kontingenztafel auf, die die gemeinsame Häufigkeitsverteilung der Merkmale enthält.

  A=0 A=1 Summe
B=0 a b a+b
B=1 c d c+d
Summe a+c b+d a+b+c+d

Mit den Daten aus der Tabelle kann man \phi \; nach der Formel  \phi= \frac{a \cdot d- b \cdot c}{\sqrt{(a+b)\cdot(c+d)\cdot(a+c)\cdot(b+d)}}  berechnen.[6]

Beispiele

Messen der Assoziation zwischen

  • Zustimmung zu oder Ablehnung einer Politikentscheidung und dem Geschlecht,
  • Vorführung bzw. Nichtvorführung eines Werbespots und Kauf oder Nichtkauf eines Produkts.
  • Anwendung von \phi \, auf eine Konfusionsmatrix mit zwei Klassen.

Hinweis

Zwischen \phi \, und \chi^2\, besteht der Zusammenhang \chi^2=n \cdot \phi^2  bzw.  \phi^2=\frac{\chi^2}{n}, wobei n\, die Anzahl der Beobachtungen bezeichnet. Damit ist \phi\, die Quadratwurzel (das Vorzeichen spielt keine Rolle) aus der mittleren quadratischen Kontingenz (siehe oben).

Als Teststatistik verwendet ist  n \cdot \phi^2 unter der Annahme, dass \phi \, gleich null ist, Chi²-verteilt mit einem Freiheitsgrad.

Literatur

  • Bortz, J., Lienert, G.A. & Boehnke, K. (1990). Verteilungsfreie Methoden in der Biostatistik. Springer, Berlin (Kap. 8.1, S. 326 und S. 355ff).
  • Diehl, J. M. / Kohr, H.U. (1999). Deskriptive Statistik. 12. Auflage. Klotz Eschborn, S.161.
  • Zöfel, P. (2003). Statistik für Psychologen. Pearson Studium, München.
  • Signifikanzprüfung für die Vierfelderkorrelation (PDF-Datei; 13 kB)

Weblinks

Einzelnachweise

  1. a b P.M. Schulze: Beschreibende Statistik. 6. Auflage. Oldenbourg, 2007, S. 125.
  2. W. Kohn: Statistik. Datenanalysis und Wahrscheinlichkeitsrechnung. Springer, 2005, S. 115.
  3. W. Kohn: Statistik. Datenanalysis und Wahrscheinlichkeitsrechnung. Springer, 2005, S. 114.
  4. H. Toutenburg, C. Heumann: Deskriptive Statistik: Eine Einführung in Methoden und Anwendungen mit R und SPSS. 6. Auflage. Springer, 2008, S. 115.
  5. Cohen, J. (1988): Statistical Power Analysis for the Behavioral Sciences, 2. Aufl., Hillsdale: Lawrence Erlbaum Associates. ISBN 978-0805802832
  6. Bernd Rönz, Hans Gerhard Strohe (Hrsg.): Lexikon Statistik. Gabler, Wiesbaden 1994, S. 25.

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Kontingenzkoeffizient — ⇡ Kontingenz …   Lexikon der Economics

  • Kontingenzanalyse — Der Kontingenzkoeffizient C (nach Karl Pearson) ist ein statistisches Zusammenhangsmaß. Der Pearsonsche Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen zwei (oder mehreren) nominalen oder ordinalen Variablen aus. Er basiert auf …   Deutsch Wikipedia

  • Kontingenz (Statistik) — Messniveau Zusammenhangsmaß Standardisiertes Zusammenhangsmaß Nominale Merkmale Chi Quadrat Cramers V Ordinale Merkmale Kovarianz für Rangplätze Spearmans Korrelationskoeffizient Metrische Merkmale Kovarianz Korrelationskoeffizient Ein… …   Deutsch Wikipedia

  • Zusammenhangsmaße — Messniveau Zusammenhangsmaß Standardisiertes Zusammenhangsmaß Nominale Merkmale Chi Quadrat Cramers V Ordinale Merkmale Kovarianz für Rangplätze Spearmans Korrelationskoeffizient Metrische Merkmale Kovarianz Korrelationskoeffizient Ein… …   Deutsch Wikipedia

  • Chi-Quadrat — (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale in einer… …   Deutsch Wikipedia

  • Chi-Quadrat-Statistik — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… …   Deutsch Wikipedia

  • Chi Quadrat — (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale in einer… …   Deutsch Wikipedia

  • Chi Square — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… …   Deutsch Wikipedia

  • Chiquadrat — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… …   Deutsch Wikipedia

  • Chi² — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”