Kontingenzanalyse

Der Kontingenzkoeffizient C (nach Karl Pearson) ist ein statistisches Zusammenhangsmaß. Der Pearsonsche Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen zwei (oder mehreren) nominalen oder ordinalen Variablen aus. Er basiert auf dem Vergleich von tatsächlich ermittelten Häufigkeiten zweier Merkmale mit den Häufigkeiten, die man bei Unabhängigkeit dieser Merkmale erwartet hätte.

Inhaltsverzeichnis

1 χ²-Koeffizient (Chi-Quadrat)
2 Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson
- 2.1 Korrigierter Kontingenzkoeffizient K*
- 2.2 Mittlere quadratische Kontingenz
3 Siehe auch

$χ 2$ -Koeffizient (Chi-Quadrat)

Der $χ 2$ -Koeffizient ist abhängig von der Größe der Kontingenztafel und n und gibt ein Maß für die "Stärke" des Zusammenhanges der beiden betrachteten Merkmale an:

$\sum_{i=1}^k \sum_{j=1}^m \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}$

Zum Beispiel sei folgende Kontingenztafel gegeben:

	Limousine	Kombi	Summen
Arbeiter	19	18	37
Angestellte	43	20	63
Summen	62	38	100

Berechnung des $χ 2$ -Koeffizienten:

$\frac{(19 -\frac{37 * 62}{100})^2}{\frac{37 * 62}{100}} + \frac{(18 -\frac{37 * 38}{100})^2}{\frac{37 * 38}{100}} + \frac{(43 -\frac{63 * 62}{100})^2}{\frac{63 * 62}{100}} + \frac{(20 -\frac{63 * 38}{100})^2}{\frac{63 * 38}{100}} = 2,83$

Der Aussagewert des $χ 2$ -Koeffizienten ist aber gering; jedoch wird er benötigt, um den Kontingenzkoeffizienten C zu ermitteln.

Zum Test vergleiche den Chi-Quadrat-Vierfeldertest.

Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson

$χ 2$ kann grundsätzlich sehr große Werte annehmen und ist nicht auf das Intervall $[0,1]$ beschränkt. Dazu wird aus dem $χ 2$ der sogenannte Kontingenzkoeffizient nach Karl Pearson ermittelt:

$C=\sqrt{\frac{\chi ^2}{\chi^2 + n}}$ .

Dabei ist

n

die Fallzahl und

χ 2

ein Maß für den Unterschied zwischen beobachteten und erwarteten Häufigkeiten.

Dieser kann Werte zwischen 0 und 1 annehmen. Problematisch ist, dass dieser Kontingenzkoeffizient abhängig von der Anzahl der betrachteten Dimensionen ist, und so nur selten den Wert 1 annehmen kann. Unabhängig von der Anzahl der betrachteten Dimensionen ist der Koeffizient Cramer's V.

Korrigierter Kontingenzkoeffizient K*

Wenn $k = min( | I | , | J | )$ das Minimum aus der Anzahl der möglichen Merkmalausprägungen ist, dann gilt $C\in \left[0,\sqrt{\frac{k-1}{k}} \right]$ . Daher benutzt man auch häufig den korrigierten Kontigenzkoeffizient:

$C_{korr}=\sqrt{\frac{k}{k-1}} \cdot C = \sqrt{\frac{k}{k-1}} \cdot \sqrt{\frac{\chi ^2}{n+\chi ^2}}$ .

Ein $C k o r r$ nahe 0 deutet dabei auf unabhängige Merkmale hin, ein $C k o r r$ in der Nähe von 1 dagegen auf ein hohes Maß an Abhängigkeit.

Der Kontingenzkoeffizient C relativiert den $χ 2$ -Koeffizienten um die Größe von n.

Der Kontingenzkoeffizient C führt schließlich zum korrigierten Kontingenzkoeffizienten.

Der korrigierte Kontingenzkoeffizient K* berechnet sich wie folgt:

$K^* = \frac{K}{\sqrt{\frac{M - 1}{M}}}$ wobei $M = M m i n (k, m)$

im Beispiel: $K^* = \frac{0,166}{\sqrt{\frac{2 - 1}{2}}} = 0,235$

K* ist ein Zusammenhangmaß zwischen den Merkmalen. Je näher er an 0 liegt, desto geringer ist der Zusammenhang; je weiter er sich 1 nähert desto größer ist der Zusammenhang.

Mittlere quadratische Kontingenz

Ein weiteres Maß, um die Stärke der Abhängigkeit der Merkmale in einer Kontingenztafel anzugeben, ist die mittlere quadratische Kontingenz, die im Wesentlichen eine Erweiterung des $χ 2$ -Koeffizienten darstellt:

$\frac{1}{N} \sum_{i=1}^k \sum_{j=1}^m \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}$

Je größer dieses Maß ist, desto stärker ist der Zusammenhang zwischen den zwei analysierten Merkmalen. Sind die beiden Merkmale unabhängig, so wird jeder Summand durch den Nenner des Bruches zu 0, das Maß selbst damit auch. Im Falle einer 2x2 Kontingenztafel ist das Maß normiert, nimmt also Werte im Intervall [0,1] an.

Siehe auch

Vierfeldertest

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Kontingenzanalyse — ⇡ Kontingenz … Lexikon der Economics
Multivariate — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariate Analyse — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariate Analysemethoden — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariate Analysen — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariate Statistik — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariate Untersuchung — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
Multivariates Verfahren — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… … Deutsch Wikipedia
multivariate Statistik — Teilbereich der ⇡ Statistik, bei dem verbundene Beobachtungen mehrerer ⇡ Merkmale zugrunde gelegt sind. Die Verfahren der m. St. umfassen Strukturen entdeckende (⇡ Faktorenanalyse, ⇡ Clusteranalyse, ⇡ multidimensionale Skalierung) und Strukturen… … Lexikon der Economics

Academic dictionaries and encyclopedias

Kontingenzanalyse

Inhaltsverzeichnis

$χ 2$ -Koeffizient (Chi-Quadrat)

Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson

Korrigierter Kontingenzkoeffizient K*

Mittlere quadratische Kontingenz

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Kontingenzanalyse

Inhaltsverzeichnis

χ2-Koeffizient (Chi-Quadrat)

Kontingenzkoeffizient C (auch CC oder K) nach Karl Pearson

Korrigierter Kontingenzkoeffizient K*

Mittlere quadratische Kontingenz

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link

$χ 2$ -Koeffizient (Chi-Quadrat)