Kreuztabelle

Kreuztabelle

Kontingenztafeln (Kontingenztabellen) sind Kreuztabellen. Sie enthalten die absoluten Häufigkeiten oder relativen Häufigkeiten(Häufigkeitstabellen) von Kombinationen bestimmter Merkmalsausprägungen. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Das bedeutet, es werden Häufigkeiten für mehrere miteinander durch „und“ oder „sowie“ (Konjunktion) verknüpfte Merkmale dargestellt. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Der häufige Spezialfall einer Kontingenztabelle mit zwei Merkmalen ist eine Konfusionsmatrix.

Die statistische Auswertung einer Kontingenztafel erfolgt mit dem Chi-Quadrat-Test. Der Exakte Fisher-Test ist ein Signifikanztest auf Unabhängigkeit in der Kontingenztafel.

Im Gegensatz zu einer normalen ("flachen") Tabelle, die in der 1. Zeile Attributnamen und in allen weiteren Zeilen Ausprägungen dieser Attribute besitzt, enthalten in einer Kreuztabelle sowohl Zeilen- als auch Spaltenüberschriften Merkmalsausprägungen und am Schnittpunkt der entsprechenden Spalte und Zeile wird ein Wert dargestellt, der von den in der jeweiligen Spalte und Zeile angegebenen Merkmalen abhängt. Siehe folgendes Beispiel.

Inhaltsverzeichnis

Beispiel: Zweidimensionale Kontingenztafel ("Vierfeldertafel")

Es werden 2000 Personen darüber befragt, ob sie Produkt A oder B bevorzugen. Das Ergebnis wird nach Geschlecht des Befragten ausgewertet:

Markenwahl weiblich männlich Summe
Produkt A 660 340 1000
Produkt B 340 660 1000
Summe 1000 1000 2000

Der Schein kann trügen

Auf den ersten Blick ist zu ersehen, dass die weiblichen Kunden dem Produkt A, die männlichen Kunden dagegen dem Produkt B zuneigen. Dies kann eine interessante Information sein – es kann aber auch nur ein Trugschluss sein. Die Auswertung der Befragung hinsichtlich des Alters der Kunden ergibt:

Markenwahl bis 40 Jahre über 40 Jahre Summe
Produkt A 700 300 1000
Produkt B 300 700 1000
Summe 1000 1000 2000

Offenbar besteht nicht nur eine geschlechtsspezifische, sondern auch eine altersmäßige Abhängigkeit vom Kaufverhalten. Das Bedürfnis, beide Informationen über Abhängigkeiten in einen realistischen Bezug zueinander zu bringen, erzwingt die Erarbeitung einer dreidimensionalen Kontingenztafel.

Allgemeine Darstellung der zweidimensionalen Kontingenztafel

Anstelle von Wahrscheinlichkeiten (p) beziehungsweise relativen Häufigkeiten können auch absolute Häufigkeiten, dargestellt werden.

Merkmal A  \bar{A} Summe
B  P({A}\cap{B})  P({\bar{A}}\cap{B}) P(B)
 \bar{B}  P({A}\cap{\bar{B}})  P({\bar{A}}\cap{\bar{B}})  P({\bar{B}})
Summe P(A)  P({\bar{A}}) 1

Siehe auch: Bedingte Wahrscheinlichkeit, Konjunktion (Logik)

Kategorien, die in Kontingenztafeln verwendet werden sollen

Streng genommen müssen alle Kategorien voneinander völlig unabhängig sein. Zum Beispiel kann eine Person nicht gleichzeitig "weiblich" und "männlich" sein (außer in seltenen Fällen von Intersexualität, die hier vernachlässigt werden); aber bei "hat Grundschule besucht" und "hat Berufslehre abgeschlossen" kann man die Mitglieder der letzteren Gruppe eigentlich auch in die erste einfügen – da der Besuch der Grundschule für jeden Menschen obligatorisch ist.

Zusätzlich sollte man so selten wie möglich eine Kategorie namens "sonstige" einsetzen; beispielsweise wie in "fährt Opel", "fährt Peugeot", "fährt Toyota", "fährt anderen Personenwagen". Dieser "Sammeltopf" sollte, falls er doch notwendig wird, durch eine durchdachte Konzipierung so klein wie möglich gehalten werden.

Ein weiterer Punkt besteht darin, dass jede noch unbekannte einzelne Stichprobe X prinzipiell die Möglichkeit haben muss, in jeder der Zeilen bzw. Spalten der Kontingenztafel aufzutreten - zum Beispiel darf eine solche Tafel nicht die Kategorien "männlich" und "weiblich" besitzen, wenn man eine ausschließlich männliche oder ausschließlich weibliche Grundgesamtheit untersucht.

Dreidimensionale Kontingenztafel

Für eine dreidimensionale Tafel (drei Merkmale) fügt man zusätzliche Spalten in die Tabelle ein:

              Geschlecht weiblich                  Geschlecht männlich
              bis 40 Jahre   über 40 Jahre         bis 40 Jahre   über 40 Jahre     
Markenwahl                                                                         Summe

Produkt A         630 (=70%)       30 (=30%)        70 (=70%)      270 (=30%)       1000 
Produkt B         270 (=30%)       70 (=70%)        30 (=30%)      630 (=70%)       1000

Summe             900 (=100%)     100 (=100%)      100 (=100%)     900 (=100%)      2000

Die in Klammern zugesetzten Prozentwerte sollen nur den Blick darauf lenken, dass die Produktneigung keinesfalls vom Geschlecht abhängig war. Sondern dem Produkt A sind gleichermaßen 70% der jüngeren Frauen wie auch der Männer und 30% der älteren Frauen wie auch der Männer zugeneigt; bei Produkt B genau umgekehrt.

Um dieses Phänomen geistig klarer zu machen, lohnt sich wieder eine (diesmal wieder zweidimensionale) Kontingenztafel:

Markenwahl bis 40 Jahre über 40 Jahre Summe
Weiblich 900 100 1000
Männlich 100 900 1000
Summe 1000 1000 2000

Hier wird deutlich, dass unter den jüngeren Befragten nunmal eine übergroße Mehrheit von 90% weiblich war. Und die jüngeren Kunden bevorzugen das Produkt A – nicht etwa die weiblichen! Dagegen bevorzugen die Älteren (in der Befragung vornehmlich Männer) das Produkt B. Es handelt sich bei der Geschlechterrelation aus dem Beispiel um ein rein scheinbares Verhältnis, das aufgrund der unausgewogenen statistischen Menge entstehen konnte.

Statistische Auswertung

Bei komplexer werdenden Kontingenztafeln lassen sich Relationen nicht mehr einfach mit dem Auge ablesen. Die Statistik setzt zur systematischen Analyse eine Reihe von Zusammenhangmaßen ein, z.B. das Instrument des Kontingenzkoeffizienten. Hierzu wird die Kontingenztafel wie folgt abstrakt geformt:

Kontingenztafel für absolute Häufigkeiten, gegeben sei Merkmal X mit Ausprägungen a1, a2... ak sowie Merkmal Y mit Ausprägungen b1, b2... bm

   b1  ...   bm                         k = Zeile, m = Spalte
a1 h11       h1m h1.                    h = Häufigkeit, n = Summe der Werte
a2 h21       h2m h2.                    . = Summe: h.1 = Summe Spalte 1
.  .         .   .                                 h1. = Summe Zeile 1
.  .         .   .                      hij = h(ai, bj)
.  .         .   .                      h1. = Randhäufigkeit von X
ak hk1       hkm hk.                    h.1 = Randhäufigkeit von Y
   h.1 ...   h.m n

Siehe auch


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • DDR-Fußball-Liga 1983/84 — In der Saison 1983/84 gelangen der BSG Stahl Brandenburg und der BSG Motor Suhl erstmals der Sprung in die DDR Oberliga. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1971/72 — In der Saison 1971/72 gelangen dem FC Rot Weiß Erfurt und der BSG Chemie Leipzig der sofortige Wiederaufstieg in die DDR Oberliga. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1972/73 — In der Saison 1972/73 gelang der BSG Stahl Riesa der sofortige Wiederaufstieg in die DDR Oberliga und der BSG Energie Cottbus erstmals der Sprung in das Oberhaus. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1974/75 — In der Saison 1974/75 gelangen der BSG Chemie Leipzig und der BSG Energie Cottbus der sofortige Wiederaufstieg in die DDR Oberliga. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1975/76 — In der Saison 1975/76 gelang dem FC Hansa Rostock der sofortige Wiederaufstieg in die DDR Oberliga und dem 1. FC Union Berlin nach drei Jahren die Rückkehr ins Oberhaus. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1976/77 — In der Saison 1976/77 gelang der BSG Chemie Böhlen erstmals der Sprung in die DDR Oberliga und die BSG Wismut Gera kehrte nach ihrem Abstieg im Jahre 1966/67 ins Oberhaus zurück. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1977/78 — In der Saison 1977/78 gelangen der BSG Stahl Riesa und dem FC Hansa Rostock der sofortige Wiederaufstieg in die DDR Oberliga. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Abschlusstabelle 2.2 Kreuztabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1978/79 — In der Saison 1978/79 gelang dem FC Vorwärts Frankfurt/O. der sofortige Wiederaufstieg in die DDR Oberliga und die BSG Chemie Leipzig kehrte nach ihrem Abstieg im Jahre 1975/76 ins Oberhaus zurück. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1… …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1979/80 — In der Saison 1979/80 gelang dem FC Hansa Rostock und der BSG Chemie Böhlen der sofortige Wiederaufstieg in die DDR Oberliga. Inhaltsverzeichnis 1 Modus 2 Staffel A 2.1 Saisonverlauf 2.2 Abschlusstabelle …   Deutsch Wikipedia

  • DDR-Fußball-Liga 1980/81 — In der Saison 1980/81 gelang der BSG Energie Cottbus zum dritten mal der Sprung in die DDR Oberliga. Als zweite Mannschaft stieg mit der BSG Chemie Buna Schkopau ein absoluter Neuling in das Oberhaus auf. Inhaltsverzeichnis 1 Modus 2 Staffel A… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”