Simpson-Paradoxon

Simpson-Paradoxon
Grafische Darstellung des Simpson-Paradoxons: von den mit 1 beschriften Vektoren hat der rote die größere Steigung, genau wie bei den mit 2 beschrifteten. Trotzdem hat die Vektorsumme der roten Vektoren eine kleinere Steigung als die der blauen.

Das Simpson-Paradoxon (auch simpsonsches Paradoxon oder Simpson'sches Paradoxon) ist ein Paradoxon aus der Statistik und wurde zuerst 1951 von Edward Hugh Simpson untersucht. Dabei scheint es, dass die Bewertung verschiedener Gruppen unterschiedlich ausfällt, je nachdem ob man die Ergebnisse der Gruppen kombiniert oder nicht. Dieses Phänomen tritt oft bei statistischen Auswertungen in den Sozialwissenschaften und in der Medizin auf. Das Simpson-Paradoxon ist möglich, wenn mehrere Vierfeldertafeln mit einem Chancenquotienten kleiner (größer) eins zu einer Gesamttafel zusammengefasst werden, die einen Chancenquotienten größer (kleiner) eins aufweist.

Inhaltsverzeichnis

Geschichte

Edward H. Simpson beschrieb das Phänomen 1951.[1] Er war aber nicht der Erste, der sich damit beschäftigte. So beschrieben bereits 1899 Karl Pearson et al.[2] und 1903 George Udny Yule[3] einen ähnlichen Sachverhalt. Die Bezeichnung Simpson-Paradoxon (englisch Simpson′s Paradox) wurde vermutlich 1972 von Colin R. Blyth eingeführt[4].

Beispiele

Eine Fahrschule hat zwei Prüfungstage mit folgenden Ergebnissen:

  männlich weiblich
  bestanden gesamt Durchfallquote bestanden gesamt Durchfallquote
1. Tag 1 1 0 % 7 8 12,5 %
2. Tag 2 3 33,3 % 1 2 50 %
Summe 3 4 25 % 8 10 20 %

Obwohl die Männer an beiden Tagen die geringere Durchfallquote haben, liegen die Frauen im Gesamtergebnis vorn.

Ursache ist der Umstand, dass die Einzelergebnisse mit unterschiedlichem Gewicht in das Gesamtergebnis eingehen.

Diskriminierungsklage gegen die Universität Berkeley

Einer der am besten bekannten Fälle des Simpson-Paradoxons tauchte auf, als die University of California, Berkeley verklagt wurde, weil Frauen offenbar geringere Chancen auf einen Graduierten-Studienplatz hätten als männliche Bewerber. Die Zahlen für Herbst 1973 zeigten, dass mehr Männer als Frauen zugelassen wurden – die Differenz war so groß, dass sie nicht mehr durch Zufall zu erklären war:

Bewerber zugelassen
Männer 8442 44 %
Frauen 4321 35 %

Ein Mann hat also eine 44-prozentige Chance, zum Studium zugelassen zu werden, eine Frau aber nur eine 35-prozentige.

Die Aufschlüsselung nach Fakultäten zeigte allerdings, dass Frauen kaum in bedeutender Weise diskriminiert wurden. Von 101 Departements der Universität hatten 16 nur erfolglose Bewerber, oder nur Bewerber des einen Geschlechts. Bei den übrigen 85 Departements ergab sich dieses Bild:

  • bei vier Departements gab es bei Männern Erfolgsquoten, die in signifikanter Weise besser waren als jene der Frauen
  • bei sechs Departements genossen Frauen eine signifikant bessere Erfolgsquote.

Ein Chi-Quadrat-Test zeigt eindrücklich, dass sich die Bewerbungen von Frauen und Männern von vorneherein nicht zufällig auf die 101 Departements verteilten (χ = 3091; p < 0,0001).

Dies führte zur Erklärung, dass keine Diskriminierung stattfand, sondern dass Frauen sich tendenziell dort bewarben, wo es für beide Geschlechter niedrigere Zulassungsraten gab, während Männer ihre Bewerbungen tendenziell dorthin sandten, wo es generell höhere Zulassungsraten gab. Die vorher angenommenen 44 gegenüber 35 Prozent bei den Erfolgsquoten lässt völlig außer acht, dass unterschiedliche Geschlechter auch unterschiedliche Vorlieben darin haben, bei welchem Departement sie sich um ein Studium bewerben - und dann geschlechtsunabhängig unterschiedliche Erfolgsquoten zu spüren bekommen[5].

Unentdeckte Einflussfaktoren

Liegen je nach Beurteilungsweise deutlich unterschiedliche Ergebnisse vor, kann dies auf nicht erfasste Einflussfaktoren zurückgeführt werden. Will der Auswertende mögliche Fehlschlüsse vermeiden, muss er diese Einflussfaktoren finden, soweit sie vorhanden sind. Das Vorliegen eines Simpson-Paradoxons kann hier als Indikator dienen.

Eine Methode für die Suche nach weiteren Einflussfaktoren ist die getrennte Auswertung von weiteren Teilgruppen, bei denen man spezifisches Verhalten erwartet. Im obigen Beispiel wären dies die Teilgruppen Departements mit niedrigen Zulassungsraten und Departement mit hohen Zulassungsraten. Auch wäre eine weitere Unterteilung nach Prüfungstagen möglich, weil z. B. am zweiten Tag möglicherweise strengere Prüfer eingesetzt wurden.

Literatur

  • Hans-Peter Beck-Bornholdt: Mit an Wahrscheinlichkeit grenzender Sicherheit : logisches Denken und Zufall. Rowohlt-Taschenbuch-Verlag, Reinbek bei Hamburg 2005, ISBN 3-499-61902-4
  • E. H. Simpson: The Interpretation of Interaction in Contingency Tables. In: Journal of the Royal Statistical Society. Series B (Methodological) 13 (1951), Nr. 2, S. 238–241
  • C. H. Wagner: Simpson's Paradox in Real Life. In: The American Statistician 36 (1982), Nr. 1, S. 46–48

Weblinks

Fußnoten und Einzelnachweise

  1. Edward Hugh Simpson: The Interpretation of Interaction in Contingency Tables. In: Journal of the Royal Statistical Society, Ser. B. 13, 1951, S. 238–241.
  2. Karl Pearson, L. Bramley-Moore: Genetic (reproductive) selection: Inheritance of fertility in man. In: Philosophical Translations of the Royal Statistical Society, Ser. A. 173, 1899, S. 534-539.
  3. George Udny Yule: Notes on the Theory of Association of Attributes in Statistics. In: Biometrika. 2, 1903, S. 121–134.
  4. Colin R. Blyth: On Simpson's Paradox and the Sure-Thing Principle. In: Journal of the American Statistical Association. 67, Nr. 338, 1972, S. 364–366.
  5. P. J. Bickel; E. A. Hammel; J. W. O'Connell: Sex Bias in Graduate Admissions: Data from Berkeley. In: Science 187 (1975), Nr. 4175, S. 398

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Simpson's Paradoxon — Grafische Darstellung des Simpson Paradoxons Das Simpson Paradoxon (auch simpsonsches Paradoxon oder Simpson sches Paradoxon) ist ein Paradoxon aus der Statistik und wurde zuerst 1951 von Edward Hugh Simpson untersucht. Dabei scheint es, dass die …   Deutsch Wikipedia

  • Paradoxon — Ein Paradox(on) (auch Paradoxie; Plural: Paradoxa oder Paradoxien; von altgriechisch παράδοξον, von παρα, para, „gegen“, und δόξα, dóxa, „Meinung, Ansicht“) ist ein scheinbar[1] oder tatsächlich unauflösbarer, unerwarteter Widerspruch.… …   Deutsch Wikipedia

  • Simpsons Paradoxon — Grafische Darstellung des Simpson Paradoxons Das Simpson Paradoxon (auch simpsonsches Paradoxon oder Simpson sches Paradoxon) ist ein Paradoxon aus der Statistik und wurde zuerst 1951 von Edward Hugh Simpson untersucht. Dabei scheint es, dass die …   Deutsch Wikipedia

  • Simpsonsches Paradoxon — Grafische Darstellung des Simpson Paradoxons Das Simpson Paradoxon (auch simpsonsches Paradoxon oder Simpson sches Paradoxon) ist ein Paradoxon aus der Statistik und wurde zuerst 1951 von Edward Hugh Simpson untersucht. Dabei scheint es, dass die …   Deutsch Wikipedia

  • Paradox — Ein Paradoxon oder Paradox (altgriechisch παράδοξον, von παρα , para – gegen und δόξα, dóxa – Meinung, Ansicht), auch Paradoxie (παραδοξία) und in der Mehrzahl Paradoxa g …   Deutsch Wikipedia

  • Paradoxa — Ein Paradoxon oder Paradox (altgriechisch παράδοξον, von παρα , para – gegen und δόξα, dóxa – Meinung, Ansicht), auch Paradoxie (παραδοξία) und in der Mehrzahl Paradoxa g …   Deutsch Wikipedia

  • Paradoxie — Ein Paradoxon oder Paradox (altgriechisch παράδοξον, von παρα , para – gegen und δόξα, dóxa – Meinung, Ansicht), auch Paradoxie (παραδοξία) und in der Mehrzahl Paradoxa g …   Deutsch Wikipedia

  • Stage migration — Das Will Rogers Phänomen (auch stage migration ) ist ein Effekt in der Mittelwertbildung von Gruppen: Durch einen Wechsel eines Elements von einer zur anderen Gruppe kann der Mittelwert in beiden Gruppen steigen (oder fallen). Statistiker… …   Deutsch Wikipedia

  • Will-Rogers-Phänomen — Das Will Rogers Phänomen (engl. stage migration) ist ein Effekt in der Mittelwertbildung von Gruppen: Durch einen Wechsel eines Elements von einer zur anderen Gruppe kann der Mittelwert in beiden Gruppen steigen (oder fallen). Statistiker… …   Deutsch Wikipedia

  • Artefakt (Diagnostik) — Artefakt: Luftblasen bei einer mikroskopischen Kotuntersuchung Artefakt nennt man in der Diagnostik einen scheinbaren, tatsächlich jedoch unbeabsichtigt künstlich herbeigeführten Kausalzusammenhang, zum Beispiel durch Fehler bei der Datenerhebung …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”