Prävalenzfehler

Prävalenzfehler

Als Prävalenzfehler bezeichnet man den Fehler, der entsteht, wenn die Bestimmung der bedingten Wahrscheinlichkeit einer statistischen Variable A unter einer Bedingung B ohne Rücksicht auf die Prävalenz oder A-priori-Wahrscheinlichkeit von A vorgenommen wird. Die Prävalenz bezeichnet die Verteilung von A über die in Frage stehende Grundgesamtheit und wird auch als Basisrate bezeichnet. Der Prävalenzfehler wird daher auch als Basisratenfehler oder als Basisratenmissachtung bezeichnet. Für A und B kommen Ereignisse, aber auch Eigenschaften in Frage, der Fehler ist ein allgemeines Phänomen bei der Interpretation von statistischer Korrelation.

Inhaltsverzeichnis

Rechenbeispiel

In Anlehnung an Lindsey/Hertwig/Gigerenzer.[1]

Die Vermutung, dass durch einen DNA-Test zweifelsfrei eine Person anhand von Spuren identifiziert werden kann, beruht auf zwei Prävalenzfehlern.

Annahmen

Bei einem Verbrechen wird eine DNA-Spur am Opfer gefunden. Es liegen nur wenige weitere Hinweise vor, 10 Millionen Personen kommen prinzipiell als Urheber der Spur in Frage. Die Wahrscheinlichkeit, dass eine zufällig aus dieser Gesamtheit herausgegriffene Person der Urheber ist, ist P(U)=\tfrac{1}{10^7}. Bei einer natürlichen Zufallsstreuung des DNA-Profils weisen ungefähr 10 der 10 Millionen in Frage kommenden Personen einen genetischen Fingerabdruck auf, der mit dem DNA-Profil der Spur am Opfer identisch ist, dieses bestimmte DNA-Profil hat also eine Prävalenzrate von P(D)=\tfrac{1}{10^6}. Der verwendete DNA-Test soll keine falsch negativen Ergebnisse produzieren: Wenn eine Person das DNA-Profil der Spur aufweist, so stellt der Test auch eine Übereinstimmung fest. Sei P(A | B) die bedingte Wahrscheinlichkeit von A unter der Bedingung B, so ist P(T | D) = 1, das heißt, unter der Bedingung, dass das DNA-Profil vorliegt, ist der Test positiv. Aber auch bei Personen, die dieses DNA-Profil nicht aufweisen, wird aufgrund einer kleinen, aber unvermeidlichen Testungenauigkeit von P(T|\overline D)=10^{-5} (das ist eine Prävalenz von 1 in 100.000) trotzdem eine Übereinstimmung festgestellt. Wie ist es zu bewerten, wenn im Rahmen einer DNA-Rasterfahndung eine zufällig aus den 10 Millionen herausgegriffene Person positiv getestet wird?

Folgen

Der Test liefert, wenn alle 10 Millionen Personen getestet werden, in knapp 100 Fällen ein falsch positives Ergebnis:

P(T \cap \overline D) = P(\overline D)\cdot P(T|\overline D) (s. bedingte Wahrscheinlichkeit), P(T \cap \overline D) \cdot 10^7=99,99999

Die Prävalenz für den positiven Test P(T)=\tfrac{11}{10^5} ist somit größer als die Prävalenz des DNA-Profils P(D). Von den 10 Millionen Personen würden bei einer DNA-Rasterfahndung insgesamt 110 positiv getestet, aber der Fall wäre nur in rund einem Elftel der Fälle korrekt. Obwohl die Wahrscheinlichkeit, dass der genetische Fingerabdruck einen positiven Test zur Folge hat, P(T | D) sogar 1 beträgt, ist die Wahrscheinlichkeit, dass hinter einem positiven Test auch das DNA-Profil steht (P(D | T)) gemäß dem Bayes-Theorem und den berechneten relativen Häufigkeiten

P(D|T)=\frac{P(T|D)\cdot P(D)}{P(T)}=\tfrac{1}{11}.

Wird also angenommen, dass ein positiver Test an einer zufällig ausgewählten Person eine gute Vorhersage für eine Übereinstimmung mit dem DNA-Profil der Spur ist, wird ein erster Prävalenzfehler begangen, bei dem P(T | D) und P(D | T) verwechselt wurden.

Der Urheber der Spur ist einer der 10 Träger des DNA-Profils. Es gilt also P(D | U) = 1, aber zugleich P(U|D)=\tfrac{1}{10}. Obwohl der Urheber der Spur mit Sicherheit das DNA-Profil aufweist und er also mit Sicherheit positiv getestet würde, ist unter den gegebenen Voraussetzungen die Wahrscheinlichkeit, dass ein beliebiger positiver Testfall den Urheber bezeichnet, recht klein: Von 110 positiven Testfällen haben nur 10 das DNA-Profil P(T|D)=\tfrac{1}{11}, und von diesen ist nur einer der Urheber:

P(U|T)=P(D|T)\cdot P(U|D)= \tfrac{1}{110}=0{,}00\overline{90}=0{,}\overline{90}%.

Im Vergleich dazu ist die Wahrscheinlichkeit, dass eine zufällig positiv getestete Person nicht Urheber der Spur ist, sehr groß: Von 110 Testfällen sind 100 nicht Träger des Profils und 9 Träger, aber nicht die Urheber:

P(\overline U|T)= P(\overline D|T) + \tfrac{P(\overline U|D)\cdot P(D)}{P(T)}=0{,}9\overline{90}=99{,}\overline{09}%.

Auswertung

Wird also behauptet, das einer Person, die ohne Anfangsverdacht positiv getestet wurde, sicher auch der Urheber der DNA-Spur wäre, so liegt ein doppelter Prävalenzfehler vor, weil sowohl die Prävalenz des DNA-Profils als auch die des Markers, der zu positiven Testergebnissen führt, übersehen wird. Es werden also P(U | T) und P(T | U) miteinander verwechselt: obwohl es nahezu sicher ist, dass der Urheber der Spur positiv getestet wird, ist es unwahrscheinlich, dass ein beliebiger positiver Testfall der Urheber ist. Durch die Vertauschung wird die hohen Wahrscheinlichkeit von und P(T|\overline U) und P(T|\overline D) unterschlagen.

Der DNA-Test ist im Beispiel ungeeignet, eine ansonsten unverdächtige Person zu belasten. Liegt bereits eine Verdächtigung aufgrund anderer, von der Spur unabhängiger Umstände vor, so kann der Test aber den Verdacht erhärten oder zerstreuen. Seine Aussagekraft steigert sich, je kleiner die Grundgesamtheit der in Frage kommenden Urheber wird – im Beispiel ist diese mit 10 Millionen sehr groß –, jedoch nur so lange, wie sichergestellt werden kann, dass der Urheber der Spur noch in der Grundgesamtheit enthalten ist. Damit von einer Übereinstimmung auf eine Urheberschaft geschlossen werden kann, muss zuerst ein Kreis von Menschen gefunden werden, der objektiv in Frage kommt. Außerdem muss geprüft werden, ob der Täterkreis Personen mit DNA-Markern enthält, die dasselbe Vergleichsergebnis erzielen. Um die Sicherheit weiter zu erhöhen, kann versucht werden, die Fehlerrate des Tests zu senken.

Psychologische Ergebnisse

Psychologische Experimente haben gezeigt, dass die Einschätzung der Wahrscheinlichkeit einer bestimmten statistischen Variable stark verzerrt wird und von der Prävalenz abweicht, sofern zuvor andere Eigenschaften des zu beurteilenden Falls bekannt waren, auch wenn diese keinen Vorhersagewert oder erklärenden Wert für das Auftreten von A besitzt.

Nach Daniel Kahneman und Amos Tversky ist dieser Befund durch die Repräsentativitätsheuristik zu erklären[2]. Richard Nisbett hat dafür argumentiert, dass Attributionsfehler wie z.B. der correspondence bias auf dem Prävalenzfehler beruhen: Die komplexe Prävalenzwahrscheinlichkeit eines Verhaltens in einer Situation wird zugunsten der einfacheren dispositionalen Attribution ignoriert.

Siehe auch

Literatur und Weblinks

Einzelnachweise

  1. Lindsey, Samuel; Hertwig, Ralph; Gigerenzer, Gerd: Communicating Statistical DNA Evidence, in: Jurimetrics 43 (2003), S. 147 ff. Artikel auf Hin-Online. Abgerufen am 19. März 2011.
  2. Tversky, A. & Kahneman, D. (1973). Availability: A heuristic for judging frequency and probability. Cognitive Psychology, 42, 207-232.

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Fehlschluss — Als Fehlschluss oder Trugschluss (lateinisch fallacia) bezeichnet man einen Schluss, bei dem die abgeleitete Aussage nicht aus den explizit angegebenen oder implizit angenommenen Voraussetzungen folgt. Dies bedeutet nicht sofort, dass die… …   Deutsch Wikipedia

  • Prävalenz — Die Prävalenz oder Krankheitshäufigkeit ist eine Kennzahl der Gesundheits und Krankheitslehre (Epidemiologie) und sagt aus, wie viele Menschen einer bestimmten Gruppe (Population) definierter Größe an einer bestimmten Krankheit erkrankt sind. In… …   Deutsch Wikipedia

  • Repräsentativitätsheuristik — Die Repräsentativitätsheuristik ist eine Urteilsheuristik, in der die Wahrscheinlichkeit von Ereignissen danach bewertet wird, wie genau sie bestimmten Prototypen entsprechen.[1] In einer klassischen Untersuchung boten Daniel Kahneman und Amos… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”