Ausreisser

Ausreisser
Ein Ausreißer-Messwert
Der Boxplot wird über einem Zahlenstrahl dargestellt.

In der Statistik spricht man von einem Ausreißer, wenn ein Messwert oder Befund nicht in eine erwartete Messreihe passt oder allgemein nicht den Erwartungen entspricht. Die „Erwartung“ wird meistens als Streuungsbereich um den Erwartungswert herum definiert, in dem die meisten aller Messwerte zu liegen kommen, z. B. der Quantilabstand Q75 – Q25. Werte außerhalb dieses Intervalls werden (meist willkürlich) als Ausreißer bezeichnet. Im Boxplot werden besonders hohe Ausreißer gesondert dargestellt. Die robuste Statistik beschäftigt sich mit der Ausreißerproblematik.

Inhaltsverzeichnis

Überprüfung auf Messfehler

Entscheidend ist es dann, zu überprüfen, ob es sich bei dem Ausreißer tatsächlich um ein verlässliches und echtes Ergebnis handelt, oder ob ein Messfehler vorliegt.

Beispiel: So wurde das Ozonloch über der Antarktis einige Jahre zwar bereits gemessen, die Messwerte aber als offensichtlich falsch gemessen bewertet und in ihrer Tragweite nicht erkannt[1].

Ausreißertests

Ein anderer Ansatz wurde von u.a. von Ferguson (1961)[2] vorgeschlagen. Danach geht man davon aus, die Beobachtungen aus einer hypothetischen Verteilung stammen. Ausreisser sind dann Beobachtungen, die nicht aus der hypothetischen Verteilung stammen. Die folgenden Ausreißertests gehen alle davon aus, dass die hypothetische Verteilung eine Normalverteilung ist und prüfen, ob einer oder mehrere der Extremwerte nicht aus der Normalverteilung stammen:

Im Rahmen der Zeitreihenanalyse können Zeitreihen, bei denen ein Ausreißer vermutet wird, darauf getestet werden und dann mit einem Ausreißermodell modelliert werden.

Extremwerte vs. Ausreißer

Ein beliebter Ansatz ist es den Boxplot zu nutzen um "Ausreißer" zu identifizieren. Die Beobachtungen ausserhalb der Whisker werden dabei willkürlich als Ausreißer bezeichnet. Für die Normalverteilung kann man leicht ausrechnen, dass knapp 0,7% der Masse der Verteilung ausserhalb der Whiskers liegen. Bereits ab einem Stichprobenumfang von n > 143 würde man daher (im Mittel) mindestens eine Beobachtung ausserhalb der Whiskers erwarten (oder auch k Beobachtungen ausserhalb der Whiskers bei n > 143.3362 * k). Sinnvoller ist es daher zunächst von Extremwerten statt von Ausreißern zu sprechen.

Einzelnachweise

  1. Karl-Heinz Ludwig (2007), Eine kurze Geschichte des Klimas: Von der Entstehung der Erde bis heute (2. Auflage), Beck Verlag, S. 149
  2. Ferguson, T. S. (1961), On the Rejection of outliers, In Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, vol. 1, 253-287.

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Dazibaos — Eine Wandzeitung ist eine zu einem bestimmten Thema zusammengestellte Informationsquelle in Form von Zeitungsausschnitten und Artikeln, die an einer Wand angebracht werden. Erstellt wird eine Wandzeitung von einem Autor oder einem Autorenteam.… …   Deutsch Wikipedia

  • Ein Wink des Himmels — Seriendaten Deutscher Titel Ein Wink des Himmels Originaltitel Home of the Brave Promised Land …   Deutsch Wikipedia

  • Laura-Isabella-Lolita Osswald — Laura Osswald (2007) Laura Isabella Lolita Osswald[1] (* 8. März 1982 in München) ist eine deutsche Schauspielerin und Fotomodell. Osswald erhielt früh privaten Schauspiel und Gesangsunterricht sowie Dialog und Sprachtraining. Neben ihrer… …   Deutsch Wikipedia

  • Laura Isabella Lolita Osswald — Laura Osswald (2007) Laura Isabella Lolita Osswald[1] (* 8. März 1982 in München) ist eine deutsche Schauspielerin und Fotomodell. Osswald erhielt früh privaten Schauspiel und Gesangsunterricht sowie Dialog und Sprachtraining. Neben ihrer… …   Deutsch Wikipedia

  • Laura Osswald — (2007) Laura Isabella Lolita Osswald[1] (* 8. März 1982 in München) ist eine deutsche Schauspielerin und Fotomodell. Laura Osswald erhielt früh privaten Schauspiel und Gesangsunter …   Deutsch Wikipedia

  • Outlier — Ein Ausreißer Messwert Der Boxplot wird über einem Zahlenstrahl dargestellt. In der Statistik spricht man von einem Ausreißer, wenn ein …   Deutsch Wikipedia

  • Tour de Suisse 2007 — Endstand nach der 9. Etappe Sieger Wladimir Karpez 30:07:23 h (38,512 km/h) Zweiter Kim Kirchen + 1:04 min Dritter Stijn Devolder + 1:30 min …   Deutsch Wikipedia

  • Ursula von Wiese — (* 21. April 1905 in Berlin; † 1. Mai 2002 in Zürich; eigentlich Ursula Renate von Wiese und Kaiserswaldau, nach der Heirat Ursula Guggenheim von Wiese) war eine Schweizer Schauspielerin, Verlagslektorin, Übersetzerin und Schriftstellerin… …   Deutsch Wikipedia

  • Premios Óscar de 2005 — Anexo:Premios Óscar de 2005 Saltar a navegación, búsqueda La 78ª edición de los premios Óscar tuvo lugar en una ceremonia que se celebró el 5 de marzo de 2006 en el Teatro Kodak de Los Ángeles (Estados Unidos). Contenido 1 Presentadores de… …   Wikipedia Español

  • Óscar al mejor cortometraje — Anexo:Óscar al mejor cortometraje Saltar a navegación, búsqueda Contenido 1 Oscar 2008 2 Oscar 2007 3 Oscar 2006 4 Oscar 2005 …   Wikipedia Español

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”