Outlier

Outlier
Ein Ausreißer-Messwert
Der Boxplot wird über einem Zahlenstrahl dargestellt.

In der Statistik spricht man von einem Ausreißer, wenn ein Messwert oder Befund nicht in eine erwartete Messreihe passt oder allgemein nicht den Erwartungen entspricht. Die „Erwartung“ wird meistens als Streuungsbereich um den Erwartungswert herum definiert, in dem die meisten aller Messwerte zu liegen kommen, z. B. der Quantilabstand Q75 – Q25. Werte außerhalb dieses Intervalls werden (meist willkürlich) als Ausreißer bezeichnet. Im Boxplot werden besonders hohe Ausreißer gesondert dargestellt. Die robuste Statistik beschäftigt sich mit der Ausreißerproblematik.

Inhaltsverzeichnis

Überprüfung auf Messfehler

Entscheidend ist es dann, zu überprüfen, ob es sich bei dem Ausreißer tatsächlich um ein verlässliches und echtes Ergebnis handelt, oder ob ein Messfehler vorliegt.

Beispiel: So wurde das Ozonloch über der Antarktis einige Jahre zwar bereits gemessen, die Messwerte aber als offensichtlich falsch gemessen bewertet und in ihrer Tragweite nicht erkannt[1].

Ausreißertests

Ein anderer Ansatz wurde von u.a. von Ferguson (1961)[2] vorgeschlagen. Danach geht man davon aus, die Beobachtungen aus einer hypothetischen Verteilung stammen. Ausreisser sind dann Beobachtungen, die nicht aus der hypothetischen Verteilung stammen. Die folgenden Ausreißertests gehen alle davon aus, dass die hypothetische Verteilung eine Normalverteilung ist und prüfen, ob einer oder mehrere der Extremwerte nicht aus der Normalverteilung stammen:

Im Rahmen der Zeitreihenanalyse können Zeitreihen, bei denen ein Ausreißer vermutet wird, darauf getestet werden und dann mit einem Ausreißermodell modelliert werden.

Extremwerte vs. Ausreißer

Ein beliebter Ansatz ist es den Boxplot zu nutzen um "Ausreißer" zu identifizieren. Die Beobachtungen ausserhalb der Whisker werden dabei willkürlich als Ausreißer bezeichnet. Für die Normalverteilung kann man leicht ausrechnen, dass knapp 0,7% der Masse der Verteilung ausserhalb der Whiskers liegen. Bereits ab einem Stichprobenumfang von n > 143 würde man daher (im Mittel) mindestens eine Beobachtung ausserhalb der Whiskers erwarten (oder auch k Beobachtungen ausserhalb der Whiskers bei n > 143.3362 * k). Sinnvoller ist es daher zunächst von Extremwerten statt von Ausreißern zu sprechen.

Einzelnachweise

  1. Karl-Heinz Ludwig (2007), Eine kurze Geschichte des Klimas: Von der Entstehung der Erde bis heute (2. Auflage), Beck Verlag, S. 149
  2. Ferguson, T. S. (1961), On the Rejection of outliers, In Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, vol. 1, 253-287.

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • outlier — UK US /ˈaʊtˌlaɪər/ noun [C] ► a fact, figure, piece of data, etc. that is very different from all the others in a set and does not seem to fit the same pattern: »Eliminating one or two obvious outliers, charges range from 0.45% per annum to 3.67% …   Financial and business terms

  • Outlier — Out li er, n. 1. One who does not live where his office, or business, or estate, is. Bentley. [1913 Webster] 2. That which lies, or is, away from the main body. [1913 Webster] 3. (Geol.) A part of a rock or stratum lying without, or beyond, the… …   The Collaborative International Dictionary of English

  • outlier — (n.) c.1600, stone quarried and removed but left unused, from OUT (Cf. out) + LIE (Cf. lie) (v.2). Transferred meaning outsider is recorded from 1680s; anything detached from its main body is from 1849; geological sense is from 1833 …   Etymology dictionary

  • outlier — ► NOUN 1) a thing detached from a main body or system. 2) Geology a younger rock formation among older rocks …   English terms dictionary

  • outlier — [out′lī΄ər] n. any person or thing that lies, dwells, exists, etc. away from the main body or expected place; specif., a) a person who resides away from his place of work or business b) a person who is excluded, or excludes himself, from some… …   English World dictionary

  • Outlier — This article is about the statistical term. For other uses, see Outlier (disambiguation). Figure 1. Box plot of data from the Michelson Morley Experiment displaying outliers in the middle column. In statistics, an outlier[1] is an observ …   Wikipedia

  • outlier — UK [ˈaʊtˌlaɪ(r)] / US [ˈaʊtˌlaɪr] noun [countable] Word forms outlier : singular outlier plural outliers 1) maths a result that is very different from the other results in a set 2) a person who lives a long way from where they work 3) a person… …   English dictionary

  • outlier — /ˈaʊtlaɪə/ (say owtluyuh) noun 1. someone or something that lies outside or at a distance from a place.: *flammable fulmar oil, acquired annually as rental from the far off outlier Hiphoray, eighty miles to the west. –david foster, 1981. 2.… …  

  • outlier — riktas statusas T sritis Standartizacija ir metrologija apibrėžtis Netikslumas, atsiradęs vertinant, kaip analitė atitinka tikrąją vertę, kuris arba pakeičia tiriamosios medžiagos ar mėginio identiškumą, arba gali būti didelių klaidų priežastimi… …   Penkiakalbis aiškinamasis metrologijos terminų žodynas

  • outlier — riktas statusas T sritis Standartizacija ir metrologija apibrėžtis Stebinys, kuris nesiderina su kitomis duomenų sekos vertėmis. atitikmenys: angl. mistake; outlier vok. Ausreißwert, m rus. промах, m pranc. valeur aberrante, f …   Penkiakalbis aiškinamasis metrologijos terminų žodynas

  • outlier — riktas statusas T sritis Standartizacija ir metrologija apibrėžtis Stebinys, kuris tiek skiriasi nuo likusiųjų verčių, jog yra pagrindo manyti, kad jis priklauso kitai tiriamajai visumai arba yra matavimo klaida. atitikmenys: angl. mistake;… …   Penkiakalbis aiškinamasis metrologijos terminų žodynas

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”