Robuste Statistik

Robuste Statistik

Robustes Schätzverfahren ist ein Begriff der Inferenzstatistik. Ein Schätzverfahren oder Testverfahren heißt robust, wenn es nicht sensibel auf Ausreißer (Werte außerhalb eines aufgrund einer Verteilung erwarteten Wertebereiches) reagiert.

Die klassischen Schätzmethoden, die in der ersten Hälfte des 20. Jahrhunderts entwickeln wurden, tendieren häufig dazu, bei Vorliegen von Ausreißern in der Stichprobe irreführende Ergebnisse zu liefern. Ein robustes Schätzverfahren orientiert sich deshalb an der Masse der Daten und integriert eine Ausreißeranalyse, um den Einfluss von Modellabweichungen zu reduzieren und ihn bei zunehmender Devianz gegen Null streben zu lassen.

Die Entwicklung robuster Schätzer zur Effizienzsteigerung von Schätzverfahren ist seit den 1980er Jahren ein wichtiges Forschungsanliegen in der mathematischen Statistik. Zu den robusten Verfahren gehört zum Beispiel der RANSAC-Algorithmus und Verfahren die eine hohe Bruchpunktresistenz aufweisen.

Ein einfaches robustes Schätzverfahren stellt der (empirische) Median dar, den man anstelle des arithmetischen Mittels verwenden kann, um den Erwartungswert einer symmetrischen Verteilung zu schätzen. Den empirischen Median erhält man, indem man die Beobachtungen der Größe nach sortiert und dann den der Reihenfolge nach mittleren Beobachtungswert als Schätzwert wählt. Ein Beispiel: Es werde eine gewisse Zahl von Messungen durchgeführt, um eine physikalische Größe (etwa die Gravitationskonstante) experimentell zu bestimmen. Man nimmt an, dass die auftretenden Messfehler unsystematisch sind und in beide Richtungen gehen können, die Messwerte also mal zu groß, mal zu klein sind; formal genauer: unabhängige und identisch verteilte Beobachtungen mit symmetrischer Verteilung und dem wahren Wert der zu bestimmenden Größe als Erwartungswert. Es gibt nun gelegentlich einzelne Messwerte, die deutlich von den übrigen abweichen („Ausreißer“, die oben beschriebenen Modellabweichungen); sie sind in der Regel auf Fehler bei der Durchführung des Experiments zurückzuführen („verwackeln“ der Apparatur, „verschreiben“ o.ä.). Obwohl extreme Abweichungen eher auf einen Fehler hindeuten und daher solche Beobachtungen eher weniger Einfluss auf das Ergebnis haben sollten, beeinflussen sie das arithmetische Mittel stark; der Einfluss wird sogar umso größer, je deutlicher die Abweichung ist. Der Median hingegen ist gegen solche Ausreißer unempfindlich, also „robust“. Sofern keine Ausreißer vorliegen, liefert er allerdings bei gleicher Zahl von Messwerten im Allgemeinen eine ungenauere Schätzung, da „im Kleinen“ der Schätzwert nur durch eine einzige – nämlich die mittlere – Beobachtung bestimmt wird.

Siehe auch

Literatur

  • P. Huber: Robust Estimation of a Location Parameter. In: The Annals of Mathematical Statistsics. 35, 1964.
  • Frank R. Hampel et al.: Robust Statistics. The Approach Based on Influence Functions. Wiley, New York 1986, ISBN 0-471-73577-9.
  • Helmuth Späth: Mathematische Software zur linearen Regression. Oldenburg, München 1987, ISBN 3-486-20375-4.
  • Helga Bunke and Olaf Bunke: Nonlinear regression, functional relations and robust methods. Band 2: Non-Linear Functional Relations and Robust Methods. Wiley, New York u.a. 1989, ISBN 0-471-91239-5.
  • Werner Stahel (Hrsg.): Directions in Robust Statistics and Diagnostics. 2 Bände. (Bände 33 und 34 von The IMA Volumes in Mathematics and its Applications.) Springer, Berlin u.a. 1991, ISBN 3-540-97530-6, ISBN 3-540-97531-4.
  • Karl-Rudolf Koch: Parameterschätzung und Hypothesentests. 3. Auflage. Dümmler, Bonn 1997, ISBN 3-427-78923-3.
  • David C. Hoaglin, Frederick Mosteller and John W. Tukey: Understanding Robust and Exploratory Data Design. Wiley, New York 2000, ISBN 0-471-38491-7.
  • Mia Hubert (Hrsg.): Theory and Application of Recent Robust Methods. Birkhäuser, Basel u.a. 2004, ISBN 3-7643-7060-2.
  • Ricardo A. Maronna, Douglas R. Martin, Victor J. Yohai: Robust Statistics: Theory and Methods. Wiley, New York u.a. 2006, ISBN 0-470-01092-4.

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • robuste Statistik — Bezeichnung für den Teilbereich der ⇡ Statistik, der Entwicklung von Verfahren mit hoher Unempfindlichkeit gegenüber Anwendungsvoraussetzungen (⇡ Robustheit) und der Quantifizierung dieser Robustheit befasst …   Lexikon der Economics

  • Robuste Schätzverfahren — Robustes Schätzverfahren ist ein Begriff der Inferenzstatistik. Ein Schätzverfahren oder Testverfahren heißt robust, wenn es nicht sensibel auf Ausreißer (Werte außerhalb eines aufgrund einer Verteilung erwarteten Wertebereiches) reagiert. Die… …   Deutsch Wikipedia

  • Beschreibende Statistik — Die deskriptive oder beschreibende Statistik ist der Zweig der Statistik, in dem alle Techniken zusammengefasst werden, die eine Menge von beobachteten Daten summarisch darstellen. Von der induktiven oder inferentiellen Statistik… …   Deutsch Wikipedia

  • Ausgleichsebene — Die Ausgleichungsrechnung (auch Ausgleichsrechnung, Ausgleichung, Parameterschätzung, Anpassung oder Fit(ting) genannt) ist eine mathematische Optimierungsmethode, um für eine Reihe von Messdaten die unbekannten Parameter ihres geometrisch… …   Deutsch Wikipedia

  • Ausgleichsproblem — Die Ausgleichungsrechnung (auch Ausgleichsrechnung, Ausgleichung, Parameterschätzung, Anpassung oder Fit(ting) genannt) ist eine mathematische Optimierungsmethode, um für eine Reihe von Messdaten die unbekannten Parameter ihres geometrisch… …   Deutsch Wikipedia

  • Ausgleichsrechnung — Die Ausgleichungsrechnung (auch Ausgleichsrechnung, Ausgleichung, Parameterschätzung, Anpassung oder Fit(ting) genannt) ist eine mathematische Optimierungsmethode, um für eine Reihe von Messdaten die unbekannten Parameter ihres geometrisch… …   Deutsch Wikipedia

  • Geradenfit — Die Ausgleichungsrechnung (auch Ausgleichsrechnung, Ausgleichung, Parameterschätzung, Anpassung oder Fit(ting) genannt) ist eine mathematische Optimierungsmethode, um für eine Reihe von Messdaten die unbekannten Parameter ihres geometrisch… …   Deutsch Wikipedia

  • Parameteranpassung — Die Ausgleichungsrechnung (auch Ausgleichsrechnung, Ausgleichung, Parameterschätzung, Anpassung oder Fit(ting) genannt) ist eine mathematische Optimierungsmethode, um für eine Reihe von Messdaten die unbekannten Parameter ihres geometrisch… …   Deutsch Wikipedia

  • Ausreisser — Ein Ausreißer Messwert Der Boxplot wird über einem Zahlenstrahl dargestellt. In der Statistik spricht man von einem Ausreißer, wenn ein …   Deutsch Wikipedia

  • Outlier — Ein Ausreißer Messwert Der Boxplot wird über einem Zahlenstrahl dargestellt. In der Statistik spricht man von einem Ausreißer, wenn ein …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”