- M-Schätzer
-
M-Schätzer (von Maximum-Likelihood-Artig) stellen eine Klasse von Schätzfunktionen dar, die als Verallgemeinerung der Maximum-Likelihood-Methode angesehen werden können. M-Schätzer sind im Vergleich zu anderen Schätzern wie z. B. den Maximum-Likelihood-Schätzern robuster gegen Ausreißer.
Dieser Artikel behandelt M-Schätzer zur Ermittlung des Lageparameters.
Inhaltsverzeichnis
Herleitung durch Verallgemeinerung der Maximum-Likelihood-Methode
Das Prinzip von Maximum-Likelihood-Schätzern beruht darauf, die Funktion
mit entsprechender Dichte- bzw. Wahrscheinlichkeitsfunktion fX(x) in Abhängigkeit von Θ zu minimieren.
Die Idee bei M-Schätzern ist, die Funktion durch eine Funktion ρ(x;Θ) zu ersetzen, welche weniger sensitiv auf Ausreißer reagiert. Aufgabe ist es also, den Ausdruck
in Abhängigkeit von Θ zu minimieren, bzw. die Gleichung
mit
zu lösen.
Jede Lösung dieser Gleichung wird M-Schätzer genannt.
Implizite Definition
Sei F eine beliebige Verteilungsfunktion und ψ eine gerade und monoton wachsende Funktion ungleich 0. Dann ist μψ(F) definiert als die Lösung μ = μψ(F) der Gleichung
Beachtet werden muss, dass abhängig von der Wahl von ψ und F es entweder keine, eine oder mehrere Lösungen geben kann. Im Falle einer konkreten Stichprobe wird μ = μψ(Fn), die Lösung von
M-Schätzer genannt.
Geeignete Funktionen ρ
Im folgenden sind die xi gemäß
standardisiert, um Skaleninvarianz zu erreichen. Sn stellt hierbei einen Streuungschätzer dar, für den meist der MAD (Median Absolute Deviation) verwendet wird.
Methode ρ(z) ψ(z) w(z) Kleinste-Quadrate-Methode ψLS(z) = z wLS(z) = 1 Huber-k-Schätzer Hampel-Schätzer Andrews wave Tukey's biweight
Die Gewichtsfunktionen im folgenden Bild zeigen die Unterschiede zwischen den Schätzern auf: bei Huber-k haben auch extreme Beobachtungen ein geringes Gewicht, beim Hampel-, Andrews wave- und Tukey's biweight-Schätzer wird extremen Beobachtungen das Gewicht Null zugeordnet.Robustheit
Bei geeigneter Wahl von ψ (gerade, beschränkt und monoton steigend) haben M-Schätzer einen Bruchpunkt von
Numerische Lösungsmethode
Für viele Funktionen ρ lässt sich keine explizite Lösung angeben, sie muss daher numerisch berechnet werden. Wie üblich zur Berechnung von Nullstellenproblemen bietet sich auch hier das Newton-Raphson-Verfahren an, und es ergibt sich folgende Iterationsvorschrift, wobei wiederum :
Als geeigneter Startwert μ0 wird meist der Median verwendet. Dieses Iterationsverfahren konvergiert sehr schnell, meist sind zwei bis drei Iterationsschritte ausreichend.
W-Schätzer
W-Schätzer sind M-Schätzern sehr ähnlich und liefern im Normalfall gleiche Ergebnisse. Der einzige Unterschied liegt in der Lösung des Minimierungsproblems. W-Schätzer werden meist bei der robusten Regression eingesetzt.
Es wird die Wichtungsfunktion
mit
eingeführt, mit deren Hilfe das Minimierungsproblem umgeschrieben werden kann in
Einsetzen der Definition von zi, ausmultiplizieren und umstellen ergibt schließlich über die Fixpunktgleichung
die Iterationsvorschrift
Siehe auch
- Sogenannte RANSAC-Algorithmen
Literatur
- Robert G. Staudte: Robust estimation and testing. Wiley, New York 1990. ISBN 0-471-85547-2
- Rand R. Wilcox: Introduction to robust estimation and hypothesis testing. Academic Press, San Diego Cal 1997. ISBN 0-12-751545-3
-
Wikimedia Foundation.