Mahalanobis-Abstand

Mahalanobis-Abstand

Die Mahalanobis-Distanz (nach Prasanta Chandra Mahalanobis) ist ein Distanzmaß zwischen Punkten in einem mehrdimensionalen Vektorraum. Die Mahalanobis-Distanz wird speziell in der Statistik zum Beispiel im Zusammenhang mit multivariaten Verfahren verwendet.

Bei multivariaten Verteilungen werden die m Koordinaten eines Punktes als m-dimensionaler Spaltenvektor dargestellt. Man fasst ihn als Realisation eines Zufallsvektors X mit der Kovarianzmatrix S auf.

Der Abstand zweier so verteilter Punkte x und y wird dann bestimmt durch die Mahalanobis-Distanz

d(\underline x, \underline y)=\sqrt{(\underline x - \underline y)^T S^{-1}(\underline x - \underline y)}.

Die Mahalanobis-Distanz ist skaleninvariant und translationsinvariant.

Graphisch bilden die Punkte gleicher Mahalanobis-Distanz von einem Zentrum im zweidimensionalen eine gedrehte und verzerrte Ellipse, während es bei der euklidischen Distanz ein Kreis ist. Ist die Kovarianzmatrix die Einheitsmatrix (dies ist genau dann der Fall, wenn die einzelnen Komponenten des Zufallsvektors X paarweise unabhängig sind und jeweils Varianz 1 besitzen), so entspricht die Mahalanobis-Distanz dem euklidischen Abstand. Die Trennflächen mit gleichem Abstand zwischen zwei Punkten können bei der Mahalanobis-Distanz beliebige Kegelschnitte sein.

Mathematisch ergibt sich die Mahalanobis-Distanz aus der m-dimensionalen Normalverteilung mit Erwartungswertvektor \underline \mu und Kovarianzmatrix S, wobei \det(S) \neq 0 gilt. Diese Verteilung besitzt nämlich die Dichte

 \frac{1}{(2\pi)^\frac{m}{2} \sqrt{|\det(S)|}} \cdot \exp\left(-\frac{1}{2} (\underline x - \underline \mu)^T S^{-1}(\underline x - \underline \mu)\right).

Durch Logarithmieren dieses Ausdrucks erhält man

 -\frac{1}{2} (\underline x - \underline \mu)^T S^{-1}(\underline x - \underline \mu) - c

für eine Konstante c, was bis auf die fehlende Wurzel, den Vorfaktor und den Summanden c der Mahalanobis-Distanz entspricht.

Anwendungen

In der Diskriminanzanalyse wird die Zuordnung eines Punktes zu einer bestimmten gegebenen Population unter anderem mit der Mahalanobis-Distanz bestimmt. Ein weiteres Anwendungsgebiet ist die Erkennung von Ausreißern mit Hilfe der Mahalanobis-Distanz, wobei der Punkt y durch einen (robusten) Lageparameter ersetzt wird. Kritisch ist dabei anzumerken, dass sowohl die Kovarianzmatrix als auch die Lageparameter durch Ausreißer verzerrt sein können. Sie werden in den meisten Fällen durch robuste Verfahren geschätzt, wie z.B. den MCD-Schätzern. Weiterhin können bei der Verwendung der Mahalanobis-Distanz als Abstandsklassifikator zwei Fälle unterschieden werden:

  1. Die Kovarianzmatrix ist für alle Klassen gleich oder gemittelt.
  2. Es werden unterschiedliche Kovarianzmatrizen für die einzelnen Klassen verwendet.

Die Entscheidung für eine Alternative ist durch empirische Analysen zu begründen.


Siehe auch

Literatur

  • P.C. Mahalanobis, On the generalised distance in statistics, Proceedings of the National Institute of Science of India 12 (1936) 49-55

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Mahalanobis Abstand — Die Mahalanobis Distanz (nach Prasanta Chandra Mahalanobis) ist ein Distanzmaß zwischen Punkten in einem mehrdimensionalen Vektorraum. Die Mahalanobis Distanz wird speziell in der Statistik zum Beispiel im Zusammenhang mit multivariaten Verfahren …   Deutsch Wikipedia

  • Mahalanobis-Distanz — Die Mahalanobis Distanz (nach Prasanta Chandra Mahalanobis) ist ein Distanzmaß zwischen Punkten in einem mehrdimensionalen Vektorraum. Die Mahalanobis Distanz wird speziell in der Statistik zum Beispiel im Zusammenhang mit multivariaten Verfahren …   Deutsch Wikipedia

  • Mahalanobis — Prasanta Chandra Mahalanobis (Bengalisch: প্রশান্ত চন্দ্র মহালনবিশ, Praśānta Chandra Mahālanabiś, Prashanta Chandra Mahalnabish; * 29. Juni 1893 in Kolkata, Westbengalen; † 28. Juni 1972 ebenda) war ein indischer Physiker und Statistiker. Nach… …   Deutsch Wikipedia

  • Prasanta Chandra Mahalanobis — (Bengalisch: প্রশান্ত চন্দ্র মহালনবিশ, Praśānta Chandra Mahālanabiś, Prashanta Chandra Mahalnabish; * 29. Juni 1893 in Kolkata, Westbengalen; † 28. Juni 1972 ebenda) war ein indischer Physiker und Statistiker. Nach ihm ist die Mahalanobis Distanz …   Deutsch Wikipedia

  • Euklidischer Abstand — Der euklidische Abstand ist der Abstandsbegriff der euklidischen Geometrie. Der euklidische Abstand zweier Punkte in der Ebene oder im Raum ist die zum Beispiel mit einem Lineal gemessene Länge einer Strecke, die diese zwei Punkte verbindet.… …   Deutsch Wikipedia

  • Euklidische Distanz — Der euklidische Abstand ist ein Begriff, der den Abstand zweier Punkte der Ebene oder des Raumes verallgemeinert. Euklidischer Raum Im dreidimensionalen Raum stimmt der euklidische Abstand d(x,y) mit dem anschaulichen Abstand überein. Im… …   Deutsch Wikipedia

  • Euklidische Metrik — Der euklidische Abstand ist ein Begriff, der den Abstand zweier Punkte der Ebene oder des Raumes verallgemeinert. Euklidischer Raum Im dreidimensionalen Raum stimmt der euklidische Abstand d(x,y) mit dem anschaulichen Abstand überein. Im… …   Deutsch Wikipedia

  • Normalabstand — Der euklidische Abstand ist ein Begriff, der den Abstand zweier Punkte der Ebene oder des Raumes verallgemeinert. Euklidischer Raum Im dreidimensionalen Raum stimmt der euklidische Abstand d(x,y) mit dem anschaulichen Abstand überein. Im… …   Deutsch Wikipedia

  • Abstandsklassifikator — Ein Abstandsklassifikator ist ein Begriff aus der mathematischen Statistik: Wird über die Zugehörigkeit eines Objektes zu einer Klasse entschieden, indem (im Merkmalsraum) der „Abstand“ des Objektes (z. B. ein Merkmalsvektor) zur Klasse… …   Deutsch Wikipedia

  • Dynamic Time Warping — Dynamic time warp(ing) ist ein Algorithmus, um Wertefolgen unterschiedlicher Länge aufeinander abzubilden.[1] Inhaltsverzeichnis 1 Anwendung 2 Algorithmus 3 Siehe auch 4 Einzelnachweise 5 …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”