- Interest-operator
-
Mit Interest-Operatoren werden auf dem Bereich der Bildverarbeitung Algorithmen bezeichnet, die markante Stellen in Bildern extrahieren und gleichzeitig eine oder mehrere Kenngrößen liefern.
Inhaltsverzeichnis
Einleitung
Markante Stellen in Bildern sind diejenigen Punkte, die in einer begrenzten Umgebung möglichst einzigartig sind. An die Interest-Operatoren werden folglich verschiedene Anforderungen gestellt:
- Die detektierten Punkte sollen deutlich, das heißt lokal einzigartig und vom Hintergrund unterscheidbar sein. Auch ihre Seltenheit, das heißt ihre Unterscheidbarkeit zu anderen Bildpunkten, soll möglichst groß sein.
- Invarianz gegenüber Bildänderungen wie geometrischen und radiometrischen Verzerrungen
- Unempfindlichkeit gegenüber Rauschen.
Das Ergebnis der Suche nach markanten Punkten wird zum Beispiel bei der Berechnung der Epipolargeometrie zwischen zwei Kameras oder beim bildbasierten Tracking verwendet.
Einzelne Operatoren
Bekannte Interest-Operatoren sind der Moravec-Operator, der Plessy Punkt-Detektor und der Förstner-Operator.
Moravec-Operator
Der Moravec-Operator wurde von Hans Moravec im Jahr 1977 vorgestellt. [1] Er berechnet die mittleren quadratischen Gradientensummen in den vier Hauptrichtungen des Fensters der Größe . Linienhafte Kanten werden somit nicht als markant markiert.
- V = min(V1,V2,V3,V4)
mit p = 2k + 1 und q = 2l + 1.
Liegt der Wert über einer bestimmten Schwelle, liegt ein markanter Punkt vor. Der Moravec-Operator ist sehr leicht zu implementieren und benötigt wenig Rechenzeit. Er ist aber nicht rotationsinvariant und seine Genauigkeit beträgt lediglich 1 Pixel.
Plessy Punkt-Detektor
Der Plessy Punkt-Detektor (auch Harris Corner Detector genannt) wurde 1988 von Harris und Stephens vorgestellt. [2] Sie beschrieben eine Verbesserung des Moravec-Operators, indem sie die diskreten Verschiebungen und Richtungen mit Hilfe der Autokorrelationsfunktion lösten und damit auch die Genauigkeit der Lokalisierung steigerten.
Die Autokorrelationsmatrix A berechnet sich dabei durch Summierung der Ableitung der Bildfunktion f in dem Gebiet Ω um einen Punkt:
fx und fy sind dabei die partiellen Ableitungen der Bildfunktion f.
A beschreibt die Nachbarschaftsstruktur um die Stelle (x,y). Ihr Rang unterscheidet sich je nach Eigenschaft der Umgebung:
- Rang 2: Es liegt ein markanter Punkt vor.
- Rang 1: Es liegt eine gerade Kante vor.
- Rang 0: Es liegt eine homogene, unstrukturierte Fläche vor.
Die Punktstärke V wird aus A mittels der Formel
ermittelt. Um eine Trennung der Kanten von markanten Punkten zu erhalten, wird k = 0,04 gewählt. Auf diese Weise erhält man für Punkte positive und für Kanten negative Werte. Eine lokale Nicht-Maxima-Unterdrückung liefert schließlich die Position des Interest-Punktes.
Förstner-Operator
Der Förstner-Operator [3] bestimmt markante Punkte auch mittels der Autokorrelationsmatrix A. Hierbei wird ausgenutzt, dass die Matrix A − 1 der Kovarianzmatrix entspricht, also angibt, wie genau die Position des Interestpunkts bestimmt werden kann (große Gradienten in A führen zu kleinen Varianzen bzw. Kovarianzen in A − 1 und damit zu genauer Bestimmbarkeit). Die Achsen und Achsabschnitte der entsprechenden Fehlerellipse korrespondieren mit den Eigenvektoren und Eigenwerten λ1,λ2 der Matrix A − 1.
Ein guter Interestpunkt liegt vor, wenn die Fehlerellipse möglichst klein und möglichst rund ist. Im Gegensatz dazu besitzt die Fehlerellipse entlang einer ausgeprägten Grauwertkante eine sehr kleine und eine sehr große Halbachse (λ1 klein, λ2 groß), der Punkt wäre also senkrecht zur Kante gut, entlang der Kante jedoch schlecht bestimmt.
Die Größe und Rundheit wird anhand der folgenden beiden Maßzahlen beurteilt, der Größe
und der Rundheit
Zu beachten ist, dass λ1,λ2 die Eigenwerte von A − 1 (nicht von A) sind. Durch die gegebenen Formeln lassen sich jedoch w und q ohne Inversion bzw. Eigenwertzerlegung berechnen.
Anhand dieser beiden Kenngrößen kann die Eignung eines Interestpunkts beurteilt werden:
- Markante Punkte besitzen kleine, kreisförmige Ellipsen.
- Gerade Kanten lassen sich durch langgestreckte Fehlerellipsen detektieren.
- Große Ellipsen kennzeichnen eine unstrukturierte, gleichförmige Fläche.
Als Faustregel für einen Interestpunkt kann man q > 0,8 angeben. Für w ist die Angabe schwieriger, da sie vom Bildkontrast abhängig ist. Eine Methode besteht darin, x Prozent der Punkte mit den größten Werten auszuwählen, also z. B. von allen Punkten (welche die Bedingung an q erfüllen) die 10 % mit größtem w. Alternativ kann man sich aus dem Mittelwert aller w über das gesamte Bild einen Schwellwert berechnen. Der Wert von w ist zugleich die „Stärke“ des Interestpunkts.
Die subpixelgenaue Berechnung des Interestpunktes wurde von Förstner ebenfalls beschrieben. das heißt, obwohl die Bewertung einer Umgebung anhand der Maße w und q nur auf Pixelgrenzen erfolgt, kann ein (Eck- oder Zentrums-) Punkt subpixelgenau berechnet werden.
Referenzen
- ↑ H. P. Moravec: Towards Automatic Visual Obstacle Avoidance. In: Proceedings of the 5th International Joint Conference on Artificial Intelligence. 1977, S. 584.
- ↑ C. Harris and M. Stephens: A combined corner and edge detector. In: Proceedings of the 4th Alvey Vision Conference. 1988, S. 17-151.
- ↑ W. Förstner und E. Gülch: A Fast Operator for Detection and Precise Location of Distinct Points, Corners and Centers of Circular Features. In: Proceedings of the ISPRS Intercommission Workshop on Fast Processing of Photogrammetric Data. 1987, S. 281-305.
Wikimedia Foundation.