Markow-Filter

Markow-Filter
QS-Informatik

Dieser Artikel wurde aufgrund von inhaltlichen Mängeln auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf mit, die inhaltlichen Mängel dieses Artikels zu beseitigen und beteilige dich an der Diskussion! (+)
Begründung: Scheinbar zusammenhangslose Informationen. Was genau ein Markov-Filter ist, steht hier leider gar nicht. Siehe auch Diskussionsseite. --pberndt (DS) 12:40, 27. Okt. 2011 (CEST)

Der Markow-Filter (nach Andrei Andrejewitsch Markow) ist ein Spamfilter basierend auf einem Hidden Markov Model und stellt eine Weiterentwicklung des Bayes-Filters dar. Der Markow-Filter errechnet dabei die Wahrscheinlichkeit, mit der die Wortketten des überprüften Textes zu Wortketten typischer Spamtexte passen. Während bei einem Bayes-Filter die Wahrscheinlichkeit einzelner Wörter errechnet wird, zieht der Markow-Filter Wortketten zur Ermittlung der Wahrscheinlichkeit heran und gewichtet die einzelnen Kombinationsmöglichkeiten. Ähneln die Wortketten des überprüften Textes denen typischer Spamtexte, so gilt der überprüfte Text als Spam.

Inhaltsverzeichnis

Beispiel für Gewichtung der Kombinationsmöglichkeiten

Am Beispiel des Satzes „Der schnelle braune Fuchs springt ...“ kann man die Kombinationsmöglichkeiten und Gewichtungen 22N im Markow-Filter veranschaulichen:

Wortkette Gewichtung N
Der 1 0
Der schnelle 4 1
Der <...> braune 4 1
Der <...> <...> Fuchs 4 1
Der schnelle braune 16 2
Der <...> braune Fuchs 16 2
Der schnelle <...> Fuchs 16 2
Der schnelle braune Fuchs 64 3

Formale Darstellung der Wahrscheinlichkeitsberechnung in Bayes- und Markow-Filter

Während die Wahrscheinlichkeit aufgrund des Bayes-Filters durch

P_\textrm{lokal}=0.5+\frac{P_{\mathrm{gut}}-P_\mathrm{schlecht}}{P_\mathrm{gut}+P_\mathrm{schlecht}+1}\;

angegeben wird, gilt für den Markow-Filter

P_\mathrm{lokal}=0.5+\frac{(P_\mathrm{gut}-P_\mathrm{schlecht}) \cdot \mathit{Gewichtung}}{(P_\mathrm{gut}+P_\mathrm{schlecht}+1) \cdot \mathit{Gewichtung}_\mathrm{maximal}}\;.

Literatur

  • Shalendra Chhabra, William S. Yerazunis, Christian Siefkes: Spam Filtering using a Markov Random Field Model with Variable Weighting Schemas. In: Fourth IEEE International Conference on Data Mining (ICDM'04). 2004, S. 347-350, doi:10.1109/ICDM.2004.10031.

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Markow'sche Prozesse — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette) ist eine spezielle Klasse von stochastischen Prozessen. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markow-Chain — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette) ist eine spezielle Klasse von stochastischen Prozessen. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markow-Eigenschaft — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette) ist eine spezielle Klasse von stochastischen Prozessen. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markow-Ketten — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette) ist eine spezielle Klasse von stochastischen Prozessen. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markow-Prozess — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette) ist eine spezielle Klasse von stochastischen Prozessen. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markow-Kette — Eine Markow Kette (engl. Markov chain, auch Markow Prozess, nach Andrei Andrejewitsch Markow, andere Schreibweisen: Markov Kette, Markoff Kette, Markof Kette) ist ein spezieller stochastischer Prozess. Man unterscheidet eine Markow Kette in… …   Deutsch Wikipedia

  • Markov-Filter — Der Markow Filter (nach Andrei Andrejewitsch Markow) ist ein Spamfilter basierend auf einem Verborgenen Markow Modell und stellt eine Weiterentwicklung des Bayes Filters dar. Während bei einem Bayes Filter die Wahrscheinlichkeit einzelner Wörter… …   Deutsch Wikipedia

  • Spam-Filter — Ein Spamfilter (Werbefilter) ist ein Computerprogramm oder Modul eines Programms zum Filtern von elektronischer unerwünschter Werbung (Spam). Klassischer Einsatzbereich ist das Filtern unerwünschter E Mails als Modul eines E Mail Programms oder… …   Deutsch Wikipedia

  • Verborgenes Markow-Modell — Das Hidden Markov Model (HMM) ist ein stochastisches Modell, das sich durch zwei Zufallsprozesse beschreiben lässt. Ein Hidden Markov Model ist auch die einfachste Form eines dynamischen Bayesschen Netz. Der erste Zufallsprozess entspricht dabei… …   Deutsch Wikipedia

  • Verdecktes Markow-Modell — Das Hidden Markov Model (HMM) ist ein stochastisches Modell, das sich durch zwei Zufallsprozesse beschreiben lässt. Ein Hidden Markov Model ist auch die einfachste Form eines dynamischen Bayesschen Netz. Der erste Zufallsprozess entspricht dabei… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”