- Content-Filter
-
Ein Contentfilter (von engl. content „Inhalt“) wird zur Filterung bestimmter Inhalte in einem Netzwerk oder einem Computer eingesetzt. Diese Filter kommen vor allem in Unternehmensnetzwerken und bei Internetprovidern zum Einsatz. Meist wird dadurch versucht, illegale, anstößige oder jugendgefährdende Websites zu sperren.[1]
Inhaltsverzeichnis
Ansätze der Filterung
Ein detailliert einstellbarer Contentfilter erleichtert die Kontrolle über die betrachteten Inhalte. Zum Teil unbemerkt für den Anwender blockt oder filtert dieses System beispielsweise Webseiten und/oder E-Mails hinsichtlich einzelner Wörter, typischer Phrasen, Bilder oder Links.
Methoden der Filterung
Meist werden diese Bereiche mittels einer Kategorisierung konfiguriert, Dabei werden Listen (Datenbanken) benutzt, so die ablehnende Blacklist oder eine Whitelist, die den Zugriff trotzdem gestattet. Typische Beispiele für vordefinierte Kategorien sind Pornographie oder Rechtsextremismus.
Einfache Contentfilter
Einfache Filter überprüfen nur das Vorkommen bestimmter Auswahlkriterien. Nachteilig ist bei Einsatz von sehr einfachen Content-Filtern, dass jede Seite mit entsprechenden Wörtern gesperrt wird. Dabei können auch Seiten gefiltert werden, die gesperrte Wörter in einem anderen Kontext nutzen. Wenn beispielsweise das Wort „Sex“ in jeder Form gesperrt ist, wird nicht nur allgemein jede Seite, die dieses Wort – auch in unverfänglichem Zusammenhang – verwendet, sondern unter Umständen auch die Seite der Ortschaft Sexten oder die Wikipedia-Einträge Rechtsextremismus und Zufallsexperimente gefiltert.
Intelligente Contentfilter
Um Nachteile einfacher Filtermethoden zu umgehen, arbeiten intelligente Contentfilter mit Gewichten und weisen eine Seite erst dann zurück, wenn eine bestimmte Relevanz überschritten wird. Daneben verwenden sie auch heuristische Verfahren, und bei E-Mails Greylists.
Ein intelligenter Contentfilter ist im Gegensatz zu einem URL-Filter mit hoher Trefferwahrscheinlichkeit in der Lage, Webseiten oder E-Mails korrekt zu beurteilen. Ebenfalls können für gut befundene URLs eine bestimmte Zeit lang gecacht werden, um das zeitraubende Prüfen bei wiederholter Anforderung zu vermeiden.
Einschränkung
Einfache Contentfilter können nur URLs, Texte und Bilder, die nach bestimmten Standards klassifiziert sind, prüfen. Texte, die in Bildform dargestellt werden, können nur geprüft werden, wenn der Contentfilter gleichzeitig eine Unterstützung für OCR-Texterkennung aufweist. Natürlich ist es auch nur begrenzt möglich, Blacklists aller unerwünschten Seiten zu führen.
Fortschrittliche Systeme kombinieren ebenfalls ein Antivirenprogramm mit dem Contentfilter, um auch hierüber eingeschleuste Malware, die beispielsweise über Scripte oder Bilder auf den Client gelangen wollen, zu erkennen.
Einzelnachweise
- ↑ heise Netze: Familienministerin: Provider machen mit beim Sperren von Kinderporno. 15. Januar 2009.
Wikimedia Foundation.