Breidbart-Index

Breidbart-Index

Der nach seinem Erfinder, Seth Breidbart, benannte Breidbart-Index ist der bedeutendste Cancel-Index im Usenet.

Mit einem Cancel-Index wird die Verbreitungsintensität wesensgleicher Artikel bestimmt. Überschreitet der Index einen Grenzwert, so bezeichnet man die betreffenden Artikel als Spam. Sie dürfen dann durch Fremdcancel entfernt werden.

Inhaltsverzeichnis

Cancel-Index

  • Crossposting ist das Versenden eines Artikels in mehrere Gruppen.
  • Multiposting ist das mehrfache Versenden desselben Inhalts.

Die grundlegende Idee des Breidbart-Index besteht darin, diese Methoden unterschiedlich zu bewerten. [1] Zum einen müssen bei Crossposts weniger Daten übertragen und gespeichert werden. Zum anderen sind exzessive Crossposts (ECP) ein plausibler Anfängerfehler, während exzessive Multiposts (EMP) auf vorsätzlichen Einsatz spezieller Software schließen lässt.

Entscheidend ist die Erfassung verschiedener Artikel als wesensgleich (im englischen Original: substantively identical). Dies umfasst unter anderem:

  • Byte für Byte identische Nachrichten;
  • an sich identische Nachrichten, die sich nur in geringen Anpassungen an die Gruppe unterscheiden;
  • Nachrichten, die dasselbe Produkt, Dienstleistung oder Website bewerben;
  • Nachrichten, die aus der gleichen Signatur (und sonst nichts) bestehen;
  • Nachrichten, die sich nur durch den zitierten Text unterscheiden.

Breidbart-Index (BI)

Der BI einer Menge von Artikeln ist die Summe der Quadratwurzeln von n, wobei n die Anzahl der Newsgroups ist, in die jeder einzelne Artikel gepostet wurde. Bewertet wird dabei eine Serie von m wesensgleichen Artikeln innerhalb eines Zeitraums von 45 Tagen. Das heißt, Postings älter als 45 Tage zählen nicht zur Serie. [2]

Formel

\mbox{BI} = \sum_{k=1}^m \sqrt{n_k}

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

\sqrt{9} + \sqrt{16} = 3 + 4 = 7

Version 2 des Breidbart-Index (BI2)

Der BI2 ist definiert als Summe der Quadratwurzeln von n, plus der Summe von n, geteilt durch zwei. [2] Der BI2 ist aggressiver als der BI. Ein Crosspost in 35 Gruppen reicht, damit eine einzelne Nachricht den Grenzwert von 20 übertritt.

Formel

\mbox{BI2} = \sum_{k=1}^m \frac{n_k + \sqrt{n_k}}{2}

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

\frac{\sqrt{9} + \sqrt{16} + 9 + 16}{2} =
\frac{3 + 4 + 9 + 16}{2} = \frac{32}{2} = 16

Skirvin-Breidbart-Index (SBI, BI3)

Die Bezeichnungen Skirvin-Breidbart-Index und SBI finden sich im Spam Thresholds FAQ. [2] In der Hierarchie nl.* wird dieser Index aber BI3 genannt. [3]

Der SBI wird wie der BI2 berechnet, summiert aber die Anzahl der Gruppen in Followup-to: (wenn vorhanden) statt der Anzahl der Gruppen in Newsgroups:. Dadurch wird das Setzen eines Followup-to: belohnt.

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16 mit vier Gruppen im Followup-to:

\frac{\sqrt{9} + \sqrt{16} + 9 + 4}{2} =
\frac{3 + 4 + 9 + 4}{2} = \frac{20}{2} = 10

BI7 und BI30

In der Usenet-Hierarchie de.* gilt der Breidbart-Index mit einem Zeitfenster von 7 Tagen statt 45. Dafür hat sich die Abkürzung BI7 eingebürgert. [4]

In der Hierarchie hamster.de.* gilt der Breidbart-Index mit einem Zeitfenster von 30 Tagen statt 45. Dafür hat sich die Abkürzung BI30 eingebürgert. [5]

Cancel-Index in at.*

Ist im FAQ [6] der Gruppe at.usenet.cancel-reports definiert. Im Wahlaufruf (CfV) [7] und im FAQ wird nur die Bezeichnung Cancel-Index verwendet. Inoffizielle Abkürzungen sind CI und ACI.

Der ACI eines einzelnen Postings berechnet sich als 3 plus Anzahl der Gruppen, an die dieses Posting geschickt wurde. Der Index mehrerer Postings ist die Summe der Indizes der einzelnen Postings.

Grenzwerte

  • Laut RFC 1036 darf ein Artikel nur vom Autor oder dem Administrator des Servers, auf dem der Artikel ins Usenet eingespeist wurde, gecancelt werden.
  • Laut dem Spam Thresholds FAQ [2] gilt im gesamten Usenet ein Breidbart-Index von 20, d.h. Artikelserien, die über diesem Wert liegen, dürfen von jedermann per Fremdcancel entfernt werden.
  • In einigen Hierarchien wurden alternative (strengere) Grenzwerte durch eine Abstimmung festgelegt.
  • In der Hierarchie free.* sind alle Arten von Cancel verboten. [8]

Tatsächlich ist eine Cancel-Message nur eine durch Software automatisch auswertbare Bitte, einen bestimmten Artikel zu löschen. Betreiber von Newsservern dürfen frei entscheiden, wie sie die widersprüchlichen Richtlinien umsetzen. [9]

Hierarchie Cancel-Index Zeitfenster Grenzwert Berichte Festlegung
* BI 45 20 news.admin.net-abuse.bulletins [2]
at.* ACI 45 11 at.usenet.cancel-reports [7] [10]
at.anzeigen.* ACI 14 4 at.usenet.cancel-reports [11] [12]
bln.* BI 45 3 [13]
de.* BI 7 5 de.admin.net-abuse.announce [4] [14]
de.alt.dateien.* BI 45 1 de.admin.net-abuse.announce [4] [13]
de.markt.* BI 45 2 de.admin.net-abuse.announce [15] [4] [13]
es.* BI 45 20 [16]
fr.* BI 30 10 fr.usenet.abus.rapports [17]
hamster.de.* BI 30 3 hamster.cancelreport [5]
it.* BI 45 20 it.news.net-abuse [18] [19]
muc.* BI 45 2 [13]
nl.* SBI 10 nl.internet.misbruik.rapport [3]
nrw.* BI 7 2 [20]
schule.* BI 14 3 schule.cancelreport [21]

Fußnoten

  1. <news:36i6hk$3li@panix3.panix.com>
  2. a b c d e Spam Thresholds FAQ
  3. a b Over cancelrapporten in nl.internet.misbruik
  4. a b c d <news:Result-festlegung-bi-06-05-1999@dana.de>, http://home.snafu.de/hweede/debi.txt
  5. a b Regelsatz für hamster.de.*
  6. Spam Cancel in at.* (FAQ)
  7. a b <news:CfV$1$at.usenet.cancel-reports$3@usenet.backbone.at>
  8. free.* FAQ
  9. Cancel Messages: Frequently Asked Questions
  10. <news:Result-festlegung-bi-06-05-1999@dana.de>
  11. <news:938889391/18913@usenet.backbone.at>
  12. <news:RESULT-Entfernung_von_at.anzeigen.computer.haendler-03.10.1999@orcus.priv.at>
  13. a b c d Die Jobbörse in den Newsgroups: de.markt.arbeit.*
  14. Fremdcancel-FAQ
  15. http://www.s.netic.de/fw/dma-result.txt, <Result-de.markt.ALL-28.05.1998@dana.de>
  16. FAQ: SPAM.ES
  17. Les annulations d'articles (Cancel)
  18. Tutto quello che occorre sapere sulla cancellazione
  19. Pagina Antispam in italiano
  20. Regeln der nrw.*-Hierarchie
  21. http://schule.afaik.de/netiquette/netiquette.txt

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Breidbart Index — The Breidbart Index, developed by Seth Breidbart [Breidbart s initial post suggesting the square root rule is at http://groups.google.com/group/news.admin.misc/msg/6e7f15c048a71019?dmode=source] , provides a measure of severity of newsgroup spam …   Wikipedia

  • Indice De Breidbart — L Indice de Breidbart (Breidbart Index en anglais) ou BI, est l unité de mesure destinée à quantifier le degré de nocivité des messages diffusés sur les newsgroup Usenet, qu il s agisse : de publication multiple abusive (Excessive… …   Wikipédia en Français

  • Indice de breidbart — L Indice de Breidbart (Breidbart Index en anglais) ou BI, est l unité de mesure destinée à quantifier le degré de nocivité des messages diffusés sur les newsgroup Usenet, qu il s agisse : de publication multiple abusive (Excessive… …   Wikipédia en Français

  • Indice de Breidbart — L Indice de Breidbart (Breidbart Index en anglais) ou BI, est l unité de mesure destinée à quantifier le degré de nocivité des messages diffusés sur les newsgroup Usenet, qu il s agisse : de publication multiple abusive (Excessive… …   Wikipédia en Français

  • Cancel-Message — Inhaltsverzeichnis 1 Cancel Message 2 Fremdcancel 3 Cancel Watch 4 Cancel Lock Cancel Key 4.1 Ablauf 4.2 Algorithmus …   Deutsch Wikipedia

  • Fremdcancel — Inhaltsverzeichnis 1 Cancel Message 2 Fremdcancel 3 Cancel Watch 4 Cancel Lock Cancel Key 4.1 Ablauf 4.2 Algorithmus …   Deutsch Wikipedia

  • NoCeM — Inhaltsverzeichnis 1 Cancel Message 2 Fremdcancel 3 Cancel Watch 4 Cancel Lock Cancel Key 4.1 Ablauf 4.2 Algorithmus …   Deutsch Wikipedia

  • Bi — ist: eine Abkürzung für Business Intelligence eine Abkürzung für Business Informatics, siehe Wirtschaftsinformatik eine Abkürzung für Bioinformatik eine Abkürzung für „Bibliographisches Institut“ das deutsche Kfz Kennzeichen der Stadt Bielefeld… …   Deutsch Wikipedia

  • Canceln — Das Verb canceln (engl. cancel „annullieren“) bezeichnet im Usenet das bewusste, vorzeitige Löschen eines Artikels. Der Begriff ist leicht mehrdeutig. Newsreader, also die Programme, mit denen man am Usenet teilnimmt, haben im allgemeinen eine… …   Deutsch Wikipedia

  • Crosspost — Die Artikel Multiposting und Crossposting überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen Baustein… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”