ID3

ID3 (Iterative Dichotomiser 3) ist ein Algorithmus, der zur Entscheidungsfindung dient. Er wird bei Entscheidungsbäumen eingesetzt.

Der australische Forscher J. Ross Quinlan publizierte diesen Algorithmus erstmals im Jahre 1986. ID3 war in seinen ersten Jahren sehr einflussreich. Er findet auch heute noch in einigen Produkten Verwendung. ID3 gilt als Vorgänger des C4.5-Algorithmus.

ID3 wird verwendet, wenn bei großer Datenmenge viele verschiedene Attribute von Bedeutung sind und deshalb ein Entscheidungsbaum ohne große Berechnungen generiert werden soll. Somit entstehen meist einfache Entscheidungsbäume. Es kann aber nicht garantiert werden, dass keine besseren Bäume möglich wären.

Die Basisstruktur von ID3 ist iterativ. Es werden zu jedem noch nicht benutzten Attribut Entropien bezüglich der Trainingsmenge berechnet. Das Attribut mit dem höchsten Informationsgehalt, also der kleinsten Entropie, wird gewählt und daraus ein neuer Baum-Knoten generiert. Das Verfahren terminiert, wenn alle Trainingsinstanzen klassifiziert wurden, d.h. wenn jedem Blattknoten eine Klassifikation zugeordnet ist.

Algorithmus

Wenn alle Elemente aus T (Daten) zu einer Klasse gehören

Dann

// Erzeuge ein Blatt //

Konstruiere ein Blatt mit der Klasse als Bezeichner

Sonst

// Erzeuge rekursiv einen Teilbaum //

Wähle das „informativste“ Merkmal xi

Beginn: Für_alle vorkommenden Werte von Merkmal xi

Konstruiere alle Teilbäume rekursiv mit den entsprechenden Teilmengen als Daten

Ende: Für_alle

Konstruiere einen Baumknoten mit Bezeichner xi und hänge alle erzeugten Teilbäume an

Ende Sonst

Auswahl der Merkmale

Für die Bildung der Teilbäume wird jeweils entsprechend der Informationstheorie das informativste Merkmal ausgewählt.

Sei $S$ die Menge der Merkmale mit ihrer jeweiligen Klassifizierung, $a \in A$ das zu prüfende Attribut aus der Menge der verfügbaren Attribute, $V (a)$ die Menge der möglichen Attributwerte von $a$ und $S v$ die Untermenge von $S$ , für die das Attribut $a$ den Wert $v$ annimmt. Der Gewinn, der durch Auswahl des Merkmals $a$ erzielt wird errechnet sich dann folgendermaßen:

$G(S, a) = Entropie(S) - \sum_{v \in V(a)} \dfrac{|S_v|}{|S|} Entropie(S_v)$ .

Schließlich wählt man ein Attribut mit dem größtmöglichem Gewinn aus der Menge $\lbrace a_{next} \in A | G(S, a_{next}) = max_{a \in A}(G(S, a)) \rbrace$ als das nächste Attribut.

Diese Wahl führt zur Bevorzugung von Merkmalen mit vielen Wahlmöglichkeiten und damit zu einem breiten Baum. Um dem entgegenzuwirken kann eine Normalisierung über die Anzahl der Wahlmöglichkeiten durchgeführt werden.

Siehe auch

Kategorie:

Klassifikationsverfahren

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

ID3 — is a metadata container most often used in conjunction with the MP3 audio file format. It allows information such as the title, artist, album, track number, or other information about the file to be stored in the file itself.There are two… … Wikipedia
Id3 — Pour l’article homonyme, voir Algorithme ID3. ID3 est le nom des métadonnées pouvant être insérées dans un fichier audio comme MP3. Ces métadonnées permettent d avoir des informations sur le contenu du fichier comme le titre, le nom… … Wikipédia en Français
ID3 — может означать: ID3 (метаданные) (от англ. Identify an MP3) формат метаданных, сохраняемых в файлах форматов типа MP3 (автор, название альбома, и т. д.) ID3 (алгоритм) один из алгоритмов для построения дерева принятия решений … Википедия
ID3 — es un estándar de facto para incluir metadatos (etiquetas) en un contenedor multimedia, tales como álbum, título o artista. Se utiliza principalmente en ficheros MP3 … Enciclopedia Universal
ID3 — Para otros usos de este término, véase Algoritmo ID3. ID3 es un estándar de facto para incluir metadatos (etiquetas) en un archivo contenedor audiovisual, tales como álbum, título o artista. Se utiliza principalmente en ficheros sonoros como MP3 … Wikipedia Español
ID3 — Pour l’article homonyme, voir Algorithme ID3. ID3 est le nom des métadonnées pouvant être insérées dans un fichier audio comme MP3. Ces métadonnées permettent d avoir des informations sur le contenu du fichier comme le titre, le nom… … Wikipédia en Français
ID3 — ● sg. m. ►SON Ensemble d informations sur le contenu d un fichier MP3, situé à la fin du fichier et faisant 128 octets de longs, découpé en champs de 30 octets maximum. On parle souvent de tag ID3 . Étendu en ID3v2. Logo ID3v2, copyright 1998… … Dictionnaire d'informatique francophone
ID3 algorithm — ID3 (Iterative Dichotomiser 3) is an algorithm used to generate a decision tree invented by Ross Quinlan.The algorithm is based on Occam s razor: it prefers smaller decision trees (simpler theories) over larger ones. However, it does not always… … Wikipedia
ID3-Tag — Anzeige des ID3 Tags im Eigenschaftenfenster einer mp3 Datei im Dateimanager Konqueror Als ID3 Tag bezeichnet man ein Format für Zusatzinformationen (Metadaten), die in Audiodateien des MP3 Formats enthalten sein können. ID3 steht für Identify an … Deutsch Wikipedia
ID3 (метаданные) — У этого термина существуют и другие значения, см. ID3. Для улучшения этой статьи желательно?: Переработать оформление в соответствии с правилами написания статей … Википедия

Academic dictionaries and encyclopedias

ID3

Algorithmus

Auswahl der Merkmale

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

ID3

Algorithmus

Auswahl der Merkmale

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link