Canterbury Corpus

Canterbury Corpus: Der Canterbury Corpus ist eine Sammlung von Dateien um die Leistung und den Kompressionsgrad verschiedener Kompressionsverfahren der verlustfreien Datenkompression zu messen. Er wurde 1997 von der Universität von Canterbury entwickelt und soll den 1980 entwickelten Calgary Corpus ablösen.

Inhaltsverzeichnis

1 Zweck

2 Pakete

3 Weblinks

4 Einzelnachweise

Zweck

Der Canterbury Corpus wurde als Grundlage zur Anwendung von Metriken auf neu entwickelte Datenkompressionsverfahren entwickelt und dient in erster Linie zur Erstellung von Testfällen zum Testen der Algorithmen während des Entwicklungszyklus. Obwohl er prinzipiell auch zum Vergleich verschiedener Kompressionsverfahren eingesetzt werden kann, distanzieren sich die Autoren hiervon ausdrücklich und verweisen auf ähnliche Sammlungen und Hilfsmittel^[1]. Darüber hinaus ist der Canterbury Corpus ausschließlich für den Test verlustfreier Kompressionsverfahren vorgesehen.

Pakete

Der Canterbury Corpus besteht aus verschiedenen Paketen, die je nach Testzweck und Algorithmus teilweise stark spezialisierte Daten enthalten. So bietet das Paket The Canterbury Corpus elf Dateien in Text- und Binärformaten, u.a. einen Auszug aus einem Werk William Shakespeares und dient in erster Linie dem Vergleich des zu testenden Algorithmus mit bereits bestehenden anderen Kompressionsmethoden. Die Pakete Artificial, Large und Miscellaneous bieten Dateien mit synthetisch generierten Inhalten, besonders großen Dateien (z.B. dem vollständigen Inhalt des CIA World Fact Book) oder rein numerischen Inhalten. Diese Pakete dienen zum Testen eines Kompressionsverfahrens in besonderen Situationen.

Weblinks

Webseite der Canterbury University zu Canterbury Corpus

Einzelnachweise

↑ http://corpus.canterbury.ac.nz/purpose.html

Kategorien:
Datenkompression
Qualitätsmanagement (Softwaretechnik)

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

Canterbury Corpus — The Canterbury Corpus is a collection of files intended for use as a benchmark for testing lossless data compression algorithms. It was created in 1997 at the University of Canterbury, New Zealand and designed to replace the Calgary Corpus. See… … Wikipedia
Corpus Christi College (Cambridge) — Saltar a navegación, búsqueda Escudo de armas del College. El Corpus Christi College (cuyo nombre completo es: The College of Corpus Christi and the blesses Virgin Mary, generalmente llamada Corpus) es uno de los colleges que forman la… … Wikipedia Español
Corpus Christi College — Saltar a navegación, búsqueda Plantilla:Oxford College Infobox El patio del Corpus Christi College. El Corpus Christi College es uno de los colleges que constituyen la Universidad de Oxford en el Reino Unido. En 2006, tuvo un presupuesto… … Wikipedia Español
Corpus Christi College, Cambridge — Colleges of the University of Cambridge Corpus Christi College … Wikipedia
Corpus Juris Canonici — Page of 1879 edition of Corpus Iuris Canonici[1] The Corpus juris canonici (lit. Body of Canon Law ) is the collection of significant sources of canon law of the Catholic Church that was … Wikipedia
Corpus Vitrearum Medii Aevi — Das Corpus Vitrearum Medii Aevi (CVMA) (lat. etwa für „(Gesamt )Werk der Glasmalerei des Mittelalters“), kurz: Corpus Vitrearum (CV), ist ein internationales kunstgeschichtliches Forschungsunternehmen, das sich zum Ziel gesetzt hat, alle… … Deutsch Wikipedia
Corpus Christi College, Oxford — Colleges and halls of the University of Oxford Corpus Christi College … Wikipedia
Corpus Christi College (Oxford) — 51° 45′ 03″ N 1° 15′ 13″ W / 51.7509, 1.2537 … Wikipédia en Français
Calgary Corpus — The Calgary Corpus is a collection of text and binary data files, commonly used for comparing data compression algorithms. It was created by Ian Witten and Tim Bell in the 1980s and was commonly used in the 1990s. In 1997 it was replaced by the… … Wikipedia
The Canterbury Tales — is a collection of stories written by Geoffrey Chaucer in the 14th century (two of them in prose, the rest in verse). The tales, some of which are originals and others not, are contained inside a frame tale and told by a collection of pilgrims on … Wikipedia

Academic dictionaries and encyclopedias

Canterbury Corpus

Inhaltsverzeichnis

Zweck

Pakete

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Canterbury Corpus

Inhaltsverzeichnis

Zweck

Pakete

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link