Canterbury Corpus

Canterbury Corpus

Der Canterbury Corpus ist eine Sammlung von Dateien um die Leistung und den Kompressionsgrad verschiedener Kompressionsverfahren der verlustfreien Datenkompression zu messen. Er wurde 1997 von der Universität von Canterbury entwickelt und soll den 1980 entwickelten Calgary Corpus ablösen.

Inhaltsverzeichnis

Zweck

Der Canterbury Corpus wurde als Grundlage zur Anwendung von Metriken auf neu entwickelte Datenkompressionsverfahren entwickelt und dient in erster Linie zur Erstellung von Testfällen zum Testen der Algorithmen während des Entwicklungszyklus. Obwohl er prinzipiell auch zum Vergleich verschiedener Kompressionsverfahren eingesetzt werden kann, distanzieren sich die Autoren hiervon ausdrücklich und verweisen auf ähnliche Sammlungen und Hilfsmittel[1]. Darüber hinaus ist der Canterbury Corpus ausschließlich für den Test verlustfreier Kompressionsverfahren vorgesehen.

Pakete

Der Canterbury Corpus besteht aus verschiedenen Paketen, die je nach Testzweck und Algorithmus teilweise stark spezialisierte Daten enthalten. So bietet das Paket The Canterbury Corpus elf Dateien in Text- und Binärformaten, u.a. einen Auszug aus einem Werk William Shakespeares und dient in erster Linie dem Vergleich des zu testenden Algorithmus mit bereits bestehenden anderen Kompressionsmethoden. Die Pakete Artificial, Large und Miscellaneous bieten Dateien mit synthetisch generierten Inhalten, besonders großen Dateien (z.B. dem vollständigen Inhalt des CIA World Fact Book) oder rein numerischen Inhalten. Diese Pakete dienen zum Testen eines Kompressionsverfahrens in besonderen Situationen.

Weblinks

Einzelnachweise

  1. http://corpus.canterbury.ac.nz/purpose.html

Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Canterbury Corpus — The Canterbury Corpus is a collection of files intended for use as a benchmark for testing lossless data compression algorithms. It was created in 1997 at the University of Canterbury, New Zealand and designed to replace the Calgary Corpus. See… …   Wikipedia

  • Corpus Christi College (Cambridge) — Saltar a navegación, búsqueda Escudo de armas del College. El Corpus Christi College (cuyo nombre completo es: The College of Corpus Christi and the blesses Virgin Mary, generalmente llamada Corpus) es uno de los colleges que forman la… …   Wikipedia Español

  • Corpus Christi College — Saltar a navegación, búsqueda Plantilla:Oxford College Infobox El patio del Corpus Christi College. El Corpus Christi College es uno de los colleges que constituyen la Universidad de Oxford en el Reino Unido. En 2006, tuvo un presupuesto… …   Wikipedia Español

  • Corpus Christi College, Cambridge — Colleges of the University of Cambridge Corpus Christi College …   Wikipedia

  • Corpus Juris Canonici — Page of 1879 edition of Corpus Iuris Canonici[1] The Corpus juris canonici (lit. Body of Canon Law ) is the collection of significant sources of canon law of the Catholic Church that was …   Wikipedia

  • Corpus Vitrearum Medii Aevi — Das Corpus Vitrearum Medii Aevi (CVMA) (lat. etwa für „(Gesamt )Werk der Glasmalerei des Mittelalters“), kurz: Corpus Vitrearum (CV), ist ein internationales kunstgeschichtliches Forschungsunternehmen, das sich zum Ziel gesetzt hat, alle… …   Deutsch Wikipedia

  • Corpus Christi College, Oxford — Colleges and halls of the University of Oxford Corpus Christi College …   Wikipedia

  • Corpus Christi College (Oxford) — 51° 45′ 03″ N 1° 15′ 13″ W / 51.7509, 1.2537 …   Wikipédia en Français

  • Calgary Corpus — The Calgary Corpus is a collection of text and binary data files, commonly used for comparing data compression algorithms. It was created by Ian Witten and Tim Bell in the 1980s and was commonly used in the 1990s. In 1997 it was replaced by the… …   Wikipedia

  • The Canterbury Tales — is a collection of stories written by Geoffrey Chaucer in the 14th century (two of them in prose, the rest in verse). The tales, some of which are originals and others not, are contained inside a frame tale and told by a collection of pilgrims on …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”