- Wiktionary
-
Wiktionary - de.wiktionary.org (Deutsche Version)
- wiktionary.org (Sprachen-Übersicht)
Motto ein Wiki-basiertes freies Wörterbuch Kommerziell Nein Beschreibung Wikiprojekt zur Erstellung eines freien Wörterbuches sowie Thesaurus in jeder Sprache Registrierung optional Sprachen 172, darunter Deutsch, Französisch und Englisch Eigentümer Wikimedia Foundation Urheber einzelne angemeldete und nicht angemeldete Autoren Erschienen Englische Version: 12. Dez. 2002 Das Wiktionary [ˈvɪkʃənərɪ] (Wikiwörterbuch) ist ein gemeinschaftliches Projekt der Wikimedia zur Erstellung eines frei zugänglichen, vollständigen und mehrsprachigen Wörterbuches sowie eines entsprechenden Thesaurus in jeder Sprache. Der Name Wiktionary ist ein analog zu Wikipedia gebildetes Kofferwort, das sich aus den Wörtern Wiki (hawaiisch für „schnell“)[1] und dictionary (englisch für „Wörterbuch“) zusammensetzt. Seit der Gründung 2002 wuchs die Anzahl der Einträge in die Wiktionarys international auf über 11,5 Millionen an.[2]
Inhaltsverzeichnis
Konzept und Projekt
Wiktionary ist der lexikalische (lexikografische) Partner der freien Online-Enzyklopädie Wikipedia. Analog zu den verschiedenen Sprachausgaben der Wikipedia gibt es Wiktionarys in unterschiedlichen Sprachen. Während die Wikipedia als ein Lexikon Sachinformationen zu den Begriffen zur Verfügung stellt, übernimmt das Wiktionary die Funktionen eines Sprachwörterbuchs und eines Thesaurus; es dient somit der Vermittlung sprachlichen Wissens. In der Funktion als Sprachwörterbuch soll es sprachliche Eigenschaften wie Homonyme, Bedeutung, Grammatik, Etymologie und Übersetzungen erklären; die Auswahl der Lemmata soll den Wortschatz der Sprachen abdecken. In der Funktion als (linguistischer) Thesaurus werden zum Worteintrag assoziierte Begriffe wie Synonyme und Oberbegriffe zusammengestellt. Wie die Wikipedias werden die Wiktionarys laufend erweitert und verbessert; jeder kann jederzeit mitarbeiten.
Im Gegensatz zu üblichen gedruckten meist zweisprachigen Sprachwörterbüchern ist das Konzept der Wiktionarys so offen angelegt, dass in jeder einzelnen Sprachversion Lemmata zu Einträgen in allen Sprachen erwünscht sind. In einer theoretischen Endausbaustufe besäße jedes Sprach-Wiktionary den Wortschatz aller Fremdsprachen, erklärt in der Grundsprache des jeweiligen Wiktionarys, sowie zusätzlich alle Einträge aus dem Wortschatz der eigenen Sprache inklusive Übersetzungen in alle Fremdsprachen.
Einer Aussage beim Wikimedia-Projekt Meta zufolge wurde die Idee zur Erstellung des Wiktionary erstmals im Jahr 2002 von Daniel Alston (mit dem Benutzernamen Fonzy) vorgebracht.[3]
Die englische Version wurde als erstes Wiktionary am 12. Dezember 2002 begonnen. Die deutsche Version, das Wikiwörterbuch, startete am 1. Mai 2004. Der 100.000ste Eintrag dieses Projektes wurde am 31. Dezember 2009 erstellt.[4]
In den Wiktionarys werden für unterschiedliche Groß-/Kleinschreibung mit gleicher Buchstabenfolge einzelne Einträge generiert (Beispiel: Bank und bank im deutschen Wikiwörterbuch); dieses Vorgehen weicht von dem der Wikipedias ab, die unterschiedliche Groß-/Kleinschreibungsvarianten in einem Eintrag bündeln. Die Möglichkeit, verschiedene Einträge für Groß- und Kleinschreibungsvarianten zu generieren, wurde nach Aussagen des Wikimedia-Projekts Meta erst 2006 geschaffen.[5] Von dieser Option macht heute eine Vielzahl der Sprachversionen Gebrauch, bei einigen Sprachversionen ist dies jedoch nicht der Fall.
Alle Einträge in den Wiktionarys erhalten eine feste Formatvorlage. Das deutsche Wikiwörterbuch kategorisiert Artikel nicht nach der Bedeutung der erklärten Begriffe (es gibt also beispielsweise keine Kategorien „Biologie“ oder „Medizin“), sondern hauptsächlich nach ihrer Zugehörigkeit zu einer Wortart und einer Sprache. Um dennoch eine gewisse Übersicht über die Abdeckung bestimmter Fachgebiete aus dem Artikelbestand zu bieten, werden manuell gepflegte Listen geführt.[6]
In Wiktionarys können Audiodateien zur Demonstration der Aussprache eingebunden werden. Das deutsche Wikiwörterbuch weist über 18.000 mit Audiodateien versehene Einträge auf.[7] Darüber hinaus wird das Wikiwörterbuch – per gezieltem Einsatz nur bei hierfür geeigneten Einträgen – zum Bildwörterbuch ausgebaut; zum Stand August 2011 sind über 11.300 Illustrationen eingebunden.[8]
Lizenz
Die Inhalte der Wiktionarys sind lizenziert unter der GNU-Lizenz für freie Dokumentation (GFDL) und seit Juni 2009 zusätzlich unter der Creative-Commons-Lizenz „CC-BY-SA 3.0 Unported“. Für die Umstellung auf die Doppellizenz musste erst die GFDL von der Version 1.2 auf eine neue Version 1.3 aktualisiert werden, was aufgrund der Struktur der Version 1.2 ohne Einwilligung der Autorenschaft möglich war. Näheres zur Umstellung auf die Doppellizenz siehe GNU-Lizenz für freie Dokumentation#Verwendung in der Wikipedia.
Übersicht
Nachdem das englischsprachige Wiktionary am 12. Dezember 2002 gestartet wurde, folgten am 29. März 2004 die französisch- und die polnischsprachige Version. Wiktionary wurde zunächst auf einer provisorischen URL wiktionary.wikipedia.org betrieben, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde. Zu diesem Termin wurde zu jeder weiteren Sprache, in der bereits eine Wikipedia-Version betrieben wurde, ein Wiktionary gestartet. So entstanden an einem Tag 143 weitere Wiktionarys, darunter war die deutschsprachige Version.[2]
Bis heute sind in allen 170 Sprachversionen zusammen über 11,5 Millionen Einträge verfügbar. Die meisten Einträge, rund 2,58 Millionen, stellt dabei die englischsprachige Version bereit, gefolgt von der französischsprachigen mit rund 2,05 Millionen Einträgen. Diese beiden größten Wiktionarys haben ihre Plätze in der Rangfolge nach Zahl der Einträge mehrmals getauscht; erstmals Anfang 2006 war die französischsprachige Version die mit den meisten Einträgen. Ab Mitte 2010 ist jedoch wieder die englischsprachige Version die mit den meisten Artikeln. Aktuell stellen die 24 größten Wiktionarys jeweils mehr als 100.000 Einträge bereit. Das deutschsprachige Wiktionary steht mit über 185.000 Einträgen auf Rang 12.[2]
Hier eine Tabelle mit den Eintragsanzahlen der 20 größten Wiktionarys zum Stand vom 20. August 2011:[9]
Nr Sprachkürzel Sprache Anzahl Einträge 1 en Englisch 2.579.184 2 fr Französisch 2.050.541 3 zh Chinesisch 1.183.437 4 mg Malagasy 596.672 5 lt Litauisch 560.490 6 ru Russisch 296.757 7 tr Türkisch 278.059 8 pl Polnisch 235.647 9 vi Vietnamnesisch 229.123 10 ta Tamilisch 226.365 Nr Sprachkürzel Sprache Anzahl Einträge 11 ko Koreanisch 203.002 12 de Deutsch 185.747 13 io Ido 184.122 14 hu Ungarisch 175.084 15 pt Portugiesisch 174.914 16 fi Finnisch 174.542 17 el Griechisch 171.571 18 sv Schwedisch 138.556 19 no Norwegisch (Bokmål) 126.305 20 nl Niederländisch 121.727 Es gibt detaillierte Statistikseiten für die Wiktionarys, die auch die historische Entwicklung abbilden.[10] Die Anzahl an Einträgen für sich sagt nur wenig über die Qualität einer Sprachversion des Wiktionary; siehe hierzu auch das Kapitel über Wachstumsschübe durch Bots. Statistiken, die die Einträge nach Qualitätsmerkmalen klassifizieren, sind bislang nur eingeschränkt verfügbar.[11]
Einzelne Sprachversionen des Wiktionary
Deutsch
Das deutschsprachige Wiktionary oder Wikiwörterbuch wurde am 1. Mai 2004 gestartet. Für die Außendarstellung des deutschsprachigen Wiktionarys existieren bis heute die beiden Begriffe „Wiktionary“ und „Wikiwörterbuch“ nebeneinander. Im Logo (die nebenstehende Abbildung zeigt das Logo vor weißem statt grau meliertem Hintergrund) lautet die Abfolge der Textpassagen „Wikiwörterbuch – Wiktionary – [ˈvɪkʃəˌnɛʀi], n – Das freie Wörterbuch – ein Wiki-basiertes freies Wörterbuch“, wobei die oberste und unterste Passage „Wikiwörterbuch“ und „ein Wiki-basiertes freies Wörterbuch“ in grauer Schrift auf heller grauem Untergrund gesetzt sind.
Von den gut 185.000 Einträgen zum Stand vom 20. August 2011 waren in der Aufteilung nach Sprache der erklärten Wörter etwa 88.000 Einträge deutsch, rund 39.000 Einträge englisch, etwa 16.000 Einträge italienisch und zirka 7.600 Einträge französisch; die restlichen Einträge verteilten sich auf 202 weitere Sprachen.[12] Laut Angaben von wikistics.falsikon.de war unter den eigentlichen Wörterbucheinträgen im August 2009 am häufigsten auf die Einträge „subtil“, „obligatorisch“ und „pragmatisch“ zugegriffen worden.[13]
Englisch
Als allererste Sprachversion wurde das englischsprachige Wiktionary am 12. Dezember 2002 gestartet. Brion Vibber legte das Wiktionary zunächst auf einer provisorischen URL wiktionary.wikipedia.org an, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde.[14] Im November 2005 wurden 100.000 Einträge erreicht, im August 2007 wurden es 500.000. Die Schwelle von 1 Million Einträgen wurde am 18. Oktober 2008 überschritten. Am 27. November 2009 waren es 1,5 Millionen Einträge, und den 2-millionsten Eintrag gab es am 7. September 2010.[15]
Unter den am 20. August 2011 vorhandenen etwa 2,6 Millionen Einträgen waren aufgeteilt nach Sprache der erklärten Wörter etwa 479.000 Einträge Latein, 446.000 italienisch, 371.000 englisch, 230.000 spanisch, 188.000 französisch und 102.000 finnisch; der Rest verteilte sich auf weit über 400 weitere Sprachen.[16]
Französisch
Am 29. März 2004 wurde das französischsprachiges Wiktionary oder Wiktionnaire ins Leben gerufen. Mittlerweile weist es über 2,05 Millionen Einträge auf und ist damit nach der englischen Version auf Platz 2 der umfangreichsten Sprachversionen des Wiktionary. Von den am 20. August 2011 vorhandenen 2,05 Millionen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 1.111.000 Einträge französisch, jeweils 155.000 russisch und bulgarisch, 117.000 englisch und 80.000 slovenisch; der Rest verteilte sich auf über 900 weitere Sprachen.[17]
Vietnamesisch
Das Wiktionary in vietnamesischer Sprache wurde 2004 gestartet. Von den mittlerweile über 230.000 vorhandenen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 110.000 englisch, 44.000 französisch, 35.000 russisch und 31.000 vietnamesisch; der Rest verteilte sich auf 54 weitere Sprachen.[18]
Polnisch
Das polnischsprachige Wiktionary wurde im März 2004 ins Leben gerufen. Von den am 20. August 2011 vorhandenen etwa 236.000 Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 35.000 Einträge englisch, 30.000 polnisch, 21.000 chinesisch und 19.400 in der Plansprache Interlingua; der Rest verteilte sich auf 264 weitere Sprachen.[19] Die zirka 7.900 Einträge in jiddisch machen das polnische Wiktionary nach eigener Darstellung[20] zum größten modernen Wörterbuch der Nachkriegszeit für Jiddisch, das in Polen ‚herausgegeben‘ wurde. Knapp 6.000 dieser Einträge entstanden 2007 durch eine Bot-Aktion (siehe das Kapitel über Wachstumsschübe durch Bots).
Wachstumsschübe durch Bots
Die meisten Einträge in den umfangreichsten Sprachversionen des Wiktionary sind durch den Einsatz von Bots entstanden. Ihre Programmierer fanden kreative Wege, um große Zahlen neuer Einträge zu generieren oder tausende von Einträgen aus öffentlich zugänglichen Wörterbüchern maschinell zu importieren.
Sieben der mittlerweile über 30 Bots, die beim englischsprachigen Wiktionary als solche gelistet sind,[21] haben dort etwa 163.000 Einträge neu erstellt.[22] 259 Komplex-Einträge, die selbst viele Definitionen enthalten, wurden von Websterbot aus öffentlich verfügbaren Quellen importiert; die meisten dieser Importe sind manuell in Tausende Einträge gesplittet worden. Ein weiterer dieser Bots, ThirdPersBot, erstellte Verbnebenformen in der dritten Person Singular, die in gedruckten Wörterbüchern üblicherweise nicht einzeln aufgeführt werden. Zur Zeit dieser Aktionen im Jahr 2006 hatte das englischsprachige Wiktionary ohne die etwa 163.000 Bot-Einträge etwa 137.000 Einträge und war damit noch deutlich kleiner als viele gedruckte Wörterbücher: So umfasst das Oxford English Dictionary etwa 615.000 Worteinträge und das Merriam-Webster's Third New International Dictionary of the English Language, Unabridged 475.000 Einträge; dabei sind viele Wortwendungen nur im Textkörper anderer Einträge vorhanden.
Die Wiktionarys in englischer und französischer Sprache haben die zirka 20.000 Einträge der Unihan-Datenbank der CJK-Schriftzeichen (chinesisch, japanisch und koreanisch) importiert.
Auch das rapide Wachstum des französischsprachigen Wiktionarys im Jahr 2006 geht hauptsächlich auf die Arbeit von Bots zurück, die viele Einträge aus alten, lizenzfreien Wörterbüchern wie der 8. Ausgabe des Dictionnaire de l'Académie française von 1935 mit rund 35.000 Worteinträgen übernahmen, sowie von Bots, die Begriffe aus anderen Sprachausgaben des Wiktionary mit französischen Übersetzungen importierten. Das französisch- wie das vietnamesischsprachige Wiktionary haben große Teile des Free Vietnamese Dictionary Project (FVDP)[23] importiert. Dieses bietet frei zugängliche zweisprachige Wörterbücher von und ins Vietnamesische an.[24] Das vietnamesischsprachige Wiktionary bestand nach dieser Aktion fast ausschließlich aus diesen importierten Einträgen.
Das Wiktionary in polnischer Sprache hat mit Hilfe des Bots Tsca.bot[25] im Zeitraum vom 10. Juli bis zum 27. November 2004 zirka 15.000 Stummeleinträge der Plansprache Interlingua mit Genehmigung des Autors von der Webpräsenz interlingua.filo.pl importiert.[26] Mit Hilfe desselben Bots Tsca.bot wurden vom 31. März bis zum 2. April 2007 knapp 6.000 Einträge in jiddischer Sprache angelegt, die zumeist neben der polnischen Übersetzung die IPA-Aussprache und die YIVO-Transkription enthielten.[27]
Das russischsprachige Wiktionary übernahm mit Hilfe des Bots LXbot ab Oktober 2006 etwa 80.000 Stummeleinträge („Boilerplates“) für englische, deutsche und französische Wörter.[28][29][30] Ab Juni 2008 wurden durch den Bot TrudoBot in hoher Zahl Stummeleinträge für russische Wörter erstellt.[31]
Bedeutung
Sprachübergreifend gesehen wird wiktionary.org von Alexa Internet im sogenannten „Alexa Traffic Rank“ auf Rang 755 (Stand 20. August 2011) geführt.[32] Von den registrierten Zugriffen erfolgten nach Sprachversion etwa 44 % auf die englische, 12 % auf die französische und 10 % auf die deutsche Version; der Rest verteilte sich auf die vielen weiteren Sprachversionen.
Literatur
- Kai-Uwe Carstensen, Christian Ebert, Susanne Jekat, Cornelia Ebert, Hagen Langer, Ralf Klabunde (Hrsg.): Computerlinguistik und Sprachtechnologie. Eine Einführung. 3. Auflage 2010 Auflage. Spektrum Akademischer Verlag, Heidelberg, ISBN 978-3-8274-2023-7 (insbesondere S. 548–550).
- A. Elia: Can a collaborative Wiki Weblish Dictionary Project help academic writing of ICT language learners?. In: Isabel González-Pueyo, Carmen Foz Gil, Mercedes Jaime Siso, Marco Luzón, María José (Hrsg.): Teaching Academic and Professional English Online. Peter Lang Publishing Group, 2009, ISBN 978-3-03911-582-2.
Einzelnachweise
- ↑ wiki in Hawaiian Dictionaries
- ↑ a b c Wiktionary, Eintrag beim Wikimedia-Projekt Meta, abgerufen zuletzt am 20. August 2011.
- ↑ Talk:Wiktionary/Archives/2002 beim Wikimedia-Projekt Meta; dies bezieht sich wiederum auf den Eintrag Wiktionary/Split_into_thesaurus_and_dictionary beim gleichen Projekt.
- ↑ Wiktionary:Meilensteine im deutschen Wikiwörterbuch.
- ↑ Capitalization of Wiktionary pages beim Wikimedia-Projekt Meta, abgerufen am 13. September 2009.
- ↑ Verzeichnis:Übersicht im Wikiwörterbuch.
- ↑ Kategorie:Audio-Datei im Wikiwörterbuch, abgerufen am 20. August 2011.
- ↑ Kategorie:Illustration im Wikiwörterbuch, abgerufen am 20. August 2011.
- ↑ s23.org/wikistats/wiktionaries_html.php, abgerufen am 20. August 2011.
- ↑ Siehe Wiktionary:Statistik/Sprachenübersicht in der deutsch- und Wiktionary:Statistics#Detail in der englischsprachigen Ausgabe des Wiktionary.
- ↑ Siehe etwa Wiktionary Category Overview bei stats.wikimedia.org.
- ↑ Wiktionary:Statistik/Sprachenübersicht, abgerufen am 20. August 2011.
- ↑ Page hits per day for de.wiktionary in month 2009-08, Statistik bei wikistics.falsikon.de.
- ↑ Talk:Wiktionary/Archives/2002 bei meta.wikimedia.org, abgerufen am 13. September 2009.
- ↑ Wiktionary:Milestones beim englischsprachigen Wiktionary, abgerufen am 13. Dezember 2009.
- ↑ Wiktionary:Statistics, abgerufen am 20. August 2011 (Version vom 19. August 2011).
- ↑ Wiktionnaire:Statistiques, abgerufen am 20. August 2011 (Version mit Stand vom 28. Juli 2011).
- ↑ Wiktionary:Thống kê im vietnamesischsprachigen Wiktionary, abgerufen am 15. September 2009.
- ↑ Wikisłownik:Statystyka im polnischsprachigen Wiktionary, abgerufen am 20. August 2011 (Version mit Stand vom 16. August 2011).
- ↑ Portal:Jidysz/pl/mainpage im polnischsprachigen Wiktionary, abgerufen am 17. September 2009.
- ↑ Siehe Special:Listusers beim englischsprachigen Wiktionary.
- ↑ Aussage auf Wiktionary in der englischsprachigen Version, abgerufen am 2. September 2009; angegeben werden folgende Bearbeitungszähler für 5 Bots: TheDaveBot, TheCheatBot, Websterbot, PastBot, NanshuBot. Allerdings ist hier zu beachten, dass nicht jeder Edit eine Neuanlage eines Eintrags darstellt.
- ↑ Free Vietnamese Dictionary Project (FVDP) bei der Universität Leipzig.
- ↑ Für Details siehe auch Wiktionary:Nguồn gốc/FVDP beim vietnamesischen Wiktionary.
- ↑ Siehe Tsca.bot im polnischsprachigen Wiktionary.
- ↑ Eintrag des ersten Wortes (abandonamento) und Eintrag des letzten Wortes (tic-tac) durch Tsca.bot aus der Quelle http://interlingua.filo.pl.
- ↑ Eintrag des ersten Wortes (שפּאַס) und Eintrag des letzten Wortes (שראַם) durch Tsca.bot.
- ↑ triskaidekaphobia, erster Eintrag dieser Art durch LXbot.
- ↑ Bearbeitungszähler für LXbot.
- ↑ Siehe Diskussionsabschnitt ru:User:LXbot bei User talk:VPliousnine im englischsprachigen Wiktionary.
- ↑ Участник:TrudoBot im russischsprachigen Wiktionary.
- ↑ wiktionary.org bei Alexa, abgerufen am 20. August 2011.
Weblinks
Commons: Wiktionary-Statistiken – Sammlung von Bildern, Videos und AudiodateienCommons: Wiktionary-Logos – Album mit Bildern und/oder Videos und AudiodateienWiktionary: Wiktionary – Bedeutungserklärungen, Wortherkunft, Synonyme, ÜbersetzungenWiktionary auf deutsch – ein freies Wörterbuch.
- Wiktionary-Sprachportal
- Statistiken zu den Wiktionarys sowie Statistiken zum deutschsprachigen Wiktionary bei stats.wikimedia.org
- Wiki Research Bibliography, mit wissenschaftlichen Arbeiten über Wikipedia und Wikis (englisch)
- Wikipedistik, Informationen über laufende Forschungsprojekte zur Wikipedia auf Deutsch
Wikimedia-ProjekteWikibooks | Wikimedia Commons | Wikipedia | Wikiquote | Wikisource | Wikispecies | Wikiversity | Wiktionary | Wikinews
Wikimedia Foundation.
Schlagen Sie auch in anderen Wörterbüchern nach:
Wiktionary — noun /ˈwɪkʃən(ə)ri,ˈwɪkʃəˌnɛɹi,ˈwɪkʃəˌnɛri/ A collaborative project run by the to produce a free and complete dictionary (lexicon and thesaurus therein) in every language … Wiktionary
Wiktionary — Infobox Website name = Wiktionary caption = Screenshot of wiktionary.org home page url = http://www.wiktionary.org/ commercial = No type = Online dictionary language = Multi lingual (over 150) registration = Optional owner = Wikimedia Foundation… … Wikipedia
Wiktionary — Wiktionnaire Logo de Wiktionnaire URL http://fr.wiktionary.org … Wikipédia en Français
Wiktionary — Викисловарь Wiktionary http://wiktionary.org/ Коммерческий: Нет Тип сайта: Сетевая энциклопедия Регистрац … Википедия
Ultimate Wiktionary — OmegaWiki OmegaWiki (anciennement WiktionaryZ (WZ), anciennement Ultimate Wiktionary (UW)) est un dictionnaire multilingue de traduction fondé sur le principe de base de données relationnelle. Sommaire 1 Historique 2 Dates importantes du… … Wikipédia en Français
bacitracin — noun A nonprescription antibiotic, usually provided in topical ointment form and discovered as a product of the bacterium Bacillus subtilis. <!From the discussion page for John Kerry in Wikipedia: , Ive seen it both ways but lower case is more … Wiktionary
Nadir — noun a) A male given name. <!Wiktionary does not give these: b) A family name See Also: Nadia … Wiktionary
second-level domain — noun a) a domain that is immediately below a top level domain Wiktionary.org is a second level domain b) a domain name that contains a single period … Wiktionary
translating dictionary — noun A dictionary whose purpose is translating from language to language, as opposed to defining words in a single language. Wiktionary is meant to be both a defining dictionary and a translating dictionary … Wiktionary
virtually — adverb /ˈvɚ.tʃwə.li/ a) almost but not quite. Wiktionary will never even be virtually complete. b) Without exaggeration; literally virtually indicable … Wiktionary