- Tatoeba
-
Tatoeba ist ein Projekt, dessen Name aus dem Japanischen stammt. Es bedeutet „zum Beispiel“. Ziel ist, viele Sätze zu sammeln, die in verschiedene Sprachen übersetzt werden.
Tatoeba besteht aus einem großen Bestand exemplarischer Sätze, die in verschiedene Sprachen übersetzt sind. Es funktioniert als vielsprachiges Übersetzungs-Wörterbuch, in dem man, wenn man die Übersetzung eines Wortes sucht, nicht nur diese findet, sondern vollständige Sätze, in denen das gesuchte Wort vorkommt. Die Satzeinträge werden nach und nach durch Tondateien ergänzt.
Die Textsammlung von Tatoeba basiert auf dem Korpus Tanaka, einer großen Sammlung von parallelen Sätzen in Japanisch und Englisch. Seit 2006 wurden unter Leitung von Trang Ho viele andere Sprachen hinzugefügt. Darunter befinden sich auch Plattdeutsch, Latein und Plansprachen wie Esperanto, Toki Pona oder Klingonisch.
Struktur
Die Sätzesammlung ist wie ein Graph mit Knoten und Pfeilen strukturiert: Jeder Knoten repräsentiert einen Satz, und jeder Pfeil repräsentiert die Verbindung zwischen zwei Sätzen. Wenn zwei Sätze verbunden sind, haben sie die gleiche Bedeutung.
Netzwerk
Das Netzwerk hat eine Reihe von Möglichkeiten für die Suche und die Bearbeitung von Sätzen. Es werden Sätze eingefügt, übersetzt, kommentiert, mit Stichworten versehen und, wenn nötig, nachträglich bearbeitet. Dies kann jeder angemeldete Nutzer tun. Man bekommt Sätze gleich in mehreren Sprachen untereinander angeordnet geboten.
Mit Tatoeba kann man seine Kenntnisse in diversen Sprachen verbessern.
Am 7. November 2011 waren 94 Sprachen vertreten. Von den insgesamt 1.171.284 Sätzen sind 209.891 auf Englisch, 161.457 auf Japanisch und 112.375 auf Esperanto verfasst. Die Ränge 4 und 5 belegen Französisch mit 104.635 und Deutsch mit 83.446 Einträgen.
Weblinks
Wikimedia Foundation.