- DIN 5007
-
DIN 31638 Bereich Schriftverkehr Regelt Bibliographische Ordnungsregeln Kurzbeschreibung Letzte Ausgabe 8.1994 ISO - DIN 5007 Bereich Schriftverkehr Regelt Ordnung von Schriftzeichenfolgen Kurzbeschreibung Teil 1: ABC-Regeln, Teil 2: Ansetzungsregeln Letzte Ausgabe 8.2005, 5.1996 ISO - Eine alphabetische Sortierung ist eine Sortierung, nach der Zeichenketten nach Reihenfolge der Buchstaben im alten Alphabet angeordnet werden. Die herkömmliche Sortierung wird auch als initialalphabetische Sortierung bezeichnet, da die Ordnung der einzelnen Buchstaben in Schriftrichtung ermittelt wird. Bei der alphabetischen Sortierung müssen Besonderheiten wie Sonderzeichen, Umlaute, Leerzeichen, Groß- und Kleinschreibung sowie Ziffern beachtet werden, da sie sich in unterschiedlichen Regeln und Normen niederschlagen.
Inhaltsverzeichnis
Einsortierungsregeln
Das deutsche Alphabet ergänzt das lateinische Alphabet um die Umlaute Ä, Ö und Ü, sowie den Kleinbuchstaben ß. Diese zusätzlichen Buchstaben können auf vier Arten einsortiert werden:
- Ignorieren der Pünktchen. Müll wird wie Mull sortiert.
- Gleichordnung von Grundbuchstaben, Doppelbuchstaben und Umlaut, wenn Doppelbuchstabe wie Umlaut gesprochen wird. Muell wird wie Müll oder Mull sortiert. Duell dagegen zwischen Duden und Dugast.
- Auflösung des Umlauts. Müll wird wie Muell vor Muffe sortiert.
- Separierung als selbständiger Buchstabe.
Die DIN 5007-1 beschreibt unter dem Titel „Ordnen von Schriftzeichenfolgen (ABC-Regeln)“ das Sortieren.
DIN 5007 Variante 1 (für Wörter verwendet, etwa in Lexika; Abschnitt 6.1.1.4.1)
- ä und a sind gleich
- ö und o sind gleich
- ü und u sind gleich
- ß und ss sind gleich
DIN 5007 Variante 2 (spezielle Sortierung darf für Namenslisten verwendet werden, etwa in Telefonbüchern; Abschnitt 6.1.1.4.2)
- ä und ae sind gleich
- ö und oe sind gleich
- ü und ue sind gleich
- ß und ss sind gleich
Österreichische Sortierung (für Telefonbücher)
- ä folgt auf a (kommt daher erst nach az)
- ö folgt auf o
- ü folgt auf u
- ß folgt auf ss
- St. folgt auf Sankt
Im gedruckten österreichischen Telefonbuch (2006/2007, seit etwa 1990 vom Verlag herold.at) finden sich unterschiedliche Reihungen: Im Ortsverzeichnis kommen nach z erst die Umlaute und ß, also: Tyrnau, Tösens und Weiz, Weißbach sowie Zwettl, Zürs, Öblarn (gut versteckt unter dem Titel "Z"). Die Infoseiten reihen jedoch Ämter vor Arbeit, die Gelben Seiten ihre Rubrik Ärzte vor Audio. Im Namensverzeichnis Bayr, dann erst Bäck, und AZ, A1, (nach Spaltenüberschrift "Ä") Ärzte. Darin Orte: Ursprung, Übersbach. Mit Abfolge wie a (mit aa, ... az), ä, b.
Schwedische Sortierung (Auszug)
- å kommt nach z
- ä kommt nach å
- ö kommt nach ä
- ü und y sind gleich
Finnische Sortierung (Auszug)
- å kommt nach z
- ä kommt nach å
- ö kommt nach ä
- ü und y sind gleich
Britische Sortierung (auch allgemeine Sortierung)
- ä kommt nach a
- ö kommt nach o
- ü kommt nach u
- ß kommt nach s
- Mc wird wie Mac behandelt
Andere Sortierungen
- Bei anderen Sprachen unterliegt die alphabetische Sortierung ebenfalls sprachabhängigen Zusatzregeln, die ihre Ursache in zusätzlichen Buchstaben oder speziellen Sonderregeln haben. So gibt es im Spanischen den Buchstaben Ch, der aber alphabetisch an anderer Stelle steht als ein C, was die Computeralgorithmen zur Sortierung vor Probleme stellt. Nach n folgt ñ. Noch kritischer wird die alphabetische Sortierung bei Sprachen wie Japanisch oder Chinesisch, die eine Vielzahl von Zeichen verwenden und deren Reihenfolge im Font (also deren Codierung) nicht der Reihenfolge einer dort üblichen Sortierung entspricht. Im Chinesischen ist zum Beispiel die Sortierung nach dem Pinyin-Äquivalent (in Computersystemen) oder nach einem System, welches sich nach dem Basissymbol und der Anzahl der Striche in Uhrzeigerrichtung richtet (in Wörterbüchern), üblich.
Beispiel
DIN 5007 Var.1
(Lexikon)DIN 5007 Var.2
(Telefonbuch)Österreichische
SortierungGöbel Göbel Goethe Goethe Goethe Goldmann Goldmann Götz Göbel Götz Goldmann Götz Computersysteme
Computersysteme codieren die gespeicherten Zeichenketten meist mittels des ASCII-, seltener noch des EBCDIC-Codes und ordnen die Zeichen (einschließlich Leerzeichen, Satz- und Sonderzeichen) nach dem zugeordneten Zahlenwert dieses Codes. Datenbankprogramme und Verlagsprogramme (zum Beispiel für Telefonbuchverlage) wenden aber mehr und mehr die richtige nationale Sortierung nach einer der traditionellen Normen an. Dabei gibt es Möglichkeiten, auf die Sortierreihenfolge durch individuelle Kodierung oder Parametrierung Einfluss zu nehmen. Als neuere Codierung erlangt Unicode eine immer weitere Verbreitung und Unterstützung.
Rückläufige Sortierung
Die rückläufige Sortierung ist eine alphabetische Sortierung, bei der die Wörter von hinten nach vorne gelesen werden. Bei der Erstellung von Rückläufigen Wörterbüchern wird in dieser Weise sortiert, sie kann auch in Reimlexika verwendet werden.
Geschichte
Marcus Verrius Flaccus (* um 10 v. Chr.) ordnete als Erster ein lateinisches Wörterbuch alphabetisch an. Die Suda aus der 2. Hälfte des 10. Jahrhunderts ist die erste alphabetisch angeordnete byzantinische Enzyklopädie.
Alphabetische Sortierung von Personennamen
Personennamen werden in Deutschland normalerweise (z.B. Telefonbuch) in der folgenden Art und Weise alphabetisch sortiert:
- Zuerst werden die Einträge nach Nachnamen sortiert, wobei akademische Grade wie „Prof.“, „Dr.“ und Namenszusätze „von“, „vor“, „am“, „zum“ weggelassen werden. Dabei ist zu beachten, dass Namenszusätze auch aus mehreren Wörtern bestehen können, wie etwa bei „von der Lippe“.
- Bei identischen Nachnamen wird anschließend nach eventuell vorhandenen Namenszusätzen alphabetisch sortiert, wobei Personennamen ohne Namenszusätze immer zuerst aufgeführt werden.
- Stimmen auch die Namenszusätze überein (oder sind keine vorhanden), wird als letztes anhand des Vornamens alphabetisch sortiert.
Die Sortierung von Personennamen ist in DIN 31638 geregelt.
Software (Auswahl), die eine alphabetische Sortierung ermöglicht
- OpenOffice.org Calc (Menübefehl: Daten - Sortieren...)
- PSPad (Menübefehl: Bearbeiten - Zeilensortierung)
Siehe auch
- Lemma (Lexikografie)
- Als Lemmastrecke bezeichnet man einen Ausschnitt einer alphabetisch sortierten Reihe, beispielsweise einen Band eines mehrbändigen Lexikons.
Weblinks
- Zur Ordnung und Codierung der Umlautbuchstaben in Bibliotheksdienst Heft 4, 98 (S. 724-735)
- Alphabetisierung auf Computer
Wikimedia Foundation.