- Leerzeichen
-
Das Leerzeichen (auch Wortzwischenraum, seltener Leerstelle oder sinngemäß Spatium, korrekte Bezeichnung laut Duden: Leerschritt, bes. schweiz. Leerschlag, engl. blank) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines zusammenhängenden Fließtextes. Man erhält ein Leerzeichen auf der Schreibmaschine und der Computertastatur durch Betätigen der Leertaste, der größten Taste unten auf der normalen Standardtastatur. Für einen guten Schriftsatz werden Leerzeichen unterschiedlicher Breite verwendet.
Inhaltsverzeichnis
Breite des Leerzeichens
Die übliche Breite des Leerzeichens und damit des Wortabstandes beträgt ein Viertelgeviert; das ist allerdings vom Schriftdesign abhängig.
Daneben gibt es auch ein schmales Leerzeichen, um für zusammengehörende Texteinheiten einen erkennbaren Unterschied gegen den normalen Wortabstand zu setzen (etwa in Abkürzungen wie »z. B.«, als Tausendertrenner oder zwischen Maßzahl und Maßeinheit).
Schreibmaschinenschriften waren überwiegend nichtproportional, also dicktengleich – das heißt jedes Zeichen besaß die gleiche Breite, auch das Leerzeichen. Bei solchen Monospace-Schriften können daher Leerzeichen auch zur Ausrichtung von Tabellen anstelle des Tabulators verwendet werden.
Entwicklung des Leerzeichens
In antiken Texten war eine Trennung der Wörter nicht üblich. Die dichte Anordnung des Textes zwang den Leser zur sorgfältigen und in den meisten Fällen lauten Lektüre. Erst im 7. Jahrhundert wurde die Wortteilung eingeführt. Die klaren Wortabstände erleichterten das schnelle Erkennen und Verstehen der Texte.
Johannes Gutenberg kannte nur einen richtigen Wortabstand. Den Randausgleich der Zeilen in seiner 42-zeiligen Bibel erzielte er mit Hilfe verschieden breiter Buchstaben. Der gute Wortabstand entsprach dem Innenraum des kleinen „n“. An ihm orientierten sich von nun an die guten Schriftsetzer.
Die Erfindung der Schreibmaschine brachte einen weiteren Wortabstand. Er entsprach der immer gleichen Buchstabenbreite und ließ das Gefühl für den richtigen Zwischenraum verschwinden.
Jan Tschichold, der Erneuerer der Typografie des 20. Jahrhunderts, griff die mittelalterliche Idee des guten Wortabstands wieder auf. Sein Biograf Werner Lemke berichtet, dass Tschichold kleine Florpapierstückchen in seiner Geldbörse aufbewahrte, um die Buchstaben- und Wortabstände ideal auszugleichen, wo die feinsten Spatien der Schriftsetzer nicht ausreichten.
Dementsprechend sollte bei Drucksachen auf den guten Wortabstand geachtet werden. Denn zu große Wortabstände erzeugen, wie der präraffaelitische Buchkünstler William Morris sagt: „Hässliche sich windende weiße Linien im Text“, die senkrecht oder schräg zu den Zeilen verlaufen. In der Sprache der Buchdrucker heißt dieser typografische Fehler „Gießbach“ oder „Gasse“. Gießbäche lassen das Auge aus dem Text irren und erschweren das Lesen.
Verwendung von Leerzeichen
Untersucht man deutsche Texte daraufhin, wie viele Buchstaben, Satz- und Wortzeichen sowie Leerzeichen sie enthalten, so stellt sich heraus, dass die Leerzeichen immer die größte Häufigkeit aufweisen, vor „e“ als dem häufigsten Buchstaben.[1]
Druckwesen
Leerzeichen sind zum einen notwendig, um eine Zeile zum Blocksatz zu strecken. Darüber hinaus werden sie in Abkürzungen wie z. B. verwendet. Auch die korrekte Schreibweise von Zahlen wird mit Hilfe der Leerzeichen erreicht (Bsp. 123 456 789). Der Wortzwischenraum entspricht bei den meisten Schriftarten etwa dem Raum, den ein schmales Schriftzeichen (Buchstabe oder Satzzeichen) einnehmen würde. Die Größe der Wortzwischenräume bleibt im Flattersatz konstant, während sie im Blocksatz variieren kann.
Zwei typische Fehler der Leerzeichensetzung haben eigenständige Namen bekommen:
- Plenk: überflüssiges Leerzeichen vor Satzzeichen
- „Deppenleerzeichen“ (Leerzeichen in Komposita): fehlerhaftes Leerzeichen innerhalb zusammengesetzter Substantive
Satzzeichen werden im Allgemeinen nie mit führendem, aber immer mit nachgestelltem Leeraum gesetzt, gewisse Stichzeichen (etwa Streckenstrich) auch mit führendem Leerraum, andere (Bindestrich) aber grundsätzlich ohne: Zeichensatz ohne Leerzeichen nennt man kompress.
Textverarbeitung, Webtypographie und Datenverarbeitung
In der modernen Textverarbeitung trifft klassische Typographie auf Webdesign, wodurch sich zusätzliche Komplikationen ergeben:
Leerzeichen gehören zum Whitespace und sind damit als Steuerzeichen zu werten: Sie beeinflussen im Allgemeinen in allen Belangen das Parsen beliebigen Codes, indem sie Codeblöcke abgrenzen. In diesem Sinne gilt das auch für die reine Schriftdarstellung: Die Wörter stellen für den am Computer allgemein üblichen automatischen Zeilenumbruch die einzeln zu lesenden Informationseinheiten dar. Daher sind Leerzeichen, sofern sie nicht dagegen geschützt sind, im Text immer Umbruchmarken. Neben den unterschiedlichen Breiten von Leerzeichen gibt es in der Webtypographie, wo es den automatischen Umbruch gibt, noch geschützte Leerzeichen, an deren Position am Zeilenende nicht umbrochen werden darf.
Teilweise werden von Textverarbeitungsprogrammen oder Betriebssystemen selbstständig passende oder unpassende Leerzeichen erkannt (Autokorrektur), so etwa Leerzeichen am Absatzanfang oder in Einzelworten (etwa führendes Leerzeichen in Dateinamen).
In vielen Programmiersprachen und Codierungen sind sie das Terminationszeichen der einzelnen Befehle – in anderen werden sie aber als Whitespace prinzipiell ignoriert: C zum Beispiel verwendet sie, Java nicht, HTML ignoriert sie (außer im Text), nicht aber der URI-Code, siehe unten.
Darstellung des Leerzeichens
Bleisatz
Im Bleisatz wurden Leerzeichen als Form des typografischen Weißraums in verschiedenen Breiten mit Hilfe des Ausschlusses (Blindmaterials, wie Gevierte, Spatien) erzeugt.
Desktop Publishing und Webtypographie
In der Darstellung der Datenverarbeitung ist das Leerzeichen im Allgemeinen ein Leerraum (Whitespace).
Für die Zwecke des Zeilenumbruchs gibt es zwei Typen von Leerzeichen:
- Umbrechendes Leerzeichen
- Geschütztes Leerzeichen, das einen automatischen Umbruch unterbindet
Schriftzeichen in ASCII und andere Kodierungen
Das Leerzeichen hat den ASCII-Code
32
, UnicodeU+0020
. Für bestimmte Zwecke gibt es besondere Leerzeichen, zum Beispiel das nicht-umbrechende oder geschützte Leerzeichen, in ISO 8859-1 mit dem Zeichencode 160, HTML-Entity
:Leerzeichen im Unicode Code Kein Umbruch HTML Name Codeblock Beispiel Beschreibung U+0020   Space Basic Latin ▕ ▏ Normales Leerzeichen, vergleichbar mit dem ASCII-Zeichen 0x20 U+00A0 ✓ No-Break Space Latin-1 Supplement ▕ ▏ Wie U+0020, aber die Zeile darf hier nicht umbrochen werden. U+1680   Ogham Space Mark Ogham ▕ ▏ Wird für Wortzwischenräume in Ogham-Texten benutzt. Benötigt eine Ogham-Schriftart. U+2002   En Space,
or NutGeneral Punctuation ▕ ▏ So breit wie ein en (halb so breit wie ein em) U+2003   Em Space,
or MuttonGeneral Punctuation ▕ ▏ So breit wie ein em U+2004   Three-Per-Em Space,
or Thick SpaceGeneral Punctuation ▕ ▏ So breit wie 1/3 des em U+2005   Four-Per-Em Space,
or Mid SpaceGeneral Punctuation ▕ ▏ So breit wie 1/4 des em U+2006   Six-Per-Em Space General Punctuation ▕ ▏ So breit wie 1/6 des em. In der computergestützten Typografie oft gleich mit U+2009. U+2007 ✓   Figure Space General Punctuation ▕ ▏ In Schriften mit Ziffern fester Breite entspricht Figure Space der Breite einer Ziffer. U+2008   Punctuation Space General Punctuation ▕ ▏ So breit wie ein enger, nach einem Interpunktionszeichen wie einem Komma folgender Abstand zum nächsten Zeichen. U+2009   Thin Space General Punctuation ▕ ▏ So breit wie 1/5 des em (manchmal auch gleich wie U+2006) U+200A   Hair Space General Punctuation ▕ ▏ Noch dünner als U+2009 U+200B ​ Zero-Width Space General Punctuation ▕▏ Kein Leerzeichen[2] und zählt auch nicht zu den Whitespace-Zeichen, sondern ist ein nicht sichtbarer Abstand. Wird für Computersysteme verwendet um Wortgrenzen anzuzeigen, wenn die Wörter nicht getrennt geschrieben werden. Daher zählt es nicht zu den Whitespace-Zeichen. Im Blocksatz können aber Leerräume zwischen den Wörtern entstehen. In HTML kann man dieses Zeichen als optionalen Umbruch in sehr langen Wörtern verwenden, vergleichbar mit dem veralteten Tag <wbr>. Das Zeichen wird aber nicht von allen Browsern unterstützt. U+202F ✓   Narrow No-Break Space General Punctuation ▕ ▏ Nicht umbrechend wie U+00A0 jedoch schmaler U+205F   Medium Mathematical Space General Punctuation ▕ ▏ Für mathematische Formeln U+2060 ✓ ⁠ Word Joiner General Punctuation ▕▏ Wie U+200B, und daher ebenfalls kein Whitespace-Zeichen, aber ohne Zeilenumbruch. Dieses Zeichen wurde in Unicode 3.2 eingeführt um die Funktion von U+FEFF als „Wortverbinder“ zu übernehmen. U+3000   Ideographic Space CJK Symbols and Punctuation ▕ ▏ So breit wie ein chinesisches, japanisches bzw. koreanisches Schriftzeichen. U+FEFF ✓  Zero Width No-Break Space
= Byte Order Mark (BOM)Arabic Presentation Forms-B ▕▏ Wird vorwiegend für die Darstellung der Byte Order Mark verwendet. Daher zählt es nicht zu den Whitespace-Zeichen. Die Verwendung als Leerzeichen mit Nullbreite ohne Umbruch wird seit Unicode 3.2 nicht mehr empfohlen. Siehe auch U+2060. Der Unicode-Block Symbole für Steuerzeichen definiert auch zwei visuelle Symbole, die Leerzeichen darstellen, selbst jedoch keine sind.
Code Zeichen Name Beschreibung U+2422 ␢ blank symbol Das kleine b mit Strich steht für blank (englisch für „Leerzeichen“). Es wurde in den 1960er Jahren von IBM eingeführt und wird nicht mehr verwendet. U+2423 ␣ open box Die offene Schachtel wird beispielsweise in Softwaredokumentation verwendet, um ein Leerzeichen grafisch darzustellen. Sie wird auch in den meisten Handytastaturen dafür verwendet. Darstellung in HTML und Verwandten
In HTML ist eine Einstellung des typographischen Weißraums durch Skalierung des Leerzeichens oder eine Spationierung, also Sperrung, möglich. Mehrfache aufeinander folgende Leerzeichen werden grundsätzlich zu einem Leerzeichen zusammengefasst, wenn dies nicht explizit verhindert wird. In HTML werden Zeilenumbrüche, falls nötig an Leerzeichen erzeugt, wenn dies nicht explizit verhindert wird.
Ein Umbruch eines nicht geschützten Leerzeichens kann in HTML 3.2 durch das Attribut
nowrap="nowrap"
unterdrückt werden.[3] In XHTML gibt es dieses Attribut nicht. Hier kann dieser Effekt aber mithilfe der CSS Eigenschaftwhite-space:nowrap
erzeugt werden.Abstände zwischen den Wörtern können mit der CSS Eigenschaft
word-spacing
reguliert werden.<div style="word-spacing:3em">Dieser Satz hat einen hohen Wortabstand.</div>
erzeugt:
Dieser Satz hat einen hohen Wortabstand.In HTML gibt es des Weiteren auch verschiedene Arten von Leerzeichen:
Name Unicode Kommentar  
Normales Leerzeichen. Mehrere aufeinander folgende werden zu einem Leerzeichen zusammengefasst.
 
Dieses Leerzeichen erzeugt bei einem Umbruch keine Trennung  
 
Leerzeichen in der Breite eines n  
 
Leerzeichen in der Breite eines m  
 
schmales Leerzeichen Codierung in TeX, LaTeX
Für die manuelle Einstellung der Abstände zwischen Zeichen stellt TeX bzw. LaTeX folgende Befehle zur Verfügung:
Darzustellender Zwischenraum Syntax Länge So sieht es gerendert aus 2 quad a\qquad b
2 quad 1 quad a\quad b
1 quad normaler Textabstand[4] a\ b
6/18 quad großer Zwischenraum a\;b
5/18 quad kleiner Zwischenraum a\,b
3/18 quad kein Zwischenraum ab
0 quad kleiner negativer Zwischenraum a\!b
−3/18 quad Dabei stehen der große Zwischenraum
a\;b
und der kleine negative Zwischenrauma\!b
nur im Mathematikmodus, nicht aber im Textmodus zur Verfügung. Dort muss das Leerzeichen mittels des horizontalen Abstands (z. B.a\hspace{-1pt}b
) angegeben werden.Die Länge 1 quad (auch em genannt) wird im Deutschen mit Geviert bezeichnet.
Leerzeichen in 8.3-Dateinamen
Im FAT-Dateisystem sind Leerzeichen in Dateinamen eigentlich nicht zulässig, werden aber von mancher Software geschrieben und akzeptiert (Beispiel OS/2 auf FAT-Volumes: EA DATA. SF. Dieser Dateiname für die Erweiterten Attribute eines Volumes erfüllt zwar die 8.3-Längenkonvention, enthält aber Leerzeichen, um die Datei vor Zugriffen und Veränderungen zu schützen. Mit moderneren Texteditoren wie Edit.com seit MS-DOS-Version 7.0 sind auch solche Dateinamen lesbar und die Dateien folglich bearbeitbar.). Dateinamen kürzer als acht Buchstaben (und Dateinamenserweiterungen kürzer als drei Buchstaben) werden in den Verzeichniseinträgen von links nach rechts mit Leerzeichen aufgefüllt, welche aber nicht zum Dateinamen gehören.
Im ISO-9660-Dateisystem können Leerzeichen in Dateinamen durch Unterstriche („_“) ersetzt werden.
Leerzeichen in URIs
Da ein Leerzeichen auch in URIs als Sonderzeichen zählt (Ende der URL), werden darin vorhandene Leerzeichen umkodiert, wie auch beispielsweise deutsche Umlaute und eckige oder geschweifte Klammern. Die Kodierung besteht aus dem Zeichen % und dem Zeichencode in zwei Hexadezimal-Ziffern (bei Multibytezeichen entsprechend für jedes Byte), für das Leerzeichen wäre das (gemäß ISO 8859-1)
%20
.In der älteren Codierung application/x-www-form-urlencoded wird ein Leerzeichen durch ein „+“ ersetzt.
Siehe auch
Weblinks
Wiktionary: Leerzeichen – Bedeutungserklärungen, Wortherkunft, Synonyme, ÜbersetzungenEinzelnachweise
- ↑ Karl-Heinz Best: Zur Häufigkeit von Buchstaben, Leerzeichen und anderen Schriftzeichen in deutschen Texten. In: Glottometrics 11, 2005, S. 9–31. Der Beitrag enthält Angaben zur Häufigkeit von Leerzeichen in 5 deutschsprachigen Texten, darunter 4 literarische Texte und ein längerer Pressetext.
- ↑ Unicode Technical Note #27
- ↑ Suchanfrage nowrap. SELFHTML Referenz für HTML, XHTML, CSS, XML/DTD und anderes
- ↑ typischer Wert, vgl. TeXbook, S. 433
Wikimedia Foundation.