Zeilenumbruch

Zeilenumbruch

Der Begriff Zeilenumbruch stammt aus dem Schriftsatz und gibt an, an welcher Stelle ein Text von einer Zeile in die nächste übergehen soll.

Inhaltsverzeichnis

Allgemeines

Auf einer Schreibmaschine wird der Zeilenumbruch explizit durch Betätigen einer Taste oder eines Hebels durchgeführt. Dabei werden zwei Funktionen ausgeführt:

  • Wagenrücklauf – Positionierung der Schreibstelle zum Zeilenanfang (ganz links).
  • Zeilenvorschub – Positionierung der Schreibstelle um eine Zeile nach unten

Bei der Einführung der Fernschreiber wurden verschiedene Steuerzeichen (Codierungen elektrischer Signale) eingeführt, um die Zeilenumbruchfunktion einer Schreibmaschine darzustellen. Diese sind dann auch, durch ihre Verwendung als erste Ausgabegeräte des Computerwesens, vom Fernmeldewesen in die elektronische Datenverarbeitung übernommen worden.

Reine Textdateien auf dem Computer ähneln in ihrer Darstellung am Bildschirm anfangs einem auf einer Schreibmaschine geschriebenen Text, die Steuerzeichen sind für den Benutzer im Allgemeinen unsichtbar. Mit dem Scrollbalken geht der Zusammenhang zwischen Bildschirmbreite und Zeilenlänge verloren, mit den Proportionalschriften der zwischen Zeichenanzahl und Zeilenlänge. Ausführliche Funktionen haben die Zeichen für den Zeilenumbruch dann erst in der Textauszeichnung (Rich Text Format und ähnliches) bekommen.

Weil die Steuerzeichen noch in den Anfangsphasen der Computertechnik spezifiziert wurden, sind sie mit ihrer Funktionsänderung bis heute eine der großen Inkompatibilitäten zwischen verschiedenen Betriebssystem- und Anwendungssoftwaresystemen.

Textverarbeitung: Neuer Absatz, Neue Zeile, harter und weicher Zeilenumbruch

Unterschieden wird in der Textformatierung der Textverarbeitungssysteme zwischen einem Absatzwechsel und einem Zeilenwechsel, sowie zwischen hartem (manuellem) und weichem (automatischem) Zeilenumbruch. Die nachfolgend genannten Eingabemethoden und Steuerzeichen entsprechen den Konventionen verbreiteter Textverarbeitungsprogramme; abweichende Bedienung und Darstellung je nach System sind jedoch möglich.

  1. Ein Absatzwechsel (Neuer Absatz) wird auch heute noch von vielen Anwendern als Zeilenumbruch verwendet. Die Eingabe erfolgt mit der Taste Enter/, zur Bildschirmdarstellung des Steuerzeichens wird häufig «» (Absatzmarke, Pilcrow) verwendet. Die Verwendung dieser Taste wie bei einer klassischen Schreibmaschine übersieht jedoch das Konzept aktueller Textverarbeitungssysteme: Diese können vor oder nach Absätzen automatisch Leerraum einfügen, neue Formatierungsvorlagen verwenden u.a.m. (rich text). Lediglich in Systemen ohne diese Fähigkeiten (reine Texteditoren, plaintext) sollte die Eingabetaste zum einfachen Abschluss einer Zeile verwendet werden. HTML-Steuerzeichen für Anfang und (optional) Ende eines Absatzes sind <p> und </p> für paragraph.
  2. Ein einfacher Zeilenumbruch (Neue Zeile) dient dazu, eine neue Zeile zu beginnen, ohne die aktuelle Absatzformatierung zu unterbrechen, oder um Zeilenumbrüche in Tabellen zu erzeugen, wo eine Zelle durch die Absatzmarke abgeschlossen wird. Das Steuerzeichen ist «↵», die Eingabe erfolgt je nach System mit ⇧ Shift+↵ Enter oder Strg+↵ Enter. Er wird ebenfalls in der Datei gespeichert. HTML-Steuerzeichen ist <br> für line break.
  3. Ein harter Zeilenumbruch (engl. hard break) wird – soweit die Software Texte noch als Zeichenstrom abspeichert – am Ende der Vorzeile bzw. des vorigen Absatzes als Steuerzeichen „hart“ in die bearbeitete Datei geschrieben.
  4. Ein weicher Zeilenumbruch (Automatischer Zeilenumbruch, englisch soft break) wird dagegen automatisch erzeugt und nicht in die Datei eingefügt. Die Software kann beim Überschreiten einer bestimmten Zeilenlänge, insbesondere aber der Fensterbreite das aktuelle Wort automatisch an den Anfang einer neuen Zeile platzieren (Word Wrap), damit der Text komplett angezeigt werden kann, ohne dass der Benutzer horizontal scrollen muss. Der weiche Zeilenumbruch wird – je nach System – nicht in der Datei gespeichert. Hierdurch wird der Benutzer von der Notwendigkeit, die Zeilen komplett manuell umzubrechen, befreit. Viele moderne Texteditoren besitzen eine automatische Zeilenumbruchsfunktion (dadurch wird vermieden, dass er den gesamten Absatz neu umbrechen muss, wenn er nur ein Wort zusätzlich einfügt), in der Webtypographie (HTML-Dokumente) ist sie standardmäßig voreingestellt.
  5. Viele Programme bieten die Möglichkeit, geschützte Leerzeichen oder fakultative Trennstriche einzugeben, an denen ein automatischer Umbruch nicht durchgeführt werden darf, oder eine Worttrennung bevorzugt durchgeführt werden soll (weiches Trennzeichen), wenn z. B. ein Wort im eingebauten Wörterbuch fehlt. In HTML existieren hierzu Formatierungsanweisungen (wie etwa <pre>) oder die Anweisung kein automatischer Zeilenumbruch in der Absatzformatierung (mit dem HTML-Tag <nobr>).

Weitere Umbruchsituationen der Zeile ergeben sich sowohl im Seitenwechsel (Ganzseitenumbruch) als auch im Spaltensatz (Spaltenumbruch).

Im Druckwesen wird das Umbrechen der Zeilen, einschließlich Spalten und Seiten und um Bildelemente, Graphiken und ähnliches Mettage genannt. In der elektronischen Datenverarbeitung übernimmt das die Textverarbeitungssoftware: Je leistungsfähiger sie ist, desto schöner und lesbarer ist das Umbruchsbild.

Codierung des Zeilenumbruchs

ASCII

Bei der Entwicklung des ASCII-Zeichensatzes wurden daher zwei Zeichen reserviert:

  • Das Steuerzeichen für den Zeilenvorschub (englisch line feed, kurz LF) ist als ASCII-Zeichen 10 (hexadezimal 0A) kodiert. Manche Systeme erlauben es, das LF-Zeichen mit der Tastenkombination Strg + J einzugeben.
  • Das Steuerzeichen für den Wagenrücklauf (englisch carriage return, kurz CR) ist als ASCII-Zeichen 13 (hexadezimal 0D) kodiert. Manche Systeme erlauben es, das CR-Zeichen mit der Tastenkombination Strg + M einzugeben.

Es existieren verschiedene Standards, um den Zeilenumbruch in einer Textdatei explizit zu kodieren:

Betriebssystem Zeichensatz Abkürzung Code Hex Code Dezimal Escape-Sequenz
Unix, Linux, Mac OS X, AmigaOS, BSD, weitere ASCII LF 0A 10 \n
Windows, DOS, OS/2, CP/M, TOS (Atari) CR LF 0D 0A 13 10 \r\n
Mac OS bis Version 9, Apple II CR 0D 13 \r
AIX OS & OS/390 EBCDIC NEL 15 21

Auf IBM-Großrechnern ist der Zeilenumbruch in den Dateien kein Steuerzeichen. Vielmehr wird die Zeilenlänge im DCB (Recordformat F oder FB) beziehungsweise in einem Längenfeld am Zeilenanfang (Recordformat V oder VB) gespeichert.

Um Dateien zwischen dem Windows- und dem Unix-Format zu konvertieren, existiert unter anderem das Kommandozeilenprogramm dos2unix (bzw. unix2dos).

Unicode: weitere Zeichen, die Zeilenumbruch markieren

Für Unicode-Texte fordert der Unicode-Standard von Software, die Unicode-konform sein will, dass neben den oben genannten und in Unicode-konformen Zeichenfolgen CR, LF und CRLF folgende weitere Zeichen als Zeilenumbrüche erkannt werden:

Abkürzung englische Bezeichnung deutsche Bezeichnung Codepoint
FF Form Feed Seitenvorschub (mit zwangsläufigem Umbruch der Zeile) U+000C
NEL New Line Neue Zeile U+0085
LS Line Separator Zeilentrenner U+2028
PS Paragraph Separator Absatztrenner U+2029

Programmierung: Codierung des Umbruchs

Durch die verschiedenen Konventionen zum Kodieren der Formen des Zeilenumbruchs auf Computersystemen, die bei der Übernahme der Fernschreib/Schreibmaschinen-Konventionen in die elektronische Textverarbeitung entstanden, treten beim Austausch zwischen unterschiedlichen Systemen Probleme auf.

Bekanntes Beispiel ist die Funktion printf() bzw. fprintf() aus der Standard C Library zum Schreiben in Dateien. Die Escape-Sequenz \n (LF) steht in C für einen Zeilenumbruch. Beim Schreiben in Dateien wird in C zwischen Textmodus und Binärmodus unterschieden. Bei im Textmodus geöffneten Dateien erfolgt eine Übersetzung von \n in die auf dem jeweiligen System üblichen Steuerzeichen für den Zeilenumbruch. Somit erfolgt in unixartigen Betriebssystem keine Umsetzung, da dort LF bereits für den Zeilenumbruch steht. Dagegen findet unter Windows eine Substitution durch CR LF statt. Die resultierenden Dateien sind folglich nicht identisch. Ist die Datei im Binärmodus geöffnet, erfolgt keine Übersetzung, sondern es wird stets ein LF in die Datei geschrieben.

Bei Java stehen die Escapesequenzen \n und \r zur Verfügung; eine Umwandlung erfolgt nicht, stattdessen können mittels gesonderter Funktionen die plattformabhängigen Zeichen für den Zeilenumbruch eingefügt werden. Beim Einlesen ist die Java-Bibliothek tolerant und akzeptiert sowohl CR, LF als auch CR+LF als Zeilenende.[1] Auch andere Programmiersprachen wie Visual Basic oder Perl stellen ähnliche Funktionalitäten zur Verfügung, um Textdateien korrekt zu verarbeiten.

Zahlreiche Netzwerkprotokolle zur Übertragung von Text, z. B. HTTP, SMTP oder FTP, definieren die Sequenz CR+LF für einen Zeilenumbruch. Einige Programme, z. B. Mail Transfer Agents, sind strikt und verweigern sogar die Verarbeitung von Daten mit alleinstehenden LFs ("Bare LF").[2] Andere Protokolle empfehlen jedoch, auch ein einzelnes LF als (ggf. weichen) Umbruch zu interpretieren.

Kennzeichnung nicht angegebener oder unerwünschter Zeilenumbrüche

Ein typographischer Umbruch, der unterdrückt wird, wird etwa in Poesiezitaten bei Zeilenzitation verwendet:

„Ich saz ûf eime steine / und dahte bein mit beine, / dar ûf satzt ich den ellenbogen; […]“ (Walther von der Vogelweide).

Damit werden etwa die Reime markiert, deutlichere Absätze wie Strophen kann man dann mit «//» setzen.

Umgekehrt kann es in der elektronischen Textverarbeitung notwendig sein, einen entstehenden Zeilumbruch als unerwünscht zu markieren. Das entsteht in Programmiersprachen, in denen der Umbruch ein Steuerzeichen ist, aber etwa auch bei der Angabe von URLs (Webadressen). Hier verwendet man etwa «_» (underline), «\» (backslash), je nachdem, was im jeweiligen Format nicht als Steuerzeichen anderweitig besetzt ist, oder auch das Zeichen wie «↩» (U+21A9):

Entwicklung des Wikipediaartikels Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch von der Erstversion 4. März 2004, 20:43:20 bis 5. März 2010 23:35:07 Uhr:
http://de.wikipedia.org/w/index.php?title=Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch&
       action=historysubmit&diff=71501259&oldid=749449

Das Zeichen «↩» ist hier eine printtypographische Anweisung „Umbruch ignorieren“ – bei Copy and paste der Textstelle etwa in die Adresszeile eines Browsers wird der Teil nach dem Zeilenumbruch von manchen Programmen ignoriert, andere fügen den Weblink wieder zusammen, dann müsste das Zeichen «↩» manuell entfernt werden − im rein elektronischen Medium ist das Zeichen eher störend.

Beim Korrekturlesen im Druckwesen verwendet man die Korrekturzeichen «Korrekturzeichen Absatz.svg» für fehlenden, und «Korrekturzeichen Absatz anhängen.svg» für unerwünschten Absatz (‚Zeilenumbruch einfügen‘, bzw. ‚Zeilenumbruch entfernen‘, also ‚Absatz anhängen‘):[3]

Korrekturlesen - Absatz.svg

Siehe auch

Weblinks

Einzelnachweise

  1. Java-Dokumentation: java.io.BufferedReader
  2. Bare LFs in SMTP
  3. Korrekturzeichen. mediaforum.ch

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Zeilenumbruch —   [engl. word wrapping], eine Stelle im Text, an der eine Zeile endet und eine neue Zeile begonnen wird (Umbruch). Durch Silbentrennung und Absatzformate wie »Blocksatz« kann der Zeilenumbruch so beeinflusst werden, dass ein gleichmäßiges oder… …   Universal-Lexikon

  • Automatischer Zeilenumbruch — ist eine softwareseitige Funktion, den Zeilenfall digitaler Texte entsprechend der Darstellung zu präsentieren und dazu eine einheitliche Zeilenlänge annähernd einzuhalten. Er wird zum Beispiel über den HTML Tag <br> generiert. Ein harter… …   Deutsch Wikipedia

  • Liste der Konzentrationslager des Deutschen Reichs — Die Liste der Konzentrationslager des Deutschen Reichs während der Zeit des Nationalsozialismus, beinhaltet auch Jugend Haftstätten, Vernichtungslager, Durchgangslager und sonstige KZ ähnliche Lager. Nicht aufgezählt sind die wenigen Lager aus… …   Deutsch Wikipedia

  • Liste der KZs — Diese Liste beinhaltet deutsche Konzentrationslager aus der Zeit des Nationalsozialismus, Jugend KZs, Vernichtungslager, Durchgangslager und sonstige KZ ähnliche Lager, nicht aufgezählt sind die wenigen Lager aus der Kolonialzeit. Die Auflistung… …   Deutsch Wikipedia

  • Liste der deutschen Konzentrationslager — Diese Liste beinhaltet deutsche Konzentrationslager aus der Zeit des Nationalsozialismus, Jugend KZs, Vernichtungslager, Durchgangslager und sonstige KZ ähnliche Lager, nicht aufgezählt sind die wenigen Lager aus der Kolonialzeit. Die Auflistung… …   Deutsch Wikipedia

  • Liste der reichsdeutschen Konzentrationslager — Diese Liste beinhaltet deutsche Konzentrationslager aus der Zeit des Nationalsozialismus, Jugend KZs, Vernichtungslager, Durchgangslager und sonstige KZ ähnliche Lager, nicht aufgezählt sind die wenigen Lager aus der Kolonialzeit. Die Auflistung… …   Deutsch Wikipedia

  • Liste deutscher Konzentrationslager — Diese Liste beinhaltet deutsche Konzentrationslager aus der Zeit des Nationalsozialismus, Jugend KZs, Vernichtungslager, Durchgangslager und sonstige KZ ähnliche Lager, nicht aufgezählt sind die wenigen Lager aus der Kolonialzeit. Die Auflistung… …   Deutsch Wikipedia

  • RegEx — In der Informatik ist ein Regulärer Ausdruck (engl. regular expression, Abk. RegExp oder Regex) eine Zeichenkette, die der Beschreibung von Mengen beziehungsweise Untermengen von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln dient.… …   Deutsch Wikipedia

  • RegExp — In der Informatik ist ein Regulärer Ausdruck (engl. regular expression, Abk. RegExp oder Regex) eine Zeichenkette, die der Beschreibung von Mengen beziehungsweise Untermengen von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln dient.… …   Deutsch Wikipedia

  • Regex — In der Informatik ist ein Regulärer Ausdruck (engl. regular expression, Abk. RegExp oder Regex) eine Zeichenkette, die der Beschreibung von Mengen beziehungsweise Untermengen von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln dient.… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”