- Internationalisierung (Softwareentwicklung)
-
Internationalisierung bedeutet in der Informatik beziehungsweise in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann.
Internationalisierung (englisch internationalisation) wird gerne mit I18N abgekürzt (im englischen Wort befinden sich 18 Buchstaben zwischen I und N).
Hierunter fallen diejenigen Aufgaben, die der Entwickler/Programmierer eines Programms bewältigen muss. Dazu darf er zum Beispiel Beschreibungstexte nicht im Quellcode fest codieren, sondern muss Variablen benutzen, die von einer Quelle zur Laufzeit eingelesen werden. Aber auch Datumsformatierungen und die sprachabhängige Oberflächengestaltung (Text kann unterschiedlich lang sein, Rechts-Nach-Links-Orientierung, …) gehören hierzu.
Im nächsten Schritt erfolgt die Lokalisierung (englisch localisation), die als L10N abgekürzt wird (10 Buchstaben zwischen L und N). Ein Programm sollte im vorigen Schritt so gestaltet sein, dass diese Änderungen nicht mehr vom Programmierer durchgeführt werden müssen. Dieser Prozess bezeichnet die reine Übersetzung von zum Beispiel Texten in eine Landessprache.
→ Hauptartikel Lokalisierung (Softwareentwicklung)
Inhaltsverzeichnis
Umfang einer Internationalisierung und Lokalisierung (Auswahl)
- Sprache
- Übersetzungen: Textdaten sind in externen Dateien abgelegt und werden dynamisch geladen. Übersetzungen können neben Texten auch Sprachausgaben und Texte innerhalb von grafischen Elementen wie Bilder und Videos (Untertitel in Filmen) betreffen.
- Grafische Darstellung: Die Programmlogik ist von der Benutzungsoberfläche und Ausgabemedien wie Drucker unabhängig.
- Texte
- Unicode: Im Gegensatz zu den früher verwendeten Zeichensätzen wie ASCII oder EBCDIC, verwenden moderne Systeme den Unicode Datensatz. Probleme der Zeichenkodierung werden durch einen wesentlich größeren Zeichenvorrat gelöst. Dadurch können Zeichen aus unterschiedlichen Schriften im selben System angeboten werden.
- Bidirektionale Texte: Je nach Schrift müssen unterschiedliche Schreibrichtungen verwendet werden.
- Schrift: Einige Sprachen können in verschiedenen Schreibvarianten existieren, wie z.B. Serbisch mit kyrillischer Schrift und Serbisch mit lateinischer Schrift.
- Textverarbeitung: Konzepte wie die Groß-/Kleinschreibung sind nicht in jeder Schrift bekannt. Für die Texttrennung etwa zum Umbrechen einer Zeile gelten unterschiedliche Regeln.
- Eingabemethoden: Ermöglichen der Eingabe von Tastaturkürzeln mit beliebigen Tastaturlayouts.
- Sortierung: Nationale Sonderzeichen, wie etwa die Umlaute in der deutschen Sprache, müssen nach nationalen Regeln einsortiert werden. Dabei kann es auch thematische Unterscheidungen geben, die dazu führen, dass etwa für Telefonbücher eine spezielle Sortierung erwartet wird.
- Suche: Bei textueller Suche müssen manche Zeichen auf sinngemäß äquivalente Formen abgebildet werden. Die Texte „¼“ und „1/4“ sind zwar unterschiedlich kodiert, die Bedeutung ist jedoch identisch. Die Transformation der Texte wird auch Normalisierung genannt.
- Transformation: Texte können in eine andere Schrift überführt werden, um entweder einen anderen Zeichensatz zu unterstützen, oder um die Lesbarkeit zu erhöhen. Man unterscheidet zwischen Transliteration (der buchstabengetreuen Transformation) und Transkription (der Transformation gemäß der Lautschrift).
- Textformatierung
- Datumsformate und die verschiedenen Kalendersysteme: Softwareprodukte rechnen meistens mit Zeiten des gregorianischen Kalenders, doch für die Anzeige kann eine Formatierung in die regional üblichen Formate und Zeitrechnungen angeboten werden.
- Zeitformate: Unterschieden wird z.B. zwischen der 24-Stunden-Zählung und der 12-Stunden-Zählung, bei der explizit Vormittag (a.m.) und Nachmittag (p.m.) angegeben wird.
- Zahlenformate: Unterschiedliche Dezimal- und Tausendertrennzeichen, sowie unterschiedliche Währungen, Gewichte und Maße.
- Zeitzonen: Ähnlich zur Datumsproblematik, muss eine Software einerseits mit allen unterschiedlichen Zeiten einheitlich rechnen, andererseits jedem Benutzer die Zeit in der angemessenen Formatierung und umgerechnet auf die entsprechende Zeitzone anzeigen.
- Kultur
- Locale: Um die Kultur zu definieren, auf die sich die Software anpassen soll, wird von der Software meist eine Locale verwendet. Diese enthält die Informationen über die Sprache, das Land und ggf. weitere regionale Eigenschaften, wie die zu verwendende Schrift.
- Bilder und Farben: Probleme bei der Verständlichkeit und kulturellen Angemessenheit
- Namen und Titel
- vom Staat vergebene Nummern wie Passnummern oder die Sozialversicherungsnummer (englisch Social Security number) in den Vereinigten Staaten, die „National Insurance number“ im Vereinigten Königreich oder die „Isikukood“ in Estland
- Telefonnummern, Adressen und internationale Postleitzahlen
- Papierabmessungen
Unterschied zwischen Internationalisierung und Lokalisierung
Der Unterschied zwischen Internationalisierung und Lokalisierung ist subtil aber wichtig. Internationalisierung ist die Anpassung eines Produkts, damit es theoretisch überall eingesetzt werden kann. Lokalisierung ist das Hinzufügen spezieller Eigenschaften für die Anwendung in einem bestimmten geographisch oder ethnisch umschriebenen Absatz- oder Nutzungsgebiet (Land, Region oder ethnische Gruppe). Internationalisierung wird pro Produkt einmal durchgeführt. Lokalisierung wird dann ein Mal für jede Kombination von Produkt und Nutzungsgebiet durchgeführt. Die Prozesse ergänzen einander und müssen kombiniert werden, um ein System zu erhalten, das global funktioniert.
Geschäftsprozess der Internationalisierung von Software
Um ein Produkt zu internationalisieren, müssen die verschiedenen Märkte betrachtet werden, in die das Produkt voraussichtlich eingebracht werden soll. Details wie Feldlängen von Adressen, optionale Felder für Postleitzahlen und die Einführung neuer Registrierungsprozesse, um die lokalen Rechtssituationen zu bedienen sind Beispiele dafür, wie komplex das Projekt einer Internationalisierung sein kann.
Ein umfassender Ansatz geht bis zu kulturellen Faktoren wie die Anpassung von Geschäftsprozesslogik oder die Berücksichtigung individueller kultureller Verhaltensaspekte.[1].
Programmierpraxis
Die 2009 vorherrschende Praxis für Anwendungen ist es, die Texte in Hilfszeichenketten (englisch resource strings) auszulagern, die während der Programmausführung bei Bedarf geladen werden. Die Zeichenketten werden in Hilfsdateien gespeichert und sind verhältnismäßig einfach zu übersetzen. Programme werden oft so gebaut, dass sie je nach gesetztem Vertriebsgebiet auf Hilfsbibliotheken zugreifen. Eine Programmbibliothek, die das unterstützt, ist GNU gettext.
Schwierigkeiten
Während das Übersetzen existierenden Textes in eine andere Sprache einfach erscheint, ist es weitaus schwieriger, gleichzeitig Sprachversionen von Texten während des Produktlebenszyklus zu verwalten. Wenn eine Nachricht, die dem Benutzer angezeigt wird, verändert wird, müssen alle übersetzten Versionen auch geändert werden. Das verlängert den Entwicklungszyklus.
Viele Lokalisierungsaufgaben (Schreibrichtung, Textsortierung, usw.) verlangen eine tiefgreifendere Änderung der Software als nur die reine Übersetzung. OpenOffice.org löst das beispielsweise mit Kompilierungsverzweigung (englisch compilation switches).
Häufig entstehen Probleme auch aus den syntaktischen Eigenheiten der verschiedenen Sprachen. Die Anzeige von „ZAHL files were found“ lässt sich nicht etwa mit einer einteiligen Übersetzung für „files were found“ umsetzen, da dieser Satz in anderen Sprachen, etwa im Deutschen, in zwei Teile zerfällt, die durch die Zahl getrennt angezeigt werden müssen: „Es wurden ZAHL Dateien gefunden“. Daher muss die internationalisierte Version des Programms Text vor und hinter der Zahl ermöglichen, wobei der Text vor der Zahl in der englischen Lokalisation leer wäre, während er in der deutschen „Es wurden “ enthalten müsste. Auch eine unterschiedliche Länge der Texte kann in der Anzeige zu unerwünschten Ergebnissen führen (abgeschnittener Text, unerwünschte Zeilenumbrüche).
Ab einem bestimmten Grad an Komplexität (zum Beispiel für die Qualitätssicherung) braucht das Entwicklungsteam jemanden, der andere Sprachen und Kulturen versteht und einen technischen Hintergrund hat.
Kosten-Nutzen-Analyse
In einer kommerziellen Umgebung ist der Vorteil der Lokalisierung der Zugang zu mehr Märkten. Es gibt die Auffassung, dass die Lokalisierung eines Produktes in verschiedene Sprachen beziehungsweise Kulturen selbstverständlich ist. Alles was nötig sei, sei die Bestätigung der Höhe der Kosten. Es kostet mehr, Produkte für internationale Märkte zu produzieren, aber in einer immer globaleren Ökonomie ist die Unterstützung nur einer Sprache beziehungsweise nur eines Marktes kaum eine Option. Jedoch ist die Lokalisierung selbstentwickelter Software von ökonomischen Unwägbarkeiten beeinflusst und entbehrt zumeist der Möglichkeit, dass Endbenutzer und Freiwillige die Lokalisierung vornehmen können, wie es in Open Source-Umgebungen üblich ist. Da Open Source-Software im Allgemeinen frei verändert und weiterverbreitet werden kann, ist sie zugänglicher für eine Internationalisierung. Das K Desktop Environment-Projekt ist zum Beispiel in 100 Sprachen übersetzt worden.[2]
Weblinks
- W3C-Spezifikationen
- I18N Linksammlung – Links aus Entwicklersicht.
- Debian I18N Introduction – Einführung zum Thema Internationalisierung von Software (englisch).
- The Localization Tool – Blog mit Tipps und Tricks für Einsteiger in die Lokalisierung von Software (englisch).
Siehe auch
- Lokalisierung
- CJK
- Complex Text Layout (CTL)
- Bidirektionaler Text (BiDi)
- ISO 8601
- National Language Support (NLS)
- International Components for Unicode (ICU)
Fußnoten
- ↑ J.M. Pawlowski: Culture Profiles: Facilitating Global Learning and Knowledge Sharing. Proc. of ICCE 2008, Taiwan, Nov. 2008. (englisch) (PDF). Abgerufen am 21. Oktober 2009.
- ↑ Die aktuelle Liste der KDE-Lokalisierungen (englisch). Abgerufen am 24. Oktober 2009.
- Sprache
Wikimedia Foundation.