Internationalizing Domain Names in Applications

Internationalizing Domain Names in Applications

IDNA (Internationalizing Domain Names in Applications) ist ein Internetstandard, um Domains, die Nicht-ASCII-Zeichen enthalten, als gültige ASCII-Strings im Domain Name System abzubilden. Einen solchen Domainnamen bezeichnet man als IDN (Internationalized Domain Name), im deutschen Sprachraum trivial auch Umlautdomain.

Inhaltsverzeichnis

Technik

Unicode-Domains werden mittels der Verfahren Nameprep und Punycode zu ASCII-Strings umgewandelt, welche als ACE-Strings (ASCII Compatible Encoding) bezeichnet werden. Die Umwandlung erfolgt beim Client (z. B. dem Browser oder Mailprogramm), sodass die Server-Infrastruktur nicht verändert werden muss. Statt der Unicode-Strings kann der Benutzer im Client auch direkt die ACE-Strings eingeben. So können auch Clients ohne IDN-Fähigkeit mit internationalen Domains arbeiten, sofern der Benutzer den ACE-String kennt. Da dies jedoch umständlich ist, wird es nur empfohlen, wenn die Software nicht IDN-tauglich ist.

Grundsätzlich sind alle Unicode-Zeichen in IDNs zulässig. Das „ß“ wurde als identisch mit „ss“ deklariert und bei der Normalisierung in ss umgewandelt, sodass zum Beispiel „Pleiße“ identisch war mit „Pleisse“. Ab dem 16. November 2010 (für Inhaber einer Domain mit ss schon vorher) ist es aber nach der geänderten Norm IDNA-bis möglich, separate Domains mit ß zu registrieren, und die Abbildung auf ss ist aufgehoben.[1]

Jede Vergabestelle für Domains regelt separat, welche Zeichen sie für die von ihr vergebenen (Sub-)Domains erlaubt. Seit dem 1. März 2004 können neben den 37 gebräuchlichen Zeichen (26 Buchstaben des lateinischen Alphabets, 10 Ziffern und der Bindestrich) für deutsche (.de) Second-Level-Domains 92 und für Schweizer (.ch) und liechtensteinische (.li) Domains 31 weitere Zeichen benutzt werden. Seit dem 31. März 2004 sind für österreichische Domains (.at) 34 weitere Zeichen erlaubt. Afilias, zuständig für .info-Domains, lässt nur die Zeichen ä, ö und ü zu.

Verarbeitung des Unicode-Strings

Zunächst wird eine Unicode-Domain durch Nameprep normalisiert, das heißt Großbuchstaben werden zu Kleinbuchstaben und als äquivalent definierte Zeichen werden in die Normalform (ASCII) umgewandelt. In der alten Version von IDNA war ß zu ss äquivalent, es wurde also aus StRAße strasse.

Im Anschluss an die Normalisierung werden mittels Punycode die Nicht-ASCII-Buchstaben aus dem Namen entfernt und am Ende des Namens ein daraus abgeleiteter ASCII-String hinzugefügt, in dem die Position und Art des Unicode-Zeichens kodiert ist. Um einen IDN- von einem ASCII-Domainnamen zu unterscheiden, beginnt der Punycode-String mit dem Präfix xn--. Die ungewöhnliche Zeichenfolge xn-- wurde gewählt, weil sie in realen Wörtern oder Eigennamen praktisch nicht vorkommt und Konflikte mit ASCII-Domains daher äußerst unwahrscheinlich sind.

Zeichensätze

Nachfolgend wird für einige Top-Level-Domains aufgelistet, welche Nicht-ASCII-Zeichen in den jeweiligen IDN-Domains erlaubt sind:

.de-Domains[2]

á à ă â å ä ã ą ā æ ć ĉ č ċ ç ď đ é è ĕ ê ě ë ė ę ē ğ ĝ ġ ģ ĥ ħ í ì ĭ î ï ĩ į ī ı ĵ ķ ĺ ľ ļ ł ń ň ñ ņ ŋ ó ò ŏ ô ö ő õ ø ō œ ĸ ŕ ř ŗ ś ŝ š ş ß[1] ť ţ ŧ ú ù ŭ û ů ü ű ũ ų ū ŵ ý ŷ ÿ ź ž ż ð þ

.eu-Domains[3]

à á â ã ä å æ ç è é ê ë ì í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ ā ă ą ć ĉ ċ č ď đ ē ĕ ė ę ě ĝ ğ ġ ģ ĥ ħ ĩ ī ĭ į ı ĵ ķ ĺ ļ ľ ŀ ł ń ņ ň ʼn ŋ ō ŏ ő œ ŕ ŗ ř ś ŝ š ť ŧ ũ ū ŭ ů ų ŵ ŷ ź ż ž ș ț ΐ ά έ ή ί ΰ α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ ς σ τ υ φ χ ψ ω ϊ ϋ ό ύ ώ а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я ἀ ἁ ἂ ἃ ἄ ἅ ἆ ἇ ἐ ἑ ἒ ἓ ἔ ἕ ἠ ἡ ἢ ἣ ἤ ἥ ἦ ἧ ἰ ἱ ἲ ἳ ἴ ἵ ἶ ἷ ὀ ὁ ὂ ὃ ὄ ὅ ὐ ὑ ὒ ὓ ὔ ὕ ὖ ὗ ὠ ὡ ὢ ὣ ὤ ὥ ὦ ὧ ὰ ά ὲ έ ὴ ή ὶ ί ὸ ό ὺ ύ ὼ ώ ᾀ ᾁ ᾂ ᾃ ᾄ ᾅ ᾆ ᾇ ᾐ ᾑ ᾒ ᾓ ᾔ ᾕ ᾖ ᾗ ᾠ ᾡ ᾢ ᾣ ᾤ ᾥ ᾦ ᾧ ᾰ ᾱ ᾲ ᾳ ᾴ ᾶ ᾷ ῂ ῃ ῄ ῆ ῇ ῐ ῑ ῒ ΐ ῖ ῗ ῠ ῡ ῢ ΰ ῤ ῥ ῦ ῧ ῲ ῳ ῴ ῶ ῷ

.com- und .net-Domains

à á â ã ä å ā ă ą æ ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ŋ ð ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ þ ù ú û ü ũ ū ŭ ů ű ų ŵ ý ÿ ŷ ź ż ž

.info-Domains[4]

á ä å æ é í ð ñ ó ö ø ú ü ý þ ā ą ć č ē ė ę ģ ī į ķ ļ ł ń ņ ō ő ŗ ś š ū ű ų ź ż ž

.at-Domains[5]

à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø œ š þ ù ú û ü ý ÿ ž

.ch- und .li-Domains[6]

à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø œ þ ù ú û ü ý ÿ

.org-Domains

ä ö ü

Seit Mai 2010 gibt es auch IDN-Top-Level-Domains und damit komplette Domains aus nicht-lateinischen Buchstaben.[7] So gibt es beispielsweise die Toplevel-Domain مصر., die das arabische Wort für Ägypten (Misr) darstellt; die Homepage des ägyptischen Ministeriums für Kommunikation und Informationstechnologie ist über die ausschließlich aus arabischen Zeichen bestehende Domain http://موقع.وزارة-الاتصالات.مصر/ erreichbar. Der Domainname ist dabei dem Arabischen entsprechend von rechts nach links zu lesen.

Beispiel-Domainnamen

dömäin.example           → xn--dmin-moa0i.example
kühe-mögen-äpfel.example → xn--khe-mgen-pfel-jfb9x9c.example
äaaa.example             → xn--aaa-pla.example
aäaa.example             → xn--aaa-qla.example
aaäa.example             → xn--aaa-rla.example
aaaä.example             → xn--aaa-sla.example
déjà.vu.example          → xn--dj-kia8a.vu.example
efraín.example           → xn--efran-2sa.example
ñandú.example            → xn--and-6ma2c.example
foo.âbcdéf.example       → foo.xn--bcdf-9na9b.example
موقع.وزارة-الاتصالات.مصر   → xn--4gbrim.xn----ymcbaaajlc6dj7bxne2c.xn--wgbh1c

Eine WhoIs-Abfrage der Form whois -h whois.denic.de -- -C ISO-8859-1 example.com bzw. whois -h whois.denic.de -- -C UTF-8 example.com auf Unicode-basierenden Systemen liefert bei registrierten Domains u. a. die Schreibweise in Punycode.

Unterstützung durch Web-Browser

Um IDNs nutzen zu können, muss der Client, etwa ein Browser dazu fähig sein, den in der URL-Zeile eingegebenen internationalen Domainnamen (z. B. mit Umlauten) in einen ACE-String umzuwandeln.

Einige IDN-fähige Browser:


(*) Der Internet Explorer (IE) kann, ab Version 5.0, durch die Installation des Plug-ins i-nav von VeriSign (siehe Weblinks) bedingt IDN-fähig gemacht werden. Mit dem IE 6 treten jedoch trotz des Plug-ins gelegentlich fehlerhafte Abläufe auf. Eine Alternative zu i-nav bietet das RFC-konforme Plug-in Quero Toolbar (siehe Weblinks), das auch mit IDN-Phishing-Schutzmechanismen ausgestattet ist.

Bewertung

Kritiker meinen, die Einführung der IDNs sei ein historischer Fehler in der Entwicklung des Internets gewesen. IDNs seien aufgrund der länderspezifischen Tastaturdesigns für weite Teile der Netzbevölkerung praktisch nicht erreichbar, vertieften damit die Gräben zwischen den Sprachräumen und konterkarierten letztlich das dem Internet zugrundeliegende Konzept vom „globalen Dorf“. Dadurch werde die hinter der IDN-Einführung stehende Idee, insbesondere die Sprachräume mit nicht-lateinischer Schrift (z. B. Arabien, Ostasien) stärker ins Netz zu integrieren, ad absurdum geführt.

Der Anteil von IDNs an allen registrierten Domains unterhalb von .de beträgt rund dreieinhalb Prozent.[8]

Quellen

  1. a b „ß“ künftig in zulässigem Zeichensatz für .de-Domains, Pressemitteilung der DENIC, 26. Oktober 2010
  2. DENIC-Domainrichtlinien
  3. Unterstützte Schriftzeichen. The European Registry of Internet Domain Names.
  4. IDN Language Tables auf http://www.info.info/information/internationalized-domain-names
  5. IDNs bei nic.at
  6. Allgemeine Geschäftsbedingungen für die Registrierung und Verwaltung von Domain-Namen unter ".ch" und ".li", Anhang 2
  7. Erste komplett nicht-lateinische Domains gehen online auf Heise-online
  8. Statistik der Domainentwicklung auf denic.de

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Internationalized Domain Names in Applications — Die Artikel Punycode und Internationalizing Domain Names in Applications überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen.… …   Deutsch Wikipedia

  • Domain-Name-System — (DNS) Familie: Internetprotokollfamilie Einsatzgebiet: Namensauflösung Ports: 53/UDP, 53/TCP DNS im TCP/IP‑Protokollstapel: Anwendung DNS Transport UD …   Deutsch Wikipedia

  • Domain Name Server — Domain Name System (DNS) Familie: Internetprotokollfamilie Einsatzgebiet: Namensauflösung Ports: 53/UDP, 53/TCP DNS im TCP/IP‑Protokollstapel: Anwendung DNS Transport UD …   Deutsch Wikipedia

  • Domain Name Service — Domain Name System (DNS) Familie: Internetprotokollfamilie Einsatzgebiet: Namensauflösung Ports: 53/UDP, 53/TCP DNS im TCP/IP‑Protokollstapel: Anwendung DNS Transport UD …   Deutsch Wikipedia

  • Domain Name System — The Domain Name System (DNS) is a hierarchical distributed naming system for computers, services, or any resource connected to the Internet or a private network. It associates various information with domain names assigned to each of the… …   Wikipedia

  • Internationalized domain name — An internationalized domain name (IDN) is an Internet domain name that contains one or more non ASCII characters. Such domain names could contain letters with diacritics, as required by many non English languages, or characters from non Latin… …   Wikipedia

  • Internationalized Domain Name — Die Artikel Punycode und Internationalizing Domain Names in Applications überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen.… …   Deutsch Wikipedia

  • Umlaut-Domain — Die Artikel Punycode und Internationalizing Domain Names in Applications überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen.… …   Deutsch Wikipedia

  • Root-Domain — Jeder Name einer Domain im Internet besteht aus einer Folge von durch Punkte getrennten Zeichen. Die Bezeichnung Top Level Domain (vom englischen top level domain, übersetzt Bereich oberster Ebene; Abkürzung TLD) bezeichnet dabei den letzten… …   Deutsch Wikipedia

  • Top Level Domain — Jeder Name einer Domain im Internet besteht aus einer Folge von durch Punkte getrennten Zeichen. Die Bezeichnung Top Level Domain (vom englischen top level domain, übersetzt Bereich oberster Ebene; Abkürzung TLD) bezeichnet dabei den letzten… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”