ASCII Compatible Encoding

ASCII Compatible Encoding
Redundanz Die Artikel Punycode und Internationalizing Domain Names in Applications überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz. chrislb disk 13:29, 9. Mär. 2008 (CET)

IDNA (Internationalizing Domain Names in Applications) ist ein Internetstandard, um Domains, die Nicht-ASCII-Zeichen enthalten, als gültige ASCII-Strings im Domain Name System abzubilden. Einen solchen Domainnamen bezeichnet man als IDN (Internationalized Domain Name), im deutschen Sprachraum trivial auch Umlautdomain.

Inhaltsverzeichnis

Technologie

Unicode-Domains werden mittels der Verfahren Nameprep und Punycode zu ASCII-Strings umgewandelt, welche als ACE-Strings (ASCII Compatible Encoding) bezeichnet werden. Die Umwandlung erfolgt beim Client (z. B. dem Browser oder Mailprogramm), sodass die Server-Infrastruktur nicht verändert werden muss. Statt der Unicode-Strings kann der Benutzer im Client auch direkt die ACE-Strings eingeben. So können auch Clients ohne IDN-Fähigkeit mit internationalen Domains arbeiten, sofern der Benutzer den ACE-String kennt. Da dies jedoch umständlich ist, wird es nur empfohlen, wenn die Software nicht IDN-tauglich ist.

Grundsätzlich sind alle Unicode-Zeichen in IDNs zulässig. Das „ß“ wurde als identisch mit „ss“ deklariert und wird bei der Normalisierung in ss umgewandelt, sodass zum Beispiel „Pleiße“ identisch ist mit „Pleisse“. Jede Vergabestelle für Domains regelt separat, welche Zeichen sie für die von ihr vergebenen (Sub-)Domains erlaubt. Seit dem 1. März 2004 können neben den 37 gebräuchlichen Zeichen (26 Buchstaben des lateinischen Alphabets, 10 Ziffern und das Minus-Zeichen) für deutsche (.de) Second-Level-Domains 92 und für Schweizer (.ch) und liechtensteinische (.li) Domains 31 weitere Zeichen benutzt werden. Seit dem 31. März 2004 sind für österreichische Domains (.at) 34 weitere Zeichen erlaubt. Afilias, zuständig für .info-Domains, lässt nur die Zeichen ä, ö und ü zu.

Verarbeitung des Unicode-Strings

Zunächst wird eine Unicode-Domain durch Nameprep normalisiert, das heißt Großbuchstaben werden zu Kleinbuchstaben und als äquivalent definierte Zeichen werden in die Normalform im ASCII-Code umgewandelt (so ist ß zu ss äquivalent, es wird also aus StRAße strasse).

Im Anschluss an die Normalisierung werden mittels Punycode die Nicht-ASCII-Buchstaben aus dem Namen entfernt und am Ende des Namens ein daraus abgeleiteter ASCII-String hinzugefügt, in dem die Position und Art des Unicode-Zeichens kodiert ist. Um einen IDN- von einem ASCII-Domainnamen zu unterscheiden, beginnt der Punycode-String mit dem Präfix xn--.

Zeichensätze

.de-Domains

á à ă â å ä ã ą ā æ ć ĉ č ċ ç ď đ é è ĕ ê ě ë ė ę ē ğ ĝ ġ ģ ĥ ħ í ì ĭ î ï ĩ į ī ı ĵ ķ ĺ ľ ļ ł ń ň ñ ņ ŋ ó ò ŏ ô ö ő õ ø ō œ ĸ ŕ ř ŗ ś ŝ š ş ť ţ ŧ ú ù ŭ û ů ü ű ũ ų ū ŵ ý ŷ ÿ ź ž ż ð þ

.com- und .net-Domains

à á â ã ä å ā ă ą æ ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ŋ ð ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ þ ù ú û ü ũ ū ŭ ů ű ų ŵ ý ÿ ŷ ź ż ž

.info-Domains

ä ö ü

.at-Domains

à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø œ š þ ù ú û ü ý ÿ ž

.ch- und .li-Domains

à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø þ ù ú û ü ý ÿ

.org-Domains

ä ö ü

Beispiel-Domainnamen

  • www.dömäin.de → www.xn--dmin-moa0i.de
  • www.kühe-mögen-äpfel.de → www.xn--khe-mgen-pfel-jfb9x9c.de
  • www.äaaa.de → www.xn--aaa-pla.de
  • www.aäaa.de → www.xn--aaa-qla.de
  • www.aaäa.de → www.xn--aaa-rla.de
  • www.aaaä.de → www.xn--aaa-sla.de
  • déjà.vu → xn--dj-kia8a.vu
  • foo.âbcdéf.bar → foo.xn--bcdf-9na9b.bar
  • efraín.com → xn--efran-2sa.com
  • ñandú.cl → xn--and-6ma2c.cl

Eine WhoIs-Abfrage der Form whois -h whois.denic.de -- -C ISO-8859-1 umlautdomain.de bzw. whois -h whois.denic.de -- -C UTF-8 umlautdomain.de auf Unicode-basierenden Systemen liefert bei registrierten Domains u. a. die Schreibweise in Punycode.

Unterstützung durch Web-Browser

Um IDNs nutzen zu können, muss der Client, etwa ein Browser dazu fähig sein, den in der URL-Zeile eingegebenen internationalen Domainnamen (z. B. mit Umlauten) in einen ACE-String umzuwandeln.

Einige IDN-fähige Browser:


(*) Der Internet Explorer (IE) kann, ab Version 5.0, durch die Installation des Plug-ins i-nav von VeriSign (siehe Weblinks) bedingt IDN-fähig gemacht werden. Mit dem IE 6 treten jedoch trotz des Plug-ins gelegentlich fehlerhafte Abläufe auf. Eine Alternative zu i-nav bietet das RFC-konforme Plug-in Quero Toolbar (siehe Weblinks), das auch mit IDN-Phishing-Schutzmechanismen ausgestattet ist.

Sonstiges

Kritiker meinen, die Einführung der IDNs sei ein historischer Fehler in der Entwicklung des Internets gewesen. IDNs seien aufgrund der länderspezifischen Tastaturdesigns für weite Teile der Netzbevölkerung praktisch nicht erreichbar, vertieften damit die Gräben zwischen den Sprachräumen und konterkarierten letztlich das dem Internet zugrundeliegende Konzept vom „globalen Dorf“. Dadurch werde die hinter der IDN-Einführung stehende Idee, insbesondere die Sprachräume mit nicht-lateinischer Schrift (z. B. Arabien, Ostasien) stärker ins Netz zu integrieren, ad absurdum geführt.

Zum 31. Dezember 2006 betrug der Anteil von IDNs an allen registrierten Domains unterhalb von .de 3,2 %.[1] Zahl der .de-Domains am 30. November 2008: 12.402.383 davon 434.222 IDNs. Quelle Denic

Quellen

  1. denic.de

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • ASCII — American Standard Code for Information Interchange (ASCII), pronEng|ˈæski [ [http://www.m w.com/cgi bin/audio.pl?ascii001.wav=ASCII Audio pronunciation for ASCII] . Merriam Webster . Accessed 2008 04 14.] is a character encoding based on the… …   Wikipedia

  • Extended ASCII — The term extended ASCII (or high ASCII ) describes eight bit or larger character encodings that include the standard seven bit ASCII characters as well as others. The use of the term is sometimes criticized, because it can be mistakenly… …   Wikipedia

  • Percent-encoding — For the urlencode in MediaWiki, see Help:Magic words. Percent encoding, also known as URL encoding, is a mechanism for encoding information in a Uniform Resource Identifier (URI) under certain circumstances. Although it is known as URL encoding… …   Wikipedia

  • JIS encoding — In computing, JIS encoding refers to several Japanese Industrial Standards for encoding the Japanese language. Strictly speaking, the term means either: * A set of standard character sets for Japanese, notably: ** JIS X 0201, the Japanese version …   Wikipedia

  • Specific Area Message Encoding — or SAME is the protocol used to encode the Emergency Alert System in the U.S. for broadcast stations. It was originally created for NOAA Weather Radio by the National Weather Service, and was later adopted by the FCC for regular broadcasters on… …   Wikipedia

  • Internationalized domain name — An internationalized domain name (IDN) is an Internet domain name that contains one or more non ASCII characters. Such domain names could contain letters with diacritics, as required by many non English languages, or characters from non Latin… …   Wikipedia

  • Abkürzungen/Computer — Dies ist eine Liste technischer Abkürzungen, die im IT Bereich verwendet werden. A [nach oben] AA Antialiasing AAA authentication, authorization and accounting, siehe Triple A System AAC Advanced Audio Coding AACS …   Deutsch Wikipedia

  • Liste der Abkürzungen (Computer) — Dies ist eine Liste technischer Abkürzungen, die im IT Bereich verwendet werden. A [nach oben] AA Antialiasing AAA authentication, authorization and accounting, siehe Triple A System AAC Advanced Audio Coding AACS …   Deutsch Wikipedia

  • Nombre de dominio internacionalizado — Ejemplo de IDN griego. Un nombre de dominio internacionalizado o Internationalized Domain Name (IDN) es un nombre de dominio de Internet que (potencialmente) contiene caracteres no ASCII. Este tipo de dominios puede contener caracteres con acento …   Wikipedia Español

  • Internationalizing Domain Names in Applications — IDNA (Internationalizing Domain Names in Applications) ist ein Internetstandard, um Domains, die Nicht ASCII Zeichen enthalten, als gültige ASCII Strings im Domain Name System abzubilden. Einen solchen Domainnamen bezeichnet man als IDN… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”