CESU-8

CESU-8

CESU-8 (kurz für Compatibility Encoding Scheme for UTF-16: 8-Bit) ist eine Variante von UTF-8, die im Unicode Technical Report #26 beschrieben wird. Der Codepoint wird zunächst in UTF-16 ausgedrückt, dann wird das Ergebnis in UTF-8 rekodiert, als wäre es UCS-2. Das Verfahren ist ähnlich wie das modifizierte UTF-8 von Java, allerdings wird das Zeichen NUL (U+0000) nicht speziell kodiert. Wie beim modifizierten UTF-8 wird CESU-8 in einzelne UTF-16-Wörter dekodiert.

CESU-8-kodierter Text entsteht, wenn ein UCS-2→UTF8-Umwandler (häufig aus der Zeit, in der Unicode nur ein 16-Bit-Zeichensatz war) fehlerhafterweise für die Umwandlung von UTF-16 verwendet wird. Eingeschränkt auf den Bereich der Basic Multilingual Plane (Zeichen bis Nummer 65.535) sind UTF-8 und CESU-8 identisch.

CESU-8 wird von der Oracle-Datenbank-Software verwendet. Der Oracle UTF8-Zeichensatz – mit einem falsch gewählten Namen – der seit Version 8.0 der Datenbank verfügbar ist, entspricht der CESU-8-Kodierung. Der AL32UTF8-Zeichensatz, eingeführt in Version 9.0, entspricht der UTF-8-Kodierung.

Beispiel

Kodierung Unicode code point
U+0045 U+0205 U+10400
UTF-8 45 C8 85 F0 90 90 80
UTF-16 0045 0205 D801 DC00
CESU-8 45 C8 85 ED A0 81 ED B0 80

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • čėsu — ×čėsù adv. K; R411 reikiamu momentu, nustatytu terminu: Čėsu dar atvažiavo brolis J. Ne čėsu gimęs vaikas N. Taigi dabokitės ir mašnas čėsù prisikraukit K.Donel. ^ Geriau čėsu skatikas, negu po čėso rublis KrvP(Mrs) …   Dictionary of the Lithuanian Language

  • CESU — Chèque emploi service universel « CESU » redirige ici. Pour l article homonyme, voir Centre d enseignement des soins d urgence …   Wikipédia en Français

  • Cesu — Chèque emploi service universel « CESU » redirige ici. Pour l article homonyme, voir Centre d enseignement des soins d urgence …   Wikipédia en Français

  • CESU-8 — Le CESU 8 (Compatibility Encoding Scheme for UTF 16: 8 Bit) est un codage de caractères variante d UTF 8 décrit dans le document Unicode Technical Report #26[1] publié par le consortium Unicode. C est un encodage d Unicode sur 8 bits non… …   Wikipédia en Français

  • CESU-8 — Compatibility Encoding Scheme for UTF 16: 8 Bit (CESU 8) is a variant of UTF 8 that is described in Unicode Technical Report #26 [http://www.unicode.org/reports/tr26/] . A Unicode code point from the Basic Multilingual Plane (BMP), i.e. a code… …   Wikipedia

  • Cēsu Alus — Industry Light alcoholic and non alcoholic beverages Founded 1995 (roots 1590) Headquarters Aldaru laukums 1, Cēsis, Latvia Key people Eva Sietiņsone Zatlere Products Beer, cider …   Wikipedia

  • Cēsu Namiņš — (Цесис,Латвия) Категория отеля: Адрес: Lielā Skolas iela 7, Цесис, LV 4101, Латвия …   Каталог отелей

  • Cesu Rajons — Cesis Pays Lettonie Population * 59914 hab …   Wikipédia en Français

  • Cēsu rajons — Cesu rajons Cesis Pays Lettonie Population * 59914 hab …   Wikipédia en Français

  • Cēsu alus — AS «Cēsu alus» …   Википедия

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”