CESU-8

CESU-8: CESU-8 (kurz für Compatibility Encoding Scheme for UTF-16: 8-Bit) ist eine Variante von UTF-8, die im Unicode Technical Report #26 beschrieben wird. Der Codepoint wird zunächst in UTF-16 ausgedrückt, dann wird das Ergebnis in UTF-8 rekodiert, als wäre es UCS-2. Das Verfahren ist ähnlich wie das modifizierte UTF-8 von Java, allerdings wird das Zeichen NUL (U+0000) nicht speziell kodiert. Wie beim modifizierten UTF-8 wird CESU-8 in einzelne UTF-16-Wörter dekodiert.

CESU-8-kodierter Text entsteht, wenn ein UCS-2→UTF8-Umwandler (häufig aus der Zeit, in der Unicode nur ein 16-Bit-Zeichensatz war) fehlerhafterweise für die Umwandlung von UTF-16 verwendet wird. Eingeschränkt auf den Bereich der Basic Multilingual Plane (Zeichen bis Nummer 65.535) sind UTF-8 und CESU-8 identisch.

CESU-8 wird von der Oracle-Datenbank-Software verwendet. Der Oracle UTF8-Zeichensatz – mit einem falsch gewählten Namen – der seit Version 8.0 der Datenbank verfügbar ist, entspricht der CESU-8-Kodierung. Der AL32UTF8-Zeichensatz, eingeführt in Version 9.0, entspricht der UTF-8-Kodierung.

Beispiel

Kodierung Unicode code point

U+0045 U+0205 U+10400

UTF-8 45 C8 85 F0 90 90 80

UTF-16 0045 0205 D801 DC00

CESU-8 45 C8 85 ED A0 81 ED B0 80

Weblinks

Unicode Technical Report #26

Kategorien:
Unicode
Abkürzung

Kodierung	Unicode code point
U+0045	U+0205	U+10400
UTF-8	45	C8	85	F0	90	90	80
UTF-16	0045	0205	D801	DC00
CESU-8	45	C8	85	ED	A0	81	ED	B0	80

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

čėsu — ×čėsù adv. K; R411 reikiamu momentu, nustatytu terminu: Čėsu dar atvažiavo brolis J. Ne čėsu gimęs vaikas N. Taigi dabokitės ir mašnas čėsù prisikraukit K.Donel. ^ Geriau čėsu skatikas, negu po čėso rublis KrvP(Mrs) … Dictionary of the Lithuanian Language
CESU — Chèque emploi service universel « CESU » redirige ici. Pour l article homonyme, voir Centre d enseignement des soins d urgence … Wikipédia en Français
Cesu — Chèque emploi service universel « CESU » redirige ici. Pour l article homonyme, voir Centre d enseignement des soins d urgence … Wikipédia en Français
CESU-8 — Le CESU 8 (Compatibility Encoding Scheme for UTF 16: 8 Bit) est un codage de caractères variante d UTF 8 décrit dans le document Unicode Technical Report #26[1] publié par le consortium Unicode. C est un encodage d Unicode sur 8 bits non… … Wikipédia en Français
CESU-8 — Compatibility Encoding Scheme for UTF 16: 8 Bit (CESU 8) is a variant of UTF 8 that is described in Unicode Technical Report #26 [http://www.unicode.org/reports/tr26/] . A Unicode code point from the Basic Multilingual Plane (BMP), i.e. a code… … Wikipedia
Cēsu Alus — Industry Light alcoholic and non alcoholic beverages Founded 1995 (roots 1590) Headquarters Aldaru laukums 1, Cēsis, Latvia Key people Eva Sietiņsone Zatlere Products Beer, cider … Wikipedia
Cēsu Namiņš — (Цесис,Латвия) Категория отеля: Адрес: Lielā Skolas iela 7, Цесис, LV 4101, Латвия … Каталог отелей
Cesu Rajons — Cesis Pays Lettonie Population * 59914 hab … Wikipédia en Français
Cēsu rajons — Cesu rajons Cesis Pays Lettonie Population * 59914 hab … Wikipédia en Français
Cēsu alus — AS «Cēsu alus» … Википедия

Academic dictionaries and encyclopedias

CESU-8

Beispiel

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

CESU-8

Beispiel

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link