Изменения

Перейти к: навигация, поиск

Участник:Qwerty787788/плюсы3сем

442 байта добавлено, 13:00, 26 января 2013
м
encodings
Очевидно, что один и тот же символ может представляться разными последовательностями байт. Но по стандарту представление должно использовать минимальное число байт. Все остальные преставления называются overlong sequences.
 
Утверждают, что это даже бывает полезно. Например, в Modified UTF-8 символ NUL(U+0000) представляют двумя байтами C0 80, чтобы оставить 00 под символ конца строки. <del>Так делает Java для сериализации объектов, добавления строковых констант в .class-файлы и JNI.</del>
=== UTF-16, surrogate pair ===
54
правки

Навигация