Изменения

Представление символов, таблицы кодировок

140 байт добавлено, 07:39, 28 октября 2011

Нет описания правки

Когда символ закодирован в UTF-16, его 2 или 4 байта можно упорядочить двумя разными способами (little-endian или big-endian). Изображение слева показывает это.Byte order mark указывает, какой порядок используется, так что приложения могут немедленно расшифровать контент. UTF-16 контент должен всегда начинатся с BOM.

BOM также используется для текста обозначенного как UTF-32. Аналогично UTF-16 существует два варианта четырёхбайтной кодировки — UTF-32BE и UTF-32LE.К сожалению, и этот способ не ~~должен использоваться для текста обозначенного как~~ позволяет надёжно различать UTF-~~32BE или~~ 16LE и UTF-32LE,поскольку символ U+0000 допускается Юникодом.

== Представление BOM в кодировках ==

{| class="wikitable"

Анонимный участник

192.168.0.2

Изменения

Представление символов, таблицы кодировок

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты