Изменения

Перейти к: навигация, поиск

Представление символов, таблицы кодировок

140 байт добавлено, 07:39, 28 октября 2011
Нет описания правки
Когда символ закодирован в UTF-16, его 2 или 4 байта можно упорядочить двумя разными способами (little-endian или big-endian). Изображение слева показывает это.Byte order mark указывает, какой порядок используется, так что приложения могут немедленно расшифровать контент. UTF-16 контент должен всегда начинатся с BOM.
BOM также используется для текста обозначенного как UTF-32. Аналогично UTF-16 существует два варианта четырёхбайтной кодировки — UTF-32BE и UTF-32LE.К сожалению, и этот способ не должен использоваться для текста обозначенного как позволяет надёжно различать UTF-32BE или 16LE и UTF-32LE,поскольку символ U+0000 допускается Юникодом. 
== Представление BOM в кодировках ==
{| class="wikitable"
Анонимный участник

Навигация