Кодирование текста в системах Юникода происходит следующим образом: 13
Коды в стандарте Юникод разделены на несколько областей. 1 Область с кодами от U+0000 до U+007F содержит символы набора ASCII, и коды этих символов совпадают с их кодами в ASCII. 1 Далее расположены области символов других систем письменности, знаки пунктуации и технические символы. 1 Часть кодов зарезервирована для использования в будущем. 1
Например, в кодировке UTF-16 любой символ Юникода может быть закодирован либо двумя, либо четырьмя байтами. 2 Если ведущий (первый) бит нулевой, то это значит, что для кодирования символа используется всего один байт. 2 Если первый бит не нулевой, то символ кодируется несколькими байтами. 2