В кодировке UTF-16 4-байтная последовательность используется для некоторых символов из-за особенностей стандарта, ориентированного на работу с обширными символьными наборами. 5
В частности, это решение применяется для материалов, в которых встречаются преимущественно элементы, отличные от ASCII, например элементы азиатских алфавитов. 5
Для кодирования таких символов используется суррогатная пара — два двухбайтовых символа, которые вместе занимают 4 байта. 13 Для суррогатных пар в таблице Unicode отведён специальный диапазон — от D800 до DFFF. 1