Вопросы к Поиску с Алисой
В кодировке UTF-16 4-байтная последовательность используется для некоторых символов из-за особенностей стандарта, ориентированного на работу с обширными символьными наборами. otus.ru
В частности, это решение применяется для материалов, в которых встречаются преимущественно элементы, отличные от ASCII, например элементы азиатских алфавитов. otus.ru
Для кодирования таких символов используется суррогатная пара — два двухбайтовых символа, которые вместе занимают 4 байта. github.com notes.algoprog.ru Для суррогатных пар в таблице Unicode отведён специальный диапазон — от D800 до DFFF. github.com