В кодировке UTF-8 каждый символ занимает разное количество байтов, и количество зависит от длины исходного числа. 2
Если первый бит каждого байта, кодирующего символ, нулевой, то для кодирования используется один байт. 4 Это обеспечивает совместимость с ASCII, так как первые 128 символов (английский алфавит, управляющие символы и знаки препинания) в ASCII и UTF-8 начинаются с нулевого бита. 4
Если первый бит не нулевой, то символ кодируется несколькими байтами. 4 Например, латиница кодируется одним байтом, а кириллица — двумя. 4