Вопросы к Поиску с Алисой
В кодировке UTF-8 каждый символ занимает разное количество байтов, и количество зависит от длины исходного числа. thecode.media
Если первый бит каждого байта, кодирующего символ, нулевой, то для кодирования используется один байт. habr.com Это обеспечивает совместимость с ASCII, так как первые 128 символов (английский алфавит, управляющие символы и знаки препинания) в ASCII и UTF-8 начинаются с нулевого бита. habr.com
Если первый бит не нулевой, то символ кодируется несколькими байтами. habr.com Например, латиница кодируется одним байтом, а кириллица — двумя. habr.com