Для кодирования английских букв требуется меньше бит, чем для иероглифов, потому что для латинских букв разработана специальная кодировка, которая позволяет использовать минимальное количество байт. 14
Например, в кодировке UTF-8 латинские буквы без диакритических знаков, цифры и наиболее распространённые знаки препинания кодируются одним байтом. 4 Для других символов, включая иероглифы, количество байт может быть больше. 2
UTF-8 разработана таким образом, чтобы часто используемые символы занимали меньше места. 1