Размер текста в байтах зависит от кодировки, потому что в разных кодировках на один символ отводится разное количество байт. 4
Например, в кодировке UTF-32 каждый символ занимает 4 байта (32 бита). 3 В UTF-8 количество байт зависит от символа: английские буквы, цифры и знаки препинания занимают 1 байт, русские буквы — 2 байта, японские — 3 байта. 4
Также в кодировке UTF-16 и UTF-32 на каждый символ отводится сразу 2 или 4 байта, что увеличивает объём памяти, нужный для хранения данных. 1 Проще говоря, те символы, на которые в UTF-8 хватило бы одного байта, здесь занимают в 2–4 раза больше. 1