Размеры текстов могут изменяться в зависимости от кодирования символов, потому что в разных кодировках один и тот же символ может занимать разный объём дискового пространства. 3
Например, в восьмиразрядной кодировке информационный вес символа равен 8 битам (1 байт), а в шестнадцатиразрядной — 16 битам (2 байта). 24 Таким образом, сохранение текста в Unicode часто занимает больше места, чем в устаревших кодировках. 1 Точное значение занятого пространства зависит от языка и конкретного текста. 1
Также размер текста изменяется при каждом его преобразовании из одного кодирования в другое. 1 Например, полный символ в кодировке UTF-8 может занять от одного до четырёх байт, а в UTF-16 — одну или две единицы 16-битного кода. 1