Разница в объёмах данных при перекодировании из Unicode в другие кодировки возникает из-за различий в том, сколько места занимает каждый символ в разных кодировках. 15
Например, кодовые точки в диапазоне от U+0800 до U+FFFF (от 2048 до 65535 в десятичной системе) в кодировке UTF-8 занимают три байта, а в UTF-16 — два. 5
Также сохранение текста в Unicode часто занимает больше места, чем сохранение его в устаревших кодировках. 1 Точное значение занятого пространства зависит от языка и конкретного текста. 1
Кроме того, разные кодировки по-разному интерпретируют одни и те же байты. 3 Например, UTF-8 требует чётко определённой последовательности байтов, а Latin-1 не обращает внимания на небольшие нарушения в порядке, что позволяет декодировать данные без ошибок. 3