При переходе от ASCII к Unicode необходимо увеличить объём памяти, потому что Unicode позволяет кодировать больше символов, чем ASCII. 1
В ASCII для хранения одного символа требуется 8 бит или 1 байт памяти. 1 В Unicode для этого используются разные стандарты, например:
- UTF-32. 35 Для шифрования одного элемента применяются 4 байта или 32 бита. 3 За счёт этого кириллические символы в UTF-32 весят в 4 раза больше, чем в ASCII. 3
- UTF-16. 35 Для кодирования одного и того же символа здесь используются 2 байта (или 16 бит). 3 При переходе на эту кодировку с ASCII размер исходного документа увеличивается в 2 раза. 3
- UTF-8. 35 Это кодировка переменной длины. 3 Каждый символ может получить код, длина которого составит от 1 до 6 байт. 3 Обычно стандарт использует записи длиной до 4 байт. 3 Латинские буквы содержатся в одном байте, как и в случае с ASCII, а буквы русского алфавита занимают по 2 байта, а грузинские — по 3. 3