Количество символов в компьютерной кодировке отличается от физического объёма данных, потому что каждый символ несёт в себе определённое количество бит. 4 Итоговый информационный объём текста определяется как произведение веса одного символа на количество символов в тексте. 4
Например, в 32-битной кодировке Unicode один символ весит 32 бита, в 16-битной — 16 бит, а в 8-битной — 8 бит. 4
Также есть кодировки, в которых длина одного символа может быть не только 1 байт, но и 2, 3 или 4 байта, например UTF-8. 2 Например, в этой кодировке часто встречающиеся символы кодируются меньшим числом байтов, в идеале — одним. 3