Объём одного символа в разных кодировках может отличаться, потому что системы кодирования решают задачу оптимального хранения информации. 2
Например, в кодировке UTF-8 часто встречающиеся символы кодируются меньшим числом байтов, в идеале — одним. 2 Если символ может быть закодирован одним байтом, то так и происходит. 3 Если нужно 2 байта, то используется 2 байта. 3 Так, например, латиница кодируется одним байтом, а кириллица — двумя. 3
Ещё есть кодировки постоянной длины, например, UTF-32, в которой номер любого символа из таблицы Unicode занимает ровно 4 байта. 1
Таким образом, объём одного символа зависит от того, какую кодировку используют, и определяется с учётом частоты появления символа в последовательности. 15