Объём данных, который занимает один символ в различных системах кодирования, может отличаться.
В кодировке ASCII каждый символ равен одному байту (1 байт = 8 бит). 12
В 32-битной кодировке Unicode (UTF-32) один символ весит 32 бита, в 16-битной — 16 бит, а в 8-битной — 8 бит. 3
В кодировке UTF-8 количество байт на символ разное — от одного (для латинских символов) до четырёх (для иероглифов). 2
Также существует международный стандарт Unicode, который отводит на каждый символ два байта. 1