Количество бит, которое занимает один символ в различных кодировках, зависит от конкретной кодировки. 14
Некоторые примеры:
- Символ ASCII в 8-битной кодировке ASCII равен 8 битам (1 байт), хотя он может умещаться в 7 битах. 1
- Символ ISO-8895-1 в кодировке ISO-8859-1 также равен 8 битам (1 байту). 1
- Символ Unicode в кодировке UTF-8 имеет длину от 8 бит (1 байт) до 32 бит (4 байта). 1
- Символ Unicode в кодировке UTF-16 составляет от 16 бит (2 байта) до 32 бит (4 байта), хотя большинство распространённых символов занимают 16 бит. 1
- Символ Unicode в кодировке UTF-32 всегда равен 32 битам (4 байтам). 1