Вес одного символа в различных кодировках символов зависит от используемой кодировки. 2 Некоторые примеры:
- ASCII (American Standard Code for Information Interchange). 1 В этой таблице, состоящей из 128 символов, куда входят буквы английского алфавита, цифры и прочие знаки, на один символ уходит 7 бит. 5
- Unicode. 1 Стандарт поддерживается тремя формами, и вес символа зависит от используемой кодировки: 1
- 32-битная (UTF-32) — один символ весит 32 бита. 1
- 16-битная (UTF-16) — один символ весит 16 бит. 1
- 8-битная (UTF-8) — один символ весит 8 бит. 1
Также существует кодировка UTF-8, в которой количество байт на символ разное — от одного (для латинских символов) до четырёх (для иероглифов). 3