Разница между переменными и фиксированными кодировками в Unicode заключается в том, как они представляют символы:
- Переменные кодировки, например UTF-8 и UTF-16, используют переменное количество байт для кодирования одного символа. 14 Если символ может быть закодирован одним байтом, UTF-8 закодирует его одним байтом, если нужно два байта, то используется два байта. 1 Так, например, латиница кодируется одним байтом, а кириллица — двумя байтами. 1
- Фиксированная кодировка, например UTF-32, использует фиксированное количество байт для хранения каждого символа — четыре байта. 23 Главное преимущество UTF-32 перед кодировками переменной длины заключается в том, что символы Юникод непосредственно индексируемы. 5