Вопросы к Поиску с Алисой
Объём одного символа в разных кодировках может отличаться, потому что системы кодирования решают задачу оптимального хранения информации. yandex.ru
Например, в кодировке UTF-8 часто встречающиеся символы кодируются меньшим числом байтов, в идеале — одним. yandex.ru Если символ может быть закодирован одним байтом, то так и происходит. github.com Если нужно 2 байта, то используется 2 байта. github.com Так, например, латиница кодируется одним байтом, а кириллица — двумя. github.com
Ещё есть кодировки постоянной длины, например, UTF-32, в которой номер любого символа из таблицы Unicode занимает ровно 4 байта. tabl.god-tigra.ru
Таким образом, объём одного символа зависит от того, какую кодировку используют, и определяется с учётом частоты появления символа в последовательности. tabl.god-tigra.ru www.yaklass.ru