Чтобы вычислить объём информации в тексте на естественном языке, можно использовать алфавитный подход. 14 Он позволяет измерить информационный объём сообщения независимо от его содержания. 1
Суть подхода в том, что каждый символ сообщения имеет определённый информационный вес — несёт фиксированное количество информации. 1 Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. 1 За минимальную единицу измерения информации принят информационный вес символа двоичного алфавита (1 бит). 1
Формула расчёта информационного объёма сообщения (I) равна произведению количества символов в сообщении (K) на информационный вес символа алфавита (i). 2 То есть I = K × i. 2
Например, если алфавит состоит из 32 символов, то каждый символ несёт 5 бит информации, так как 32 = 2⁵. 4