Сжатие текста работает на основе устранения избыточности, содержащейся в исходных данных. 3
Простейший пример избыточности — повторение в тексте фрагментов (например, слов естественного или машинного языка). 3 Подобная избыточность обычно устраняется заменой повторяющейся последовательности ссылкой на уже закодированный фрагмент с указанием его длины. 3
Другой вид избыточности связан с тем, что некоторые значения в сжимаемых данных встречаются чаще других. 3 Сокращение объёма данных достигается за счёт замены часто встречающихся данных короткими кодовыми словами, а редких — длинными (энтропийное кодирование). 3
Существует два типа сжатия текстов: 2