Некоторые методы сжатия документов при архивировании:
- Удаление избыточности. 1 Для этого используют, например, метод Лемпеля-Зива-Велча или алгоритм RLE (Run-Length Encoding). 1
- Замена данных более короткими представлениями. 1 Для этого применяют словари, которые содержат набор уникальных символьных или более длинных последовательностей данных и их соответствующих сокращённых кодов. 1 При сжатии повторяющиеся символьные или последовательности данных заменяют их кодами из словаря. 1 Также замена символов и символьных последовательностей основывается на частотности их появления: часто используемые символы или последовательности заменяют более короткими кодами, а редкие — более длинными. 1
- Арифметическое кодирование. 1 Принцип компрессии данных, основанный на представлении всего входного потока данных одним числом, попадающим в определённый интервал. 1 В арифметическом кодировании каждому символу или символьной последовательности присваивается определённый интервал вещественных чисел, пропорционально их вероятности. 1 При декодировании входной поток делят на интервалы, каждый из которых соответствует символу или символьной последовательности, восстанавливая исходные данные. 1
- Сжатие с потерями. 12 Позволяет достичь значительно большего уменьшения размера файлов за счёт удаления излишков данных, таких как мелкие детали изображения или неслышимые частоты в аудио. 2 Подходит только для данных, где не критично потерять часть информации. 2 Примерами алгоритмов сжатия с потерями являются алгоритмы JPEG для сжатия изображений и алгоритм MP3 для сжатия аудио. 1
Выбор метода сжатия зависит от задачи и типа данных. 2