Принцип энтропии в информационных технологиях заключается в том, что энтропия рассматривается как мера неупорядоченности или неопределённости состояния некоторой системы, описываемой данными. 2
В терминах информатики энтропия — это показатель хаотичности, или случайности распределения значений байтов в файле. 3 Например, в скомпилированном файле обычной программы участки кода распределены более-менее равномерно. 3 При использовании кодировщиков, упаковщиков, алгоритмов сжатия или вставок кода в исходный файл такая равномерность нарушается, в файле появляются высокоэнтропийные области. 3 То есть чем выше энтропия, тем меньше избыточности в файле. 3
В анализе данных и машинном обучении энтропия используется в алгоритмах классификации как мера классовой однородности подмножеств наблюдений, полученных в результате разбиения обучающего множества на классы. 2 Чем выше однородность подмножества, то есть чем больше примеров одного класса и меньше «примесь» примеров других классов, тем меньше энтропия и тем лучше результаты классификации. 2
В сфере информационной безопасности анализ энтропии объектов используется, например, в алгоритмах машинного обучения для создания моделей оценки файла в антивирусном ПО. 3 Также оценка энтропии применяется при подсчёте весов на этапе вынесения оценки вредоносности объекта в анти-АРТ-средствах защиты, то есть в процессе динамического анализа объектов. 3