Возможно, имелась в виду методика нормализации алфавита поиска при анализе частотных характеристик данных. 2 Её цель — повысить качество идентификации сущностей предметной области. 2
Принцип нормализации заключается в удалении из алфавита поиска лексем, которые входят в другие лексемы с аналогичной частотой повтора в данных сущности. 2 При этом удаляются более короткие лексемы, чтобы повысить устойчивость к ошибкам ложного срабатывания. 2
Нормализация данных в целом — это процесс приведения числовых данных к стандартному масштабу, чтобы сделать их сопоставимыми и более удобными для анализа. 3