Возможно, имелся в виду алгоритм обнаружения дубликатов в данных, например, при обработке изображений. 1 Один из таких алгоритмов включает следующие этапы: 1
- Вычисление значений кодов локальных шаблонов в режиме скользящего окна, например, размером 5×5. 1 Полученные значения помещаются в матрицу кодов. 1
- Вычисление значений хэш-функции (отображение значений матрицы кодов в целочисленную неотрицательную величину или хэш-значение). 1
- Помещение хэш-значений в матрицу хэш-значений. 1
- Построение гистограммы хэш-значений. 1
- Анализ гистограммы, который заключается в поиске таких хэш-значений, для которых значение в гистограмме превышает единицу. 1
- Формирование выходного изображения, которое содержит выделенные области-дубликаты. 1
Также существует алгоритм поиска дубликатов в математических формулах, который включает следующие шаги: 3
- Выявление формул в анализируемых текстах. 3
- Создание образцов на основе выявленных формул. 3
- Сравнение между собой образцов найденных формул. 3
- Проверка контекста формул с идентичным образцом, с учётом наличия часто используемых символов в этих формулах. 3
- Формулы с идентичным образцом и содержанием считаются близкими дубликатами. 3