Метод сравнения данных (сопоставление или связывание) применяется для выявления одинаковых по смыслу, но разных по виду представления записей в больших информационных массивах. 1
Сопоставление может использовать нечёткую логику для поиска дубликатов в данных. 1 Например, «Пётр» и «Птер» могут быть одним и тем же человеком, который проживает по одинаковому адресу. 1
Также для выявления ошибок в больших массивах числовой информации используют «сжатие» исходной информации путём вычисления корреляционных матриц, средних значений коэффициентов корреляции, коэффициентов асимметрии и вариации. 2
Ещё один метод — сравнительный анализ, который предполагает систематическое изучение двух или более наборов данных с целью выявления сходств, различий и взаимосвязей между ними. 4