Разница между удалением и заполнением пропусков в данных заключается в подходе к обработке пропущенных значений:
- Удаление пропусков заключается в исключении из набора данных записей, строк или атрибутов, содержащих пропуски. 5 Этот метод может привести к потере какой-то информации, так как наблюдение удаляется целиком. 2
- Заполнение пропусков предполагает замену пропущенных значений конкретными значениями, средними значениями, медианами или другими вычисляемыми значениями. 3 Например, вместо пустого значения в ячейку можно записать специальное число или строку. 1 Также можно заполнить пропущенные значения с учётом других наблюдений в столбце. 1
Выбор между удалением и заполнением пропусков зависит от типа и объёма отсутствующих данных, а также от целей анализа. 3