Некоторые методы обработки пропущенных данных в SPSS:
- Удаление списков (listwise). 24 Программа проверяет строки на наличие пропущенных значений и удаляет их целиком из базы данных. 1 Это простой метод, но он может давать искажённые результаты и уменьшать размер выборки. 4
- Удаление пар (pairwise). 14 Программа не удаляет строки с пропусками, а в процессе статистических расчётов не выполняет только те операции, которые требуют наличия пропущенных значений. 1 В анализе участвуют все введённые данные, но результаты обработки имеют погрешность. 1
- Замена на среднее. 4 Отсутствующие значения заменяются средним из наблюдаемых значений для этой переменной. 4 Этот метод может уменьшить вариабельность и лучше всего подходит, когда доля отсутствующих данных мала. 4
- Импутация с помощью регрессии. 4 Прогнозирование отсутствующих данных с использованием регрессионной модели на основе других переменных. 4 Это может быть более сложным методом, но он лучше сохраняет связи между переменными, чем замена на среднее. 4
- Множественная импутация (MI). 23 Создаётся несколько полных наборов данных с помощью алгоритмов, таких как Predictive Mean Matching (PMM) или Linear Regression Imputation (LRI). 2 Этот метод учитывает неопределённость и даёт более точные стандартные ошибки и доверительные интервалы. 3
- Алгоритм EM. 4 Используется для выполнения оценки максимального правдоподобия, когда данные отсутствуют. 4
Выбор метода зависит от конкретного исследовательского вопроса, уровня отсутствия данных и типа данных. 4