Использование фиктивных переменных может исказить результаты анализа данных в некоторых случаях, например:
- Уменьшение статистической мощности выборки. 3 Создание фиктивных переменных занижает величину парной связи и не позволяет выявить истинный эффект независимой переменной в генеральной совокупности. 3
- Неверная оценка значимости регрессионных коэффициентов. 3 Это может привести к неправильному выбору переменных для итогового уравнения и неверным результатам. 3
- Возникновение мультиколлинеарности. 4 Она появляется из-за добавления в модель избыточного количества фиктивных переменных. 4 В таком случае наблюдается строгая линейная связь между переменными модели, и оценка модели становится невозможна. 4
- Влияние выбора контрольной группы. 3 Если неинтервальные переменные не распределены приблизительно равномерно, то выбор контрольной группы может повлиять на набор переменных в итоговом уравнении и, соответственно, на содержание результирующей модели. 3
Чтобы избежать искажений, при использовании фиктивных переменных важно соблюдать правило: добавлять в модель на одну переменную меньше, чем есть значений признака. 45