Некоторые проблемы робастности при анализе данных:
- Влияние выбросов. 3 Даже небольшое число резко выделяющихся наблюдений (выбросов) способно сильно повлиять на результат исследования. 3 Робастные методы направлены на выявление выбросов, снижение их влияния или исключение из выборки. 3
- Неизвестная степень засорения. 4 В теории обычно предполагается известная степень засорения, но на практике эта величина неизвестна. 4
- Неоднозначность определения робастности. 5 Если рассматривать робастность как сохранение поведения модели при малых возмущениях исходных данных, то возникают вопросы о том, насколько малы должны быть эти изменения и как такое определение соотносится с другими характеристиками модели. 5
- Смещение обучающих данных. 5 Если некоторые части совокупности недостаточно представлены или отсутствуют в обучающих данных, то подобранная модель на этих данных будет смещена в сторону от оптимальной функции. 5
Основная идея робастности — это построение статистических процедур, устойчивых к возможным отклонениям от принятых вероятностных моделей распределений данных. 1