Вопросы к Поиску с Алисой
Проблема применения теста Шапиро-Уилка к очень большим выборкам заключается в том, что доверительный интервал становится слишком маленьким. stats.stackexchange.com В таком случае тест чрезвычайно «точен», но практически бесполезен. stats.stackexchange.com Он всегда будет отклонять нулевую гипотезу, даже если распределение достаточно нормальное. stats.stackexchange.com
Кроме того, при больших объёмах выборки тесты практически всегда показывают отклонения от нормального распределения. your-scorpion.ru Если данные очень ненормальные, например, у них есть ограничение снизу, то нужна нормализация или хотя бы удаление выбросов. your-scorpion.ru
Максимальный допустимый размер выборки зависит от реализации теста. builtin.com Например, в Python при размере выборки более 5000 тест Шапиро-Уилка выдаёт предупреждение о том, что полученное значение может быть неточным из-за ограничений в базовых предположениях теста. builtin.com