Статистически значимое улучшение показателя не всегда приводит к положительным результатам по нескольким причинам:
- Статистическая значимость не оценивает важность разницы между эталоном и объектом исследования. habr.com Показатель статистической значимости сообщает, что разница, вероятно, появилась не по случайности, но не говорит о том, имеет ли она значение в реальном мире. habr.com
- При тестировании делают предположения, которые часто не имеют места в реальных жизненных сценариях. ux-journal.ru Например, предполагают, что элементы каждой выборки распределены одинаково, но это не так. ux-journal.ru Вероятность конверсии зависит от времени, местоположения, предпочтений посетителя, источников трафика и многих других факторов. ux-journal.ru
- Возможны завышенные ожидания от вариации-победителя. ux-journal.ru www.mango-office.ru Есть вероятность, что вариация-победитель на самом деле была не объективно лучшей, а просто более «везучей». ux-journal.ru Это везение со временем заканчивается и сглаживается, в результате чего возникает ощущение, что результаты падают. ux-journal.ru
- Результаты исследования могут быть невоспроизводимыми. habr.com Часто бывает так, что результат, являющийся статистически значимым в исходной публикации, оказывается статистически незначимым при воспроизведении эксперимента. habr.com
Чтобы избежать ошибок, важно оценивать размер эффекта (то, насколько велик этот эффект) отдельно от уровня статистической значимости результатов эксперимента. habr.com