Некоторые аргументы, на которых строится критика использования p-значений в научных исследованиях:
- Ошибки первого рода. ru.wikipedia.org Использование p-значений нередко приводит к ложноположительным заключениям. ru.wikipedia.org
- Неправильная интерпретация. ru.wikipedia.org P-значение часто неверно понимается как вероятность того, что нулевая гипотеза верна. ru.wikipedia.org Также критикуется практика принятия альтернативной гипотезы для любого p-значения, номинально меньшего 0,05, без других подтверждающих доказательств. ru.wikipedia.org
- Зависимость от размера выборки. hum-ecol.ru Мощность статистического критерия зависит от объёма выборки. hum-ecol.ru Например, p=0,005 на малой выборке будет отсекать интересующий эффект, а с ростом выборки даже такого значения не хватит, чтобы отсечь неинформативные случайные находки. hum-ecol.ru
- Манипуляции авторов работ. nplus1.ru Научные журналы предпочитают публиковать именно статистически значимые результаты, и иногда авторы работ используют статистические манипуляции, чтобы подогнать результаты под этот критерий. nplus1.ru
В качестве альтернативы p-значениям некоторые специалисты предлагают использовать другие метрики доказательности, такие как доверительный интервал, отношение правдоподобий или коэффициент Байеса. ru.wikipedia.org
Однако не все учёные согласны с такими предложениями. nplus1.ru Например, философ науки Дебора Майо считает, что отказ от понятия статистической значимости позволит учёным занижать важность отрицательных результатов и откроет дорогу к манипуляциям выводами. nplus1.ru