Некоторые причины, по которым p-значения могут быть ненадёжными при проверке гипотез:
  - Неправильная интерпретация.                                                                          neiros.ru                                                                                               ru.wikipedia.org                       P-значение часто неверно понимается как вероятность того, что нулевая гипотеза верна.                                                                          ru.wikipedia.org                       Также по этому показателю нельзя оценить, например, вероятность того, что один исследуемый вариант лучше другого.                                                                          neiros.ru                      
  - Неустойчивость на эквивалентных выборках.                                                                          ru.wikipedia.org                       Это может стать препятствием для воспроизводимости результатов эксперимента.                                                                          ru.wikipedia.org                      
  - Отсутствие указания на размер или важность наблюдаемого эффекта.                                                                          en.wikipedia.org                       Небольшое p-значение может наблюдаться для эффекта, который не является значимым.                                                                          en.wikipedia.org                      
  - Проблема множественных сравнений.                                                                          en.wikipedia.org                       Она возникает, когда одновременно рассматривается набор статистических выводов или выводится подмножество параметров, выбранных на основе наблюдаемых значений.                                                                          en.wikipedia.org                      
  - Влияние фактора случайности.                                                                          nplus1.ru                       Из-за случайности можно совершить ошибку второго рода, то есть принять нулевую гипотезу в качестве верной, хотя на самом деле это не так.                                                                          nplus1.ru                      
  
 Использование p-значений для проверки нулевых гипотез в работах по медицине и естественным наукам подвергается критике со стороны многих специалистов.                                                                          ru.wikipedia.org                       Некоторые специалисты предлагают заменить p-значения на альтернативные метрики доказательности, такие как доверительный интервал, отношение правдоподобий или коэффициент Байеса.                                                                          ru.wikipedia.org