Некоторые аргументы, на которых строится критика использования p-значений в научных исследованиях:
  - Ошибки первого рода.                                                                          ru.wikipedia.org                       Использование p-значений нередко приводит к ложноположительным заключениям.                                                                          ru.wikipedia.org                       
  - Неправильная интерпретация.                                                                          ru.wikipedia.org                       P-значение часто неверно понимается как вероятность того, что нулевая гипотеза верна.                                                                          ru.wikipedia.org                       Также критикуется практика принятия альтернативной гипотезы для любого p-значения, номинально меньшего 0,05, без других подтверждающих доказательств.                                                                          ru.wikipedia.org                      
  - Зависимость от размера выборки.                                                                          hum-ecol.ru                       Мощность статистического критерия зависит от объёма выборки.                                                                          hum-ecol.ru                       Например, p=0,005 на малой выборке будет отсекать интересующий эффект, а с ростом выборки даже такого значения не хватит, чтобы отсечь неинформативные случайные находки.                                                                          hum-ecol.ru                      
  - Манипуляции авторов работ.                                                                          nplus1.ru                       Научные журналы предпочитают публиковать именно статистически значимые результаты, и иногда авторы работ используют статистические манипуляции, чтобы подогнать результаты под этот критерий.                                                                          nplus1.ru                      
  
 В качестве альтернативы p-значениям некоторые специалисты предлагают использовать другие метрики доказательности, такие как доверительный интервал, отношение правдоподобий или коэффициент Байеса.                                                                          ru.wikipedia.org                       
 Однако не все учёные согласны с такими предложениями.                                                                          nplus1.ru                       Например, философ науки Дебора Майо считает, что отказ от понятия статистической значимости позволит учёным занижать важность отрицательных результатов и откроет дорогу к манипуляциям выводами.                                                                          nplus1.ru