P值到底在说啥？

P值指什么？

一句话概括一下最近对P值的争议，P值只代表概率，不代表因果。不能用P值来做命题真假的判断。

以下是摘抄自公众号文章。原文

无显著统计学差异并不能“证明”零假设（即两组不存在差异或基于某个特定结果某种处理方法无效），统计学上具有显著差异也未必能“证明”非零假设。

我们不能仅仅因为P值大于某个阈值（通常为0.05），或因为置信区间涵盖了0，而得出“无差异”或“无关联”的结论。我们也不能仅仅因为一项研究结果具有统计学显著性而另一项没有，便判定两项研究的结果存在冲突。这些误解不仅会浪费研究资源，有时甚至会误导决策。

我们并不是要求完全禁用P值，也并不否定在特定应用场景下P值可以做作为决策标准（例如评定某种制造工艺是否符合质控标准）。我们并非提倡毫无限制地得出实验结论，薄弱证据不可能突然变得可信。和过去几十年许多人提议的一样，我们呼吁停止以传统二分法方式使用P值来判定研究结果是否推翻或支持某一科学假设。