P值指什么?
一句话概括一下最近对P值的争议,P值只代表概率,不代表因果。不能用P值来做命题真假的判断。
以下是摘抄自公众号文章。原文
无显著统计学差异并不能“证明”零假设(即两组不存在差异或基于某个特定结果某种处理方法无效),统计学上具有显著差异也未必能“证明”非零假设。
我们不能仅仅因为P值大于某个阈值(通常为0.05),或因为置信区间涵盖了0,而得出“无差异”或“无关联”的结论。我们也不能仅仅因为一项研究结果具有统计学显著性而另一项没有,便判定两项研究的结果存在冲突。 这些误解不仅会浪费研究资源,有时甚至会误导决策。
我们并不是要求完全禁用P值,也并不否定在特定应用场景下P值可以做作为决策标准(例如评定某种制造工艺是否符合质控标准)。我们并非提倡毫无限制地得出实验结论,薄弱证据不可能突然变得可信。和过去几十年许多人提议的一样,我们呼吁停止以传统二分法方式使用P值来判定研究结果是否推翻或支持某一科学假设。