优秀的编程知识分享平台

网站首页 > 技术文章 正文

想要学人工智能,你必须得先懂点统计学(6)统计学中的显著性水平、统计量和P值之间什么关系?

nanyue 2024-08-15 08:09:56 技术文章 5 ℃

在很多时候大家会看到这样的话语:“当统计量小于/大于某个值时,影响是显著的”;或者“当P值小于某个值时,影响是显著的”;或者“在0.05的显著性水平下,结果是显著的”。

今天作者就以但单因素方差分析的F统计量为例,给大家讲一讲显著性水平,统计量大小以及P值大小这三者之间的关系,如何根据P值怎么判断显著性,查表又怎么判断显著性。不是很清楚单因素方差分析的童鞋可以先简单回顾一下作者同系列的(4)方差分析概述和(5)单因素方差分析这两篇文章

看完之后大家就会明白其实这三者表达的是同一个意思,再也不会混淆了。用软件计算只要看一个P值就行,而手动计算的话往往使用查表法

提出假设

  • H0: m1 = m2 = m3 = m4

    • 即:颜色对销售量没有影响

  • H1: m1 ,m2 ,m3, m4不全相等

    • 即:颜色对销售量有影响

F统计量计算公式

F统计量计算公式

  • n全部观察值的个数

  • k因素水平的个数

一般软件的输出结果

一般我们做方差分析和假设检验都可以通过软件得到下图所示的一个结果,接下来分别讲述怎么分别通过F统计量值P值来判断颜色对销量到底有没有影响

  • F统计量值=10.486

  • P值=0.00047

单因素方差分析输出结果

F分布与拒绝域

  • 此题我们取显著性水平a=0.05

  • 前面已经讲过,如果颜色对销量没有影响,那么F值应该是趋近于1的;如果颜色对销量有影响F值就会大于1,当F值大到某种程度时,就说颜色对销量有显著影响

F分布与拒绝域

利用F值确定是否有显著影响——查表法

给定显著性水平a之后,我们就可以到F分布临界值表查到其对应自由度下分位点的值Fa,本例中v1=3,v2=16,查表得分位点值Fa=3.24,也就是说当我们算出的F值大于3.24时,就可以拒绝H0,我就可以说在0.05的显著性水平下,颜色对销量有显著影响,显然F值=10.486>Fa=3.24

F分布临界值表示例

利用P值确定是否有显著影响

一般软件计算结果都会直接给出P值,实际上本例中P值的具体含义就是,从F值开始到无穷大时分布曲线下的面积,我们知道从Fa到无穷大时分布曲线下的面积=显著性水平0.05,显然F值=10.486>Fa=3.24,因此可以预计F值开始到无穷大时分布曲线下的面积应该小于0.05,结果是P值=0.00047<0.05

因此当软件直接给出P值大小时,不用查表直接看P值大小就可以作出结论,比如此题P值=0.00047<0.05,我们可以说,在0.05的显著性水平下,颜色对销量有显著影响,甚至因为P值=0.00047<0.01,我们可以说,在0.01的显著性水平下,颜色对销量有显著影响,P值越小,颜色对销量的影响越显著

最近发表
标签列表