网站首页 > 技术文章 正文
本文内容参考来源:billiontrader.com/2016/08/04/measures-of-variability
假设一笔投资的回报情况是第一周盈利1元,第二周盈利10元,第三周盈利100元,那么每周盈利的均值=(1+10+100)/3=37元。
在这里,均值体现的是收益率分布的中心在哪里,但并没有体现出收益率的分布差异程度。因此在衡量一组数据的分布情况时,不能只看数据的集中程度,为了量化该组数据中某一具体数值分布的精确度以及与其他数据的分布偏离程度,需要借助一些衡量数据分布差异性的指标。
数据区间
数据区间是指该组数据中最大值和最小值之间的距离。
比如有三组数据:
1、(1,1,1)
2、(1, 1,2)
3、(1,2,3,4,5,100)
第一组数据分布的差异程度为1-1=0;第二组数据分布的差异程度为2-1=1;第三组数据分布的差异程度为100-1=99。在第三组数据中,分布差异最大的是100-1的99,但99并不代表第三组中各数据之间一般的分布情况,因此数据区间只体现数据组中最大值和最小值之间的差异程度而没有考虑数据分布的集中趋势。
均值偏差
均值偏差是指一组数据中各数据与均值之间的差异程度。
以下是另两组数据:
1、(5,5,5)
2、(6, 7,1,6,5)
这两组数据的均值均为(5+5+5)/3=(6+7+1+6+5)/5=5,如果计算一下各数据与均值5之间的差异程度就可以看出均值5是否很好地代表了整组数据的分布情况,如下图所示。
在第二组数据中,差异程度最大的是数据1与均值5之间的4,最常见的差异程度是1,因该差值出现的频率最高。
如何用一个数据来表示一组数据均值偏差的程度?如果将各数据的均值偏差值相加,结果肯定是零,因此解决方案有两个,以第二组数据为例:
第一、是将差值的绝对值相加,那么绝对值之和为8。
第二、是求该组数据中每一个数据的均值偏差的平方的和,那么均值偏差的平方的和为22。
在这两种解决方案中,第二种方法被认为更好一些,但22这个数字只是该组数据中各数据的均值偏差的平方的加总,既没有体现出数据分布的差异程度也没有体现出均值在代表数据分布情况方面的准确程度。
方差
方差是用一组数据中各数据的均值偏差的平方的和除以数据的总数
第二组数据的方差等于22/5=4.4,说明第二组数据中各数据的均值偏差的均值为4.4,但方差这个指标也有局限之处,第二组中均值偏差的绝对值最高的才是4,而4.4比4还高,因此方差用来描述数据的分布差异未免不太精确。
标准差
方差指标的缺陷导致标准差这个指标的登场,标准差是方差的开方,标准差具有方差的一切优点,但又规避了方差指标数值过大的弊端。
标准差=4.4^0.5=2.0976
中位数绝对偏差
与均值偏差这个概念非常相似的是中位数偏差,对一组数据中的各个数据按大小排序后处于中间位置上的数值即为中位数,计算各数据与中位数的差值,再对差值的绝对值进行大小排序,其中位数即被称为中位数绝对偏差,本例中为1,可以用Excel的MEDIAN函数计算得出。
与标准差相比,中位数偏差的绝对值更适合数据组中存在异常值的情况,因为标准差还是来自于均值偏差的平方,因此偏差大的数据对标准差的影响权重更大。而如果偏差较大的数据总量不多,对于中位数偏差的绝对值排序不会产生大的影响。
以标准普尔500指数的周度收盘价数据为例看看这几个指标在衡量数据分布方面的差异。
数据区间:
均值偏差:
方差和标准差:
中位数绝对偏差:
猜你喜欢
- 2024-09-26 上证指数符合正太分布(上证指数是负数代表什么)
- 2024-09-26 山顶洞人学机器学习之——中心极限定理(通俗理解版)
- 2024-09-26 1.数学期望 在概率论和统计学中,数学期望(或均值
- 2024-09-26 不懂统计和数据分析讲的是什么?看这篇就够了,干货值得收藏
- 2024-09-26 百分位数近似的工作原理(以及为什么它比平均值更有用)
- 2024-09-26 了解这5种常用的概率分布,能让你跳过不少坑
- 2024-09-26 SPSS各种均值比较(spss均数比较)
- 2024-09-26 笔试|考试必备!常用离散和连续型分布及其均值和方差
- 1514℃桌面软件开发新体验!用 Blazor Hybrid 打造简洁高效的视频处理工具
- 573℃Dify工具使用全场景:dify-sandbox沙盒的原理(源码篇·第2期)
- 513℃MySQL service启动脚本浅析(r12笔记第59天)
- 486℃服务器异常重启,导致mysql启动失败,问题解决过程记录
- 486℃启用MySQL查询缓存(mysql8.0查询缓存)
- 469℃「赵强老师」MySQL的闪回(赵强iso是哪个大学毕业的)
- 449℃mysql服务怎么启动和关闭?(mysql服务怎么启动和关闭)
- 447℃MySQL server PID file could not be found!失败
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (83)
- 主键只能有一个吗 (66)
- c#console.writeline不显示 (75)
- pythoncase语句 (81)
- es6includes (73)
- windowsscripthost (67)
- apt-getinstall-y (86)
- node_modules怎么生成 (76)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- js判断是否是json字符串 (67)
- checkout-b (67)
- c语言min函数头文件 (68)
- asynccallback (71)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- & (66)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)