色散度量了数据集的数据点分布范围。标准偏差受极端异常值的严重影响,而极端异常值又会影响平均值。平均绝对偏差基于中值,其可以提供核心数据的度量而不受少数极端数据点的影响。根据Naval Bajpai的“商业统计”,中位数绝对偏差(MAD)提供了一个绝对的分散度量,不受极端异常值影响,可以根据平均值和标准偏差进行统计分析。
你需要的物品
-
数据集
-
计算器
计算中位数
列出数据集中从最小到最大的所有观察结果。如果某个数字出现多次,请将其列出的次数与发生次数相同。
计算观察数量。
将观察次数除以2.如果观察数为奇数,因此不能均匀划分,则中间观察值为中位数。否则,这两个中间数的平均值是中间点。
取两个位于中间点上方和下方的观察结果。然后平均这两个观察结果。该值是中位数。
计算中位数绝对偏差
从中位数中减去数据集中的每个值。这给出了每个数据点与中值的偏差。
总计数据集的所有偏差。这可以通过使用计算器来加速。
将观察数量除以数据集的所有偏差的总和除以。结果是中位数绝对偏差。
提示
-
根据“分析科学家的实用统计”一书,虽然MAD不是标准偏差的估计,但如果数据分布近似正常,则将MAD乘以1.483可提供标准偏差的近似估计。
警告
基于中位数的统计数据不能用于六个基于sigma质量的统计数据。