统计学中最基本的概念之一是平均值,或 算术平均值, 一组数字。均值表示数据集的中心值。该 方差 数据集的度量衡量该数据集的元素从均值中分散的程度。数字均接近均值的数据集将具有低方差。那些数字远高于或低于均值的集合将具有很大的差异。
计算数据集的平均值
计算平方差异
下一步涉及计算数据集中每个元素与均值之间的差异。由于某些元素将高于平均值而某些元素将更低,因此方差计算使用差异的平方。
第1天销售 - 平均销售额:62,000美元 - 65414.29美元=( - 3,414.29美元); (-3,414.29)2 = 11,657,346.94
第2天销售 - 平均销售额:64,800- $ 65414.29 =( - $ 614.29); (-614.29)2 = 377,346.94
第3天销售 - 平均销售额:62,600美元 - 65414.29美元=( - 2,814.29美元); (-2,814.29)2 = 7,920,204.08
第4天销售 - 平均销售额:69,200美元 - 65414.29美元=(+ 3,785.71美元); (+3,785.71)2 = 14,331,632.65
第5天销售 - 平均销售额:66,000美元 - 65414.29美元=(+ 585.71美元); (585.71)2 = 343,061.22
第6天销售 - 平均销售额:63,900美元 - 65414.29美元=( - 1,514.29美元); (-1,514.29)2 = 2,293,061.22
第7天销售 - 平均销售额:69,400美元 - 65414.29美元=(+ 3,985.71美元); (+3,985.71)2 = 15,885,918.37
注意:平方差异不以美元计算。这些数字用于下一步计算方差。
方差和标准差
方差定义为平方差的平均值。
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
由于方差使用差的平方,方差的平方根将给出实际扩散的更清晰的指示。在统计中,方差的平方根称为 标准差.
SQRT(7,544,081.63)= 2,746.65美元
用于方差和标准偏差
方差和标准差在统计分析中都非常有用。方差衡量数据集从平均值的总体传播。标准偏差有助于检测 离群,或者偏离平均值太远的数据集的元素。
在上面的数据集中,差异非常大,只有两个每日销售总额达到平均值1,000美元以内。数据集还显示,七个每日销售总额中有两个比平均值高出一个标准差,而另外两个比平均值低一个标准差。