在统计分析中, 方差 数据集的成员之间显示数据点与趋势线的距离,也称为a 回归线 。方差越大,数据点的分布越多。方差分析的研究表明,方差的哪些部分可以用数据的特征来解释,哪些部分可以归因于随机因素。 无法解释的方差部分称为残差方差.
使用Excel电子表格计算残差方差
计算残差方差的公式涉及许多复杂的计算。对于小数据集,手动计算残差方差的过程可能很繁琐。对于大型数据集,任务可能会耗费精力。通过使用Excel电子表格,您只需输入数据点并选择正确的公式。该程序处理复杂的计算并快速提供结果。
数据点
打开一个新的Excel电子表格并将数据点输入两列。回归线要求每个数据点都有两个元素。统计人员通常将这些元素标记为“X”和“Y”。例如,Generic Insurance Co.希望找到员工身高和体重的剩余差异。 X变量表示高度,Y变量表示重量。在A列输入高度,在B列输入重量。
找到平均值
该 意思 表示数据集中每个元素的平均值。在此示例中,Generic Insurance希望找到10名员工的身高和体重的平均值,标准差和协方差。通过在单元格F1中输入函数“= AVERAGE(A1:A10)”,可以找到A列中列出的高度的平均值。通过在单元格F3中输入函数“= AVERAGE(B1:B10)”,可以找到B列中列出的重量的平均值。
找到标准偏差和协方差
该 标准差 衡量数据点与平均值之间的距离。该 协方差 测量数据点的两个元素一起变化多少。通过在单元格F2中输入函数“= STDEV(A1:A10)”,可以得到高度的标准偏差。通过在单元格F4中输入函数“= STDEV(B1:B10)”来找到权重的标准偏差。通过在单元格F5中输入函数“= COVAR(A1:A10; B1:B10)”来找到高度和权重之间的协方差。
寻找回归线
该 回归线 表示遵循数据点趋势的线性函数。回归线的公式如下所示:Y = aX + b。
用户可以通过使用平均值,标准偏差和协方差的计算来找到“a”和“b”的值。 “b”的值表示回归线截取Y轴的点。可以通过取协方差并将其除以X值的标准偏差的平方来找到该值。 Excel公式进入单元格F6,如下所示:= F5 / F2 ^ 2。
“a”的值表示回归线的斜率。 Excel公式进入单元格F7,如下所示:= F3-F6 * F1。
要查看回归线的公式,请在单元格F8中输入此字符串并置:
= CONCATENATE(“Y =”; ROUND(F6; 2);“X”; IF(SIGN(F7)= 1;“+”;“ - ”); ABS(ROUND(F7; 2)))
计算Y值
下一步涉及计算数据集中给定X值的回归线上的Y值。找到Y值的公式进入C列,如下所示:
= $ F $ 6 * A(ⅰ)+ $ F $ 7
其中A(i)是行(i)中A列的值。公式在电子表格中如下所示:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7,依此类推
D列中的条目显示Y的预期值和实际值之间的差异。公式如下所示:
= B(I)-C(i)中,
其中B(i)和C(i)分别是列B和C中的行(i)中的值。
找出残差方差
该 残差方差的公式 进入Cell F9,看起来像这样:
= SUMSQ(D1:D10)/(COUNT(D1:D10)-2)
其中SUMSQ(D1:D10)是实际和预期Y值之差的平方和,(COUNT(D1:D10)-2)是数据点的数量,减去2的自由度。数据。