在进行科学或统计分析时,数据精确度是最重要的考虑因素之一。通常与同样重要的准确性概念相混淆,由夏威夷大学表达的飞镖类比法证明了这种关系:准确的数据点平均值与预期结果相等,而精确的数据点紧密聚集在一起,即使它们不接近预期结果。根据达特茅斯学院的说法,精确度是衡量一组结果的可重复性的指标。即使在技术相关的努力中,数据集的精确性也是一个重要的概念,正如德克萨斯大学奥斯汀分校的Kenneth E. Foote和Donald J. Huebner对地理信息系统的分析所示。计算精度是一个相当简单但有点主观的练习。
你需要的物品
-
数据集的图形表示
-
有关数据中表达的相关单位的信息
-
实验中允许的最小误差范围
开发数据点的可视化表示,例如散点图。非常简单的可视化表示涉及在笛卡尔坐标系上绘制每个数据点的相应的相关和独立变量值。
评估数据点的分组并查找模式。精确数据显示在数据点集群中,表明类似的输入变量与类似的输出变量相关。
应用用于收集数据的测量单位的信息,以确定数据点之间的平均间距。可以使用简单的标尺测量来确定图形上的点之间的距离,然后使用对应于用于生成数据点的测量单位的任意,方便的标度进行转换。这将允许通过取平均距离来计算数据点相对于彼此的精度。
比较实验中允许的最小误差范围和数据点的平均精度,以确定实验的相对总体精度。不同类型的实验将具有更大或更小的误差容忍度:工程项目可能需要精确到非常小的单位,而社会实验可能会容忍更多的差异。
提示
-
在创建数据点的图形表示之前,尝试评估可能的单位比例。这样可以更容易地在视觉上评估精度,以便识别任何特别显着的精度或不精确的区域。
在视觉表示上发生的清晰数据模式高度指示了实验的精确度和可重复性。持续的实验应该在已经存在的精确集群中添加更多的数据点。
警告
不要将准确性与精确度混淆。如果实验的目标是实现所有输入的给定的平均输出值,并且这通过-12到14的平均值来实现,则这不可能是精确的测量,尽管它可能是准确的。精确测量可能导致所有数据点聚集在17左右,这将是不准确的,但是精确且因此是可预测的。