热搜: 食品  烟台  奶粉  保健品  海产品  周黑  黑窝点  黑作坊  全聚德  小龙虾 
 

格鲁布斯检验法确定离群数据

放大字体  缩小字体 发布日期:2018-08-20
核心提示:在检测检验工作中, 为了保证检测结果的准确性, 及时发现检验设备能力、人员技术能力或检测方法上的问题, 确保检测结果科学有效, 确保采取切合实际的科学有效的改进措施, 使技术能力不断完善。比对试验已成为实验室自我测评的重要有效的手段。
   在检测检验工作中, 为了保证检测结果的准确性, 及时发现检验设备能力、人员技术能力或检测方法上的问题, 确保检测结果科学有效, 确保采取切合实际的科学有效的改进措施, 使技术能力不断完善。比对试验已成为实验室自我测评的重要有效的手段。
 
  经常遇到2组或多组检测结果进行比较的情况, 通常进行的比对试验有实验室间比对, 设备比对或者人员比对等能力验证方式。能力验证是对试验结果的有效性评价与保障, 是实验室内部质量控制的重要补充。
 
  随着实验室能力的扩展、试验设备的增添及设备的更新换代, 现在同一个试验项目可以用多个相同型号或不同型号的仪器或设备来完成。为了评估实验室内不同的试验仪器或设备对试验结果造成的影响并设法加以控制, 通常启动实验室内部设备比对试验进行。
 
  在一组平行测定的数据中, 常会出现个别数据与其他数据相差较大, 但这个数据的保留还是舍弃会对试验结果的准确性产生非常大的影响。如果能确系找到引起过失的原因, 则坚决舍弃该数值, 但如果找不到确切的原因, 随便舍弃一个数据是不科学的, 应该通过具体的科学的方法及充分的依据进行有效的统计计算方法, 判断为离群值后才能舍弃。由于数据的取舍是对过失误差的判断, 统计计算方法选用适当与否直接关系到对试验结果的评价。
 
  1 Grubbs检验法
 
  Grubbs检验法是检验异常值的统计检验方法之一。以前由于计算量大, 且一次只能检出一个异常值, 在剔除离群值时被其他的检验方法所代替。随着计算机的广泛应用, Grubbs检验离群数据的计算可以用Microsoft Excel来处理, 解决了该方法的计算量大的难题。经过比较, 在剔除离群值的统计计算方法中, 格鲁布斯检验法不但适用于一组数据中有一个或多个可疑值的舍弃, 而且对有限次测定均适用。是测定可疑值的最可靠的检验方法。格鲁布斯检验法的临界值表有2种:一种是单尾检验, 一种为双尾检验。在实际应用中测试出的数据可疑值可以是最大, 也可以是最小, 所以常采用双尾检验的临界值。
 
  假设测量结果服从正态分布。计算出n个测量值的平均值和标准偏差。如计算的统计量大于等于格鲁布斯检验临界值表中给出的对应置信区间下的临界值, 则判定该值为离群值, 舍去。如果计算的统计量小于格鲁布斯检验临界值表中给出的对应置信区间下的临界值, 则不属于离群值, 给予保留。
 
  2 统计分析的设计及能力评价
 
  2.1 统计分析的设计
 
  样品的均匀一致性是进行能力验证的基础。强度试验是破坏性试验, 同一样品无法进行重复试验。只能通过从完整的有代表性的试样中进行均匀性试验来选取均匀一致性的样品。按照CNAS-GL03《能力验证样品均匀性和稳定性评价指南》要求选择。对每个样品进行单独编号。每个样品按照标准要求切割成长度为140 mm长。钢丝公称直径为1.00mm。选取的拉力试验机分别为LDW-10 (A) 和LDW-30 (B) 的2台经省计量院检定合格, 设备准确度均为Ⅰ级, 示值误差为±1.0%的电子拉力试验机进行比对。试验由有经验的技术人员进行操作。环境温度为19.8℃。满足GB/T228.1-2010试验标准要求。试样为分割样。2台设备同时进行试验。数据经确认无误后记录。测得的试验原始数据见表1。
  表1 拉力试验原始数据
 
  2.2 数据的处理
 
  把所测得的数据按照从小到大的顺序进行排列, 排序后的表格见表2。计算出最大值、最小值、平均值、标准偏差。
 
  计算最大值、最小值、平均值和标准偏差对于用计算机的Microsoft Excel表格来处理是非常的简单快捷。
 
  首先计算平均值和标准偏差:
 
  平均值的计算公式为:
  表2 排列后的试验数据
  标准偏差的计算公式为:
  注:n为样本数量。
 
  按照公式计算出本次试验中的数据平均值及标准偏差见表3。
  表3 试验数据的平均值及标准偏差
 
  通过比较发现, 2组数值的中位值相同而平均值略有不同。可见中位值这个稳健的统计量不受数据中离群值的影响。标准偏差是一种度量数据分布的分散程度的标准, 用以衡量数据偏离的程度, 标准偏差越小, 这些值偏离平均值就越小。
 
  2.3 确定检验端
 
  A设备对应的最大值与平均值之差0.024 k N, 最小值与平均值之差为0.039 k N;B设备对应的最大值与平均值之差为0.024 k N, 最小值与平均值之差为0.056 k N。先检验差值大的。
 
  2.4 计算
 
  根据Grubbs检验法公式
假设B设备测量数据中的1.28为可疑值, 那么计算
。根据检验的一般情况, 我们将置信度选择95%的置信区间。查Grubbs值表得出G (0.95, 18) =2.65, 将Gj与G (p, n) 相比较得出Gj小于G表。说明我们的假设不成立, 1.28这个数值保留。用同样的方法假设1.36为可疑值, 计算Gj (大) =0.289, 同样小于G (0.95, 18) =2.65。此数据保留。通过计算比较得出B设备测出的所有数据均没有离散值。然后计算A设备的Gj, 得出Gj (小) =0.558, Gj (大) =0.3所有测量值也均小于G (p, n) 。通过计算和查表得出2台设备的测量数据均没有离群值即没有过失误差。格鲁布斯检验法保证了数据统计结果的准确性和有效性。是进行设备比对这一能力验证的基本统计方法。以便于进行后续的随机误差和系统误差的检验。格鲁布斯临界值表 见表4。
 
  表4 Grubbs临界值表 (双尾)
  随着科技的发展, 许多新的检验设备和检验手段在日益完善。处理数据的方法会越来越广泛的得到关注。在分析试验中, 离群值是客观存在的, 不能随意的舍弃或保留, 要对可疑数据的来源进行客观科学的分析。比对试验结果数据的统计分析是做出比对试验结果评价的基础依据。所以试验结果数据的统计计算方法的选用是否合适是非常重要的。所选用的统计计算方法既要与比对试验项目和试验范围相适应, 又能反映出结果数据的差异程度, 又能避免极个别离群数据对整体试验结果的干扰。统计计算方法选用适当与否直接会关系到试验结果的评价。可疑值的取舍统计学常用的处理方法有Q检验法, 迪克逊法, 格鲁布斯检验法等。通过实际计算比较, 格鲁布斯检验法是剔除异常数据最好的方法。格鲁布斯检验法既可用于一组测量值的一致性检验和剔除一组测量中的离群值, 又可用于多组测量值的均值的一致性检验和剔除多组测量中的离群均值。优点是能将正态分布的2个最重要的参数—平均值和标准偏差引进来, 准确性高。在进行可疑值数据取舍时要注意:在弃去一个可疑值后, 若对下一个可疑值进行检验, 必须重新计算弃去可疑值后剩余数据的平均值和标准偏差。检验第二个可疑值时, 置信水平要适当提高。可疑值检验的是过失误差, 在保证没有过失误差的基础上再进行随机误差和系统误差的检验。
 
 
[ 检测应用搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 
推荐图文
推荐检测应用
点击排行
  

鲁公网安备 37060202000213号