《【教学课件】第1章分析化学中的数据处理.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第1章分析化学中的数据处理.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1章分析化学中的数据处理1.1 分析化学中的误差概念分析化学中的误差概念1.2 有效数字及其运算规则有效数字及其运算规则1.3 随机误差的正态分布随机误差的正态分布1.4 少量数据的统计处理少量数据的统计处理1.1分析化学中的误差概念一、一、误差的分类及产生的原因误差的分类及产生的原因二、误差的表示方法二、误差的表示方法1 准确度和误差准确度和误差2 精密度和偏差精密度和偏差3 准确度和精密度的关系准确度和精密度的关系三、提高分析结果准确度的方法三、提高分析结果准确度的方法(一)系统误差(可定误差)(一)系统误差(可定误差)(一)系统误差(可定误差)(一)系统误差(可定误差):由可定原因产生
2、由可定原因产生由可定原因产生由可定原因产生一、误差的分类及产生的原因1特点:具单向性(大小、正负一定特点:具单向性(大小、正负一定)可测性(原因固定)可测性(原因固定)重复性重复性(重复测定重复出现重复测定重复出现)2分类:分类:(1)按来源分)按来源分 a方法误差:方法不恰当产生方法误差:方法不恰当产生 b仪器与试剂误差:仪器不精确和试剂中含仪器与试剂误差:仪器不精确和试剂中含被测组分或不纯组分产生被测组分或不纯组分产生 c操作误差:操作误差:操作方法不当引起操作方法不当引起(二)偶然误差(随机误差,不可定误差):由不确定原因引起由不确定原因引起由不确定原因引起由不确定原因引起特点:特点:1
3、)1)不具单向性(大小、正负不定)不具单向性(大小、正负不定)2)2)不可消除(原因不定)不可消除(原因不定)但可减小(测定次数但可减小(测定次数)3)3)分布服从统计学规律(正态分布)分布服从统计学规律(正态分布)二、误差的表示方法(一)准确度与误差(一)准确度与误差(二)精密度与偏差(二)精密度与偏差(三)准确度与精密度的关系(三)准确度与精密度的关系 (一一)准确度与误差准确度与误差1 1准确度准确度准确度准确度:指测量结果与真值的接近程度:指测量结果与真值的接近程度2 2误差误差(1 1)绝对误绝对误差差差差:测量值与真实值之差:测量值与真实值之差 (2 2)相相相相对误对误差差差差:
4、绝对误差占真实值的百分比:绝对误差占真实值的百分比 注:注:1 1)测高含量组分,)测高含量组分,RERE可小;测低含量组分,可小;测低含量组分,RERE可大可大 2 2)仪器分析法)仪器分析法测低含量组分,测低含量组分,RERE大大 化学分析法化学分析法测高含量组分,测高含量组分,RERE小小(二)精密度与偏差(二)精密度与偏差1 1精密度精密度精密度精密度:平行测量的各测量值间的相互接近程度:平行测量的各测量值间的相互接近程度2 2偏差:偏差:(1 1)绝对偏差)绝对偏差 :单次测量值与平均值之差:单次测量值与平均值之差 (2 2)相对偏差:绝对偏差占平均值的百分比)相对偏差:绝对偏差占平
5、均值的百分比(5 5)标准偏差:)标准偏差:(6 6)相对标准偏差(变异系数)相对标准偏差(变异系数)(3 3)平均偏差:各测量值绝对偏差的算术平均值)平均偏差:各测量值绝对偏差的算术平均值 (4 4)相对平均偏差:平均偏差占平均值的百分比)相对平均偏差:平均偏差占平均值的百分比当测定次数非常多时,标准偏差与平均偏差有未知未知已知已知(三)准确度与精密度的关系(三)准确度与精密度的关系1.1.准确度高,要求精密度一定高准确度高,要求精密度一定高准确度高,要求精密度一定高准确度高,要求精密度一定高 但精密度好,准确度不一定高但精密度好,准确度不一定高但精密度好,准确度不一定高但精密度好,准确度不
6、一定高福州大学福州大学2005年年,5分分如何表征分析结果的准确度和重现性如何表征分析结果的准确度和重现性?两者之间的关系两者之间的关系?精密度是保证准确度的先决条件。精密度差,所精密度是保证准确度的先决条件。精密度差,所精密度是保证准确度的先决条件。精密度差,所精密度是保证准确度的先决条件。精密度差,所测结果不可靠,就失去了衡量准确度的前提。测结果不可靠,就失去了衡量准确度的前提。测结果不可靠,就失去了衡量准确度的前提。测结果不可靠,就失去了衡量准确度的前提。高的精密度不一定能保证高的准确度。高的精密度不一定能保证高的准确度。高的精密度不一定能保证高的准确度。高的精密度不一定能保证高的准确度
7、。2.准确度反映了测量结果的正确性准确度反映了测量结果的正确性 精密度反映了测量结果的重现性精密度反映了测量结果的重现性2、以下论述正确的是A、单次测定偏差的代数和为零B、总体平均值就是真值C、偏差用S表示 D、随机误差有单向性1、以下情况产生的误差属于系统误差的是:A 称量时读错了砝码B 试剂中含有少量干扰测定的离子C 滴定时有溶液溅出D 滴定管读数最后一位估测不准测定值与真实值接近的程度误差的大小3、下列定义中正确的是A 绝对误差是测量值与平均值之间的差B 相对误差是绝对误差在真值中所占百分比的分数C 总体平均值就是真值D 偏差是测定值与真值之差4、分析结果的准确度是指 ,准确度的高低 用
8、 衡量。5、从精密度好就可以判断分析结果可靠的前提是A 随机误差小 B 系统误差小 C 平均偏差小 D 相对偏差小6、以下有关系统误差的论述错误的是A 系统误差有单向性 B 系统误差有随机性 C 系统误差是可测误差 D 系统误差是由一定原因造成的三、提高分析结果准确度的方法三、提高分析结果准确度的方法1 1选择合适的分析方法选择合适的分析方法选择合适的分析方法选择合适的分析方法(1)(1)根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或根据试样的中待测组分的
9、含量选择分析方法。高含量组分用滴定分析或重量分析法;低含量用仪器分析法。重量分析法;低含量用仪器分析法。重量分析法;低含量用仪器分析法。重量分析法;低含量用仪器分析法。(2)(2)充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。(3)(3)对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后对于痕量组分,分析方法的灵敏度不
10、能满足分析的要求,可先定量富集后对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定再进行测定再进行测定再进行测定.例:例:例:例:测全测全测全测全FeFe含量含量含量含量 K K2 2CrCr2 2OO7 7法法法法 40.20%0.2%40.20%40.20%0.2%40.20%比色法比色法比色法比色法 40.20%2.0%40.20%40.20%2.0%40.20%2 2减小测量误差减小测量误差减小测量误差减小测量误差1 1)称量)称量)称量)称量 例:例:例:例:天平一次的称量误差为天平一次的称量误差为天平一次的称量误差为天平一次的称量误差为 0.0001g 0.
11、0001g,两次的称量误差为,两次的称量误差为,两次的称量误差为,两次的称量误差为 0.0002g 0.0002g,RE%0.1%RE%0.1%,计算最少称样量?,计算最少称样量?,计算最少称样量?,计算最少称样量?2 2)滴定)滴定)滴定)滴定 例:例:例:例:滴定管一次的读数误差为滴定管一次的读数误差为滴定管一次的读数误差为滴定管一次的读数误差为0.01mL0.01mL,两次的读数误差为,两次的读数误差为,两次的读数误差为,两次的读数误差为 0.02mL 0.02mL,RE%0.1%RE%0.1%,计算最少移液体积?,计算最少移液体积?,计算最少移液体积?,计算最少移液体积?3 3增加平行
12、测定次数,一般测增加平行测定次数,一般测增加平行测定次数,一般测增加平行测定次数,一般测3 34 4次以减小偶然误差次以减小偶然误差次以减小偶然误差次以减小偶然误差4 4消除测量过程中的系统误差消除测量过程中的系统误差消除测量过程中的系统误差消除测量过程中的系统误差1 1)校准仪器:消除仪器的误差)校准仪器:消除仪器的误差)校准仪器:消除仪器的误差)校准仪器:消除仪器的误差2 2)空白试验:消除试剂误差)空白试验:消除试剂误差)空白试验:消除试剂误差)空白试验:消除试剂误差3 3)对照实验:消除方法误差)对照实验:消除方法误差)对照实验:消除方法误差)对照实验:消除方法误差4 4)回收实验:加
13、样回收,以检验是否存在方法误差)回收实验:加样回收,以检验是否存在方法误差)回收实验:加样回收,以检验是否存在方法误差)回收实验:加样回收,以检验是否存在方法误差1.2 有效数字及其运算规则一、有效数字一、有效数字二、有效数字的修约规则二、有效数字的修约规则 三、有效数字的运算法则三、有效数字的运算法则一、有效数字:实际可以测得的数字实际可以测得的数字1.1.有效数字位数包括所有准确数字和一位欠准数字有效数字位数包括所有准确数字和一位欠准数字 例:滴定读数例:滴定读数20.30mL20.30mL,最多可以读准三位,最多可以读准三位 第四位欠准(估计读数)第四位欠准(估计读数)1%1%记录测量结
14、果时,只保留一位可疑数据记录测量结果时,只保留一位可疑数据 分析天平称量质量:分析天平称量质量:0.000Xg0.000Xg 滴定管体积滴定管体积:0.0X mL:0.0X mL 容量瓶容量瓶:100.0mL,250.0mL,:100.0mL,250.0mL,50.0mL50.0mL 吸量管吸量管,移液管移液管:25.00mL,:25.00mL,10.00mL,10.00mL,5.00mL,1.00mL 5.00mL,1.00mL pH:0.0X pH:0.0X 单位单位 吸光度吸光度:0.00X:0.00X4 4pHpH,pMpM,pKpK,lgClgC,lgKlgK等对数值,其有效数字的等
15、对数值,其有效数字的 位数取决于小数部分(尾数)数字的位数,整数部位数取决于小数部分(尾数)数字的位数,整数部 分只代表该数的方次分只代表该数的方次 例:例:pH=11.20 HpH=11.20 H+=6.310=6.310-12-12mol/L mol/L 两位两位5 5结果首位为结果首位为8 8和和9 9时,有效数字可以多计一位时,有效数字可以多计一位 例:例:90.0%90.0%,可示为四位有效数字,可示为四位有效数字 2.2.在在0909中,只有中,只有0 0既是有效数字,又是无效数字既是有效数字,又是无效数字 例:例:0.06050 0.06050 四位有效数字四位有效数字 定位定位
16、 有效位数有效位数 例:例:3600 3.6103 3600 3.6103 两位两位 3.60103 3.60103 三位三位3 3单位变换不影响有效数字位数单位变换不影响有效数字位数 例:例:10.00mL0.01000L10.00mL0.01000L 分析结果表示的有效数字分析结果表示的有效数字 高含量(大于高含量(大于10%):):4位有效数字位有效数字 含量在含量在1%至至10%:3位有效数字位有效数字 含量小于含量小于1%:2位有效数字位有效数字 分析中各类误差的表示分析中各类误差的表示 通常取通常取1 至至 2位有效数字。位有效数字。各类化学平衡计算各类化学平衡计算 2至至3位有效
17、数字。位有效数字。下列数据中包含了几位有效数字?(1)10.030含 位;(2)0.01200含 位;(3)8.710-4含 位;(4)pKa=5.52含 位;(5)pH=10.00含 位二、有效数字的修约规则1 1四舍六入五留双四舍六入五留双2 2只能对数字进行一次性修约只能对数字进行一次性修约3 3当对标准偏差修约时,修约后会使标准偏差结果当对标准偏差修约时,修约后会使标准偏差结果 变差,从而提高可信度变差,从而提高可信度 例:例:s=0.134s=0.134 修约至修约至0.140.14,可信度,可信度 例:例:0.374560.37456 ,0.37450.3745 均修约至三位有效数
18、字均修约至三位有效数字例:例:6.5496.549,2.4512.451 一次修约至两位有效数字一次修约至两位有效数字0.3740.375 6.5 2.5三、有效数字的运算法则1 1加减法:以小数点后位数最少的数为准(即以加减法:以小数点后位数最少的数为准(即以 绝对误差最大的数为准)绝对误差最大的数为准)2 2乘除法:以有效数字位数最少的数为准(即以乘除法:以有效数字位数最少的数为准(即以 相对误差最大的数为准)相对误差最大的数为准)例:例:例:例:50.1 50.1 +1.45 +0.5812 =+1.45 +0.5812 =?0.10.1 0.01 0.0001 0.01 0.0001例
19、:例:例:例:0.01210.0121 25.64 1.05782=25.64 1.05782=?0.0001 0.01 0.00001 0.0001 0.01 0.00001 RE RE 0.8%0.8%0.4%0.009%0.4%0.009%保留三位有效数字保留三位有效数字保留三位有效数字保留三位有效数字保留三位有效数字保留三位有效数字保留三位有效数字保留三位有效数字常用的加减法规则指出常用的加减法规则指出:结果小数后的位结果小数后的位数以参加运算各数据中小数点后的位数数以参加运算各数据中小数点后的位数最少者为准最少者为准实际上规则指的是纯小数实际上规则指的是纯小数,本题计算的是科学本题计
20、算的是科学记数法构成的正整数记数法构成的正整数.不能直接引用规则不能直接引用规则.5.856中的中的6是整数的千位是整数的千位,是是3个数据中可个数据中可疑数字的最高位疑数字的最高位,故应以此为准故应以此为准.计算下式的结果应为计算下式的结果应为:因为25.4508-21.52=3.94 结果应以此为准1.3随机误差的正态分布 一、一、一、一、频数分布频数分布频数分布频数分布 测定某样品测定某样品测定某样品测定某样品100100次,因有偶然误差存在,故分析结果有高有低,有次,因有偶然误差存在,故分析结果有高有低,有次,因有偶然误差存在,故分析结果有高有低,有次,因有偶然误差存在,故分析结果有高
21、有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。1.3随机误差的正态分布二、二、二、二、正态分布正态分布正态分布正态分布:测测测测量量量量数数数数据据据据一一一一般般般般符符符符合合合合正正正正态态态态分分分分布布布布规规规规律律律律,即即即即高高高高斯斯斯斯分分分分布布布布,正正正正态分布曲线数学表达式为:态分布曲线数学表达式为:态分布曲线数学表达式为:态分布曲线数学表达式为:n n y y:概率密度
22、;:概率密度;:概率密度;:概率密度;x x:测量值:测量值:测量值:测量值n n:总总总总体体体体平平平平均均均均值值值值,即即即即无无无无限限限限次次次次测测测测定定定定数数数数据据据据的的的的平平平平均均均均值值值值,无无无无系系系系统统统统误差时即为真值;反映测量值分布的集中趋势。误差时即为真值;反映测量值分布的集中趋势。误差时即为真值;反映测量值分布的集中趋势。误差时即为真值;反映测量值分布的集中趋势。n n:标准偏差,反映测量值分布的分散程度;:标准偏差,反映测量值分布的分散程度;:标准偏差,反映测量值分布的分散程度;:标准偏差,反映测量值分布的分散程度;n nx-x-x-x-:随
23、机误差:随机误差:随机误差:随机误差正态分布曲线规律:正态分布曲线规律:正态分布曲线规律:正态分布曲线规律:*x=x=时时时时,y y y y值值值值最最最最大大大大,体体体体现现现现了了了了测测测测量量量量值值值值的的的的集集集集中中中中趋趋趋趋势势势势。大大大大多多多多数数数数测测测测量量量量值值值值集集集集中中中中在在在在算算算算术术术术平平平平均均均均值值值值的的的的附附附附近近近近,算算算算术术术术平平平平均均均均值值值值是是是是最最最最可可可可信信信信赖赖赖赖值值值值,能能能能很很很很好好好好反反反反映映映映测测测测量量量量值值值值的集中趋势。的集中趋势。的集中趋势。的集中趋势。反
24、映测量值分布集中趋势。反映测量值分布集中趋势。反映测量值分布集中趋势。反映测量值分布集中趋势。*曲曲曲曲线线线线以以以以x=x=这这这这一一一一直直直直线线线线为为为为其其其其对对对对称称称称轴轴轴轴,说说说说明明明明正正正正误误误误差和负误差出现的概率相等。差和负误差出现的概率相等。差和负误差出现的概率相等。差和负误差出现的概率相等。*当当当当x x趋趋趋趋于于于于或或或或时时时时,曲曲曲曲线线线线以以以以轴轴轴轴为为为为渐渐渐渐近近近近线线线线。即即即即小小小小误误误误差差差差出出出出现现现现概概概概率率率率大大大大,大大大大误误误误差差差差出出出出现现现现概概概概率率率率小小小小,出现很
25、大误差概率极小,趋于零。出现很大误差概率极小,趋于零。出现很大误差概率极小,趋于零。出现很大误差概率极小,趋于零。*越越越越大大大大,测测测测量量量量值值值值落落落落在在在在附附附附近近近近的的的的概概概概率率率率越越越越小小小小。即即即即精精精精密密密密度度度度越越越越差差差差时时时时,测测测测量量量量值值值值的的的的分分分分布布布布就就就就越越越越分分分分散散散散,正正正正态态态态分分分分布布布布曲曲曲曲线线线线也也也也就就就就越越越越平平平平坦坦坦坦。反反反反之之之之,越越越越小小小小,测测测测量量量量值值值值的的的的分分分分散散散散程程程程度度度度就就就就越越越越小小小小,正正正正态态
26、态态分分分分布布布布曲曲曲曲线线线线也也也也就就就就越越越越尖锐。尖锐。尖锐。尖锐。反映测量值分布分散程度。反映测量值分布分散程度。反映测量值分布分散程度。反映测量值分布分散程度。1.31.3随机随机误误差的正差的正态态分布分布标准正态分布曲线标准正态分布曲线标准正态分布曲线标准正态分布曲线 横坐标改为横坐标改为横坐标改为横坐标改为u u,纵坐标,纵坐标,纵坐标,纵坐标为概率密度,此时曲线的为概率密度,此时曲线的为概率密度,此时曲线的为概率密度,此时曲线的形状与形状与形状与形状与大小无关,不同大小无关,不同大小无关,不同大小无关,不同的曲线合为一条。的曲线合为一条。的曲线合为一条。的曲线合为一
27、条。三、三、三、三、随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差的区间概率 正态分布曲线与横坐标正态分布曲线与横坐标正态分布曲线与横坐标正态分布曲线与横坐标-到到到到+之间所之间所之间所之间所夹的面积,代表所有数据出现概率的总和,夹的面积,代表所有数据出现概率的总和,夹的面积,代表所有数据出现概率的总和,夹的面积,代表所有数据出现概率的总和,其值应为其值应为其值应为其值应为1 1,即概率,即概率,即概率,即概率P P为:为:为:为:续续续续 三、三、三、三、随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差出现的区间随机误差出现的区间随机误差出现
28、的区间随机误差出现的区间 测量值出现的区间测量值出现的区间测量值出现的区间测量值出现的区间 概率概率概率概率(以以以以 为单位为单位为单位为单位)u=1 x=1 68.3%u=1 x=1 68.3%u=1.96 x=1.96 95.0%u=1.96 x=1.96 95.0%u=2 x=2 95.5%u=2 x=2 95.5%u=2.58 x=2.58 99.0%u=2.58 x=2.58 99.0%u=3 x=3 99.7%u=3 x=3 99.7%续续续续 三、三、三、三、随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差的区间概率例例例例1 1 已已已已知知知知某某某某试试试试
29、样样样样中中中中山山山山质质质质量量量量分分分分数数数数的的的的标标标标准准准准值值值值为为为为1.75%1.75%,=0.10%=0.10%,又又又又 已已已已 知知知知 测测测测 量量量量 时时时时 没没没没 有有有有 系系系系 统统统统 误误误误 差差差差,求求求求 分分分分 析析析析 结结结结 果果果果 落落落落 在在在在(1.750.15)%(1.750.15)%范围内的概率。范围内的概率。范围内的概率。范围内的概率。解:解:解:解:例例例例2 2 同上例,求分析结果大于同上例,求分析结果大于同上例,求分析结果大于同上例,求分析结果大于2.00%2.00%的概率。的概率。的概率。的概
30、率。解:属于单边检验问题。解:属于单边检验问题。解:属于单边检验问题。解:属于单边检验问题。阴影部分的概率为阴影部分的概率为阴影部分的概率为阴影部分的概率为0.49380.4938。整个正态分布曲线右侧的概率。整个正态分布曲线右侧的概率。整个正态分布曲线右侧的概率。整个正态分布曲线右侧的概率为为为为1/21/2,即为,即为,即为,即为0.50000.5000,故阴影部分以外的概率为,故阴影部分以外的概率为,故阴影部分以外的概率为,故阴影部分以外的概率为0.50000.50000.4938=0.62%0.4938=0.62%,即分析结果大于,即分析结果大于,即分析结果大于,即分析结果大于2.00
31、%2.00%的概率为的概率为的概率为的概率为0.62%0.62%。练习三、三、三、三、随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差的区间概率1.4少量数据的统计处理一、一、t 分布曲线分布曲线二、二、平均值的置信区间平均值的置信区间三、三、显著性检验显著性检验四、四、异常值的取舍异常值的取舍1.4少量数据的统计处理一、一、t 分布曲线分布曲线 正态分布是无限次测量正态分布是无限次测量正态分布是无限次测量正态分布是无限次测量数据的分布规律,而对有数据的分布规律,而对有数据的分布规律,而对有数据的分布规律,而对有限次测量数据则用限次测量数据则用限次测量数据则用限次测量数据则用t
32、t 分布曲分布曲分布曲分布曲线处理。用线处理。用线处理。用线处理。用s s代替代替代替代替,纵坐纵坐纵坐纵坐标仍为概率密度,但横坐标仍为概率密度,但横坐标仍为概率密度,但横坐标仍为概率密度,但横坐标则为统计量标则为统计量标则为统计量标则为统计量t t。t t定义为:定义为:定义为:定义为:自由度自由度自由度自由度f f degree of freedomdegree of freedom (f=n-1f=n-1)t t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t t分布曲线随分布曲线随分布曲线随分布曲线随自由
33、度自由度自由度自由度f f而改变。当而改变。当而改变。当而改变。当f f趋近趋近趋近趋近 时,时,时,时,t t分布就趋近正态分布分布就趋近正态分布分布就趋近正态分布分布就趋近正态分布。置信度(置信度(置信度(置信度(P P P P)confidence degreeconfidence degree 在某一在某一在某一在某一t t值时,测定值落在值时,测定值落在值时,测定值落在值时,测定值落在(+ts+ts)范围内的概率。范围内的概率。范围内的概率。范围内的概率。置信水平置信水平置信水平置信水平()confidence levelconfidence level在某一在某一在某一在某一t t
34、值时,测定值落在值时,测定值落在值时,测定值落在值时,测定值落在(+ts+ts)范围以外的概率范围以外的概率范围以外的概率范围以外的概率(l(lP P)t ta a,f f :t t值与置信度值与置信度值与置信度值与置信度P P及自由度及自由度及自由度及自由度f f关系。关系。关系。关系。例:例:例:例:t t005005,1010表示置信度为表示置信度为表示置信度为表示置信度为95%95%,自由度为,自由度为,自由度为,自由度为1010时的时的时的时的t t值。值。值。值。t t001001,5 5表示置信度为表示置信度为表示置信度为表示置信度为99%99%,自由度为,自由度为,自由度为,自
35、由度为5 5时的时的时的时的t t值。值。值。值。一、一、一、一、t t 分布曲线分布曲线分布曲线分布曲线一、一、一、一、t t 分布曲线分布曲线分布曲线分布曲线2 平均值的置信区间平均值的置信区间(confidence intervalconfidence interval)当当当当n n趋近趋近趋近趋近 时:时:时:时:单次测量结果单次测量结果单次测量结果单次测量结果以样本平均值来估计总体以样本平均值来估计总体以样本平均值来估计总体以样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间:平均值可能存在的区间:平均值可能存在的区间:对于少量测量数据,对于少量测量数据,对于少量测量数
36、据,对于少量测量数据,即即即即当当当当 n n有限时有限时有限时有限时,必须根,必须根,必须根,必须根据据据据t t分布进行统计处理:分布进行统计处理:分布进行统计处理:分布进行统计处理:它表示在一定置信度下,它表示在一定置信度下,它表示在一定置信度下,它表示在一定置信度下,以平均值为中心,包括以平均值为中心,包括以平均值为中心,包括以平均值为中心,包括总体平均值的范围。这总体平均值的范围。这总体平均值的范围。这总体平均值的范围。这就叫平均值的置信区间就叫平均值的置信区间就叫平均值的置信区间就叫平均值的置信区间。一、一、一、一、t t 分布曲线分布曲线分布曲线分布曲线 例例例例 对其未知试样中
37、对其未知试样中对其未知试样中对其未知试样中ClCl-的质量分数进行测定,的质量分数进行测定,的质量分数进行测定,的质量分数进行测定,4 4次次次次结果为结果为结果为结果为47.64%47.64%,47.69%47.69%,47.52%47.52%,47.55%47.55%。计算。计算。计算。计算置信度为置信度为置信度为置信度为90%90%,95%95%和和和和99%99%时,总体平均值时,总体平均值时,总体平均值时,总体平均值 的置的置的置的置信区间。信区间。信区间。信区间。解:解:解:解:一、一、一、一、t t 分布曲线分布曲线分布曲线分布曲线三、三、显著性检验显著性检验 Significa
38、nce test(1)F检验法检验法 F test 比较两组数据的方差比较两组数据的方差s2(2)t检验法检验法 t test *平均值与标准值的比较平均值与标准值的比较 *两组平均值的比较两组平均值的比较(1 1)F F检验法检验法检验法检验法 比较两组数据的方差比较两组数据的方差比较两组数据的方差比较两组数据的方差s s2 2,以确定它们的精密度是,以确定它们的精密度是,以确定它们的精密度是,以确定它们的精密度是否有显著性差异的方法。统计量否有显著性差异的方法。统计量否有显著性差异的方法。统计量否有显著性差异的方法。统计量F F定义为两组数据的定义为两组数据的定义为两组数据的定义为两组数据
39、的方差的比值,分子为大的方差,分母为小的方差。方差的比值,分子为大的方差,分母为小的方差。方差的比值,分子为大的方差,分母为小的方差。方差的比值,分子为大的方差,分母为小的方差。两组数据的精密度相差不大,则两组数据的精密度相差不大,则两组数据的精密度相差不大,则两组数据的精密度相差不大,则F F值趋近于值趋近于值趋近于值趋近于1 1;若;若;若;若两者之间存在显著性差异,两者之间存在显著性差异,两者之间存在显著性差异,两者之间存在显著性差异,F F值就较大。值就较大。值就较大。值就较大。在一定的在一定的在一定的在一定的P(P(置信度置信度置信度置信度95%)95%)及及及及f f时,时,时,时
40、,F F计算计算计算计算 F F表表表表,存在显著性差异,存在显著性差异,存在显著性差异,存在显著性差异,否则,不存在显著性差异。否则,不存在显著性差异。否则,不存在显著性差异。否则,不存在显著性差异。三、三、三、三、显著性检验显著性检验显著性检验显著性检验三、三、三、三、显著性检验显著性检验显著性检验显著性检验例例例例1 1 在吸光光度分析中,用一台旧仪器测定溶液的吸光度在吸光光度分析中,用一台旧仪器测定溶液的吸光度在吸光光度分析中,用一台旧仪器测定溶液的吸光度在吸光光度分析中,用一台旧仪器测定溶液的吸光度6 6次,次,次,次,得标准偏差得标准偏差得标准偏差得标准偏差s s1 1=0.055
41、;=0.055;再用一台性能稍好的新仪器测定再用一台性能稍好的新仪器测定再用一台性能稍好的新仪器测定再用一台性能稍好的新仪器测定4 4次,次,次,次,得标准偏差得标准偏差得标准偏差得标准偏差s s2 2=0.022=0.022。试问新仪器的精密度是否显著地优。试问新仪器的精密度是否显著地优。试问新仪器的精密度是否显著地优。试问新仪器的精密度是否显著地优于旧仪器的精密度于旧仪器的精密度于旧仪器的精密度于旧仪器的精密度?解解解解 已已已已知知知知新新新新仪仪仪仪器器器器的的的的性性性性能能能能较较较较好好好好,它它它它的的的的精精精精密密密密度度度度不不不不会会会会比比比比旧旧旧旧仪仪仪仪器器器器
42、的的的的差差差差,因此,这是属于单边检验问题。因此,这是属于单边检验问题。因此,这是属于单边检验问题。因此,这是属于单边检验问题。已知已知已知已知 n n1 1=6=6,s s1 1=0.055=0.055 n n2 2=4=4,s s2 2=0.022=0.022 查表,查表,查表,查表,f f大大大大=6-1=5=6-1=5,f f小小小小=4-1=3=4-1=3,F F表表表表=901=901,FFFFFF表表表表,故故故故认认认认为为为为两两两两种种种种方方方方法法法法的的的的精精精精密密密密度度度度之之之之间间间间存存存存在在在在显显显显著著著著性性性性差差差差异异异异。作作作作出出
43、出出此此此此种种种种判判判判断断断断的置信度为的置信度为的置信度为的置信度为90%90%。三、三、三、三、显著性检验显著性检验显著性检验显著性检验(2)t检验法检验法 平均值与标准值的比较平均值与标准值的比较平均值与标准值的比较平均值与标准值的比较 为为为为了了了了检检检检查查查查分分分分析析析析数数数数据据据据是是是是否否否否存存存存在在在在较较较较大大大大的的的的系系系系统统统统误误误误差差差差,可可可可对对对对标标标标准准准准试试试试样样样样进进进进行行行行若若若若干干干干次次次次分分分分析析析析,再再再再利利利利用用用用t t检检检检验验验验法法法法比比比比较较较较分分分分析析析析结结
44、结结果果果果的的的的平平平平均均均均值与标准试样的标准值之间是否存在显著性差异。值与标准试样的标准值之间是否存在显著性差异。值与标准试样的标准值之间是否存在显著性差异。值与标准试样的标准值之间是否存在显著性差异。进行进行进行进行t t检验时,首先按下式计算出检验时,首先按下式计算出检验时,首先按下式计算出检验时,首先按下式计算出t t值值值值 若若若若t t计算计算计算计算 t t,f,f,存在显著性差异,否则不存在显著性差异。,存在显著性差异,否则不存在显著性差异。,存在显著性差异,否则不存在显著性差异。,存在显著性差异,否则不存在显著性差异。通常以通常以通常以通常以95%95%的置信度为检
45、验标准,即显著性水准为的置信度为检验标准,即显著性水准为的置信度为检验标准,即显著性水准为的置信度为检验标准,即显著性水准为5%5%。三、三、三、三、显著性检验显著性检验显著性检验显著性检验小结 1.1.比较:比较:比较:比较:t t 检验检验检验方法的系统误差检验方法的系统误差 F F 检验检验检验方法的偶然误差检验方法的偶然误差 G G 检验检验异常值的取舍异常值的取舍 2.2.检验顺序:检验顺序:检验顺序:检验顺序:GG检验检验 F F 检验检验 t t检验检验 异常值的异常值的取舍取舍精密度显著性精密度显著性精密度显著性精密度显著性检验检验检验检验准确度或系统误准确度或系统误准确度或系
46、统误准确度或系统误差显著性检验差显著性检验差显著性检验差显著性检验例例例例 采采采采用用用用某某某某种种种种新新新新方方方方法法法法测测测测定定定定基基基基准准准准明明明明矾矾矾矾中中中中铝铝铝铝的的的的质质质质量量量量分分分分数数数数,得得得得到到到到下下下下列列列列9 9个个个个分分分分析析析析结结结结果果果果:10.74%10.74%,10.77%10.77%,10.77%10.77%,10.77%10.77%,10.81%10.81%,10.82%10.82%,10.73%10.73%,10.86%10.86%,10.81%10.81%。已已已已知知知知明明明明矾矾矾矾中中中中铝铝铝铝
47、含含含含量量量量的的的的标标标标准准准准值值值值(以以以以理理理理论论论论值值值值代代代代)为为为为10.77%10.77%。试试试试问问问问采采采采用用用用该该该该新新新新方方方方法法法法后后后后,是是是是否引起系统误差否引起系统误差否引起系统误差否引起系统误差(置信度置信度置信度置信度95%)?95%)?解解解解 n n=9,=9,f f=9=91=8 1=8 查查查查表表表表,P P=0.95,=0.95,f f=8=8时时时时,t t0.050.05,8 8=2.31=2.31。tttttt表表表表两两两两组组组组平平平平均均均均值值值值存存存存在在在在显显显显著著著著性性性性差差差差
48、异异异异。tttt表表表表,则不存在显著性差异。则不存在显著性差异。则不存在显著性差异。则不存在显著性差异。三、三、三、三、显著性检验显著性检验显著性检验显著性检验例例例例 用两种方法测定合金中铝的质量分数,所得结果如下用两种方法测定合金中铝的质量分数,所得结果如下用两种方法测定合金中铝的质量分数,所得结果如下用两种方法测定合金中铝的质量分数,所得结果如下:第一法第一法第一法第一法 1.26%1.25%1.22%1.26%1.25%1.22%第二法第二法第二法第二法 1.35%1.31%1.33%1.35%1.31%1.33%试问两种方法之间是否有显著性差异试问两种方法之间是否有显著性差异试问
49、两种方法之间是否有显著性差异试问两种方法之间是否有显著性差异(置信度置信度置信度置信度90%)?90%)?解解解解 n n1 1=3=3,x x1 1=1.24%=1.24%s s1 1=0.021%=0.021%n n2 2=4=4,x x2 2=1.33%=1.33%s s2 2=0.017%=0.017%f f大大大大=2 f=2 f小小小小=3 F=3 F表表表表=955 =955 FFF t t t010010,5 5,故故故故两两两两种分析方法之间存在显著性差异种分析方法之间存在显著性差异种分析方法之间存在显著性差异种分析方法之间存在显著性差异.三、三、三、三、显著性检验显著性检验
50、显著性检验显著性检验四、四、可疑值(可疑值(cutlier)的取舍)的取舍 在实验中得到一组数据,个别数据离群较远,这一数在实验中得到一组数据,个别数据离群较远,这一数在实验中得到一组数据,个别数据离群较远,这一数在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则据称为异常值、可疑值或极端值。若是过失造成的,则据称为异常值、可疑值或极端值。若是过失造成的,则据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是这一数据必须舍去。否则异常值不能随意取舍,特别是这一数据必须舍去。否则异常值不能随意取舍,特别是这一