《分析结果的数据处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《分析结果的数据处理ppt课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 2-2 分析结果的数据处理分析结果的数据处理 如何用测量值如何用测量值来估计真实值来估计真实值?一、置信度与置信区间一、置信度与置信区间 若用单次测量值若用单次测量值x来估计真实值来估计真实值 真值真值被包括在被包括在x1内的可能性内的可能性p=68.3%,同理同理 真值真值被包括在被包括在x2内的可能性内的可能性p=95.5 %, 真值真值被包括在被包括在x3内的可能性内的可能性p=99.7%。真值被包括的区间可表示为:真值被包括的区间可表示为:= x叫单次测量结果的置信区间,叫单次测量结果的置信区间,p叫置信度。叫置信度。 若用平均值若用平均值 估计真值估计真值 xx xx 2 xx 3
2、 叫平均值的置信区间。叫平均值的置信区间。nx p=68.3%p=95.5%p=99.7%其中其中由由 可见可见,平均值的置信区间比单次测量结果平均值的置信区间比单次测量结果的置信区间要小,亦即用平均值估计真值的准确度比的置信区间要小,亦即用平均值估计真值的准确度比单次测量值更高,即平均值更接近于真值。单次测量值更高,即平均值更接近于真值。 xxnx 有限次测量有限次测量结果平均值的置信区间为:结果平均值的置信区间为:其中,其中, t置信因子,是试验次数置信因子,是试验次数n、置信度、置信度p的函数。由的函数。由p14表表2-2可以查到可以查到 。nstx p15.例例3:测定:测定SiO2的
3、百分含量,得到下列数据:的百分含量,得到下列数据:28.62、28.59、28.51、28.42、28.52、28.63。求平均值、标准偏差、置信度分别。求平均值、标准偏差、置信度分别为为90%和和95%时平均值的置信区间。时平均值的置信区间。解:解:06. 01607. 004. 008. 005. 003. 000656.28663.2852.2848.2851.2859.2862.28222222 sx07056286060571256285712695%05056286060015256280152690%2-2.tn.tn。,时时,同同理理,置置信信度度为为。,置置信信度度为为查查表
4、表p15 例例4 测定钢中含铬量时,先测定两次,得到测定钢中含铬量时,先测定两次,得到1.12%和和1.15%;以后又补测了三次为以后又补测了三次为1.11%、1.16%和和1.12%。试分别按两次和按。试分别按两次和按五次测定的数据计算平均值的置信区间(五次测定的数据计算平均值的置信区间(p=95%)。解:两次测定时解:两次测定时021. 012015. 0015. 014. 1215. 112. 122 sx03.013.150.0222.781.13Cr%)5(78.22-2022.01)(13.1512.116.111.115.112.119.014.120.02112.71.14Cr
5、%)2(7.122-2%952%95 ntnxxsxnti,得得查查表表五五次次测测定定时时。得得查查表表通过给出的这两条例题通过给出的这两条例题 ,可得到如下结论:,可得到如下结论:测定次数一定时测定次数一定时,置信度越高置信度越高,则则t 越大越大,置信区间越宽。置信区间越宽。置信度和精密度一定时置信度和精密度一定时,测定次数越多测定次数越多, 越小越小,置信区间越置信区间越窄窄,结果较可靠。结果较可靠。nst 测定铁矿中测定铁矿中 Fe 的百分含量的百分含量, 求得置信度为求得置信度为 95时平均值的置信区间为时平均值的置信区间为35.210.10。对此表达式。对此表达式的正确理解是的正
6、确理解是 真值不是随机变真值不是随机变量。所以,不能用量。所以,不能用出现概率来描述。出现概率来描述。(A) 在已测定的数据中有在已测定的数据中有95的数据在此区间内的数据在此区间内(B) 若再作测定,则数据有若再作测定,则数据有95将落入此区间内将落入此区间内(C) 真值真值在此区间出现的概率为在此区间出现的概率为95(D) 用此区间估计真值用此区间估计真值的把握有的把握有95二、可疑数据的取舍二、可疑数据的取舍22.38, 22.39,22.36,22.40,22.44这组测量数据中这组测量数据中22.44精密度较差,而又没有什精密度较差,而又没有什么明确理由舍弃它时,怎么办?么明确理由舍
7、弃它时,怎么办?例例1,以,以90%的置信度,用的置信度,用Q检验法检验下列数据中检验法检验下列数据中22.44是否参加平均值的计算。是否参加平均值的计算。 22.38, 22.39,22.36,22.40,22.441. Q 检验法检验法 将数据从小到大排序:将数据从小到大排序: 22.36,22.38, 22.39,22.40,22.44 求极差求极差 ; xnx1 = 22.44-22.36=0.08 求可疑值的邻差求可疑值的邻差( 或或 ); xnxn-1=22.44-22.40=0.04 求求Q值:值: 或或 ; 将将Q值与值与p18表表2-4给出的给出的Q表表进行比较。进行比较。
8、n=5,Q0.90=0.640.5,则,则22.44给予保留参加平均。给予保留参加平均。1 nnxx1xxn 12xx 11xxxxQnnn 112xxxxQn 5 . 008. 004. 0 Q如果如果Q Q表表则舍弃则舍弃可疑值可疑值Q Q表表则补则补12个实验数据后个实验数据后再检验再检验2. Grubbs法法 例例2 测定某药物中测定某药物中Co的质量分数的质量分数(10-6)得到结果如得到结果如下:下:1.25,1.27,1.31,1.40。用。用Grubbs法判断法判断1.4010-6这这个数据是否保留。个数据是否保留。 36. 1066. 031. 140. 1 计算计算G 解:
9、用解:用GrubbsGrubbs法,法, =1.31=1.311010-6-6, ,s s = O.066= O.0661010-6-6x60. 01.25-1.4031. 140. 1Q1n1nn xxxx计计算算GrubbsGrubbs法和法和注意:注意:1.如果一系列数据中需要检验若干个可疑值,则每如果一系列数据中需要检验若干个可疑值,则每次首先检验邻差较大的那个数据。次首先检验邻差较大的那个数据。例如:例如:8.32,8.38,8.44,8.45,8.52,8.69。因为因为8.69与与8.52的差的差0.17是所有数据邻差中最大的,是所有数据邻差中最大的,所以首先应当检验所以首先应当
10、检验8.69,然后有必要时,再检验剩下,然后有必要时,再检验剩下的数据。的数据。2. 从三次测量结果中舍弃一个从三次测量结果中舍弃一个“离群值离群值” 是不可是不可取的。因为这样做表面上精密度提高了,但实际上会取的。因为这样做表面上精密度提高了,但实际上会增大了置信区间的宽度。增大了置信区间的宽度。为什么?为什么?参看参看p19二二四段四段n值变小,值变小, t 值增大值增大通过通过 t 检验检验能够判断分析方法是否有系统误差。能够判断分析方法是否有系统误差。三、平均值与标准值的比较(系统误差的检验)三、平均值与标准值的比较(系统误差的检验)1. 用某种方法测量标准值为用某种方法测量标准值为的
11、基准物质或标准的基准物质或标准试样试样n次,求平均值次,求平均值 。2. 计算计算 t 值值nsxt 计计算算3. 将将 t计算计算 值与表值与表2-2中的中的 t 值比较值比较若若t 计算计算 t 表表,则该测量方法有系统误差;,则该测量方法有系统误差;若若t 计算计算 t 表表,则该方法的测量差异主要是随机误,则该方法的测量差异主要是随机误差所致。差所致。xp19例例2一种新方法用来测定试样含铜量,用含量为一种新方法用来测定试样含铜量,用含量为11.7 mgkg的标准试样,进行五次测定,所得数据为的标准试样,进行五次测定,所得数据为10.9,11.8,10.9,10.3,10.0。判断该方
12、法是否可行。判断该方法是否可行? (是否存在系统误差是否存在系统误差)解:计算平均值解:计算平均值 ,标准偏差,标准偏差 s =0.78 .10 x87. 257 . 07 .118 .10 nsxt 计算计算查表查表2-2 t (0.95,n=5)=2.78,因此因此t 计算计算 t 表表说明该方法存在系统误差,结果偏低。说明该方法存在系统误差,结果偏低。四、两个平均值的比较四、两个平均值的比较 在分析化学实验中往往要通过比较在分析化学实验中往往要通过比较 两种分析方法两种分析方法; 两个实验室两个实验室; 两个不同操作者两个不同操作者;的试验结果之间是否有显著性差异,来确定他们之间的试验结
13、果之间是否有显著性差异,来确定他们之间的差异是系统原因造成,还是随机原因造成的。的差异是系统原因造成,还是随机原因造成的。在两组数据的在两组数据的精密度精密度没有显著差别的情况下,可没有显著差别的情况下,可以用以用 t 检验法比较这两组数据的平均值,给出上述问检验法比较这两组数据的平均值,给出上述问题作出回答题作出回答 。 下面通过下面通过 p20 例例3 来介绍这种检验方法来介绍这种检验方法 解:解: n甲甲=3 =1.24 s甲甲=0.021 n乙乙=4 =1.33 s乙乙=0.01753. 1017. 0021. 02222 小小大大计算计算ssF先用先用 F 检验检验 比较两种方法的精
14、密度:比较两种方法的精密度:甲甲x乙乙x续例续例 39054343200331241 02002430.017)1(40.021)1(32)1()1(2121212221222211.nnnnsxx t.-nnsnsns合合合合则则因为因为 f =n-1,查表,查表2-5得得 F表表=9.55,大于,大于F计算计算=1.53,表明两组数据的表明两组数据的 s 没有显著差异。所以能合并它们没有显著差异。所以能合并它们查表查表2-2,因为,因为 f =7-2=5,置信度,置信度95%时,时,t表表=2.57,小于小于上述计算值上述计算值5.90。表明两种方法有显著差异。表明两种方法有显著差异。续例
15、续例 30404343020572212121.nnnnstxx合合表表这两种方法所能允许的最大随机差别为:这两种方法所能允许的最大随机差别为:而实际上两者的平均值相差达到而实际上两者的平均值相差达到0.09,所以,所以,至少有至少有0.05是由于系统的差别引起的。是由于系统的差别引起的。2-3 误差的传递误差的传递 分析结果的误差是由各步测量值的误分析结果的误差是由各步测量值的误差,在运算时通过某种传递方式而形成差,在运算时通过某种传递方式而形成的。系统误差和偶然误差的传递规律是的。系统误差和偶然误差的传递规律是不一样的下面分别加以讨论。不一样的下面分别加以讨论。一、系统误差的传递规律一、系
16、统误差的传递规律 对于加、减运算:对于加、减运算: 测量值测量值A、B、C的误差对分析结果的误差对分析结果R 的影响为:的影响为: ,如果误差为有限量,则:如果误差为有限量,则: ,极端情况下,有:极端情况下,有: 若若A B和和C,则,则RA,即计算结果的绝,即计算结果的绝对误差取决于对误差取决于 绝对误差最大的绝对误差最大的A。dCdBdAdR CBAR CBAR max)(CBAR 对于乘、除运算:对于乘、除运算:测量值测量值A、B、C的误差对分析结果的误差对分析结果R 的影响为:的影响为:如果误差为有限量,则:如果误差为有限量,则:极端情况下,有:极端情况下,有: 若若 ,则,则 ,即
17、计算结果的相对误差,即计算结果的相对误差由相对误差最大的由相对误差最大的 决定决定 。CBAR CdCBdBAdARdR CCBBAARR CCBBAARR maxCCBBAA 和和AdARdR AdA二、随机误差的传递规律二、随机误差的传递规律 2222CBARssss CBAR 2222 CsBsAsRsCBARCBAR 在加、减运算中在加、减运算中 由此可见,在加减运算中分析结果的方差,取决于测量值由此可见,在加减运算中分析结果的方差,取决于测量值中方差最大者。中方差最大者。在乘、除运算中在乘、除运算中由此可见,在乘除运算中分析结果的相对标准偏差的平方取由此可见,在乘除运算中分析结果的相
18、对标准偏差的平方取决于参加运算的测量值中相对标准偏差的平方最大者。决于参加运算的测量值中相对标准偏差的平方最大者。2-4 有效数字及其运算规则有效数字及其运算规则一、有效数字的概念一、有效数字的概念 有效数字有效数字 通过实验仪器所能测量到的数字通过实验仪器所能测量到的数字。 例如:例如:滴定管的体积读数滴定管的体积读数20.52mL; 分析天平称出的质量读数分析天平称出的质量读数0.5180g; 分光光度计的吸光度读数分光光度计的吸光度读数0.235等等。等等。 有效数字与其他数字的区别有效数字与其他数字的区别 不仅表示数值的大小,还表示所用仪器的精度。不仅表示数值的大小,还表示所用仪器的精
19、度。例如,用分析天平称某物体的质量,应读准到小数点后例如,用分析天平称某物体的质量,应读准到小数点后第四位:第四位: 正确正确 不正确不正确 记录数据记录数据 0.5180g 0.518g 绝对误差绝对误差 0.0001g 0.001g 相对误差相对误差 0.02% 0.2% 实验数据的表示应当注意实验数据的表示应当注意:在实验数据的所有有效数字中,只允许最后一位在实验数据的所有有效数字中,只允许最后一位是可疑值。是可疑值。数据中的数据中的“0”是否为有效数字,取决于它所起的是否为有效数字,取决于它所起的作用。作用。只起定位作用只起定位作用0.5180g=518.0mg=518000 g =5
20、.180105g在用有效数字表示大于在用有效数字表示大于1 1的整数时,应采用科学记的整数时,应采用科学记数法。数法。25.00mL25mL0.02500L2.50010-2L例:下列数据各包含几位有效数字例:下列数据各包含几位有效数字 0.0376 1.2067 0.2180 0.0040 1.810 -5 0.005 2.0103 1000 10.98%3位位5位位4位位4位位2位位2位位1位位2位位含糊含糊因测量误差的存在,所以实验数据的最后因测量误差的存在,所以实验数据的最后一位是可疑数字,而用它进行运算的结果也只一位是可疑数字,而用它进行运算的结果也只能保留一位可疑数字。能保留一位可
21、疑数字。二、有效数字的运算规则二、有效数字的运算规则1.加减运算加减运算 运算结果的绝对误差,应当与运算结果的绝对误差,应当与参加运算参加运算数据中数据中绝对误差最大者一致。绝对误差最大者一致。 26.71R=0.0001+0.01+0.000010.010.0121+25.64+1.05782=26.70992 0.0325 RE%=0.3,5.103 RE%=0.02 , 60.06 RE%=0.02,139.8 RE%=0.07。250363071. 08 .13960 .60310. 55032. 0 3 . 007. 002. 002. 03 . 0 RdR2.乘除运算乘除运算 运算
22、结果的有效数字位数,应当与参加运算结果的有效数字位数,应当与参加运算数据中相对误差最大者一致。运算数据中相对误差最大者一致。0.0712503630.3%=0.00020.0713化学计量系数、得失电子数、质子转移数、倍化学计量系数、得失电子数、质子转移数、倍数等的有效数字位数应视为足够多。数等的有效数字位数应视为足够多。第一位数字大于等于第一位数字大于等于8的数据,其有效数字的的数据,其有效数字的位数可比该数据的实际位数多算一位,例如,位数可比该数据的实际位数多算一位,例如,8.33可以当作可以当作4位有效数字处理。位有效数字处理。计算的中间结果可计算的中间结果可,最终,最终结果则应按四舍五
23、入规则舍弃其他多余的可疑值,结果则应按四舍五入规则舍弃其他多余的可疑值,只保留一位可疑值。只保留一位可疑值。在全分析中应采用在全分析中应采用“”的规则的规则对数据进行修约。对数据进行修约。3.3.取舍有效数字应注意取舍有效数字应注意涉及到平衡常数的计算,其结果的有效数涉及到平衡常数的计算,其结果的有效数字一般保留两位。字一般保留两位。的有效数字是小数点后的部的有效数字是小数点后的部分,小数点前的部分起定位作用,不是有效数分,小数点前的部分起定位作用,不是有效数字。字。误差和偏差最多用两位有效数字表示。误差和偏差最多用两位有效数字表示。常量组分分析中,含量常量组分分析中,含量10%的结果用四的结
24、果用四位有效数字表示;含量在位有效数字表示;含量在110%的用三位有效的用三位有效数字表示;微量组分分析通常用两到三位有效数字表示;微量组分分析通常用两到三位有效数字表示分析结果。数字表示分析结果。74. 426. 058 . 1lg5pH108 . 1108 . 1100. 0100. 0H108 . 1HAcAcH555- 从上述计算可知:从上述计算可知:例如:例如:HAc-NaAc浓度均为浓度均为0.100mol/L时溶液的时溶液的pH值。值。 涉及平衡常数的计算,结果一般取两位有效数字。涉及平衡常数的计算,结果一般取两位有效数字。 对数的有效数字是小数点后的数字。对数的有效数字是小数点
25、后的数字。例题例题p26 10(1)计算计算 2.1870.854 + 9.610-50.03260.00814原式原式1.8677+ 9.610-5 0.0002654 =1.867831 1.868计算计算 2016. 0958. 171025. 0958. 10 .1061085 . 49105. 021589. 10 .10610)64.2022.25(1059. 02133 例:把下列数据以例:把下列数据以“四舍六入五成双四舍六入五成双”的方法修约的方法修约为为2位有效数字:位有效数字: 3.3486 2.6502 3.050 6.36 0.73500 7.5499 1.25000
26、1.25001 3.32.73.06.40.747.51.21.3四舍六入五成双四舍六入五成双尾数大于尾数大于5的数的数进位进位,尾数小于,尾数小于5的数的数舍弃舍弃。尾数等于尾数等于5的数,若前一位数是偶数或的数,若前一位数是偶数或0,则,则5应应舍弃舍弃;前一位数是奇数,则;前一位数是奇数,则5应应进位进位。0.365510.3660.365340.365我们在实验中常常会遇到两组数之间存在直线关我们在实验中常常会遇到两组数之间存在直线关系的情况。如果用作图法表示这组数间的关系,系的情况。如果用作图法表示这组数间的关系,n个个人人就有可能给出就有可能给出n条条斜率和截距各不相同的斜率和截距
27、各不相同的直线直线。xy 为实为实验点,验点, 为线上点为线上点。iyy 1.最小二乘法原理最小二乘法原理最小二乘法是拟合实验数据的常用方法。它处理线性实最小二乘法是拟合实验数据的常用方法。它处理线性实验数据的中心思想是:验数据的中心思想是:选择恰当的斜率选择恰当的斜率b和截距和截距a,使确立的,使确立的直线方程直线方程与所有实验点与所有实验点 yi 间的间的“差方和差方和”最小。最小。即即(6) (5) (4) )()()()(3) 0)(2(2) 0)(2(1) )() (1122111121112121ininiiinininiiiiiniiniiiiniiiiniiiniiniixba
28、yxbyanxxnyxyxxxyyxxbxbayxbQxbayaQxbayyyQ 回归方程:回归方程:2. 相关系数相关系数 r实验数据的线性相关程度,用实验数据的线性相关程度,用相关系数相关系数 r 来定来定量描述。量描述。yxniiniiniiissbyyxxyyxxr)()()(12121 当当r =1,两变量间完全线性相关;,两变量间完全线性相关;当当r = 0 ,两变量间无线性相关关系;,两变量间无线性相关关系;当当0|r| 1 ,两变量间有一定线性相关性,这时,两变量间有一定线性相关性,这时 r 只只有大于有大于p26表表2-6中的临界值,相关性才显著。中的临界值,相关性才显著。sx和和sy分别是分别是x 和和y的标准偏差的标准偏差p26例例99400.05950.01744034030130 0130025804031010 4030015000510 001506155000550)(0051066060155002080 0789,0 0050 01560 05950 01740 0101,0 0258002080 606,0 1550 622222.rx.y .a .b .nxx./.n)y)(x(yx.y,.x,.yxn,.s,.s.y,.x.yx.y,.xniiiiiiiiyxiiii相关系数:相关系数:回归方程:回归方程:故故则则,解:解:作业: