《误差和分析数据处理PPT课件.ppt》由会员分享,可在线阅读,更多相关《误差和分析数据处理PPT课件.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于误差和分析数据的处理第一张,PPT共七十六页,创作于2022年6月 因此,人们在进行定量分析时,不仅要得到被测因此,人们在进行定量分析时,不仅要得到被测组分的含量,而且必须对分析结果进行评价,判断分组分的含量,而且必须对分析结果进行评价,判断分析结果的准确性析结果的准确性(可靠程度可靠程度),检查产生误差的原因,采,检查产生误差的原因,采取减小误差的有效措施,从而不断提高分析结果的准确程取减小误差的有效措施,从而不断提高分析结果的准确程度。度。第二张,PPT共七十六页,创作于2022年6月1 2-1误差及其产生的原因误差及其产生的原因分析结果与真实值之间的差值称为误差。分析结果与真实值之间
2、的差值称为误差。分析分析结果大于真实值,误差为正;分析结果小于真实值,结果大于真实值,误差为正;分析结果小于真实值,误差为负。误差为负。根据误差的性质与产生的原因,可将误差分为根据误差的性质与产生的原因,可将误差分为系系统误差统误差和和偶然误差偶然误差两类。两类。第三张,PPT共七十六页,创作于2022年6月 一、系统误差一、系统误差系系统统误误差差也也叫叫可可测测误误差差,它它是是定定量量分分析析误误差差的的主主要要来来源源,对对测测定定结结果果的的准准确确度度有有较较大大影影响响。它它是是由由于于分分析析过过程程中中某某些些确确定定的的、经经常常的的因因素素造造成成的的,对对分分析析结结果
3、果的的影影响响比比较较固固定定。系系统统误误差差的的特特点点是是具具有有“重重现现性性”、“单单一一性性”和和“可可测测性性”。即即在在同同一一条条件件下下,重重复复测测定定时时,它它会会重重复复出出现现;使使测测定定结结果果系系统统偏偏高高或或系系统统偏偏低低,其其数数值值大大小小也也有有一一定定的的规规律律;如如果果能能找找出出产产生生误误差差的的原原因因,并并设设法法测测出出其其大大小小,那那么么系系统统误误差差可可以以通通过过校校正正的的方方法法予予以以减减小小或或消消除除。系系统统误误差差产产生生的的主主要要原原因因是是:第四张,PPT共七十六页,创作于2022年6月 (一一一一)方
4、法误差方法误差方法误差方法误差这这种种误误差差是是由由于于分分析析方方法法本本身身所所造造成成的的。例例如如:在在重重量量分分析析中中,沉沉淀淀的的溶溶解解损损失失或或吸吸附附某某些些杂杂质质而而产产生生的的误误差差;在在滴滴定定分分析析中中,反反应应进进行行不不完完全全,干干扰扰离离子子的的影影响响,滴滴定定终终点点和和等等当当点点的的不不符符合合,以以及及其其他他副副反反应应的的发发生生等等,都都会会系统地影响测定结果。系统地影响测定结果。(二二二二)仪器误差仪器误差仪器误差仪器误差主主要要是是仪仪器器本本身身不不够够准准确确或或未未经经校校准准所所引引起起的的。如如天天平平、法法码码和和
5、量量器器刻刻度度不不够够准准确确等等,在在使使用用过过程程中中就就会会使测定结果产生误差。使测定结果产生误差。(三三)试剂误差试剂误差试剂误差试剂误差 由于试剂不纯或蒸馏水中含有微量杂质所引起。由于试剂不纯或蒸馏水中含有微量杂质所引起。第五张,PPT共七十六页,创作于2022年6月 (四四四四)操作误差操作误差操作误差操作误差 主主要要是是指指在在正正常常操操作作情情况况下下,由由于于分分析析工工作作者者掌掌握握操操作作规规程程与与正正确确控控制制条条件件稍稍有有出出入入而而引引起起的的。例例如如,使使用用了了缺缺乏乏代代表表性性的的试试样样;试试样样分分解解不不完完全全或或反反应应的的某某些
6、些条条件件控控制不当等。制不当等。与与上上述述情情况况不不同同的的是是,有有些些误误差差是是由由于于分分析析者者的的主主观观因因素素造造成成的的,称称之之为为“个个人人误误差差”例例如如,在在读读取取滴滴定定剂剂的的体体积积时时,有有的的人人读读数数偏偏高高,有有的的人人读读数数偏偏低低;在在判判断断滴滴定定终终点点颜颜色色时时,有有的的人人对对某某种种颜颜色色的的变变化化辨辨别别不不够敏锐,偏深或偏浅等所造成的误差。够敏锐,偏深或偏浅等所造成的误差。第六张,PPT共七十六页,创作于2022年6月 二、偶然误差二、偶然误差 偶偶然然误误差差也也叫叫不不可可测测误误差差,产产生生的的原原因因与与
7、系系统统误误差差不不同同,它它是是由由于于某某些些偶偶然然的的因因素素(如如测测定定时时环环境境的的温温度度、湿湿度度和和气气压压的的微微小小波波动动,仪仪器器性性能能的的微微小小变变化化等等)所所引引起起的的,其其影影响响有有时时大大,有有时时小小,有有时时正正,有有时时负负。偶偶然然误误差差难难以以察察觉觉,也也难难以以控控制制。但但是是消消除除系系统统误误差差后后,在在同同样样条条件件下下进进行行多多次次测测定定,则则可可发发现现偶偶然然误误差差的的分分布布完全服从一般的统计规律:完全服从一般的统计规律:(一一)大小相等的正、负误差出现的几率相等;大小相等的正、负误差出现的几率相等;(二
8、二)小小误误差差出出现现的的机机会会多多,大大误误差差出出现现的的机机会会少少,特特别别大大的的正正、负负误误差差出出现现的的几几率率非非常常小小、故故偶偶然然误误差差出出现现的几率与其大小有关。的几率与其大小有关。第七张,PPT共七十六页,创作于2022年6月 2-2测定值的准确度与精密度测定值的准确度与精密度一、准确度与误差一、准确度与误差误误差差愈愈小小,表表示示分分析析结结果果的的准准确确度度愈愈高高,反反之之,误误差差愈愈大大,准准确确度度就就越越低低。所所以以,误误差差的的大大小小是是衡衡量量准准确确度度高高低低的的尺尺度度。误误差差又又分分为为绝绝对对误误差差和和相相对对误误差差
9、。其其表表示方法如下:示方法如下:绝对误差测定值绝对误差测定值-真实值真实值(12-1)相对误差相对误差%=(绝对误差绝对误差/真实值真实值)100%(12-2)第八张,PPT共七十六页,创作于2022年6月 相对误差表示误差在测定结果中所占的百分率。分相对误差表示误差在测定结果中所占的百分率。分相对误差表示误差在测定结果中所占的百分率。分相对误差表示误差在测定结果中所占的百分率。分析结果的准确度常用相对误差表示。绝对误差和相对误差析结果的准确度常用相对误差表示。绝对误差和相对误差析结果的准确度常用相对误差表示。绝对误差和相对误差析结果的准确度常用相对误差表示。绝对误差和相对误差都有正值和负值
10、。正值表示分析结果偏高,负值表示分析都有正值和负值。正值表示分析结果偏高,负值表示分析都有正值和负值。正值表示分析结果偏高,负值表示分析都有正值和负值。正值表示分析结果偏高,负值表示分析结果偏低。结果偏低。结果偏低。结果偏低。二、精密度与偏差二、精密度与偏差 精精精精密密密密度度度度是是是是指指指指在在在在相相相相同同同同条条条条件件件件下下下下多多多多次次次次测测测测定定定定结结结结果果果果相相相相互互互互吻吻吻吻合合合合的的的的程程程程度度度度,表表表表现现现现了了了了测测测测定定定定结结结结果果果果的的的的重重重重现现现现性性性性。精精精精密密密密度度度度用用用用“偏偏偏偏差差差差”来来
11、来来表表表表示示示示。偏偏偏偏差差差差越越越越小小小小说说说说明明明明分分分分析析析析结结结结果果果果的的的的精精精精密密密密度度度度越越越越高高高高。所所所所以以以以偏偏偏偏差差差差的的的的大大大大小小小小是是是是衡衡衡衡量量量量精精精精密密密密度度度度高高高高低低低低的的的的尺尺尺尺度度度度。偏偏偏偏差差差差也也也也分分分分为为为为绝绝绝绝对对对对偏偏偏偏差差差差和和和和相相相相对对对对偏差。偏差。偏差。偏差。第九张,PPT共七十六页,创作于2022年6月(一)绝对偏差、平均偏差和相对平均偏差(一)绝对偏差、平均偏差和相对平均偏差绝对偏差个别测定值一测定平均值绝对偏差个别测定值一测定平均值
12、(12-4)如如果果对对同同一一种种试试样样进进行行了了n次次测测定定,若若其其测测得得的的结结果果分分别别为为:x1,x2,x3,xn,则则它它们们的的算算术术平平均均值值()算算术术平平均均偏偏差差()和和相相对对平平均均偏偏差差分分别别可可由由以以下下各各式式计计算:算:(12-5)第十张,PPT共七十六页,创作于2022年6月 相对平均偏差相对平均偏差%=(126)值值得得注注意意的的是是:平平均均偏偏差差不不计计正正负负号号,而而个个别别测测定定值的偏差要记正负号。值的偏差要记正负号。使使用用平平均均偏偏差差表表示示精精密密度度比比较较简简单单,但但这这个个表表示示方方法法有有不不足
13、足之之处处,因因为为在在一一系系列列的的测测定定中中,小小偏偏差差的的测测定定总总是是占占多多数数,而而大大偏偏差差的的测测定定总总是是占占少少数数,按按总总的的测测定定次次数数去去求求平平均均偏偏差差所所得得的的结结果果偏偏小小,大大偏偏差差得得不不到到充充分分的的反反映映。所所以以,用用平平均均偏偏差差表表示示精精密密度度方方法法在数理统计上一般是不采用的。在数理统计上一般是不采用的。第十一张,PPT共七十六页,创作于2022年6月 (二)标准偏差和相对标准偏差(二)标准偏差和相对标准偏差(二)标准偏差和相对标准偏差(二)标准偏差和相对标准偏差 近近年年来来,在在分分析析化化学学的的教教学
14、学中中,愈愈来来愈愈广广泛泛地地采采用用数数理理统统计计方方法法来来处处理理各各种种测测定定数数据据。在在数数理理统统计计中中,我我们们常常把把所所研研究究对对象象的的全全体体称称为为总总体体(或或母母体体);自自总总体体中中随随机机抽抽出出的的一一部部分分样样品品称称为为样样本本(或或子子样样);样样本本中中所所含含测测量量值值的的数数目目称称为为样样本本大大小小(或或容容量量)。例例如如,我我们们对对某某一一批批煤煤中中硫硫的的含含量量进进行行分分析析,首首先先是是按按照照有有关关部部门门的的规规定定进进行行取取样样、粉粉碎碎、缩缩分分,最最后后制制备备成成一一定定数数量量的的分分析析试试
15、样样,这这就就是是供供分分析析用用的的总总体体。如如果果我我们们从从中中称称取取10份份煤煤样样进进行行平平行行测测定定,得得到到10个个测测定定值值,则则这这一一组组测测定定结结果果就就是是该该试试样样总总体体的的一一个个随机样本,样本容量为随机样本,样本容量为10。第十二张,PPT共七十六页,创作于2022年6月 若若样样本本容容量量为为n,平平行行测测定定次次数数分分别别为为x1,x2,x3,xn,则其样本平均值为:,则其样本平均值为:(12-7)当当测测定定次次数数无无限限增增多多,既既n时时,样样本本平平均均值值即即为总体平均值为总体平均值:若若没没有有系系统统误误差差,且且测测定定
16、次次数数无无限限多多(或或实实用用上上n30次次)时时,则则总总体体平平均均值值就就是是真真实实值值T。此此时时,用用代表总体标准偏差,其数学表示式为:代表总体标准偏差,其数学表示式为:(12-8)第十三张,PPT共七十六页,创作于2022年6月 可可见见,在在定定量量分分析析的的实实验验中中,测测定定次次数数一一般般较较少少(n20次),故其平均偏差次),故其平均偏差,须由式(,须由式(3-9)求得。)求得。但但是是,在在分分析析化化学学中中测测定定次次数数一一般般不不多多(n20),而而总总体体平平均均值值又又不不知知道道,故故只只好好用用样样本本的的标标准准偏偏差差S来来衡衡量量该组数据
17、的分散程度。样本标准偏差的数学表达式为:该组数据的分散程度。样本标准偏差的数学表达式为:(12-9)第十四张,PPT共七十六页,创作于2022年6月 式式中中:(n-1)称称为为自自由由度度,以以f表表示示。它它是是指指在在n次次测测量量中中,只只有有n-1个个可可变变的的偏偏差差。自自由由度度也也可可以以理理解解为为:数数据据中中可可供供对对比比的的数数目目。例例如如,两两次次测测定定a值值和和b值值,只只有有a与与b之之间间的的一一种种比比较较,三三次次测测定定可可有有两两种种比比较较(即即其其中中任任何何两两个个数数据据之之间间及及其其平平均均值值与与第第三三个个数数据据之之间间比比较较
18、),n次次测测定定n-1个个可可供供对对比比的的数数目目。这这里里引引入入(n-1)的的目目的的,主主要要是是为为了了校校正正以以代代替替所所引引起起的的误误差差。很很明明显显,当当测测定定次次数数非非常常多多时时,测测定定次次数数n与与自自由由度度(n-1)的的区区别别就就变变得得很很小小,。即即(12-9)此时,此时,S。第十五张,PPT共七十六页,创作于2022年6月 另另外外,在在许许多多情情况况下下也也使使用用相相对对标标准准偏偏差差(亦亦称称变变异异系系数数)来来说说明明数数据据的的精精密密度度,他他代代表表单单次次测测定定标标准准偏偏差(差(S)对测定平均值()对测定平均值()的
19、相对值,用百分率表示:)的相对值,用百分率表示:变异系数(变异系数(%)=(12-10)(三三三三)平均值的标准偏差平均值的标准偏差平均值的标准偏差平均值的标准偏差 如如果果从从同同一一总总体体中中随随机机抽抽出出容容量量相相同同的的数数个个样样本本,由由此此可可以以得得到到一一系系列列样样本本的的平平均均值值。实实践践证证明明,这这些些样样本本平平均均值值也也并并非非完完全全一一致致,它它们们的的精精密密度度可可以以用用平平均均值值的的标标准准偏偏差差来来衡衡量量。显显然然,与与上上述述任任一一样样本本的的各各单单次次测测定定值值相相比比,这这些些平平均均值值之之间间的波动性更小,即平均值的
20、精密度较单次测定值的更高。的波动性更小,即平均值的精密度较单次测定值的更高。第十六张,PPT共七十六页,创作于2022年6月 因因此此,在在实实际际工工作作中中,常常用用样样本本的的平平均均值值对对总总体体平平均均值值进进行行估估计计。统统计计学学证证明明,平平均均值值的的标标准准偏偏差差与与单单次次测测定值的标准偏差定值的标准偏差之间有下述关系。之间有下述关系。(n)(12-11)对于有限次的测定对于有限次的测定,则有:则有:(12-12)第十七张,PPT共七十六页,创作于2022年6月 式式中中称称样样本本平平均均值值的的标标准准偏偏差差。由由以以上上两两式式可可以以看看出出,平平均均值值
21、的的标标准准偏偏差差与与测测定定次次数数的的平平方方根根成成反反比比。因因此此增增加加测测定定次次数数可可以以减减小小随随机机误误差差的的影影响响,提提高高测测定定的精密度。的精密度。除除了了偏偏差差之之外外,还还可可以以用用极极差差R来来表表示示样样本本平平行行测测定定值值的的精精密密度度。极极差差又又称称全全距距,是是测测定定数数据据中中的的最最大大值值与与最最小小值值之之差差,其其值值愈愈大大表表明明测测定定值值愈愈分分散散。由由于于没没有有充充分分利利用用所所有有的的数数据据,故故其其精精确确性性较较差差。偏偏差差和和极极差差的的数数值值都都在一定程度上反映了测定中随机误差影响的大小。
22、在一定程度上反映了测定中随机误差影响的大小。第十八张,PPT共七十六页,创作于2022年6月 三、准确度和精密度的关系三、准确度和精密度的关系三、准确度和精密度的关系三、准确度和精密度的关系从从以以上上的的讨讨论论可可知知,系系统统误误差差是是定定量量分分析析中中误误差差的的主主要要来来源源,它它影影响响分分析析结结果果的的准准确确度度;偶偶然然误误差差影影响响分分析析结结果果的的精精密密度度。获获得得良良好好的的精精密密度度并并不不能能说说明明准准确确度度就就高高(只只有在消除了系统误差之后,精密度好,准确度才高有在消除了系统误差之后,精密度好,准确度才高)。根根据据以以上上分分析析,我我们
23、们可可以以知知道道:准准确确度度高高一一定定需需要要精精密密度度好好,但但精精密密度度好好不不一一定定准准确确度度高高。若若精精密密度度很很差差,说说明明所所测测结结果果不不可可靠靠,虽虽然然由由于于测测定定的的次次数数多多可可能能使使正正负负偏偏差差相相互互抵抵消消,但但已已失失去去衡衡量量准准确确度度的的前前提提。因因此此,我我们们在在评评价价分分析析结结果果的的时时候候,还还必必须须将将系系统统误误差差和和偶偶然然误误差差的的影响结合起来考虑,以提高分析结果的准确度。影响结合起来考虑,以提高分析结果的准确度。第十九张,PPT共七十六页,创作于2022年6月 12-3随机误差的正态分布随机
24、误差的正态分布一、频率分布一、频率分布在相同条件下对某样品中镍的质量分数(在相同条件下对某样品中镍的质量分数(%)进行)进行重复测定,得到重复测定,得到90个测定值如下:个测定值如下:1.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.651.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.521.491.56
25、1.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.69第二十张,PPT共七十六页,创作于2022年6月 首先视样本容量的大小将所有数据分成若干组:容首先视样本容量的大小将所有数据分成若干组:容量大时分为量大时分为10-20组,容量小时(组,容量小时(n1)第二十六张,PPT共七十六页,创作于2022年6月 综综上上所所述述,一一旦旦和和确确定定后后
26、,正正态态分分布布曲曲线线的的位位置置和和形形状状也也就就确确定定,因因此此和和是是正正态态分分布布的的两两个个基基本本参参数数,这这种种正态分布用正态分布用N(,2)表示。)表示。正态分布曲线关于直线正态分布曲线关于直线x=呈钟形对称,且具有以下特点:呈钟形对称,且具有以下特点:1.对对称称性性绝绝对对值值大大小小相相等等的的正正负负误误差差出出现现的的概概率率相相等等,因因此它们常可能部分或完全相互低消。此它们常可能部分或完全相互低消。2.单单峰峰性性峰峰形形曲曲线线最最高高点点对对应应的的横横坐坐标标x-值值等等于于0,表明随机误差为表明随机误差为0的测定值出现的概率密度最大。的测定值出
27、现的概率密度最大。3.有有界界性性一一般般认认为为,误误差差大大于于的的测测定定值值并并非非是是由由随随机机误误差差所所引引起起的的。也也就就是是说说,随随机机误误差差的的分分布布具具有有限的范围,其值大小是有界的。有有限的范围,其值大小是有界的。第二十七张,PPT共七十六页,创作于2022年6月 三、标准正态分布三、标准正态分布 由由于于和和不不同同时时就就有有不不同同的的正正态态分分布布,曲曲线线的的形形状状也也随随之之而而变变化化。为为了了使使用用方方便便,将将正正态态分分布布曲曲线线的的横横坐坐标标改改用用u来来表表示示(以以为为单单位位表表示示随随机机误误差差),并并定义定义(12-
28、14)代入(代入(3-13)中得:)中得:由于由于1第二十八张,PPT共七十六页,创作于2022年6月 故故u称称为为标标准准正正态态变变量量。此此时时式式(12-13)就就转转化化成成只有变量只有变量u的函数表达式:的函数表达式:(12-15)经经过过上上述述变变换换,总总体体平平均均值值为为的的任任一一正正态态分分布布均均可可化化为为=0,2=1的的标标准准正正态态分分布布,以以N(0,1)表表示示。标标准准正正态态分分布布曲曲线线如如图图3-5所所示示,曲曲线线的的形形状状与与和和的的大大小无关。小无关。第二十九张,PPT共七十六页,创作于2022年6月 图图12-5标准正态分布曲线标准
29、正态分布曲线第三十张,PPT共七十六页,创作于2022年6月 四、随机误差的区间概率四、随机误差的区间概率正正态态分分布布曲曲线线与与横横坐坐标标之之间间所所夹夹的的总总面面积积,就就等等于于概概率率密密度度函函数数从从-至至+的的积积分分值值。它它表表示示来来自自同同一一总总体体的的全全部部测测定定值值或或随随机机误误差差在在上上述述区区间间出出现现概概率率的的总总和和为为100%,即为,即为1。(12-16)欲欲求求测测定定值值或或随随机机误误差差在在某某区区间间出出现现的的概概率率P,可可取取不不同同的的u值值对对式式(12-16)积积分分求求面面积积而而得得到到。例例如如随随机机误误差
30、差在在区区间间(u=1),即即测测定定值值在在区区间间出出现现的的概概率是:率是:第三十一张,PPT共七十六页,创作于2022年6月 按按此此法法求求出出不不同同u值值时时的的积积分分面面积积,制制成成相相应应的的概概率积分表可供直接查用。率积分表可供直接查用。表表2-1中中列列出出的的面面积积对对应应于于图图中中的的阴阴影影部部分分。若若区区间为间为|u|值值,则应将所查得的值乘以则应将所查得的值乘以2。例如:。例如:随机误差出现的区间随机误差出现的区间测定值出现的区间测定值出现的区间概率概率u=1x=0.34132=0.6826u=2x=20.47732=0.9546u=3x=30.498
31、72=0.9974第三十二张,PPT共七十六页,创作于2022年6月 以以上上概概率率值值表表明明,对对于于测测定定值值总总体体而而言言,随随机机误误差差在在2范范围围以以外外的的测测定定值值出出现现的的概概率率小小于于0.045,即即20次次测测定定中中只只有有1次次机机会会。随随机机误误差差超超出出3的的测测定定值值出出现现的的概概率率更更小小。平平均均1000次次测测定定中中只只有有3次次机机会会。通通常常测测定定仅仅有有几几次次,不不可可能能出出现现具具有有这这样样大大误误差差的的测测定定值值。如如果果一一旦旦发发现现,从从统统计计学学的的观观点点就就有有理理由由认认为为它它不不是是由
32、由随随机机误误差差所所引引起起,而而应应当当将将其其舍舍去去,以以保保证证分分析析结结果准确可靠。果准确可靠。第三十三张,PPT共七十六页,创作于2022年6月 概率概率=面积面积=第三十四张,PPT共七十六页,创作于2022年6月 表表12-1正态分布概率积分表正态分布概率积分表|u|面积面积|u|面积面积|u|面积面积0.00.00001.10.36432.20.48210.10.03981.20.38492.20.48610.20.07931.30.40322.30.48930.30.11791.40.41922.40.49180.40.15541.50.43322.50.49380.5
33、0.19151.60.44522.580.49510.60.22581.70.45542.60.49530.70.25801.80.46412.70.49650.80.28811.90.47132.80.49740.90.31591.960.49503.00.49871.00.34132.00.47730.5000第三十五张,PPT共七十六页,创作于2022年6月 概概率率积积分分面面积积表表的的另另一一用用途途是是由由概概率率确确定定误误差差界界限限。例例如如要要保保证证测测定定值值出出现现的的概概率率为为0.95,那那么么随随机机误误差界限应为差界限应为1.96。例例1经经过过无无数数次次
34、测测定定并并在在消消除除了了系系统统误误差差的的情情况况下下,测测得得某某钢钢样样中中磷磷的的质质量量分分数数为为0.099%。已已知知=0.002%,问测定值落在区间问测定值落在区间0.095%-0.103%的概率是多少?的概率是多少?解:根据得解:根据得|u|=2,由表,由表3-1查得相应的概率为查得相应的概率为0.4773,则,则P(0.095%x0.103%)=0.47732=0.955第三十六张,PPT共七十六页,创作于2022年6月 例例2对对烧烧结结矿矿样样进进行行150次次全全铁铁含含量量分分析析,已已知知结结果果符符合合正正态态分分布布(0.4695,0.00202)。求求大
35、大于于0.4735的的测测定定值可能出现的次数。值可能出现的次数。解:解:查表,查表,P=0.4773,故在,故在150次测定中大于次测定中大于0.4773的测定的测定值出现的概率为:值出现的概率为:0.5000-0.4773=0.02271500.02273第三十七张,PPT共七十六页,创作于2022年6月 12-4有限测定数据的统计处理有限测定数据的统计处理一、置信度与的置信区间一、置信度与的置信区间日日常常分分析析中中测测定定次次数数是是很很有有限限的的,总总体体平平均均值值自自然然不不为为人人所所知知。但但是是随随机机误误差差的的分分布布规规律律表表明明,测测定定值值总总是是在在以以为
36、为中中心心的的一一定定范范围围内内波波动动,并并有有着着向向集集中中的的趋趋势势。因因此此,如如何何根根据据有有限限的的测测定定结结果果来来估估计计可可能能存存在在的的范范围围(称称之之为为置置信信区区间间)是是有有实实际际意意义义的的。该该范范围围愈愈小小,说说明明测测定定值值与与愈愈接接近近,即即测测定定的的准准确确度度愈愈高高。但但由由于于测测定定次次数数毕毕竟竟较较少少,由由此此计计算算出出的的置置信信区区间间也也不不可可能能以以百百分分之之百百的的把把握握将将包包含含在在内内,只只能能以以一一定定的的概概率率进进行行判断。判断。第三十八张,PPT共七十六页,创作于2022年6月 (一
37、)已知总体标准偏差(一)已知总体标准偏差(一)已知总体标准偏差(一)已知总体标准偏差 时时对对于于经经常常进进行行测测定定的的某某种种试试样样,由由于于已已经经积积累累了了大大量量的的测测定定数数据据,可可以以认认为为是是已已知知的的。根根据据(12-14)式并考虑式并考虑u的符号可得:的符号可得:(12-14a)由由随随机机误误差差的的区区间间概概率率可可知知,测测定定值值出出现现的的概概率率由由u决决定定。例例如如,当当u=1.96时时。x在在-1.96至至+1.96区区间间出出现现的的概概率率为为0.95。如如果果希希望望用用单单次次测测定定值值x来来估估计计可可能能存存在在的的范范围围
38、,则则可可以以认认为为区区间间x1.96能能以以0.95的的概概率率将将真值包含在内。即有真值包含在内。即有(12-14b)第三十九张,PPT共七十六页,创作于2022年6月 由于平均值较单次测定值的精密度更高,因此常用由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有样本平均值来估计真值所在的范围。此时有 式式(12-14b12-14b)和式()和式()和式()和式(12-1712-17)分别表示在一定的置分别表示在一定的置分别表示在一定的置分别表示在一定的置信度时,以单次测定值信度时,以单次测定值信度时,以单次测定值信度时,以单次测定值x或以平均值为中心的包
39、含真值或以平均值为中心的包含真值的取值范围,即的取值范围,即 的置信区间的置信区间。在置信区间内包含。在置信区间内包含。在置信区间内包含。在置信区间内包含 的概率称为的概率称为的概率称为的概率称为置信度置信度置信度置信度,它表明了人们对所作的判断有把握,它表明了人们对所作的判断有把握,它表明了人们对所作的判断有把握,它表明了人们对所作的判断有把握的程度,用的程度,用的程度,用的程度,用P表示。表示。表示。表示。u u值可由表值可由表值可由表值可由表12-1中查到,它与一定的中查到,它与一定的中查到,它与一定的中查到,它与一定的置信度相对应置信度相对应置信度相对应置信度相对应。(12-17)第四
40、十张,PPT共七十六页,创作于2022年6月 在在对对真真值值进进行行区区间间估估计计时时,置置信信度度的的高高低低要要定定得得恰恰当。一般以当。一般以95%或或90%的把握即可。的把握即可。式式(12-14b)和和式式(12-17)还还可可以以看看出出置置信信区区间间的的大大小小取取决决于于测测定定的的精精密密度度和和对对置置信信度度的的选选择择,对对于于平平均均值值来来说说还还与与测测定定的的次次数数有有关关。当当一一定定时时,置置信信度度定定得得愈愈大大,u 值值愈愈大大,过过大大的的置置信信区区间间将将使使其其失失去去实实用用意意义义。若若将将置置信信度度固固定定,当当测测定定的的精精
41、密密度度越越高高和和测测定定次次数数越越多多时时,置置信信区区间间越越小小,表表明明x或或越越接接近近真真值值,即即测测定定的的准准确度越高。确度越高。例题例题1:第四十一张,PPT共七十六页,创作于2022年6月 注意:注意:注意:注意:是确定且客观存在的,它没有随机性。而区间是确定且客观存在的,它没有随机性。而区间是确定且客观存在的,它没有随机性。而区间是确定且客观存在的,它没有随机性。而区间xuxu或或或或是具有随机性的,即它们均与一定的置信度相是具有随机性的,即它们均与一定的置信度相是具有随机性的,即它们均与一定的置信度相是具有随机性的,即它们均与一定的置信度相联系。因此我们只能说置信
42、区间包含真值的概率是联系。因此我们只能说置信区间包含真值的概率是联系。因此我们只能说置信区间包含真值的概率是联系。因此我们只能说置信区间包含真值的概率是0.950.95,而不,而不能认为真值落在上述区间的概率是能认为真值落在上述区间的概率是0.950.95。(二)已知样本标准偏差(二)已知样本标准偏差(二)已知样本标准偏差(二)已知样本标准偏差S S时时时时 在实际工作中,通过有限次的测定是无法得知在实际工作中,通过有限次的测定是无法得知 和和和和 的,只能求出的,只能求出的,只能求出的,只能求出和和和和S。而且当测定次数较少时,测定值或随机。而且当测定次数较少时,测定值或随机。而且当测定次数
43、较少时,测定值或随机。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了误差也不呈正态分布,这就给少量测定数据的统计处理带来了误差也不呈正态分布,这就给少量测定数据的统计处理带来了误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用困难。此时若用困难。此时若用困难。此时若用S代替代替代替代替 从而对从而对从而对从而对 作出估计必然会引起偏离,作出估计必然会引起偏离,作出估计必然会引起偏离,作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量而且测定次数越少,偏离就越大。如果采用另一新统计量而且测定次数越少,偏离就越大。
44、如果采用另一新统计量而且测定次数越少,偏离就越大。如果采用另一新统计量tP,fP,f取代取代取代取代u(仅与仅与仅与仅与P有关有关),上述偏离即可得到修正。,上述偏离即可得到修正。,上述偏离即可得到修正。,上述偏离即可得到修正。第四十二张,PPT共七十六页,创作于2022年6月 t分布法:分布法:t值的定义:值的定义:(12-18)t分分布布是是有有限限测测定定数数据据及及其其随随机机误误差差的的分分布布规规律律。t分分布布曲曲线线见见图图3-6,其其中中纵纵坐坐标标仍仍然然表表示示概概率率密密度度值值,横横坐坐标标则则用用统统计计量量t值值来来表表示示。显显然然,在在置置信信度度相相同同时时
45、,t分分布布曲曲线线的的形形状状随随f(f=n-1)而而变变化化,反反映映了了t分分布布与与测测定定次次数数有有关关有有实实质质。由由图图3-6可可知知,随随着着测测定定次次数数增增多多,t分分布布曲曲线线愈愈来来愈愈陡陡峭峭,测测定定值值的的集集中中趋趋势势亦亦更更加加明明显显。当当f时时,t分分布布曲曲线线就就与与正正态态分分布布曲曲线线合合为为一一体体,因因此此可以认为正态分布就是可以认为正态分布就是t的极限。的极限。第四十三张,PPT共七十六页,创作于2022年6月 图图图图12-6t12-6t分布曲线分布曲线分布曲线分布曲线 第四十四张,PPT共七十六页,创作于2022年6月 与正态
46、分布曲线一样,与正态分布曲线一样,与正态分布曲线一样,与正态分布曲线一样,t t分布曲线下面某区间的分布曲线下面某区间的面积也表示随机误差在此区间的概率。但面积也表示随机误差在此区间的概率。但t t值与标准值与标准值与标准值与标准正态分布中的正态分布中的正态分布中的正态分布中的u u值不同,它不仅与概率还与测定次数有值不同,它不仅与概率还与测定次数有值不同,它不仅与概率还与测定次数有值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的关。不同置信度和自由度所对应的关。不同置信度和自由度所对应的关。不同置信度和自由度所对应的t t值见表值见表值见表值见表12-212-2中。中。中。中
47、。第四十五张,PPT共七十六页,创作于2022年6月 表表表表12-2t12-2tP P,f f值表(双边)值表(双边)值表(双边)值表(双边)t值值P90%95%99%99.5%f(n-1)16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.04
48、2.75(3.01)601.672.002.66(2.87)1201.661.982.622.811.641.962.582.81第四十六张,PPT共七十六页,创作于2022年6月 由由表表3-2中中的的数数据据可可知知,随随着着自自由由度度的的增增加加,t值值逐逐渐渐减减小小并并与与u值值接接近近。当当f=20时时,t与与u已已经经比比较较接接近近。当当f时,时,tu,S。在引用。在引用t值时,一般取值时,一般取0.95置信度。置信度。根根据据样样本本的的单单次次测测定定值值x或或平平均均值值分分别别表表示示的的置置信区间时,根据信区间时,根据t分布则可以得出以下的关系:分布则可以得出以下的
49、关系:(12-18a)或或(12-19)第四十七张,PPT共七十六页,创作于2022年6月 式式(12-18a)和和式式(12-19)的的意意义义在在于于,真真值值虽虽然然不不为为所所知知(也也未未知知),但但可可以以期期望望由由有有限限的的测测定定值值计计算算出出一一个个范范围围,它它将将以以一一定定的的置置信信度度将将真真值值包包含含在在内内。该范围越小,测定的准确度越高。该范围越小,测定的准确度越高。例例题题2:式式(12-19)是是计计算算置置信信区区间间通通常常使使用用的的关关系系式式。由由该该式式可可知知,当当P一一定定时时,置置信信区区间间的的大大小小与与tP,f、S、n均均有有
50、关关,而而且且tP,f与与S实实际际也也都都受受n的的影影响响,即即n值值越越大大,置信区间越小。例置信区间越小。例3:二、可疑测定值的取舍二、可疑测定值的取舍 平平行行测测定定的的数数据据中中,有有时时会会出出现现一一二二个个与与其其结结果果相相关关较较大大的的测测定定值值,称称为为可可疑疑值值或或异异常常值值。对对于于为为数数不不多多的的测测定定数数据据,可可疑疑值值的的取取舍舍往往往往对对平平均均值值和和精精密密度造成相当显著的影响。度造成相当显著的影响。第四十八张,PPT共七十六页,创作于2022年6月 对可疑值的取舍实质是区分可疑值与其它测定值之对可疑值的取舍实质是区分可疑值与其它测