《分析化学-第三章(3).ppt》由会员分享,可在线阅读,更多相关《分析化学-第三章(3).ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 天津科技大学3.3 分析化学中的数据处理分析化学中的数据处理处理处理偶然误差:偶然误差:运用统计方法处理数据运用统计方法处理数据总体总体样本样本 天津科技大学 总体平均值(总体平均值():):测定次数无限增多时,所得平均值。测定次数无限增多时,所得平均值。总体标准偏差:总体标准偏差:测量次数为无限多次:测量次数为无限多次:总体平均值:总体平均值:总体标准偏差:总体标准偏差 天津科技大学n,nf,x,即,即s 天津科技大学平均值的标准偏差:平均值的标准偏差:从总体中取从总体中取m个样本,每个样本测量个样本,每个样本测量n次,次,用统计学方法证明:用统计学方法证明:n次测量平均值的标准次测量平均
2、值的标准偏差偏差sx与单次测量结果的标准偏差与单次测量结果的标准偏差s之间有下之间有下列关系:列关系:天津科技大学1.1.误差的正态分布误差的正态分布 偶然误差服从统计规律。偶然误差服从统计规律。在分析化学中,偶然误差一般可按在分析化学中,偶然误差一般可按正正态分布规律态分布规律进行处理,即进行处理,即高斯分布。高斯分布。正态分布曲线的数学表达式为:正态分布曲线的数学表达式为:天津科技大学 y:概率密度;:概率密度;x:测量值;:测量值;:总体平均值:总体平均值.没有系统误差时,为真值没有系统误差时,为真值.:总体标准偏差;:总体标准偏差;x:随机误差。:随机误差。若以若以x作横坐标,则作横坐
3、标,则曲线最高点对应的横坐标曲线最高点对应的横坐标为零,这时曲线为为零,这时曲线为正态分正态分布曲线布曲线.天津科技大学 ax时,时,y值最大,值最大,最高点。体现测量值的最高点。体现测量值的集中趋势。大多数测量集中趋势。大多数测量值集中在平均值附近。值集中在平均值附近。b曲线以通过曲线以通过x这一点的垂直线为对这一点的垂直线为对称轴。说明正误差和负称轴。说明正误差和负误差出现的概率相等。误差出现的概率相等。天津科技大学 c.当当x趋向于趋向于或或时,曲线以时,曲线以x轴为渐近轴为渐近线,说明小误差出现的线,说明小误差出现的概率大,大误差出概率大,大误差出现的概率小,出现很大现的概率小,出现很
4、大误差的概率极小,趋近误差的概率极小,趋近于零。于零。d.x时的概率密度时的概率密度为:为:天津科技大学 越小,测量值的分散越小,测量值的分散程度越小,曲线是瘦高程度越小,曲线是瘦高的;的;越大,测量值的分布越大,测量值的分布就越分散,曲线是矮胖就越分散,曲线是矮胖的。的。正态分布曲线的两个基本参数:正态分布曲线的两个基本参数:和和。反映测量值分布的集中趋势,反映测量值分布的集中趋势,反映测量值分布的分散程度。反映测量值分布的分散程度。天津科技大学 当当一定,一定,值不同值不同时,曲线形状不变,时,曲线形状不变,整个曲线向左或向右整个曲线向左或向右移动位置。移动位置。正态分布曲线随正态分布曲线
5、随和和不同而不同,应不同而不同,应用不太方便,故通常将用不太方便,故通常将横坐标改为横坐标改为u u来表示,来表示,称为称为标准正态分布曲线标准正态分布曲线。确定确定、之后,正态分布曲线被完全确之后,正态分布曲线被完全确定了。定了。标准正态分布曲线:曲线的形状与标准正态分布曲线:曲线的形状与和和大小无关。大小无关。天津科技大学u定义为:定义为:数学表达式:数学表达式:天津科技大学2.随机误差的区间概率随机误差的区间概率 正态分布曲线与横坐标正态分布曲线与横坐标到到之间之间所夹的面积,代表所有数据出现概率的总和,所夹的面积,代表所有数据出现概率的总和,其值应为其值应为1,即概率,即概率P为:为:
6、随机误差在某一区间出现的概率,可以随机误差在某一区间出现的概率,可以取不同取不同u值对式上式进行积分,称为值对式上式进行积分,称为正态分正态分布概率积分表布概率积分表(p57表)。表)。天津科技大学u表表 天津科技大学例如随机误差在例如随机误差在u1区间,即测量值在区间,即测量值在1区间的概率是区间的概率是:20.341368.3。说明:说明:表中面积与阴影部分相表中面积与阴影部分相对应。若求对应。若求u值区间的概值区间的概率,必须乘以率,必须乘以2。天津科技大学 随机误差超过随机误差超过3的测量值出现的概率是的测量值出现的概率是很小的,仅占很小的,仅占0.3。在实际工作中,如果多次重复测量中
7、的在实际工作中,如果多次重复测量中的个别数据的误差的绝对值大于个别数据的误差的绝对值大于3,可以舍去。,可以舍去。天津科技大学例例 已知试样已知试样Co的质量分数的测量标准值为的质量分数的测量标准值为1.75,0.10,如果测量时无系统误差,如果测量时无系统误差,求分析结果落在(求分析结果落在(1.75 0.15)范围内的)范围内的概率。概率。解:解:查表,求得概率为:查表,求得概率为:20.433286.8 天津科技大学例例 同上例,求分析结果大于同上例,求分析结果大于2.00的概率。的概率。解:解:分析结果大于分析结果大于2.00的分布情况,属于的分布情况,属于单边检验单边检验。查表,求得
8、概率为查表,求得概率为0.4938。阴影部分以外的概率阴影部分以外的概率0.50000.49380.0062分析结果大于分析结果大于2.00的概率为的概率为0.62。天津科技大学 有限次数的测量:有限次数的测量:s s代替代替,估算测量数据的分散情况。,估算测量数据的分散情况。必然引起对正态分布的偏离必然引起对正态分布的偏离用用t t分布处理分布处理.t t分布是英国统计学家兼化学家分布是英国统计学家兼化学家GossetGosset提提出来的。出来的。3.少量数据的统计处理少量数据的统计处理(1)t分布曲线分布曲线 天津科技大学t t定义为:定义为:t t为在选定某一置信度(真值出现几率)为在
9、选定某一置信度(真值出现几率)下的下的几率系数几率系数,是与置信度和自由度,是与置信度和自由度(f(fn-1)n-1)有关的统计量,称为有关的统计量,称为置信因子置信因子。图图 t分布曲线分布曲线f1,5,天津科技大学t分布曲线与正态分分布曲线与正态分布曲线相似,分布布曲线相似,分布曲线随曲线随f而改变。当而改变。当f趋近趋近时,时,t分布就分布就趋近正态分布。趋近正态分布。t分布曲线下面一定区间内的积分面积,分布曲线下面一定区间内的积分面积,是该区间内随机误差出现的概率。是该区间内随机误差出现的概率。图图 t分布曲线分布曲线f1,5,天津科技大学置信度置信度P:表示在某一:表示在某一t时,测
10、定值落在时,测定值落在(ts)范围内的概率。范围内的概率。显著性水准显著性水准:落在此范围之外的概率:落在此范围之外的概率(1P)。一般表示为一般表示为t,f。例如:。例如:t0.05,10表示置信度为表示置信度为95,自由度为,自由度为10时的时的t值;值;t0.01,5表示置信度为表示置信度为99,自由度为,自由度为5时的时的t值。值。天津科技大学 天津科技大学(2)平均值的置信区间平均值的置信区间用单次测量结果用单次测量结果x来估计总体平均值来估计总体平均值的范围的范围,则则在在(x1)范围内的概率为范围内的概率为68.3,在在(x1.6)范围内的概率为范围内的概率为90,在在(x1.9
11、6)范围内的概率为范围内的概率为95%,数学表达式为:数学表达式为:xu 以样本平均值来估计总体平均值可能存以样本平均值来估计总体平均值可能存在的区间,按下式进行估算:在的区间,按下式进行估算:天津科技大学 对于少量测量数据,必须根据对于少量测量数据,必须根据t分布处理,分布处理,按按t的定义式可得出:的定义式可得出:上式表示上式表示平均值的置信区间:平均值的置信区间:在一定置在一定置信度下,以平均值信度下,以平均值x为中心,包括总体平均为中心,包括总体平均值值的范围。的范围。天津科技大学测定结果所包含的最大偶然误差为测定结果所包含的最大偶然误差为 选择的置信度越高,置信区间越宽。选择的置信度越高,置信区间越宽。测定次数越多,测定次数越多,t 值越小。置信区间越窄值越小。置信区间越窄,与,与越接近。越接近。平均值置信区间的大小取决于:平均值置信区间的大小取决于:测定精密度、测定次数(测定精密度、测定次数(n)和置信水平)和置信水平(t)天津科技大学在分析化学中,一般将置信度定在在分析化学中,一般将置信度定在95或或90。