《测量误差与数据处理n上海理工.pptx》由会员分享,可在线阅读,更多相关《测量误差与数据处理n上海理工.pptx(192页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.测量误差与数据处理测量误差与数据处理第1页/共192页2.1 概述测量的目的 求出物理量的真值测量过程中各种因素 测量数据有误差 测量过程都是某人、在一定环境条件下,使用一定的仪器进行的。1、由于测量仪器的结构不可能完美无缺;2、观测者的操作、调整和读数也不可能完全准确;3、环境条件的变化(如温度的波动、振动、电磁辐射的随机变化);4、理论的近似性等等,第2页/共192页对一个物理量进行n次测量,获得了n个测量值 谓之测定值,那么,每次测量后测定值所包含的误差为:不能:用 n个方程求n+1 个未知数,不能求出真值X。可以:在给定条件下,找出测定值与真值间误差的分布规律,从而由一组测定值
2、中确定一个所谓的最优概值,用它来代表我们要测的物理量,随后对这最优概值的精确度做出估计。这个过程称之为数据处理数据处理。数据处理的目的和过程就是使随机误差对最终结果的影响减至最小。第3页/共192页2.1.1、误差的基本概念、误差的基本概念 测量值x 与真值x0之差,就称为误差(也称绝对误差),记为x,即 测量误差测量误差=测得值测得值-真值真值 x =x x0真值是一定条件下被测量的客观实际值,是被测量本身所具有的真实大小,只有通过完善的测量才有可能获得。实际上,由于被测量的定义和测量不可能完善,因而真值往往是未知的,真值只是一个理想的概念。只有少数情况下才可能知道。第4页/共192页 约定
3、真值:世界各国公认的几何量和物理量的最高基准的量值 相对真值:标准仪器的测得值或用来作为测量标准用的标准器的值、高一级精度仪表的测量值。约定真值是具有不确定度如砝码、秤。如:公制热力学温度基准:开(K)约定是水处于三相点时温度值的1/273.16。约定公制长度基准:米(m)m=1650763.73 -氪-86的2p10-5d5能级间跃迁在真空中的辐射波长 理论真值:设计时给定或用数学、物理公式计算出的给定值。如三角形内角之和为180度。第5页/共192页 对同一测量对象,误差的绝对值越小,测量值就越好。而对不同的测量对象,就不能只凭误差来评判测量结果的优劣。例如,分别测量一个长方形的长和宽,若
4、以米尺测量,误差都是0.5 mm,那么前者的结果比后者好。因此,在这种情况下,需用相对误差来说明测量精确度的高低。相对误差为绝对误差与真值之比,用百分率表示:相对误差=绝对误差真值100%当绝对误差很小时可以用以下近似式:相对误差绝对误差测量结果(真值的最佳估计值)100%用符号表示:引用误差第6页/共192页 引用误差 在多档和连续刻度的仪表中,因为各档示值和对应真值都不一样,这时若按上式计算相对误差,所用的分母也不一样,故很麻烦。为方便计算,又定义了引用误差,这是一种简化和实用方便的相对误差。其分母一律取仪表满量程的最大刻度值(满刻度值),用M 表示;其分子为在测量范围内产生的最大绝对误差
5、,用 表示;用 f表示引用误差。其表达式为第7页/共192页2.1.2、测量数据的处理 数据处理的任务就是对测量所获得的一系列数据进行深入的分析,以便得到各参数之间的关系,有时还需要用到数学解析的方法,推导出各参量之间的函数关系。通过数据处理可以确定并表示出输入变量与输出变量之间的关系,从而揭示事物的本质及事物之间的内在联系。第8页/共192页2、误差来源、误差来源 分析误差来源是测量误差分析的重要环境,只有知道了误差源才能消除或减少测量误差。主要有以下四种误差源。1)、设备装置误差 标准器误差 仪器仪表误差 辅助设备和附件误差2)、环境误差环境条件(温度、湿度、气压、振动等)与标准状态不一致
6、,引起测量装置和被测量本身的变化所造成的误差。第9页/共192页3)、方法和理论误差由于所采用的测量原理或者测量方法本身的近似、不严格、不完备所产生的测量误差。电流表外接电流表外接电流表内接电流表内接第10页/共192页4)、人员误差 操作人员视觉、读数误差、经验、熟练程度、精神方面原因(疲劳)第11页/共192页3、误差的分类、误差的分类 系统误差(System error)是被测量的数学期望与真值之差(数学期望是无限多次测量结果的平均值),表示测量结果偏离真值的程度。由特定原因引起、具有一定因果关系并按确定规律产生,如装置、环境、动力源变化、人为因素。再现性-偏差(Deviation)理论
7、分析/实验验证-原因和规律-减少/消除第12页/共192页3、误差的分类、误差的分类 随机误差(Random error)是测量值与数学期望之差。它是同一条件下多次测量同一量值时,误差的绝对值和符号以不可预测的规律随机变化的误差,表示测量结果分散性的程度。因许多不确定性因素而随机发生 偶然性(不明确、无规律)概率和统计性处理(无法消除/修正)第13页/共192页3、误差的分类、误差的分类 粗大误差(Abnormal error)是明显歪曲测量结果的误差。它一般是由测量者的主观原因引起,或由于测量条件以外地改变以引起的误差均属粗大误差。发现粗大误差就要立即剔除。第14页/共192页 p X0 x
8、i x 真值真值 期望值期望值 测量值测量值系统误差系统误差随机误差随机误差第15页/共192页2.2 随机误差的估计2.2.1 测量数据的统计处理一、频率分布直方图与经验分布曲线的建立一、频率分布直方图与经验分布曲线的建立 用同一个仪器对同一对象在相同条件下进行多次测量,其结果总是各不相同的,例如对某处于稳定工作状况下运行的透平机械进行测量,发现其转速是在某一区间波动的,现在以同一工况下50次测量中所获取的数据作一分析。第16页/共192页4753.14757.54752.74752.84752.14749.24750.64751.04753.94751.24750.34757.34754.
9、14751.24752.34748.44752.54754.74750.04751.04752.34751.84750.64754.54752.44751.64747.94748.34753.44755.54752.74749.14753.24751.94755.44755.64750.24756.74755.14752.04751.14752.64753.64749.14755.64754.04753.94752.84754.54753.7例例2-1 透平机械同一稳定工况下对其转速进行多次测量,得到的结果如下:(单位是转/分)第17页/共192页问题1 1、在这些数据中究竟哪一个数据是最可信
10、赖的?也就是说被测量的物理量的真值最大可能是什么?2 2、能不能以99%99%的把握断定真值在哪一个数据区间中?数据的特点1、随机性:在等精度的测量条件下,测定值互不相等,呈现波动状态,这就是数据的随机性.2、规律性:测定值皆在4747.0到4758.0之间,范围并不大,并且落在4750.0到4754.0之间的次数很多,而落在这一区间以外的数据却很少,这种在数值上的有界性和中间大两头小的单峰性规律在被测量技术中是普遍存在的.第18页/共192页有关名词与概念 我们将所研究对象的单个测量值称为个体,全部测量值称为母体(所有可能出现的值),母体中的一部分称为子样,子样中所包含的个体数目称为子样容量
11、。随机变量:在随机因素的作用下用等精度测量法对同一对象进行多次测量以后可以发现,每一次测量结果各不相同,我们把这些具有数值变化而事先又无法确定的测定值用来表示。当测量次数无限增加,对于任何一个实数x,当 x时,在全部测量值中出现的次数有确定的概率,我们称这样的测定值为随机变量。如果随机变量的取值可以是数轴上某一区间的任意数值,则称为连续型随机变量。不难理解随机误差也是随机变量。第19页/共192页在实际工作中,我们经常将这些本质上是连续变化的测定值离散化。例如我们决不会将U型管压力计的读数读成 米(虽然它在一脉动过程中是确实存在过的),也不能对五位数字显示的仪表中读出六位或七位的读数。因此,在
12、实际工作中,测定值以及测量误差所表现出来的数据一般都是离散型随机变量。第20页/共192页测量值随机变化分布规律研究方法(1)对所研究的子样,找出最大值和最小值;本例中最大值是4757.5,而最小值为4747.9(2)决定组距和组数:在子样容量较大时,组数分得多些,组距可小一些,通常可分为1020组。子样容量小时,可适当少分几组。组距可以等分也可以不等分,一般来说,分组应突出子样的特点并冲淡子样的随机波动为原则。在本例中将数据分为11组,组距为1.0。(3)决定分点:通常应使分点比原测量精度高一位,并避免个体数据恰好落在分点上。例如本例中可分成如下十一组:4747.054748.05,474.
13、05749.05,4756.054757.05,4757.054758.05第21页/共192页(4)计算出各组频数:用唱票的办法数出落在各组的数目,称为频数。各组频数与子样容量之比称为频率。(5)计算出测定值最小的组至最大组的累积频数和累积频率(6)编制测定值子样的频数、频率分布表,绘制频数分布直方图;(7)绘制累积频率分布图,这种分布也称经验分布。第22页/共192页表表2-1 频数、频率分布表频数、频率分布表第23页/共192页频率分布直方图与累积频率分布(经验分布)图频数分布直方图累积频率分布图,也称经验分布第24页/共192页频数(频率)分布直方图和累积频率分布图都是研究测定值数据规
14、律性的重要工具。1、用同样的仪表及测量手段再测量50次,再作一次上述的数据整理工作 发现它与第一次的数据会有若干差异;2、将这二组数据混在一起,组成了容量为 的子样,用它得出的子样频数(频率)分布直方图及累积频率分布 又与前两组不同;3逐步增加子样的容量并相应地加大组数后,各组的频率将逐步以某确定的数值稳定下来,直方图的也逐渐趋向于一条曲线。第25页/共192页4、当子样容量趋于无穷大,测定值将连续地充满数轴的某一区间,这时各组的频率可任意地接近于某一定值,此值即称为概率;而频率的直方图将演变为一光滑曲线,称之为分布密度曲线,如果表达为函数则称为分布密度函数,用f(x)来表示。同样,对于经验分
15、布和函数Fn(x),当子样容量趋于无穷大时趋向于母体的理论分布曲线和理论分布函数F(x)图图2-3 当子样容量限增大时,频率直方图和经验分布的演变当子样容量限增大时,频率直方图和经验分布的演变 a)频率直方图频率直方图 b)累积频率分布)累积频率分布(经验分布经验分布)直方图直方图第26页/共192页人们对不同的测量对象在等精度测量条件下作了大量的试验,通过对各测定值的统计及分析,绘制了大量频率直方图后发现:尽管在子样容量较小时直方图差别很大,但随着子样的增加,最终的分布密度曲线的形状将趋于一个共同的规律:1、分布密度曲线都有一个峰值,而且此峰值一般都落在该随机变量散布区间的中心。2、而各条分
16、布密度曲线的差异却在于密集程度不同,有的随机变量在中心部分集中度高,有的却比较分散。第27页/共192页为了衡量测定值数据的密集程度,引入两个常用的概念:子样平均值:把子样数据的算术平均值看作子样散布的中心子样方差:它是一个描述在子样平均值附近散布程度的参数第28页/共192页二、随机误差分布的性质对大量测定值进行分析研究,并建立了直方图以后,逐渐通过子样认识了母体,同时对含有随机误差的测定值分布规律进行了总结,它大体上有如下一些性质:(一)有界性:观察子样发现,不论子样容量有多大,测定值总是在一定的、相当窄的范围内变动,故而随机误差也总是在一定的、相当窄的范围内变动的。由于测量的精确度不一,
17、测定值的随机误差也会不一样,但无论如何它是有界的。(二)对称性:当子样容量足够大后就可发现,出现正的误差和负误差的次数大致相等;更确切地说,绝对值相等但符号相反的误差以同样的频率出现。在概率密度曲线上这样的性质就表现出它的对称性。对称轴x=m的m是母体各元素的算术平均值,它随容量的增加而逐渐地逼近其真值,当子样容量趋于无穷大时,它就代表着测量对象的真值。第29页/共192页(三)补偿性:在等精度测量的条件下,全部随机误差的算术平均值在子样容量为无穷大时趋于零。(四)单峰性:随机误差非但是有界的,而且具有单峰性,也就是说,误差的绝对值越小,其出现的频率就越大,测量值等于其算术平均值(或说随机误差
18、为零)时出现的概率为最大,这就是概率密度曲线的单峰性。以上四点性质都是从大量的观察统计中得到的,已经获得了公认,因此也称为随机误差分布的公理。在这几点性质的基础上,推导出正态分布函数,并发展了误差理论。第30页/共192页2.2.2 随机误差的正态分布规律一、正态分布密度函数一、正态分布密度函数 分析结果表明,当观测次数很多时,随机误差的出现,呈现出统计学上的规律性。而且,观测次数越多,规律性越明显。当观测次数n无限增多(n)、误差区间d无限缩小(d0)时,各矩形的顶边就连成一条光滑的曲线,这条曲线称为“正态分布曲线”,又称为“高斯误差分布曲线”。所以随机误差具有正态分布的特性。根据误差分布的
19、四点性质及概率论原理推导出正态分布函数 参见书P17二、正态分布函数的性质二、正态分布函数的性质 正态分布具有和误差分布相同的四点性质第31页/共192页测量数据 直方图(频率直方图,经验分布直方图)概率论原理 分布密度曲线、分布密度函数f(x)随机误差分布四个性质 理论分布曲线、理论分布函数F(x)(有界性、单峰性、对称性、补偿性)正态分布函数推导数据量无穷大误差,不知测量值数学期望值(平均值)标准误差第32页/共192页当m和确定后,曲线的形状就确定了。所以m和是决定正态分布的两个特征参数。在概率论和数理统计学中,它们都是随机变量的数字特征。其中m表示随机变量的集中位置,而表示随机变量的分
20、散程度。上式可简写为:n(x;m,)。其中n表示正态分布,注意“;”第33页/共192页正态分布的平均值与真值当样本数为无穷大时,样本数的数学期望(平均值)是真值的最佳估计值X0是真值第34页/共192页满足归一化条件满足归一化条件可以证明:可以证明:0 0总面积总面积=1=1正态分布特点正态分布特点总面积=1第35页/共192页三、正态分布表及其应用三、正态分布表及其应用考虑特殊情况,令m=0,=1,n(t;0,1)称为标准正态分布密度函数。将正态分布密度函数积分,得到正态分布函数N(x;m,);同理,令m=0,=1,得到N(t;0,1)称为标准正态分布函数。第36页/共192页由于标准正态
21、分布函数广泛应用于误差理论中,所以已将函数制成表格(附表一、二)。标准正态分布密度函数与分布函数具有如下性质:(一)(二)对于非标准正态分布n(x;m,)及N(x;m,),则可先进行标准化,然后用标准正态分布表来求取。例2-2,2-3,2-4第37页/共192页查表为:0.9332第38页/共192页第39页/共192页=N(1;0,1)-N(-1;0,1)=N(1;0,1)-(1-N(1;0,1)=2N(1;0,1)-1=2*0.8413-1=0.6826x-m=,N(/;0,1)x-m=-,N(-/;0,1)问第40页/共192页2.2.4 随机误差的估计随机误差的估计前面正态分布公式中的
22、m,都是母体分布的特征量,都是子样容量为无穷大时的理论值。测量次数总是有限的,如何通过有限次的测量所获得的测定值来估计被测量的真值及其误差范围,这是误差理论所要解决的问题一、参数的点估计一、参数的点估计 参数估计分为点估计和区间估计。通过子样测量值计算出子样的特征量,并根据子样特征量对母体特征量进行估计称为点估计。第41页/共192页为了把某一统计量作为未知母体分布参数的估计值,我们还希望这个估计值的数学期望就等于该未知母体参数,具有这种性质的估计值叫做母体参数的无偏估计(值)。协调估计值并不一定等于无偏估计值。无偏估计值可以用下式表示:(一)子样平均数的数学期望这说明子样平均数的数学期望就等
23、于母体的数学期望,对于测定值这个随机变量,子样平均数 的数学期望就等于母体的平均数m,所以最优概值 是母体平均数m的无偏估计。n组或无穷组子样平均值的平均值某一组子样的平均值母体的数学期望,即这个随机变量所有值的平均值第42页/共192页第43页/共192页(二)子样平均数方差这说明子样平均数的方差并不等于母体的方差,而只是它的1/n倍。这一结论可以推广到等精度测量条件下,对测量对象进行多次测量所获得结果的平均值要比单次测量所获结果精确的多。第44页/共192页平均值的标准差平均值作为期望值的最佳估计值多组数据的平均值也是随机变量,符合正态分布其标准差为:测量次数n越多,平均值标准差越小。n超
24、过一定数值后,(1)标准差的减小明显慢了下来(2)测量工作量大量增加,带来新的误差 一般根据情况,选择4-20次第45页/共192页(三)子样最大或然方差的数学期望研究它的数学期望子样平均值其数学期望第46页/共192页由方差的定义第47页/共192页应该为n n-1第48页/共192页二、参数的区间估计二、参数的区间估计 点估计是用一个数去估计未知参数。区间估计就是用一个区间估计未知数,即把未知数估计在某两个界限之间,并且还要知道未知数落在这个区间的可靠性有多少。如一个人的年龄95%可能是30-35岁之间。数理统计学中的区间估计,就是要用有确切意义的数字表达某个未知母体参数落在一定区间内的“
25、肯定程度”。下面用一个简单的数字例子说明区间估计的原理和方法求95%的置信区间步骤计算平均值 平均值符合正态分布 正态分布标准化 查表求95%概率区间 第49页/共192页第50页/共192页如果以 代入可得 从表面看来,最后上式的意义是m落在 区间的概率为95,但这是毫无意义的,因为m是母体平均数,是一个确切的数值,我们不能说它落在某区间的概率是多少,事实上既然括号内已没有任何随机的东西,当然就没有什么概率可言了。第51页/共192页应该这样理解,进行多次抽样,可得到多个不同的xm2.94这个区间,95%的x落在这个区间有95%的x2.94这个区间包含m问题是 本身是随机变量,故区间 也是随
26、机的,我们可以把它写成:本例中 95%并不表示通常所理解的概率,而只是表示我们对某区间包含着m这一事实的置信程度,称之为置信度或置信概率。见书P29详细说明第52页/共192页三、测量结果的表示三、测量结果的表示测量结果=子样平均值置信区间半长 (置信度1-a)我们所说的测量结果必须理解为在一定置信度下,以子样平均值为中心,而以置信区间半长为界限的量第53页/共192页 一般把置信区间取为一般把置信区间取为 的若干倍,的若干倍,=k=kk:k:置信因子置信因子/置信系数置信系数当当k=1k=1时,置信区间为时,置信区间为=,置信概率为置信概率为68.3%68.3%当当k=2k=2时,置信区间为
27、时,置信区间为=2=2,置信概率为,置信概率为95.4%95.4%当当k=3k=3时,置信区间为时,置信区间为=3=3,置信概率为,置信概率为99.7%99.7%当以子样进行估计母体参数时,用子样标准差替代母体标准差当以子样进行估计母体参数时,用子样标准差替代母体标准差 注意!上述的讨论是在正态分布的理论推演出来的,如果子样容量很小,它并不符合正态分布第54页/共192页例例2-52-5 透平机械同一稳定工况下对其转速进行多次测量,其结果如下(转/分)4753.14757.54752.74752.84752.14749.24750.64751.04753.94751.24750.34753.3
28、4752.14751.24752.34748.44752.54754.74750.04751.04752.34751.84750.64752.54752.44751.64747.94748.34753.44753.54752.74749.14753.24751.94753.44755.64750.24756.74752.14752.04751.14752.64753.64749.14755.64754.04753.94752.84754.54753.7第55页/共192页实际上这个不用算应该为n n-1第56页/共192页第57页/共192页2.2.3 小子样误差分析-t分布 测量次数趋于无穷
29、只是一种理想情况,这时物理量的概率密度服从正态分布。当次数减少时,概率密度曲线变得平坦(如图),成为t分布,也叫学生分布(英国数理统计师科萨特提出)对有限次测量的结果,要保持与无穷次测量同样的置信概率,即概率分布曲线下相等的面积,显然要扩大置信区间,把随机误差乘以一个大于1的因子t。t因子与测量次数(自由度)和置信概率密度有关。t 分布与正态分布图分布与正态分布图第58页/共192页 t t 分布只取决于子样容量分布只取决于子样容量 n n 或自由度或自由度(n 1)而与母体标准误差而与母体标准误差无关。它也具有对无关。它也具有对称性,称性,与正态分布相比,与正态分布相比,t t 分布的中心值
30、比较小,分布的中心值比较小,而分散度比较大。而分散度比较大。越小,中心值越低,分散度越越小,中心值越低,分散度越大。大。当当大于等于大于等于3030时,时,t t 分布趋于正态分布分布趋于正态分布。第59页/共192页当子样数3030时,误差限一般表示为:tt,t t值取决于自由度v v和置信概率P Pvpvp0.990.950.990.9544.62.78142.982.1454.032.57162.922.1263.712.45182.882.1073.502.36202.852.0983.362.31302.752.0493.252.26402.702.02103.172.23602.6
31、62.00123.052.182.581.96第60页/共192页正态分布与t分布对比:1、当置信区间一定时,正态分布的置信概率比t分布的大;2、当置信概率一定时,正态分布的置信区间比t分布的小.3、从另一角度来说就是当用正态分布来估计小子样时,往往得到太好的结果.第61页/共192页应该是附表3第62页/共192页2.3 疏忽误差疏忽误差 疏忽误差又称粗大误差(粗差),它是由于疏忽所引起的,1、测量试验人员的不正确行为(读数看错、偶然碰动仪表等等),2、外界因素发生突然变动(如电源电压突然大幅度波动)等等。测量值-平均值2.3.1 拉伊特方法拉伊特方法判断疏忽误差最简单的方法莫过于应用拉伊特
32、方法,也称判断粗差的拉伊特准则。它可叙述如下:如果测量列的残差列 中有一个残差 ,那么可以认为存在有疏忽误差,因而含有这一突出残差的数据可以删去;如果不立即删去,也无论如何要对整个测量列数据进行研究,以期找到存在疏忽误差的可能性。第63页/共192页拉伊特方法的根据是偶然误差这个随机变量适用于正态分布,而误差大于 的概率是极小的,因之反过来说,大于 的误差已不属于随机误差的范围,显然,这就是该剔除的疏忽误差了。剔除了最大的超过 的数据以后,应该重新计算其余子样平均值,第二次计算测量列的标准误差 ,再一次判断数据中有无超过 者,这一过程一直到所有数据全在所允许的范围中为止。大量的统计数据证明,由
33、于般工程实验的测量数据(子样容量)比较少,按正态分布理论为基础的拉伊特方法不太准确。而且由于所取界限太宽,容易混入该剔除的数据,故目前国内外都推荐采用以 分布为基础的格拉布斯(Grubbs)方法。第64页/共192页2.3.2、格拉布斯方法、格拉布斯方法 格拉布斯按照数理统计理论计算出按危险率及子样容量求得的格拉布斯标准用表,若子样某个体的 函数超过标准表中的值,该数据即该剔除,否则就该保留。格拉布斯标准用表 见表2-3(书P31危险率为5%、2.5%、1%)。格拉布斯法判定异常数据的步骤:第65页/共192页第66页/共192页第67页/共192页第68页/共192页第69页/共192页2.
34、4 系统误差系统误差 除了偶然误差及疏忽误差以外,在试验测定中往往会碰到另一种情况,即由于一种未被发现的因素,使得测定值永远朝一个方向偏离,这样引起的误差,就称为系统误差。例如 1、电压表的零读数由于室温改变而改变,在测量前又未予调整,使得所有电压测定值多了一个零读数;2、用测压管来测量流动气流中的压力,由于系统接头处的漏气,使得正压测定值始终偏低,而负压测定值又偏高。3、由于仪表初读数始终处于波动状态,所以读数随高随低,这种误差虽说不是始终朝一个方向(也可理解为读数误差始终多了一个“零读数”),不过消除了它,也就消除了这种误差。第70页/共192页 系统误差属于准确度的范畴,与偶然误差属于精
35、密度的范畴性质上是不相同的。研究偶然误差我们采用的是统计的方法,即不去研究个别数据的特点,而是从总体出发,通过大量重复性的试验及随后的数学处理来获得数量上的结果。对系统误差则不同,由于它不是随机的,故只能采用具体问题具体分析的方法,通过仔细的校验及特定的试验才能发现与消除系统误差。第71页/共192页系统误差的分类:(一)按照系统误差产生的原因,可以将它分成两类。1、由于仪器、工具或试验装置不正确所引起的,例如仪表的零读数,温漂,测量区域的电磁场干扰等等。2、由于试验理论和试验方法不正确所引起,例如脉动气流中采用了用于稳态测量的大惯性的仪表,得到的不可能是真值,甚至也不是真正的时均值;要消除这
36、些误差首先要仔细推敲试验理论,反复研究试验方案及校准用的测量仪表,排除可能产生的错误以求得准确的数值。然而这往往是困难的,特别是当被测对象的物理过程还没有被十分清晰了解之前,更是难于达到。第72页/共192页本课程将通过另外一条途径,即研究系统误差的性质,通过对试验数据的分析处理,找到判断是否存在系统误差的方法,通过这些以后,可以采取措施抑或从数据上加以更正,或者找寻出系统误差产生的根源,从试验理论,试验方案上加以改变以求得正确的结果。第73页/共192页(二)按照系统误差的特点分类:1、不变的系统误差 如米尺标称尺寸不准;一般只有用不同尺的对比实验来发现,而多次重复实验不能发现这类误差。2、
37、变化的系统误差(1)线性变化的系统误差 如电位差计测量热电势时由于标准电池的持续放电而产生的误差。(2)复杂规律变化的系统误差 误差值按确定的复杂规律变化,这种误差常是由于几种误差因素同时起作用引起的。如仪表指针偏转角与偏转力矩不能严格保持线性关系而表盘仍采用均匀刻度。(3)周期性变化的系统误差 如仪表指针的回转中心与刻度盘中心存在偏心带来的误差。第74页/共192页0t不变的系统误差线性变化的系统误差复杂规律变化的的系统误差周期性变化的的系统误差系统误差常见的变化规律系统误差常见的变化规律第75页/共192页第76页/共192页第77页/共192页第78页/共192页2.4.2 系统误差的发
38、现系统误差的发现目前不可能全部消除系统误差的影响由于在测量过程中形成系统误差的因素很复杂,并且有些因素也很难查明,因而目前还不能查明所有的系统误差,所以,也不可能全部消除系统误差的影响。下面为几种常用的发现系统误差的方法。一、不变的系统误差一、不变的系统误差 对于不变的系统误差,通常不能用增加测量次数来发现,只有改变形成这种误差的条件,再通过实验对比才能发现。例如,米尺按标称尺寸使用时,在测量结果中就存在着由于米尺的尺寸偏差而产生的不变的系统误差,多次重复测量也不能发现这一误差,只有用另一根准确度更高的标准尺来测量,并进行对比时才能发现它,再通过修正来减少系统误差。第79页/共192页二、变化
39、的系统误差二、变化的系统误差 对于变化的系统误差,则可采用离差观察法或利用某些判断准则来发现(这些判断准则实质上是检验误差的分布是否偏离正态分布)。(1)离差观察法离差观察法离差观察法是将所测得的数据及其残差按测得的先后次序列在表中,观察各数据的残差值的大小和符号的变化情况,从而判断是否存在系统误差及其规律。此方法只适于系统误差比随机误差大的情况。第80页/共192页显著含有系统误差的测量数据,其任一测量值的残余误差为系统误差与测量列系统误差平均值之差第81页/共192页无法判断线性周期线性+周期第82页/共192页第83页/共192页第84页/共192页第85页/共192页第86页/共192
40、页第87页/共192页第88页/共192页第89页/共192页第90页/共192页二、更正值及其误差二、更正值及其误差 如果在试验中不能做到将系统误差消除,那么就只能通过更正值来达到测量的准确度了。更正值是从专门的试验中求得的,例如要引入环境温度对压力传感器测量的更正。应该事先测出各种温度下传感器二次仪表上的零读数。当引入更正值来消除系统误差时,必须注意的是务必使测定更正值本身所带来的误差对测量结果的影响要小到可以忽略不计的程度,否则,引入更正值就是没有意义的。如果要使引入更正值后的测量误差(偶然误差)不超过原来的数值应使更正值本身测定误差的均方根值小于测量误差的 倍。第91页/共192页粗大
41、误差的剔除粗大误差的剔除 拉伊特方法、格拉布斯方法 系统误差系统误差系统误差的发现系统误差的发现 1、不变的系统误差 实验对比 2、变化的系统误差1)离差观察法 2)马利科夫准则适用于发现线性系统误差 3)阿贝赫梅特准则适用于发现周期性系统误差 消除系统误差的方法消除系统误差的方法 对置补偿法(交换法):消除固定的系统误差 对称观测法:消除呈线性变化的累进系统误差 半周期偶数观察法:消除周期性的系统误差 更正值修正更正值修正第92页/共192页2.5 误差的各种表示方法误差的各种表示方法 测量结果表达为:在一定的置信水平下,以子样平均值为中心,以置信区间半长为区间的一个范围,这个置信区间就是测
42、量的误差。由于置信度的不同,误差可有各种不同的表示方法。第93页/共192页P40 2-352.5.1 绝对误差绝对误差第94页/共192页第95页/共192页第96页/共192页第97页/共192页第98页/共192页2.6 测量不确定度测量不确定度 在测量过程中各种原因造成测量误差。实践证明,测量误差是客观存在的,由于真值未知,因此也就不可能确切地得到测量误差,由此引出了用测量不确定度来说明和衡量测量结果的质量。不确定度是误差理论发展和完善的产物,是建立在概率论和统计学基础上的新概念,目的是为了澄清一些模糊的概念和便于使用。它表示由于测量误差的影响而对测量结果的不可信程度或有效性的怀疑程度
43、,或称为不能肯定的程度。是定量说明测量结果的质量的一个参数。测量值在某个区域内以一定的概率分布,表示被测量分散性的参数就是测量不确定度,它不说明测量结果是否接近真值。第99页/共192页多年来,世界各国对测量结果不确定度的估计方法和表达方式存在的不一致性,影响了计量和测量成果的相互交流。为此,1993年国际不确定度工作组制定了Guide to the Expression of Uncertainty in Measurement(测量不确定度表达导则),经国际计量局等国际组织批准执行,由国际标准化组织(ISO)公布。本教材将采用符合国际和国家标准的对误差理论和测量不确定度的表示方法。第100
44、页/共192页2.6.1 不确定度的术语不确定度的术语 不确定度是说明测量结果的参数,它用于表达被测量值可能的分散程度。这个参数用(1)标准偏差表示,也可以用(2)标准偏差的倍数或(3)置信区间的半宽度表示。根据计算及表示方法的不同,有以下几个专用术语:一、标准不确定度一、标准不确定度 测量结果的不确定度由多种原因引起,一般来源于随机性或模糊性。所有这些不确定度的来源都会影响测量结果,其综合效应使测量结果的可能值服从某种概率分布。用概率分布的标准偏差表示的不确定度就称为标准不确定度,用符号u表示。因为测量不确定度往往是由多种原因产生的,对每个不确定度来源评定的标准偏差,称为标准不确定度分量,用
45、ui表示。标准不确定度有两类评定方法:A类评定和B类评定。第101页/共192页(1)A类标准不确定度用统计方法得到的不确定度,称为A类标准不确定度。用符号uA表示。(2)B类标准不确定度用非统计方法得到的不确定度,即根据资料或假设的概率分布估计的标准偏差表示的不确定度,称为B类标准不确定度,用符号uB表示。A类标准不确定度和B类标准不确定度仅仅是评定方法不同。二、合成标准不确定度二、合成标准不确定度 由各不确定度分量合成的标准不确定度,称为合成标准不确定度。当间接测量时,即测量结果是由若干其他量求得的情况下,测量结果的标准不确定度等于各其他量的方差和协方差相应和的正平方根,用符号uc表示。合
46、成标准不确定度仍然是标准(偏)差,表示测量结果的分散性。合成的方法,常被称为“不确定度传播律”。第102页/共192页三、扩展不确定度三、扩展不确定度 扩展不确定度是由合成标准不确定度的倍数表示的测量不确定度。它用包含因子k乘以合成标准不确定度得到的一个区间半宽度来表示测量不确定度。包含因子是为获得扩展不确定度而与合成标准不确定度相乘的数字因子,它的取值决定了扩展不确定度的置信水平。扩展不确定度是测量结果附近的一个置信区间,被测量的值以较高的概率落在该区间内,用符号U表示。通常测量结果的不确定度都用扩展不确定度表示。当说明具有置信水平为P的扩展不确定度时,可以用Up表示,此时包含因子可用kp表
47、示。例如,U0.95表示测量结果落在以U为半宽度区间的概率为0.95U和uc单独定量表示时,数值前可不加正负号。测量不确定度也可以用相对形式表示。第103页/共192页2.6.2 误差与不确定度的区别误差与不确定度的区别误差是测量值和真值的差值。是客观存在的,但不能准确得到,它是属于理想条件下的一个定性的概念,反映测量误差大小的术语准确度也是一个定性的概念。测量不确定度反映的是对测量结果的不可信程度,是可以根据试验、资料、经验等信息定量评定的量。(误差是不以人的认识程度而改变的客观存在,而测量不确定度与人们对被测量和影响量及测量过程的认识有关)在测量不确定度中不包括已确定的修正值。已修正的测量
48、结果的测量不确定度中应考虑修正不完善引入的不确定度分量。例如,某力值的未修正结果是2KN,用高一级校准装置校准该力值,得到修正值为4.3N,校准装置引起的修正值的不确定度为0.02N,如果其他因素引起的不确定度均可忽略,则该力值的已修正测量结果为2004.3N,其不确定度为0.02N。第104页/共192页A类或类或B类标准不确定度与随机误差、系统误差之间不存在简类标准不确定度与随机误差、系统误差之间不存在简单的对应关系。单的对应关系。随机误差、系统误差是表示两种不同性质的误差,测量不确定度评定时一般不必区分其性质。A类和B类不确定度是表示两种不同的评定方法。在需要区分不确定度性质的情况下,可
49、用:“由随机影响引起的不确定度分量”和“由系统影响引起的不确定度分量”两种表述方法。这两种表述方法不表明不确定度分量用什么方法评定,即不确定度分量既可能用A类也可能用B类评定方法得到,性质与评定方法间没有对应关系。另外,测量数据中不应包括异常数据。对测量数据应进行异常数据判别,一旦发现有异常数据应剔除,不应包括在测量结果的范围内。因此在不确定度的评定前要剔除异常数据。第105页/共192页第106页/共192页二、标准不确定度的二、标准不确定度的B类评定方类评定方 当不能用统计方法计算不确定度时,就要用B类方法评定。B类方法评定的主要信息来源是以前测量的数据、生产厂的技术说明书、仪器的鉴定证书
50、或校准证书等。这类信息通常只给出极大值与极小值,而未提供测量值的分布及自由度的大小。B类标准不确定度就是根据现有信息评定近似的方差或标准偏差以及自由度,分析判断被测量的可能值不会超出的区间(-a,a),并假设被测量的值的概率分布,由要求的置信水平估计包含因子k,则测量不确定度uB为 uB=a/k 式中 a区间的半宽度;k包含因子,也称为置信因子,通常在23之间。k的选取与概率分布有关,例如,假设为正态分布时,查表24;假设为非正态分布时,根据概率分布查表2-5第107页/共192页表表2-4 正态分布时概率与置信因子正态分布时概率与置信因子k的关系的关系概率P%5068.27909595.45