误差理论与数据处理基础知识.doc

上传人:飞****2 文档编号:66778268 上传时间:2022-12-21 格式:DOC 页数:21 大小:768KB
返回 下载 相关 举报
误差理论与数据处理基础知识.doc_第1页
第1页 / 共21页
误差理论与数据处理基础知识.doc_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《误差理论与数据处理基础知识.doc》由会员分享,可在线阅读,更多相关《误差理论与数据处理基础知识.doc(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、误差理论与数据处理基础知识0-1 物理实验中的测量误差与不确定度误差和不确定度的概念物理实验离不开对各种物理量进行测量,由测量所得的一切数据,都毫无例外地包含有一定数量的测量误差,没有误差的测量结果是不存在的。测量误差存在于一切测量之中,贯穿于测量的全过程。随着科学技术水平的不断提高,测量误差可以被控制得越来越小,但却永远不会降低到零。测量误差测量值真值。何谓真值?真值是在特定条件下被测量量的客观实际值,当被测量的测量过程完全确定,且所有测量的不完善性完全排除时,则测量值就等于真值。这就是说,真值是通过完善的测量才能获得。然而,严格、完善的测量难以做到,故真值就不能确定。在实践中,有一些物理量

2、的真值或从相对意义上来说的真值是可以知道的,这有如下几种:(1)理论真值。如平面三角形三内角之和恒为180;某一物理量与本身之差恒为零,与本身之比值恒为1;理论公式表达值或理论设计值等。(2)计量单位制中的约定真值。国际单位制所定义的七个基本单位,根据国际计量大会的共同约定,凡是满足上述定义条件而复现出的有关量值都是真值。(3)标(基)器相对真值。凡高一级标准器的误差是低一级或变通测量仪器误差的时,则可认为前者是后者的相对真值。如经国家级鉴定合格的标准器称为国家标准器,它在同一计量单位中精确度最高,从而作为全国该计量单位的最高依据。国际铂铱合金千克原器的质量将作为国际千克质量的真值。在科学实验

3、中,真值就是指在无系统误差的情况下,观测次数无限多时所求得的平均值。但是,实际测量总是有限的,故用有限次测量所求得的平均值作为近似真值(或称最可信赖值)。1误差(error)误差即观测值与真值之间的差异。如前所述,测量误差就是测量值减去真值。(1)绝对误差(absolute error)。某物理量值与其真值之差称绝对误差,它是测量值偏离真值大小的反映,有时又称真误差。即 绝对误差量值-真值 修正值-绝对误差真值-量值 真值量值+修正值这说明量值加上修正值后,就可以消除误差的影响。在精密计量中,常常用加一个修正值的方法来保证量值的准确性。(2)相对误差(relative error)。绝对误差与

4、真值的比值所表示的误差大小称为相对误差或误差率。有时,两组测量的绝对误差相同,但真值不同,而此时实际反映了两种不同的准确度。所以采用相对误差就能够清楚地表示出测量的准确程度。按定义,当绝对误差很小时,此时相对误差还有一种表达形式,即分贝误差。同种物理量之比取对数,再乘以20,这称为分贝A(单位用dB表示)。设两个同种物理量之比为 (0-1-1)则按分贝的定义有 (0-1-2)如果比值a产生了一个误差,那末将引起A产生一个误差(此为分贝误差),则 (0-1-3)式(0-1-3)减去式(0-1-2),得 (0-1-4)该式即为相对误差与分贝误差之间的关系式。从数学上可知则式(0-1-4)可写成或

5、分贝误差主要用在声学及无线电计量之中,如计算声压级,按规定空气中的基准声压(大约相当于蚊子飞行发出声音的声压),如有一声的声压,则其声压级按式(0-1-4)计算为。相对误差还有一种简便实用的形式引用误差。它在多挡或连续刻度的仪表中得到广泛应用。为了减少误差计算中的麻烦和划分仪表正确度等级的方便,一律取仪表的量程或测量范围上限值作为误差计算的分母(即基准值),而分子一律取用仪表量程范围内可能出现的最大绝对误差值。于是,定义引用误差为在热工、电工仪表中,正确度等级一般都是用引用误差来表示的,通常分成0.1、0.2、0.5、1.0、1.5、2.5和5.0七级。上述数值表示该仪表最大引用误差的大小,但

6、不能认为仪表在各个刻度上的测量都具有如此大的误差。例如某仪表正确度等级为R级(即引用误差为R%),满量程的刻度值为X,实际使用时的测量值为(一般X),则 (0-1-5)通过上面的分析,可知为了减少仪表测量的误差,提高正确度,应该使仪表尽可能在靠近满量程刻度的区域内使用。这正是人们利用或选用仪表时,尽可能在满刻度量程的以上区域内使用的原因。(3)误差的分类根据误差产生的原因和性质将误差分为系统误差和随机误差两大类。系统误差在相同条件下,多次测量同一物理量时,测量值对真值的偏离(包括大小和方向)总是相同的,这类误差称为系统误差。系统误差的特点是恒定性,不能用增加测量次数的方法使它减小,在实验中发现

7、和消除系统误差是很重要的,因为它常常是影响实验结果准确程度的主要因素,能否用恰当的方法发现和消除系统误差,是测量者实验水平高低的反映,但是又没有一种普遍适用的方法去消除系统误差,主要是靠对具体问题作具体的分析与处理,要靠实验经验的积累。如果我们能够确定系统误差的数值,就应该把它从实验结果中扣除,消除它的影响,或者说,把系统误差的影响减小到偶然误差的范围以内,这种数值已知的系统误差称为“已定系统误差”。还有一类系统误差,只知道它存在于某个大致范围,而不知道它的具体数值,我们称之为“未定系统误差”。例如仪器的允差就属于这一类。关于系统误差的限制和消除将在后面介绍随机误差(偶然误差)由于偶然的不确定

8、因素造成每一次测量值的无规律的涨落,测量值对真值的偏离时大时小、时正时负,不能由上次测量值预计下一次测量值的大小,这类误差称为随机误差,也称偶然误差。造成偶然误差的因素是多方面的,如仪器性能和测量者感官分辩力的统计涨落,环境条件(如温度、湿度、气压、气流、微震)的微小波动,测量对象本身的不确定性(如气压、放射性物质单位时间内衰变的粒子数,小球直径或金属丝直径)等等。偶然误差的特点是它的随机性,如果在相同的宏观条件下,对某一物理量进行多次测量,当测量次数足够大时,便可以发现这些测量值呈现出一定的规律性统计规律性,即它们服从某种概率分布。下面我们对一个实际测量的结果进行统计分析(表0-1-1),就

9、可以发现随机误差的特点和规律。表0-1-1中观测总次数n150次,某测量值的算术平均值为3.01,共分14个分区间,每个区间的间隔为0.01。为直观起见,把表中的数据画成频率分布的直方图如(图0-1-1),从图中便可分析归纳出随机误差的以下四个特点。表0-1-1 测值分布值区间1234567测值xi2.952.962.972.982.993.003.01误差-0.06-0.05-0.04-0.03-0.02-0.010出现次数nI46611142024频率0.0270.040.040.0730.0930.1330.16区间891011121314测值xI3.023.033.043.053.06

10、3.073.08误差xi0.010.020.030.040.050.060.07出现次数ni17121210842频率0.1130.080.080.0660.0580.0270.018图0-1-1 频率分布直方图a)随机误差的有界性。在某确定的条件下,误差的绝对值不会超过一定的限度。表0-1-1中的xi均不大于0.07,可见绝对值很大的误差出现的概率近于零,即误差有一定限度。b)随机误差的单峰性。绝对值小的误差出现的概率比绝对值大的误差出现的概率大,最小误差出现的概率最大。表0-1-1中的次数为110次,其中的占61次,而的仅40次。可见随机误差的分布成单峰形c)随机误差的对称性。绝对值相等的

11、正负误差出现的概率相等。表0-1-1正误差出现的次数为65次,而负误差为61次,两者出现的频率分别为0.427和0.407,大致相等。d)随机误差的抵偿性。在多次、重复测量中,由于绝对值相等的正负误差出现的次数相等,所以全部误差的算术平均值随着测量次数的增加趋于零,即随机误差具有抵偿性。抵偿性是随机误差最本质的统计特性,凡是具有相互抵偿特性的误差,原则上都可以按随机误差来处理。虽然随机误差产生的原因尚不清楚,但由于它总体上遵守统计规律,因此理论上可以计算出它对测量结果的影响。(4)误差的表示方法算术平均误差在一组测量中,用全部测值的随机误差绝对值的算术平均值来表示。按定义 (0-1-6) 式中

12、:xi一组测量中的各个测量,i1,2,n(测量的次数);一组测值的算术平均值,第i个测值xi与平均值之偏差(即误差)的绝对值这种表示方法已经考虑到了观测次数n对随机误差的影响,但是各次观测中相互间符合的程度不能予以反映。因为一组测量中,偏差彼此接近的情况与另一组测量中偏差有大、中、小的情况,两者的算术平均误差很可能相等。标准误差(又称均方根误差)它是观测值与真值偏差的平方和观测次数n比值的平方根,按定义 (0-1-7)式中,A被测物理量的真值; 第i个测值xi与真值A之偏差。在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替,此时的标准误差按下式计算: (0-1-8)标准误

13、差对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。例1 有两组观测数据:第一组 2.9、3.1、3.0、2.9、3.1第二组 3.0、2.8、3.0、3.0、3.2求平均值、算术平均误差、标准误差,并分析其准确度及精密度。解 列表计算如下:第 一 组 测 量算术平均值3.0算术平均误差标准误差n-1第 二 组 测 量算术平均值3.0算术平均误差标准误差n-1从计算结果可知:两组数据的平均值一样,即测量的准确度一样;两组数据的测量精密度实际上不一样。因为第一组数据的重现性较好,但此时的算术平均误差是一样的,显然未能

14、反映出精密度来。标准误差n-1的计算结果说明第一组测量数据比第二组精密度高。标准误差不仅仅是一组观测值的函数,而且更重要的是它对一组测量中的大误差及小误差反映比较敏感。因此,在试验中广泛用标准误差来表示测量的精密度。极限误差通常定义极限误差的范围为标准误差的3倍,即3n-1。从统计的角度计算得,所测物理量的真值落在3n-1范围内的概率为99.7%,而超出此范围的可能性实际上已经非常小,故把它定义为极限误差。(5)几个重要概念精密度(简称精度precision)它表示测量结果中随机误差大小的程度,即在一定条件下,进行多次、重复测量时,所得测量结果彼此之间符合的程度,通常用随机不确定度来表示。正确

15、度(correctness)它表示测量结果中系统误差大小的程度。即在规定的条件下,测量中所有系统误差的综合。准确度(又称精确度accuracy)准确度是测量结果中系统误差与随机误差的综合,它表示测量结果与真值的一致程度。从误差的观点来看,准确度反映了测量的各类误差的综合。如果所有已定系统误差已经修正,那末准确度可用不确定度来表示。2不确定度(uncertainty)不确定度是由于测量误差的存在而对被测量值不能肯定的程度。表达方式有系统不确定度、随机不确定度、总不确定度。可按估值的不同方法把不确定度归并为A、B两类分量。前者是多次重复测量后,用统计方法计算出的标准误差;后者是用其他方法估计出的近

16、似的“标准误差”。系统不确定度实质上就是系统误差限,常用未定系统误差可能不超过的界限或半区间宽度e来表示。随机不确定度实质上就是随机误差对应于置信概率1-a时的置信区限k(a为显著性水平)。当置信因子k1时,标准误差就是随机不确定度,此时的置信概率(按正态分布)为68.27%。总不确定度是由系统不确定度与随机不确定度按合成方差的方法合成而得的。它反映了测量结果中未能确定的量值的范围。不确定度是测量结果的测度,没有不确定度说明,测量结果将无从比较。1993年,国际计量局(BIPM)等7个国际组织发表了测量不确定度表示指南。这一国际的权威性文献,对计量和科学实验工作极其重要。综上所述,不确定度与误

17、差有区别,误差是一个理想的概念,一般不能准确知道;但不确定度反映误差存在分布范围,即随机误差分量和未定系统误差分量综合的分布范围,可由误差理论求得。总之,不确定度是未定误差的特征描述,而不是指具体的误差大小和符号,故不确定度不能用来修正测量结果。图0-1-2 给出了精密度、正确度和准确度的示意图。图0-1-2 精密度(a)、正确度(b)、准确度(c)的示意图0-3 实验数据的分析与处理一、系统误差的分析与处理系统误差是一种固定的或服从一定规律变化的误差。对某物理量作多次重复测量时,系统误差不具有抵偿性,故通常不能用处理随机误差的方法来处理。前面讨论随机误差是以测量数据中不包含系统误差为前提的。

18、可是系统误差与随机误差往往是同时存在于测量数据中,有时系统误差对实验结果的影响比随机误差还要严重。如果不消除或不减少系统误差的影响,就会使得对随机误差的估计变得毫无意义。对于一个具体实验来说,要能找出造成系统误差的主要原因。然后,从实验中设法限制和消除这些因素的影响。下面我们就系统误差的主要来源如何判断系统误差的存在以及限制和消除系统误差进行讨论。1.系统误差的来源分析(1)装置误差仪器、仪表误差仪器、仪表误差是由于使用的仪器或量具在结构上不完善、或没有按照操作规程使用而引起的误差。例如电工仪表、电桥、电位差计等的误差。标准器误差标准器是提供标准量值的器具,如标准电池、标准电阻等,它们本身的标

19、称值含有的误差。安置误差安置误差是由于仪器或被测工件的安置不当所引的误差。例如,有些电工仪表按规定应水平放置,而在使用时,垂直放置仪表引起的误差。装备、附件误差装备、附件误差主要指的是电源的波形、三相电源的不对称度,各种测量附件如转换开关、触点、接线引起的误差以及测试设备和电路的安装、布置或调整不完善等产生的误差。(2)方法误差(理论误差)测量方法本身的理论根据不完善或采用了近似公式引起的误差称为方法误差。例如,电阻与温度的关系为RR20+(t-20)+(t-20)2式中:R温度t的电阻; R20温度20时的电阻;电阻的一次温度系数; 电阻的二次温度系数;在实验中不考虑温度因素的影响而引起的系

20、统误差R-(t-20)-(t-20)2,消除它的方法就是进行温度修正。(3)观测者误差观测者误差是由于观测者的生理或心理上的特点和固有习惯所造成的。例如,观测者对刻度尺进行估读时,习惯地偏向某一方向(始终偏大或偏小)记录信息或计时的滞后等所造成的误差。(4)环境误差环境误差是在测量时的环境影响量(如温度、湿度、气压、电磁场等)偏离规定值时而产生的误差。除上述系统误差的来源外,还有很多系统误差是很复杂的。例如,刻度盘刻度线不准确而引起的测量示数的误差,就是一种比较复杂的系统误差。因此,我们在设计和制造测量仪器以及设计选择测量方法时,都要预先考虑系统误差的来源,尽可能将系统误差减小到所允许的范围内

21、。2.系统误差存在的判断对比检验是判断系统误差存在的常用方法。这里所说的对比,可以是把要判断的实验结果跟标准值、理论值比较;或者是跟准确度较高的仪器设备的测量值相比较;还可以是跟采用不同的实验方法测得的结果相比较。由于随机误差不可避免,在系统误差与随机误差同时存在的情况下,应进行多次测量以减少随机误差的影响,才能有效地判断系统误差的存在。在多次测量中,分析测量数据随时间变化的规律(特别是偏差的变化),往往会有助于发现随时间线性变化或周期变化的系统误差。分布检验也是判断系统误差的一种重要方法。这是一种假设检验,先由理论分析和过去同类测量的经验,认为测量值应该遵从某种分布,然后用统计量作检验,判断

22、实验结果是否与假设分布相符,如果不符可怀疑测量中存在着系统误差。直接分析实验原理、方法以及实验条件的变化,也是判断系统误差的一种有效方法。如果实验方案本身就存在着不完备性。比如说计算公式是近似的,测量方法受到某种副效应或某种干扰的影响,则这个实验必然存在着系统误差。另外,有些实验所研究的物理现象存在着统计涨落,测量仪器产生零点漂移,控制的实验条件随时间而明显变化等,这些因素也就带来了系统误差。总之,对实验本身的分析研究,往往会使我们能直接找出系统误差并可估计其大小。3.系统误差的限制和消除方法(1)消除产生系统误差的根源。在测量之前,要求测量者对可能产系统误差的环节作仔细的分析,从产生根源上加

23、以消除。例如,若系统误差来自仪器不准确或使用不当,则应该把仪器校准并按规定的使用条件去使用;若理论公式只是近似的,则应在计算时加以修正;若测量方法上存在着某种因素会带来系统误差,则应估计其影响的大小或改变测量方法以消除其影响;若外界环境条件急剧变化,或存在着某种干扰,则应设法稳定实验条件,排除有关干扰;若测量人员操作不善,或者读数有不良偏向,则应该加强训练以改进操作技术,以及克服不良偏向等。总之,从产生系统误差的根源上加以消除,无疑是一种最根本的方法。(2)在测量中限制和消除系统误差。对于固定不变的系统误差的限制和消除,在测量过程中常常采用下列方法:抵消法。有些定值的系统误差无法从根源上消除,

24、也难以确定其大小而修正,但可以进行两次不同的测量,使两次读数时出现的系统误差大小相等而符号相反,然后取两次测量的平均值便可消除系统误差。例如螺旋测微计空行程(螺旋旋转但量杆不动)引起的固定系统误差,可以从两个方向对标线来消除。先顺时针方向旋转,对准标志读数,a为不含系统误差的读数,为空行程引起的误差。再逆时针方向旋转,对准标志读数。两次读数取平均,即得,可见空行程所引起的误差已经消除。代替法。在某装置上对未知量测量后,马上用一标准量代替未知量再进行测量,若仪器示值不变,便可肯定被测的未知量即等于标准量的值,从而消除了测量结果中的仪器误差。例如用天平秤物体质量m,若天平两臂和不等,先使m与砝码G

25、平衡,则有。再以标准砝码P取代质量为m的物体,若调节P与G达到平衡,则有。从而,消除了天平不等臂引起的系统误差。交换法。根据误差产生的原因,对某些条件进行交换,以消除固定的误差。例如用电桥测电阻,得。若两臂有误差,可将被测电阻互换再测得。从而可得,消除了带来的误差。下面再讨论一定规律变化的系统误差的消除方法。对称观测法。这是消除随时间线性变的系统误差的有效方法。随着时间的变化,被测量的量值作线性变化,如图0-3-1所示。若定某时刻为中点,则对称于点的系统误差的算术平均值彼此相等,即有。利用此规律,可把测量点对称安排,取每组对称点读数的算术平均值作为测量值,便可消除这类系统误差。 图0-3-1

26、线性变化的系统误差 图0-3-2 周期变化的系统误差有些按复杂规律变化的系统误差,若在短时间内可认为是线性变化的,也可近似地作为线性误差处理,从而也可用对称测量法减少误差。半周期偶次测量法。这是消除周期性系统误差的基本方法。周期性误差一般出现在有圆周运动的情况(如度盘等),以2为周期呈正弦变化。因此,在相距半周期(180)的位置上作一次测量,取两次读数的平均值,便可有效地消除周期性系统误差。这种误差一般表示为式中a为周期性系统误差的幅值。当位相时误差,当位相时误差。故相隔半周期两次观测误差的平均值,即周期性系统误差得到消除。实时反馈修正法。这是消除各种变值系统误差的自动控制方法。当查明某种误差

27、因素(例如位移、气压、温度、光强等)的变化时,由传感器将这些因素引起的误差反馈回控制系统,通过计算机根据其影响测量结果的函数关系进行处理,对测量结果作出自动补偿修正。这种方法在微机控制的自动测量技术中得到了广泛的应用。二、随机误差的统计分析数据处理的任务是要从测量结果找出随机变量的分布规律或它的数字特征量,从而得出结论。从理论上讲,只要测量的次数足够多,随机变量的规律性一定能呈现出来,但实际上进行的或允许的观测次数总是有限的,有时甚至是少量的,因此我们关心的是怎样有效地利用有限的数据,才能去掉那些由于测量次数不够多引起的随机干扰,尽可能作出精确可靠的结论。由于测量时不是对全部可能的取值进行研究

28、,只是得到一个容量有限的随机子样,因此,基于这个随机子样得出的结论一定包含一定的不确定性,概率就是这种不确定性的量度。这时必须用概率的语言来表述我们的结论。例如:对于某个正态变量测量结果表述为,通常意味在到范围内取值的概率为68.3%,表述这一结论所用的概率称为置信水平。由于子样平均值本身也是一个随机变量,故区间也应是随机的,则或该两式说明在区间内包含真值的可靠程度为68.3%,或者说子样均值有68.3%的可能性落在以真值a为中心、的区间范围内。通常,称为置信区间(或置信限),为置信区间的半长。68.3%为置信概率(或置信度),常表示为,称显著性水平。概括起来,可以对测量结果作以下结论:测量结

29、果子样平均值置信区间半长该结论说明,一切测量结果应该理解为在一定置信概率下,以子样平均值为中心,以置信区间半长为界限的量,这正是误差统计意义的所在。当随机变量规律的函数形式已知,未知的只是其中某些参数的数值时,数据处理的任务就是要估计这些参数的数值。在实验测量中,这些参数往往就是我们要求的物理量的数值,如正态变量的期望值常常就是所要测量的物理量的真值。假设是分布的参数,测量得到的子样为,当未知时,我们可寻找子样的一个合适的函数作为的估计量,并给出这种估计的误差大小,这种估计方法称为分布参数的点估计,子样的函数称为统计量。我们也可以寻找两个统计量和,而且有,使参数落在区间之间有足够大的(给定的)

30、概率,这种估计方法称为分布参数的区间估计。此外还可以根据经验或其他方面的知识给参数以某假设值,然后建立统计推断方法,利用子样提供的信息在一定的概率水平下对接受或拒绝这个假设作出决断,这一类的假设检验称为参数检验;当随机变量分布规律的函数形式未知时,我们也可以根据理论的预测或经验对它所遵从的分布规律作出假设,用统计推断的方法对是否接受这一假设作出决断,这一类的假设检验称为拟合性检验。当然还可以利用测量结果对其他假设进行检验。根据近代物理实验数据分析处理的需要,我们着重介绍参数估计(点估计)的最大似然法与分布规律的检验方法。三、分布参数的点估计分布参数点估计的方法是用统计量作出参数的估计量,而统计

31、量是随机子样的函数。随机子样可以看作是一个N维的随机变量,一次测量得到子样的N个随机数值,另一次测量得到另N个随机数值,因此它们的函数必然也是随机变量。统计量既然是随机变量,它必然遵从一定的分布规律,有它的期待值、方差及其他数字特征量。由于统计量是我们对母体分布参数和分布规律进行推断的基础,因此统计量本身的分布和数字特征量是我们必须加以研究的。根据母体的分布规律及统计量的函数形式,原则上可以导出统计量遵从的分布规律。一般说来,要确定统计量的精确分布是很复杂的,对于一些特殊情形,如母体是正态分布时,这个问题有较简单的解法。必须指出的是:统计量遵从的分布规律和母体的分布不一定相同。例如,当母体为正

32、态分布时,某些统计量却遵从分布、t分布或者其他分布规律。如果参数的估计量的期待值满足则称为的无偏估计量。有些估计量不满足式(0-3-1)但是当子样容量N时满足这种估计量称为渐近的无偏估计量。对于同一个参数,可以用不同方法设计不同形式的统计量作为的估计量,常用的方法之一是最大似然法。1.参数估计的最大似然法子样可看作N维的随机变量,它们的联合概率密度称为子样的似然函数。由于是随机变量x的随机子样,因此其中各个随机变量x的概率密度函数(对于离散型变量,则是概率函数)的形式和x的概率密度函数相同,只需把x换为xi。由于各xi是互相独立的,根据式(0-3-6)似然函数等于各个观测值xi ,概率密度的乘

33、积,即似然函数为对于已知的,L的大小说明哪些子样有较大的可能性;当未知而已知时,采用的不同估算计值L将有不同的数值,L的大小说明哪一些值有较大的可能性,亦即实测子样对的估计提供了一定的信息。选择使实测数值有较大概率密度的参数值作为的估计值是一种很自然的估计办法,这就是最大似然法。如果估计值使似然函数最大,即则称为参数的最大似然估计。求最大似然估计量的具体办法是解似然方程 (0-3-2)数理统计的理论证明,用最大似然法求出估算计量具有一系列的优良性质,但最大似然估计量通常是渐近的无偏估计量。小子样的最大似然估计量不一定是无偏估计量,然而可以通过适当的调整使其成为无偏估计量。2.检验若N个不等精度

34、的观测值分别服从正态分布,这时量定义为 (0-3-3)式中的为的加权平均值。如果某些观测值存在系统误差使得它们的期待值偏离被测的真值,或者某些观测值对误差的估计过小都会使量的数值远小于N-1。因此,当量的数值远远大于N-1时,表明这组观测值之间存在着不协调。由于的概率小于1/400,若,通常不能认为有系统误差存在;若则表明有系统误差存在或者在某些测量中误差的估计过小;当介于1与2之间则不能确定是否有系统误差的存在。当检验表明有系统误差存在时,应对各个观测结果进行审核,把可疑值剔去,重新计算并再作检验。检验可以帮助我们发现是否有明显的系统误差,但并不能通过检验把系统误差都找出来,例如当的数值介于

35、1与2之间时,量偏大有可能是由于存在系统误差,也可能是统计涨落的结果。3应用举例 表0-3-2列出H2电离电势的一组不等精度的测量值,现在进行综合分析如下:表0-3-2 H2电离电势的测量值i12345616.517.115.615.415.615.370.6745Si0.50.20.10.10.10.03用Si作为的估计值分别代入式(3-15)和(3-18)求出加权平均值和量分别为同样用Si作为的估计值,由式(3-17)和(3-19)求出平均值方差的两种估计值分别为0.00153和0.01098,二者相差太大,疑有系统误差存在,这时作检验得到数值显然太大,因此肯定有系统误差存在。现在去掉17

36、.10.2这一组数据再处理一次,得到再用两种方法计算平均值方差的估计量,分别为:0.00155和0.00243二者已无重大差别,这时作检验得,可以认为剩下的五组数据已不存在明显的不协调,最后结果可表示为。0-4 最小二乘拟合在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量x与y之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x与y之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设x与y之间的关系是一个待定的多项式,多项式系数就是待

37、定的未知参数,从而可采用类似于前一种情况的处理方法。一、最小二乘法原理在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作x,而把所有的误差只认为是y的误差。设x和y的函数关系由理论公式yf(x;c1,c2,cm) (0-4-1)给出,其中c1,c2,cm是m个要通过实验确定的参数。对于每组观测数据(xi,yi)i1,2,N。都对应于xy平面上一个点。若不存在测量误差,则这些数据点都准确落在理论曲线上。只要选取m组测量值代入式(0-4-1),便得到方程组 yif(x;c1,c2,cm) (0-4-2) 式中i1,2,m.求m个方程的联立

38、解即得m个参数的数值。显然Nm的情况下,式(0-4-2)成为矛盾方程组,不能直接用解方程的方法求得m个参数值,只能用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正,则y的观测值yi围绕着期望值 摆动,其分布为正态分布,则yi的概率密度为,式中是分布的标准误差。为简便起见,下面用C代表(c1,c2,cm)。考虑各次测量是相互独立的,故观测值(y1,y2,cN)的似然函数.取似然函数L最大来估计参数C,应使 (0-4-3)对于y的分布不限于正态分布来说,式(0-4-3)称为最小二乘法准则。若为正态分布的情况,则最大似然法与最小二乘法是一致的。因权重因子,故式(0-4-3)表明,用最

39、小二乘法来估计参数,要求各测量值yi的偏差的加权平方和为最小。根据式(0-4-3)的要求,应有从而得到方程组 (0-4-4)解方程组(0-4-4),即得m个参数的估计值,从而得到拟合的曲线方程。然而,对拟合的结果还应给予合理的评价。若yi服从正态分布,可引入拟合的x2量, (0-4-5)把参数估计代入上式并比较式(0-4-3),便得到最小的x2值 (0-4-6)可以证明,服从自由度vN-m的x2分布,由此可对拟合结果作x2检验。由x2分布得知,随机变量的期望值为N-m。如果由式(0-4-6)计算出接近N-m(例如),则认为拟合结果是可接受的;如果,则认为拟合结果与观测值有显著的矛盾。二、直线的

40、最小二乘拟合曲线拟合中最基本和最常用的是直线拟合。设x和y之间的函数关系由直线方程ya0+a1x (0-4-7)给出。式中有两个待定参数,a0代表截距,a1代表斜率。对于等精度测量所得到的N组数据(xi,yi),i1,2,N,xi值被认为是准确的,所有的误差只联系着yi。下面利用最小二乘法把观测数据拟合为直线。1直线参数的估计前面指出,用最小二乘法估计参数时,要求观测值yi的偏差的加权平方和为最小。对于等精度观测值的直线拟合来说,由式(0-4-3)可使 (0-4-8)最小即对参数a(代表a0,a1)最佳估计,要求观测值yi的偏差的平方和为最小。根据式(0-4-8)的要求,应有整理后得到正规方程

41、组 (0-4-9)解正规方程组便可求得直线参数a0和a1的最佳估计值和。即 (0-4-10) (0-4-11)2拟合结果的偏差由于直线参数的估计值和是根据有误差的观测数据点计算出来的,它们不可避免地存在着偏差。同时,各个观测数据点不是都准确地落地拟合线上面的,观测值yi与对应于拟合直线上的这之间也就有偏差。首先讨论测量值yi的标准差S。考虑式(0-4-6),因等精度测量值yi所有的都相同,可用yi的标准偏差S来估计,故该式在等精度测量值的直线拟合中应表示为 (0-4-12)已知测量值服从正态分布时,服从自由度vN-2的x2分布,其期望值由此可得yi的标准偏差 (0-4-13)这个表示式不难理解

42、,它与贝塞尔公式是一致的,只不过这里计算S时受到两参数和估计式的约束,故自由度变为N-2罢了。式(0-4-13)所表示的S值又称为拟合直线的标准偏差,它是检验拟合结果是否有效的重要标志。如果xy平面上作两条与拟合直线平行的直线如图0-4-1所示,则全部观测数据点(xi,yi)的分布,约有68.3%的点落在这两条直线之间的范围内。图0-4-1 拟合直线两侧数据点的分布下面讨论拟合参数偏差,由式(0-4-10)和(0-4-11)可见,直线拟合的两个参数估计值和是yi的函数。因为假定xI是精确的,所有测量误差只有yi有关,故两个估计参数的标准偏差可利用不确定度传递公式求得,即把式(0-4-10)与(

43、0-4-11)分别代入上两式,便可计算得 (0-4-14) (0-4-15)例 光电效应实验中照射光的频率与遏止电压V的关系为,式中为脱出功,e和h分别是为电子电荷与普朗克常量。现有实验观测数据(i,Vi)如表0-4-1中所示,试用最小二乘法作直线拟合,并求h的最佳估计值。由于频率的测量精度比遏止电压V的精度高得多,故的误差可忽略不计。对照前面讨论的直线方程ya0+a1x,则相当于x,V相当于y,。把表0-4-1内的数据入参数估计式(0-4-10)和(0-4-11),即得。为了求出拟合精度,先计算偏差以及。表0-4-1 某光电效应实验的测量数据序号VI(V)17.021-1.43549.292

44、.059-10.0826.056-0.97536.680.951-5.90535.678-0.77332.240.598-4.38945.334-0.70028.450.490-3.73454.931-0.55524.310.308-2.73765.087-0.63025.880.397-3.20574.738-0.43822.450.192-2.07538.845-5.506219.304.995-32.125代入式(0-4-13),可得Vi的标准偏差经检验所有观测值Vi不存在粗大误差,从而拟合的直线方程为V1.54-4.191015。该直线参量的标准偏差可由式(0-4-14)和(0-4-15)得由于,则。若取,便可求得,其标准差。故本实验测定的普朗克常量最佳估计值可表示为h(6.710.39)10-34Js三、相关系数及其显著性检验当我们把观测数据点(xi,yi)作直线拟合时,还不大了解x与y之间线性关系的密切程度。为此要用相关系数(x,y)来判断

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁