《实验数据处理方法 DataAnalysis-ch11.ppt》由会员分享,可在线阅读,更多相关《实验数据处理方法 DataAnalysis-ch11.ppt(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、实验数据处理方法实验数据处理方法第三部分:统计学方法第三部分:统计学方法第十一章第十一章 参数估计参数估计(Parameter estimation)Parameter estimation)第十一章第十一章 参数估计参数估计(Parameter estimation)什么是参数估计:什么是参数估计:假定我们对某一物理系统进行了测量,得到了容量为假定我们对某一物理系统进行了测量,得到了容量为n的事例样本;的事例样本;我们想从这一有限样本中获取有关该物理系统的信息;我们想从这一有限样本中获取有关该物理系统的信息;描述该物理系统的概率分布数学形式是已知的,但其中包含了某些未描述该物理系统的概率分布
2、数学形式是已知的,但其中包含了某些未知的参数;知的参数;参数估计的任务是通过对观测到的事例样本的统计分析来最大限度地参数估计的任务是通过对观测到的事例样本的统计分析来最大限度地获取有关这些未知参数的信息。获取有关这些未知参数的信息。例:共振峰参数的估计:例:共振峰参数的估计:概率密度函数:概率密度函数:Breit-Wigner公式公式未知参数:未知参数:m0=共振峰的质量共振峰的质量=共振峰的宽度共振峰的宽度观测量:观测量:m=共振峰衰变产物的不变质量共振峰衰变产物的不变质量第十一章第十一章 参数估计参数估计(Parameter estimation)参数估计的内容:参数估计的内容:1、点估计
3、、点估计(Point Estination):估计未知参数的值估计未知参数的值2、区间估计、区间估计(Interval Estimation):估计未知参数的估计值估计未知参数的估计值的精确性和可靠性的精确性和可靠性本章介绍统计学中的参数估计的一些基本概念和方法本章介绍统计学中的参数估计的一些基本概念和方法第十一章第十一章 参数估计参数估计(Parameter estimation)Parameter estimation)11.1 参数估计的基本概念参数估计的基本概念11.1 参数估计的基本概念参数估计的基本概念总体的概率密度函数总体的概率密度函数(pdf):f(x|):未知参数未知参数x:
4、实验可测量量实验可测量量随机样本随机样本(容量为容量为n):xi:独立的随机变量独立的随机变量11.1 参数估计的基本概念参数估计的基本概念一、基本定义一、基本定义1、似然函数、似然函数(Likelihood Function,LF):由于由于xi是相互独立的随机变量,因而在给定的是相互独立的随机变量,因而在给定的 值下获得测量量值下获得测量量x1,x2,xn的联合条件概率为的联合条件概率为(Joint Conditional Probability)(1)似然值似然值(Likelihood):如果如果 和和xi都都为固定值,则称为固定值,则称L 为在特定的为在特定的 值下,观测值下,观测量量
5、x1,x2,xn的的似然值;似然值;(2)似然函数似然函数(LF):如果将如果将L看成是看成是 的函数,而的函数,而xi固定,则称固定,则称L为似然函数;为似然函数;(3)可测量量可测量量xi得得pdf:固定,固定,L是是xi的的函数函数11.1 参数估计的基本概念参数估计的基本概念2、统计量、统计量(Statistic):如果如果t=t(x1,x2,xn)是样本变量是样本变量xi的函数,且不依赖于任何的的函数,且不依赖于任何的未知参数未知参数,则称,则称t为统计量为统计量例:样本的平均值和方差:例:样本的平均值和方差:3、估计式、估计式(Estimator):如果统计量如果统计量t给出了未知
6、参数给出了未知参数 的估计值,则称的估计值,则称t为为 的估计式,的估计式,即即例:样本平均值例:样本平均值 和方差和方差s2分别是总体平均值分别是总体平均值 和方差和方差 2的估的估计式。计式。参数估计的目标之一就是求出未知参数的估计式参数估计的目标之一就是求出未知参数的估计式二、估计式的特性二、估计式的特性 由估计式由估计式t得到的参数得到的参数 的估计值的估计值 是随机变量,将满足某种分是随机变量,将满足某种分布,这种分布的特性将反映该估计式的好坏布,这种分布的特性将反映该估计式的好坏判断估计式好坏的标准:判断估计式好坏的标准:(1)一致性一致性(Consistency):样本容量为无限
7、大时估计式的特性样本容量为无限大时估计式的特性(2)无偏性无偏性(Unbiassedness):样本容量为有限时估计式的特性样本容量为有限时估计式的特性(3)最小方差最小方差(Minimum variance)有效性有效性(Efficiency)估计式的分布特性估计式的分布特性(4)充分性充分性(Sufficiency):估计式是否包含了样本中所包含估计式是否包含了样本中所包含的有关的有关 的所有信息的所有信息11.1 参数估计的基本概念参数估计的基本概念1、一致性、一致性(Consistency):如果一个估计式的值当样本容量增加时收敛到待估参数的真值,如果一个估计式的值当样本容量增加时收敛
8、到待估参数的真值,则称该估计式具有一致性则称该估计式具有一致性概率语言的一致性描述:概率语言的一致性描述:如果估计值如果估计值 n是从容量为是从容量为n的样本得到的,则对于给定的正的样本得到的,则对于给定的正数数 和和,存在着正整数,存在着正整数N,使得对所有的使得对所有的nN,|n-|的的概率小于概率小于 P(|n-|)即,当即,当n 时,时,n 例例:样本平均值样本平均值 是总体平均值是总体平均值 的一致性估计式的一致性估计式根据大数定理:当根据大数定理:当n 时,时,11.1 参数估计的基本概念参数估计的基本概念2、无偏性、无偏性(Unbiassedness):对于任意大的样本,如果估计
9、式对于任意大的样本,如果估计式t的期望值都等于参数的真值的期望值都等于参数的真值 则称则称t是是 的无偏估计式的无偏估计式无偏性保证了估计式的值不会系统地偏离参数无偏性保证了估计式的值不会系统地偏离参数 的真值;的真值;一致性和无偏性是不相关的,具有一致性并不等于具有一致性和无偏性是不相关的,具有一致性并不等于具有无偏性无偏性一致性和无偏性是对参数估计式的基本要求,因为参数一致性和无偏性是对参数估计式的基本要求,因为参数估计的目的就是求估计的目的就是求 的真值的真值。注:注:11.1 参数估计的基本概念参数估计的基本概念3、最小方差和有效性、最小方差和有效性估计值估计值 是随机变量,服从一定的
10、分布,好的估计式给出的估是随机变量,服从一定的分布,好的估计式给出的估计值的方差应尽可能地小。计值的方差应尽可能地小。假定:假定:(1)对所有的对所有的,L(x|)对对 的一、二阶导数存在;的一、二阶导数存在;(2)变量变量x的定义域与的定义域与 无关;无关;则由则由估计式得到的估计值的方差存在着一个下限估计式得到的估计值的方差存在着一个下限设设t是是()的估计式,的估计式,()为为 的函数,估计值的偏差为的函数,估计值的偏差为b()估计式估计式t的方差的方差V(t)满足下列满足下列Cramer-Rao不等式:不等式:最小方差限最小方差限(Minimum Variance Bound,MVB)
11、11.1 参数估计的基本概念参数估计的基本概念有效估计式:方差等于最小方差限的估计式有效估计式:方差等于最小方差限的估计式t为有效估计式的充分必要条件:为有效估计式的充分必要条件:在在实际应用中,有效估计式只是在有限的几类参数估计问实际应用中,有效估计式只是在有限的几类参数估计问题中存在。题中存在。例如:泊松分布样本的样本平均值是泊松总体平均值的有例如:泊松分布样本的样本平均值是泊松总体平均值的有效估计式效估计式4、充分性、充分性(Sufficiency)设设t是参数是参数 的估计式,如果测量量中所包含的有关的估计式,如果测量量中所包含的有关 的信息都包的信息都包含在含在t内,则称内,则称t为
12、为 的充分估计式的充分估计式11.1 参数估计的基本概念参数估计的基本概念充分估计式的存在有利于数据的浓缩充分估计式的存在有利于数据的浓缩(Data Reduction):t中所包含的有关中所包含的有关 的信息与原始数据中的一样多;或者:任的信息与原始数据中的一样多;或者:任何其它的原始数据的函数都给不出更多的有关参数何其它的原始数据的函数都给不出更多的有关参数 的信息的信息R.A.Fisher的信息的定义:的信息的定义:由由观测量观测量x给出的有关未知参数给出的有关未知参数 的信息量的定义:的信息量的定义:如果如果 是是k维的维的根据此定义,若根据此定义,若t为为 的充分估计式,则的充分估计
13、式,则It()=Ix()11.1 参数估计的基本概念参数估计的基本概念t 是参数是参数 的充分估计式的充分必要条件:似然函数的充分估计式的充分必要条件:似然函数L(x|)可分可分解为如下的形式:解为如下的形式:其中:其中:i)H(x)与参数与参数 无关;无关;ii)G(t|)是估计式是估计式t的函数,表示在的函数,表示在 一定的条件下一定的条件下t得得pdf可证:有效估计式总是具有充分性可证:有效估计式总是具有充分性注:充分统计量只对某些特殊类型的注:充分统计量只对某些特殊类型的pdf存在;如果存在;如果f(x,)为为指数形式:指数形式:则则充分统计量充分统计量t一定存在,且一定存在,且11.
14、1 参数估计的基本概念参数估计的基本概念例:在例:在 2已知的情况下,样本平均值已知的情况下,样本平均值 是正态分布是正态分布N(,2)中中 的的充分估计式充分估计式第十一章第十一章 参数估计参数估计(Parameter estimation)Parameter estimation)11.2 参数的区间估计参数的区间估计区间估计的目的:区间估计的目的:找出未知参数找出未知参数 的一个变化范围的一个变化范围使得使得 的真值落入该范围的概率为的真值落入该范围的概率为 一、区间估计的基本概念一、区间估计的基本概念1、置信区间、置信区间(Confidence Interval)若参数若参数 的真值落
15、入闭区间的真值落入闭区间 a,b内的概率为内的概率为,则称该区间,则称该区间为参数为参数 的的100%置信区间置信区间:置信系数(置信水平):置信系数(置信水平)a,b:置信限置信限(Confidence Limits)在实验上,置信区间对应于在实验上,置信区间对应于 的估计值的误差的估计值的误差11.2 参数的区间估计参数的区间估计特性:特性:1)是随机的:由两个容量相同的样本得到的置信区间一般是随机的:由两个容量相同的样本得到的置信区间一般是不同的是不同的2)置信区间可能包含置信区间可能包含 的真值,也可能不包含;对于一个特的真值,也可能不包含;对于一个特定样本定样本 反映了不等式反映了不
16、等式 的可靠性的可靠性3)两难性两难性(Dilemma):b-a大,大,大,但参数大,但参数 的不确定性大;的不确定性大;b-a小,小,小,但对参数小,但对参数 的确定具有较高的精度;的确定具有较高的精度;实验上一般取实验上一般取=68.3%或或95.5%,分别对应一个和二个标,分别对应一个和二个标准偏差的置信区间;准偏差的置信区间;11.2 参数的区间估计参数的区间估计2、区间估计的基本方法、区间估计的基本方法区间估计就是:给定置信系数区间估计就是:给定置信系数,根据参数,根据参数 的分布,求出置信的分布,求出置信区间区间设设统计量统计量t是参数是参数 的估计式,的估计式,t的的pdf为为f
17、(t)a,b即为欲求的置信区间即为欲求的置信区间1)如果如果f(t)与与 无关,则可通过求解上述积分方程求出无关,则可通过求解上述积分方程求出 a和和 b2)如果如果f(t)与与 有关,则上式中的积分将无法计算有关,则上式中的积分将无法计算z=z(t,)pdf f(z)与与 无关无关11.2 参数的区间估计参数的区间估计二、正态分布的区间估计二、正态分布的区间估计设设x1,x2,xn是正态分布是正态分布N(,2)的样本的样本样本平均值:样本平均值:样本方差:样本方差:的估计式,服从的估计式,服从N(,2/n)2的的估计式,变量估计式,变量 服从服从 2(n-1)分布分布1、的的置信区间:置信区
18、间:1)2已知的情况已知的情况统计量统计量 的的pdf N(,2/n)与与 有关有关N(0,1),与与 无关无关y a,b的概率的概率取取a=-b,a的值,的值,得得 的的置信水平为置信水平为 的置信区间:的置信区间:11.2 参数的区间估计参数的区间估计例:例:=0.954,a=22)2未知的情况未知的情况服从服从N(0,1)服从服从 2(n-1)两个量是相互独立的,由这两个量可构造出变量两个量是相互独立的,由这两个量可构造出变量tt满足自由度为满足自由度为(n-1)的的t-分布:分布:f(t;n-1)由于由于f(t;n-1)相对于相对于t=0是对称的,可将是对称的,可将a,b取为对称区间取为对称区间-1,b由上式求出由上式求出b,得得 的置信区间的置信区间置信水平置信水平 11.2 参数的区间估计参数的区间估计2、2的置信区间的置信区间1)已知的情况已知的情况 2可用统计量可用统计量 估计估计变量变量 服从服从 2(n)分布分布 2的置信区间的置信区间置信水平置信水平 2)未知的情况未知的情况在此情况下,可将上面的在此情况下,可将上面的 用用 代替代替由于分布是非对称的,上述积分方程有无数个解,通常取由于分布是非对称的,上述积分方程有无数个解,通常取11.2 参数的区间估计参数的区间估计