《毕业设计(论文)-卡尔曼滤波对测量数据处理的程序实现方法(43页).doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-卡尔曼滤波对测量数据处理的程序实现方法(43页).doc(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-毕业设计(论文)-卡尔曼滤波对测量数据处理的程序实现方法-第 41 页第1章 绪 论1.1 研究的目的 自从1960年卡尔曼滤波提出以来,它已成为控制,信号处理与通信等领域最基本最重要的计算方法和工具之一,并已成功的应用到航空,航天,工业过程及社会经济等不同领域,比如,在雷达中,人们感兴趣的是跟踪目标,但目标的位置、速度、加速度的测量值往往在任何时候都有噪声。卡尔曼滤波利用目标的动态信息,设法去掉噪声的影响,得到一个关于目标位置的好的估计。这个估计可以是对当前目标位置的估计(滤波),也可以是对于将来位置估计(预测),也可以是对过去位置的估计(差值或平滑)。但随着微型计算机的普及应用,对卡尔曼
2、滤波的数值稳定性、计算效率、实用性和有效性的要求越来越高,随着微型计算机时代的来临显著地提高了科学计算的能力,滤波大量复杂的计算在计算机种只需要几分钟就能算出,为此本文将对卡尔曼滤波进行研究。1.2 研究的意义卡尔曼滤波 ( Kalman , 1960) 是当前应用最广的一种动态数据处理方法 , 它具有最小无偏方差性. 把变形体视为一个动态系统 , 将一组观测值作为系统的输出 , 可以用卡尔曼滤波模型来描述系统的状态. 动态系统由状态方程和观测方程描述 , 以监测点的位置、速率和加速率参数为状态向量 ,可构造一个典型的运动模型. 状态方程中要加进系统的动态噪声. 其滤波方程是一组递推计算公式
3、,计算过程是一个不断预测、修正的过程 , 在求解时 , 优点是不需保留用过的观测值序列 , 并且当得到新的观测数据时 , 可随时计算新的滤波值 , 便于实时处理观测成果 , 把参数估计和预报有机地结合起来. 卡尔曼滤波特别适合变形监测数据的动态处理.1.3 研究的方法1.4 课题的主要内容 本文先从现代测量误差处理理论基础开始讲解,细致的写出现代测量误差都有那些函数,并详细分析讲解这些函数,在继续讲解最小二乘与卡尔曼滤波的关系,如量测值越多,只要处理得合适,最小二乘估计的均方误差就越小。采用批处理实现的最小二乘算法,需存储所有的量测值。若量测值数量十分庞大,则计算机必须具备巨大的存储容量,这显
4、然是不经济的。递推最小二乘估计从每次获得的最小量测值中提取出被估计量信息,用于修正上一步所得的估计。获得量测的次数越多,修正的次数也越多,估计的精读也越高。这和卡尔曼滤波原理非常相似,本文在详细讲解了卡尔曼滤波,写出其原理性质,在根据C+进行编程,使其应用于测量领域。第2章 现代测量误差处理理论基础2.1概 述 在测量、通信和控制等学科中,为了求得某些未知参数,常常要进行一系列的观测由于测量上的局限性,往往只能观测未知量的某些函数,且观测值中必然含有误差(或称为噪声)这就产生了根据含有误差的观测值求定未知参数估值的问题下面举几个例子 (1)为了确定平面或三维控制网中各点的坐标,对控制网的边长和
5、方向(或坐标差)进行了观测,当然,观测值包含有误差设各点的坐标为未知参数向量x,而包括边长和方向的观测值向量为L,则L和x之间有函数关系式中表示误差向量通过含有误差的观测向量L来求定待定点坐标的最佳估值,就是一个估计问题在测量中,就是一个平差问题 (2)通信理论中的一个重要问题是从接收到的信号中,提取被发送的信号设被发送的信息调制成信号S(t),而接收到的信号也就是信号的观测值L(t),由于大气噪声和电路噪声的干扰,因此有其中n(t)是噪声,t表示时间通信中的主要问题就是从L(t)中将有用的信号S(t)分离出来,也就是由L(t)求定S(t)的最佳估值信号S(t)也是一种未知参数 (3)生产过程
6、的自动化可以达到高效率和高精度 在实现生产过程的控制中,需要通过对生产系统进行状态的不断测量,得到与系统运行状态有关的观测值;然后对观测值进行分析处理得到控制信号,实时地控制生产系统按要求运行但由于观测值中存在误差,所以,为了得到控制信号,就要求由观测值来估计系统的运行状态 (4)卫星(或其他运动体)的轨道往往可以由如下微分方程确定式中f表示时间;x(t)表示卫星的轨道参数,在此处称为状态向量;U(t)为控制向量;力(t)是随机的状态噪声为了精确估计或预测卫星的轨道,就需要对卫星进行观测,从而得到大量的观测数据L(t),然后实时地由含有误差的观测值L(t)来估计卫星的轨道,即估计卫星的轨道参数
7、 以上例中所述的信号或状态都可以说是一种未知参数在测量平差中,通常称非随机的未知参数向量为参数,而称随机参数向量为信号,而称随时间t变化的动态系统中的未知参数向量为状态向量,或筒称为状态可以看到,在上面的例子中,都存在一个对未知参数进行估计的问题 一般说来,若设x为t阶未知参数向量(简称为参数),L为n阶观测向量(或称观测值),表示n维误差(或噪声)向量那么,所谓估计问题,就是根据含有误差的观测值L,构造一个函数,使成为未知参数向量X的最佳估计量,其具体数值称为最佳估值(以后一般不区分其含义)通常将简记为,并记称;为的估计误差 可以看到,当;的数学期望等于零时,;的方差就等于;而当X为非随机量
8、时,未知参数的估值工的方差;也就等于其误差方差在估计理论中,通常是用估计量的误差方差来衡量其精度的但在经典的最小二乘平差中,由于X一般都是非随机参数,所以习惯上都用估值(平差值)的方差衡量精度 在根据观测值L求未知参数x的估值时,总是希望所得到的估值是最优的由估计理论知道,最优估计量主要应具有以下几个性质: (1)一致性由观测值得到的估值通常与其真值是不同的,我们希望当观测值个数n增加时,估计量变得更好些;当n无限增大时,估计量向被估计的参数趋近的概率等于1即如果对于任意,有 (1-1-1)则称估计量具有一致性;若有 (1-1-2)则称此估计量是均方一致的估计量的一致性是从它的极限性质来看的
9、(2)无偏性若估计量的数学期望等于被估计量x的数学期望,即 (1-1-3)如果丑是非随机量,上式即为 (1-1-4)则称丘为无偏估计量如果,则称为渐近无偏 (3)有效性若由观测向量L得到无偏估计量的误差方差,小于由L得到的任何其他无偏估计量的误差方差,即或写为 (1-1-5)则称是有效估计量,也称具有有效性或方差最小性 以不同的准则来求定未知参数的最佳估值,可得到不同的估计方法估计方法主要有极大似然估计,最小二乘估计,极大验后估计,最小方差估计和线性最小方差估计等;经典的测量平差法都是以最小二乘估计或极大似然估计为根据导出的;而滤波、配置和动态系统的卡尔曼滤波等,最初是以极大验后估计或最小方差
10、估计为根据导出的因此,概率统计中的估计理论是广义测量平差的理论基础2.2多维正态分布 正态分布是测量平差理论中最常用的误差分布,是最小二乘平差误差理论的基础本节在已学过的一元正态分布的基础上,对多维正态分布做全面阐述广义测量平差理论中还涉及其他分布,则将分别在相应章节中一一介绍2.2.1多维正态分布的定义和性质 已知随机变量X的正态分布概率密度为 (1-2-1)式中两个参数和分别为随机变量X的数学期望和方差当=0,=1时,X为标准正态分布变量记为,其概率密度为 (1-2-2) 设有m个互相独立的标准正态随机变量构成的随机向量它们的有限个线性函数为n维正态随机向量此时,X的数学期望和方差阵为X的
11、分布函数和概率密度都简称为n维(或n元)正态分布,简记为,或写为 由互相独立的标准正态随机变量组成的随机向量Z,可写为阶单位阵 多维正态分布具有以下性质:(1)正态随机向量的线性函数还是正态的.例如,设则(2)设,记则 2.2.2多维正态分布 设有n维正态随机向量XN。(p。,Dx),其中方差阵D,为可逆阵,即det(Dx)0,则它的概率密度为式中表示的行列式 对于二维正态随机向量,若它有可逆方差阵和数学期望为则由(1-2-3)式可得其概率密度为因相关系数,所以上式可写为(1-2-4)这就是二维正态随机向量概率密度 当时,即当X和Y是互不相关的两个正态随机变量时,则有这就是说,当时,x和y是互
12、相独立的所以,对于正态分布来说,随机变量的“互不相关”与“互相独立”是等价的 根据(1-2-4)式绘制二维正态曲面(密度曲面)如图l-1所示曲面在点处取得最大值如果用平行于XOY面的平面 (常数)截此曲面,即得到一族椭圆,椭圆上所有点的概率密度值均相等,因此,称这些椭圆为等密度椭圆2.2.3正态随机向量的条件概率密度 设有维正态随机向量X,且设和分别是由X的前n个分量和后t个分量构成的正态随机变量,即,的概率密度是图1-1 (1-2-6)按分块矩阵求逆公式,有 (1-2-7)或为 (1-2-8)其中 (1-2-9)可将(1-2-7)和(1-2-8)两式分别写为 (1-2-10) (1-2-11
13、)因还可分解为 (1-2-12)所以,的行列式之值为 (1-2-13)利用(1-2-10)、(1-2-9)式和(1-2-13)式,可将概率密度(1-2-6)式改写为 (1-2-14)或 (1-2-15)其中 (1-2-16)根据边际概率密度和多维正态分布的性质可知 (1-2-17) (1-2-18)又由条件概率密度公式知 (1-2-19) (1-2-20)而将(1-2-14)和(1-2-17)两式代人(1-2-19)式,得 (1-2-21)而将(1-2-15)和(1-2-18)两式代人(1-2-20)式,即得 (1-2-22)显然,上两式仍然是正态概率密度,根据条件期望和条件方差的定义和正态概
14、率密度的性质可得 (1-2-23) (1-2-24)因此,(1-2-21)和(1-2-22)式又可写为 (1-2-25) 正态分布的条件期望具有以下性质: (1)由(1-2-23)式可知,是的线性组合,所以,它是正态随机向量;当然也是正态随机向量 (2)设X和Y,为正态随机向量,且设 (1-2-26)则是与Z互相独立的随机向量这是因为由协方差传播律可得 (3)设,而 (1-2-27)证 因为所以(4)设令 (1-2-28)证 因为所以 (1-2-29)利用分块求逆公式和(1-2-29)式得2.2.4矩阵反演公式由于正定矩阵的逆阵唯一,故由(1-2-7)、(1-2-8)两式直接可得: (1-2-
15、30) (1-2-31)由此可知,对于任意矩阵A、B和任意可逆阵C、D,只要在下式中它们可以相乘,就有上两式关系,一般形式为 (1-2-32) (1-2-33)通常称(1-2-32)、(1-2-33)两式为矩阵反演公式,是两个非常重要的关系式,在测量平差推导公式时常要用到 矩阵反演公式也可直接证明令,则有 , (1-2-34)将上式左乘B,得或 此即(1-2-33)式,代入(1-2-34)式,即得(1-2-32)式2.3极大似然估计 设有参数向量,它可以是未知的非随机量,也可以是随机向量,为了估计X,进行了n次观测得到了观测向量的观测值,又假定对X的所有可能取值为,在X=的条件下得到的观测向量
16、L的条件概率密度为容易理解,是x和的函数,但对具体的观测值来说,可以认为只是x的函数因此,如果是中的一个,而是中的最大值,那么,是的准确值的可能性最大此时把叫做X的极大似然估值,并记作或这就是说,极大似然估计是以 (1-3-1)为准则求最佳估值x的方法 显然,它满足于 (1-3-2)由于对数是单调增加函数,因此与在相同的值达到最大,亦即(1-3-2)式等价于 (1-3-3)此方程称为似然方程,称为似然函数,而称为对数似然函数 如果参数X是非随机量,则而(1-3-1)式变为 (1-3-4)此时,是的概率密度,其中的只是表示函数与参数X有关 由似然方程或(1-3-2)式可见,极大似然估值是观测值L
17、的函数在采用极大似然估计求时,需要首先知道似然函数或对数似然函数2.4最小二乘估计 设被估计量是维未知的参数向量X,观测向量为其观测误差(或称为噪声)向量为,观测方程 (1-4-1)式中的秩,设X的估值为,则有 (1-4-2)所谓最小二乘估计,就是要求估计值使下列二次型达到最小值,即 (1-4-3)其中是一个适当选取的对称正定常数阵,称为X的最小二乘估值,记为或(L) 当参数X的各个分量之间没有确定的函数关系,即它们是函数独立的参数时,可将对求自由极值,令其一阶导数为零,得 (1-4-4) 转置后,得或 (1-4-5)解得 (1-4-6)又因为所以使达到极小值 最小二乘估计量x的估计误差为 (
18、1-4-7)由此式按协方差传播律可得X的误差方差阵为 (1-4-8)将对称正定阵表示为 (R为可逆阵),并令则得:且由“矩阵形”许瓦茨不等式可得:即只有当或 (为常数)时,上式才取等号,而使的误差方差阵达到最小,此时有 (1-4-9)有时将P取为或时的估计称为马尔柯夫估计,此时应将(1-4-3)式写为 (1-4-10)可以看到,最小二乘估计具有如下性质: (1)最小二乘估计是一种线性估计,即X的估计量是观测值的线性函数 (2)当观测误差的数学期望为时,因所以即具有无偏性 (3)当观测误差的方差阵为,而取时,的误差方差阵达到最小值 (4)最小二乘估计不需要X的任何先验统计信息当X是非随机量,或X
19、虽然是随机量,但完全不考虑其先验统计信息时,由观测方程(1-4-1)和(1-4-6)式按协方差传播律可知 (1-4-11) (1-4-12) 上面是不考虑概率分布,直接将(1-4-3)式作为一种估计准则当观测误差和参数X是正态随机向量时,这种最小二乘估计准则还可以从极大似然估计导出 设,由于X和一般是互相独立的,故设则由观测方程(1-4-1)式可得: (1-4-13)而在条件下的条件概率密度为式中将(1-4-13)式代人上式得:由于似然方程等价于所以也等价于 (l-4-14)考虑到则(l-4-14)式也就是最小二乘估计的准则(1-4-10).这就由极大似然估计导出了最小二乘估计 从上述讨论看到
20、,在由极大似然估计导出最小二乘估计的过程中,虽然将参数X作为随机向量,但是在求最小二乘估值时,并不需要知道X的先验期望和先验方差因此,从这个意义上可以说,最小二乘估计实际上并没有考虑参数的随机性质正因为如此,当不知道参数的先验期望和先验方差,或者参数是非随机量时,可以应用上述最小二乘估计求其估值 本节是以间接平差的函数模型为例,说明了最小二乘估计的准则至于其他的各种经典平差法(如条件平差、附有参数的条件平差、附有限制条件的间接平差),尽管它们各具自己的函数模型,但它们所依据的估计准则不变,其差别仅在于:在不同的函数模型下,它们的具体求解方法有所不同因此可以说,各种经典平差方法,都是依据最小二乘
21、估计准则,去求未知参数X的最小二乘估值和观测值L的平差值2.5极大验后估计 如1-3节中所述,极大似然估计是以“”为准则的估计方法,而极大验后估计则是以 (1-5-1)为准则的估计方法这里是随机参数向量在观测向量的条件下的条件概率密度仍然表示的观测值这个准则的含义在直观上是较明显的它的含义是:给定了的一组子样观测值,由这组可以按一定的概率取得参数X的不同估值,其中最佳估值的条件概率密度应为极大值一般用表示由极大验后估计得到的最佳估值,称之为极大验后估值,显然,应满足 (1-5-2)此方程称为验后方程 因为将上式对求导,则有由此可知,极大验后估计的准则(1-5-1)式等价于2.6最小方差估计 最
22、小方差估计是一种以估计误差的方差为最小作为准则的估计方法,即根据观测向量L求得参数X的估值,如果它的误差方差比任何其他估值的方差小,就认为这个估值是最优估值记X的最小方差估值为或 设任一估值为,其估计误差为,而误差方差阵为 (1-6-1)当取最小值时的就是最小方差估值.因(1-6-1)式表示的方差阵是一个非负定对称阵,所以,为了求得使取得最小值的,只需要求下式的最小值,即得: (1-6-2)由上式可写为因为所以 (1-6-3)由于总是一个非负定阵,所以 (1-6-4) 欲使取得最小值,就应使上式取等号,此时应使即得参数的最小方差估值为 (1-6-5)而最小方差估值的误差方差阵为即 (1-6-6
23、)它是估计误差的最小方差阵 又因为考虑到即得 (1-6-7)可见,是X的无偏估计量 可以看到,当X和L都是正态随机向量时,X的最小方差估值,和它的极大验后估值是相等的然而,当X和L不都是正态随机向量时,就不一定等于了2.7线性最小方差估计 前面所述的极大似然估计、极大验后估计和最小方差估计,均要求知道观测向量L和未知参数向量X的条件概率密度或联合概率密度。它们所得到的估计量可以是L的任意函数而最小二乘估计可以不需要知道任何统计性质,所得到的估计量x。是的线性函数,所以说最小二乘估计是一种线性估计本节的线性最小方差估计则是放宽对概率密度的要求,只要求已知L和X的数学期望和方差、协方差,以及限定所
24、求的估计量是观测向量L的线性函数,再以估计量的均方误差达到极小为求最优估计量的准则这样得到的估计量称为线性最小方差估计量,并记为以或。 设已知观测向量L的数学期望和方差为和,参数向量X的先验期望和方差为和和X的协方差为,又设估计量是L的线性函数 (1-7-1)式中和是非随机常数向量和系数矩阵此时,的误差向量是 (1-7-2)则的数学期望和方差分别为 (1-7-3) (1-7-4)而的均方误差阵为即得将上式配方,则有(1-7-5)上式右边第一、二项都是非负定阵,而第三、四项均与无关显然,为使(1-7-5)式中的达到极小,唯一的解就是选取,使(1-7-5)式右边的第一、二项等于零,亦即使 (1-7
25、-6) (1-7-7)将(1-7-6)和(1-7-7)两式代入(1-7-3)式可得: (1-7-8)再将(1-7-7)和(1-7-8)两式代入(1-7-1)式,即得线性最小方差估计量 (1-7-9) 因为,所以,的方差可由(1-7-5)式得出 (1-7-10) 如果把线性最小方差估计的达到最小的准则,改为其迹达到最小,即 (1-7-11)则可按求极值的方法求定将(1-7-11)式分别对求导数,并令其为零,可得: (1-7-12) (1-7-13)由(1-7-12)式可得:代人(1-7-13)式得:即有所以也可得 (1-7-14) (1-7-15)此即(1-7-7)、(1-7-8)式,由此可知,
26、这种以方差阵之迹达到最小的准则,与前面以方差阵达到最小的准则所得到的结果完全相同。有时也称这种以方差阵之迹达到最小为准则的估计方法称之为最小方差迹估计 不难看到,线性最小方差估计量童。具有以下性质:(1) 由(1-7-9)式可得:所以,是X的无偏估计,即具有无偏性 (2)盖具有有效性,即的误差方差取得最小值这是显然的因为有,其误差方差等于其方差阵(3)因为估计误差可表为所以与观测向量L的协方差阵为可见,估计误差向量与观测向量L是不相关的;从几何的角度看,可以将此性质叫做与L正交X与L本来不是正交的,但从Y中减去一个由L的线性函数构成的随机向量后,即与L正交因此可以说,是X在L上的投影 (4)当
27、X,L的联合概率密度是正态时,因为所以,此时X的线性最小方差估计量x。就等于最小方差估计量也等于其极大验后估计量2.8贝叶斯估计 在1-5节和l-6节中介绍的极大验后估计和最小方差估计,可以说是贝叶斯(Bayes)估计的两种形式,因此有必要介绍一些关于贝叶斯估计的概念 仍设X是被估计的未知参数向量,L是观测向量,是根据L给出的X的一个估计量,其估计误差为 设有估计误差的一个标量值函数: (1-8-1)如果它具有性质:其中则称为估计量对X的损失函数(或代价函数),并称其数学期望为的贝叶斯风险,记为 (1-8-2) 上述的第一个性质说明它是原点到的距离的非减函数;第二个性质的含义是,当估计精确时,
28、估计的损失为零;第三个特性说明对称于原点: 所谓贝叶斯估计,就是根据使贝叶斯风险达到最小的准则来求定未知参数的估计量,也就是使满足 (1-8-3) 可以看到,选择不同形式的损失函数,就可得到不同的贝叶斯估计方法和结果下面来说明极大验后估计和最小方差估计是贝叶斯估计的两种形式2.8.1极大验后估计 设选择的损失函数是 (1-8-4)上式的损失函数称为均匀损失函数,此时,的贝叶斯风险为 (1-8-5)上式可写为若设X的贝叶斯估计量为,因等价于当足够小时,这又等价于 (1-8-6)所以,此时又是石的极大验后估计量。也就是说,当损失函数是(1-8-4)式且足够小时,贝叶斯估计就是极大验后估计2.8.2
29、最小方差估计设选择的损失函数是 (1-8-7)式中S为任意对称非负定阵,(1-8-7)式的损失函数称为二次型损失函数此时的贝叶斯风险为 (1-8-8)不难看到,上式也可写为矩阵迹的形式,即有 (1-8-9)式中的积分就是童的误差方差阵,当取S=E时,选择二次型损失函数的贝叶斯估计,是以估计量的误差方差阵之迹达到最小为准则来求的方法因此,可以说,它就是最小方差估计 如果将(1-8-8)式写为则它也等价于 (1-8-10)又因为所以有由于S是非负定阵,因此下式成立:亦即 (1-8-11)又由于因此,当宣时,确使具有最小值也就是说,根据(1-8-9)式求得的也是X的最小方差估计量。2.9广义测量平差
30、原理 测量平差的主要任务,是根据含有随机误差的观测值来确定被观测量及其函数的平差值,也就是求定未知参数的最佳估值前面所讨论的各种估计方法也就是广义测量平差的理论基础为了进一步说明广义测量平差原理,下面先讨论在正态分布的情况下,上述估计方法的关系 从前面的叙述可以看到,对于正态分布来说,极大验后估计所得到的结果,与最小方差估计、线性最小方差估计相同;而在一定的情况下,可以由极大似然估计导出最小二乘估计因此,本节主要说明极大似然估计、最小二乘估计与极大验后估计之间的关系 由1-3节知,对于正态分布,极大似然估计的准则,等价于 (1-9-1)若未知参数为,观测误差,并有观测方程 (1-9-2)再记
31、(1-9-3)则由l-4节知,似然方程等价于最小二乘估计准则 (1-9-4)其中,若取=1,则(1-9-3)式也就是观测值L对应的误差方程又由l-5节知,极大验后估值。应满足验后方程根据贝叶斯公式可得因此 (1-9-5)考虑正态分布的概率密度,和可知,极大验后估计准则“”也等价于 (1-9-6)而当有观测方程(1-9-2),且时,上式便等价于 (1-9-7) 下面根据(1-9-5)和(1-9-7)式来进行讨论 在式(1-9-6)中其左边第一项就是极大似然估计准则的等价公式(1-9-1)的左边项.因此,当X是随机参数时,极大验后估计改善了极大似然估计或最小二乘估计.而当X的先验概率密度为常数时,
32、则有 (1-9-8) (1-9-9)所谓先验概率密度为常数,也就是说在一定的范围内,参数X在验前取任何值的概率都相等,亦即工是不具有先验统计特性的非随机量 上两式表明,极大验后估计在此时便退化为极大似然估计或最小二乘估计 如果将(1-9-7)式中的未知参数看成非随机量,亦记为,将此时的观测向量记为;而将X的先验期望看成是与相互独立,且方差为的虚拟观测值,记为,相应的虚拟观测误差记为,则有观测方程为 (1-9-10)若仍以表示的估值,并记 (1-9-11)此式也就是误差方程于是,(1-9-7)式可写为 (1-9-12)式中当取时,即有,它们表示权矩阵 也就是说,在上述情况下,可以对和。列出误差方
33、程(1-9-ll),按(1-9-12)式来求非随机参数的估计值容易看到,(1-9-l2)式是l-4节中的最小二乘估计准则的扩充,因此。称(1-9-12)式为广义最小二乘原理而将按广义最小二乘原理进行平差的过程,称为广义测量平差 不难理解,在上述情况下,按极大验后估计(或最小方差估计)求得的 (或)同按广义最小二乘原理求得的估值,在数值上是完全相等的同时,由于按广义最小二乘原理求时,是非随机量,因此所得到的估值的方差也就等于其误差方差,当然它也等于的误差方差,但一般并不等于的方差在以后按广义最小二乘原理进行平差时,一般不区分和 以上的讨论说明,在正态分布的情况下,极大验后估计可以转化为广义最小二
34、乘估计实际上,随机参数的先验期望和先验方差的精确值一般是不可能得到的,往往只能得到它们的估计值显然,先验期望的估计值也就是X的观测值因此,在这种情况下,按极大验后估计求也只能说是近似的;而将此先验期望的估计值作为方差为,的虚拟观测值,采用最小二乘估计将更为合理只有在和,能够精确得到时,采用极大验后估计才是合理的但此时,也可按广义最小二乘原理求解,得到的结果与极大验后估计一致 如果在未知参数中除包含随机参数X外,还包含非随机参数Y,则有故此时只要将未知参数中的随机部分,即X的先验期望当作方差为的虚拟观测值,仍可按(1-9-12)式表示的广义最小二乘原理求估值和 如果全部未知参数都是非随机量,则(1-9-12)式中的就不存在了,也就变成1-4节中的最小二乘原理了 上面的广义最小二乘原理(1-9-12)式,是就正态分布和线性观测方程(1-9-2)且的情况导出的对于非线性观测方程,可按泰勒级数化为线性形式;对于非正态分布,也可将它们近似地看成正态分布;而的情况亦不多见因此,(1-9-12)式的广义最小二乘原理具有一定的普遍意义 下面讨论的情况仍假定为正态分布,且有(1-9-2)式的线性观测方程