《基于经验似然的部分线性模型的统计诊断.pdf》由会员分享,可在线阅读,更多相关《基于经验似然的部分线性模型的统计诊断.pdf(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用概率统计第二十七卷第一期2011年2月Chinese Journal of Applied Probabilityand Statistics Vol.27 No.1 Feb.2011基于经验似然的部分线性模型的统计诊断徐 亮1丁先文2林金官1(1东南大学数学系,南京,211189;2江苏技术师范学院数理学院,常州,213001)摘 要经验似然方法已经被广泛应用于许多模型的统计推断.本文基于经验似然对部分线性模型进行统计诊断.首先给出模型的估计方程,进而得到模型参数的极大经验似然估计;其次,基于经验似然研究了三种不同的影响曲率;最后通过随机模拟和实例分析,说明了统计诊断方法的有效性.关键词
2、:经验似然,估计方程,极大经验似然估计,影响曲率.学科分类号:O212.2.1.引言在回归分析中,模型的诊断问题是非常重要的环节.自Cook1,2开始了统计模型的诊断研究起,许多统计学家在这方面做了大量的研究.如Thomas和Cook14等发展了局部影响分析的方法,该方法可以应用于许多统计模型的诊断;Fung&Kwan4考虑了基于正态曲率的局部影响问题;Zhu&Lee17、Zhu,et al18分别研究了基于不完全数据的局部影响和数据删除诊断;Fung,et al5、Lee&Xu6、Xie,et al15等又在不同的领域对模型进行了诊断,提出了许多诊断统计量.基于经验似然的统计分析是近年统计学
3、的热点研究课题.Owen79介绍并发展了非参数问题的经验似然方法,提出了经验似然比统计量,并在此基础上对线性模型和广义线性模型进行了深入的研究.由于这种方法适用范围的广泛性和有效性,迅速得到了许多研究者的推广和发展.例如,Qin10研究了利用经验似然进行纠偏的问题;Qin&Lawless11接着用经验似然方法来研究广义估计方程,得到了广义估计方程的参数估计方法,并证明了参数估计的渐近性质;Wang&Jing16用经验似然方法来研究部分线性模型中似然比统计量的渐近性质并构造了参数的置信域.Zhu,et al19将经验似然和统计诊断方法相结合,提出了三种针对广义估计方程的诊断方法,即数据删除方法,
4、局部影响分析方法和伪残差方法.对数据删除方法,Zhu,et al19引进了经验似然距离和经验Cook距离,并证明了它们的渐近一致性;对局部影响分析方法,他们考虑了对经验似然函数的扰动,并给出了常用的影响度量;对伪残差方法,Zhu,etal19介绍了标准化伪残差的计算方法,并给出了具体的诊断标准.江苏省自然科学基金项目(BK2008284)和东南大学校内基金(9207011430)资助.本文2009年12月16日收到.92应用概率统计第二十七卷本文基于经验似然对部分线性模型进行诊断分析.部分线性模型首先由Engle,et al3为了研究电力需求与天气之间的相互关系而提出来的.此模型的一般形式为:
5、yi=xTi+(ti)+i,i=1,n,(1.1)其中yi为响应变量,xi为p 1维向量,ti在0,1上取值,为p 1维未知参数,()为定义在0,1上的未知可测函数,i(i=1,n)为随机统计误差,通常假设i为独立同分布的随机变量,期望E(i)=0,方差2=E(21),并且i与(xi,ti)相互独立,i=1,n.由于部分线性模型的实用性和有效性,一些学者对此进行了研究,提出了若干关于未知参数和未知函数()的估计方法.例如,Robinson12运用Nadaraya-Waston核估计方法给出了参数的最小二乘估计,并且推导了在某些正则条件下参数估计的渐近分布.Speckman13用核估计方法得到了
6、参数和函数()的估计.本文的主要结构如下:第二节介绍经验似然与估计方程,给出了未知函数()的估计,然后基于经验似然比函数求得参数的极大经验似然估计,并给出了具体的求解方法;在第三节,对模型进行了数据删除和局部影响分析,将Zhu,et al19的研究成果进一步推广至部分线性模型,对此模型进行统计诊断,并给出诊断统计量和具体的计算公式;第四节利用随机模拟和实际数据分析来说明诊断统计量的有效性.2.基于经验似然的估计方程及其参数估计2.1基于经验似然的估计方程不失一般性,假设x1,xn为来自未知分布F的独立样本,为p 1维参数,=(1,p)T.不必假设分布F的参数形式,仍然可以通过r(p)维独立的估
7、计函数g(x,)=(g1(x,),gr(x,)T对进行统计推断,其中估计方程满足:EFg(x,0)=0,0,(2.1)其中EF表示关于分布函数F的数学期望,0为的真值.方程(2.1)通常称做估计方程或矩条件方程(Qin&Lawless11;Owen9).经验似然函数定义为(Owen7;Qin&Lawless11):L(F)=nQi=1dF(xi)=nQi=1pi,其中pi=dF(xi)=P(X=xi).在条件(2.1)下,截面经验似然比函数为:LE()=supnnQi=1npi|pi 0,nPi=1pi=1,nPi=1pig(xi,)=0o.由Qin&Lawless11,Owen9可知:当pi
8、=1n11+Tg(xi,)第一期徐亮 丁先文 林金官:基于经验似然的部分线性模型的统计诊断93时,LE()取得唯一值:LE()=nQi=11+Tg(xi,)1,其中n()为1nnPi=1g(xi,)1+Tg(xi,)=0的根.经验似然也可用于对参数的统计推断(例如,参数估计和假设检验).参数的极大经验似然估计可由极大化截面经验对数似然比函数logLE()得到,即:b=argmaxlE()=argmaxnPi=1lE,i()=argmaxnnPi=1log(1+Tn()g(xi,)o,(2.2)其中lE,i()=log(1+Tn()g(xi,).Qin&Lawless11证明了b和b=bn(b)
9、的渐近正态性质,即当n 时,n(b 0)L N(0,C),n(b 0)L N(0,C),这里L指依分布收敛,协方差矩阵分别为:C=(S21S111S12)1,C=S111 S111S12S122.1S21S111.现记S22.1=S21S111S12和矩阵S:S=S(0,0)=S11S12S21S22!=EF(g2)EF(g)TEF(g)0!(0,0),其中g=g(x,0),g=g(x,)/(下同),对任意的向量a,a2=aaT.在(2.1)成立的条件下,可进一步构造经验似然比统计量WE(0)=2lE(b)l(0),此统计量可以用来检验H0:=0 H1:6=0,Qin&Lawless11证明了
10、在原假设成立的情况下,当n 时,WE(0)L 2p.2.2模型的参数估计首先假设参数已知,则有:yxT=(t)+,其中未知函数.由Nadaraya-Watson核估计的方法有:n(t)=b(t,)=nPj=1wnj(t)(yj xTj),(2.3)94应用概率统计第二十七卷其中wnj(t)=kt tjhn.nPj=1kt tjhn为权重因子,k()为核函数,hn为窗宽,满足nhn 0,n (Owen9).令e xi=xinPj=1wnj(ti)xj,g(xi,)=e xi(yi xTi (ti).若函数()已知且参数为真参数0,则有E(g(xi,0)=0.(2.4)由此可以得到部分线性模型的估
11、计方程,即为(2.4)式.由于()未知,因此无法通过估计方程(2.4)对参数进行统计推断,这就需要通过它的估计式(2.3)替换(t),由此可以得到模型的估计方程为:E(e g(xi,)=E(e xi(yi xTi n(ti)=0.下面根据(2.2)式给出参数的极大经验似然估计的方法.参数的经验对数似然比函数为:lE()=nPi=1lE,i()=nPi=1log(1+tn()Te g(xi,),其中lE,i()=log(1+tn()Te g(xi,).将t看成与相互独立的变量,并定义:Qn(t,)=n1nPi=1li(t,)=n1nPi=1log(1+tTe g(xi,).显然,参数的极大经验似
12、然估计b和t的估计值bt为下列方程组的解:Q1,n(t,)=tQn(t,)=n1nPi=1e g(xi,)1+tTe g(xi,)1=0;Q2,n(t,)=Qn(t,)=n1nPi=1e g(xi,)t1+tTe g(xi,)1=0,其中,e g(xi,)=xi+nPj=1wnj(ti)xje xTi=e xie xTi.由此方程即可得到部分线性模型参数的极大经验似然估计b.3.部分线性模型的影响分析在模型的非参数函数和参数估计的基础上,即可研究部分线性模型的诊断问题.通过数据删除分析、局部影响分析和伪残差分析等来研究部分线性模型的诊断.第一期徐亮 丁先文 林金官:基于经验似然的部分线性模型的
13、统计诊断953.1模型的数据删除度量为了研究第i组数据点(yi,xTi)的影响,通常考虑去掉(yi,xTi)的删除模型.首先引入一些记号,记X(i)为X去掉第i行后的矩阵,b(i)为去掉第i组数据点(yi,xTi)后参数的估计值.类似地,记Qn(i)(t,)=n1nPj6=ilog(1+tTg(xj,),b(i)和bt(i)为方程组Q1,n(i)(t,)=tQn(i)(t,)=0Q2,n(i)(t,)=Qn(i)(t,)=0的解.利用Zhu,et al19的方法,对应于参数似然的Cook距离,可得经验Cook距离ECDi(M)=(b(i)b)TM(b(i)b),其中M可取为某一正定矩阵,例如M
14、=2lE()|=b,同时,也可得到经验似然距离:ELDi(M)=2lE(b)lE(b(i).若某个ECDi(M)或ELDi(M)较大时,则可以认为第i组数据点为强影响点.Zhu,et al19在一定正则条件下给出了b(i)和bt(i)的一步近似结果.利用类似推导,可得到在部分线性模型中,模型参数b(i)和bt(i)的一步近似结果为:b(i)=b n1(S122.1S21S111T S122.1N)1+op(1),bt(i)=bt n1(S111+S111S12S122.1S111)T S111S12S122.1N)1+op(1),(3.1)其中,S11,S12,S22,S22.1如前定义,而T
15、=e g(xi,b)1+btTe g(xi,b),N=e g(xi,b)bt1+btTe g(xi,b),e g(xi,)=e xie xTi.由此,即可简化ECDi(M)和ELDi(M)的表达式.3.2模型的局部影响分析设=(1,n)T为描述扰动因素的向量,其定义域称为扰动空间,它是Rn上的某一开集.受扰动后的对数经验似然函数定义为:lE(|)=nPi=1ilE,i(),并且0,使得,有lE(|0)=lE(),即当=0时,模型未受到扰动.用b,b()分别表示相应于原模型和扰动模型参数的极大经验似然估计,且有b=b(0).由以上假设,经验似然距离为(Zhu,et al19):LDE()=2lE
16、(b)lE(b().96应用概率统计第二十七卷现考虑空间中过0以h为方向的一条直线(a)=0+ah,其中(0)=0,h为单位方向向量,a为实参数.影响图:()=(T,LDE()T在=0处沿方向h的曲率为:Ch(0)=hTHLDE(0)h,这里HLDE(0)=22LDE(b()Tflflfl0=2T2lE()1flfl0,b,其中=2LDE(,)/为p n阶矩阵,其第(k,i)个元素为:klE,i().影响曲率Ch(0)表示影响图在0处沿方向h的变化率,它反映了模型对于沿h方向扰动的敏感程度.下面考虑基于影响曲率Ch(0)的局部影响度量.根据对称矩阵的谱分解原理,可以得到HLDE(0)的谱分解如
17、下:HLDE(0)=nPk=1kvkvTk,其中,k为HLDE(0)的特征值,vk为对应于k的特征向量,且有1 p=n=0,vk=(vk1,vkn)T:k=1,n为标准正交基,即HLDE(0)vk=kvk.由以上假设,得到了局部影响分析的影响度量,即对应于1的特征向量v1为最大影响曲率方向.Zhu&Zhang20研究了影响度量Cei=pPm=1mv2mi,i=1,n,指出了若某个Cei较大(ei指第i个分量为1,其余分量为0的n维向量),则对应的第i组数据点(xTi,yi)即为强影响点.下面推导部分线性模型的局部影响度量Cei的表达式.对部分线性模型,有:2lE()=n(Q2,n tn()tQ
18、1,ntn()T)=nS22.1+op(1).又由tn()|=b=S21S111+op(1)可得:i=lE,i(xi,)|=b=tTn(b)e g(xi,b)+e g(xi,b)bt1+btTe g(xi,b)=S21S111e g(xi,b)+e g(xi,b)bt1+btTe g(xi,b)+op(1),所以,Cei=2Ti2lE()1i+op(1)=2n1TiS122.1i+op(1).另一方面:将lE(b(i)在b处展开可以得到:lE(b(i)lE(b)=12(b(i)b)T 2lE(b)(b(i)b)1+op(1),第一期徐亮 丁先文 林金官:基于经验似然的部分线性模型的统计诊断97
19、将(3.1)式代入上式可得:ELDi(M)=2lE(b(i)lE(b)=n1ATiS22.1Ai1+op(1)=n1TiS122.1i1+op(1)=12Cei1+op(1),其中,Aidef=(S122.1S21S111T S122.1N).所以,Cei=2ELDi1+op(1).同样地,可以得到:Cei=2ECDi1+op(1),因此有如下的结论:Cei=2ELDi1+op(1)=2ECDi1+op(1)=2n1ATiS22.1Ai1+op(1)=2n1TiS122.1i1+op(1).(3.2)上式即为部分线性模型的局部影响度量的两个等价表达式,该结果说明了数据删除和模型扰动对于影响分析
20、的效果是一致的.若某个Cei较大,则有理由认为第i组数据点为强影响点.在具体计算统计量Cei时,需要计算S11,S12,S22,通过若干计算,可得到针对部分线性模型它们的近似计算公式:Sn11=tQ1,n=1nnPi=1e g(xi,)e g(xi,)T(1+tTe g(xi,)2flflfl=b,t=bt;(3.3)Sn12=Q1,n=1nnPi=1e g(xi,)tTe g(xi,)e g(xi,)(1+tTe g(xi,)(1+tTe g(xi,)2flflfl=b,t=bt;(3.4)Sn22=Q2,n=1nnPi=1Te g(xi,)ttTe g(xi,)(1+tTe g(xi,)2
21、flflfl=b,t=bt,(3.5)其中,e g(xi,)=xi+nPj=1wnj(ti)xje xTi=e xie xTi.3.3模型的伪残差分析在(2.1)式成立的条件下,对每组观测数据的伪残差为:Ri=(Ri,1,Ri,r)T=g(xi,b),i=1,n.显然EF(Ri)0,n.进一步地,Zhu,et al19研究了标准化伪残差,记(21,2r)=diagEF(g2),其估计量为(b 21,b 2r),标准化伪残差为:Rsi=(Rsi,1,Rsi,r)T=g1(xi,b)b 21,gr(xi,b)b 2rT.(3.6)对估计量(b 21,b 2r),有下面的近似公式:EFgk(xi,b
22、)n1EFgk(xi)TS122.1S21S111g(xi)1ntrEF2gk(xi)S122.1;98应用概率统计第二十七卷b 2kVarFgk(xi)2n1EFgk(xi)gk(xi)TS122.1S21S111g(xi)n1EFgk(xi)TS122.1gk(xi),这里,g(xi)=g(xi,0),gk(xi)=gk(xi,0),k=1,r.若对某个j,|Rsi,j|较大(比如|Rsi,j|3),则可以认为第i组数据点为异常点.4.模拟计算和实例分析4.1模拟计算在模型随机分析中,类似Wang&Jing(2003),选定(ti)=t2i,参数=(1,4,7)T,产生了n=50组数据,并
23、通过改变生成的数据,对改变后的数据进行影响分析.4.1.1数据的生成生成随机数据集X,T,Y 的步骤如下:(1)首先生成i,i=1,50,它们均取自于N(0,0.22)上的随机数;(2)然后生成X,X为3 50的矩阵,其中的每一个元素都取自于N(0,1)上的随机数,得到了数据集X;(3)再生成ti,i=1,50,ti均取自于均匀分布U(0,1)上的随机数,得到了数据集T;(4)最后生成yi,i=1,50,yi=XTi(1,4,7)T+t2i+i,其中Xi表示X的第i列元素,得到了数据集Y.为了对模拟数据进行影响分析,将得到的数据集Y 中的第20号点加20,第40号点减20,对调整后的数据集用前
24、面介绍的方法进行影响分析,找出强影响点.4.1.2参数估计在对调整后的数据集进行分析时,选定窗宽hn=5(nlogn)1/3(Wang&Jing16),核函数k(x)=(15/16)(1x2)2,|x|1.对每个i,计算e g(xi,),然后计算参数的极大经验似然估计值.对调整后的数据进行一次模拟后得到b=(0.8324,4.0122,7.2146)T,同时,对模拟重复了100次,得到b的均值为:b=(1.0011,4.0482,6.9990)T,有理由认为关于参数的估计是有效的.4.1.3影响分析在前面得到参数估计的基础上,进一步对调整后的数据进行影响分析.首先根据(3.3)(3.5)式算出
25、相应的表达式的值,即得到S11,S12,S21,S22的值,然后根据(3.2)式计算Cei,根据(3.6)式计算Ri,1.在进行一次模拟后得到Cei的值用散点图表示为图1,从图中可以看第一期徐亮 丁先文 林金官:基于经验似然的部分线性模型的统计诊断99出第20号点和第40号点明显异于其它点,可以认为这两个点为强影响点.图2为标准化伪残差图,从图中可以看出第20号点和第40号点也明显异于其它点,进一步说明了这两个点为强影响点.0102030405000.20.40.60.811.21.41.61.8010203040501.210.80.60.40.200.20.40.60.8图1Cei的散点图
26、图2标准化伪残差Ri,1对上述的诊断继续重复进行了100次,并且统计出了能够正确诊断出第20号数据点和第40号数据点为强影响点的次数.诊断出第20号数据点为强影响点的次数为88次,诊断出第40号数据点为强影响点的次数为87次.其他不能判定强影响点的情况中,第20号和第40号数据点所对应的诊断统计量一般都比较大,但是不很明显,无法认定为强影响点.同时,通过改变异常点设置的显著程度,进一步说明了诊断方法的有效性.具体结果见表1.表1加减量20号点为异常点(频率)40号点为异常点(频率)同时为异常点(频率)50.720.640.48100.800.720.68150.840.820.80200.88
27、0.870.85表1说明:随着异常点的不断加大,诊断出第20号点和第40点为异常点的频率在不断增大,并且同时诊断出第20号点和第40点为异常点的频率也在不断增大,进一步说明了诊断方法的有效性.在上述的模拟计算中,没有考虑窗宽的选择对于估计及诊断的影响,但是尝试了几种不同的窗宽,它们对诊断的影响不大.4.2口腔清洗数据分析为了确定治疗常见牙床疾病的某种止痛药物的疗效,进行一组医疗实验,把30个患有不同程度牙床病的病人随机分成两组,控制组和实验组,每组15人.在实验前,首先测定每个病人患病程度的指标SBI;然后控制组仅用水冲洗口腔,实验组用药物清洗,实验三周后,重新测定SBI,具体数据集见下表(S
28、peckman13).表2的第一列和第四列表示100应用概率统计第二十七卷实验三周后指标SBI的数值,第二列和第五列表示实验之前指标SBI的数值,第三列和第六列中xi为示性函数,xi=1表示实验组,xi=0表示控制组.在数据分析中,模型为:yi=xi+(ti)+i,i=1,2,30,这里yi表示实验三周后SBI的数值,ti表示实验前SBI的数值,xi=1或xi=0.表2口腔清洗数据SBI(三周后)SBI(实验前)xiSBI(三周后)SBI(实验前)xi0.390.2510.650.6310.190.2500.450.6310.300.3010.150.6310.150.3300.440.651
29、0.140.3400.510.6500.150.3810.500.6610.170.4000.180.6910.190.4510.540.7100.180.4610.470.7100.330.4800.510.7510.290.5400.420.9900.450.5510.691.3200.410.5710.571.4200.290.5910.571.4200.090.6000.311.7204.2.1参数估计对数据集进行分析时,选定窗宽hn=0.38,核函数k(x)=(15/16)(1 x2)2,|x|1(Speckman13),对于给定的j(1 j 30),对每个i,计算wnj(ti)的值
30、,再计算e xi的值,最后计算参数的极大经验似然估计值.通过计算得到参数的估计值为b=0.0422,同时将b(t)和b(t)+b的图像表示为图3(实线曲线表示b(t)的图像,虚线曲线表示b(t)+b的图像).从图3可以看到xib+b(t)对实验数据的拟合较好,说明了得到的参数估计及(t)的估计较好.4.2.2影响分析在前面得到参数估计的基础上,进一步对数据集进行影响分析.根据(3.3)(3.5)式算出相应的表达式的值,即得到S11,S12,S21,S22的值,然后计算ECDi.用散点图将统计量ECDi表示为图4.从图4中很容易看出第15号数据点的统计量的值明显异于其他点,因此,第一期徐亮 丁先
31、文 林金官:基于经验似然的部分线性模型的统计诊断101有理由认为第15号点为强影响点,这与朱仲义、韦博成21的分析结果是一致的,进一步说明了诊断统计量的有效性.0.20.40.60.811.21.41.61.800.10.20.30.40.50.60.7SBI(t)SBI(3weeks later)05101520253000.050.10.150.20.25图3拟合图图4ECDi的散点图参 考 文 献1 Cook,R.D.,Detection of influential observations in linear regression,Technometrics,19(1977),151
32、8.2 Cook,R.D.,Assessment of local influence with discussion,J.Roy.Statist.Soc.Ser.B,48(1986),133169.3 Engle,R.,Granger,C.,Rice,J.and Weiss,A.,Nonparametrics estimates of the relationship betweenweather and electricity sales,J.Amer.Statist.Assoc.,81(1986),310320.4 Fung,W.K.and Kwan,C.W.,A note on loc
33、al influence based on normal curvature,J.Roy.Statist.Soc.Ser.B,59(1997),839843.5 Fung,W.K.,Zhu,Z.Y.,Wei,B.C.and He,X.,Diagnostic and outlier testing for semiparametricmodel,J.Roy.Statist.Soc.Ser.B,64(2002),565579.6 Lee,S.Y.and Xu,L.,Influence analysis of nonlinear mixed-effects models,Comput.Statist
34、.DataAnal.,45(2004),321341.7 Owen,A.,Empirical likelihood ratio confidence intervals for a single functional,Biometrika,75(1988),237249.8 Owen,A.,Empirical likelihood for linear models,Ann.Statist.,19(1991),17251747.9 Owen,A.,Empirical Likelihood,Chapman and Hall,New York,2001.10 Qin,J.,Empirical li
35、kelihood in biased sample problems,Ann.Statist.,21(1993),11821196.11 Qin,J.and Lawless,J.,Empirical likelihood and general estimating equations,Ann.Statist.,22(1994),300325.12 Robinson,P.M.,Root n-consistent semiparametric regression,Econometrica,56(1988),931954.13 Speckman,P.,Kernel smoothing in pa
36、rtial linear models,J.Roy.Statist.Soc.Ser.B,50(1988),413436.14 Thoms,W.and Cook,R.D.,Asseessing influence on regression coefficients in generalized linear mod-els,Biometrika,76(1989),741749.102应用概率统计第二十七卷15 Xie,F.C.,Wei,B.C.and Lin,J.G.,Assessing influence for pharmaceutical data in zero-inflatedgen
37、eralized Poission mixed models,Statistica in Medicine,27(2008),36563673.16 Wang,Q.H.and Jing,B.Y.,Empirical likelihood for partial linear models,Ann.Inst.Statist.Math.,55(2003),585595.17 Zhu,H.T.and Lee,S.Y.,Local influence for incomplete data models,J.Roy.Statist.Soc.Ser.B,63(2001),111126.18 Zhu,H.
38、T.,Lee,S.Y.,Wei,B.C.and Zhu,J.,Case-delete measures for models with incomplete data,Biometrika,88(2001),727737.19 Zhu,H.T.,Ibrahim,J.G.,Tang,N.S.,et al,Diagnostic measures for empirical likelihood of generalizedestimating equations,Biometrika,99(2008),489507.20 Zhu,H.T.and Zhang,H.P.,A diagnostic pr
39、ocedure based on local influence,Biometrika,91(2004),579589.21 朱仲义,韦博成,半参数非线性模型的统计诊断与影响分析,应用数学学报,24(4)(2001),568581.Diagnostic Measures for Partial Linear Models Based onEmpirical Likelihood MethodXu Liang1Ding Xianwen2Lin Jinguan1(1Department of Mathematics,Southeast University,Nanjing,211189)(2Sch
40、ool of Mathematics and Physics,Jiangsu Teachers University of Technology,Changzhou,213001)The empirical likelihood method has been extensively applied to many models of statistical inference.This paper is based on empirical likelihood for partial linear models for statistical diagnosis.First,theesti
41、mating equations of the model are given and the maximum empirical likelihood estimates of the param-eters are obtained;then,based on empirical likelihood method,the three different measures of influencecurvatures are studied;last,stochastic simulation and data analysis are given to illustrate the validity ofstatistical diagnostic measures.Keywords:Empirical likelihood,estimating equations,maximum empirical likelihood estimate,influence curvatures.AMS Subject Classification:62G86.