《数据带扭曲测量误差条件下乘积回归模型的统计分析.docx》由会员分享,可在线阅读,更多相关《数据带扭曲测量误差条件下乘积回归模型的统计分析.docx(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、摘 要在对带有测量误差的数据进行回归建模时,如果直接分析观测到的数据,忽略测量误差,那么估计结果往往是有偏甚至不相合的。因此,对于这类问题,我们要用相应的测量误差模型来处理。测量误差模型主要有两种:第一种是具有可加结构的一些测量误差模型;第二种是具有相乘结构的一些测量误差模型,我们称之为扭曲测量误差模型。在本文中,我们主要讨论数据带扭曲测量误差条件下的乘积回归模型。本文研究数据带扭曲测量误差条件下乘积回归模型的估计和假设检验问题。通过理论和模拟研究,讨论了估计量的估计效果。我们考虑了当响应变量和协变量都不能直接观测到,但被一个可观测的混淆变量的未知函数所扭曲时,乘积线性回归模型的估计。在对响应
2、变量进行对数变换后,提出了一种参数估计方法,即最小二乘估计。另一种是无对数变换的最小乘积相对误差估计。对于参数分量的假设检验,提出了零假设和检验统计量下的约束估计。建立了估计量和检验统计量的渐近性质。提出了一种计算临界值的自助法。模拟仿真研究表明了该方法的有效性,并将该方法应用于一组实际数据进行统计分析。论文主要研究乘积回归模型中自变量和响应变量均受到扭曲因子的污染而不可观测的统计分析问题。我们所做的主要工作如下:(1)对数据带扭曲测量误差条件下乘积回归模型的介绍及变量校准过程的介绍。我们使用直接插入法1,2,3获取校准过的协变量和校准过的响应变量。(2)运用校准之后的变量,提出了无对数变换的
3、最小乘积相对误差()估计。我们考虑对进行假设检验来考察是否满足某些线性组合。为了模拟检验统计量的零分布,提出了自助法来定义值。(3)基于对数变换的最小二乘估计的介绍。我们研究了提出的估计量、检验统计量和约束估计量的大样本性质,并通过理论证明了最小二乘估计量和估计量的有效性。(4)使用本文提出的方法对模拟数据和实际数据进行统计分析,并给出数据分析结果。关键词:扭曲测量误差;最小乘积相对误差估计;最小二乘估计;自助法;约束估计量Multiplicative regression models with distortion measurement errorsAbstractWhen we dea
4、l with the measurement error data, the naive procedure by simply ignoring measurement errors always leads to a biased and inconsistent estimator. As a result, we should solve such practical problems by choosing some proper measurement error models. There are two types of measurement error data. One
5、is the additive measurement error model. Another one has a multiplicative fashion, which we call the distortion measurement error model. In this paper we consider the distortion measurement error model.This paper studies the estimation and hypothesis test of multiplicative linear regression model wi
6、th distortion measurement error. Through theoretical and simulation research, the estimation effect of the estimators are discussed. This paper considers estimation for multiplicative linear regression models when neither the response variable nor the covariates can be directly observed, but are dis
7、torted by unknown functions of a commonly observable confounding variable. After taking logarithmic transformation on the response variable, we propose an estimation methods for the parameter. That is the least squares estimator. Another is the least product relative error estimator without logarith
8、mic transformation. For the hypothesis testing of parametric components, restricted estimators under the null hypothesis and test statistics are proposed. The asymptotic properties for the estimators and test statistics are established. A bootstrap procedure is proposed to calculate critical values.
9、 Simulation studies demonstrate the performance of the proposed procedure and a real example is analyzed to illustrate its practical usage.The main work we have done is as follows: Firstly, we propose the product linear regression model with distortion measurement error and variable calibration proc
10、ess. We use the direct plug-in method (Cui et al. 2009; Delaigle et al. 2016; Zhao and Xie 2018) to obtain calibrated covariates and calibrated response variable. Secondly, by using the calibrated variables, we propose the LPRE estimator without logarithmic transformation. We consider statistical in
11、ference for to test whether satisfies some linear combinations or not. To mimic the null distribution of the test statistic, a bootstrap procedure is proposed to define p-values. Thirdly, we propose the least square estimation with logarithmic transformation. We investigate the large sample properti
12、es for the proposed estimators, test statistics and restricted estimators. And we prove the asymptotic properties of least square estimator and LPRE estimator by theory. Lastly, we conduct Monte Carlo simulation and real data analysis to illustrate our proposed methods.Key words: Distortion measurem
13、ent errors;Least product relative error estimator;Least squares estimator;Bootstrap;Restricted estimators.III数据带扭曲测量误差条件下乘积回归模型的统计分析目 录摘要IAbstractII第 1 章 引言11.1 研究背景及模型介绍11.2 研究意义和现状21.3 本文的主要内容3第 2 章 最小乘积相对误差估计52.1校准过程52.2定理条件62.3最小乘积相对误差估计72.3.1估计方法72.3.2假设检验8第 3章 基于对数变换的最小二乘估计113.1最小二乘估计113.2假设检验
14、12第 4 章 实验模拟分析15第 5 章 真实数据分析19第 6 章 总结与展望236.1 论文总结236.2 未来展望24参 考 文 献25附录28引理28定理1的证明28定理2的证明31定理3的证明32定理4的证明33致谢36攻读硕士学位期间的研究成果37第 1 章 引言1.1 研究背景及模型介绍在现实生活中,我们经常要利用数学模型分析数据,但是,很多收集到的数据集并不精确,往往含有测量误差。测量误差是我们在进行数据分析时经常遇到的问题。由于观测者的技术水平、外界环境、仪器校准不正确等原因,测量误差问题很常见并存在于多学科领域中,如医学、健康科学、经济学等领域。对一些已经存在测量误差的变
15、量,如果忽略其测量误差,直接使用观察到的数据进行参数估计,那么得到的估计结果往往有很大偏差甚至在大样本中也是不相合的。例如,Fuller et al.4就曾研究此问题,在简单线性回归建模中,如果直接使用观察到的数据,忽略测量误差,那么建模得到的估计系数是被低估的,即所得估计是带有衰减偏差的估计。在非线性模型中,偏差的结构则更加复杂,详见Carroll et al.5。因此,必须精确处理带有测量误差的数据,才能得到更加准确的估计。一般情况下,对测量误差模型的估计和假设检验是非常具有挑战性的,因为我们在估计目标参数时要特别考虑如何消除这种偏差。此外,相比于线性回归模型,乘积回归模型也更加复杂。因此
16、,在这种情况下,乘积回归模型与测量误差的结合使得我们所研究的统计推断问题具有很大的挑战性。在许多回归分析的应用中,很多变量可能受到测量误差的影响而不可直接观测到。统计学上测量误差主要有两种形式,一种是测量误差与待关心的不可观测变量之间是相加结构,另一种是测量误差与待关心的不可观测变量之间是相乘结构,本文主要研究后者。一类我们感兴趣的扭曲测量误差条件下乘积回归模型可以写成:(1.1)其中是不可观测的响应变量,是一个不可观测的连续协变量(“T”在这里是代表矩阵或向量转置符),Y和X是观测到的响应变量和协变量向量,即是我们感兴趣但观察不到的真实变量,我们能观测到的是被污染后的数据(X,Y)。在这里,
17、和是关于可观测变量的扭曲函数,是一个维的对角矩阵:对角元素为,其中和是未知的连续扭曲函数。混淆变量是可观测的且与真实变量相互独立。的对角线结构表明,混淆变量以乘积的方式扭曲不可观测的变量。模型(1.1)中的误差是一个正的随机变量,并且满足和。条件用于识别截距,因为模型(1.1)可以写成。条件用于最小乘积相对误差估计24。参数是待估计的未知参数。模型(1.1)中的可观察变量,也就是扭曲变量对我们所要研究的真实变量有一种相乘或者相加的作用。比如在医学各项指标的测量中,通常将扭曲变量选取为体重指数(BMI)、身高或者体重。目前关于测量误差模型的研究成果有很多,主要研究数据带传统意义下的可加结构测量误
18、差回归模型的统计分析。而这种带有相乘结构的测量误差模型最先是由和6提出来的,近几年也有很多文献讨论扭曲测量误差模型的参数估计,假设检验和变量选择等研究问题。本文将扭曲测量误差模型引入乘积模型中,考虑模型中的参数的有效性估计问题和假设检验。 1.2 研究意义和现状乘积回归模型的研究在数学和应用统计学中具有重要意义。乘积回归模型用于分析金融或生物医学研究中特别常见的具有正响应变量的数据,如股价或生命周期。最小二乘或最小绝对偏差是回归模型统计估计中应用最广泛的准则之一。然而在许多实际应用中,相对误差的大小,而不是误差本身的大小,是实践者关注的中心问题。另外在实际应用中,一些响应变量和协变量是不能直接
19、观察到的,因此,我们研究数据带扭曲测量误差条件下乘积回归模型的相关问题。文献中有关测量误差问题的研究一直没有间断过。最近,国内外很多学者在一些参数和半参数模型上都研究了数据带测量误差的情况。如Delaigle et al.2利用了非参数的估计方法来估计数据带相乘结构测量误差的非参数回归模型。Cui et al.1研究了带扭曲测量误差的非线性回归模型。Li et al.8提出了带扭曲测量误差的部分线性回归模型,其中带相乘结构测量误差的是模型的线性部分;Li和Lu9则用了Lasso法和适应性Lasso法来对模型进行变量选择以及参数估计;Li et al.10通过平滑削边绝对偏差法来进行变量选择;L
20、iang et al.11研究了数据带有测量误差的部分线性模型的变量选择问题;Senturk和Muller12,13最早提出了数据带可加结构测量误差的模型,他们还考虑了带扭曲测量误差的线性回归模型以及广义线性模型;Zhao et al.3考虑了扭曲测量误差模型的非参数检验;Zhang et al.14研究了两组带可加结构测量误差的数据之间的相关系数估计。还有很多测量误差模型的相关文献,具体读者可以参阅Nguyen et al.15,Nguyen和Senturk16,17,Senturk和Muller18以及Senturk和Nguyen19,20,21。带扭曲测量误差数据在生物医学研究和健康相关
21、研究中经常出现。例如, Kaysen et al.22首先通过体重指数()将血液透析患者的纤维蛋白原水平正常化,研究其与血清转铁蛋白水平之间的关系。这说明未观测到的主变量与混淆变量()之间可能存在乘积关系。在实践中,收集的数据通常需要通过一些身体指标来调整,如体重指数(),身体表面积,身高等。由于混淆变量与主变量之间的确切关系未知,直接把观测到的变量除以混淆变量这种“正则化”方式可能过于粗糙,导致模型中参数的估计不相合。作为补救措施,和6通过未知的光滑扭曲函数和引入了一种灵活的乘积调整。最近,大量的文献主要研究模型误差和模型均值是可加结构下的扭曲测量误差模型。现有的文献并没有考虑在数据带扭曲测
22、量误差条件下对乘积回归模型(1.1)的参数估计和假设检验等统计推断问题。在没有扭曲测量误差且变量可精确观测时,将模型(1.1)进行对数变换成为经典线性回归模型23,24。这样的对数运算变换直观上是合理的,因为对数变换后的模型在理论和计算上都很简单。其次模型(1.1)也是乘积线性回归模型或加速失效模型的推广。为了估计乘积回归模型,Chen et al.23,24提出了最小绝对相对误差()估计和最小乘积相对误差()估计。准则是最小化 ,准则是最小化,后者相当于最小化。估计是稳健、无尺度的,但该准则不光滑并且计算非常复杂24。此外,在估计参数的置信区间中,需要用到的渐近协方差矩阵中含有未知的模型误差
23、的密度函数。这使得最后得到的置信区间形式比较复杂,覆盖率精度也不高。所以Chen et al.24提出理论,因为是严格凸且无限可微,并且优化过程更加容易。1.3 本文的主要内容本文旨在扭曲测量误差条件下对模型(1.1)进行研究。我们提出了参数的两种估计方法。首先,我们使用直接插入法1,2,3来获得校准协变量和校准响应变量。使用这些校准变量,提出了基于对数变换的最小二乘估计和无对数变换的最小乘积相对误差估计,我们用这两种估计方法来给出回归系数的估计,并证明该估计是渐近正态的。我们考虑对进行假设检验来考察是否满足某些线性组合。为了模拟检验统计量的零分布,我们提出使用自助法来定义。接下来,我们研究参
24、数是否满足一些线性限制条件的假设检验问题,我们提出了在零假设下的约束最小乘积相对误差估计法和约束最小二乘估计法,该估计是基于拉格朗日乘子来得到的。其次,我们研究了所提出的估计量、检验统计量的大样本性质。我们提出了一个基于零假设下和备择假设下残差平方和之差的规范化检验统计量。在零假设下,检验统计量的极限分布是一个标准的卡方分布。最后,我们通过一系列的蒙托卡罗模拟实验来检验文章中所提出的估计方法和检验过程的数值表现,并将该方法应用于实际数据分析。在本文中,我们对数据带有扭曲测量误差的乘积回归模型进行深入研究。本文的整体结构如下。第1章引言,主要介绍研究问题的背景、模型表达形式、问题研究的意义和现状
25、以及问题研究的思路。在第2章中,我们介绍了数据带扭曲测量误差条件下乘积回归模型和变量校准过程。并提出了无对数变换的最小乘积相对误差估计。研究了最小乘积相对误差估计量、检验统计量和约束估计量的大样本性质。在第3章中,我们介绍基于对数变换的最小二乘估计。研究了提出的估计量、检验统计量和约束估计量的大样本性质。在第4章,我们报告了模拟研究的结果。在第5章中,我们用提出的模型和统计分析方法分析一组真实数据。以说明我们所提出方法的有效性和实用性。在附录中我们给出了渐近结果的所有理论证明。第 2 章 最小乘积相对误差估计在实际应用中,相对于普通误差而言,人们更关心相对误差的大小,比如股价预测或者寿命分析,
26、这时我们选择相对误差可能比绝对误差对实际问题更有意义。因此,最小绝对相对误差和(Minimum Sum of Relative Errors)以及最小相对误差平方和(The Relative Least Squares)的估计准则,很早就在不同领域中被提了出来。Chen et al.23,24提出了最小绝对相对误差(LARE)估计准则和最小乘积相对误差(LPRE)估计准则。这些方法可以从根本上消除尺度或者单位对估计结果造成的影响。Chen et al.24所提出的准则具有良好的估计特性,本章节我们将运用准则对模型(1.1)进行参数估计。2.1校准过程在这一小节中,我们使用观察到的独立同分布样本
27、来校准不可观察的和,为了保证模型(1.1)中未知参数可识别,通常假设 (2.1)这个可识别性假设最先是由Senturk和Muller6提出来的,它类似于经典的可加测量误差:即对于,其中有误差的,而是无误差的。根据与之间的独立性,并结合可识别性条件(2.1)和条件(C1)(详见2.2节),对于我们可得到(2.2)(2.3)等式(2.2)与Gui et al.1所得结果相同,等式(2.3)由Delaigle et al.2以及Zhao和Xie3提出。注意,响应变量是正的,在条件(C1)下很容易得到, .由式(2.2)-(2.3)可知,的校准程序可由, 在总体水平上实现。Gui et al.1, D
28、elaigle et al.2以及Zhao和Xie3关于这些不可观测到的变量提出了一种基于矩的校准方法,估计过程总结如下。首先使用估计方法估计和:(2.4)(2.5)这里, 表示密度函数,和是取值为正值的核窗宽函数,。 由 (2.2)(2.3) 和(2.4)(2.5)可得,的校准估计可定义为(2.6)2.2定理条件为了给出本小节中参数估计的大样本性质,我们将列举出一些假设条件,这些假设条件只是为了证明的方便,并非最弱条件,而且在一般情况下是比较容易满足的。(C1)对任意,函数且,其中表示的紧支撑集。此外,函数和有三阶连续导数,并且。随机变量的密度函数大于0,并且在上满足一阶利普希茨条件。(C2
29、),。定理1定义的矩阵和定理3定义的矩阵都是正定矩阵。(C3)核函数是一个有界、连续并且在上关于0对称的密度函数,满足利普希茨条件。的二阶导数连续有界,并满足和。(C4)当时,窗宽和,满足,和。(C5)模型误差满足和。上述条件在大多数实际情况下都能满足。条件(C1)最近被用于扭曲测量误差模型的研究2,3。关于的有界假设是不失一般性的,因为变量总是可以进行单调变换,即使在转换之前的支撑是无界的。条件(C2)用于定理的证明。条件(C3)是核函数的通用条件。核满足此条件。条件(C4)是非参数核光滑中窗宽、的条件。条件(C5)用于对响应变量进行基于对数变换的最小二乘估计和无对数变换最小乘积相对误差估计
30、24。2.3最小乘积相对误差估计2.3.1估计方法最小乘积相对误差()估计的定义如下: (2.7)为了最小化(2.7),我们可运用近似算法,并通过使用一个相合的估计作为初始值使得迭代算法收敛更快。我们用作为初始估计并运用算法(2.8)更新,具体形式如后面3.1节式(3.1)所示。(2.8)其中(2.9)和由(2.8)得到的收敛估计作为最小乘积相对误差估计。 在下面的定理中,我们需定义一些记号:,定理1:假设条件(C1)-(C5)满足,令,则:证明过程见附录。备注1. 中的第一项是精确观测数据集为,的最小乘积相对误差估计的渐近方差,与Chen et al.24得到的渐近方差相同。中的剩余项是由于
31、响应变量和协变量中的扭曲测量误差所导致的。2.3.2假设检验在不失一般性的前提下,我们考虑线性假设检验问题:(2.10)其中是一个已知的行满秩矩阵,是一个已知的维常数向量,并且我们还假设。这个假设检验可以用来检验参数是否带有某种特殊结构。考虑假设检验(2.10),在下,利用拉格朗日算子技术构造了一个约束估计量,(2.11)式中是维的拉格朗日算子,设为维向量,第一个位置为1,其他位置为0,得到约束最小乘积相对误差估计量为: (2.12)(2.13)其中在(2.9)中通过用替换来定义。为了检验(2.10)中的零假设,我们定义我们给出关于的检验统计量为(2.14)直观地说,如果零假设为真,则的值很小
32、。如果零假设不成立,则与之间应存在显著差异,值较大。它进一步表明应拒绝零假设。下面的定理给出了估计量和检验统计量的渐近分布。定理2:令假设定理1中的条件满足,则以下结果成立:在零假设下,我们有和,其中是自由度为1的独立标准卡方随机变量,而是的特征值。在局部假设下,我们有其中。此外,渐近收敛到广义卡方分布25,即(2.15)这里服从多元正态分布。证明过程见附录。定理2中所得到的渐近方差非常复杂,且对于的有限样本估计可能并不精确。为了解决这个问题,我们提出了自助法26,27,28来近似下检验统计量的分布。基于自助法检验统计量计算临界值的步骤如下:步骤1.计算(2.14)中定义的检验统计量。步骤2.
33、生成次服从伯努利分布的独立同分布变量,分别以概率取值。令,.步骤3.对于每个,使用自助法,重新计算自助法估计量和,然后计算自助法检验统计量步骤4.我们计算自助法检验统计量,的分位数作为临界值。第 3章 基于对数变换的最小二乘估计 3.1最小二乘估计 最小二乘法是一种经典且应用广泛的估计方法,在诸多学科中均占有重要地位,本节我们提出了模型(1.1)的最小二乘估计量。对任意矩阵或向量,我们定义,直接运用对数校正数据集和就可以得到关于基于对数变换的最小二乘()估计为(3.1)我们将会在定理3中证明最小二乘估计是渐近正态的。在下面的定理中,我们定义,和,定理3.令。在(C1)-(C5)条件下,有备注2
34、. 中的第一项是观测数据集 的最小二乘估计量的一般渐近方差。中的剩余项是由于响应变量和协变量中的扭曲测量误差造成的。因为与相互独立,令,则有.当时,估计比估计效果更好,否则估计比估计效果好。3.2假设检验考虑假设检验(2.10),我们用拉格朗日乘数算子法29构造了一种约束最小二乘估计量。(3.2)其中是维向量的拉格朗日乘数。约束估计量获得如下:(3.3)(3.4)其中和。 为了检验(2.10)中的零假设,我们定义我们提出的检验统计量为(3.5)直觉上,如果零假设为真,则的值很小。如果零假设不成立,那么和之间应该存在显著差异,并且值很大。这进一步表明零假设应该被拒绝。我们在下面的定理中给出了估计
35、量的渐近分布和检验统计的大样本性质。我们定义和定理4:假设满足定理3的条件,则有在(2.8)零假设条件下,我们有和,其中是自由度为1的独立标准卡方随机变量,而是矩阵的特征值,其中,是一个维单位矩阵。(b)在局部备择假设,常数下,我们有其中,而且渐近收敛到广义的卡方分布25,即:(3.6)其中服从多元正态分布。证明过程见附录。运用定理4,我们可以通过相合的估计和来获取权重,然后再利用的条件分布,其中是相合估计。但是,由于定理4中所得到的渐近方差非常复杂,特别是对于的有限样本估计可能不精确。因此,我们采用自助法26,27,28来模拟检验统计量的分布。基于自助法检验统计量计算临界值的步骤如下:步骤1
36、.计算(3.5)中定义的检验统计量。步骤2.生成次服从伯努利分布的变量,分别以概率取值。令,.步骤3.对于每个,使用自助法,通过以下公式重新计算自助法估计量和然后计算自助法检验统计量步骤4.我们计算自助法检验统计量,的分位数作为临界值。值得注意的是,步骤2中使用的自助法样本满足,并存在某正实数,使得。其中和分别表示自助法样本的期望和方差。为选择一个分别以概率取值的两点分布是采用30的建议。这两点分布满足,通常可以提高自助法方法的性能26。第 4 章 实验模拟分析在这一章节中,我们进行了数值模拟研究,以展示我们所提出的方法的性能。我们给出了三个例子,在下面的数值模拟中,我们均使用核。带宽和,根据
37、条件(C4)进行选择,由于欠平滑(,)对非参数估计是必要的,所以无法得到和的最优窗宽。欠平滑的结果是,非参数估计的偏差较小,并且排除了和,的最优窗宽。参数估计的渐近方差既不依赖于窗宽和,也不依赖于核函数。因此,我们可以使用Zhou et al.31提出的经验法则。即,为的样本偏差,此方法效果很好且易于实施。我们的数值经验表明,当我们围绕这个数据驱动窗宽移动几个值时,数值结果是稳定的。例 4.1.在这个例子中,考虑模型(4.1)我们进行了2000次重复实验,样本大小分别为和。在这个例子中,随机变量产生于一个三元正态分布,即,其中,。而扭曲变量服从均匀分布。在这里,的扭曲函数是,的扭曲函数是。模型
38、误差与相互独立,来自于,其中服从均匀分布。为了合理比较,我们考虑了最小乘积相对误差估计和最小二乘估计两种估计方法,并分别得到在模拟数据不带误差(利用真实的变量X,)和数据带扭曲测量误差(直接利用观察到的数据,)两种条件下的估计量。表1所展示的就是每一种估计方法得到的估计值所产生的均值、标准误差和均方误差。从表1中可以看到,在基于模拟数据不带误差情况下真实最小乘积相对误差估计量比最小二乘估计量表现好,因为与最小二乘估计的结果相比,最小乘积相对误差估计所产生的标准误差和均方误差较小,这与Chen et al.24所得的结果相同。虽然在基于模拟数据不带误差情况下真实最小乘积相对误差估计量比最小二乘估
39、计量表现好,但是,在数据带扭曲测量误差条件下,却得到相反的结论,因为最小二乘估计所产生的标准误差和均方误差都相对较小。此外,两种估计方法所得到的均值都接近真实值,并且标准误差和均方误差随着样本容量的增加而减小。表1:例1中平均值(M),标准误差(SD)和均方误差(MSE)的模拟结果,MSE值的单位刻度为10-3。n=300n=500MSDMSEMSDMSE1.00000.01910.36681.00000.01500.22681.00020.02100.44380.99960.01670.27981.00000.01870.34990.99990.01480.22050.98800.05523
40、.19930.99440.03671.37710.99250.05833.46350.99220.03961.63370.98990.04912.51580.99410.03491.25331.00000.01880.35551.00000.01480.21971.00020.02070.43050.99960.01640.27121.00000.01840.33920.99990.01460.21360.98700.09138.51650.99090.07475.66830.99350.100810.21140.99330.07936.33150.99000.08697.66270.9910
41、0.07035.0232例 4.2.针对模型(4.1),我们还分别考虑了在和条件下的约束估计量和,其中(即),(即)。这里的协变量,模型误差,扭曲变量,扭曲函数以及参数跟例4.1中的设定一样。我们依据模型(4.1),进行了2000次重复实验,样本大小分别为和。模拟结果如表2所示。从表2中我们可以看到,不管是在还是在条件下,约束估计量的均方误差的值都小于的,由此可见,在扭曲测量误差条件下并利用相同的约束条件,则约束最小二乘估计量比约束最小乘积相对误差估计量表现好。并且,两个约束条件下的约束估计量和的估计均值都接近参数的真值,且标准误差和均方误差随着样本容量的增加而减小。约束估计量和分别与表1中的
42、无约束估计量和相比,两个约束条件和都降低了均方误差的值,这就意味着约束条件和都提高了参数的估计有效性。总的来说,我们提出的方法的估计程序表现良好。表2:例2中约束估计量的均值(M),标准误差(SD)和均方误差(MSE)的模拟结果,MSE值的单位刻度为10-3。n=300n=500MSDMSEMSDMSE0.99070.03031.00770.99410.02070.46370.99070.03031.00770.99410.02070.46370.98690.04692.30870.99340.03451.23570.98950.05933.62620.99380.04381.95880.98
43、950.05933.62620.99380.04381.95880.99050.09817.43240.99330.08244.99310.99340.03921.58480.99610.02760.77670.98640.03041.10900.99120.02070.50750.99290.03691.41690.99510.02740.77850.99240.08036.51040.99540.06253.92750.98550.05703.46760.99100.04191.83690.99300.07926.32870.99550.06293.9823例 4.3.(假设检验)在这个例
44、子中,我们为模型(4.1)考虑以下假设检验问题(4.2)我们进行了 1000 次实验,样本大小分别为和。在每个功效函数模拟中,生成1000个自助法样本。在这个例子中,对于零假设,对于备择假设。 协变量,模型误差,扭曲变量和扭曲函数,与例4.1中的设定相同。对于检验问题(4.2),我们使用约束条件,比较两个检验统计量和的性能。模拟结果如表3所示。在表3中可以看出,随着值的增加,功效函数的值也急剧增加。且随着样本量的增加,功效函数的值增大并趋向于1,这表明检验统计量和对于这个检验问题来说是有效的。此外,在这个例子中对于给定的,比更有效。扭曲测量误差条件下的估计量的这种现象也出现在表1中。在基于模拟
45、数据不带误差情况下,由例4.1中表1可知,真实最小乘积相对误差估计量比最小二乘估计量表现好,这与Chen et al.24所得的结果相同。在数据带扭曲测量误差条件下,由例4.1中表1可知,最小二乘估计量比最小乘积相对误差估计量表现好;由例4.2中表2可知,约束最小二乘估计量比约束最小乘积相对误差估计量表现好;由例4.3中表3可知,对于给定的,检验统计量比更有效。由此可见扭曲测量误差破坏了Chen et al.24所提出的准则的良好估计特性。表3:例3中功效函数计算的模拟结果。n=300n=500显著性水平0.010.050.100.010.050.10Tn,lnc=0.000.0110.0530.1080.0120.0520.112c=0.050.2110.4130.5120.4600.6670.758c=0.100.7040.8500.8880.9380.9820.988c=0.150.9440.9750.9820.9930.9991.000c=0.200.9700.9900.9951.0001.0001.000Tn*c=0.000.0120.0560.1210.0110.0510.097c=0