《应用回归分析第2章课后习题参考复习资料.docx》由会员分享,可在线阅读,更多相关《应用回归分析第2章课后习题参考复习资料.docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.1一元线性回归模型有哪些根本假定?EMBEDEMBEDEquation.3答:1.解 释 变 量EMBED Equation.3Equation.3是非随机变量,观测值是常数。2.等方差及不相关的假定条件为这个条件称为高斯-马尔柯夫()条件,简称条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。3.正态分布的假定条件为估计在此条件下便可得到关于回归系数的最小二乘估计及的最小方差无的进一步结果,如它们分别是回归系数的最及偏估计等,并且可以作回归的显著性检验及区间估计。及样本容量4.通常为了便于数学
2、上的处理,还要求的个数要多于解释变量的个数。在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比拟深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进展处理。因此,线性回归模型的理论和应用是本书研究的重点。及方求出1.如何根据样本的估计;差2.对回归方程及回归系数的种种假设进展检验;3.如何根据回归方程进展预测和控制,以及如何进展实际问题的构造分析。2.2 考虑过原点的线性回归模型仍满足根本假定。求误差的最小二乘估计。答:即令的最小二乘估计为即解得EMBED Equation.KSEE3
3、)=(,Q(2.3 证明:EMBED Equation.KSEE3)2),)Q(,因为 Q(上可导,当 Q 取得最小值时,有)非负且在,而 Q(EMBEDEMBEDEquation.KSEE3即-2(EMBED Equation.KSEE3Equation.KSEE3)=0-2(=0EMBED Equation.KSEE3)EMBED+EMBEDEquation.KSEE3(又 EMBEDEMBED Equation.KSEE3Equation.KSEE3)=EMBED Equation.KSEE3=0,Equation.KSEE3=0即残差的期望为 0,残差以变量 x 的加权平均值为零2.4
4、 解:参数0,1 的最小二乘估计及最大似然估计在(0,2)1,2,n 的条件下等价。证明:因为所以其最大似然函数为使得L最大的,就是,的最大似然估计值。即使得下式最小:因为恰好就是最小二乘估计的目标函数一样。所以,在的条件下,参数0,1 的最小二乘估计及最大似然估计等价。2.是的无偏估计。证明:假设要证明是的无偏估计,那么只需证明E()=。因为,的最小二乘估计为其中E()()()()()()其中EMBED Equation.3由于=0,所以=EMBED Equation.3=)0又因为一元线性回归模型为所以 E()=0 所以E()()(=所以是的无偏估计。2.6 解:因为,联立 式,得到。EM
5、BED Equation.KSEE3因为,所以EMBED Equation.KSEE32.7 证明平方和分解公式:证明:2.8 验证三种检验的关系,即验证:1;2证明:1因为,所以又因为,所以故得证。2EMBED Equation.DSMT42.9 验证2.63式:证明:其中:是独立的随机变量注:各个因变量的无偏估计量是2.10 用第 9 题证明证明:注:2.11 验证证明:所以有以上表达式说明 r 及 F 等价,但我们要分别引入这两个统计量,而不是只引入其中一个。理由如下:r 及 F,n 都有关,且当 n 较小时,r 较大,尤其当 n 趋向于 2 时,趋向于 1,说明 x 及 y 的相关程度
6、很高;但当 n 趋向于 2 或等于 2 时,可能回归方程并不能通过 F 的显著性检验,即可能 x 及 y 都不存在显著的线性关系。所以,仅凭 r 较大并不能断定 x 及 y 之间有密切的相关关系,只有当样本量 n 较大时才可以用样本相关系数 r 判定两变量间的相关程度的强弱。F 检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线及回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12 如果把自变量观测值都乘以 2,回归参数的最小二乘法估计和会发生什么变化?如果把自变量观测值都加上 2,回归参数的最小二乘估计和会发生什么变化?解:解法一:我们知道当,时,用最小
7、二乘法估计的和分别为当时有将带入得到当时有将带入得到解法二:当,时,有当时当,由最小二乘法可知,离差平方和时,其估计值应当有。即回归参数的最小二乘估计和在自变量观测值变化时不会变。2.13 如果回归方程相应的相关系数 r 很大,那么用它预测时,预测误差一定较小。这一结论能成立吗?对你的答复说明理由。解:这一结论不成立。因为相关系数 r 表示 x 及线性关系的密切程度,而它接近 1 的程度及数据组数有关。n 越小,r 越接近1。2 时,1。因此仅凭相关系数说明 x 及 有密切关系是不正确的。只有在样本量较大时,用相关系数 r 判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。2.14
8、解:1散点图为:2x 及 y 大致在一条直线上,所以 x 及 y 大致呈线性关系。3得到计算表:所以回归方程为:=4所以,EMBED的置信区间为,5因为Equation.KSEE3;XY1104100206-142-4221011001013-7232320000200042010027727254044004034142-62和15100和 10600和 70和100490110均3均20均 20的置信区间为,所以,同理,因为。查表知,的置信区间为。的置信区间为,所以,6决定系数7计算得出,方差分析表如下:查表知,F0.05(1,3)=10.13,F 值F0.05(1,3),故拒绝原假设,说
9、明回归方程显著。)8(做回归系数1 的显著性检验EMBED Equation.DSMT4计算 t 统计量:查表知,所以,tt0.05/2(3),所以承受原假设,说明 x 和 Y 有显著的线性关系。方差来源平方和自由度均方F 值4901490110360049做相关系数 r 的显著性检验:因为所以,相关系数因为查表知,2 等于 3 时,%的值为 0.959,%的值为 0.878。所以,%,故 x 及 y 有显著的线性关系。10残差表为:残差图为:11当 X0=4.2 时,,即为:17.1,其 95%的置信区间近似为39.7。序号残差111064221013-33320200442027-75540346