《统计学一元线性回归课后知识题目解析.ppt》由会员分享,可在线阅读,更多相关《统计学一元线性回归课后知识题目解析.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一元线性回归课后习题讲解,-第九组,11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:,产量和费用存在正的线性相关系数,(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。,r=0.9202,2)计算产量与生产费用之间的线性相关系数。,1、提出假设:H0: ;H1: 0,2、计算检验的统计量,根据显著性水平0.05,查t分布表得t(n-2)=2.2281由于t=7.435453t(12-2)=2.2281,拒绝H0,产量与生产费用之间存在着显著的正线性相关关系,(3)对相关系数的显著性进行检验( 0.05),并说明二者之间的关系强度。,t(12-2)=2.2281,
2、11.2 学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,取得的数据如下:,复习时间和考试分数存在正的线性相关关系,要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。,r=0.8621,(2)计算相关系数,说明两个变量之间的关系强度。,11.3、根据一组数据建立的线性回归方程 要求: 1)解释截距 的意义。 1)解释斜率 的意义。 2)当=6时的E(y) 1)表示在没有自变量X的影响时其他各种因素对因变量Y的影响为10 2)斜率的意义在于:自变量X变化对Y影响程度。回归方程中,当
3、x增加一个单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=7,11.4 设SSR=36,SSE=4,n=18 要求:1)计算判定系数R2并解释其意义 回归直线对观测值的拟合程度为0.9,说明变量Y的变异性中有90%是由自变量x引起的。 2)计算估计标准误差 并解释其意义,表示实际值与估计值之间的差异程度是0.5,11.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车的运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下表:,(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态 (2
4、)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,根据图表显示,二者可能存在正线性相关关系,(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态,x与y的简单相关系数是0.9489,两变量之间呈现高度正相关关系,(2)计算线性相关系数,说明两个变量之间的关系强度,最小二乘估计:y = 0+ 1 x,将表中数据代入公式得:,y=0.118129 + 0.003585x,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,y关于x的回归方程为y=0.118129 + 0.003585x表示运输距离每增加1公
5、里,运送时间平均增加 0.003585天。,11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:,要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。,产量和生产费用之间存在着正的线性相关关系,(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。,说明两个变量之间高度相关,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,y = 734.6928 + 0.308683x,回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。,(4)计算判定系数,并解释其意义。,人均GDP对人
6、均消费的影响达到99.6%。,(5)检验回归方程线性关系的显著性(a=0.05)。,提出假设 H0:1=0 人均消费水平与人均GDP之间的线性关系不显著 计算检验统计量F,确定显著性水平=0.05,并根据分子自由度1和分母自由度7-2找出临界值F =6.61 作出决策:若FF ,拒绝H0,线性关系显著,(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。,某地区的人均GDP为5 000元,预测其人均消费水平为2278.1078元。,(7)求人均GDP为5 000元时,人均消费水平95的置信区间和预测区间。,解:已知n=7,t(7-2)=2.5706 置信区间为,人均GDP为5 00
7、0元时,人均消费水平95的 置信区间为1990.74915,2565.46399,1990.74915E(y)2565.46399,解:根据前面的计算结果,已知n=7,t(7-2)=2.5706 预测区间为,人均GDP为5 000元时,人均消费水平95的预测区间为1580.46315,2975.74999。,11.7随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,所得数据如下,二者之间为负的线性相关关系,1)绘制散点图,说明二者之间的股息形态,回归系数 =-4.7表示航班正点率每增加1%顾客投诉次数平均下降4.7次。,2)用航班正点率作自变量,建立估计的回归方程,并解释回
8、归系数的意义,t=4.7684t=2.201,拒绝H0,回归系数显著,提出假设 H0:b1 = 0 H1:b1 0 计算检验的统计量,3)检验回归系数的显著性(a=0.05),=2.201,解:已知n=10,t(10-2)=2.306 置信区间为,计算得,4)如果航班正点率为80%,估计顾客投诉次数,5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间,已知n=10,t(10-2)=2.306 预测区间为,计算得,11.8 下面是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。,11.9 某汽车生产商欲了
9、解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:,方差分析表,参数估计表,(1)完成上面的方差分析表。,SSR=SST-SSE= 1642866.67-40158.07=1602708.6 MSR=SSR/1= 1602708.6 MSE=SSE/10= 4015.807 F=MSR/MSE=399.1000065,(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?,汽车销售量的变差中有97.56%是由于广告费用的变动引起的,(3)销售量与广告费用之间的相关系数是多少?,(4)写出估计的回归方程并解释回归系数的实际意义。,回归系数的意义:广
10、告费用每增加一个单位, 汽车销量就增加1.42个单位。,(5)检验线性关系的显著性(a0.05)。,p=2.17E09,显著。,11.10 根据下面的数据建立回归方程,计算残差,判定R2,估计标准误差se,并分析回归方程的拟合程度。,残差,估计标准误差se,本题判定系数R2=0.937348,可以看出拟合程度好。,判定R2,11.11 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。 要检验x与y之间的线性关系是否显著,即检验假设:,。,(1)线性关系检验的统计量F值是多少?,解:(1)SSR的自由度为1;SSE的自由度为n-2=18; F=,=,=27,(2)给定显著性水平a
11、0.05,Fa是多少?,=,=4.41,(3)是拒绝原假设还是不拒绝原假设?,拒绝原假设,线性关系显著。,(4)假定x与y之间是负相关,计算相关系数r,r=,=,=0.7746,由于是负相关,因此r=-0.7746,(5)检验x与y之间的线性关系是否显著?,从F检验看线性关系显著。,F=,27,=4.41,11.12从n=20的样本中得到的有关回归结果是: y=5+3x, =1 =2,,要求 1)当x=4时,构建y的平均值的95%的置信区间,2)当x=4时,构建y的平均值的95%的预测区间,11.13 一家公司拥有多家子公司,公司的管理者想通过广告支出来估计销售收入,为此抽取了8家子公司,得到
12、广告支出和销售收入的数据如下(单位:万元),建立线性回归模型,当x=40万元时,构建销售收入95%的置信区间。,y0=-46.2918+15.23977x 当x=40万元时 E(y0)=-46.2918+15.23977*40=563.299 t/2=t0.025(6)=2.4469,置信区间为441.559 , 685.039,11.14从两个回归分析中得到的残差如下:,绘制残差图,你会得出什么结论。,回归1 :,观察图像可以看出,残差值基本上集中在两条平行线之间,表明对于所有值,方差都相同,所以认定其假定描述变量x和y之 间关系的回归模型是合理的。,回归2:,对于不同的x值残差相差也较大,
13、且其残差值基本上集中在两条曲线之间,这就意味着其违背了方差相等的,表明所选择 的回归模型不合理,应该考虑曲线回归或多元回归。,11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:,11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:,解:(1),(1)用广告费支出作自变量x,销售额作因变量y, 求出估计的回归方程。,(2)回归直线的F检验:,显著。,(2)检验广告费支出与销售额之间的线性关系是否显著(a0.05)。,广告费支出与销售额之间的线性关系显著,显著。,回归系数的t检验:,(3)绘制关于x的残差图,你觉得关于误差项的假定被满足了吗?,3).大约有95%的标准化残差在-22之间表明误差项假定的条件成立。从图中可以看出不满足这个条件,所以关于误差项的假定没有被满足。,(4)你是选用这个模型,还是另寻找一个更好的模型?,4).可考虑选用非线性模型,