《《回归分析测试题》word版.doc》由会员分享,可在线阅读,更多相关《《回归分析测试题》word版.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 测试题1下列说法中错误的是( )A如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3, n)将散布在一条直线附近B如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。C设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数D为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系2在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是( )A B C D3回归直线必过点( )A(0,0) B C D4在画两个变量的散点图
2、时,下面叙述正确的是( )A预报变量在轴上,解释变量在轴上 B解释变量在轴上,预报变量在轴上 C可以选择两个变量中任意一个变量在轴上D可以选择两个变量中任意一个变量在轴上5两个变量相关性越强,相关系数r( )A越接近于0 B越接近于1 C越接近于1 D绝对值越接近16若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为( )A0 B1 C1 D1或17一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁)3456789身高(94.8104.2108.7117.8124.3130.8139.0 由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高, 则下面的叙述
3、正确的是( )A她儿子10岁时的身高一定是145.83 B她儿子10岁时的身高在145.83以上C她儿子10岁时的身高在145.83左右 D她儿子10岁时的身高在145.83以下8两个变量有线性相关关系且正相关,则回归直线方程中,的系数( )A B C D能力提升:9一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.033.143.263.363.50(1)画出散点图;(2)求每月产品的总成本y与该月产量x之间
4、的回归直线方程。10某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:产量x(千件)40424855657988100120140生产费用y(千元)150140160170150162185165190185(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为,求系数,。综合探究:11一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y与x之间的回归方程。温度x21232527293235产卵数y个711212466115325参考答案:基础达标:1B尽管两个
5、变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。2A由回归直线经过样本点的中心,由题中所给出的数据,将,代入中适合,故选A。3D回归直线,必然经过样本点的中心,其坐标为,故选D。4B5D6B7C8A9解析:(1)画出的散点图如图所示:(2), , 。 所以所求回归直线方程为。10解析:(1)制表:140150160022500600024214017641960058803481602304256007680455170302528900935056515042252250097506791626241262441279878818577
6、4434225162808100165100002722516500912019014400361002280010140185196003422525900合计777165770903277119132938 , , 即x与y的相关系数r0.808。(2)因为,所以可以认为x与y之间具有很强的线性相关关系。(3),。综合探究:11解析:散点图如图所示:由散点图可以看出:这些点分布在某一条指数函数的图象的周围。现在,问题变为如何估计待定参数c1和c2,我们可以通过对数变换把指数关系变为线性关系。令,则变换后样本点应该分布在直线(,)的周围。这样,就可以利用线性回归模型来建立y和x之间的非线性回
7、归方程了。由题中所给数据经变换后得到如下的数据表及相应的散点图x21232527293235z1.9462.3983.0453.1784.1904.7455.784由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。计算得,。设所示的线性回归方程为,则有,得到线性回归方程,因此红铃虫的产卵数对温度的非线性回归方程为。总结升华:(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能 直接利用线性回归方程来建立两个变量之间的关系。根据已有的函数知识,可以发现样本点分布 在一条指数函数曲线的周围,其中c1和c2是待定参数。(2)选择适当的
8、非线性回归方程。然后通过变量代换,将非线性回归方程化为线性回归方程,并由此 来确定非线性回归方程中的未知参数。(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有回归分析撰稿 吕宝珠 审稿 谷丹 责编:严春梅课程标准的要求回归分析的基本思想及其初步应用:(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;(3)理解线性回归模型;(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体 计算公式(5)了解解
9、释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和 ;了解样本的 数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样 本的各个点的随机误差的效应的平方和)的参数:残差平方和 ;了解表示解释变量效应的参数: 回归平方和;了解刻画回归效果的相关指数的含义及计算公式。 (有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的)(6)了解残差分析的方法及意义,会读或会作残差图重点和难点分析回归分析的基本思想及其初步应用。内容精讲1相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点
10、如下:相同点:均是指两个变量的关系。不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系2回归分析:一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析 的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图, 在图上看它们有无
11、关系,关系的密切程度,然后再进行相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意 义,否则,求出的回归直线方程毫无意义。3散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。4. 回归直线设所求的直线方程为,其中a、b是待定系数,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。5相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把= 叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关
12、程度. 6相关系数的性质:1,且越接近1,相关程度越大;且越接近0,相关程度越小.7显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每一次统计检验之前确定。8显著性检验:由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值0.05或0.01;例如时,0.050.754,0.010.874 求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当0.05或0.01,认为线性关系不显著。
13、典型例题:1一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:X1.081.121.191.281.361.481.591.681.801.871.982.07Y2.252.372.402.552.642.752.923.033.143.263.363.501)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程. 解析:i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.14
14、3.263.363.50xiyi2.432.2642.8563.2643.5904.074.6435.0905.6526.0966.6537.245,1)画出散点图:2) 在“相关系数检验的临界值表”查出与显著性水平0.05及自由度122=10相应的相关数临界值 r0.05=0.5760.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相 关关系。3)设回归直线方程, 利用, 计算a,b,得b1.215, , 回归直线方程为:2在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)施化肥量x15202530354045水稻产
15、量y3303453654054454504551)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。解析:1)画出散点图如下: 2)检验相关系数r的显著性水平: i1234567xi15202530354045yi330345365405445450455xiyi49506950912512150155751800020475, , 在“相关系数检验的临界值表”查出与显著性水平0.05及自由度72=5相应的相关数临界值 r0.05=0.7540.9733,这说明水稻产量与施化肥量之间存在线性相关关系。3)设回归直线方程,利用 计算a,b, 得 a=399
16、.34.7530257,则回归直线方程3已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计
17、每单位面积施肥150kg时, 每单位面积蔬菜的年平均产量。分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若则线性相关,否则不线性相关。解析:(1)列出下表,并用科学计算器进行有关计算:i1234567891011121314157074807885929095921081151231301381455.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0357444544608.4765938.490011401058118813571500.616251766.4188
18、5 , ,。 故蔬菜产量与放用氮肥量的相关系数 。 由于n=15,故自由度15-2=13。 由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值, 则, 从而说明蔬菜产量与氮肥量之间存在着线性相关关系。(2)设所求的回归直线方程为, 则, , 回归直线方程为。点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到,这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进行处理。4假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456
19、y2.23.85.56.57.0若由资料可知y对x呈线性相关关系。试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。解析:(1)列表如下:i12345234562.23.85.56.57.04.411.422.032.542.049162536, , , 于是, 。 线性回归方程为:。(2)当x=10时,(万元) 即估计使用10年时维修费用是12.38万元。点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的