《2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 章末小结与测评 .doc》由会员分享,可在线阅读,更多相关《2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 章末小结与测评 .doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归直线方程x来预报,利用公式求出回归系数,即可写出回归直线方程,并用回归直线方程进行预测说明典例1以下是某地收集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据对应的散点图;(2)若线性相关,求线性回归方程;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格 解:(1)数据对应的散点图如图所示(2)由散点图知y与x具有线性相关关系由表中数据知i109,i23.2,60 975,iyi12 952
2、.设所求回归直线方程为x,则0.196 2,1.814 2,故所求回归直线方程为0.196 2x1.814 2.(3)根据(2),当x150时,销售价格的估计值为0.19621501.814 231.244 2(万元)对点训练1随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程t;(2)用所求回归方程预测该地区2015年(t6)的人民币储蓄存款附:回归方程t中, .解:(1)列表计算如下:itiyittiyi115152264123
3、37921448163255102550153655120这里n5,i3,i7.2,又lttn25553210,ltyiyin 120537.212,从而1.2, 7.21.233.6,故所求回归方程为1.2t3.6.(2)将t6代入回归方程可预测该地区2015年的人民币储蓄存款为1.263.610.8(千亿元).对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行评价一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的R2(相关系数r)对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题典例2在研究
4、弹簧伸长长度y(cm)与拉力x(N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x/N51015202530y/cm7.258.128.959.9010.911.8若依据散点图及最小二乘法求出的回归直线方程为0.18x6.34,求R2,并结合残差说明拟合效果解:列表求值如下:xi51015202530yi7.258.128.959.9010.911.8xiyi36.2581.2134.25198272.5354x25100225400625900yii0.010.020.090.040.060.06yi2.241.370.540.411.412.3117.5,9.49,iyi1
5、 076.2,2 275,(yii)20.017 4,(yi)214.678 4.R210.998 81,回归模型拟合效果较好由表中数据可以看出残差比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高对点训练2从某大学中随机选取5名女大学生,其身高和体重数据如下表所示:编号12345身高x/cm165165157170175体重y/kg4857505464甲、乙两位同学在计算根据女大学生的身高预报体重的回归方程时,分别得到以下回归模型:甲:0.75x70;乙:0.76x71.试依据R2判定哪一个模型的拟合效果较好?解:对甲模型,yii与yi的值如下表:yii
6、5.753.252.253.52.75yi6.62.44.60.69.4所以(yii)2(5.75)23.2522.252(3.5)22.75268.5,(yi)2(6.6)22.42(4.6)2(0.6)29.42159.2.此时R210.57.对乙模型,yii与yi的值如下表:yii6.42.61.684.22yi6.62.44.60.69.4所以(yii)2(6.4)22.621.682(4.2)22272.2,(yi)2(6.6)22.42(4.6)2(0.6)29.42159.2.此时R210.55.因为0.570.55,所以甲模型的拟合效果较好.独立性检验就是根据采集的样本数据,利
7、用公式求出随机变量K2的观测值k,通过比较k与临界值k0的大小来确定两个分类变量是否有关系的方法典例3户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动总计男性5女性10总计50已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是.(1)请将上面的列联表补充完整;(2)求该公司男、女员工各多少人;(3)在犯错误的概率不超过0.005的前提下能否认为喜欢户外运动与性别有关?并说明你的理由下面的临界值表仅供参考:P(K2k0)0.150.100.050.0
8、250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd解:(1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是,所以喜欢户外运动的男女员工共30人,其中男员工20人,列联表补充如下:喜欢户外运动不喜欢户外运动总计男性20525女性101525总计302050(2)该公司男员工人数为2550650325(人),则女员工有325人(3)K2的观测值k8.3337.879,所以在犯错误的概率不超过0.005的前提下认为喜欢户外运动与性别有关对点训练3吃零食是中学生中普遍存在的现象,吃零食对学生身体发育
9、有诸多不利影响,影响学生的健康成长下表是性别与吃零食的列联表:男女总计喜欢吃零食51217不喜欢吃零食402868总计454085请问喜欢吃零食与性别是否有关?解:k,把相关数据代入公式,得k4.7223.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”(时间:120分钟,满分:150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1有下列关系:人的年龄与他拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的同一种树木,其横断面直径与高度之间的关系,其中有相
10、关关系的是()A BC D解析:选D曲线上的点与该点的坐标之间是确定关系函数关系,故不正确其余均为相关关系2对于回归分析,下列说法中错误的是()A在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定B相关系数可以是正的也可以是负的C回归分析中,如果R21,说明变量x与y之间是完全线性相关D样本相关系数r(,)解析:选D在回归分析中,样本相关系数r的范围是|r|1,故选D.3在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A两个分类变量关系较弱B两个分类变量无关系C两个分类变量关系较强D无法判断解析:选C从条形图中可以看出,在x1中y1比重明显大于x2中y1的比重
11、,所以两个分类变量的关系较强4设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()Ab与r的符号相同 Ba与r的符号相同Cb与r的符号相反 Da与r的符号相反解析:选A因为b0时,两变量正相关,此时r0;b0时,两变量负相关,此时r7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关12两个分类变量X和Y,值域分别为x1,x2和y1,y2,其样本频数分别是a10,b21,cd35.若X与Y有关系的可信程度不小于97.5%,则c等于()A3
12、B4 C5 D6附:P(K2k0)0.050.025k03.8415.024解析:选A列22列联表如下:x1x2总计y1102131y2cd35总计10c21d66故K2的观测值k5.024.把选项A,B,C,D代入验证可知选A.二、填空题(本大题共14小题,每小题5分,共20分,把答案填在题中横线上)13下面是一个22列联表:y1y2总计x1a2173x282533总计b46则表中ba_.解析:ba8.答案:814已知样本容量为11,计算得i510,i214,回归方程为0.3x,则_,_.(精确到0.01)解析:由题意得i46.36,i,因为0.3,所以0.3,可得5.55.答案:46.36
13、5.5515某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程x,其中2.现预测当气温为4时,用电量的度数约为_.气温x()1813101用电量y(度)24343864解析:由题意可知(1813101)10,(24343864)40,2.又回归直线2x过点(10,40),故60,所以当x4时,2(4)6068.答案:6816某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:读书健身总计女243155男82634总计325789在犯错误的概率不超过_的前提下性别与休闲方式有关系解析:由列联表中
14、的数据,得K2的观测值为k3.6892.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系答案:0.10三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17(本小题10分)x与y有如下五组数据,x123510y105422试分析x与y之间是否具有线性相关关系若有,求出回归直线方程;若没有,说明理由解:作出散点图,如图所示:由散点图可以看出,x与y不具有线性相关关系18(本小题12分)有两个分类变量x与y,其一组观测值如下面的22列联表所示:y1y2x1a20ax215a30a其中a,15a均为大于5的整数,则a取何值时,在犯错误的概
15、率不超过0.1的前提下认为x与y之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k2.706,而k.由k2.706得a7.19或a2.04.又a5且15a5,aZ,解得a8或9,故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系19(本小题 12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联
16、表:身高达标身高不达标总计经常参加体育锻炼40不经常参加体育锻炼15总计100(1)完成上表;(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?解:(1)填写列联表如下:身高达标身高不达标总计经常参加体育锻炼403575不经常参加体育锻炼101525总计5050100(2)由列联表中的数据,得K2的观测值为k1.3333.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系20(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:零件的个数x(个
17、)2345加工的时间y(小时)2.5344.5(1)在给定坐标系(如图)中画出表中数据的散点图;(2)求y关于x的线性回归方程x;(3)试预测加工10个零件需要的时间解:(1)散点图如图所示:(2)由表中数据得3.5,3.5,(xi)(yi)3.5,(xi)25,由公式计算得0.7,1.05,所以所求线性回归方程为0.7x1.05.(3)当x10时,0.7101.058.05,所以预测加工10个零件需要8.05小时21(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统
18、计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2k)0.1000.0500.0100.001k2.7063.8416.63510.82
19、8解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1
20、),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K21.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”22(本小题12分)在一段时间内,某种商品价格x(万元)和需求量y(t)之间的一组数据如下表:价格x1.41.61.822.2需求量1210753(1)画出散点图;(2)求出y对x的线性回归方程,并在(1)的图形上画出它的图象;(3)如果价格定为1.9万元,预测需求量大约是多少(结果精确到0.01 t)解:(1)散点图如图所示(2)1.8,7.4,iyi62,16.6,11.5,7.411.51.828.1.所以y对x的线性回归方程为11.5x28.1.画出图象如图(3)当价格定为1.9万元,即x1.9时,y11.51.928.16.25.所以商品价格定为1.9万元时,需求量大约是6.25t.