《2018版高中数学人教B版选修1-2学案:第一单元 1.2 回归分析(一) .docx》由会员分享,可在线阅读,更多相关《2018版高中数学人教B版选修1-2学案:第一单元 1.2 回归分析(一) .docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、明目标、知重点1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.回归直线方程在回归直线方程 x中, , .其中xi,yi.(,)称为样本点的中心,回归直线过样本点的中心.2.相关系数(1)对于变量x与y随机抽到的n对数据(x1,y1),(x2,y2),(xn,yn),检测统计量是样本相关系数r.(2)相关系数r的取值范围是1,1,|r|值越大,变量之间的线性相关程度越高;|r|值越接近0,变量之间的线性相关程度越低.当|r|r0.05时,表明有95%的把握认为两个变量之间有线性相关关系.情境导学“名师出高徒”这句谚语的意思是什么?有名气的老师就
2、一定能教出厉害的学生吗?这两者之间是否有关?探究点一回归直线方程思考1两个变量之间的关系分几类?答分两类:函数关系,相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2什么叫回归分析?答回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.思考3对具有线性相关关系的两个变量进行回归分析有哪几个步骤?答基本步骤为画散点图,求回归直线方程,用回归直线方程进行预报.例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4
3、857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172 cm的女大学生的体重.解(1)画散点图选取身高为自变量x,体重为因变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线ybxa来近似刻画它们之间的关系.(2)建立回归方程由计算器可得 0.849, 85.712.于是得到回归直线方程为 0.849x85.712.(3)预报和决策当x172时, 0.84917285.71260.316(kg).即一名身高为172 cm的女大学生的体重预报值为60.
4、316 kg.反思与感悟在使用回归直线方程进行预报时要注意:(1)回归直线方程只适用于我们所研究的样本的总体;(2)我们所建立的回归直线方程一般都有时间性;(3)样本取值的范围会影响回归直线方程的适用范围;(4)不能期望回归直线方程得到的预报值就是预报变量的精确值.跟踪训练1某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 x ;(3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力.解(1)如图:(2)xiyi62831051261
5、58,9,4,x6282102122344, 0.7, 40.792.3,故线性回归方程为 0.7x2.3.(3)由(2)中回归直线方程,当x9时, 0.792.34,预测记忆力为9的同学的判断力约为4.探究点二相关性检验思考1给出n对数据,按照公式求出的回归直线方程,是否一定能反映这组成对数据的变化规律?答如果数据散点图中的点都大致分布在这条直线附近,这条直线就能反映这组成对数据的变化规律,否则求出的方程没有实际意义.思考2怎样定量确定两个变量的相关关系?答可以通过计算相关系数r来确定,若|r|r0.05,可以有95%的把握认为两个变量具有线性相关关系;若|r|r0.05,则没有理由认为两个
6、变量具有线性相关关系,此时寻找回归直线方程毫无意义.例2维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度(g/L)18202224262830缩醛化度(克分子%)26.8628.3528.7528.8729.7530.0030.36(1)画散点图;(2)求回归直线方程;(3)求相关系数r,并进行相关性检验.解(1)散点图如下图:(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算 , .
7、ixiyixi2xiyi11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80168202.944 1444 900.1624, 0.264 3, 0.264 32422.648,回归直线方程为 22.6480.264 3x.(3)yi25 892,r0.96.r0.96r0.050.754.有95%的把握认为“甲醛浓度与缩醛化度有关系”,求得的回归直线方程有意义.反思与感悟根据已知数据求得回归直线方程后,可以利用相关系数和临界
8、值r0.05比较,进行相关性检验.跟踪训练2为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2007年至2012年的情况,得到了下面的数据:年份200720082009201020112012x()24.429.632.928.730.328.9y(日)19611018(1)对变量x、y进行相关性检验;(2)据气象预测,该地区在2013年3月下旬平均气温为27,试估计2013年4月化蛹高峰日为哪天.解由已知条件可得下表:i123456xi24.429.632.928.730.328.9yi1961101829.13,7.5,i25 130.92,i25
9、63,iyi1 222.6(1)r0.934 1.查表知:r0.050.811.由|r|r0.05,可知变量y和x存在线性相关关系.(2)2.23,72.46.所以回归直线方程为2.23x72.46.当x27时,2.232772.4612.据此,可估计该地区2013年4月12日为化蛹高峰日.1.下列各组变量之间具有线性相关关系的是()A.出租车费与行驶的里程B.学习成绩与学生身高C.身高与体重D.铁的体积与质量答案C2.对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知n3,r0.995 0;n7,r0.953 3;n15,r0.301 2;n17,r0.499 1.则变量y
10、和x具有线性相关关系的是()A.和 B.和C.和 D.和答案C解析n3时,r0.050.997,所以|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系.n15时,r0.050.514,所以|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系.所以和满足题意.3.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归直线方程可能是()A. 10x200B. 10x200C. 10x200D. 10x200答案A解析由于销售量y与销售价格x成负相关,故排除B、D.又当x10时,A中y100,而C中y300,C不符合题意,故选A.4.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: 0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.答案0.254解析由题意知(0.254x0.321)0.254.呈重点、现规律1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.