《高考数学一轮复习 9.4 用样本估计总体与变量间的相关关系精品课件 文 新人教A.ppt》由会员分享,可在线阅读,更多相关《高考数学一轮复习 9.4 用样本估计总体与变量间的相关关系精品课件 文 新人教A.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学案学案4 4 用样本估计总体与用样本估计总体与 变量间的相关关系变量间的相关关系2021/8/11 星期三1填填知学情填填知学情填填知学情填填知学情课内考点突破课内考点突破课内考点突破课内考点突破规规规规 律律律律 探探探探 究究究究考考考考 纲纲纲纲 解解解解 读读读读考考考考 向向向向 预预预预 测测测测2021/8/11 星期三2考考考考 纲纲纲纲 解解解解 读读读读1.用样本估计总体(1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差(不要求记忆公式).(3)能从样本数据中提取基本
2、的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.2.变量的相关性(1)会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).返回目录返回目录 2021/8/11 星期三3 2012年高考年高考,试题难度仍以中低档题为主试题难度仍以中低档题为主.对总体分布对总体分布的估计、线性回归很可能在选
3、择、填空题中考查的估计、线性回归很可能在选择、填空题中考查.对于频对于频率分布直方图率分布直方图,求线性回归方程以及回归分析、独立性检求线性回归方程以及回归分析、独立性检验与假设检验等,由于计算量大,因此考解答题的可能验与假设检验等,由于计算量大,因此考解答题的可能性不大,但也不排除给出数据、公式,以选择题形式考性不大,但也不排除给出数据、公式,以选择题形式考查查.考考考考 向向向向 预预预预 测测测测返回目录返回目录 2021/8/11 星期三4 1.1.用样本的频率分布估计总体分布用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图)频率分布表与频率分布直方图 频率分布表和频率分
4、布直方图,是从各个小组数据频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占在样本容量中所占 的角度,来的角度,来表示数据分布规律,它可以使我们看到整个样本数据的表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况频率分布情况.比例大小比例大小 返回目录返回目录 2021/8/11 星期三5 (2)频率分布折线图)频率分布折线图 连接频率分布直方图中各小长方形连接频率分布直方图中各小长方形 ,就得到频率分布折线图,就得到频率分布折线图.(3)总体密度曲线)总体密度曲线 总体密度曲线反映了总体在各个范围内取值的百分比,总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提
5、供更加精细的信息它能给我们提供更加精细的信息.(4)茎叶图)茎叶图 2.2.用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数)众数、中位数、平均数上端的中点上端的中点 返回目录返回目录 2021/8/11 星期三6 众数:在样本数据中,频率分布最大值所对应的样本众数:在样本数据中,频率分布最大值所对应的样本 数数 据;据;中位数:样本数据中,累积频率为中位数:样本数据中,累积频率为0.5时所对应的样本时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);值点的累积频
6、率);平均数:样本数据的算术平均数,即平均数:样本数据的算术平均数,即x=.(2)标准差的计算公式:标准差的计算公式:s=.3.从散点图上看,点散布在从散点图上看,点散布在 就称这种相关关系为正相关,如果点散布在就称这种相关关系为正相关,如果点散布在从左下角到右上角的区域内从左下角到右上角的区域内 从左上角到右下从左上角到右下 角的区域内角的区域内 就称这种相关关系为负相关就称这种相关关系为负相关.返回目录返回目录 2021/8/11 星期三7 4.如果散点图中点的分布从整体上看大致在一条直如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线附近,我们就称这两个变量之
7、间具有 ,这条直线叫做回归直线,回归直线方程常记作,这条直线叫做回归直线,回归直线方程常记作 .5.对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),用最小二乘法,求回归直线系数用最小二乘法,求回归直线系数a,b的公式为的公式为 b=,a=.其中其中,x=,y=.y-bx线性相关关系线性相关关系 返回目录返回目录 2021/8/11 星期三8 通过求通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样的最小值而得出回归直线的方法,即求回归直线,使得样本本 数数 据的点到它的距离的平方和最小,这一方法叫做最据的点到它的距离的平方和
8、最小,这一方法叫做最 小二乘法小二乘法.(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2 返回目录返回目录 2021/8/11 星期三92010年高考安徽卷某市年高考安徽卷某市2010年年4月月1日日4月月30日对空日对空气污染指数的监测数据如下气污染指数的监测数据如下(主要污染物为可吸入颗粒物主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.考点考点考点考点1 1 绘制频率分布直方图绘制频率分布直方图绘制频率分
9、布直方图绘制频率分布直方图返回目录返回目录 2021/8/11 星期三10【分析】【分析】按要求列表、绘图按要求列表、绘图,用样本的分布估计总体的分布用样本的分布估计总体的分布.(1)完成频率分布表完成频率分布表;(2)作出频率分布直方图作出频率分布直方图;(3)根据国家标准根据国家标准,污染指数在污染指数在050之间时之间时,空气质量为优空气质量为优;在在51100之间时之间时,为良为良;在在101150之间时之间时,为轻微污染为轻微污染;在在151200之间时之间时,为轻度污染为轻度污染.请你依据所给数据和上述标准请你依据所给数据和上述标准,对该市的空气质量给出一对该市的空气质量给出一个简
10、短评价个简短评价.返回目录返回目录 2021/8/11 星期三11分组分组频数频数频率频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,111)2【解析】【解析】【解析】【解析】(1)(1)频率分布表如下频率分布表如下频率分布表如下频率分布表如下:返回目录返回目录 2021/8/11 星期三12 (2)频率分布频率分布 直方图如图直方图如图.返回目录返回目录 2021/8/11 星期三13 (3)答对下述两条中的一条即可答对下述两条中的一条即可:该市一个月中空气污染指数有该市一个月中空气污染指数有2天处于优的水平天处于优的水平,占占当月天数的当
11、月天数的 ;有有26天处于良的水平天处于良的水平,占当月天数的占当月天数的 ;处于优或良的天数为处于优或良的天数为28,占当月天数的占当月天数的 .说明该市空说明该市空气质量基本良好气质量基本良好.轻微污染有轻微污染有2天天,占当月天数的占当月天数的 ;污染指数在污染指数在80以上的接近轻微污染的天数以上的接近轻微污染的天数15,加上处于轻微污染的天数加上处于轻微污染的天数17,占当月天数的占当月天数的 ,超过,超过50%;说明该市空气质量有待说明该市空气质量有待进一步改善进一步改善.返回目录返回目录 2021/8/11 星期三14 (1)列频率分布表时要注意区分频数、频率的意义列频率分布表时
12、要注意区分频数、频率的意义.(2)画频率分布直方图时要注意纵、横坐标代表的意画频率分布直方图时要注意纵、横坐标代表的意义及单位义及单位.(3)通过本题可以掌握总体分布估计的各种常见步骤通过本题可以掌握总体分布估计的各种常见步骤和方法和方法.(4)解决总体分布估计问题的一般步骤如下解决总体分布估计问题的一般步骤如下:先确定分组的组数先确定分组的组数;分别计算各组的频数及频率分别计算各组的频数及频率(频率频率=);画出频率分布直方图画出频率分布直方图,并作出相应的估计并作出相应的估计.频数频数总数总数返回目录返回目录 2021/8/11 星期三15对某电子元件进行寿命追踪调查对某电子元件进行寿命追
13、踪调查,情况如下情况如下:(1)列出频率分布表列出频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)估计电子元件寿命在估计电子元件寿命在100,400)以内的概率以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400 h以上的概率以上的概率.寿命寿命(h)100,200)200,300)300,400)400,500)500,600)个数个数(个个)2030804030返回目录返回目录 2021/8/11 星期三16寿命(寿命(h)频频 数数频频 率率100,200)200.10200,300)300.15300,400)800.40400,500)400.20500,600
14、)300.15合合 计计2001.00【解析】【解析】(1)样本频率分布表如下样本频率分布表如下:返回目录返回目录 2021/8/11 星期三17(2)频率分布直方图如图频率分布直方图如图(3)由频率分布表可以看出由频率分布表可以看出,寿命在寿命在100,400)内的电子元内的电子元件出现的频率为件出现的频率为0.65,所以我们估计电子元件寿命在所以我们估计电子元件寿命在100,400)内的概率为内的概率为0.65.(4)由频率分布表可知由频率分布表可知,寿命在寿命在400 h以上的电子元件出现以上的电子元件出现的频率为的频率为0.20+0.15=0.35,故我们估计电子元件寿命在故我们估计电
15、子元件寿命在400 h以上的概率为以上的概率为0.35.返回目录返回目录 2021/8/11 星期三18考点考点考点考点2 2 频率分布直方图的应用频率分布直方图的应用频率分布直方图的应用频率分布直方图的应用2010年高考陕西卷为了解学生身高情况,某校以年高考陕西卷为了解学生身高情况,某校以10%的比例对全校的比例对全校700名学生按性别进行分层抽样调查,名学生按性别进行分层抽样调查,测得身高情况的统计图如图:测得身高情况的统计图如图:(1)估计该校男生的人数;)估计该校男生的人数;(2)估计该校学生身高在)估计该校学生身高在170185 cm之间的概率;之间的概率;(3)从样本中身高在)从样
16、本中身高在180190 cm之间的男生中任选之间的男生中任选2人,求至少有人,求至少有1人身高在人身高在185190 cm之间的概率之间的概率.返回目录返回目录 2021/8/11 星期三19 【解析】【解析】(1)样本中男生人数为)样本中男生人数为40,由分层抽样比例,由分层抽样比例为为10%估计全校男生人数为估计全校男生人数为400.(2)由统计图知)由统计图知,样本中身高在样本中身高在170185 cm之间的学之间的学生有生有14+13+4+3+1=35(人人),样本容量为样本容量为70,所以样本中学生所以样本中学生身高在身高在170185 cm之间的频率之间的频率f=0.5.故由故由f
17、估计该校学估计该校学生身高在生身高在170185 cm之间的概率之间的概率p=0.5.【分析】【分析】在频率直方图中在频率直方图中,频率等于矩形的面积频率等于矩形的面积,每一小每一小组的频率等于这小组的频数与样本容量的商组的频率等于这小组的频数与样本容量的商.返回目录返回目录 2021/8/11 星期三20 (3)样本中身高在)样本中身高在180185 cm之间的男生有之间的男生有4人,设其编号为人,设其编号为,样本中身高在,样本中身高在185190 cm之间的男生有之间的男生有2人,设其编号为人,设其编号为.从上述从上述6人中任选人中任选2人的树状图为:人的树状图为:故从样本中身高在故从样本
18、中身高在180190 cm之间的男生中任选之间的男生中任选2人的所有可能结果数为人的所有可能结果数为15,至少有,至少有1人身高在人身高在185190 cm之间的可能结果数为之间的可能结果数为9.因此,所求概因此,所求概率率p2=.返回目录返回目录 2021/8/11 星期三21 解决该类问题时应正确理解图表中各个量的意义解决该类问题时应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键识图掌握信息是解决该类问题的关键.频率分布指的频率分布指的是一个样本数据在各个小范围内所占比例的大小是一个样本数据在各个小范围内所占比例的大小,一一般用频率分布直方图反映样本的频率分布般用频率分布直方
19、图反映样本的频率分布.其中其中,频频率分布直方图中纵轴表示率分布直方图中纵轴表示 ,频率频率=;频率分布直方图中频率分布直方图中,各小长方形的面积之和为各小长方形的面积之和为1,因因此在频率分布直方图中此在频率分布直方图中,组距是一个固定值组距是一个固定值,所以长方形所以长方形高的比也就是频率之比高的比也就是频率之比;频率分布表和频率分布直方频率分布表和频率分布直方 图是一组数据频率分布的两种形式图是一组数据频率分布的两种形式,前者准确前者准确,后者直观后者直观;众数为最高矩形的中点众数为最高矩形的中点;中位数为平分频率分布中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标直方
20、图面积且垂直于横轴的直线与横轴交点的横坐标.频率频率组距组距频数频数样本容量样本容量返回目录返回目录 2021/8/11 星期三222010年高考湖北卷为了了解一个小水库中养殖的鱼的年高考湖北卷为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出有关情况,从这个水库中多个不同位置捕捞出100条鱼,称条鱼,称得每条鱼的质量(单位:得每条鱼的质量(单位:km),并将所得数据分组,画出),并将所得数据分组,画出频率分布直方图(如图所示)频率分布直方图(如图所示).返回目录返回目录 2021/8/11 星期三23(1)在下面表格中填写相应的频率;)在下面表格中填写相应的频率;分分 组
21、组频频 率率1.00,1.05)1.05,1.10)1.10,1.15)1.15,1.20)1.20,1.25)1.25,1.30)返回目录返回目录 2021/8/11 星期三24(2)估计数据落在)估计数据落在1.15,1.30)中的概率为多少;中的概率为多少;(3)将上面捕捞的)将上面捕捞的100条鱼分别作一记号后再放回水库条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出几天后再从水库的多处不同位置捕捞出120条鱼,其中条鱼,其中带有记号的鱼有带有记号的鱼有6条条.请根据这一情况来估计该水库中鱼请根据这一情况来估计该水库中鱼的总条数的总条数.【解析】【解析】(1)根据频率分
22、布直方图可知,频率)根据频率分布直方图可知,频率=组距组距(频率频率/组距),故可得下表:组距),故可得下表:返回目录返回目录 2021/8/11 星期三25 (2)0.30+0.15+0.02=0.47,所以数据落在所以数据落在1.15,1.30)中的概率约为中的概率约为0.47.(3)=2 000,所以水库中鱼的总条数约为,所以水库中鱼的总条数约为2 000.分组分组频率频率1.00,1.05)0.051.05,1.10)0.201.10,1.15)0.281.15,1.20)0.301.20,1.25)0.151.25,1.30)0.02返回目录返回目录 2021/8/11 星期三26甲
23、、乙两台机床同时加工直径为甲、乙两台机床同时加工直径为10mm的零件,为了检验的零件,为了检验产品的质量产品的质量,从产品中各随机抽取从产品中各随机抽取6件进行测量件进行测量,测得数据测得数据如下如下(单位单位:mm)甲甲:99,100,98,100,100,103乙乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差分别计算上述两组数据的平均数和方差;(2)根据根据(1)的计算结果的计算结果,说明哪一台机床加工的这种零件说明哪一台机床加工的这种零件 更符合要求更符合要求.考点考点考点考点3 3 用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字
24、特征用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征返回目录返回目录 2021/8/11 星期三27 两个机床加工零件的平均数相等两个机床加工零件的平均数相等,平均数描述了数平均数描述了数据的平均水平据的平均水平,要说明哪一台机床加工的零件更符合要要说明哪一台机床加工的零件更符合要求求,可再用方差来判断可再用方差来判断.平均数和标准差超过了规定界平均数和标准差超过了规定界限时限时,说明这批产品质量与生产要求有较大偏差说明这批产品质量与生产要求有较大偏差.返回目录返回目录 2021/8/11 星期三28甲、乙两种冬小麦试验品种连续甲、乙两种冬小麦试验品种连续x年的平均单位面积
25、产年的平均单位面积产量如下:量如下:试根据这组数据试根据这组数据,估计哪一种小麦品种产量较稳定估计哪一种小麦品种产量较稳定.品种品种第第1 1年年第第2 2年年第第3 3年年第第4 4年年第第5 5年年甲甲9.89.89.99.910.110.1101010.210.2乙乙9.49.410.310.310.810.89.79.79.89.8返回目录返回目录 2021/8/11 星期三29 甲甲品种的样本平均数为品种的样本平均数为10,样本方差为,样本方差为 (9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)25=0.02;乙品种的样本平均数也是乙
26、品种的样本平均数也是10,样本方差为,样本方差为 (9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)25=0.240.02.所以,由这组数据可以认为甲种小麦的产量比乙种小麦所以,由这组数据可以认为甲种小麦的产量比乙种小麦的产量较稳定的产量较稳定.返回目录返回目录 2021/8/11 星期三30某化肥厂甲、乙两个车间包装肥料,在自动包装传送某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔带上每隔30min抽取一包产品,称其重量,分别记录抽抽取一包产品,称其重量,分别记录抽查数据如下:查数据如下:甲:甲:102,101,99,98,103,9
27、8,99;乙:乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示将这两组数据用茎叶图表示:(3)将两组数据比较将两组数据比较,说明哪个车间产品较稳定说明哪个车间产品较稳定.考点考点考点考点4 4 茎叶图茎叶图茎叶图茎叶图 返回目录返回目录 2021/8/11 星期三31 【解析】【解析】【解析】【解析】(1)因为间隔时间相同因为间隔时间相同,故是系统抽样故是系统抽样.(2)茎叶图如图所示茎叶图如图所示:【分析】【分析】【分析】【分析】(1)根据各种抽样的特点判断根据各种抽样的特点判断.(2)求出两组数据的平均值与
28、方差进行比较求出两组数据的平均值与方差进行比较.返回目录返回目录 2021/8/11 星期三32(3)甲车间甲车间:平均值平均值:x1=(102+101+99+98+103+98+99)=100.方差方差:=(102-100)2+(101-100)2+(99-100)23.4286.乙车间乙车间:平均值平均值:x2=(110+115+90+85+75+115+110)=100,方差方差:=(110-100)2+(115-100)2+(110-100)2228.5714.x1=x2,甲车间产品稳定甲车间产品稳定.返回目录返回目录 2021/8/11 星期三33 (1)茎叶图的优点是保留了原始数据
29、茎叶图的优点是保留了原始数据,便于记录便于记录及表示及表示,能反映数据在各段上的分布情况能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况茎叶图不能直接反映总体的分布情况,这就需要这就需要通过茎叶图给出的数据求出数据的数字特征通过茎叶图给出的数据求出数据的数字特征,进一步进一步估计总体情况估计总体情况.返回目录返回目录 2021/8/11 星期三34某中学高一某中学高一(2)班甲、乙两名同学自高中以来每场数学考试班甲、乙两名同学自高中以来每场数学考试成绩情况如下:成绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107
30、;乙的得分乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩茎叶图画出两人数学成绩茎叶图.请根据茎叶图对两人的成绩进行请根据茎叶图对两人的成绩进行比较比较.返回目录返回目录 2021/8/11 星期三35甲、乙甲、乙两人数学成绩的茎叶图如图两人数学成绩的茎叶图如图 从这个茎叶图上可以看出从这个茎叶图上可以看出,乙同学的得分情况是大致乙同学的得分情况是大致对称的对称的,中位数是中位数是98;甲同学的得分情况除一个特殊得分外甲同学的得分情况除一个特殊得分外,也大致对称也大致对称,中位数是中位数是88.因此乙同学发挥比较稳定因此乙同学发挥比较稳定,总体
31、总体得分情况比甲同学好得分情况比甲同学好.返回目录返回目录 2021/8/11 星期三36关于人体的脂肪含量(百分比)和年龄关系的研究中,关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据得到如下一组数据.判断它们是否有相关关系判断它们是否有相关关系.考点考点考点考点5 5 利用散点图判定相关关系利用散点图判定相关关系利用散点图判定相关关系利用散点图判定相关关系 【分析】【分析】【分析】【分析】本题涉及两个变量:年龄与脂肪含量,可本题涉及两个变量:年龄与脂肪含量,可以以年龄为自变量,考查脂肪含量的变化趋势,而分以以年龄为自变量,考查脂肪含量的变化趋势,而分析相关关系通常借助散点图
32、析相关关系通常借助散点图.年年龄龄23232727393941414545494950505151脂脂肪肪9.59.517.17.8 821.21.2 225.25.9 927.27.5 526.26.3 328.28.2 229.29.6 6返回目录返回目录 2021/8/11 星期三37 【解析】【解析】【解析】【解析】以年龄作为以年龄作为x轴,脂肪含量作为轴,脂肪含量作为y轴,可得轴,可得相应散点图如图所示相应散点图如图所示:由散点图可知,两者之间具有相关关系由散点图可知,两者之间具有相关关系.返回目录返回目录 2021/8/11 星期三38 判断有无相关关系,一种常用的简便方法就是绘判
33、断有无相关关系,一种常用的简便方法就是绘制散点图制散点图.返回目录返回目录 2021/8/11 星期三39已知已知10只狗的血球体积及红血球数的测量值如下表:只狗的血球体积及红血球数的测量值如下表:x:x:血球体积(mm(mm3 3)y:y:红血球数(百万)45456.536.5342426.306.3046469.529.5248487.507.5042426.996.9935355.905.9058589.499.4940406.206.20返回目录返回目录 2021/8/11 星期三40(1)将表中的数据画成散点图)将表中的数据画成散点图;(2)你能从散点图中发现狗的血球体积与红血球数近
34、似)你能从散点图中发现狗的血球体积与红血球数近似 成什么关系吗?成什么关系吗?(3)如果近似成线性相关关系的话,请画出一条直线来)如果近似成线性相关关系的话,请画出一条直线来 近似地表示这种线性相关关系近似地表示这种线性相关关系.返回目录返回目录 2021/8/11 星期三41(1)画出的散点图如图所示)画出的散点图如图所示.(2)由散点图可以看出:狗的血球体积与红血球数近)由散点图可以看出:狗的血球体积与红血球数近 似成线性相关关系似成线性相关关系.(3)如图中的直线)如图中的直线.返回目录返回目录 2021/8/11 星期三42假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维
35、修费用和所支出的维修费用y(万万元元)有如下的统计资料有如下的统计资料:(1)线性回归方程线性回归方程y=bx+a的回归系数的回归系数a,b;(2)估计使用年限为估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?考点考点考点考点6 6 求线性回归直线求线性回归直线求线性回归直线求线性回归直线 若由资料知若由资料知,y与与x呈线性相关关系呈线性相关关系.试求:试求:使用年限使用年限x23456维修费用维修费用y2.23.85.56.57.0 返回目录返回目录 2021/8/11 星期三43 【解析】【解析】【解析】【解析】(1)制表如下)制表如下:【分析】【分析】【分析】【分析】本题
36、已知本题已知x与与y之间有线性相关关系,就无需之间有线性相关关系,就无需进行相关检验进行相关检验.i i1 12 23 34 45 5合计合计xi2 23 34 45 56 62020yi2.22.23.83.85.55.56.56.57.07.02525xiyi4.44.411.411.422.022.032.532.542.042.0112.3112.34 49 91616252536369090 x=4;y=5;返回目录返回目录 2021/8/11 星期三44于是有于是有b=;a=y-bx=5-1.234=0.08.(2)回归直线方程是回归直线方程是:y=1.23x+0.08,当当x=1
37、0年时年时,y=1.2310+0.08=12.3+0.08=12.38(万万元元),即估计使用即估计使用10年时,维修费用是年时,维修费用是12.38(万元万元).返回目录返回目录 2021/8/11 星期三45 由本题中由本题中y对对x的关系呈线性关系,故可用一元线的关系呈线性关系,故可用一元线 性性 相关的方法解决问题相关的方法解决问题.(1)利用公式利用公式:来计算回归系来计算回归系数,有时为了方便常制表对应出数,有时为了方便常制表对应出xiyi,,以利于求和,以利于求和.(2)获得直线方程后,取获得直线方程后,取x=10,即得所求即得所求.(3)求线性回归方程的计算量大,解题时可借助计
38、算器,求线性回归方程的计算量大,解题时可借助计算器,列出表格,再按分析时的步骤进行列出表格,再按分析时的步骤进行.(4)本题是一个应用问题,其实就是求出回归直线方程,本题是一个应用问题,其实就是求出回归直线方程,通过回归方程来分析使用年限与维修费用之间的关系通过回归方程来分析使用年限与维修费用之间的关系.返回目录返回目录 2021/8/11 星期三46一般说来一般说来,一个人的身高越高一个人的身高越高,他的手就越大他的手就越大.为调查这为调查这一问题一问题,对对10名高三男生的身高与右手一扎长测量得到名高三男生的身高与右手一扎长测量得到如下一组数据如下一组数据(单位单位:cm)(1)画出散点图
39、,你能发现两者有相关关系吗?画出散点图,你能发现两者有相关关系吗?(2)如果有相关关系如果有相关关系,求回归直线方程求回归直线方程;(3)如果一个学生身高如果一个学生身高185cm,估计他的右手一扎长估计他的右手一扎长.身高168168170170171171172172174174176176178178178178180180181181一扎长19.19.0 020.20.0 021.21.0 021.21.5 521.21.0 022.22.0 024.24.0 023.23.0 022.22.5 523.23.0 0返回目录返回目录 2021/8/11 星期三47(1)散点图如下散点图
40、如下:由散点图可以发现由散点图可以发现,身高与右手一扎长之间的总体趋势成一身高与右手一扎长之间的总体趋势成一条直线条直线,所以它们线性相关所以它们线性相关.返回目录返回目录 2021/8/11 星期三48 (2)设回归直线方程为设回归直线方程为y=bx+a,将上述数据利用计算将上述数据利用计算器计算得器计算得 x=174.8,y=21.7,利用公式求得利用公式求得b0.303,a=y-bx-31.264.因此所求回归直线方程为因此所求回归直线方程为y=0.303x-31.264.(3)当当x=185时,时,y=24.791.返回目录返回目录 2021/8/11 星期三49 1.1.牢记画频率分
41、布直方图的步骤牢记画频率分布直方图的步骤牢记画频率分布直方图的步骤牢记画频率分布直方图的步骤:(1)(1)先确定分组的组数,其方法是:最大数据与最小先确定分组的组数,其方法是:最大数据与最小先确定分组的组数,其方法是:最大数据与最小先确定分组的组数,其方法是:最大数据与最小 数据之差除以组距得组数数据之差除以组距得组数数据之差除以组距得组数数据之差除以组距得组数.(2)(2)计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率=.=.(3)(3)画出直方图,同时要注意频率分布直方图的含义画出直方图,同时要注意频率分布直方图的含
42、义画出直方图,同时要注意频率分布直方图的含义画出直方图,同时要注意频率分布直方图的含义.2.2.利用频率分布直方图估计样本的数字特征:利用频率分布直方图估计样本的数字特征:利用频率分布直方图估计样本的数字特征:利用频率分布直方图估计样本的数字特征:(1)(1)众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中,就是最高矩就是最高矩就是最高矩就是最高矩 形的中点的横坐标形的中点的横坐标形的中点的横坐标形的中点的横坐标.频数频数频数频数总数总数总数总数返回目录返回目录 2021/8/11 星期三50 (2)(2)在频率分
43、布直方图中在频率分布直方图中在频率分布直方图中在频率分布直方图中,中位数左边和右边的直中位数左边和右边的直中位数左边和右边的直中位数左边和右边的直方方方方 图的面积应该相等图的面积应该相等图的面积应该相等图的面积应该相等,由此可以估计中位数的值由此可以估计中位数的值由此可以估计中位数的值由此可以估计中位数的值.(3)(3)平均数是频率分布直方图的平均数是频率分布直方图的平均数是频率分布直方图的平均数是频率分布直方图的“重心重心重心重心”,等于频率,等于频率,等于频率,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的分布直方图中每个小矩形的面积乘以小矩形底边中点的分布直方图中每个小矩形的
44、面积乘以小矩形底边中点的分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和横坐标之和横坐标之和横坐标之和.(4)(4)一组数据中的众数可能不止一个一组数据中的众数可能不止一个一组数据中的众数可能不止一个一组数据中的众数可能不止一个,而中位数是唯而中位数是唯而中位数是唯而中位数是唯一的一的一的一的,如果数据的个数为偶数如果数据的个数为偶数如果数据的个数为偶数如果数据的个数为偶数,那么那么那么那么,最中间两个数据的最中间两个数据的最中间两个数据的最中间两个数据的平均数是这组数据的中位数平均数是这组数据的中位数平均数是这组数据的中位数平均数是这组数据的中位数.返回目录返回目录 2021/8/
45、11 星期三51 3.3.分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义.平均平均平均平均数反映的是数据的平均水平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的程度,标准差越小程度
46、,标准差越小程度,标准差越小程度,标准差越小,表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的两边越分散两边越分散两边越分散两边越分散.4.4.要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关的作用的作用的作用的作用.由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答.返回目录返回目录 2021/8/11 星期三52