《2019高中数学 第三章 统计案例 阶段复习课 第3课 统计案例学案 新人教A版选修2-3.doc》由会员分享,可在线阅读,更多相关《2019高中数学 第三章 统计案例 阶段复习课 第3课 统计案例学案 新人教A版选修2-3.doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第三课第三课 统计案例统计案例核心速填(建议用时 4 分钟)1分析判断两个变量相关关系常用的方法(1)散点图法:把样本数据表示的点在直角坐标系中标出,得到散点图,由散点图的形状分析(2)相关指数法:利用相关指数R2进行检验,在确认具有相关关系后,再求线性回归方程2求线性回归方程的步骤(1)画散点图:从直观上观察两个变量是否线性相关(2)计算:利用公式求回归方程的系数的值, .bn i1xixyiyn i1xix2n i1xiyin xyn i1x2in x2aybx(3)写出方程:依据 x,写出回归直线方程yab3两种特殊可线性化回归模型的转化(1)将幂型函数yaxm(a为正的常数,x,y取
2、正值)化为线性函数如果将yaxm两边同取以 10 为底的对数,则有 lg ymlg xlg a令ulg y,vlg x,lg ab,代入上式,得umvb,其中m,b是常数这是u,v的线性函数如果以u为纵坐标,v为横坐标,则umvb的图象就是一直线(2)将指数型函数ycax(a0 且a1,c0 且为常数)化为线性函数将ycax两边同取以 10 为底的对数,有 lg yxlg alg c,令 lg yu,lg ak,lg cb,得ukxb,其中,k和b是常数,与幂型函数不同的是x依然保持原来的,只是用y的对数 lg y代替了y.4在实际问题中常用的三个数值(1)当K26.635 时,表示有 99%
3、的把握认为“事件A与B有关系” (2)当K23.841 时,表示有 95%的把握认为“事件A与B有关系” (3)当K23.841 时,认为事件A与B是无关的体系构建2题型探究线性回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法根据两个变量的一组观测值,可以画出散点图或利用相关系数r,判断两个变量是否具有线性相关关系,若具有线性相关关系,可得出线性回归直线方程利用公式求回归直线方程时应注意以下几点:(1)求 时,利用公式 ,先求出bbn i1xixyiyn i1xix2n i1xiyin xyni1x2in x2 (x1x2x3xn), (y1y2y3yn)再由 求 的值,并
4、写出x1 ny1 naybxa回归直线方程(2)回归直线一定经过样本点的中心(,)xy(3)回归直线方程中的截距 和斜率 都是通过样本估计得来的,存在误差,这种误差可ab能导致预报结果的偏差(4)回归直线方程 x中的 表示x每增加 1 个单位时预报变量y的平均变化量,yabb而 表示预报变量y不随x的变化而变化的部分a以下是某地收集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据对应的散点图;3(2)若线性相关,求线性回归方程;(3)根据(2)的结果估计当房屋面积为 150 m2时的销售价
5、格. 【导学号:95032252】解 (1)数据对应的散点图如图所示(2)由散点图知y与x具有线性相关关系由表中数据知i109,i23.2,60 975,iyi12 952.设所求回归直线x1 55 i1xy1 55 i1y5 i1x 2i5 i1x方程为 x ,则 0.196 2, 1.814 2,故所求回归ybab5i1xiyi5xy5 i1x2i5x2aybx直线方程为 0.196 2x1.814 2.y(3)根据(2),当x150 时,销售价格的估计值为 0.19621501.814 231.244 y2(万元)规律方法 在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研
6、究,可近似地利用回归直线方程 x 来预报,利用公式求出回归系数 ,即可写出ybaab回归直线方程,并用回归直线方程进行预测说明跟踪训练1已知某连锁经营公司的 5 个零售店某月的销售额和利润额资料如下表:商店名称ABCDE销售额x(千万元)35679利润额y(千万元)23345(1)画出散点图;(2)根据如下的参考公式与参考数据,求利润额y与销售额x之间的线性回归方程;(3)若该公司还有一个零售店某月销售额为 10 千万元,试估计它的利润额是多少4(参考公式: , .bn i1xiyin xyn i1x2in x2aybx其中,iyi112,200)5 i1x5 i1x 2i解 (1)散点图(2
7、)由已知数据计算得n5,6,3.4, 0.5, 3.40.560.4.x30 5y17 5b1125 6 3.4 2005 6 6a则线性回归方程为 0.5x0.4.y(3)将x10 代入线性回归方程中得到 0.5100.45.4(千万元)y即估计该零售店的利润额约为 5.4 千万元回归模型分析对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行评价一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的R2(相关系数r)对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题在研究弹簧伸长长度y(cm)与拉
8、力x(N)的关系时,对不同拉力的 6 根弹簧进行测量,测得如下表中的数据:x/N51015202530y/cm7.258.128.959.9010.911.8若依据散点图及最小二乘法求出的回归直线方程为 0.18x6.34,求R2,并结合残y差说明拟合效果. 【导学号:95032253】解 列表求值如下:xi51015202530yi7.258.128.959.9010.911.85xiyi36.2581.2134.25198272.5354x2i25100225400625900yiiy0.010.020.090.040.060.06yiy2.241.370.540.411.412.3117
9、.5,9.49,iyi1 076.2,2 275,(yii)20.017 4,xy6 i1x6 i1x 2i6 i1y(yi)214.678 4.6 i1yR210.998 81,回归模型拟合效果较好由表中数据可以看出残差比0.017 4 14.678 4较均匀地落在宽度不超过 0.15 的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高规律方法 在一元线性回归模型中,相关指标R2与相关系数r都能刻画线性回归模型拟合数据的效果|r|越大,R2就越大,用线性回归模型拟合数据的效果就越好跟踪训练2关于x与y有以下数据:x24568y3040605070已知x与y线性相关,由最小二乘法得 6.
10、5,b(1)求y与x的线性回归方程;(2)现有第二个线性模型: 7x17,且R20.82.y若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由解 (1)依题意设y与x的线性回归方程为 6.5x .ya5,x24568 550,y3040605070 5 6.5x 经过(,),yaxy506.55 , 17.5,aay与x的线性回归方程为 6.5x17.5.y6(2)由(1)的线性模型得yii与yi的关系如下表:yyyiiy0.53.5106.50.5yiy201010020所以(yii)2(0.5)2(3.5)2(10)2(6.5)20.52155.5 i1y(yi)2(20)
11、2(10)2102022021 000.5 i1y所以R110.845.2 15 i1yiyi25 i1yiy2155 1 000由于R0.845,R20.82 知RR2,2 12 1所以(1)的线性模型拟合效果比较好独立性检验独立性检验是判断两个分类变量之间是否有关系的一种方法在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论为了调查胃病是否与生活规律有关,在某地对 540 名 40 岁以上的人进行了调查,结果是:患胃病者生活不规律的共 60 人,患胃病者生活规律的共 20 人,未患胃病者生活不规律的共 260 人,未
12、患胃病者生活规律的共 200 人(1)根据以上数据列出 22 列联表;(2)判断 40 岁以上的人患胃病与生活规律是否有关. 【导学号:95032254】思路探究 (1)解决本题关键是首先弄清问题中的两个分类变量及其取值分别是什么,其次掌握 22 列联表的结构特征(2)利用 22 列联表计算K2的观测值,再结合临界值表来分析相关性的大小解 (1)由已知可列 22 列联表如下:患胃病未患胃病总计生活规律20200220生活不规律602603207总计80460540(2)根据列联表得K2的观测值为k9.638.540 20 260200 602 80 460 220 320因为 9.6387.8
13、79,因此,我们在犯错误的概率不超过 0.005 的前提下认为 40 岁以上的人患胃病和生活规律有关规律方法 独立性检验的一般步骤:(1)根据样本数据制成 22 列联表(2)根据公式计算K2的观测值k.(3)比较k与临界值的大小关系作统计推断跟踪训练3为了解某班学生喜爱打篮球是否与性别有关,对本班 50 人进行问卷调查得到了如下的列联表:喜爱打篮球不喜爱打篮球总计男生5女生10总计50已知在全部 50 人中随机抽取 1 人抽到喜爱打篮球的学生的概率为 0.6.(1)请将上面的列联表补充完整(不用写计算过程);(2)能否有 99%的把握认为喜爱打篮球与性别有关?说明你的理由(参考公式:K2,nadbc2 abcdacbd其中nabcd)解 (1)依题意可知喜爱打篮球的学生的人数为 500.630.列联表补充如下:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050(2)因为 k8.3336.635,所以,有 99%的把握认为喜爱打篮球与50 20 155 10225 25 30 20性别有关