《高考数学一轮复习课件:统计案例.ppt》由会员分享,可在线阅读,更多相关《高考数学一轮复习课件:统计案例.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四节统计案例一、回归分析1 定义:对具有 的两个变量进行统计分析的一 种常用方法相关关系2 样本点的中心 在具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中,回归方程的截距和斜率的最小二乘估计公式分别 为:其中 称为样本点的中心几乎3 相关系数 当r 0 时,表明两个变量;当r 0 时,表明两个变量 r 的绝对值越接近于1,表明两个变量的线性相关性 r 的绝对值越接近于0 时,表明两个变量之间 通常|r|大于 时,认为两 个变量有很强的线性相关性正相关负相关 越强不存在线性相关关系 0.75二、独立性检验1 22 列联表:假设有两个分类变量X 和Y,它们的值域分 别为x
2、1,x2 和y1,y2,其样本频数列联表(称22 列联 表)为:K2(其中n a b c d 为 样本容量)y1y2总计x1a b abx2c d c d总计 ac bd abc d2 用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A 与B 无关3 当K23.841 时,则有 的把握说事件A 与B 有关;当K26.635 时,则有 的把握说事件A 与B 有关;当K22.706 时,则认为事件A 与B 95%99%无关根据独立性检验的基本思想,得出的两个分类变量有关系,这样的结论一定是正确的吗?提示:在实际问题中,独立性检验的结论仅仅是一种数学关系,得出的结
3、论也可能犯错误,比如:在推测吸烟与肺癌是否有关时,通过收集、整理、分析数据,我们得到“吸烟与患肺癌有关”的结论,并且有超过99%的把握说明吸烟与患肺癌有关系,或者这个结论出错的概率为0.01 以下.但实际上一个人吸烟也不一定会患肺癌,这是数学中的统计思维与确定性思维差异的反映.1 对于事件A 和事件B,通过计算得到K2的观测值k4.514,下列说法正确的是()A 有99%的把握说事件A 和事件B 有关B 有95%的把握说事件A 和事件B 有关C 有99%的把握说事件A 和事件B 无关D 有95%的把握说事件A 和事件B 无关解析:由独立性检验知有95%的把握说事件A 与B 有关答案:B2 相关
4、系数度量()A 两个变量之间线性相关关系的强度B 散点图是否显示有意义的模型C 两个变量之间是否存在因果关系D 两个变量之间是否存在关系答案:A3 以下对线性相关系数r 的叙述中,正确的是()A|r|(0,),|r|越大,相关程度越大;反之,相关程度越小B r(,),r 越大,相关程度越大;反之,相关程度越小C|r|1,|r|越接近于1,相关程度越大;|r|越接近 于0,相关程度越小D 以上说法都不对解析:根据相关系数的定义和计算公式可知,|r|1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小答案:C4 下面是一个22 列联表 则表中a、b 处的值分别为_ y1y2总计x1
5、a 21 73x22 25 27总计 b 46解析:a 21 73,a 52.又a 2 b,b 54.答案:52、545 甲、乙、丙、丁四位同学各自对A、B 两变量的线性相关 性作试验,并用回归分析方法分别求得相关系数r 与残差 平方和m 如下表:则_ 同学的试验结果体现A、B 两变量更强的线性 相关性甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103解析:由表可知,丁同学的相关系数r 最大且残差平方和m 最小,故丁同学的试验结果体现A、B 两变量更强的线性相关性答案:丁 分析判断两个变量是否线性相关的常用方法是:(1)利用散点图进行判断若各数据点大致分
6、布在通过散点 图中心的一条直线附近,那么就说这两个变量之间具有 线性相关关系此方法直观、形象,但缺乏精确性(2)利用相关系数r 进行判断操作步骤是:先求相关系数r.计算时要特别细心,避免出现计算错误,然后根据r 的值检验所得结果如果|r|0.75,表明变 量x 与y 之间具有很强的线性相关关系 假设关于某设备的使用年限x 和支出的维修费用y(万元),有如下表的统计资料:若由资料知y 对x 呈线性相关关系,试求:(1)线性回归方程(2)估计使用年限为10 年时,维修费用是多少?使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0由于题目条件明确告诉,y 对x 呈线性相
7、关关系,所以可直接代入公式求解.【解】(1)将已知条件制成下表:i 1 2 3 4 5合计xi2 3 4 5 6 20yi2.2 3.8 5.5 6.5 7.0 25xiyi4.4 11.4 22.0 32.5 42.0 112.3x 4 9 16 25 36 90于是有 5 1.234 0.08,回归直线方程是1.23x 0.08.(2)当x 10 时,y 1.2310 0.08 12.38(万元),即估计使用10 年时维修费用是12.38 万元1(2010 广州模拟)许多因素都会影响贫穷,教育也许是 其中之一,在研究这两个因素的关系时收集了美国50 个 州的成年人受过9 年或更少教育的百分
8、比(x)和收入低于 官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为 0.8x 4.6,斜率的估计值等于0.8 说明_,成年人受过9 年或更少教育的百 分比(x)和收入低于官方规定的贫困线的人数占本州人数 的百分比(y)之间的相关系数_(填“大于0”或“小 于0”)解析:由回归方程知 4.6,再由x,y 表示的实际意义可知0.8 的含义,相关系数r 0.答案:一个地区受9 年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右大于0 独立性检验的一般步骤:(1)根据样本数据制成22 列联表;(2)根据公式K2=计算K2的值;
9、(3)查表比较K2与临界值的大小关系,作统计判断 某班主任对全班50 名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高 18 7 25学习积极性一般 6 19 25合计 24 26 50试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由根据公式K2计算后与临界值比较.【解】由K26.635,故可以有99%的把握认为学生的学习积极性与对待班级工作的态度有关系2 在本例条件下,如果随机抽查这个班的一名学生,那么 抽到积极参加班级工作的学生的概率是多少?抽到不太 主动参加班级工作且学习积极性
10、一般的学生的概率是多少?解:随机抽查一名学生有50 种不同的抽法,积极参加班级工作的学生有18 6 24 人,故不主动参加班级工作且学习积极性一般的学生有19 人,本部分主要内容是变量的相关性及其几种常见的统计方法,在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有可能出现解答题,如2009 年辽宁高考.(2009 辽宁高考)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500 件,量其内径尺寸,得结果如下表:甲厂:分组29.8
11、6,29.90)29.90,9.94)29.94,9.98)29.98,0.02)30.02,0.06)30.06,0.10)30.10,30.14)频数 12 63 86 182 92 61 4乙厂:分组29.8629.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数 29 71 85 159 76 62 18(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22 列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂 乙厂 合计优质品非优质品合
12、计附K2 解(1)甲厂抽查的产品中有360 件优质品,从而甲厂生产的零件的优质品率估计为乙厂抽查的产品中有320 件优质品,从而乙厂生产的零件的优质品率估计为(2)甲厂 乙厂 合计优质品360 320 680非优质品140 180 320合计500 500 1 000所以有99%的把握认为“两个分厂生产的零件的质量有差异”.在解决本题时,由于题中的信息量较大,故审题时要仔细,尤其是甲、乙两厂所抽取的500 件的数据分布.这是解决第(1)问的关键,对于第(2)问利用条件,填写出列联表直接代入公式计算.要注意运算结果的准确性,以免造成运算失分.另外,在本例中同学求一下甲厂中抽取的500 件零件的平均尺寸是多少?