《高中数学总复习教学案.pdf》由会员分享,可在线阅读,更多相关《高中数学总复习教学案.pdf(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高中数学总复习教学案高中数学总复习教学案第十三单元第十三单元统计统计本章知识结构本章知识结构收集数据(随机抽样)整理、分析数据,估计推断简单随机抽系统抽样分层抽样用样本估计总体变量间的相互关系抽签法随机数法用样本的频率分布来估计总体的分布用样本数字特征估计总体的数字特征线性回归方程本章的重点难点聚焦本章的重点难点聚焦重点:重点:1、能够正确理解简单随机抽样的基本方法抽签法、随机数法,系统抽样和分层抽样,结合实际问题能够准确选择恰当的抽样方法从总体中抽取样本。2、能从样本数据中提取基本的数字特征(如众数、中位数、平均数、标准差)并能作出合理的解释。3、能够通过收集现实问题中两个有关联变量的数据做
2、出散点图,并能够利用散点图直观认识变量间的相关关系。4、能够根据给出的线性回归方程的系数公式建立线性回归方程。难点:难点:1、领会用样本估计总体的思想,回归的思想。2、最小二乘法的应用。3、对回归直线与观测数据的关系的正确理解。本章学习中应当着重注意的问题本章学习中应当着重注意的问题1、在参与解决统计问题的过程中,注意理解抽样问题的必要性和重要性,加深对不同抽样方法的理解。2、在解决问题的过程中,注意体会用样本估计总体的思想,用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征,领会样本频率分布和数字特征的随机性。3、注意最小二乘法的数学思想和回归方程的建立,正确理解变量之
3、间的相关关系,特别是线性相关关系。本章高考分析及预测本章高考分析及预测本章是高考必考内容,是考察考生数据处理能力的主要依据,高考中主要依据统计或统计案例中的方法对数据进行处理、分析、并解决给定的实际问题;利用频率分布直方图考察学生的数据处理能力,利用平均数、标准差等数字特征评价样本数据;对两个变量的相关关系主要体现在散点图、变量间的相关关系的判断以及线性回归方程的思想方法上。命题形式一般为选择题或填空题,在高考中也可出现结合概率、给定实际应用问题考察学生构造抽样模型、识别模型、收集数据等研究性学习的应用题。在高考中,本章分值一般在 1015 分。13.113.1随机抽样随机抽样课标要求理解随机
4、抽样的必要性和重要性学会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法重点难点聚焦重点:1.能从现实生活或其他学科中提出具有一定价值的统计问题2.理解随机抽样的必要性和重要性.3.学会简单随机抽样方法,了解分层和系统抽样方法.4.对随机性样本的随机性的正确理解.难点:1.对样本随机性的理解.2.三种抽样方法的步骤.高考分析及预策本节是高考必考内容,主要用于考查学生的数据处理能力.考试大纲中在关于能力的要求中指出:数据处理能力主要依据统计或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题。高考中常结合应用问题考查学生构造抽样模型、识别模型、收集数据等研究性学习的能力,命
5、题形式大都为选择题或填空题。题组设计再现型题组1.(2007 全国卷)一个总体中含有 100 个个体,以简单随机抽样方式从该总体中抽取一个容量为 5 的样本,则指定的某个个体被抽到的概率是_。2.某车间工人加工一种轴 100 件,为了了解这种轴的直径,要从中抽取 10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?3.某校高中三年级的 295 名学生已经编号为 1,2,295,为了了解学生的学习情况,要按 1:5 的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。4.某公司生产三种型号的轿车,产量分别为 1200 辆,6000 辆和 2000 辆,为检验该公司的产品质量,现用
6、分层抽样的方法抽取 46 辆进行检验,这三种型号的轿车依次应该抽取_辆,_辆,_辆。巩固型题组5一个单位有职工160 人,其中有业务人员112 人,管理人员16 人,后勤服务人员 32 人,为了了解职工的某种情况,要从中抽取一个容量为 20 的样本,用分层抽样的方法抽取样本,并写出过程。6.(2005 年湖北)某高级中学有学生 270 人,其中一年级 108 人,二、三年级各81 人,现要利用抽样方法抽取10 人参加某项调查,考虑选用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为 1,2,270;使用系统抽样时,将学生统一随机编号为 1,2,270,并将整个编号依次分为 10
7、段。如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是A.都不能为系统抽样 B.都不能为分层抽样C.都可能为系统抽样 D.都可能为分层抽样提高型题组7经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多 12 人,按分层抽样方法从全班选出部分学生座
8、谈摄影,如果选出了 5 位“喜欢”摄影的同学、1 位“不喜欢”摄影的同学和3 位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多_人。8.(2006 年高考湖北卷)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组。在参加活动的职工中,青年人占42.5%,中年人占 47.5%,老年人占 10%。登山组的职工占参加活动总人数的1,4且该组中,青年人占 50%,中年人占 40%,老年人占 10%。为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为 200 的样本。(1)在游泳组中,试确定
9、青年人、中年人、老年人分别所占的比例;(2)在游泳组中,试确定青年人、中年人、老年人分别应抽取的人数。反馈型题组9.(2007 浙江)某校有学生 2000 人,其中高三学生500 人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该学校学生中抽取一个 200 人的样本,则样本中高三学生的人数为_。10.要从已经编号(160)的 60 枚最新研制的某种导弹中随机抽取 6 枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的 6 枚导弹的编号可能是()A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,4,8,16
10、,32,4811.从 2008 名学生中选取 50 人参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从 2008 人中剔除 8 人,剩下的 2000 人再按系统抽样的方法抽取,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为251 D.都相等,且为40100412(2008 天津文)一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人,为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工_人。13.用系统抽样法从 160 名学生中抽以容量为 20 的样本,将 160 名学生
11、随机地从 160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160号),若第 16 组抽出的号码为 126,则第 1 组中用抽签的方法确定的号码是_。13.213.2总体估计总体估计新课标要求1、通过实例体会分布的意义和作用,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图;2、能根据实际问题的需求合理选取样本,从样本数据中提取基本的数字特征;3、在解决统计问题的过程中,进一步体会用样本估计总体的思想。重点难点聚焦本节的重点是频率分布表、频率分布直方图、频率折线图、茎叶图,样本数据的平均数、标准差,用样本估计总体的思想方法;难点是频率分布表、频率分布直方图的画法、基
12、本数字特征的求法。高考分析及预测本 节 内 容 是 收 集、整 理、分 析 数 据 等 研 究 性学习的理论依据,是高考的必考内容,并且是考查考生数据处理能力的主要依据。在高考中常结合应用问题考查频率分布情况,利用平均数、标准差等数字特征评价样本,估计总体等问题。命题形式一般为选择题或填空题,将来有可能结合研究性学习考察学生的实践能力。题组设计再现型题组一个容量为 35 的样本数据,分组后,组距与频数如下:(5,10:5个,(10,15:12 个,(15,20:7 个,(20,25:5 个,(25,30:4 个,(30,35:2个,则样本在区间(20,+)上的频率约为()A、20%B、69%C
13、、31%D、27%2、在用样本频率估计总体分布的过程中,下列说法中正确的是()A、总体容量越大,估计越精确 B、总体容量越小,估计越精确C、样本容量越大,估计越精确 D、样本容量越小,估计越精确3、某工厂有 10 名工人,他们某天生产同一零件,生产的件数是 15,17,14,10,15,17,17,16,14,12。设其平均数为 a,中位数为 b,众数为 c,则有()A、abc B、bca C、cab D、cba4、在统计中,样本数据的方差可以近似的反应数据总体的()A、平均状态 B、分布规律 C、最大值和最小值 D、波动大小5、作频率分布直方图:用横轴表示,用纵轴表示,在横轴上以为底,以为高
14、作矩形。6、某人射击 10 次,得环数如下:18,20,19,22,20,21,19,19,20,21,则这组数据的平均数是,方差是。巩固型题组7、在一小时内统计一传呼台接收到用户的呼唤次数,按每分钟统计如下:00 1 2 1 2 2 3 4 101 2 5 3 1 2 2 2 414 3 1 1 3 2 3 4 622 0 2 3 1 3 1 4 112 0 2 3 4 2 5 0 221 0 3 2 1 3 1 2 0列出一分钟内传呼台接收呼唤次数的频率分布表。8、要从甲、乙两名工人中选出一名参加机床技术表演,先对甲、乙两人进行测试,使用同一台机床,甲、乙两人在 10 天内每天出的次品数分
15、别是:甲:2,1,0,2,3,1,0,4,2,0;乙:1,2,0,3,1,1,2,1,0,1。分别计算这两个样本的平均数与方差,从计算结果看,应选哪一名工人参加技术表演?提高型题组9、(2008 年广东文,11)为了调查某厂工人生产某种产品的能力,随机抽查了20 位工人某天生产该产品的数量。产品数量的分组区间为45,55),55,65),65,75),75,85),85,95),由此得到频率分布直方图如图 3,则这 20 名工人中一天生产该产品数量在55,75)的人数是_10、(2008 年山东文,9)从某项综合能力或抽取100人的成绩,统计如表,则达 100 人成绩的标准差为分数54321人
16、数2010303010(A)3 (B)82 10 (C)3 (D)5511、(2008 年山东理,8)下图是根据山东统计年鉴 2007中的资料做成的 1997 年至 2006 年我省城镇居民百户家庭人口数的茎叶图。图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字。从图中可以得到 1997 年至 2006 年我省城镇居民百户家庭人口数的平均数为A、304.6 B、303.6 C、302.6 D、301.6反馈型题组12、关于频率分布直方图,下列说法正确的是()A、直方图的高表示区某数的频率B、直方图的高表示该组上的个体数与组
17、距的比值C、直方图的高表示该组上个体数与组距的比值D、直方图的高表示该组上个体在样本中出现的频率与组距的比值13、甲、乙两人在同样的条件下练习射击,每人打5 发子弹,命中环数如下,甲:6,8,9,9,8;乙:10,7,7,7,9。则甲乙的射击成绩()A、甲比乙稳定 B、乙比甲稳定C、甲、乙的稳定程度相同 D、无法比较14、一组数据的每一个数据都减去 80,得一组新数据。若求的新数据的平均数是 1.2,方差是 4.4,则原来数据的平均数和方差分别是()A、81.2,4.4 B、78.8,4.4 C、81.2,84.4 D、78.8,75.615、期中考试以后,班长算出了全班 40 个人数学成绩的
18、平均分为 M。如果把 M当成一个同学的分数,与原来的 40 个分数一起,算出这 41 个分数的平均值是 N,那么 M/N=16、(2007 年广东)图 1 是某县参加 2007 年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,A10(如A2表示身高(单位:cm)在150,155)内的学生数)。图 2 是统计图 1 种身高在一定范围内学生人数的一个算法流程图。现要统计身高在 160180cm(含 160cm,不含 180cm)的学生人数,那么在流程图中的判断框内应填写的条件是A、i9 B、i8 C、i7 D、i3.841B.K26.635D.K26.635二、填空题
19、6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业统计专业1310男720女为了检验主修统计专业是否与性别有关系,根据表中的数据,得到5 0(1 32 0 1207)4.8 4k 2 3 2 72 03 0因为 K23.814,所以断定主修统计专业与性别有关系,这种判断出错的可能性为_.三、解答题7.某种产品的广告支出 x 与销售额 y(单位:百万元)之间有如下的对应关系x24568y3040605070(1)假定 y 与 x 之间具有线性相关关系,求回归直线方程。(2)若实际销售额不少于 60 百万元,则广告支出应该不少于多少?第十三单元 统计 45
20、分钟单元综合检测题一、选择题选择题:1、已知样本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 1011 12 12 那么频率为 0.3 的范围是 ()A.5.57.5 B.7.59.5C.9.511.5 D.11.513.52、期中考试以后,班长算出了全班40 个人数学成绩的平均分 M,如果把 M 当成一个同学的分数,与原来的 40 个分数一起,算出这41 个分数的平均值为 N,那么 M:N 为本()4041A.B.1 C.D.241403、某地区有 300 家商店,其中大型商店 30 家,中型商店 75 家,小型商店 195家,为了掌握各商店的营业情况,要
21、从中抽取一个容量为 20 的样本,若采用分层抽样的方法,抽取的中型商店数是不是()A2 B.3 C.5 D.134、某单位有机工 18 人、技术员 12 人、工程师 6 人,需要从中抽取一个容量为n 的样本。如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除一个个体,则样本的容量n为本()A4 B.5 C.6 D.无法确定=500+80 x,下5、工人月工资(元)以劳动生产率(千元)变化的回归方程为y列判断正确的是不是()A劳动生产率为 1000 元时,工资为 80 元B劳动生产率提高 1000 元时,工资水平平均提高 80 元C劳动生产
22、率提高 1000 元时,工资平均提高 580 元6一组数据中的每一个数据都减去 80,得一组新数据,若求得新数据的平均数是 1.2,方差是 4.4,则原来的数据的平均数和方差分别是()A812;4.4 B.78.8;4.4 C.81.2;84.4 D.78.8;75.6二填空题填空题7、某公司生产三中型号的轿车,产量分别为辆、辆和辆。现用分层抽样的方法抽取辆进行检验,这三种型号的车依次应抽取_辆,_辆,_ 辆。8、在样本的频率分布直方图中,一共有 m(m3)个小矩形,第个小矩形的面积1等于其余 m-1 个小矩形面积和的,且样本容量为,则第组的頻数是4_。bx+a,其中 a=3 且样本点中心为(
23、,)、已知回归直线方程y,则回归直线方程为_。、容量为样本拆分为组,若前组频率之和为,而剩下的三组的频数成等比数列,且其公比不为,则剩下的三组频数最大的一组的频率是_。三、解答题:、从全年级的两个班的调考成绩中每班任意抽取名的数学成绩如下(总分):甲班:135 134 140 146 108 110 98 88142 126 118 112 95 103 148 92 121 132乙班:108 117 125 137 119108132 121 97 104 114 135 127 124 135 107试用茎叶图分析,哪个班成绩比较稳定、通过随机询问名不同性别的大学生在购买食物时是否看营养
24、说明,得到下列联表女男总计读营养说明不读营养说明总计请问性别和读读营养说明之间多大程度上有关系?13.113.1随机抽样(解答部分)随机抽样(解答部分)再现型题组再现型题组1.【提示或答案提示或答案】每个个体被抽取的概率均为P 511,故答案为1002020【基础知识聚焦基础知识聚焦】当从一个容量为的总体中,抽取一个容量为 n 的样本时,每个个体被抽到的概率均为P n。N2.【提示或答案提示或答案】方法一(抽签法)将 100 件轴编号为 1,2,100,并做好大小、形状相同的号签,分别写上这100 个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取 10 个号签,与这 10 个号签号码相同的
25、轴的直径即为所为抽取的样本。方法二(随机数表法)将100 件轴编号为 00,01,99,在随机数表中选定一 个 起 始 位 臵,如 取 第21行 第1个 数 开 始,选 取10个 为68,34,30,13,70,55,74,77,40,44,这 10 个号码对应的轴的直径即为所要抽取的样本。【基础知识聚焦基础知识聚焦】(1)一个抽样试验能否用抽签法,关键要看:制签是否方便;号签是否容易被搅匀。一般地,当总体容量和样本容量都较小时,可用抽签法。(2)随机数表法的步骤:将总体的个体编号;在随机数表中选择开始数字;读数获取样本号码。随机数表法简单易行,它很好地解决了抽签法在总体容量较大时制签难的问题
26、,但是当需要的样本容量很大时,用随机数表法抽取样本仍不方便。3.【提示或答案提示或答案】按 1:5 的比例,应该抽取的样本容量为 2955=59,我们把 295名同学分成 59 组,每组 5 人。第 1 组是编号为 15 的学生,第 2 组是编号为 610 的学生,依次下去,第 59 组是编号为 291295 的学生。采用简单随机抽样的方法,从第 1 组 5 名学生中抽出一名学生,不妨设编号为 m(1m5),那么抽取的学生编号为 m+5k(k=0,1,2,58),得到 59 个个体作为样本,如当 m=3 时,样本编号为 3,8,13,288,293.【基础知识聚焦基础知识聚焦】在抽样过程中,当
27、总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤是:采用随机抽样的方法将总体中个体编号;将整体编号进行分段,确定分段间隔 m,在确定分段间隔 m 时应注意:分段间隔 m为整数,当N不是整数时,应采用等可能剔除的方法剔除部分个体,以获得整n数间隔 m;在第 1 段内采用简单随机抽样的方法确定起始个体编号 k;按照事先预定的规则抽取样本。4.【提示或答案提示或答案】首先确定抽样比例,然后根据各层份数确定各层要抽取的份数。4611200600020002001111200 6,6000 30,200010200200200故这三种型号的轿车依次应该抽取 6 辆、30 辆、10 辆进行检
28、验。【基础知识聚焦基础知识聚焦】分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,两层之间的样本差异要大,且互不重叠;为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;在每层抽样时,应采用简单随机抽样或系统抽样的方法进行;在确定每层中抽取的份数时,要首先确定抽样比例,然后根据每层份数确定各层要抽取的份数。巩固型题组巩固型题组5.解法一:三部分所含个体数之比为 112:16:32=7:1:2,设三部分各抽取个体数为 7x,x,2x,则由 7x+x+2x=20 得 x=2
29、。故业务人员、管理人员、后勤服务人员抽取的个体数分别为 14,2 和 4。对 112 名业务人员按系统抽样分成 14 个部分,其中每个部分包含 8 个个体,对每个部分利用简单随机抽样抽取个体。若将112 名业务人员依次编号为 1,2,3,112。管理人员的编号为 113,114,128。后勤人员的编号为 129,130,160。那么在 1112 名业务人员中第一部分的个体编号为 18。从中随机抽取一个号码,如它是4 号,那么可以从第4 号起,按系统抽样法每隔 8 个抽取 1 个号码,这样得到 112 名业务人员被抽出的 14 个号码依次为 4,12,20,28,36,44,52,60,68,7
30、6,84,92,100,108。同样可抽出的管理人员和后勤服务人员的号码分别为 116,124 和 132,140,148,156。将以上各层抽出的个体合并起来,就得到容量为 20 的样本。解法二:分层抽样中的抽样比为201111,由11214,162,32 41608888可得,业务人员、管理人员、后勤人员应分别抽取14 人、2 人、4 人。以下同解法一。点评:分层抽样的步骤是:分层;按比例确定每层应抽取个体的个数;各层抽样(方法可以不同);汇合成样本。本题要抓住“分层抽样中各层抽取个体数依各层个体数之比来分配”这一分层抽样的特点,首先确定各层应抽取的个体数,之后分别采用系统抽样和简单随机抽
31、样完成抽样过程。解决些类问题的关键在于对概念的正确理解以及在每一次抽样的步骤中所采用的抽样方法,应注意语言叙述的完整性。变式与拓展:(2007 陕西)某商场有四类食品,其中粮食类、植物油类、动物性食品类和果蔬类分别,40 种、10 种、30 种、20 种,现从中抽取一个容量为20 的样本进行食品安全检测。若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4B.5C.6D.7答案:C6.解:根据三种抽样方法的特征,如果是分层抽样,则各号段应占的比例为4:3:3,均合适;如果是系统抽样,则抽取的样本号码应该构成公差为27 的等差数列,其中的首项分别为 7 和 11,适合,
32、的首项为 30,不适合。对所给 四个选项判断知,应选 D。点评:本题主要考查统计中的抽样方法的有关知识。解答此题,必须明确三种抽样方法的特征、区别和联系,结合具体案例分析判断。分层抽样时要按抽样比确定每层应抽取个体的个数;系统抽样是分段抽样,故抽得的编号是等差数列,首项应该在第一段,公差是每段中个体的数量。变式与拓展 1:问题:有 1000 个乒乓球分别装在 3 个箱子内,其中红色箱子内有 500 个,蓝色箱子内有200 个,黄色箱子内有 300 个,现从中抽取一个容量为 100 的样本;从 20 名学生中选出成 3 名参加座谈会。方法:1.简单随机抽样;2.系统抽样;3.分层抽样法。其中问题
33、与方法能配对的是:A.1,2B.3,1C.2,3D.3,2答案:B变式与拓展 2:(2008 重庆)某校高三年级有男生 500 人,女生 400 人,为了解该年级学生的健康情况,从男生中任意抽取 25 人,从女生中任意抽取 20 人进行调查。这种抽样方法是()A.简单随机抽样 B.抽签法 C.随机数表法 D.分层抽样法答案:D提高型题组提高型题组317解:设全班共有x 人,则xx 12,解得 x=54。“喜欢”摄影的人数9951为54 30人,比全班人数的一半多3054 3人。92点评:利用分层抽样的结果可确定每层人数占总体人数的比例,根据已知条件列出方程求出全班的总人数,进而求出答案。变式与
34、拓展:(2008 湖南)从某地区 15000 位老人中随机抽取 500 人,其生活能否自理的情况如下表所示:性别男女能否自理能178 人278人不能23人21人则该地区生活不能自理的老人中男性比女性约多_人。答案:60 人。8解:(1)设登山组人数为 x,则总人数为 4x,游泳组人数为 3x.在游泳组 中,青 年 人、中 年 人、老 年 人 所 占 比 例 分 别 为 a、b、c,则 有x40003xbx10003xc0 47.50,1000,解得 b=50%,c=10%.4x4x故 a=100%-50%-10%=40%,即在游泳组中,青年人、中年人、老年人所占的比例分别为 40%、50%、1
35、0%。3(2)在游泳组中,抽取的青年人人数为2004000 60人;抽取的中年433人人数为2005000 75人;抽取的老年人人数为200100015人。44点评:分层抽样中,所有层中每个个体被抽到的可能性相同,本题最关键是确定游泳组中青年人、中年人、老年人的比例,再按照比例确定样本中青年人、中年人、老年人的人数。课堂小结课堂小结1、三种抽样方法的比较类别共同点各自的特点简单随从总体中逐个抽取机抽样系统抽将总体均分成几部分,抽样过程中每样按预先制定的规则在个个体被抽到各部分抽取的可能性相等分层抽将总体分成几层,分层样进行抽样相互联系在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或
36、系统抽样适用范围总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成2、三种抽样方法的步骤3、三种抽样方法都是等概率抽样,即每个个体被抽取的可能性相等,体现了这三种抽样方法的客观性和公平性。反馈型题组反馈型题组9答案:50 人。提示:先确定抽样比,再求出高三学生的人数。10答案:B提示:系统抽样选取的编号是等差数列,公差为 10.11答案:C提示:系统抽样中每个个体被抽到的可能性都相等,入样的概率均为P 12答案:10提示:抽样比为13答案:6.提示:设第一组号码是 x,则 126=x+158。2511,故应抽取8010人。20088n。N13.213.2 总体估计总体估计(解答部分
37、)再现型题组1、【提示或答案提示或答案】C【基础知识聚焦基础知识聚焦】某区间上的频率=各组上的频率之和;频率=频数/总数或=个小频率之和。2、【提示或答案提示或答案】C【基础知识聚焦基础知识聚焦】样本容量越大,样本所包含的数据越多,所反映的结论越接近总体的情况,所以估计就越精确。3、【提示或答案提示或答案】D【基础知识聚焦基础知识聚焦】平均数:所有数据之和/个数;中位数:把数据按大小顺序排列后在中间的数(如果中间有两个数,取其平均数);众数:出现次数最多的数。4、【提示或答案提示或答案】D【基础知识聚焦基础知识聚焦】方差反映的是数据与平均数距离的远近,因此也就反映出数据总体的波动情况。5、【提
38、示或答案提示或答案】样本数据,频率/组距,组距,频率/组距【基础知识聚焦基础知识聚焦】频率分布直方图中横轴表示样本数据,纵轴表示频率/组距。矩形以组距作底,频率/组距作高。6、【提示或答案提示或答案】19.9,1.29【基础知识聚焦基础知识聚焦】平均数:所有数据之和/个数;1方差:s2(x1 x)2(x2 x)2(xn x)2。n巩固型题组7、【解法解法】一分钟内频数呼唤次数0123456合计8161710621600.1330.2670.2830.1670.1000.0330.0171.000频率【点评】因为所给的数据很多,所以在找相同的数据时一定要数清楚个数,最后求和看看是否有漏掉的或重复
39、的,分布表中的合计一行不要忘了写。221.65,s乙 0.76,由以上计算可以看出:8、【解法解法】x甲1.5,x乙1.2,s甲22。也就是说乙工人的水平比价工人的水平高,并且外水平的稳定x甲 x乙,s甲 s乙程度也比较高,所以应该选乙工人去参加技术表演。【点评】比较优劣要从两个方面;一是平均数,二是方差(也可以求标准差)。先求平均数,平均数大的要优秀一些,如果平均数相同,再求方差,方差小的优秀一些。提高型题组9、【解法解法】在55,75的频率为(0.04+0.025)10=0.4+0.25=0.65,因此人数为 0.6520=13.【点评】频率分布直方图中矩形以组距作底,频率/组距作高,要仔
40、细观察所给直方图找出所求区间上的频率/组距和区间长度。10、【解法解法】B.这 100 人成绩的平均数为x 520 410 330 230 110 3,方差为10018(53)220(4 3)210(33)230(2 3)230(13)210,1005s2因此标准差为s 82 10。551【点评】方差:s2(x1 x)2(x2 x)2(xn x)2,标准差:s.n11、【解法解法】B。由茎叶图可知 1997 年人口数为 291,1998 年 291,1999 年 295,2000 年 298,2001 年 302,2002 年 306,2003 年 310,2004 年 312,2005 年
41、314,2006 年 317,故平均数为(291+291+295+298+302+306+310+312+314+317)/10=303.6。课堂小结知识小结:1、用样本的频率分布估计总体的频率分布:频率分布表、频率分布直方图、频率折线图、茎叶图;2、用样本的数字特征估计总体的数字特征:众数、中位数、平均数、标准差。思想方法小结:1、用样本估计总体的思想;2、会用样本估计总体的思想解决一些简单的实际问题。反馈型题组12、答案:D。13、答案:A。14、答案:A。15、答案:1。提示:M=(x1 x2 x40)/40,N=(x1 x2 x40+M)/41=x1 x2 x40+(x1 x2 x40
42、)/40/41=41(x1 x2 x40)/40/41=(x1 x2 x40)/40=M,因此 M=N.16、答案:C。提示:身高在 160180cm 之间的人数应为A4 A5 A6 A7,因此当算法流程中的判断框内填 i3.841 时,则有 95%的把握说事件 A 与 B 有关;当 K26.635 时,则有 99%的把握说事件 A 与 B 有关;当 K22.706 时,则认为事件 A 与 B 无关.【巩固型题组】6.解(1)列出下表12345678910102030405060708090100 xiyixiyi6262068758189951021081151221360225032404
43、4505700714086401035012200 x 55,y 91.7,xi1102i 38500,yi87777,xiyi 55950,因此2i1i11010r x yii1102i110i10 xy10(xi10 x)(yi210y2)2i1 0.999855950 105591.7(38500 1055)(87777 1091.7)22由于r=0.99980.75,因此x与y之间有很强的线性相关关系,因而可求回归直线方程。a bx,则有(2)设所求的回归直线方程为yb x y 10 xyiii11010 xi12i10 x215202.91037.9739.1356.631.447,
44、214663.671037.97246.461a y bx 39.11.44737.97 15.843,1.447x15.843.因此,所求的回归直线方程为y(3)这个回归直线方程的意义是当 x 每增大 1 时,y 的值约增加 0.668,而54.96 是 y 不随 x 增加而变化的部分,因此,当 x=200 时,y 的估计值为 0.66820054.96 188.56 189,因此,加工 200 个零件所用的工时约为y189 分。【点评】因为y对x呈线性相关关系,所以可以用一元线性相关的方法解决问题。()利用公式:1b x y nxyiii1nn,a y bx来计算回归系数。xi12inx2
45、有时为了方便常制表对应求出xiyi,xi2,以利于求和。(2)获得线性回归方程后,取 x=10,即得所求。(3)本题应借用计算器计算,并列出表格,再按解题步骤进行。【变式与拓展】假设关于某设备的使用年限 x 和所支出的维修费用 y(万元),有如下的统计资料:使用年限 x23456维修费用 y2.23.85.56.57.0若有资料知 y 对 x 呈线性相关关系。=bx+a的系数a,b;试求:(1)回归直线方程y(2)估计使用年限为 10 年时,维修费用约是多少?解(1)制表如下:12345合计2345620 xiyixiyi2.23.85.56.57.0254.411.422.032.542.0
46、112.34916253690 xi2x=4;y=5;xi 90;xiyi112.32i1i155于是有b=112.354512.31.23;9054210a y bx 51.234 0.08.1.23x0.08,(2)回归直线方程是:y 1.23100.0812.30.08 12.38(万元),当x 10时,y即估计使用 10 年时,维修费用是 12.38 万元。7.解假设做过心脏搭桥手术与又发作心脏病没有关系。由于a 39,b 157,c 29,d 167,ab 196,cd 196,ac 168,bd 324,n 392,由公式可得K2的观测值为392(3916715729)2k 1.7
47、8,19619668324因为k 1.78 2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系。【点评】在判断两个非类变量关系的可靠性时一般利用随机变量K2来确定;把计算出的K2的值与有关的临界值作比较,确定出“X 与 Y 有关系的把握。【变式与拓展】为考察性别与是否喜欢饮酒之间的关系,在某地区随机抽取 290 人,得到如下列联表:喜欢饮酒不喜欢饮酒总计女10145146男12420144总计22565290利用列联表的独立性检验判断性别与喜欢饮酒是否有关系?解由列联表中数据得:290(1012012445)2K 11.95 10.828,146144225652所以我们有 99.
48、9%的把握认为“性别与是否喜欢饮酒有关”。【提高型题组】8.解(1)作统计假设:x 与 y 不具有线性相关关系。(2)有显著性水平 0.05yun-2=8 在附表中查的r0.05 0.632。(3)x y 101(159160 157)158.8,101(158159 156)159.1,102ixi110i11010 x2(15921602 1572)10158.82 47.6,(159158160159 157156)10158.8159.1 37.2,xiyi10 xy yi12i10y2(15821592 1562)10159.12 56.9,37.2 0.71.47.656.9所以r
49、(4)r 0.71 0.632,即 r r0.05,从而有95%的把握认为x与y之间具有线性相关关系,去求回归直线方程是有意义的。回归系数37.2b 0.782 0.78,a 159.10.782158.8 34.92.47.6 34.920.78x.所以y对x的回归直线方程是y回归系数 0.78 反映出当母亲身高每增加 1cm 时女儿身高平均增加 0.78cm,a=34.92 可以解释为女儿身高不受母亲身高变化影响的部分。34.920.78161160.5.当 x=161 时,y这就是说当母亲身高为 161cm 时女儿的身高大致也接近 161cm。【点评】先对x与y作相关性检验,确定模型,当
50、有线性相关关系时,求线性回归方程,再预测。【变式与拓展】在 10 年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据:第几年12345678910城市居民年32.231.132.935.837.138.039.043.044.646.0收入x(亿元)某商品销售25.030.034.037.039.041.042.044.048.051.0额y(万元)(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程。解(1)散点图如图所示。524844销售额(万元)4036322824203032 34 36 38 40 42 44 446 48.年收