《新高考一轮复习苏教版 第10章 第2节用样本估计总体 学案.docx》由会员分享,可在线阅读,更多相关《新高考一轮复习苏教版 第10章 第2节用样本估计总体 学案.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3用样本估计总体考试要求1 .会用统计图表对总体进行估计.2 .理解集中趋势参数的统计含义;理解离散程度参数的统计含义;能用样本 估计总体的取值规律,理解百分位数的统计含义.3 .掌握分层随机抽样的样本均值与样本方差.走进教材夯实县础回顾知识激活技能C梳理必备知识1 .总体百分位数的估计(1)百分位数的定义一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有 侬的数据小于或等于这个值,且至少有(100)的数据大于或等于这个值.(2)计算一组个数据的第p百分位数的步骤第1步,按从小到大排列原始数据;第2步,计算义;第3步,假设i不是整数,而大于i的比邻整数为那么第p百分位数为第2项
2、 数据;假设,是整数,那么第D百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因 此称为四分位数.第叁百分位数又称第一四分位数或下四分位数;第五百分位数又称第三 四分位数或上四分位数.提醒:一组数据的某些百分位数可能是同一个数.2 .总体集中趋势的估计名称概念平均数如果有几个数XI, X2,,那么这组数据的平均数X (xi +xzH11/+x)学校采用分层随机抽样方法,从高一、高二学生中分别抽取了 50人、40人参加 心理健康测试(总分值:10分).经初步统计,参加测试的高一学生成绩 %(=1, 2, 3,,5
3、0)的平均分三=7.4,方差 = 2.6,高二学生的成绩 期=1, 2, 3,40)的统计表如下:成绩y456789频数3711964计算参加测试的高二学生成绩的平均分y和方差民(2)估计该学校高一、高二全体学生的平均分工和方差已解由题意, 4X3 + 5X7 + 6X11+7X9 + 8X6+9X4 =40=65=3X(4-6.5)2 + 7X(5-6.5)2+HX(6-6.5)2 + 9X(7-6.5)2 + 6X(8- 6.5)2+4X(9-6.5)2 = 1.95.(2)由可得,7 =(507 +407) =(50X7.4+40X6.5)=7,蟾=瑞 X 2.6+(7.47)2 +瑞
4、X 1.95 + (6.57月=景.考向2均值与方差的应用典例2 2 (2021 .全国乙卷)某厂研制了一种生产高精产品的设备,为检验 新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为X和y,样本方差分别记为和我(1)求 x , y , d,金;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y_/
5、V?-Lo2-x三2一一,那么认为新设备生产产品的该项指标的均值较旧设备有显著提 高,否那么不认为有显著提高).解(1)由题中的数据可得 9.8+10.3 + 10.0+10.2+9.9+9.8 + 10.0+10.1 +10.2+9.7x =TTJ= 10.0,= 10.3,= 10.3,10.1 +10.4+10.1 +10.0+10.1 +10.3 + 10.6+10.5 + 10.4+10.510s仁击(9.8 - 10.0)2 + (10.3-10.0)2 + (10.0-10.0)2 + (10.2-10.0)2 + (9.9 - 10.0)2 + (9.8-10.0)2 + (1
6、0.0-10.0)2 + (10.1-10.0)2 + (10.2-10.0)2 + (9.7-10.0)2 =0.036,=-(10.1- 10.3)2 + (10.4-10.3)2 + (10.1-10.3)2 + (10.0- 10.3)2 + (10.1-10.3)2 + (10.3 - 10.3)2 + (10.6 - 10.3)2 + (10.5 - 10.3)2 + (10.4 10.3)2 + (10.5 10.3)2=0.04.(2)由(1)知 y 一-/0.036+0.04x = 10.3 - 10.0 = 0.3,2A= 2A / 2/0.007 6,那么 03=72N0
7、.007 6=勺0.030 4.所以可判断新设备生产产品的该项指标的均值较旧设备有显著提高.伞反思领悟 标准差(方差)反映了数据的离散与集中、波动与稳定的程 度.标准差(方差)较大,数据的离散程度越大;标准差(方差)较小,数据的离散 程度越小.跟进训练2.(1)(2021 广东模拟)数据XI, X2,孙X4,X6的平均数是5,方差是 9, 那么 %?+/+翥+/+招+忌=()B. 204B. 204A. 159C. 231C. 231D. 636某7个数的平均数为4,方差为2.现加入一个新数据4,此时这8个数的平均数为x,方差为$2,那么()A. x =4, 522C. x 4, 524, s
8、22(3)(2021越秀区期末)为了解学生的课外阅读情况,某校采用样本量比例分配 的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时) 的调查,所得样本数据如下:年级抽样人数样本平均数样本方差高一4053.5点一 问一*3()X 22i_r a 演J二303si高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,那么高二 年级学生的样本平均数三2 =,高三年级学生的样本方差S3 =.(1)B (2)A (3)4 1.5 (1)根据题意,数据 xi, X2, X3,孙 X5, X6 中,平均数x =5,方差义=9,1那么 s2=d(X+x3+x3+/+xg+需)-X
9、 2 = 9,变形可得:那么x?+x3+K+x2+xg+近=204,应选B.(2)因为某7个数的平均数为4,所以这7个数的和为4X7 = 28.因为加入一_ 28+4个新数据4,所以三=4.又因为这7个数的方差为2,且加入一个新数据 O4,所以这8个数的方差$2=公匕=22.应选A. o4(3)由高中三个年级学生的总样本平均数为4.1,40X5 + 30工2 + 30X3_可得 40+30+30=41,解得 *2=4.因为总样本方差为3.14,所以盖X 3.5 + (54.1月+需X 2 + (4 4.1归+需X + (3 4.l)2 =3.14,解得s3=15将一组数据按从小到大或从大到小的
10、顺序排列,处在最中间的一个数 中位数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶 数时)叫做这组数据的中位数一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫 众数一做这组数据的众数3.总体离散程度的估计(1)方差和标准差1区 一假设一组数据是国,X2,,羽,用X表示这组数据的平均数,称打3 X )2Hi=_n /1 nZZ-为这组数据的方差,也可以写成应二田复的形式;称、X )2为这组数Hi= 4三 1据的标准差.(2)总体方差和标准差一般式:如果总体中所有个体的变量值分别为力,总体平均1 N 数为y ,那么总体方差s2=r4(匕一丫产加权式:如果总体的N个变
11、量值中,不同的值共有网女WN)个,不妨记为丫2,,Yk,其中匕出现的频数为力(i=l,2,,左),那么总体方差为S2=与 力(匕一亍产总体标准差:S=y.(3)样本方差和标准差如果一个样本中个体的变量值分别为yi,X,样本平均数为7,那么称S2=!(V亍户为样本方差,5 =正为样本标准差.ni=(4)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为总,样 本方差为以分两层抽样的情况为例,假设第一层有机个数,分别为%2,,无”平均数为x,方差为R第二层有几个数,分别为yi,V,力,平均数为y,1 m1 m 1 n1 n方差为.贝h=加2产s仁R&SX E ys上
12、部;(,一,产那么行=日土犷2 =1mn心率+( x co )2 + 小+( y - co 归).常用结论1 .频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底、/ZZ1/WZ/WZ/ZXZZZZZXZZN/XZ/N/ZZVZZVZwySZZSZSZZSZZZZZZSZXZZS/ZZSZZZWZSZZZVZ.边中点的横坐标之和.*SZZV/X/ZW/lZWWW/ZW/WX/WX/ZZVZ/1/W/ZZ/Z/*(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. /Z/Z/Z/ZZX/ZVZX/Z
13、KZZ/ZZZVZZ1ZZZZZZZZXZZ1/ZZZZ1ZwZ1/ZZ1/ZZKZZZZs/ZS1ZZKZZZZ1/KZZZKZZZKZZZKZZ*2 .平均数、方差的公式推广假设数据 X2,% 的平均数为 x ,那么 mxa, mx2-a, mxa, , mxnra的平均数是m x +a.(2)数据1, X2,,X”的方差为一.数据i+a, X2-a, , %+。的方差也为处;数据(2X1, 6ZX2,,的方差为。2$2.O激活基本技能一、易错易误辨析(正确的打“ J”,错误的打“X”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数
14、据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)任何一组数据的第50百分位数与中位数的值是相同的.()答案(1)V (2)X (3)V(4)V二、教材习题衍生1 .(多项选择)以下数字特征能反映样本数据的分散程度、波动情况的有(A.极差B.平均数C.方差D.标准差答案ACD2 .假设某校高一年级8个班参加合唱比赛的得分分别为 87,89,90,91,92,93,94,96,那么这组数据的中位数和平均数分别是()A. 91.5 和 91.5B. 9L5 和 92C. 91 和 91.5D. 92 和 9291+92A这组数据为 87,89,90
15、,91,92,93,94,96, 中位数是-5一=%.5, 87 + 89+90+91+92+93+94+96平均数 x =o=915O3 .某车间12名工人一天生产某产品(单位:kg)的数量分别为 13.8/3/3.5,15.7/3.64.844.655.2,15.8/5.4,那么所给数据的第25,50,75百 分位数分别是.13 744.745.3 将12 个数 据按从 小到大 排序:13 , 13.5 , 136/3.8,14,14.6/4.8/5,15.2/5.4/5.7/5.8.由z=12X25% = 3,得所给数据的第25百分位数是第3个数据与第4个数l t u l s 13.6+
16、13.8据的平均数即=13.7;由z=12X50% = 6,得所给数据的第50百分位数是第6个数据与第7个数 l g 14.6+14.8据的平均数,即5=14.7;由i=12X75%=9,得所给数据的第75百分位数是第9个数据和第10个数ll 口 15.2+15.4据的平均数,即刁=1534. 一组数据的平均数是28,方差是4,假设将这组数据中的每一个数据都加 上20,得到一组新数据,那么所得新数据的平均数是,方差是.48 4 设该组数据为XI, X2,,Xn9那么新数据为X1+20,及+20,,咒+20,记新数据的平均数为1 ;Xl+X2-ll-X,znxi + 20+x2+20+x+20=
17、20+28=48.因为 s2=%(%L;)2 + (%2 工+(%一工)2, 1所以 s 2=xi + 20( x +20)2+%2+20( x+20)2+ + 8?+20( x+ 20)2=52=4.细研考点-突破题型 考点一总体百分位数的估计,多维探究,考向1计算一组数据的第百分位数典例1 1从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们 的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.分别求出这组数据的第25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)假设用第25,50,95百
18、分位数把公司生产的珍珠划分为次品、合格品、优等 品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9.因为共有12个数据,所以12X25% = 3,12X50% = 6/2X95%=lL4,q n_|_o 3那么第25百分位数是 . =8.15,廿、八l白8.5 + 8.5第50百分位数是一5一=85第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12义15%=1.8,那么第15百分位数是第2个数 据为7.9.即产品质量较小的前15%的产
19、品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是&15 g,第50百分位数为8.5 g, 第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍 珠为优等品,质量大于9.9 g的珍珠为特优品.考向2根据频率分布直方图计算样本数据的百分位数典例12某市为了了解人们对“中国梦”的伟大构想的认知程度,对不 同年龄和不同职业的人举办了一次“一带一路”知识竞赛,总分值100分(90分及 以上为认知程度高),现从参赛者中抽取了 工人,按年龄分成5组(
20、第一组:20,25), 第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45),得到如 图所示的频率分布直方图,第一组有5人.频率/组距0.070.060.050.040.030.020.0120 25 30 35 40 45 年龄/岁求工;(2)求抽取的x人的年龄的50%分位数(结果保存整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,9% 求这10人成 绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路” 的认知程度.解(1)第一组频率为0.01义5=0.05,所以 c = 100.(2)由题图
21、可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比 例为70%,所以抽取的x人的年龄的50%分位数在30,35)内,由30 + 0.500.40 95”,r ,、, ,5X32,所以抽取的x人的年龄的50%分位数为32.U.7U-0.403(3)把参赛的10 人的成绩按从小到大的顺序排列: 88,90,92,92,95,96,96,97,98,99,90+92计算10X20%=2,所以这10人成绩的20%分位数为一%一=91,这10人 成绩的平均数为=X (88+90+92+92+95+96+96+97+98+99) = 94.3.评价:从第20百分位数和平均数来看,参赛人员的认知程
22、度很高.畲反思领悟1 .计算一组个数据的第p百分位数的一般步骤第一步第一步按从小到大排列原始数据第二步计算i=n x p%假设,不是整数,而大于i的比邻整数为那么第p百分位数为第j项数据第三步假设i是整数,那么第p百分位数为第i项与 第(i +1)项数据的平均数2 .频率分布直方图中第.百分位数的计算确定百分位数所在的区间a, b).确定小于和小于。的数据所占的百分比分别为%, %,那么第P百分跟进训练1. (1)一组数据为 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36,那么这组数据的第 25 百分位数是()A. 15B. 25C. 50D. 75(2)某班
23、的全体学生参加消防安全知识竞赛,成绩的频率分布直方图如图, 数据的分组依次为:20,40), 40,60), 60,80), 80,100.估计本班学生的消防 安全知识成绩的第90百分位数是()频率/组距0.0200.0150.0100.005020 40 6080 100成绩/分B. 80A. 93C. 90C. 90D. 95(1)A (2)A (1)由小到大排列的结果:6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 一共11项.由11X25% = 2.75,故第25百分位数是15.应选A.(2)由频率直方图得,从左到右的第一、二、三、四小组的频率分别是
24、0.10、 0.20. 0.40、0.30.第一、二、三小组的频率之和为010+0.20+0.40=0.700.90,所以第90百分位数处在第四组80,100内,为80+20X所以第90百分位数处在第四组80,100内,为80+20X _1.00-0.70%93.考点二 总体集中趋势的估计题组通关1 .有两位射击运发动在一次射击测试中各射靶7次,每次命中的环数如下: 甲:7 8 109 8 86乙:9 107 8 7 7 8那么以下判断正确的选项是()A.甲射击的平均成绩比乙好B.乙射击的平均成绩比甲好C.甲射击的成绩的众数小于乙射击的成绩的众数D.甲射击的成绩的中位数等于乙射击的成绩的中位数
25、D 由题意得,甲射击的平均成绩为=7 + 8+10三+ 8 + 8+6 = 8,众 _9+10+7+8+7+7+8数为8,中位数为8;乙射击的平均成绩为%乙=q=8, 众数为7,中位数为8.故甲射击的平均成绩等于乙射击的平均成绩,甲射击的成绩 的众数大于乙射击的成绩的众数,甲射击的成绩的中位数等于乙射击的成绩的中 位数,应选D.2 .有13位同学参加学校组织的才艺表演比赛,他们所得的分数互不相 同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖, 在这13名同学成绩的统计量中只需知道一个量,它是(填“众数”“中 位数”或“平均数”).中位数因为7位获奖者的分数肯定是13名参赛
26、选手中最高的,所以把13 个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获 奖了.3 . (2021天津河西区期末)某校为了解全校高中学生五一假期参加实践活动 的情况,抽查了 100名学生,统计他们假期参加实践活动的时间,绘成的频率分 布直方图如下图.求这100名学生中参加实践活动时间在610小时的人数;(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.解(l)100Xl-(0.04+0.12+0.05)X2 = 58,即这 100 名学生中参加实践 活动时间在610小时的人数为58.(2)由频率分布直方图可以看出,最高矩形底边中点的横坐标为7,故这10()
27、 名学生参加实践活动时间的众数的估计值为7小时.(0.04+0.12)X2=0.32, (0.04+0.12+0.15)X2=0.62,中位数 t 满足 6V 时).畲反思领信1 .众数 中位数和平均数的意义众数描述变量的值出现次数最多的数;中位数等分样本数据所占的频率;平 均数反映所有数据的平均水平.2.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等, 由此可以估计中位数的值.(2)平均数:平均数的估计值等于每个小矩形的面积乘小矩形底边中点的横 坐标之和.(3)众数:最高的矩形的底边中点的横坐标.一考点三总体离散程度的估计,多维探究卜考向1分层随机抽样的均值与方差典例21 (2021 .烟台期末)为调查高一、高二学生心理健康达标情况,某