《9.2 用样本估计总体 -(人教A版2019选择性必修第二、三册)(学生版).docx》由会员分享,可在线阅读,更多相关《9.2 用样本估计总体 -(人教A版2019选择性必修第二、三册)(学生版).docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用样本估计总体知识剖析1总体取值规律的估计频率直方图(1)画频率直方图的步骤求极差-决定组距与组数-将数据分组-列频率分布表-画频率分布直方图.(2)小长方形的面积=频率 (3)在直方图中,各小长方形的面积之和等于1.2总体百分位数的估计第p百分位数的概念 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且 至少有(100 - p)%的数据大于或等于这个值.计算一组几个数据的第p百分位数 第一步:按从小到大排列原始数据;第三步:若i不是整数,而大于i的比邻整数为则第p百分位数为第/项数据;若i是整数,则第p百分位数为 第i项与第(i + 1)项数据
2、的平均数.四分位数的概念 四分位数:包含第25百分位数,第50百分位数,第75百分位数.中位数相当于第50百分位数,第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三 四分位数或上四分位数.3总体集中趋势的估计一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体 上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于 中位数.平均数、中位数平均数、中位数中位数平均数平均数中位数一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述,可以用平均数、中位数;而对分 类型数据(如校服
3、规格、性别、产品质量等级等)集中趋势的描述,可以用众数.4总体离散程度的估计方差,标准差的概念假设一组数据是%1/2功,用元表示这组数据的平均数,我们称nS2 = -Y - X)2九乙,i=l这组数据的方差,为了计算方便也可以用;21媛-北2标准差是S =R鸳=式修一元)2方差,标准差的意义方差越大,表明数据波动越大,越不稳定;方差越小,表明数据波动越小,越稳定.经典例题【题型一】常见统计数据【典题1】某地一年之内12个月的月降水量从小到大分别为:46, 51, 48, 53, 56, 53, 56, 64, 58,56, 66, 71,则该地区的月降水量20%分位数和75%分位数为()A.
4、51, 58B. 51, 61C. 52, 58D. 52, 61【典题2甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:下列说法错误的是()A.从平均数和方差相结合看,甲波动比较大,乙相对比较稳定B.从折线统计图上两人射击命中环数走势看,甲更有潜力C.从平均数和命中9环及9环以上的次数相结合看,甲成绩较好D.从平均数和中位数相结合看,乙成绩较好【典题3已知为如的平均数为1。,标准差为2,则2%1 - lf2x2 - 1,2xn - 1的平均数和标准差分别为.【典题4】为了解本市居民的生活成本,甲、乙、内三名同学利用假期分别对三个社区进行了“家庭每月日 常消费额”的调查.他们将
5、调查所得到的数据分别绘制成频率分布直方图(如图所示),甲、乙、丙所调查数据的标准差分别为Si,S2,S3,则它们的大小关系为()SiS2 S3甲元C S3 S2 SiB,S1 s3 s2D. S3 S S2【典题5】在发生某公共卫生事件期间,有专业机构认为该事件在一段事时间内没有发生大规模群体感染的 标志是“连续10日,每天新增疑似病例不超过7人”,过去10日,甲、乙、丙、丁四地新增疑似病例数据信 息如下:甲地:中位数为2,众数为3;乙地:总体平均数为2,总体方差为3;丙地:总体平均数为1,总体方差大于0;丁地:总体平均数为3,中位数为4.则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是
6、 地【典题6(多选)气象意义上从春季进入夏季的标志为“当且仅当连续5天每天日平均温度不低于22。.现 有甲、乙、丙三地连续5天日平均温度的记录数据(数据均为正整数,单位。C)且满足以下条件: 甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是30,平均数是24,方差是96根据以上数据,下列统计结论正确的是()A.甲地进入了夏季B.乙地进入了夏季C.不能确定丙地进入了夏季D.恰有2地确定进入了夏季巩固练习1 .(币以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78, 70, 72, 86, 88, 79, 80, 81, 94,
7、84, 56, 98, 83, 90, 91. 则这15人成绩的第80百分位数是.2 .(巧已知甲、乙两组数据(己按从小到大的顺序排列):甲组:27、28、39、40、50;乙组:24、n. 34、43、48、52.若这两组数据的30百分位数、80百分位数分别相等,则”等于 n. ()某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来 得到频率分布折线图(如图所示),据此估计此次考试成绩的众数是()A. 100 B. 110 C. 115 D. 120在某次测量中得到E的样本数据如下:80, 82, 82, 84, 84, 84, 84, 86, 86,
8、86, 86.若尸的样本数据恰好是E的样本数据都减去2后得到的数据,则关于E,尸两样本数据特征的下列说法中,正确的是()A.与F样本数据的众数为84B.瓦F样本数据的方差相同C.样本数据的平均数相同D.样本数据的中位数相同5.巧下列命题中不正确的是()A. 一组数据1, 2, 3, 3, 4, 5的众数大于中位数B.数据 6, 5, 4, 3, 3, 3, 2, 2, 2, 1 的 85%分位数为 5C.若甲组数据的方差为5,乙组数据为5, 6, 9, 10, 5,则这两组数据中较稳定的是乙D.为调查学生每天平均阅读时间,某中学从在校学生中,利用分层抽样的方法抽取初中生20人,高中生 10人.
9、经调查,这20名初中生每天平均阅读时间为60分钟,这10名高中生每天平均阅读时间为90分钟, 那么被抽中的30名学生每天平均阅读时间为70分钟.(*)已知数据%100是杭州市100个普通职工的2016年10月份的收入(均不超过2万元),设 这100个数据的中位数为,平均数为y,方差为z,如果再加上马云2016年10月份的收入%10式约100亿 元),则相对于汽、y z,这101个月收入数据()A.平均数可能不变,中位数可能不变,方差可能不变B.平均数大大增大,中位数可能不变,方差也不变C.平均数大大增大,中位数一定变大,方差可能不变D.平均数大大增大,中位数可能不变,方差变大.(*)设样本数据
10、的平均值和方差分别为2和5,若% =阳+ a(a为非零实数,i = 1, 2, 10),则%, 丫2,%。的均值和方差分别为()A. 2, 5 B. 2 + a, 5C. 2 + a, 5 + aD. 2, 5 + a8.(*)(多选)在全球新型冠状病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示 可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7 天的新增病例数计算,下列各项中,一定符合上述指标的是()A.平均数元43B.标准差SW2C.平均数前W 3且极差小于或等于2D.众数等于1且极差小于或等于4(多选)甲同学投掷骰子5次,并请乙
11、同学将向上的点数记录下来,计算出平均数和方差.由于记 录遗失,乙同学只记得这五个点数的平均数为2,方差在区间1.2, 2.4内,则这五个点数()A.众数可能为1B.中位数可能为3C. 一定不会出现6D.出现2的次数不超过两次【题型二】频率直方图的运用【典题1】 某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段 40,50)/50,60), 60,70), 70,80)/80,90)/90,100后,画出如图所示部分频率分布直方图.观察图形,回答 下列问题:(1)求第四小组的频率,并补全这个频率分布直方图;(2)估计这次考试成绩的中位数(结果取整数值);(3)估计这
12、次考试的众数、平均分、方差.巩固练习()为了 了解某种进口茶叶的质量(单位:克),从中抽取若干包进行检查,获得样本的频率分布直方图如图所示.若已知样本中质量在1555160.5)内的茶叶有10包,则样本容量为()C. 70 D. 50C. 70 D. 501. ()某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若 130140分数段的人数为90人,则90100分数段的人数为()A. 740 B. 180C. 720 D. 540湍0.060.050.04混0.010湍0.060.050.04混0.0102. (*)某市要对辖区内的中学教师的年龄进行调查,
13、现从中随机抽出200名教师,已知抽到的教师年龄都 在25, 50)岁之间,根据调查结果得出教师的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频 率分布直方图估计该市辖区内中学教师的年龄的中位数大约是()25 30 35 40 45 50 年的(岁)A. 37.1 岁 B. 38.1 岁 C. 38.7 岁 D. 43.1 岁()(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调A.估计该地农户家庭年收入不低于8.5万元的农户比例为30%B.估计该地农户家庭年收入的第三四分位数为9万元C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地农户家
14、庭年收入的中位数为8万元5. ()(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学 习和体育锻炼协调发展.某学校对高一和高二年级每周在校体育锻炼时长进行了统计,得到数据(单位:小 时)如表:高一年级在校体育锻炼时长关于高一和高二年级在校体育锻炼时长,下列说法正确的是()分组频率2, 3)0.253, 4)0.304, 5)0.2060.25高二年级在校体育锻炼时长A.高一年级时长的众数比高二年级的大B.高一年级时长的平均数比高二年级的小 C.高一年级时长的中位数比高二年级的大 D.高一年级时长的方差比高二年级的大&()为对考生的月考成绩进行分析,某地区随机
15、抽查了 10000名考生的成绩,根据所得数据画了如下的 样本频率分布直方图.求成绩在600, 650)的频率;根据频率分布直方图算出样本数据的中位数;为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20人作进 一步分析,则成绩在550, 600)的这段应抽多少人?7. ()某学校1800名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组13, 14,第二组14, 15),第五组17, 18,如图是按上述分组方法得到的频率分布直方图.若成绩小于15秒认为良好,求该样本在这次百米测试中成绩良好的人数;请估计学校1800名学生中,成绩属于第四组的人数;请根据频率分布直方图,求样本数据的众数、中位数、平均数和方差.