《第一节 随机抽样、常用统计图表.pptx》由会员分享,可在线阅读,更多相关《第一节 随机抽样、常用统计图表.pptx(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节随机抽样、常用统计图表成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468也可联系微信fjmath加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期 1.了解简单随机抽样的含义,掌握两种简单的抽样方法:抽签法和随机数法;了解分层随机抽样,掌握各层样本量比例分配的方法.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.2.理解统计图表的含义,能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.CONTENTS/目录目录CONTENTS010102020303/目录目录知识知识 逐
2、点夯实逐点夯实考点考点 分类突破分类突破课时课时 过关检测过关检测目录0101目录1.随机抽样(1)简单随机抽样定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样;简单随机抽样常用方法:抽签法和随机数法.抽签法随机数法目录(2)分层随机抽样定义:一般地,按一个或多个变量把总
3、体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配;分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.分层随机抽样层比例分配目录目录目录条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,
4、这样一种表达和分析数据的统计图称为条形图;折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图;扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.目录1.判断正误.(正确的画“”,错误的画“”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()答案:(1)(2)抽签法和随机数法都是简单随机抽
5、样.()(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()答案:(2)答案:(3)答案:(4)目录2.为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A.总体指的是该市参加升学考试的全体学生B.样本是指抽查的1000名学生的数学成绩C.样本量指的是抽查的1000名学生D.个体指的是抽查的1000名学生中的每一名学生解析:B对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指抽查的
6、1000名学生的数学成绩,故B正确;对于C,样本量是1000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误.目录3.为了推动全民读书活动再次掀起高潮,某市文化局按性别分层随机抽样的方法从该市平均月阅读量超过十万字的200名市民中抽取30人进行比赛,若30人中共有男性12人.则这200名市民中女性可能有()A.12人B.18人C.80人D.120人目录4.甲、乙、丙、丁四组人数分布如图所示,根据扇形统计图的情况可以知道丙、丁两组人数和为()A.150B.250C.300D.400解析:B甲组人数为120,占总人数的百分比为30%,总人数为12030%400.丙、丁两组人数和占总人数的
7、百分比为130%7.5%62.5%,丙、丁两组人数和为40062.5%250.目录5.某市交通局对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70km/h以下的汽车有辆.解析:由频率分布直方图可得时速在70km/h以下的频率是(0.010.03)100.4,所以频数是0.45020.答案:20目录0202目录抽样方法考向1简单随机抽样【例1】(1)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5
8、个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.02C.63D.01目录解析(1)根据题意,依次读出的数据为65(舍去),72(舍去),08,02,63(舍去),14,07,02(舍去,重复),43(舍去),69(舍去),97(舍去),28(舍去),01.故选D.答案(1)D目录(2)我国古代数学名著九章算术有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石
9、答案(2)B目录解题技法1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).目录考向2分层随机抽样【例2】(1)某校高一年级1000名学生的血型情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为50的样本,则从高一年级A型血的学生中应抽取的人数是()A.11B.22C.110D.220目录解析(1)由图中数据可知高一年级A型血的学生占高一年级学生总体的22%,所以抽取一个容量为50的样
10、本,从A型血的学生中应抽取的人数是5022%11.答案(1)A目录(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案(2)18目录目录考向3分层随机抽样的平均值【例3】有4万个大于70的两位数,从中随机抽取了3000个数,统计如下表:数据x70 x7980 x8990 x99个数8001300900平均数78.18591.9请根据表格中的信息,估计这4万个数的平均数约为.答案85.23目录解题技法目录1.甲、乙两套设备生产的同类型产品共48
11、00件,采用分层随机抽样的方法从中抽取一个样本量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.答案:18002.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为分.答案:95目录统计图表考向1扇形(饼状)图【例4】2022年7月15日,国家统计局发布了2022年上半年居民人均消费支出及构成情况如图所示,根据图中的信息,针对2022年上半年,下列结论不正确的是()目录A.居民在“教育文化娱乐”上的人均消费支出的占比为9.8%B.居民人均消费支出为11440元C.居民在“居住”“生活用品及服务”
12、“医疗保健”上的人均消费支出之和大于在“食品烟酒”上的人均消费支出D.居民在“衣着”上的人均消费支出比在“交通通信”上的人均消费支出的一半少目录答案D目录解题技法通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.考向2条形图与折线图【例5】(多选)人口普查是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,根据人口普查的基本情况制定社会、经济、科教等各项发展政策.截至2022年6月,我国共进行了七次人口普查,如图是这七次人口普查的城乡人口数和城镇人口比重情况,下列说法正确的是()目录A.乡村人口数逐次增加B.历次人口普查中第七次普查城镇人口最多C.城镇人口数逐次增加D.城镇人
13、口比重逐次增加解析对于A,根据题中条形图,知乡村人口数在前四次普查中逐次增加,在后三次普查中逐次减少,故A不正确;对于B,从题中条形图,知在历次人口普查中第七次普查城镇人口最多,故B正确;对于C,根据题中条形图,知城镇人口数逐次增加,故C正确;对于D,从题中折线图对应的数据可得,七次人口普查中城镇人口比重依次为13.26,18.30,20.91,26.44,36.22,49.68,63.89,可知城镇人口比重逐次增加,故D正确.故选B、C、D.答案BCD目录解题技法折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.目录考向3频率分布直方
14、图【例6】随机抽取100名学生,测得他们的身高(单位:cm),按照区间160,165),165,170),170,175),175,180),180,185分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170cm及以上的学生人数;解(1)由频率分布直方图可知5(0.07x0.040.020.01)1,解得x0.06,身高在170cm及以上的学生人数为1005(0.060.040.02)60.目录(2)将身高在170,175),175,180),180,185区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学
15、生人数.目录目录1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为()A.100,20B.200,20C.200,10D.100,10目录解析:B由题图甲可知学生总数是10000,样本量为100002%200,高中生为20002%40人,由题图乙可知高中生近视率为50%,所以人数为4050%20.目录2.某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2022年1月至2022年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了如图所示的折线图.根
16、据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8、9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳目录解析:D由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至
17、5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.目录3.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图回答下列问题:(1)25,30)年龄组对应小矩形的高度是多少?解:(1)设25,30)年龄组对应小矩形的高度为h,则5(0.01h0.070.060.02)1,解得h0.04.目录(2)据此估计该市“四城同创”活动中志愿者年龄在25,35)内的人数是多少?解:(2)志愿者年龄在25,35)内的频率为5(0.040.07)0.55,故志愿者年龄在25,35)内的人数约为0.55
18、800440.目录0303目录1.“嫦娥五号”的成功发射,实现了中国航天史上的五个“首次”.某中学为此举行了“讲好航天故事”的主题演讲比赛.若将报名的30位同学编号为01,02,30,经随机模拟产生了36个随机数如下,则选出来的第7个个体的编号为()456732121231020104521520011251293204923449358200362348696938748146527364A.12B.20C.29D.23目录解析:C有效编号为:12,02,01,04,15,20,29,得到选出来的第7个个体的编号为29.故选C.目录2.为了了解全校240名高一学生的身高情况,从中随机抽取40
19、名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一学生的身高解析:B总体是240名高一学生的身高,则个体是每名高一学生的身高,故样本是抽取的40名高一学生的身高.故选B.目录3.已知某居民小区户主人数和户主对户型结构的满意率分别如图和图所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()A.240,18B.200,20C.240,20D.200,18解析:A样本量n(250150400)30%240,抽取的户主对四居室满意的人
20、数为15030%40%18.目录4.某校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则这两个数学建模兴趣班所有同学的平均成绩是()A.85分B.85.5分C.86分D.86.5分目录5.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制成如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80100分的学生人数是()A.15B.18C.20D.25目录目录6.为了比较甲、乙两名学生的数学学科素养的各项能力指标值(
21、满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述错误的是()A.甲的逻辑推理能力指标值高于乙的逻辑推理能力指标值B.甲的直观想象能力指标值高于乙的数学建模能力指标值C.乙的六维能力指标值整体水平高于甲的六维能力指标值整体水平D.甲的数学运算能力指标值高于甲的直观想象能力指标值目录目录7.在九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共
22、100钱,要按照各人带多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()D.三者中甲付的钱最多,丙付的钱最少目录目录8.(多选)某学校为调查学生在一周生活方面的支出情况,抽取了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在50,60元的学生有60人,则下列说法正确的是()A.样本中支出在50,60元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则一定有600人的支出在50,60元目录目录9.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间10,110内,其频
23、率分布直方图如图所示.已知活动时间在10,35)内的频数为80,则n的值为.答案:800目录10.某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到如图的统计图表,则样本中人数最多的是层,样本中E层的男生人数为.目录解析:由图可知女生人数为60,则男生人数为40,样本中A层的人数为94010%13;样本中B层的人数为244030%36;样本中C层的人数为154025%25;样本中D层的人数为94020%17;样本中E层的人数为34015%9.故样本中B层的人数最多,样本中E层的男生人数为4015%6.答案:B6
24、目录11.(多选)某企业2022年12个月的收入与支出数据的折线图如图,已知:利润收入支出,根据该折线图,下列说法正确的是()A.该企业2022年1月至6月的总利润低于2022年7月至12月的总利润B.该企业2022年1月至6月的平均收入低于2022年7月至12月的平均收入C.该企业2022年8月至12月的支出持续增长D.该企业2022年11月份的月利润最大目录解析:ABC因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线统计图可知8月至
25、12月的虚线是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.目录12.将一个总体分为A,B,C三层,其个体数之比为532.若用分层随机抽样的方法抽取容量为100的样本,则应从C中抽取个个体;若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为.答案:2020.5目录13.某企业三月中旬生产A,B,C三种产品共3000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1300样本容量(件)130由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本
26、容量多10,根据以上信息,可得C的产品数量是件.目录答案:800目录14.为了对某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0m72n).(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;目录目录15.为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约有1000万人,从0岁到100岁的居民年龄结构的频率分布直方图如图所示.为了解各年龄段居民签约家庭医生的情况,现调查了10
27、00名年满18周岁的居民,各年龄段被访者签约率如图所示.目录(1)估计该城市50岁以上且已签约家庭医生的居民人数;解:(1)估计该城市5060岁签约的居民有10000.0151055.7%83.55(万人);6070岁签约的居民有10000.0101061.7%61.7(万人);7080岁签约的居民有10000.0041070.0%28(万人);80岁以上签约的居民有10000.0031075.8%22.74(万人).故估计该城市50岁以上且已签约家庭医生的居民有83.5561.72822.74195.99(万人).目录(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的
28、签约率提高到55%以上,应着重提高图中哪个年龄段的签约率?并根据已有数据陈述理由.解:(2)由题意可估计该城市年龄在1020岁的居民有10000.0051050(万人);年龄在2030岁的居民有10000.01810180(万人).所以估计该城市居民年龄在1830岁的人数大于180万,小于230万,签约率为30.3%;估计该城市居民年龄在3050岁的有10000.03710370(万人),签约率为37.1%;目录估计该城市居民年龄在50岁以上的有10000.03210320(万人),签约率超过55%,上升空间不大.故由以上数据可知这个城市居民年龄在3050岁这个年龄段的人数约为370万,与其他年龄段相比人数是最多的,且签约率与55%相比较低,所以为把该城市满18周岁居民的签约率提高到55%以上,应着重提高3050岁这个年龄段的签约率.T TH HA AN NK K.YOU.YOU