《八、统计(一)随机抽样和用样本估计总体(学生)11784.docx》由会员分享,可在线阅读,更多相关《八、统计(一)随机抽样和用样本估计总体(学生)11784.docx(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2016届高三文科数学 第一轮复习系列 统计(1)随机抽样和用样本估计总体(1) 主要内容: 11、简单随机机抽样 2、分分层抽样 33、系统抽样样一、简单随机抽抽样: (1)抽取方方式:逐个不放回回抽取;(2)每个个体体被抽到的概概率相等;(3)常用方法法:抽签法和随随机数法提醒简单单随机抽样中中易忽视样本本是从总体中中逐个抽取,是是不放回抽样样,且每个个个体被抽到的的概率相等1下列抽取样样本的方式是是简单随机抽抽样的有()从无限多个个个体中抽取550个个体作作为样本;箱子里有1000支铅笔,今从中选取取10支进行行检验在抽样操作作时,从中任意拿拿出一支检测测后再放回箱箱子里;从50个个体体
2、中一次性抽抽取5个个体体作为样本A0个B1个C2个 D3个解析:选A不满足样本本的总体数较较少的特点;不满足不放放回抽取的特特点;不满足逐个个抽取的特点点2某公司在甲甲、乙、丙、丁四个地区区分别有1550,120,180,150个销销售点公司为了调调查产品销售售情况,需从这6000个销售点点中抽取一个个容量为1000的样本,记这项调查查为;在丙地区有有20个大型型销售点,要从中抽取取7个调查其其销售收入和和售后服务等等情况,记这项调查查为,则完成,这两项调查查宜采用的抽抽样方法依次次是()A分层抽样法法,系统抽样法法B分层抽样法法,简单随机抽抽样法C系统抽样法法,分层抽样法法D简单随机抽抽样法
3、,分层抽样法法解析:选B一一般甲、乙、丙丙、丁四个地地区会存在差差异,采用分分层抽样法较较好在丙地区中中抽取的样本本个数较少,易易采用简单随随机抽样法3(20133江西高考考)总体由编号号为01,02,19,20的200个个体组成成利用下面的的随机数表选选取5个个体体,选取方法是是从随机数表表第1行的第第5列和第66列数字开始始由左到右依依次选取两个个数字,则选出来的的第5个个体体的编号为()781665572080263140702436997280198320492234493582003623486969387481A08B07C02 D01解析:选D从从随机数表第第1行的第55列和第6
4、列列数字开始由由左到右依次次选取两个数数字,则选出出的数字为008,02,14,07,01,故选出的的第5个个体体的编号为001.二、系统抽样的的步骤假设要从容量为为N的总体中抽抽取容量为nn的样本(1)先将总体体的N个个体编号号;(2)确定分段段间隔k,对编号进行行分段当(n是样本容量量)是整数时,取k;(3)在第1段段用简单随机机抽样确定第第一个个体编编号l(lk);(4)按照一定定的规则抽取取样本通常是将l加上间隔k得到第2个个个体编号llk,再加k得到第3个个个体编号ll2k,依次进行下下去,直到获取整整个样本提醒系统统抽样中,易易忽视抽取的的样本数也就就是分段的段段数,当不是整数时时
5、,注意剔除除,剔除的个个体是随机的的,各段入样样的个体编号号成等差数列列1、 (20114广东高高考)为了解1 000名学学生的学习情情况,采用系统抽抽样的方法,从中抽取容容量为40的的样本,则分段的间间隔为()A50 B40C25 D20解析:由25,可可得分段的间间隔为25.故选C.答案:C解决系统抽样问问题的两个关关键步骤(1)分组的方方法应依据抽抽取比例而定定,即根据定义义每组抽取一一个样本(2)起始编号号的确定应用用简单随机抽抽样的方法,一旦起始编编号确定,其他编号便便随之确定了了2、已知某单位位有40名职职工,现要从中抽抽取5名职工工,将全体职工工随机按140编号,并按编号顺顺序平
6、均分成成5组按系统抽样样方法在各组组内抽取一个个号码567892031(1)若第1组组抽出的号码码为2,则所有被抽抽出职工的号号码为_;(2)分别统计计这5名职工工的体重(单位:千克),获得体重重数据的茎叶叶图如图所示示,则该样本的的方差为_解析:(1)由由题意知被抽抽出职工的号号码为2,10,18,26,34.(2)由茎叶图图知5名职工工体重的平均均数69,则该样本的方差差s2(5969)2(6269)2(7069)2(7369)2(8169)262.答案:(1)22,10,18,26,34(2)62三、分层抽样(1)定义:在在抽样时,将总体分成成互不交叉的的层,然后按照一一定的比例,从各层
7、独立立地抽取一定定数量的个体体,将各层取出出的个体合在在一起作为样样本,这种抽样方方法是一种分分层抽样(2)分层抽样样的应用范围围:当总体是由差异异明显的几个个部分组成时时,往往选用分分层抽样提醒分层层抽样中,易易忽视每层抽抽取的个体的的比例是相同同的,即.1(20144广东高考考)已知某地区区中小学生人人数和近视情情况分别如图图1和图2所所示为了解该地地区中小学生生的近视形成成原因,用分层抽样样的方法抽取取2%的学生生进行调查,则样本容量量和抽取的高高中生近视人人数分别为()A100,110B200,10C100,220 D200,20解析:选D易易知(3 50044 50022 000)2
8、%2000,即样本本容量;抽取取的高中生人人数为2 0002%400,由于其近近视率为500%,所以近近视的人数为为4050%220.2某公司有一一批专业技术术人员,对他们进行行年龄状况和和接受教育程程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下3550岁50岁以上本科803020研究生x20y(1)用分层抽抽样的方法在在3550岁年龄龄段的专业技技术人员中抽抽取一个容量量为5的样本本,将该样本看看成一个总体体,从中任取22人,求至少有11人学历为研研究生的概率率;(2)在这个公公司的专业技技术人员中按按年龄状况用用分层抽样的的方法抽取NN个人,其中35岁岁以下48人人,50岁以
9、上上10人,再从这N个人中随机机抽取1人,此人的年龄龄为50岁以以上的概率为为,求x,y的值解:(1)用分分层抽样的方方法在3550岁年龄龄段的专业技技术人员中抽抽取一个容量量为5的样本本,设抽取学学历为本科的的人数为m,解得m3.抽取的样本中有有研究生2人人,本科生33人,分别记记作S1,S2;B1,B2,B3.从中任取2人的的所有等可能能基本事件共共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人人的学历为研研究生的基本本事件有7个个:(S1,B1),(S
10、1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2)从中任取2人人,至少有11人学历为研研究生的概率率为.(2)由题意,得得,解得N78.3550岁岁中被抽取的的人数为7884811020,解得x40,y5.即x,y的值分分别为40,5.类题通法进行分层抽样的的相关计算时时,常利用以下下关系式巧解解:(1);(2)总体中某某两层的个体体数之比等于于样本中这两两层抽取的个个体数之比课后练习:一、选择题1(20144湖南高考考)对一个容量量为N的总体抽取取容量为n的样本,当选取简单单随机抽样、系统抽样和和分层抽样三三种不同方法法抽取样本时时,总体中每个个个体被
11、抽中中的概率分别别为p1、p2、p3,则()Ap1p22p3Bp2p3p1Cp1p332,s1s2B.12,s1s2C.1s2 D.12,s1s2解析:选D由由题中茎叶图图可得161,262,s1,s2,故选DD.4.(20155沈阳质量量检测)某大学对11 000名学学生的自主招招生水平测试试成绩进行统统计,得到样本频频率分布直方方图(如图),则这1 000名学学生在该次自自主招生水平平测试中成绩绩不低于700分的学生数数是()A300 B400C500 D600解析:选D依依题意得,题题中的1 000名学学生在该次自自主招生水平平测试中成绩绩不低于700分的学生数数是1 000(0.035
12、50.01150.0010)106000,选D.甲乙29 36 2 1 3 3 1 6 470.040.050.060.070.080.091 2 3 6692 9972 4 6 5.(20155郑州第一一次质量预测测)PM2.55是指大气中中直径小于或或等于 2.5微米米的颗粒物,也称为可入入肺颗粒物如图是根据据某地某日早早7点到晚88点甲、乙两个PMM2.5监测测点统计的数数据(单位:毫克/立方方米)列出的茎叶叶图,则甲、乙两地浓度度的方差较小小的是()A甲 BB乙C甲、乙相等等 D无法确定解析:选A从从茎叶图上可可以观察到:甲监测点的的样本数据比比乙监测点的的样本数据更更加集中,因因此甲
13、地浓度度的方差较小小6如图是依据据某城市年龄龄在20岁到到45岁的居居民上网情况况调查而绘制制的频率分布布直方图,现已知年龄龄在30,35),35,400),400,45的的上网人数呈呈递减的等差差数列分布,则网民年龄龄在35,40)的频率为()A0.04 B0.06C0.2 D0.3解析:选C由由已知得网民民年龄在220,25)的频率为00.0150.005,在225,30)的频率为00.0750.335.因为年年龄在300,35),35,400),400,45的的上网人数呈呈递减的等差差数列分布,所所以其频率也也呈递减的等等差数列分布布,又年龄在在30,445的频率率为10.050.350
14、.6,所以年年龄在35,40)的频率为00.2.故选选C.二、填空题7(20144江苏高考考)为了了解一一片经济林的的生长情况,随机抽测了了其中60株株树木的底部部周长(单位:cm),所得数据据均在区间80,1330上,其频率分布布直方图如图图所示,则在抽测的的60株树木木中,有_株株树木的底部部周长小于1100 cm.解析:由频率分分布直方图可可得树木底部部周长小于1100 cm的频率是是(0.02550.0115)100.4,又样本本容量是600,所以频数数是0.460244.答案:248下图茎叶图图是甲、乙两人在55次综合测评评中的成绩,其中一个数数字被污损,则甲的平均均成绩超过乙乙的平
15、均成绩绩的概率为_甲乙98210893379解析:由图可知知,甲的5次次成绩分别是是88,89,90,91,92,易知知甲的平均分分为90.乙乙的成绩分别别是83,83,87,99,其中中被污损的成成绩为90到到99中的某某一个设被污损的的那次成绩为为x,由甲的平平均成绩超过过乙的平均成成绩,得90.所所以x98.又又x是90到999的十个整整数中的其中中一个,其中中有8个整数数小于98,所所以x98的概概率为.答案:9(20155南昌一模模)在一次演讲讲比赛中,6位评委对对一名选手打打分的茎叶图图如图所示,若去掉一个个最高分和一一个最低分,得到一组数数据xi(1i4),在如图所所示的程序框框图中,是这4个数数据的平均数数,则输出的v的值为_789780241解析:根据题意意得到的数据据