《随机抽样-用样本估计总体(共14页).doc》由会员分享,可在线阅读,更多相关《随机抽样-用样本估计总体(共14页).doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上随机抽样、用样本估计总体一、高考考点1.简单随即抽样 一般地,设一个总体有N个个体, 从中 抽取n个个体作为样本(nN), 如果每次抽取时总体内的各个个体被抽到的机会都 , 则这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法: 和 .2. 系统抽样一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成 ,然后按照预先制定的规则,从每一部分抽取 个体,得到所需要的样本,这种抽样的方法叫做系统抽样.3.系统抽样的步骤为:(1)采用 的方式将总体中的个体编号; (2)将整个的编号进行 ,为将整个的编号进行分段,要确定 .当是整数时,;当不是整数时,通过从总体中
2、使剩下的个体数N能被整除,这时;(3)在第一段中用 确定起始的个体编号;(4)按照先确定的规则(常将加上间隔)抽取样本: .4.分层抽样在抽样时,将总体分成互不交叉的_,然后按照一定的_,从各层独立的抽取一定数量的_,将各层取出的个体合在一起作为_,这种抽样方法叫做分层抽样.当总体是由_组成时,往往选用分层抽样.5通常我们对总体作出的估计分成两种,一种是用 估计总体的分布,另一种是用 估计总体的数字特征.6.样本的频率分布样本中所有数据(或数据组)的 和 的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规律叫做 ,可以用频率分布直方图、折线图、茎叶图来表示。7.频率分布直方图的具体
3、做法如下:(1)求 (即一组数据中最大值与最小值的差);(2)决定 与 ;(3)将数据 ;(4)列频率 ;(5)画频率分布直方图.8.频率分布直方图中小正方形的 =组距=频率。9.连接频率分布直方图中小长方形上端中点,就得到 ,当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为 .10.众数、中位数在一组数据中出现 的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在 上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;11.平均数与方差如果这n个数据是,那么= 叫做这n个数据平均数;= 叫做这n个数据方差;同时 叫做这n个数据的标准差.12.根据
4、样本频率分布直方图,估计总体的众数、中位数和平均数 (1)众数:最高矩形下端中点的 . (2)中位数:直方图 平分线与横轴交点的横坐标. (3)平均数:每个小矩形的 与小矩形底边 的乘积之和. 二、自我检测1在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本采用随机抽样法:抽签取出20个样本;采用系统抽样法:将零件编号为00,01,99,然后平均分组抽取20个样本;采用分层抽样法:从一级品,二级品,三级品中一共抽取20个样本下列说法中正确的是()A无论采用哪种方法,这100个零件中每一个零件被抽到的概率都相等B两种抽样方法,这100个零件中每一个零件被抽到的概
5、率都相等;并非如此C两种抽样方法,这100个零件中每一个零件被抽到的概率都相等;并非如此D采用不同的抽样方法,这100个零件中每一个零件被抽到的概率是各不相同的22011朝阳一模 某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A8,8 B10,6 C9,7 D12,432011湖南六校联考 用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1160编号,按编号顺序平均分成20组(18号,916号,153160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是()A5
6、B6 C7 D84 某林场有树苗30000棵,其中松树苗4000棵,为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A25棵 B30棵 C15棵 D20棵5某初级中学领导采用系统抽样方法,从该校初一年级全体800名学生中抽50名学生做牙齿健康检查现将800名学生从1到800进行编号,求得间隔数k16,即每16人抽取一个人在116中随机抽取一个数,如果抽到的是7,则从3348这16个数中应取的数是()A40 B39 C38 D3762011江门一模 某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭在建设幸福广东的
7、某次分层抽样调查中,高收入家庭被抽取了6户,则在此次分层抽样调查中,被抽取的总户数为()A20 B24 C30 D3672012大同调研 将容量为的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为234641,且前三组数据的频数之和为27,则_.82012惠州调研 一个容量为20的样本,数据的分组及各组的频数如下表(其中x,yN*)分组10,20)20,30)30,40)40,50)50,60)60,70频数2x3y24则样本在区间10,50)上的频率为_9.2011山东卷 某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生,为了解学生的就业倾向
8、,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为_10. 某市教育行政部门为了对2010届高中毕业生学业水平进行评价,从该市高中毕业生抽取1000名学生学业水平考试数学成绩为样本进行统计,已知该样本中的每个值都是40,100中的整数,且频率分布直方图如图所示记这1000名学生学业水平考试数学平均成绩的最小可能值为,最大可能值为.(1)求,的值;(2)从这1000名学生中任取1人,试根据直方图估计其成绩位于中的概率(假设各小组数据平均分布在相应区间内的所有整数上) 三、 考点分类考点1 系统抽样例1 某校高中三年级的295名学生已经编号为1,2,295,为了
9、了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.考点2分层抽样例2 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.现要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.考点3频率分布直方图的绘制与应用例3 对某校高三年级学生参加社区服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数频率100.2524 20.05合计1频率/组距15252010030次数a()求出表中及图中的值;()若该校高三学生有240人,试估
10、计该校高三学生参加社区服务的次数在区间内的人数;()在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间内的概率.考点4茎叶图的应用例4 观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯 马利斯 0 8 1 3 4 6 5 2 2 3 6 8 5 4 3 3 9 9 7 6 6 1 1 4 9 4 4 5 0 6 1考点5 用样本的数字特征估计总体的数字特征例5 甲、乙两人在相同条件下各射击10次,每次
11、命中的环数如下:甲86786591047乙6778678795(1)分别计算以上两组数据的平均数;(2)分别计算以上两组数据的方差;(3)根据计算结果,估计一下两人的射击情况四、 巩固提高1数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是( )A97.2 B87.29 C92.32 D82.862从学号为050的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是:( )A. 5,15,25,35,45 B. 1,2,3,4,5 C. 2,4,6,8
12、,10 D. 4,13,22,31,403在2011年孝感高中“校园十佳歌手”大赛中,七位评委为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A. 92,2B. 92,2.8C. 93,2D. 93,2.84.已知一组数据的平均数是2,方差是,那么另一组数据的平均数和方差分别为( )A2, B4,3 C4, D2,15某台机床加工的100只产品中次品数的频率分布如下表:次品数0 12 34频率0.050.20.50.20.05则次品数的众数、中位数、平均数依次为 ( )A. 4,2,2 B. 2,1.5,1 C.
13、2, 2, 1 D. 2, 2, 26. 甲、乙两名运动员在某项测试中的6次成绩如茎叶图所示,分别表示甲乙两名运动员这项测试成绩的众数,分别表示甲乙两名运动员这项测试成绩的中位数,则有( )A. B. C. D. 7. 一个年级有12个班,每个班有50名学生,随机编为150号,为了解他们在课外的兴趣爱好。要求每班是40号学生留下来进行问卷调查,这里运用的抽样方法是( )A分层抽样 B抽签法 C随机数表法 D系统抽样法8.要考察某公司生产的500克袋装奶粉的质量是否达标,现从800袋牛奶中抽取50袋进行检验.先将800袋牛奶按000,001,799进行编号,如果从随机数表第8行第7列的数开始向右
14、读取,则最先检测的5袋牛奶的编号依次是( )A.55,67,19,98,10 B.556,719,810,507,175C.785,567,199,507,175 D.556,719,050,717,512(下面摘取了随机数表第8行)第8行:63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 799甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( ) A.30人,30人,30人 B.
15、30人,45人,15人C.25人,50人,15人 D.30人,50人,10人10. 下面的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( )A. B. C. D.11. 某班甲、乙两组学生数学期中考试的成绩的茎叶图如图,设甲、乙组的中位数分别为,甲、乙两组方差分A、 B、 C、 D、12.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则在这几场比赛中甲得分的中位数与乙得分的众数分别是( ) A、3,2 B、28,32 C、23,23D、8,213.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲
16、乙丙丁平均环数方差 从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是 A甲 B 乙 C 丙 D丁14现有60件产品,编号从1到60,若用系统抽样方法从中抽取6件检验,则所抽到的个体编号可能是( )A5,10,15,20, 25,30 B2,14,26,28,42,56C5,8,31,36,48,54 D3,13,23,33,43,5315. 某项综合能力测试中抽取100人的成绩统计如表,则这100人成绩的标准差为( )分数54321人数2010303010A. B C3 D16. 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设
17、四个社区驾驶员的总人数为,其中甲社区有驾驶员96人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数为( )A920 B960 C808 D120017. 有40件产品,编号1至40,现从中抽取4件检验,用系统抽样的方法确定所抽编号为 ( )A. 5, 10, 15, 20 B. 2, 12, 22, 32C. 2, 14, 26, 38 D. 5, 15, 26, 3818某校有40个班,每班50人,从中选派150人参加“学代会”,这个问题中样本容量是( )A、40 B、50 C、120 D、15019. (海、宁理11文12)甲、乙、丙三名射
18、箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有()AB CD20.关于统计数据的分析,有以下几个结论:一组数不可能有两个众数;将一组数据中的每个数据都减去同一个数后,方差没有变化;调查剧院中观众观看时的感受,从50排(每排人数相同)中任意取一排的人参加调查,属于分层抽样;这3种说法中正确的个数是( ) A. 0 B. 1 C. 2 D. 321. 下图是一样本的频率分布直方图,其中(4,7)内的频数为4,数据在1,4)7,15)内的
19、频率为_,样本容量为_.22A、B、C三所学校共有高三学生1500人,且A、B、C三所学校的高三学生人数成等差数列,在一次联考后,准备用分层抽样的方法从所有高三学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取_人23某高中共有4500人,其中高一年级1200人,高二年级1500人,高三年级1800人,现采取分层抽样的方法抽取容量为600的样本,则高二年级抽取的人数为 .24某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在14
20、0,150段的约是_人25. 已知某商场新进3000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为 26. 进行次试验,得到样本观测值为,设为任意常数,为任意正数,得变量,则_.27. 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲:6080709070 乙:8060708075问:甲、乙谁的平均成绩好?谁的各门功课较平衡?28. 对某电子元件进行寿命追踪调查,情况如下.寿命(h)100200200300300400400500500600个 数2030804030(1)列出频率分布表;(2)画
21、出频率分布直方图;(3)估计电子元件寿命在100400 h以内的在总体中占的比例;(4)估计电子元件寿命在400 h以上的在总体中占的比例.29. 某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:. 品种A:357,359,367,368,375,388,392,399,400,405,414, 415,421,423,423,427,430,430,434,443,445,451,454品种B:363,371,374,383,385,386,391,392,394,395,397 397,400,401,
22、401,403,406,407,410,412,415,416,422,430()画出茎叶图;()用茎叶图处理现有的数据,有什么优点?. ()通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论。量不够稳定,而品种B的亩产量比较集中D平均产量附近.30. 2011惠州调研 某高校在2011年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下:组号分组频数频率第1组160,165)50.050第2组165,170)0.350第3组170,175)30第4组175,180)200.200第5组180,185100.100来源:学,科,网合计1001.000(1)请先求出频率分布表中、位置相应的数据,完成频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求第4组至少有一名学生被考官A面试的概率?专心-专注-专业