《9.1.2 分层抽样—山东省滕州市第一中学人教版高中数学新教材必修第二册课件(共32张PPT).ppt》由会员分享,可在线阅读,更多相关《9.1.2 分层抽样—山东省滕州市第一中学人教版高中数学新教材必修第二册课件(共32张PPT).ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、9.1.2 9.1.2 分层随机抽样分层随机抽样 9.1.3 9.1.3 获取数据的途径获取数据的途径 本资料分享自高中数学同步资源大全QQ群483122854 专注收集同步资源期待你的加入与分享联系QQ309000116加入百度网盘群2500G一线老师必备资料一键转存,自动更新,一劳永逸讲课人:邢启强21 1、简单随机抽样的概念、简单随机抽样的概念:2 2、简单随机抽样的特点、简单随机抽样的特点:3 3、简单随机抽样的常用方法:、简单随机抽样的常用方法:机会均等抽样机会均等抽样.总体个数有限;总体个数有限;逐个进行抽取;逐个进行抽取;抽签法;抽签法;随机数表法随机数表法.设一个总体含有有限个
2、个体,并记其个体数为设一个总体含有有限个个体,并记其个体数为N如果通过逐个抽取的方法从中抽取一个样本,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为样的抽样为简单随机抽样简单随机抽样.复习回顾复习回顾讲课人:邢启强3抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,
3、从而使得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法进行改进呢?新课引入新课引入讲课人:邢启强4学习新知学习新知在对树人中学高一年级学生身高的调查中,采取简单随机抽样的方式抽取了50名学生。1.抽样调查最核心的问题是什么?2.会不会出现样本中 50 个个体大部分来自高个子或矮个子的情形?3.为什么会出现这种“极端样本”?4.如何避免这种“极端样本”?样本代表性会抽样结果的随机性个体差异较大分组抽样,减少组内差距讲课人:邢启强5在树人中学高一年级的 712 名学生中,男生有 326 名、女生有 386 名学习新知学习新知样本量在男生、女生中应如何分配?讲课人:邢启强6 探究?探究?
4、假设某地区有假设某地区有高中生高中生2400人,初人,初中生中生10900人,小人,小学生学生11000人,此人,此地教育部门为了了地教育部门为了了解本地区中小学的解本地区中小学的近视情况及其形成近视情况及其形成原因,要从本地区原因,要从本地区的小学生中抽取的小学生中抽取1%的学生进行调的学生进行调查,你认为应当怎查,你认为应当怎样抽取样本?样抽取样本?80604020 0近视率%小学 初中 高中你认为哪些因素影响学生视你认为哪些因素影响学生视力?抽样要考虑哪些因素?力?抽样要考虑哪些因素?分析:考察对象的特分析:考察对象的特点是由具有明显差异点是由具有明显差异的几部分组成。的几部分组成。当已
5、知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。学习新知学习新知讲课人:邢启强7一、分层抽样的定义。一、分层抽样的定义。一般地,按一个或多个变量把总体划分成若干个子总一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为取的样本合在一起作为总样本,
6、这样的抽样方法称为分层随机抽样分层随机抽样(stratified random sampling),每),每一个子总体称为层一个子总体称为层.在分层随机抽样中,如果每层样在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配本量都与层的大小成比例,那么称这种样本量的分配方式为方式为比例分配比例分配.学习新知学习新知每一层抽取的样本数=总样本量讲课人:邢启强8学习新知学习新知应用分层抽样应遵循以下要求:应用分层抽样应遵循以下要求:(1 1)分层:将相似的个体归入一类,即为一层,分层要求每层)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不
7、遗漏的原则。的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2 2)分层抽样为保证每个个体等可能入样,需遵循在各层中进)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。量与总体容量的比相等。分层随机抽样的特点1.从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况。2.比例分配的分层随机抽样是等可能抽样,如果层数分为 2层,第 1 层和第 2 层包含的个体数分别为M 和N,抽取的样本数分别 m 和n。讲课人:邢启强9第一步,计
8、算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比.第四步,将各层抽取的个体合在一起,就得第四步,将各层抽取的个体合在一起,就得到所取样本到所取样本.第三步,用简单随机抽样在各层中抽取相应数第三步,用简单随机抽样在各层中抽取相应数量的个体量的个体.第二步,将总体分成互不交叉的层,按比例第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数确定各层要抽取的个体数.分层抽样的步骤:分层抽样的步骤:学习新知学习新知讲课人:邢启强10注意事项:注意事项:1.1.分层抽样法适用于总体中个体分层抽样法适用于总体中个体差异明显的抽样差异明显的抽样;2.2.分层是按总体中个体的明显差分层
9、是按总体中个体的明显差异进行分类异进行分类;3.3.分层抽样是按各层中含个体在分层抽样是按各层中含个体在总体中所占的比例,确定层抽样的个总体中所占的比例,确定层抽样的个体个数进行随机抽样体个数进行随机抽样.学习新知学习新知讲课人:邢启强11 某地区有高中生某地区有高中生24002400人,初中生人,初中生1080010800人,人,小学生小学生1110011100人人.当地教育部门为了了解本地区中小当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学学生的近视率及其形成原因,要从本地区的中小学生中抽取生中抽取1%1%的学生进行调查的学生进行调查.样本容量与总体个数的比例为
10、样本容量与总体个数的比例为1:1001:100,则,则高中应抽取人数为高中应抽取人数为2400*1/100=242400*1/100=24人人,初中应抽取人数为初中应抽取人数为10800*1/100=10810800*1/100=108人,人,小学应抽取人数为小学应抽取人数为11100*1/100=11111100*1/100=111人人.典型例题典型例题变式变式1:若用分层抽样从该地区抽取若用分层抽样从该地区抽取81名学生调查身名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽体发育状况,那么高中生、初中生和小学生应分别抽取多少人?取多少人?高中生高中生8 8人,初中生人,初中生36
11、36人,小学生人,小学生3737人人.讲课人:邢启强12某单位有职工某单位有职工500500人,其中人,其中3535岁以下的有岁以下的有125125人,人,3535岁岁4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人人.为了为了调查职工的身体状况,要从中抽取一个容量为调查职工的身体状况,要从中抽取一个容量为100100的样本的样本.思考思考1 1:该项调查应采用哪种抽样方法进行?该项调查应采用哪种抽样方法进行?典型例题典型例题思考思考2 2:按比例,三个年龄层次的职工分别抽取多少人按比例,三个年龄层次的职工分别抽取多少人?3535岁以下岁以下2525人,人,353
12、5岁岁4949岁岁5656人,人,5050岁以上岁以上1919人人.思考思考3 3:在各年龄段具体如何抽样?怎样获得所需样本?在各年龄段具体如何抽样?怎样获得所需样本?讲课人:邢启强131 1、某高中共有某高中共有900900人,其中高一人,其中高一年级年级300300人,高二年级人,高二年级200200人,高人,高三年级三年级400400人,现采用分层抽样抽人,现采用分层抽样抽取容量为取容量为4545的样本,那么高一、的样本,那么高一、高二、高三各年级抽取的人数分高二、高三各年级抽取的人数分别为(别为()A.15,5,25 B.15,15,15A.15,5,25 B.15,15,15C.10
13、,5,30 D15,10,20C.10,5,30 D15,10,20D 巩固练习巩固练习讲课人:邢启强142:2:一个地区共有一个地区共有5 5个乡镇个乡镇,人口人口3 3万人万人,其中人口其中人口比例为比例为3:2:5:2:3,3:2:5:2:3,从从3 3万人中抽取一个万人中抽取一个300300人的人的样本,分析某种疾病的发病率,已知这种疾病样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。样的方法?并写出具体过程。巩固练习巩固练习解:解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况
14、因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:差异明显,因而采用分层抽样的方法,具体过程如下:(1 1)将)将3 3万人分为万人分为5 5层,其中一个乡镇为一层。层,其中一个乡镇为一层。(2 2)按照样本容量的比例随机抽取各乡镇应抽取的样本。)按照样本容量的比例随机抽取各乡镇应抽取的样本。3003/15=603003/15=60(人),(人),3002/15=1003002/15=100(人),(人),3002/15=403002/15=40(人),(人),3002/15=603002/15=60(人)(人),因此各乡镇抽取人数分别为因
15、此各乡镇抽取人数分别为6060人、人、4040人、人、100100人、人、4040人、人、60 60 人。人。(3 3)将)将300300人组到一起,即得到一个样本。人组到一起,即得到一个样本。讲课人:邢启强153.3.某公司共有某公司共有10001000名员工,下设若干部门,名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容现用分层抽样法,从全体员工中抽取一个容量为量为8080的样本,已知策划部被抽取的样本,已知策划部被抽取4 4个员工,个员工,求策划部的员工人数是多少?求策划部的员工人数是多少?5050人人.巩固练习巩固练习4.4.某中学有某中学有180180名教职员工名教职员工
16、,其中教学人员其中教学人员144144人,管理人员人,管理人员1212人人,后勤服务人员后勤服务人员2424人,人,设计一个抽样方案设计一个抽样方案,从中选取从中选取1515人去参观学习人去参观学习.用分层抽样,抽取教学人员用分层抽样,抽取教学人员1212人,管人,管理人员理人员1 1人,后勤服务人员人,后勤服务人员2 2人人.讲课人:邢启强165.5.某公司在甲、乙、丙、丁四个地区分别有某公司在甲、乙、丙、丁四个地区分别有150150个、个、120120个、个、180180个、个、150150个销售点,公司为了调查个销售点,公司为了调查产品的销售情况,需从这产品的销售情况,需从这600600
17、个销售点中抽取一个个销售点中抽取一个容量为容量为100100的样本,记这项调查为的样本,记这项调查为;在丙地区中有在丙地区中有2020个特大型销售点,要从中抽取个特大型销售点,要从中抽取7 7个个调查其销售收入和售后服务等情况,记这项调查调查其销售收入和售后服务等情况,记这项调查为为,完成这两项调查宜分别采用什么方法?完成这两项调查宜分别采用什么方法?用分层抽样,用分层抽样,用简单随机抽样用简单随机抽样.巩固练习巩固练习讲课人:邢启强17请根据上述基本数据,设计一个样本容量为总体中请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案个体数量的千分之一的抽样方案.6.6.某地
18、区中小学生人数的分布情况如下表所示某地区中小学生人数的分布情况如下表所示(单位:人):(单位:人):学段学段城市城市县镇县镇农农村村小学小学357 000357 000 221 600221 600 258 100258 100初中初中226 200226 200 134 200134 200 11 290 11 290高中高中112 000112 000 43 300 43 300 6 300 6 300巩固练习巩固练习讲课人:邢启强187、某某校校有有500名名学学生生,其其中中O型型血血的的有有200人人,A型型血血的的人人有有125人人,B型型血血的的有有125人人,AB型型血血的的有
19、有50人人,为为了了研研究究血血型型与与色色弱弱的的关关系系,要要从从中中抽抽取取一一个个20人人的的样样本本,按按分分层层抽抽样样,O型型血血应应抽抽取取的的人人数数为为 人人,A型型血血应应抽抽取取的的人人数数为为 人人,B型型血血应应抽抽取取的的人人数数为为 人人,AB型型血血应应抽抽取取的的人数为人数为 人。人。8552巩固练习巩固练习8、某某中中学学高高一一年年级级有有学学生生600人人,高高二二年年级级有有学学生生450人人,高高三三年年级级有有学学生生750人人,若若该该校校取取一一个个容容量量为为n的的样样本本,每每个个学学生生被被抽抽到到的的可可能能性性均均为为0.2,则则n
20、=.360讲课人:邢启强1910、某校有老师、某校有老师200人,男学生人,男学生1200人,女人,女学生学生1000人,现用分层抽样的方法从所有人,现用分层抽样的方法从所有师生中抽取一个容量为师生中抽取一个容量为n的样本,已知女学的样本,已知女学生中抽取的人数为生中抽取的人数为80,则,则n=1921929、某单位有职工、某单位有职工160人,其中业务员有人,其中业务员有104人,管人,管理人员理人员32人,后勤人,后勤24人,现用分层抽样从中抽取人,现用分层抽样从中抽取一容量为一容量为20的样本,则抽取管理人员(的样本,则抽取管理人员()人)人A、3 B、4 C、7 D、12B巩固练习巩固
21、练习讲课人:邢启强2011、某大学数学系共有本科生、某大学数学系共有本科生5000人,其中一、二、人,其中一、二、三、四年级的学生比为三、四年级的学生比为4:3:2:1,用分层抽样的,用分层抽样的方法抽取一个容量为方法抽取一个容量为200人的样本,则应抽取三年级人的样本,则应抽取三年级的学生为(的学生为()人。)人。A、80 B、40 C、60 D、20B B巩固练习巩固练习讲课人:邢启强21思考:思考:样本容量与总体的个体数之比是分层抽样的比例样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的
22、个体数不都是整数该如何处理?各层应抽取的个体数不都是整数该如何处理?调节样本容量,剔除个体调节样本容量,剔除个体.学习新知学习新知某某单单位位有有老老年年人人28人人,中中年年人人54人人,青青年年人人81人人,为为了了调调查查他他们们的的身身体体情情况况,需需从从他他们们中中抽抽取取一一个个容容量量为为36的的样样本本,则适合的抽取方法是则适合的抽取方法是 A简单随机抽样简单随机抽样 B系统抽样系统抽样 C.分层抽样分层抽样 D.先从老人中剔除先从老人中剔除1人人,然后再分层抽样然后再分层抽样D 讲课人:邢启强22学习新知学习新知四、分层随机抽样的平均数.在简单随机抽样中如何估计总体平均数?
23、.那么在分层随机抽样中如何估计总体平均数呢?是否也可以直接用样本平均数进行估计?讲课人:邢启强23学习新知学习新知第1层的总体平均数和样本平均数为:第2层的总体平均数和样本平均数为:总体平均数和样本平均数为:讲课人:邢启强24学习新知学习新知由于用第一层的样本平均数 可以估计第层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数 ,因此我们可以用估计总体平均数对各层样本平均数加权(层权)求和讲课人:邢启强25学习新知学习新知分层随机抽样如何估计总体平均数在比例分配的分层随机中抽样中讲课人:邢启强26典型例题典型例题在树人中学高一年级的 712 名学生,男生有 326 名、女生有 3
24、86 名,分别抽取的男生23名男生、27名女生样本数据如下173.0 174.0 166.0172.0 170.0 165.0 165.0 168.0 164.0 173.0172.0 173.0 175.0168.0 170.0 172.0 176.0 175.0 168.0 173.0167.0 170.0 175.0163.0164.0161.0157.0162.0165.0168.0155.0164.0162.5154.0154.0164.0149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0样本女
25、生平均身高=160.6,样本男生平均身高=170.6讲课人:邢启强27巩固练习巩固练习高一年级有男生490人,女生510人,张华按照男生女生进行分层,得到男生女生平均身高分别为170.2cm和160.8cm。(1)如果张华在各层中按比例分配样本,总样本量为100.那么男生、女生中分别抽取了多少名?在这种情况下,请估计高一年级全体学生的平均身高。(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高一全体学生的平均身高。讲课人:邢启强28深入思考深入思考小明用比例分配的分层抽样方法,从高一年级的学生中抽取了十个样本量为50的样本,计算出样本平均数。与相同样本量的简
26、单随机抽样的结果比较序号12345678910简单随机抽样165.2162.8164.4164.4165.6164.8165.3164.3165.7165.0分层随机抽样165.8 165.1 164.3 164.3 166.4 164.6 165.2164.9 166.1 165.1 讲课人:邢启强291.分层抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。2.相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。3.分层随机抽样的结果并不是每一次都优于简单随机抽样。发现结论发现结论讲课
27、人:邢启强30课堂小结课堂小结 1 1、分分层层抽抽样样是是当当总总体体由由差差异异明明显显的的几几部部分分组组成成时时采采用用的的抽抽样样方法,进行分层抽样时应注意以下几点:方法,进行分层抽样时应注意以下几点:(1)分分层层抽抽样样中中分分多多少少层层、如如何何分分层层要要视视具具体体情情况况而而定定,总总的的原原则则是是,层层内内样样本本的的差差异异要要小小,面面层层之之间间的的样样本本差差异异要要大大,且且互不重叠。互不重叠。(2)为为了了保保证证每每个个个个体体等等可可能能入入样样,所所有有层层应应采采用用同同一一抽抽样样比等可能抽样。比等可能抽样。(3)在每层抽样时,应采用简单随机抽
28、样的方法进行抽样。在每层抽样时,应采用简单随机抽样的方法进行抽样。2、分分层层抽抽样样的的优优点点是是:使使样样本本具具有有较较强强的的代代表表性性,并并且且抽抽样样过过程程中中可可综综合合选选用用各各种种抽抽样样方方法法,因因此此分分层层抽抽样样是是一一种种实实用用、操操作性强、应用比较广泛的抽样方法。作性强、应用比较广泛的抽样方法。3.分层随机抽样中如何用样本估计总体平均值。讲课人:邢启强31 方法方法 类别类别 共同共同 特点特点抽抽样样特征特征相互相互联联系系适适应应范范围围简单随简单随机抽样机抽样分层分层抽样抽样将总体分将总体分成几层,成几层,按比例分按比例分层抽取层抽取总体中总体中
29、的个体的个体差异较差异较小小总体由总体由差异明差异明显的几显的几部分组部分组成成从总体中从总体中逐个抽取逐个抽取用简单随用简单随机抽样对机抽样对各层抽样各层抽样抽抽样样过过程程中中每每个个个个体体被被抽抽到到的的可可能能性性相等相等讲课人:邢启强322.2.分层抽样是按比例分别对各层进行抽样,再将各个子样分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本本合并在一起构成所需样本.其中正确计算各层应抽取的其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节个体数,是分层抽样过程中的重要环节.1.1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用实际调查中被广泛应用.3.3.简单随机抽样是基础,分层抽样是发展,二者相辅简单随机抽样是基础,分层抽样是发展,二者相辅相成,对立统一相成,对立统一.课堂小结课堂小结