《21随机抽样3060.pptx》由会员分享,可在线阅读,更多相关《21随机抽样3060.pptx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计数理统计感性认识数理统计数理统计是研究如何有效地收集,整理,分析受随机影数理统计是研究如何有效地收集,整理,分析受随机影数理统计是研究如何有效地收集,整理,分析受随机影数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为响的数据,并对所考虑的问题作出推断或预测,直至为响的数据,并对所考虑的问题作出推断或预测,直至为响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门采取决策和行动提供依据和建议的一门学科。它是一门采取决策和行动提供依据和建议的一门学科。它是一门采取决策和行动提供依据和建议的一门学科。它是
2、一门应用性很强的学科,凡是有大量数据出现的地方,都要应用性很强的学科,凡是有大量数据出现的地方,都要应用性很强的学科,凡是有大量数据出现的地方,都要应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成用到数理统计。现在,数理统计的内容已异常丰富,成用到数理统计。现在,数理统计的内容已异常丰富,成用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中为数学中最活跃的学科之一。教科书选择了数理统计中为数学中最活跃的学科之一。教科书选择了数理统计中为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门
3、学科的思想与方法。最基本问题来介绍这门学科的思想与方法。最基本问题来介绍这门学科的思想与方法。最基本问题来介绍这门学科的思想与方法。数理统计所要解决的问题是数理统计所要解决的问题是数理统计所要解决的问题是数理统计所要解决的问题是(1)(1)如何从总体中抽取样本如何从总体中抽取样本如何从总体中抽取样本如何从总体中抽取样本(2)(2)对样本的整理,计算,分析和综合,然后才能对总对样本的整理,计算,分析和综合,然后才能对总对样本的整理,计算,分析和综合,然后才能对总对样本的整理,计算,分析和综合,然后才能对总体作统计推断。体作统计推断。体作统计推断。体作统计推断。随机抽样相关概念与原则相关概念与原则
4、相关概念总体总体:所要考察对象的全体:所要考察对象的全体个体个体:总体中的每一个考察对象;:总体中的每一个考察对象;样本样本:从总体中抽取的一部分个体,叫总体:从总体中抽取的一部分个体,叫总体的一个样本;的一个样本;样本容量样本容量:样本中个体的数目;:样本中个体的数目;抽样抽样:从总体中抽取一部分个体作为样本的:从总体中抽取一部分个体作为样本的过程叫抽样过程叫抽样如何才能收集到高质量的样本数据?设计抽样方法的原则生活常识:判断一锅汤的味道如何,只需品尝一勺生活常识:判断一锅汤的味道如何,只需品尝一勺生活常识:判断一锅汤的味道如何,只需品尝一勺生活常识:判断一锅汤的味道如何,只需品尝一勺即可,
5、前提是什么?即可,前提是什么?即可,前提是什么?即可,前提是什么?“搅拌均匀搅拌均匀搅拌均匀搅拌均匀”的总体的总体的总体的总体一个好的抽样调查胜过一次蹩脚的普查一个好的抽样调查胜过一次蹩脚的普查一个好的抽样调查胜过一次蹩脚的普查一个好的抽样调查胜过一次蹩脚的普查抽样的关键在于使抽取的抽样的关键在于使抽取的抽样的关键在于使抽取的抽样的关键在于使抽取的样本与总体样本与总体样本与总体样本与总体的的的的特征一致特征一致特征一致特征一致,以利于进一步以利于进一步以利于进一步以利于进一步利用样本估计总体利用样本估计总体利用样本估计总体利用样本估计总体。达到这样目的的有效途径就是抽样的达到这样目的的有效途径
6、就是抽样的达到这样目的的有效途径就是抽样的达到这样目的的有效途径就是抽样的随机化随机化随机化随机化。侯选人侯选人Literary DigestLiterary Digest预测预测%选举结果选举结果%罗斯福罗斯福43436262兰顿兰顿57573838 一个著名的案例抽样中的泰坦尼克事件抽样中的泰坦尼克事件19361936年美国正从经济大恐慌中复苏,全国仍有年美国正从经济大恐慌中复苏,全国仍有年美国正从经济大恐慌中复苏,全国仍有年美国正从经济大恐慌中复苏,全国仍有9 9百万人失业当百万人失业当百万人失业当百万人失业当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角年的美国总统大选,由民主
7、党员罗斯福与共和党员兰登进行角年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐文学文摘(逐文学文摘(逐文学文摘(逐文学文摘(Literary DigestLiterary Digest)杂志对结果进行了调查预测)杂志对结果进行了调查预测)杂志对结果进行了调查预测)杂志对结果进行了调查预测他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄邮寄邮寄邮寄1 1千万份问卷调查表,回
8、收约千万份问卷调查表,回收约千万份问卷调查表,回收约千万份问卷调查表,回收约240240万份工作人员获得了大万份工作人员获得了大万份工作人员获得了大万份工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,量的样本,对此进行了精确的计算,根据数据的整理分析结果,量的样本,对此进行了精确的计算,根据数据的整理分析结果,量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以他们断言:在总统选举中,兰登将以他们断言:在总统选举中,兰登将以他们断言:在总统选举中,兰登将以370370 161161的优势,即以的优势,即以的优势,即以的优势,即以57%
9、57%比比比比43%43%,领先,领先,领先,领先1414个百分点击败罗斯福与之相反,一个名叫乔个百分点击败罗斯福与之相反,一个名叫乔个百分点击败罗斯福与之相反,一个名叫乔个百分点击败罗斯福与之相反,一个名叫乔治治治治 盖洛普的人,对文学文摘调查结果的可信度提出质疑盖洛普的人,对文学文摘调查结果的可信度提出质疑盖洛普的人,对文学文摘调查结果的可信度提出质疑盖洛普的人,对文学文摘调查结果的可信度提出质疑他也组织了抽样调查,进行民意测验他的预测与文学文摘他也组织了抽样调查,进行民意测验他的预测与文学文摘他也组织了抽样调查,进行民意测验他的预测与文学文摘他也组织了抽样调查,进行民意测验他的预测与文学
10、文摘截然相反,认为罗斯福必胜无疑结果,罗斯福以截然相反,认为罗斯福必胜无疑结果,罗斯福以截然相反,认为罗斯福必胜无疑结果,罗斯福以截然相反,认为罗斯福必胜无疑结果,罗斯福以62%62%比比比比38%38%压倒性地大胜兰登这一结果使文学文摘销声匿迹,压倒性地大胜兰登这一结果使文学文摘销声匿迹,压倒性地大胜兰登这一结果使文学文摘销声匿迹,压倒性地大胜兰登这一结果使文学文摘销声匿迹,而盖洛普则名声大噪而盖洛普则名声大噪而盖洛普则名声大噪而盖洛普则名声大噪简单随机抽样概念:一般地,设一个总体的个体数为概念:一般地,设一个总体的个体数为概念:一般地,设一个总体的个体数为概念:一般地,设一个总体的个体数为
11、N N,如果通过,如果通过,如果通过,如果通过逐个逐个逐个逐个不放回不放回不放回不放回地抽取的方法从中抽取地抽取的方法从中抽取地抽取的方法从中抽取地抽取的方法从中抽取n(nN)n(nN)个样本,个样本,个样本,个样本,且每次抽取时各个个体被抽到的且每次抽取时各个个体被抽到的且每次抽取时各个个体被抽到的且每次抽取时各个个体被抽到的概率相等概率相等概率相等概率相等,就称这样,就称这样,就称这样,就称这样的抽样为的抽样为的抽样为的抽样为简单随机抽样简单随机抽样简单随机抽样简单随机抽样。要点:要点:要点:要点:它要求被抽取样本的总体的个体数有限它要求被抽取样本的总体的个体数有限它要求被抽取样本的总体的
12、个体数有限它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是从总体中逐个进行抽取它是从总体中逐个进行抽取它是从总体中逐个进行抽取它是一种不放回抽样它是一种不放回抽样它是一种不放回抽样它是一种不放回抽样它是一种等概率抽样它是一种等概率抽样它是一种等概率抽样它是一种等概率抽样用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于 简单随机抽样常用的方法1 1、抽签法、抽签法、抽签法、抽签法(抓阄法抓阄法抓阄法抓阄法)先将总体中的所有个体(共先将总体中的所有个体(共先将总体中的所有个体(共先将总体中的所有个体(共N N个)编号(号码可个)编号(号码可个)编号(号码可个
13、)编号(号码可以从以从以从以从1 1到到到到N N),并把号码写在形状、大小相同的号),并把号码写在形状、大小相同的号),并把号码写在形状、大小相同的号),并把号码写在形状、大小相同的号签上(签上(签上(签上(号签可以用小球、卡片、纸条等制作),号签可以用小球、卡片、纸条等制作),号签可以用小球、卡片、纸条等制作),号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅然后将这些号签放在同一个箱子里,进行均匀搅然后将这些号签放在同一个箱子里,进行均匀搅然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出拌。抽签时,每次从中抽出拌。抽签时,每次从中抽出拌。抽
14、签时,每次从中抽出1 1 个号签,连续抽取个号签,连续抽取个号签,连续抽取个号签,连续抽取n n次,就得到一个容量为次,就得到一个容量为次,就得到一个容量为次,就得到一个容量为n n的样本。对个体编号时,的样本。对个体编号时,的样本。对个体编号时,的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位也可以利用已有的编号。例如学生的学号,座位也可以利用已有的编号。例如学生的学号,座位也可以利用已有的编号。例如学生的学号,座位号等。号等。号等。号等。练习 1.高二高二(21)班有班有53名同学名同学,现要从中抽取现要从中抽取8名名去参加一个座谈会去参加一个座谈会,请写出用抽签法抽选的过
15、请写出用抽签法抽选的过程程2.假设一个总体有假设一个总体有5个元素个元素,分别记为分别记为a,b,c,d,e,采用抽签法抽取一个容量为采用抽签法抽取一个容量为2的样本的样本,样本共样本共有多少个有多少个?为了考察某公司生产底为了考察某公司生产底800克袋装牛奶的质量克袋装牛奶的质量是否达标是否达标,现从现从800袋牛奶中抽取袋牛奶中抽取60件产品进件产品进行检查行检查.当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。简单随机抽样常用的方法2 2、随机数表法、随机数表法、随机数表法、随机数表法随机数表是统计工作者用计算机生成的随机数,保随机数表是统计工作者用
16、计算机生成的随机数,保随机数表是统计工作者用计算机生成的随机数,保随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的证表中的每个位置上的数字是等可能出现的证表中的每个位置上的数字是等可能出现的证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;用随机数表进行抽样的步骤:将总体中个体编号;用随机数表进行抽样的步骤:将总体中个体编号;用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码选定开始的数字;获取样本号码选定开始的数字;获取样本号码选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,用随机
17、数表抽取样本,可以任选一个数作为开始,用随机数表抽取样本,可以任选一个数作为开始,用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等读数的方向可以向左,也可以向右、向上、向下等读数的方向可以向左,也可以向右、向上、向下等读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的等。因此并不是唯一的等。因此并不是唯一的等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取由于随机数表是等概率的,因此利用随机数表抽取由于随机数表是等概率的,因此利用随机数表抽取由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的样本保证
18、了被抽取个体的概率是相等的样本保证了被抽取个体的概率是相等的样本保证了被抽取个体的概率是相等的例:为了考察某公司生产底例:为了考察某公司生产底例:为了考察某公司生产底例:为了考察某公司生产底0000克袋装牛奶的质量是克袋装牛奶的质量是克袋装牛奶的质量是克袋装牛奶的质量是否达标否达标否达标否达标,现从现从现从现从800800袋牛奶中抽取袋牛奶中抽取袋牛奶中抽取袋牛奶中抽取6060件产品进行检查件产品进行检查件产品进行检查件产品进行检查.S1S1,将,将,将,将800800袋牛奶编号,可以编为袋牛奶编号,可以编为袋牛奶编号,可以编为袋牛奶编号,可以编为000000,001001,799799;S2
19、S2,在随机数表中任意选一个数,例如第,在随机数表中任意选一个数,例如第,在随机数表中任意选一个数,例如第,在随机数表中任意选一个数,例如第8 8行第行第行第行第7 7列的数列的数列的数列的数7 7;S3S3,从选定的数,从选定的数,从选定的数,从选定的数7 7开始向右读,得到一个三位数,开始向右读,得到一个三位数,开始向右读,得到一个三位数,开始向右读,得到一个三位数,如果这个三位数在如果这个三位数在如果这个三位数在如果这个三位数在000799000799范围内,则取出,否范围内,则取出,否范围内,则取出,否范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下则去掉;继续向右读,得下
20、一个三位数;依次下则去掉;继续向右读,得下一个三位数;依次下则去掉;继续向右读,得下一个三位数;依次下去,直到样本的去,直到样本的去,直到样本的去,直到样本的6060个号码全部取出个号码全部取出个号码全部取出个号码全部取出.将总体中的个体编号时从将总体中的个体编号时从000开始开始,用意何在用意何在?当随机地选定开始读数的数后当随机地选定开始读数的数后,读数的方向只读数的方向只能向右吗能向右吗?练习将全班同学按学号编号将全班同学按学号编号将全班同学按学号编号将全班同学按学号编号,制作相应的卡片号签制作相应的卡片号签制作相应的卡片号签制作相应的卡片号签,放入同放入同放入同放入同一个箱子里均匀搅拌
21、一个箱子里均匀搅拌一个箱子里均匀搅拌一个箱子里均匀搅拌,从中抽出从中抽出从中抽出从中抽出1515个号签个号签个号签个号签,就相应的就相应的就相应的就相应的1515名学生对看足球比赛的喜爱程度名学生对看足球比赛的喜爱程度名学生对看足球比赛的喜爱程度名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一很喜爱、喜爱、一很喜爱、喜爱、一很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。般、不喜爱、很不喜爱)进行调查。般、不喜爱、很不喜爱)进行调查。般、不喜爱、很不喜爱)进行调查。上述问题中抽取样本的方法用上述问题中抽取样本的方法用上述问题中抽取样本的方法用上述问题中抽取样本的方法用随机数表法随机数表法随机数表
22、法随机数表法来进行!来进行!来进行!来进行!规则规则规则规则1 1:从:从:从:从107107页表中第页表中第页表中第页表中第3 3行第行第行第行第1111列的两位数开始,依列的两位数开始,依列的两位数开始,依列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并次向下读数,到头后再转向它左面的两位数号码,并次向下读数,到头后再转向它左面的两位数号码,并次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。向上读数,以此下去,直到取足样本。向上读数,以此下去,直到取足样本。向上读数,以此下去,直到取足样本。规则规则规则规则2 2:从:从:从:从107107页
23、表中第页表中第页表中第页表中第1212行第行第行第行第1010列的两位数开始,依列的两位数开始,依列的两位数开始,依列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并次向左读数,到头后再转向它下面的两位数号码,并次向左读数,到头后再转向它下面的两位数号码,并次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。向右读数,以此下去,直到取足样本。向右读数,以此下去,直到取足样本。向右读数,以此下去,直到取足样本。系统抽样(等距抽样)问题情景:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用
24、简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而第而第1排被抽取前,其他各排中各号码被抽取概率也是排被抽取前,其他各排中各号码被抽取概率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,因此这种,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。抽样的方法是系统抽样。一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座
25、位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听众。会后为听取意见留下了座位号为听众。会后为听取意见留下了座位号为20的的30名听众进行座谈。名听众进行座谈。系统抽样当总体的个数较多时,采用简单随机抽样太麻烦,当总体的个数较多时,采用简单随机抽样太麻烦,当总体的个数较多时,采用简单随机抽样太麻烦,当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成这时将总体分成这时将总体分成这时将总体分成均衡均衡均衡均衡的部分,然后按照预先定出的的部分,然后按照预先定出的的部分,然后按照预先定出的的部分,然后按照预先定出的规则,从规则,从规则,从规则,从每一部分中抽取每一部分中抽取每一部分中抽取每一部分
26、中抽取1 1个个体个个体个个体个个体,得到所需要的样,得到所需要的样,得到所需要的样,得到所需要的样本,这种抽样称为系统抽样。本,这种抽样称为系统抽样。本,这种抽样称为系统抽样。本,这种抽样称为系统抽样。(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:
27、l;lk;l2k;lnk (等距)(等距)系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段段进进行行抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的是整个抽样过程中每个个体被抽到的概率仍然相等。的是整个抽样过程中每个个体被抽到的概率仍然相等。系统抽
28、样的步骤以下抽样方法的区别中,说法错误的是以下抽样方法的区别中,说法错误的是以下抽样方法的区别中,说法错误的是以下抽样方法的区别中,说法错误的是_(A A)4 4个人打牌时,将洗好的牌(个人打牌时,将洗好的牌(个人打牌时,将洗好的牌(个人打牌时,将洗好的牌(5252张)随机确定一张)随机确定一张)随机确定一张)随机确定一张牌为起始牌,然后按次序发牌,每人张牌为起始牌,然后按次序发牌,每人张牌为起始牌,然后按次序发牌,每人张牌为起始牌,然后按次序发牌,每人1313张,这种抽张,这种抽张,这种抽张,这种抽样方法属于随机抽样样方法属于随机抽样样方法属于随机抽样样方法属于随机抽样(B B)从标号为)从
29、标号为)从标号为)从标号为115115的的的的1515个球中,任选个球中,任选个球中,任选个球中,任选3 3个做为样本,个做为样本,个做为样本,个做为样本,按从小到大排序,随机选取起点号按从小到大排序,随机选取起点号按从小到大排序,随机选取起点号按从小到大排序,随机选取起点号i i0 0,以后选取,以后选取,以后选取,以后选取i i0 0+5+5,i i0 0+10+10(超过(超过(超过(超过1515则从则从则从则从1 1数起),这种抽样方法属于系数起),这种抽样方法属于系数起),这种抽样方法属于系数起),这种抽样方法属于系统抽样统抽样统抽样统抽样(C C)工厂生产某种产品,用传送带送入包装
30、车间,)工厂生产某种产品,用传送带送入包装车间,)工厂生产某种产品,用传送带送入包装车间,)工厂生产某种产品,用传送带送入包装车间,检验人员每隔五分钟从传送带上抽一产品进行检验,检验人员每隔五分钟从传送带上抽一产品进行检验,检验人员每隔五分钟从传送带上抽一产品进行检验,检验人员每隔五分钟从传送带上抽一产品进行检验,这种抽样方法属于系统抽样这种抽样方法属于系统抽样这种抽样方法属于系统抽样这种抽样方法属于系统抽样(D D)电影院为调查观众某项指标,通知每排的座位)电影院为调查观众某项指标,通知每排的座位)电影院为调查观众某项指标,通知每排的座位)电影院为调查观众某项指标,通知每排的座位号为号为号为
31、号为8 8号的观众留下来,这种抽样方法属于系统抽样号的观众留下来,这种抽样方法属于系统抽样号的观众留下来,这种抽样方法属于系统抽样号的观众留下来,这种抽样方法属于系统抽样应用举例某地区有某地区有某地区有某地区有30003000名学生参加学科竞赛名学生参加学科竞赛名学生参加学科竞赛名学生参加学科竞赛,现要从中抽取一个现要从中抽取一个现要从中抽取一个现要从中抽取一个样本对他们的成绩进行分析样本对他们的成绩进行分析样本对他们的成绩进行分析样本对他们的成绩进行分析,每个学生被抽到的概率均每个学生被抽到的概率均每个学生被抽到的概率均每个学生被抽到的概率均为为为为1/15,1/15,试确定样本容量,并说出
32、抽样步骤。试确定样本容量,并说出抽样步骤。试确定样本容量,并说出抽样步骤。试确定样本容量,并说出抽样步骤。设某校共有设某校共有设某校共有设某校共有118118名教师,为了支援西部的教育事业,要名教师,为了支援西部的教育事业,要名教师,为了支援西部的教育事业,要名教师,为了支援西部的教育事业,要从中随机抽出从中随机抽出从中随机抽出从中随机抽出1616名教师组成暑期西部讲师团。请用系名教师组成暑期西部讲师团。请用系名教师组成暑期西部讲师团。请用系名教师组成暑期西部讲师团。请用系统抽样方法选出讲师团成员。统抽样方法选出讲师团成员。统抽样方法选出讲师团成员。统抽样方法选出讲师团成员。有人说,可以借用居
33、民身份证号码(有人说,可以借用居民身份证号码(有人说,可以借用居民身份证号码(有人说,可以借用居民身份证号码(1818位)来进行央位)来进行央位)来进行央位)来进行央视春晚的收视率调查:在视春晚的收视率调查:在视春晚的收视率调查:在视春晚的收视率调查:在19991999中抽出一个随机数,比中抽出一个随机数,比中抽出一个随机数,比中抽出一个随机数,比如如如如632632,那么身份证后三位是,那么身份证后三位是,那么身份证后三位是,那么身份证后三位是632632的观众就是要调查的的观众就是要调查的的观众就是要调查的的观众就是要调查的对象。你觉得这样所获得的样本有代表性吗?对象。你觉得这样所获得的样
34、本有代表性吗?对象。你觉得这样所获得的样本有代表性吗?对象。你觉得这样所获得的样本有代表性吗?系统抽样的优缺点优点优点优点优点:(1 1)简单易操作)简单易操作)简单易操作)简单易操作(2 2)当对总体结构有一定了解时,充分利用已有的)当对总体结构有一定了解时,充分利用已有的)当对总体结构有一定了解时,充分利用已有的)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽信息对总体中的个体进行排队后再抽样,可提高抽信息对总体中的个体进行排队后再抽样,可提高抽信息对总体中的个体进行排队后再抽样,可提高抽样效率样效率样效率样效率(3 3)当总体中的个体存在一种自然编号
35、时,采用系)当总体中的个体存在一种自然编号时,采用系)当总体中的个体存在一种自然编号时,采用系)当总体中的个体存在一种自然编号时,采用系统抽样比较方便统抽样比较方便统抽样比较方便统抽样比较方便缺点:缺点:缺点:缺点:(4 4)当在不了解样本总体的情况下(如性别差异,)当在不了解样本总体的情况下(如性别差异,)当在不了解样本总体的情况下(如性别差异,)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的经济基础,个人喜好,天气因素等等),所抽出的经济基础,个人喜好,天气因素等等),所抽出的经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。样本可能
36、会有一定的偏差。样本可能会有一定的偏差。样本可能会有一定的偏差。如何改进?分层抽样问题情景:一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分层抽样当已知总体由当已知总体由当已知总体由当已知总体由差异明显的几部分差异明显的几部分差异明显的几部分差异明显的几部分组成时,为了使样本组成时,为了使样本组成时,为了使样本组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后充分地反映总体的情况,常将总体分成几部分,然后充分地反映总体的情况,常将总体分成几
37、部分,然后充分地反映总体的情况,常将总体分成几部分,然后按照按照按照按照各部分所占的比例各部分所占的比例各部分所占的比例各部分所占的比例进行抽样进行抽样进行抽样进行抽样,这种抽样叫做分层这种抽样叫做分层这种抽样叫做分层这种抽样叫做分层抽样。其中所分成的各部分叫做层。抽样。其中所分成的各部分叫做层。抽样。其中所分成的各部分叫做层。抽样。其中所分成的各部分叫做层。注意注意注意注意:分层抽样适用于总体由差异明显的几部分组成的分层抽样适用于总体由差异明显的几部分组成的分层抽样适用于总体由差异明显的几部分组成的分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随情况,每一
38、部分称为层,在每一层中实行简单随情况,每一部分称为层,在每一层中实行简单随情况,每一部分称为层,在每一层中实行简单随机抽样。机抽样。机抽样。机抽样。分层抽样中分多少层,要视具体情况而定。总的分层抽样中分多少层,要视具体情况而定。总的分层抽样中分多少层,要视具体情况而定。总的分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的原则是:层内样本的差异要小,而层与层之间的原则是:层内样本的差异要小,而层与层之间的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。差异尽可能地大,否则将失去分层的意义。差异尽可能地大,否则将失去分层的意义。差
39、异尽可能地大,否则将失去分层的意义。解解:抽抽取取人人数数与与职职工工总总数数的的比比是是100:5001:5,则则各各年年龄龄段段(层层)的的职职工工人人数数依依次次是是125:280:9525:56:19,然然后后分分别别在在各各年年龄龄段段(层层)运运用用简简单单随随机抽样方法抽取。机抽样方法抽取。答答:在在分分层层抽抽样样时时,不不到到35岁岁、3549岁岁、50岁岁以以上上的三个年龄段分别抽取的三个年龄段分别抽取25人、人、56人和人和19人。人。分层抽样举例一个单位的职工有一个单位的职工有一个单位的职工有一个单位的职工有500500人,其中不到人,其中不到人,其中不到人,其中不到3
40、535岁的有岁的有岁的有岁的有125125人,人,人,人,35354949岁的有岁的有岁的有岁的有280280人,人,人,人,5050岁以上的有岁以上的有岁以上的有岁以上的有9595人。为了了解人。为了了解人。为了了解人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取该单位职工年龄与身体状况的有关指标,从中抽取该单位职工年龄与身体状况的有关指标,从中抽取该单位职工年龄与身体状况的有关指标,从中抽取100100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?分层抽样的步骤1.1.总体与样本容量确定抽取的比例。总体与样本
41、容量确定抽取的比例。总体与样本容量确定抽取的比例。总体与样本容量确定抽取的比例。2.2.由分层情况,确定各层抽取的样本数。由分层情况,确定各层抽取的样本数。由分层情况,确定各层抽取的样本数。由分层情况,确定各层抽取的样本数。3.3.各层的抽取数之和应等于样本容量。各层的抽取数之和应等于样本容量。各层的抽取数之和应等于样本容量。各层的抽取数之和应等于样本容量。4.4.对于不能取整的数,求其近似值。对于不能取整的数,求其近似值。对于不能取整的数,求其近似值。对于不能取整的数,求其近似值。问题:每个个体在整个抽样过程中被抽取的概率是否相等?练习1.1.某科研单位有科研人员某科研单位有科研人员某科研单
42、位有科研人员某科研单位有科研人员160160人人人人,其中具有高级以上职其中具有高级以上职其中具有高级以上职其中具有高级以上职称的称的称的称的2424人人人人,中级职称中级职称中级职称中级职称4848人人人人,其余均为初级以下职称其余均为初级以下职称其余均为初级以下职称其余均为初级以下职称,现现现现要抽取一个容量为要抽取一个容量为要抽取一个容量为要抽取一个容量为2020的样本的样本的样本的样本,试确定抽样方法试确定抽样方法试确定抽样方法试确定抽样方法,并写出并写出并写出并写出抽样过程抽样过程抽样过程抽样过程.2.2.某市某市某市某市3 3个区共有高中学生个区共有高中学生个区共有高中学生个区共有
43、高中学生2000020000人,且人,且人,且人,且3 3个区的高中学个区的高中学个区的高中学个区的高中学生人数之比为生人数之比为生人数之比为生人数之比为2 2:3 3:5 5,现在要用分层抽样的方法从,现在要用分层抽样的方法从,现在要用分层抽样的方法从,现在要用分层抽样的方法从所有学生中抽取一个容量为所有学生中抽取一个容量为所有学生中抽取一个容量为所有学生中抽取一个容量为200200的样本,这的样本,这的样本,这的样本,这3 3个区应该个区应该个区应该个区应该分别抽取多少人?分别抽取多少人?分别抽取多少人?分别抽取多少人?3.3.如果采用分层抽样,从个体数为如果采用分层抽样,从个体数为如果采
44、用分层抽样,从个体数为如果采用分层抽样,从个体数为N N的总体中,抽取的总体中,抽取的总体中,抽取的总体中,抽取一个容量为一个容量为一个容量为一个容量为n n的样本,那么每个个体被抽到的概率等的样本,那么每个个体被抽到的概率等的样本,那么每个个体被抽到的概率等的样本,那么每个个体被抽到的概率等于于于于 ()4.4.下列属于分层抽样特点的是下列属于分层抽样特点的是下列属于分层抽样特点的是下列属于分层抽样特点的是()()A.A.从总体中逐个抽取从总体中逐个抽取从总体中逐个抽取从总体中逐个抽取 B.B.将总体分成几层将总体分成几层将总体分成几层将总体分成几层,分层进行抽取分层进行抽取分层进行抽取分层
45、进行抽取 C.C.将总体分成几部分将总体分成几部分将总体分成几部分将总体分成几部分,按事先确定的规则在各部分抽取按事先确定的规则在各部分抽取按事先确定的规则在各部分抽取按事先确定的规则在各部分抽取 D.D.将总体随意分成几部分将总体随意分成几部分将总体随意分成几部分将总体随意分成几部分,然后进行随机抽取然后进行随机抽取然后进行随机抽取然后进行随机抽取5.5.某校高中生共有某校高中生共有某校高中生共有某校高中生共有900900人人人人,其中高一年级其中高一年级其中高一年级其中高一年级300300人人人人,高二年高二年高二年高二年级级级级200200人人人人,高三年级高三年级高三年级高三年级400
46、400人人人人,现采用分层抽样抽取容量为现采用分层抽样抽取容量为现采用分层抽样抽取容量为现采用分层抽样抽取容量为4545的样本的样本的样本的样本,那么高一那么高一那么高一那么高一,高二高二高二高二,高三各年级抽取人数分别高三各年级抽取人数分别高三各年级抽取人数分别高三各年级抽取人数分别为为为为()()A 15,5,25 B 15,15,15C 10,5,30 D 15,10,20B B6.6.某公司在某公司在某公司在某公司在A,B,C,DA,B,C,D四个地区分别有四个地区分别有四个地区分别有四个地区分别有150150个个个个,120,120个个个个,180,180个,个,个,个,150150
47、个销售点个销售点个销售点个销售点,公司为了调查产品销售情况公司为了调查产品销售情况公司为了调查产品销售情况公司为了调查产品销售情况,需从需从需从需从这这这这600600个销售点中抽取容量为个销售点中抽取容量为个销售点中抽取容量为个销售点中抽取容量为100100的样本的样本的样本的样本,记这项调查为记这项调查为记这项调查为记这项调查为;在在在在C C地区有地区有地区有地区有2020个特大型销售点个特大型销售点个特大型销售点个特大型销售点,现从中抽取现从中抽取现从中抽取现从中抽取7 7个调个调个调个调查它的销售收入和销后服务情况查它的销售收入和销后服务情况查它的销售收入和销后服务情况查它的销售收入
48、和销后服务情况,记这项调查为记这项调查为记这项调查为记这项调查为;则则则则完成完成完成完成,这两项调查应采取的抽样方法依次为这两项调查应采取的抽样方法依次为这两项调查应采取的抽样方法依次为这两项调查应采取的抽样方法依次为()()A,A,分层抽样法分层抽样法分层抽样法分层抽样法,系统抽样法系统抽样法系统抽样法系统抽样法;B,B,分层抽样法分层抽样法分层抽样法分层抽样法,简单随机抽样法简单随机抽样法简单随机抽样法简单随机抽样法;C,C,系统抽样法系统抽样法系统抽样法系统抽样法,分层抽样法分层抽样法分层抽样法分层抽样法;D,D,简单随机抽样法简单随机抽样法简单随机抽样法简单随机抽样法,分层抽样法分层
49、抽样法分层抽样法分层抽样法;7.7.在在在在100100个零件中个零件中个零件中个零件中,有一级品有一级品有一级品有一级品2020个个个个,二级品二级品二级品二级品3030个个个个,其余为其余为其余为其余为三级品三级品三级品三级品,从中抽取从中抽取从中抽取从中抽取2020个作为样本个作为样本个作为样本个作为样本.(1).(1)采用随机抽样法采用随机抽样法采用随机抽样法采用随机抽样法,将零件编号为将零件编号为将零件编号为将零件编号为00,01,99.00,01,99.抽签取出抽签取出抽签取出抽签取出2020个个个个;(2);(2)采用系统采用系统采用系统采用系统抽样法抽样法抽样法抽样法,将所有零
50、件分成将所有零件分成将所有零件分成将所有零件分成2020组组组组,每组每组每组每组5 5个个个个,然后每组中随然后每组中随然后每组中随然后每组中随机抽取机抽取机抽取机抽取1 1个个个个;(3);(3)采用分层抽样法采用分层抽样法采用分层抽样法采用分层抽样法,从一级品中从一级品中从一级品中从一级品中 随机抽取随机抽取随机抽取随机抽取4 4个个个个,从二级品中随机抽取从二级品中随机抽取从二级品中随机抽取从二级品中随机抽取6 6个个个个,从三级品中随机抽取从三级品中随机抽取从三级品中随机抽取从三级品中随机抽取1010个个个个,则下列说法正确的是则下列说法正确的是则下列说法正确的是则下列说法正确的是(