《统计学原理第五版精选课件.ppt》由会员分享,可在线阅读,更多相关《统计学原理第五版精选课件.ppt(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、STAT关于统计学原理第关于统计学原理第五版五版第一页,本课件共有72页教学重点与难点:教学重点与难点:重点:抽样误差的特点及计算,总体参数的区间重点:抽样误差的特点及计算,总体参数的区间 估计法。估计法。难点:抽样平均误差的涵义与计算、区间难点:抽样平均误差的涵义与计算、区间 估计的原理及过程。估计的原理及过程。第二页,本课件共有72页教学方式与学时安排教学方式与学时安排内内 容容教学方式教学方式学时学时抽样推断的抽样推断的一般问题一般问题 讲讲 授授2H2H抽样误差抽样误差讲授、讨论讲授、讨论2H2H抽样估计抽样估计抽样估计抽样估计讲授、讨论讲授、讨论2H2H抽样的组织形式,抽样的组织形式
2、,抽样必要数目的确定抽样必要数目的确定讲授、讨论讲授、讨论2H2H总学时总学时-8H8H思考练习题思考练习题抽样误差的影响因素抽样误差的影响因素样本容量的影响因素样本容量的影响因素第三页,本课件共有72页5.1 抽样推断的一般问题抽样推断的一般问题一、一、抽样推断的意义抽样推断的意义概念概念 抽样推断法又称为抽样调查法,简称抽样法抽样推断法又称为抽样调查法,简称抽样法 指样本单位的抽取不受主观因素及其指样本单位的抽取不受主观因素及其指样本单位的抽取不受主观因素及其指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位他系统性因素的影响,每个总体单位他系统性因素的影响,每个总体单位他系
3、统性因素的影响,每个总体单位都有均等的被抽中机会都有均等的被抽中机会都有均等的被抽中机会都有均等的被抽中机会按照按照随机原则随机原则 从调查对象中抽取一部分单位从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总具有一定可靠程度的估计与推断,从而认识总体的一种统计方法体的一种统计方法第四页,本课件共有72页特点特点 q按随机原则抽取样本单位按随机原则抽取样本单位q以部分推断总体的数量特征以部分推断总体的数量特征q抽样误差可以事先计算并控制抽样误差可以事先计算并控制q抽样法运用概率估计的方法抽样法运用概
4、率估计的方法 作用作用(见第二章)(见第二章)第五页,本课件共有72页全及总体全及总体全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全体,简称总体或母体;全体,简称总体或母体;全体,简称总体或母体;全体,简称总体或母体;分:分:分:分:有限总体和无限总体有限总体和无限总体。用用用用N N表示有限总体的单位数,称表示有限总体的单位数,称总体容量总体容量。样本总体样本总体样本总体或抽样总体,简称样本或子样。样本总体或抽样总体,简称样本或子样。样本总体或抽样总体,简称样本或子样。样本总体
5、或抽样总体,简称样本或子样。用用用用n表示表示表示表示样本容量。样本容量。样本容量。样本容量。n30n30n30n30,为大样本;,为大样本;n 30n 30n 30n 30,为小样本,为小样本二、抽样估计的基本概念二、抽样估计的基本概念对同一问题,全及总体是唯一的,样本总体不唯一对同一问题,全及总体是唯一的,样本总体不唯一 第六页,本课件共有72页总体单位和样本单位总体单位和样本单位 总体单位:总体单位:组成全及总体的每一个单位或分子组成全及总体的每一个单位或分子样本单位:样本单位:样本单位:样本单位:抽样单位,构成样本的每一个单位或分子抽样单位,构成样本的每一个单位或分子 又称为又称为又称
6、为又称为全及指标,全及指标,全及指标,全及指标,用来描述全及总体特征的用来描述全及总体特征的用来描述全及总体特征的用来描述全及总体特征的综合指标。综合指标。综合指标。综合指标。总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数 总体指标总体指标a a、总体平均数(又叫总体均值):总体平均数(又叫总体均值):总体平均数(又叫总体均值):总体平均数(又叫总体均值):第七页,本课件共有72页b、总体方差总体方差 ,总体标准差,总体标准差 c、总体成数、总体成数、总体成数、总体成数 P P对总体中不能用数量表
7、示的单位品质标志,总体参对总体中不能用数量表示的单位品质标志,总体参对总体中不能用数量表示的单位品质标志,总体参对总体中不能用数量表示的单位品质标志,总体参数是以总体中具有某种性质的单位数占总体全部单数是以总体中具有某种性质的单位数占总体全部单数是以总体中具有某种性质的单位数占总体全部单数是以总体中具有某种性质的单位数占总体全部单位数的比重来反映,这种参数称为位数的比重来反映,这种参数称为位数的比重来反映,这种参数称为位数的比重来反映,这种参数称为成数成数成数成数,用,用,用,用P P表示,表示,表示,表示,QQ表示另一部分成数。表示另一部分成数。设总设总体容量体容量N,具有某种性质,具有某种
8、性质,不具有某种性质不具有某种性质 第八页,本课件共有72页具有某种性质的具有某种性质的单位数所占的成数单位数所占的成数不具有某种性质不具有某种性质的单位数所占的成数的单位数所占的成数的单位数所占的成数的单位数所占的成数若品质标志表现为若品质标志表现为“是是”、“非非”两种,称两种,称是非标志是非标志,用,用1表示表示“是是”,用,用0表示表示“非非”,则是非标志可看成,则是非标志可看成(0,1)分布)分布,P是(是(0,1)分布的平均数。)分布的平均数。第九页,本课件共有72页分分分分 组组组组单位数单位数单位数单位数变量值变量值变量值变量值具有某一性质具有某一性质具有某一性质具有某一性质不
9、具有某一性质不具有某一性质不具有某一性质不具有某一性质N N1 1N N2 21 10 0合计合计合计合计均均值值第十页,本课件共有72页标标准准差差方方差差当当P=1/2时时,达最大,达最大值值 第十一页,本课件共有72页a、样本平均数(又叫样本均值):样本平均数(又叫样本均值):用来描述样本特征的综合指标,也用来描述样本特征的综合指标,也叫统计量叫统计量,又被称为又被称为估计量或统计量估计量或统计量样本指标样本指标样本指标是随机变量,不同样本有不同的样本指标是随机变量,不同样本有不同的样本指标样本指标 第十二页,本课件共有72页b、样本方差、标准差:样本方差、标准差:c、样本成数:样本成数
10、:第十三页,本课件共有72页重复抽样重复抽样又被称作重置抽样、有放回抽样又被称作重置抽样、有放回抽样抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取特点特点同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行而且每次抽取都是独立进行第十四页,本课件共有72页不重复抽样不重复抽样又被称作不重置抽样、不放回抽又被称作不重置抽样、不放回抽样样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体中每个单位被抽中的机会并不同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是均等,在连续抽取时,每次抽取都不是独立进行独立进行是最为
11、常用的抽样方法。是最为常用的抽样方法。第十五页,本课件共有72页样本的可能数目样本的可能数目在考虑顺序的抽样条件下,从总在考虑顺序的抽样条件下,从总体体N中随机抽取中随机抽取n个样本单位共有个样本单位共有多少种可能的抽选结果多少种可能的抽选结果 重复抽样的可能样本数目:重复抽样的可能样本数目:不重复抽样的可能样本数目:不重复抽样的可能样本数目:共共n个个第十六页,本课件共有72页在不考虑顺序的抽样条件下:在不考虑顺序的抽样条件下:在不考虑顺序的抽样条件下:在不考虑顺序的抽样条件下:重复抽样的可能样本数目:重复抽样的可能样本数目:不重复抽样的可能样本数目:不重复抽样的可能样本数目:第十七页,本课
12、件共有72页抽样单元抽样单元抽样框抽样框将总体划分成互不重叠又穷尽的有限多个部分,每个将总体划分成互不重叠又穷尽的有限多个部分,每个部分称为抽样单元。部分称为抽样单元。抽样单元有若干个体组成,当然也可以只包含一个个体抽样单元有若干个体组成,当然也可以只包含一个个体。又叫抽样结构,一份包含所有抽样单元的名单或清册。又叫抽样结构,一份包含所有抽样单元的名单或清册。在抽样框中,每个抽样单元被编上一个号码。在抽样框中,每个抽样单元被编上一个号码。抽样框可以多种形式:除名单或清册外,还可以是一张地抽样框可以多种形式:除名单或清册外,还可以是一张地图或其他适当的形式图或其他适当的形式 第十八页,本课件共有
13、72页一、抽样误差的概念一、抽样误差的概念5.2 抽样误差抽样误差调查结果与总体真实值之差。调查结果与总体真实值之差。抽样调查方式所产生的调查误差抽样调查方式所产生的调查误差调查误差:调查误差:抽样调查误差:抽样调查误差:抽抽样调查误样调查误差差=登登记记性性误误差差+系系统统性性误误差差+用部分推断总体而引用部分推断总体而引起的误差,可控制,起的误差,可控制,不可避免。不可避免。抽样误差抽样误差第十九页,本课件共有72页二、抽样误差的实质二、抽样误差的实质1 1、抽样实际误差、抽样实际误差、抽样实际误差、抽样实际误差 一个总体有多个样本,每一个样本与总体之间有一个总体有多个样本,每一个样本与
14、总体之间有一个离差,叫抽样实际误差。一个离差,叫抽样实际误差。例例5.1,设设有有4个工人,其每周工个工人,其每周工资资分分别为别为70,90,130,150元,元,从从4人中随机抽取人中随机抽取2人构成样本:人构成样本:可能产生的样本如下:可能产生的样本如下:第二十页,本课件共有72页重复抽样重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 9101011111212131314141515161670 7070 7070 9070 9070 13070 13070 15070 15090 7090 7090 9090 9090
15、 13090 13090 15090 150130 70130 70130 90130 90130 130130 130130 150130 150150 70150 70150 90150 90150 130150 130150 150150 1507070808010010011011080809090110110120120100100110110130130140140110110120120140140150150-40-40-30-30-10-100 0-30-30-20-200 01010-10-100 0202030300 0101030304040合合计计176017600
16、0样样本平均本平均数的平均数的平均数数等于总等于总体平均数体平均数 抽样实际抽样实际误差误差第二十一页,本课件共有72页不重复抽样不重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 910101111121270 9070 9070 13070 13070 15070 15090 7090 70 90 130 90 13090 15090 150130 70130 70130 90130 90 130 150 130 150150 70150 70150 90150 90150 130 150 130 80 80100100110
17、1108080 110 110120120100100110110 140 140110110120120140 140 -30-30-10-100 0-30-30 0 01010-10-100 0 30 300 0101030 30 合合计计1320 0 0抽样实际抽样实际误差误差第二十二页,本课件共有72页2 2、抽样误差抽样误差抽样误差抽样误差不是某个抽样实际误差,而是所有可能的不是某个抽样实际误差,而是所有可能的不是某个抽样实际误差,而是所有可能的不是某个抽样实际误差,而是所有可能的 抽样实际误差的平均值抽样实际误差的平均值,称抽样平均误差或平均抽,称抽样平均误差或平均抽,称抽样平均误
18、差或平均抽,称抽样平均误差或平均抽 样误差样误差样误差样误差 。3、抽样平均误差是反映抽样误差一般水平的指标,用、抽样平均误差是反映抽样误差一般水平的指标,用、抽样平均误差是反映抽样误差一般水平的指标,用、抽样平均误差是反映抽样误差一般水平的指标,用 表示。简称为表示。简称为表示。简称为表示。简称为抽样误差抽样误差抽样误差抽样误差。用抽样平均数(或成数)的标准差来表示用抽样平均数(或成数)的标准差来表示 令:令:M M为为全部全部样样本数,本数,总体平均数,总体平均数,P总体成数。总体成数。第二十三页,本课件共有72页抽样成数的平均误差:抽样成数的平均误差:抽样成数的平均误差:抽样成数的平均误
19、差:抽样平均数的平均误差:抽样平均数的平均误差:抽样平均数的平均误差:抽样平均数的平均误差:第二十四页,本课件共有72页1 1、抽样平均数的抽样误差、抽样平均数的抽样误差(平均数指标抽样误差)(平均数指标抽样误差)(平均数指标抽样误差)(平均数指标抽样误差)重复抽样:重复抽样:重复抽样:重复抽样:不重复抽样:不重复抽样:不重复抽样:不重复抽样:三、抽样误差的计算三、抽样误差的计算当总体很大,当总体很大,n很小,可代替不重复抽样很小,可代替不重复抽样 当当N远远大于远远大于n时时 第二十五页,本课件共有72页总体方差总体方差(总总体方差不知,用体方差不知,用样样本方差本方差如果如果n很大,也可以
20、用很大,也可以用)代替,代替,分析:分析:*是是总总体的差异程度,反映体的差异程度,反映总总体特征,其大小与体特征,其大小与样样本本大小无关;大小无关;*不重复抽不重复抽样误样误差小于重复抽差小于重复抽样误样误差;差;受受样样本大小影响,本大小影响,n n越大,越大,越小,越小,*第二十六页,本课件共有72页重复抽样重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 9101011111212131314141515161670 7070 7070 9070 9070 13070 13070 15070 15090 7090 709
21、0 9090 9090 13090 13090 15090 150130 70130 70130 90130 90130 130130 130130 150130 150150 70150 70150 90150 90150 130150 130150 150150 1507070808010010011011080809090110110120120100100110110130130140140110110120120140140150150-40-40-30-30-10-100 0-30-30-20-200 01010-10-100 0202030300 0101030304040合合计
22、计176017600 0 离差平方离差平方160016009009001001000 09009004004000 01001001001000 04004009009000 01001009009001600160080008000第二十七页,本课件共有72页第二十八页,本课件共有72页不重复抽样不重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 910101111121270 9070 9070 13070 13070 15070 15090 7090 70 90 130 90 13090 15090 150130 70130
23、 70130 90130 90 130 150 130 150150 70150 70150 90150 90150 130 150 130 80 801001001101108080 110 110120120100100110110 140 140110110120120140 140 -30-30-10-100 0-30-30 0 01010-10-100 0 30 300 0101030 30 合合计计1320 0 0离差平方离差平方9009001001000 09009000 01001001001000 09009000 010010090090040004000第二十九页,本课件
24、共有72页第三十页,本课件共有72页2 2、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)重复抽样:重复抽样:不重复抽样:不重复抽样:P:总体成数,可用样本成数代替:总体成数,可用样本成数代替 第三十一页,本课件共有72页例例5.2 要估计某地区要估计某地区100000名适龄儿童的入学率,名适龄儿童的入学率,随机从这一地区抽取随机从这一地区抽取500名儿童,检查有名儿童,检查有400 名儿童入学,求抽样误差。名儿童入学,求抽样误差。或:或:第三十二页,本课件共有72页例例5.3:对某
25、天生产的:对某天生产的:对某天生产的:对某天生产的2000件电子元件的耐用时间件电子元件的耐用时间件电子元件的耐用时间件电子元件的耐用时间进行全面检测,又抽取进行全面检测,又抽取5%进行复测进行复测耐用时间耐用时间(小时)(小时)全面检测全面检测(件)(件)抽样复测抽样复测(件)(件)3000以下以下3000-40004000-50005000以上以上506009903602305018合计合计2000100根据规定耐用时间在根据规定耐用时间在根据规定耐用时间在根据规定耐用时间在30003000小时以下为不合格小时以下为不合格品,根据以上资料,计算该电子元件平均耐品,根据以上资料,计算该电子元
26、件平均耐用时间及合格率的抽样平均误差用时间及合格率的抽样平均误差第三十三页,本课件共有72页平均耐用时间的抽样平均误差平均耐用时间的抽样平均误差第三十四页,本课件共有72页合格率的抽样平均误差合格率的抽样平均误差第三十五页,本课件共有72页四、影响抽样误差的因素四、影响抽样误差的因素 总体各单位的差异程度(即标准差的大小):总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;越大,抽样误差越大;越大,抽样误差越大;越大,抽样误差越大;抽样组织方式:抽样组织方式:对相同的对相同的对相同的对相同的n,类型抽样和等距抽,类型抽样和等距抽,类型抽样和等距抽,类型抽样和等距抽 样小于简单随机抽样
27、,单个抽样小于简单随机抽样,单个抽样小于简单随机抽样,单个抽样小于简单随机抽样,单个抽 样小于整群抽样样小于整群抽样。抽样方法抽样方法:不重复抽样的抽样误差比重复抽样的不重复抽样的抽样误差比重复抽样的 抽样误差小;抽样误差小;抽样误差小;抽样误差小;样本容量:样本容量:越大,抽样误差越小;越大,抽样误差越小;越大,抽样误差越小;越大,抽样误差越小;第三十六页,本课件共有72页在进行抽样估计时,根据总体标志变异程度和在进行抽样估计时,根据总体标志变异程度和抽样调查的任务要求确定一个可允许的误差范抽样调查的任务要求确定一个可允许的误差范围,围,也称作也称作允许误差、误差范围允许误差、误差范围等。等
28、。五、抽样极限误差五、抽样极限误差设:设:抽样平均数极限误差抽样平均数极限误差 抽样成数极限误差抽样成数极限误差 第三十七页,本课件共有72页或:或:第三十八页,本课件共有72页F(t)六、抽样误差的概率度六、抽样误差的概率度 通常以抽样误差通常以抽样误差为尺度来度量抽样极限为尺度来度量抽样极限误差误差的大小,它们的数量关系为:的大小,它们的数量关系为:1 1、t t表示误差范围的倍数,称为表示误差范围的倍数,称为表示误差范围的倍数,称为表示误差范围的倍数,称为概率度。概率度。概率度。概率度。2、调查结果落在一定平均误差范围的概率,称为、调查结果落在一定平均误差范围的概率,称为、调查结果落在一
29、定平均误差范围的概率,称为、调查结果落在一定平均误差范围的概率,称为 把握程度、概率保证程度把握程度、概率保证程度或或置信度。置信度。第三十九页,本课件共有72页3、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围 的大小和概率的关系是:的大小和概率的关系是:t值值 概率保证程度概率保证程度F(t)1.00 0.6827(68.27%)1.65 0.9000(90%)1.96 0.9500(95%)2.00 0.9545(95.45)2.58 0.9900(99%)3.00 0
30、.9973(99.73%)抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。第四十页,本课件共有72页例例5.4,调查某县的水稻产量调查某县的水稻产量,从,从150个村中抽个村中抽30个村,若个村,若=5公斤,若要求调查结果的把握程公斤,若要求调查结果的把握程度在度在95.45%,则:,则:若若公斤,公斤,则则:公斤公斤 t=2即有即有95.45%的把握:的把握:第四十一页,本课件共有72页5.3 抽样估计抽样估计1、指直接以样本指标估计总体指标,估指直接以样本指标估计总体指标,估 计一个确定的值。计一个确定的值。简单,具体
31、明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况一、点估计一、点估计第四十二页,本课件共有72页2、抽样估计量的优良标准、抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第四十三页,本课件共有72页若,则称为比更有效的估计量若,则称为比更有效的估计量作为优良的估计量,除了满足无偏作
32、为优良的估计量,除了满足无偏性的要求外,其方差应比较小性的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性第四十四页,本课件共有72页q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:第四十五页,本课件共有72页二、区间估计二、区间估计1、在一定误差范围内,估计出一个可能区间、在一定误差范围内,估计出
33、一个可能区间 2、参数区间估计三要素、参数区间估计三要素 估计值(统计量的值、样本指标值)估计值(统计量的值、样本指标值)抽样误差抽样误差 概率度(置信度)概率度(置信度)第四十六页,本课件共有72页例例5.5,某灯具厂生产日光灯管,某灯具厂生产日光灯管100000只,从中随机只,从中随机抽取抽取500只测定其寿命,分组资料如下:只测定其寿命,分组资料如下:按日光灯耐用按日光灯耐用时间时间分分组组(小(小时时)组组中中值值x x日光灯只数日光灯只数f f850850以下以下8508509509509509501050105010501050115011501150115012501250125
34、01250以上以上80080090090010001000110011001200120013001300505010010015015011011070702020合合 计计500500试根据上述资料,以试根据上述资料,以95.45%的把握程度估计这的把握程度估计这100000只灯管的平均耐用时间。只灯管的平均耐用时间。第四十七页,本课件共有72页解:解:或:或:第四十八页,本课件共有72页区间估计:区间估计:有有95.45%的把握,的把握,总体平均数落在估计总体平均数落在估计区间内。区间内。置信度为置信度为95.45%的的置信区间。置信区间。第四十九页,本课件共有72页例例5.6,若灯管寿
35、命低于,若灯管寿命低于850小时以下为不合格品,小时以下为不合格品,假设用不重复抽样抽取样本,试以假设用不重复抽样抽取样本,试以68.27%的把握程度,的把握程度,对这批灯管的不合格品率作区间估计。对这批灯管的不合格品率作区间估计。解:解:第五十页,本课件共有72页区间估计:区间估计:置信度为置信度为68.27%的的置信区间。置信区间。第五十一页,本课件共有72页q调查对象的性质特点调查对象的性质特点q对调查对象的了解程度(抽样框的特点)对调查对象的了解程度(抽样框的特点)q抽样误差的大小抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组在实
36、际工作中,选择适当的抽样组织方式主要应考虑:织方式主要应考虑:5.4 抽样调查的组织方式抽样调查的组织方式第五十二页,本课件共有72页一、简单随机抽样一、简单随机抽样按随机原则直接从总体中抽出若干单位构按随机原则直接从总体中抽出若干单位构成样本。成样本。是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式又称又称完全随机抽样完全随机抽样或或纯随机抽样纯随机抽样,适用于均匀总体。,适用于均匀总体。*直接抽选法直接抽选法*抽签法抽签法*随机数码表法随机数码表法 第五十三页,本课件共有72页二、类型抽样(分层抽样
37、)二、类型抽样(分层抽样)将总体全部单位分类,形成若干个类型组,将总体全部单位分类,形成若干个类型组,然后从各类型中按水剂随机原则分别抽取样本单然后从各类型中按水剂随机原则分别抽取样本单位组成样本。位组成样本。是一种限制随机性抽样方式,适用于情况复是一种限制随机性抽样方式,适用于情况复杂、各单位之间差异较大、单位数量较多的情况。杂、各单位之间差异较大、单位数量较多的情况。优越性优越性*提高样本代表性,提高样本指标对总体指标估计提高样本代表性,提高样本指标对总体指标估计 的准确性。的准确性。*分层抽样不仅可以得到总体指标的估计值,而且分层抽样不仅可以得到总体指标的估计值,而且 可以得到各层子总体
38、指标的估计值。可以得到各层子总体指标的估计值。第五十四页,本课件共有72页总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取抽取方式抽取方式 等比例分层抽样等比例分层抽样:各各组应组应抽取的抽取的样样本本单单位数的位数的计计算公式算公式为为:第五十五页,本课件共有72页抽样误差的计算抽样误差的计算 先求出各先求出各层层的方差的方差(或(或)总总体方差体方差(或(或)或或 或或 为为各各层单层单位数,位数,第五十六页,本课件共有72页分层抽样的抽样平均误差与组间方差无关,分层抽样的抽样平均误差与组间方差无关,取决于组内方差的平均水平。取决于组内方差的平均水平。注意注意 应扩
39、大组间方差,缩小组内方差应扩大组间方差,缩小组内方差 总方差总方差=组内方差组内方差+组间方差组间方差 分层抽样误差小于简单抽样误差分层抽样误差小于简单抽样误差第五十七页,本课件共有72页三、等距抽样(机械抽样或系统抽样)三、等距抽样(机械抽样或系统抽样)将总体单位按某一标志排序,而后按一定将总体单位按某一标志排序,而后按一定的顺序和间隔抽取样本单位。的顺序和间隔抽取样本单位。随机起点随机起点(总体单位按某一标志排序)(总体单位按某一标志排序)无关标志排队等距抽样无关标志排队等距抽样 抽样距离:抽样距离:起点起点 第五十八页,本课件共有72页有关标志排队等距抽样有关标志排队等距抽样 中点等距法
40、中点等距法 对称等距法对称等距法 第五十九页,本课件共有72页抽样误差的计算抽样误差的计算 先求出各距离的方差先求出各距离的方差总总体方差体方差 或或 第六十页,本课件共有72页四、整群抽样(集体抽样)四、整群抽样(集体抽样)将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随,然后随机抽取一部分机抽取一部分“群群”,对被抽中群体的所有单,对被抽中群体的所有单位进行全面调查。位进行全面调查。群的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和
41、时间,简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差。但其样本代表性可能较差。当群内差异大、群间差异小,代表性较好当群内差异大、群间差异小,代表性较好 群的划分群的划分 自然划分:自然划分:家庭,学校,村庄。家庭,学校,村庄。人为划分:人为划分:一打帽子,一箱钉子。一打帽子,一箱钉子。群内单位数可相同,可不同。群内单位数可相同,可不同。第六十一页,本课件共有72页抽样误差的计算抽样误差的计算 N分分为为R群,每群群,每群M个个单单位,位,N=RM,随机抽取,随机抽取r群。群。表示群平均数,表示群平均数,表示群的方差表示群的方差 注注整
42、群抽样取决于群间方差,与群内方差无关。整群抽样取决于群间方差,与群内方差无关。第六十二页,本课件共有72页五、多阶段抽样五、多阶段抽样 指分两个或两个以上的阶段来完成抽取样指分两个或两个以上的阶段来完成抽取样本单位的过程。本单位的过程。例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查农户调查农户生产性投资情况。户生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从被抽中的第四阶段:从被抽中
43、的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)第六十三页,本课件共有72页5.5 必要抽样数目的确定必要抽样数目的确定 一、意义一、意义 1、合理确定抽样必要单位数,可以控制抽样误差。、合理确定抽样必要单位数,可以控制抽样误差。2、合理确定抽样必要单位数,可以在确保样本对总、合理确定抽样必要单位数,可以在确保样本对总 体的代表性的前提下,提高抽样调查的效率及经体的代表性的前提下,提高抽样调查的效率及经 济效益。济效益。二、确定抽样单位数的依据二、确定抽样单位数的依据 (或:影响抽样单位数的依据)(或:影响抽样单位数的依据)1、调查者对一项抽样推断的可靠程度和精确程
44、度调查者对一项抽样推断的可靠程度和精确程度 的要求。的要求。(估计的概率保证程度,极限误差)(估计的概率保证程度,极限误差)第六十四页,本课件共有72页2、总体各单位的差异程度。总体各单位的差异程度。3、抽样组织形式。抽样组织形式。类型抽样和等距抽样比简单随机抽样需要的抽样单类型抽样和等距抽样比简单随机抽样需要的抽样单 位数少,单个抽样比整群抽样需要的抽样单位数少位数少,单个抽样比整群抽样需要的抽样单位数少 4、抽样方法。抽样方法。不重复抽样比重复抽样需要的抽样单位数少不重复抽样比重复抽样需要的抽样单位数少 5、另外,还要考虑人力、物力和财力的许可情况。另外,还要考虑人力、物力和财力的许可情况
45、。三、计算公式三、计算公式 原理:原理:原理:原理:事先确定极限事先确定极限误误差,根据抽差,根据抽样误样误差公式求差公式求第六十五页,本课件共有72页 重复抽样条件下:重复抽样条件下:第六十六页,本课件共有72页 不重复抽样条件下:不重复抽样条件下:第六十七页,本课件共有72页【例例A A】某食品厂要检验本月生产某食品厂要检验本月生产的的1000010000袋某产品的重量,根据上月袋某产品的重量,根据上月资料,这种产品每袋重量的标准差资料,这种产品每袋重量的标准差为为2525克。要求在克。要求在95.4595.45的概率保证的概率保证程度下,平均每袋重量的误差范围程度下,平均每袋重量的误差范
46、围不超过不超过5 5克,应抽查多少袋产品?克,应抽查多少袋产品?第六十八页,本课件共有72页第六十九页,本课件共有72页【例例B】某企业对一批总数为某企业对一批总数为5000件的件的产品进行质量检查,过去几次同类调查产品进行质量检查,过去几次同类调查所得的产品合格率为所得的产品合格率为93、95、96,为,为了使合格率的允许误差不超过了使合格率的允许误差不超过3,在,在99.73 的概率保证程度下,应抽查多少件的概率保证程度下,应抽查多少件产品?产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。第七十页,本课件共有72页解:解:第七十一页,本课件共有72页STAT感感谢谢大大家家观观看看第七十二页,本课件共有72页