《统计学第六章抽样与抽样估计.ppt》由会员分享,可在线阅读,更多相关《统计学第六章抽样与抽样估计.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、三 峡 大 学经济与管理学院第六章第六章 抽样推断抽样推断教学目的:教学目的:掌握抽样调查的概念特点、应用范围;掌握抽样调查的概念特点、应用范围;掌握抽样调查的概念特点、应用范围;掌握抽样调查的概念特点、应用范围;理解、掌握抽样平均误差和抽样极限误差的计算理解、掌握抽样平均误差和抽样极限误差的计算理解、掌握抽样平均误差和抽样极限误差的计算理解、掌握抽样平均误差和抽样极限误差的计算及误差范围和置信区间;及误差范围和置信区间;及误差范围和置信区间;及误差范围和置信区间;熟练掌握简单随机抽样熟练掌握简单随机抽样熟练掌握简单随机抽样熟练掌握简单随机抽样组织方式下如何利用样本指标估计总体的平均指标组织方
2、式下如何利用样本指标估计总体的平均指标组织方式下如何利用样本指标估计总体的平均指标组织方式下如何利用样本指标估计总体的平均指标和成数指标。和成数指标。和成数指标。和成数指标。掌握假设检验的一般问题掌握假设检验的一般问题掌握假设检验的一般问题掌握假设检验的一般问题教学重点:教学重点:抽样调查的特点、抽样平均误差和抽样抽样调查的特点、抽样平均误差和抽样抽样调查的特点、抽样平均误差和抽样抽样调查的特点、抽样平均误差和抽样极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间教学难点:教学难点:抽样调查的特点、抽样平均误
3、差和抽样抽样调查的特点、抽样平均误差和抽样抽样调查的特点、抽样平均误差和抽样抽样调查的特点、抽样平均误差和抽样极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间极限误差的计算及误差范围和置信区间 教学学时:教学学时:8 8学时学时10/28/20221三 峡 大 学经济与管理学院统计推断的过程统计推断的过程总总总总体体体体样样样样本本本本总体均值、比例、总体均值、比例、总体均值、比例、总体均值、比例、方差方差方差方差样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本例如:样本例如:样本例如:样本例如:样本例如:样本均值、比
4、例、均值、比例、均值、比例、均值、比例、均值、比例、均值、比例、方差方差方差方差方差方差10/28/20222三 峡 大 学经济与管理学院第一节第一节 抽样调查抽样调查一、抽样调查的概念及特点一、抽样调查的概念及特点 1.1.概念概念 (1 1)抽样调查:从所研究的总体中抽出)抽样调查:从所研究的总体中抽出一部分单位,作为样本进行观察研究,以认一部分单位,作为样本进行观察研究,以认识总体的数量特征一种统计方法。识总体的数量特征一种统计方法。(2 2)抽样估计:根据样本分布的原理、)抽样估计:根据样本分布的原理、利用样本资料提供的信息对总体的某些数量利用样本资料提供的信息对总体的某些数量特征进行
5、科学的估计或推断。特征进行科学的估计或推断。10/28/20223三 峡 大 学经济与管理学院2.2.特点特点(1 1)根据部分实际资料对全部总体的数量特征)根据部分实际资料对全部总体的数量特征作出估计;作出估计;(2 2)按随机原则从全部总体中抽取样本单位;)按随机原则从全部总体中抽取样本单位;(3 3)抽样误差可以事先计算并加以控制;)抽样误差可以事先计算并加以控制;二、抽样调查的作用二、抽样调查的作用1.1.对不可能进行全面调查现象进行抽样估计;对不可能进行全面调查现象进行抽样估计;2.2.抽样调查可以节省人力物力,提高调查的经抽样调查可以节省人力物力,提高调查的经济效益,又能够节省时间
6、,提高调查的实效性。济效益,又能够节省时间,提高调查的实效性。10/28/20224三 峡 大 学经济与管理学院三、抽样调查的几个基本概念三、抽样调查的几个基本概念 1.总体和样本总体和样本 (1 1)总体)总体 总体单位的总数称为总体单位的总数称为总体容量总体容量(用(用N N表示)。表示)。(2 2)样本)样本 从总体中抽取来代表总体的部分总体单位所从总体中抽取来代表总体的部分总体单位所构成的整体。构成的整体。样本单位的总数称为样本单位的总数称为样本容量样本容量(用(用n n表示)。表示)。种类:大样本种类:大样本 小样本小样本10/28/20225三 峡 大 学经济与管理学院2.2.总体
7、参数和样本指标总体参数和样本指标(1 1)总体参数(总体指标)总体参数(总体指标)如如 (或记为(或记为 )、)、P P、等。等。(2 2)样本指标(估计量或样本统计量)样本指标(估计量或样本统计量)如如 、p p、s s 等。等。3.重复抽样和不重复抽样重复抽样和不重复抽样(1 1)重复抽样(回置抽样)重复抽样(回置抽样)(2 2)不重复抽样(不回置抽样)不重复抽样(不回置抽样)10/28/20226三 峡 大 学经济与管理学院4.4.概率抽样与非概率抽样概率抽样与非概率抽样(1 1)概率抽样)概率抽样 基本的组织方式有:整群抽样、分层抽样、基本的组织方式有:整群抽样、分层抽样、等距抽样、简
8、单随机抽样。等距抽样、简单随机抽样。(2 2)非概率抽样)非概率抽样 根据调查者的经验或判断,从总体中有意根据调查者的经验或判断,从总体中有意识的抽取若干单位构成样本。如典型调查、重识的抽取若干单位构成样本。如典型调查、重点调查等。点调查等。10/28/20227三 峡 大 学经济与管理学院5.5.抽样筐抽样筐(1 1)定义:包括全体抽样单位的名单框架。)定义:包括全体抽样单位的名单框架。(2 2)形式:)形式:名单抽样筐名单抽样筐列出全部总体单位的名录一览列出全部总体单位的名录一览表。如企业名单、居民名单、学生名单;表。如企业名单、居民名单、学生名单;区域抽样筐区域抽样筐按地理位置将总体范围
9、划分为按地理位置将总体范围划分为若干小区域,以小区域为抽样单位;若干小区域,以小区域为抽样单位;时间表抽样筐时间表抽样筐将总体全部单位按照时间顺将总体全部单位按照时间顺序排列,把总体的时间过程分为若干小的时间单序排列,把总体的时间过程分为若干小的时间单位,以时间单位为抽样单位。如检测流水线上的位,以时间单位为抽样单位。如检测流水线上的产品质量时以产品质量时以1 1分钟为一个抽样单位。分钟为一个抽样单位。10/28/20228三 峡 大 学经济与管理学院第二节第二节 抽样误差抽样误差一、抽样误差的概念一、抽样误差的概念(一)抽样误差的性质(一)抽样误差的性质 1.1.1.1.抽样误差抽样误差抽样
10、误差抽样误差 由于随机抽样的偶然因素使各单位的结构不足由于随机抽样的偶然因素使各单位的结构不足由于随机抽样的偶然因素使各单位的结构不足由于随机抽样的偶然因素使各单位的结构不足以代表总体的结构而引起抽样指标与总体指标间以代表总体的结构而引起抽样指标与总体指标间以代表总体的结构而引起抽样指标与总体指标间以代表总体的结构而引起抽样指标与总体指标间的绝对离差。的绝对离差。的绝对离差。的绝对离差。2.2.2.2.抽样调查中误差的来源抽样调查中误差的来源抽样调查中误差的来源抽样调查中误差的来源 (1)(1)(1)(1)登记性误差登记性误差登记性误差登记性误差:可避免可避免可避免可避免 (2)(2)(2)(
11、2)代表性误差代表性误差代表性误差代表性误差 系统误差系统误差系统误差系统误差:非随机、可避免非随机、可避免非随机、可避免非随机、可避免 随机性误差:可计算、控制随机性误差:可计算、控制随机性误差:可计算、控制随机性误差:可计算、控制 抽样估计中所指的误差主要指随机误差。抽样估计中所指的误差主要指随机误差。抽样估计中所指的误差主要指随机误差。抽样估计中所指的误差主要指随机误差。10/28/20229三 峡 大 学经济与管理学院(二)抽误误差的影响因素(二)抽误误差的影响因素 1.1.样本容量样本容量:即样本单位数即样本单位数2.2.总体差异程度总体差异程度3.3.抽样方法抽样方法4.4.抽样组
12、织形式抽样组织形式10/28/202210三 峡 大 学经济与管理学院二、抽样平均误差二、抽样平均误差(一)抽样平均误差的概念(一)抽样平均误差的概念 所有可能样本的估计值与相应总体参数的所有可能样本的估计值与相应总体参数的标准差,反映样本估计值与其中心的平均离标准差,反映样本估计值与其中心的平均离散程度。散程度。(二)抽样平均误差的计算公式(二)抽样平均误差的计算公式 10/28/202211三 峡 大 学经济与管理学院样本均值的抽样分布样本均值的抽样分布(一个例子)(一个例子)【例例例例】设设一一个个总总体体,含含有有4个个元元素素(个个体体),即即总总体体单单位位数数N=4。4 个个个个
13、体体分分别别为为X1=1、X2=2、X3=3、X4=4。总总体体的的均值、方差及分布如下均值、方差及分布如下:均值和方差均值和方差均值和方差均值和方差总体分布总体分布总体分布总体分布1 14 42 23 30 0.1 12 2.3 310/28/202212三 峡 大 学经济与管理学院 现现从从总总体体中中抽抽取取n2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下,共共有有42=16个个样样本本。所所有有样样本本的的结结果果如下表如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第
14、一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)10/28/202213三 峡 大 学经济与管理学院样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 01 12 23 3P P(x x)1.51.53.03.04.04.03.53.52.02.02.52.5x x 计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样
15、本的均值(个样本的均值(x)10/28/202214三 峡 大 学经济与管理学院所有样本均值的均值和方差所有样本均值的均值和方差式中:式中:M为样本数目为样本数目比较及结论:比较及结论:1.样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/n10/28/202215三 峡 大 学经济与管理学院1.1.抽样平均数的平均误差抽样平均数的平均误差(1)(1)重复抽样重复抽样(2)(2)不重复抽样不重复抽样10/28/202216三 峡 大 学经济与管理学院2.2.抽样成数的平均误差抽样成数的平均误差(1)(1
16、)重复抽样重复抽样(2)(2)不重复抽样不重复抽样 例:从例:从例:从例:从40000400004000040000件产品中随机抽取件产品中随机抽取件产品中随机抽取件产品中随机抽取200200200200件进件进件进件进行检查,结果有行检查,结果有行检查,结果有行检查,结果有10101010件不合格。求合格率的抽件不合格。求合格率的抽件不合格。求合格率的抽件不合格。求合格率的抽样平均误差?样平均误差?样平均误差?样平均误差?10/28/202217三 峡 大 学经济与管理学院三、抽样极限误差三、抽样极限误差(一)概念(一)概念 又称允许误差。指样本指标与总体指标又称允许误差。指样本指标与总体指
17、标又称允许误差。指样本指标与总体指标又称允许误差。指样本指标与总体指标之间产生抽样误差被允许的最大可能范围。之间产生抽样误差被允许的最大可能范围。之间产生抽样误差被允许的最大可能范围。之间产生抽样误差被允许的最大可能范围。(二)抽样极限误差的计算(二)抽样极限误差的计算 10/28/202218三 峡 大 学经济与管理学院(三)抽样误差的概率度(三)抽样误差的概率度 基于概率估计的要求,抽样极限误差通基于概率估计的要求,抽样极限误差通基于概率估计的要求,抽样极限误差通基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。常需要以抽样平均误差为标准单位来衡量。常需要以抽样平均误
18、差为标准单位来衡量。常需要以抽样平均误差为标准单位来衡量。极限误差除以抽样平均误差得到的相对极限误差除以抽样平均误差得到的相对极限误差除以抽样平均误差得到的相对极限误差除以抽样平均误差得到的相对数称为概率度。用数称为概率度。用数称为概率度。用数称为概率度。用Z Z Z Z表示。表示。表示。表示。(四)抽样估计的置信度(四)抽样估计的置信度 指样本指标与总体指标误差不超过一定指样本指标与总体指标误差不超过一定指样本指标与总体指标误差不超过一定指样本指标与总体指标误差不超过一定范围的概率保证程度。抽样误差的概率就是范围的概率保证程度。抽样误差的概率就是范围的概率保证程度。抽样误差的概率就是范围的概
19、率保证程度。抽样误差的概率就是概率度概率度概率度概率度Z Z Z Z的涵数,即:的涵数,即:的涵数,即:的涵数,即:10/28/202219三 峡 大 学经济与管理学院10/28/202220三 峡 大 学经济与管理学院第三节第三节 简单随机抽样估计的方法简单随机抽样估计的方法 一、一、抽样估计的优良标准抽样估计的优良标准 同一个总体参数有多个样本估计量,究竟同一个总体参数有多个样本估计量,究竟哪一个才是最优估计量呢,常用以下三个标准哪一个才是最优估计量呢,常用以下三个标准衡量:衡量:1.1.无偏性:无偏性:估计量的数学期望等于被估计估计量的数学期望等于被估计的总体参数的总体参数P(X)XC
20、CA A 无偏无偏无偏无偏有偏有偏有偏有偏10/28/202221三 峡 大 学经济与管理学院 2.2.有有效效性性:一一个个方方差差较较小小的的无无偏偏估估计计量量称称为为一一个个更更有有效效的的估估计计量量。如如,与与其其他他估估计计量量相相比比,样样本均值是一个更有效的估计量。本均值是一个更有效的估计量。AB 中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布XP(X)10/28/202222三 峡 大 学经济与管理学院 3.3.一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量越来越接近被估计的总体参数。量越来越接近被估计的总体参数。AB较小的样本容量较小的样本容
21、量较大的样本容量较大的样本容量 P(X)X10/28/202223三 峡 大 学经济与管理学院 二、总体参数的点估计二、总体参数的点估计 1.1.1.1.概念概念概念概念 从总体中抽取一个样本,根据该样本从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值的统计量对总体的未知参数作出一个数值点的估计。点的估计。例如例如:用样本均值作为总体未知均值用样本均值作为总体未知均值的估计值就是一个点估计。的估计值就是一个点估计。2.2.点点估估计计的的方方法法:有有矩矩估估计计法法、顺顺序序统统计计量法、最大似然法、最小二乘法等。量法、最大似然法、最小二乘法等。优点优点:简单明确:简单明
22、确 缺点:缺点:不能说明估计结果的抽样误差和不能说明估计结果的抽样误差和把握程度。把握程度。10/28/202224三 峡 大 学经济与管理学院l几个总体参数的无偏、有效、一致点估计几个总体参数的无偏、有效、一致点估计l(1)样本平均数估计量是总体平均数的无偏、有效、一致估计,即l(2)样本比例是总体比例的无偏、有效、一致估计,即10/28/202225三 峡 大 学经济与管理学院l(3)总体方差的无偏估计是:总体方差的无偏估计是:10/28/202226三 峡 大 学经济与管理学院三、总体参数的区间估计三、总体参数的区间估计 (一)一)区间估计的概念要点区间估计的概念要点 1.根据一个样本的
23、观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围 2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率 3.例如例如:总体均值在总体均值在5070之间,置信度为之间,置信度为 95%置信区间置信区间置信下限置信下限置信上限置信上限样本统计量样本统计量(点估计点估计)10/28/202227三 峡 大 学经济与管理学院(二)区间估计的内容(二)区间估计的内容 2 2 已知已知 2 2未知未知均均 值值方方 差差比比 例例置置 信信 区区 间间10/28/202228三 峡 大 学经济与管理学院落在总体均值某一区间内的样本落在总体均值某一区间内的样本95%95%的
24、样本的样本的样本的样本x -1.96-1.96 x xx +1.96+1.96 x x99.73%99.73%的样本的样本的样本的样本 x -3-3 x x x +3 3 x x90%的样本的样本x -1.65 xx +1.65 x10/28/202229三 峡 大 学经济与管理学院(三)置信水平(三)置信水平 1.总体未知参数落在区间内的概率总体未知参数落在区间内的概率2.表示为表示为(1-为显著性水平,是总体参数为显著性水平,是总体参数未在未在区间内区间内的概率的概率 3.常用常用(1-)%有有 99%,95%,90%99.7399.73,95.4595.45,68.2768.27相应的相
25、应的 为为,;,10/28/202230三 峡 大 学经济与管理学院(四)总体均值的区间估计(四)总体均值的区间估计(已知已知)1.假定条件假定条件总体服从正态分布总体服从正态分布,且总体方差(且总体方差()已知已知如果不是正态分布,可以由正态分布来近似如果不是正态分布,可以由正态分布来近似(n 30)2.使用正态分布统计量使用正态分布统计量3.总体均值总体均值 在在1-置信水平下的置信水平下的置信区间为置信区间为以上是重复抽样,如果是不重复抽样又怎样呢!以上是重复抽样,如果是不重复抽样又怎样呢!10/28/202231三 峡 大 学经济与管理学院总体均值的区间估计总体均值的区间估计(正态总体
26、:实例)(正态总体:实例)【例例1】某某种种零零件件长长度度服服从从正正态态分分布布,从从该该批批产产品品中中随随机机抽抽取取件件,测测得得其其平平均均长长度度为为21.4 21.4 mmmm。已已知知总总体体标标准准差差 ,试试估估计计该该种种零零件件平平均均长长度度的的置置信信区区间间,给给定置信水平为。定置信水平为。解解:已已知知N(,2),x2.14,n,/2 总体均值总体均值 的置信区间为的置信区间为我我们们可可以以95的的概概率率保保证证该该种种零零件件的的平平均长度在均长度在21.498 mm之间。之间。10/28/202232三 峡 大 学经济与管理学院总体均值的区间估计总体均
27、值的区间估计(非正态总体:实例)(非正态总体:实例)【例例2】某某大大学学从从该该校校学学生生中中随随机机抽抽取取100100人人,调调查查到到他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为2626分分钟钟。试试以以9595的的置置信信水水平平估估计计该该大大学学全全体体学学生生平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间(已已知知总总体体方方差差为为3636分钟)。分钟)。解:解:已知已知 x26,=6,n=100,,/2我我们们可可以以95的的概概率率保保证证平平均均每每天天参参加加锻锻炼炼的的时时间间在在27.176 分分钟钟之之间。间。10/28/202233
28、三 峡 大 学经济与管理学院总体均值的置信区间总体均值的置信区间(未知未知,小样本小样本)1.假定条件假定条件总体方差(总体方差()未知未知总体必须服从总体必须服从正态分布正态分布2.使用使用 t 分布统计量分布统计量3.3.总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为置信区间为以上是重复抽样,如果是不重复抽样又怎样呢!以上是重复抽样,如果是不重复抽样又怎样呢!10/28/202234三 峡 大 学经济与管理学院总体均值的区间估计总体均值的区间估计(未知实例未知实例)【例例3】从从一一个个正正态态总总体体中中抽
29、抽取取一一个个随随机机样样本本,n=25,其其均均值值 x=50,标标准准差差 s=8。建建立立总总体体均均值值 的的95%的的置信区间。置信区间。解解:已已知知N(,2),x=50,s=8,n,t/2。我我们们可可以以95的的概概率率保保证证总总体体均均值值在在53.30 之间之间10/28/202235三 峡 大 学经济与管理学院(五)总体比例的置信区间(五)总体比例的置信区间1.假定条件假定条件两类结果两类结果总体服从二项分布总体服从二项分布可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量3.总体比例总体比例 的置信区间为的置信区间为以上是重复抽样,如果是
30、不重复抽样又怎样呢!以上是重复抽样,如果是不重复抽样又怎样呢!10/28/202236三 峡 大 学经济与管理学院例例例例4 4 4 4:某城市想要估计下岗职工中女性所占的某城市想要估计下岗职工中女性所占的某城市想要估计下岗职工中女性所占的某城市想要估计下岗职工中女性所占的比例,随机抽取了比例,随机抽取了比例,随机抽取了比例,随机抽取了100100100100名下岗职工,其中名下岗职工,其中名下岗职工,其中名下岗职工,其中65656565人为女性职工。试以人为女性职工。试以人为女性职工。试以人为女性职工。试以99.73%99.73%99.73%99.73%的置信水平估计的置信水平估计的置信水平
31、估计的置信水平估计该城市下岗职工中女性比例的置信区间该城市下岗职工中女性比例的置信区间该城市下岗职工中女性比例的置信区间该城市下岗职工中女性比例的置信区间?10/28/202237三 峡 大 学经济与管理学院影响区间宽度的因素影响区间宽度的因素1.数据的离散程度,数据的离散程度,用用 来测度来测度2.样本容量样本容量3.3.置信水平置信水平(1-),影响,影响 Z 的的大小大小10/28/202238三 峡 大 学经济与管理学院区间估计步骤区间估计步骤(以估计(以估计 为例):为例):计算样计算样本统计本统计量量计算抽计算抽样平均样平均误差误差计算抽计算抽样极限样极限误差误差 确定置确定置信区
32、间信区间10/28/202239三 峡 大 学经济与管理学院 四、样本容量的确定四、样本容量的确定思考思考:1.:1.影响样本容量的因素影响样本容量的因素?2.2.比例条件下比例条件下n n的确定的确定?10/28/202240三 峡 大 学经济与管理学院 课堂练习课堂练习:用用用用简简简简单单单单随随随随机机机机抽抽抽抽样样样样方方方方法法法法,从从从从一一一一批批批批电电电电子子子子产产产产品品品品中中中中按按按按重重重重复复复复抽样抽取抽样抽取抽样抽取抽样抽取100100100100个对其使用寿命进行测试,结果如下:个对其使用寿命进行测试,结果如下:个对其使用寿命进行测试,结果如下:个对
33、其使用寿命进行测试,结果如下:(1 1 1 1)以)以)以)以95959595.45454545的概率保证的概率保证的概率保证的概率保证 程度估计该产品的平均使用程度估计该产品的平均使用程度估计该产品的平均使用程度估计该产品的平均使用 寿命区间?寿命区间?寿命区间?寿命区间?(2 2 2 2)若)若)若)若 30003000小时以下为不小时以下为不 合格品,试以同样的概率估合格品,试以同样的概率估 计计该产品合格率的区间?该产品合格率的区间?该产品合格率的区间?该产品合格率的区间?使用寿命使用寿命(小时)(小时)产品个数产品个数3000以下以下 15 30004000 30 40005000
34、505000以上以上 510/28/202241三 峡 大 学经济与管理学院第四节第四节 其他抽样组织方式其他抽样组织方式及其抽样估计及其抽样估计一、分层抽样及其抽样估计一、分层抽样及其抽样估计1.1.分层抽样的概念分层抽样的概念2.2.等比分层抽样等比分层抽样10/28/202242三 峡 大 学经济与管理学院【例例1】某某地地区区对对居居民民在在一一年年内内用用于于某某类类消消费费的的支支出出进进行行了了等等比比例例分分层层抽抽样样,结果如下,单位:结果如下,单位:(元)要要求求以以95.45%的的置置信信度度估估计计该该地地区区平平均均每每户户支支出的区间出的区间?调查调查户数户数平均平
35、均支出支出方差方差城镇城镇403502209农村农村802602916解解:以以95.45%的的置置信信度度估估计计该该地地区区平平均均每每户户支支出出的的区区间为至元之间。间为至元之间。10/28/202243三 峡 大 学经济与管理学院3.3.不等比分层抽样不等比分层抽样【例例2】某某企企业业生生产产的的1 1万万件件某某种种产产品品,有有6 6千千件件由由3 3年年前前购购进进的的新新机机器器生生产产,现现在在两两类类中中各各抽抽100100件件。由由旧旧机机器器生生产产的的产产品品样样本本合合格格率率是是94%94%,新新机机器器生生产产的的产产品品样样本本合合格格率率是是98%98%
36、,要要求求以以68.27%的的置置信信度度估估计计全全部部产产品合格率的区间品合格率的区间?10/28/202244三 峡 大 学经济与管理学院解:解:解:解:N=10000N=10000N=10000N=10000,N1=4000=4000=4000=4000,N2=6000=6000=6000=6000,n1=n2 =100,=100,=100,=100,p1=94%,=94%,=94%,=94%,p2=98%,z=1=98%,z=1=98%,z=1=98%,z=1置信上限置信上限=96%+1.3%=97.3%上限上限=96%-1.3%=94.7%以以68.27%的置信度估计全部产品合格率
37、的区间的置信度估计全部产品合格率的区间为为94.7%至至97.3%10/28/202245三 峡 大 学经济与管理学院二、等距抽样及其抽样估计二、等距抽样及其抽样估计 1.1.等距抽样的概念等距抽样的概念 2.2.无关标志排队等距抽样无关标志排队等距抽样 其抽样误差按简单随机抽样的抽样误差公式近似其抽样误差按简单随机抽样的抽样误差公式近似计算。计算。3.3.有关标志排队等距抽样有关标志排队等距抽样 其抽样误差按分层抽样的抽样误差公式近似计算。其抽样误差按分层抽样的抽样误差公式近似计算。(1 1)半距起点等距抽样)半距起点等距抽样 (2 2)对称起点等距抽样)对称起点等距抽样10/28/2022
38、46三 峡 大 学经济与管理学院三、整群抽样及其抽样估计三、整群抽样及其抽样估计1.1.整群抽样的概念整群抽样的概念2.2.整群抽样估计整群抽样估计例例3 某商场有某种饮料某商场有某种饮料500箱箱,每箱每箱6瓶瓶,现随机抽取现随机抽取10箱检查箱检查每瓶的含菌量数每瓶的含菌量数,测得这测得这10箱的平均每瓶含菌数分别为箱的平均每瓶含菌数分别为:90、80、65、85、75、70、60、65个。要求以个。要求以95%的置信度推的置信度推断这批饮料的平均含菌数的区间?(教材断这批饮料的平均含菌数的区间?(教材P108)10/28/202247三 峡 大 学经济与管理学院第五节第五节 假设检验假设
39、检验一、假设检验的概念一、假设检验的概念 事先对总体参数或总体分布形式(特征)事先对总体参数或总体分布形式(特征)作出一个假设,然后利用样本信息来判断原作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是假设是否合理,即判断样本信息与原假设是否有显著性差异,从而决定应接受或否定原否有显著性差异,从而决定应接受或否定原假设。所以,假设检验也称为显著性检验。假设。所以,假设检验也称为显著性检验。二、假设检验的步骤二、假设检验的步骤第一步第一步,提出假设,包括原假设和备择假设,提出假设,包括原假设和备择假设10/28/202248三 峡 大 学经济与管理学院 原原假假设设又又
40、称称零零假假设设,是是正正待待检检验验的的假假设设,记记为为H0;备备择择假假设设是是拒拒绝绝原原假假设设后后可可供供选选择择的的假设,记为假设,记为H1。原原假假设设与与备备择择假假设设是是相相互互对对立立的的,检检验验结结果果两者必取其一两者必取其一一般地,假设有三种形式一般地,假设有三种形式(1)H0:uu0;H1:uu0 双侧检验双侧检验(2)H0:uu0;H1:uu0(或或H0:uu0;H1:uu0)左侧检验左侧检验(3)H0:uu0;H1:uu0(或或H0:uu0;H1:uu0)右侧检验右侧检验10/28/202249三 峡 大 学经济与管理学院 第第二二步步,构构造造相相应应的的
41、检检验验统统计计量量,并并确确定定其其 分分布布形形式式不不同同的的假假设设检检验验问问题题需需要要选选择择不不同同的统计量作为检验统计量。的统计量作为检验统计量。第第三三步步,确确定定显显著著性性水水平平 和和临临界界值值(单单双双侧侧)。表表示示H H0 0为为真真时时拒拒绝绝H H0 0的的概概率率(小小概概率率),通通常取、。常取、。第四步第四步,根据样本数据计算统计量的值,根据样本数据计算统计量的值或或P P值值。第第五五步步,作作出出结结论论。根根据据所所计计算算的的统统计计量量的的值值与与临临界界值值比比较较(或或用用P P值值与与 对对比比),确确定定是是否否拒拒绝绝原原假假设
42、设统统计计值值落落在在拒拒绝绝区区域域内内(或或者者落在接受区域内的概率落在接受区域内的概率P P 1 Za/2时拒绝原假设,否则时拒绝原假设,否则接受原假设;接受原假设;(2)左侧检验:)左侧检验:H0:uu0(或(或H0:uu0);H1:uu0,则临界值为,则临界值为 Za,当,当ZZa时拒绝原假设,时拒绝原假设,否则接受原假设;否则接受原假设;10/28/202252三 峡 大 学经济与管理学院【例例】某品牌精炼油标明每桶净重量不低于】某品牌精炼油标明每桶净重量不低于 3 3 公斤。现随公斤。现随机抽验了机抽验了 36 36 桶油,计算其平均净重为公斤,并且已知总桶油,计算其平均净重为公
43、斤,并且已知总体标准差为公斤。试在的显著性水平下检验每桶油净重不体标准差为公斤。试在的显著性水平下检验每桶油净重不低于低于 3 3 公斤的说法是否成立。公斤的说法是否成立。第一步第一步:确定假设确定假设H0:3;H1:3 第二步第二步:确定检验统计量:确定检验统计量第三步第三步:求临界值:求临界值第四步第四步:比较统计量与临界值大小:比较统计量与临界值大小由于由于ZZ 接受接受H0即即每桶油净重低于每桶油净重低于 3 公斤。公斤。10/28/202253三 峡 大 学经济与管理学院 2.总体方差未知时对正态总体均值的检验总体方差未知时对正态总体均值的检验 t检验法检验法(1)双侧检验:当)双侧
44、检验:当|t|ta/2时拒绝时拒绝H0,否则接受,否则接受H0(2)左侧检验)左侧检验:当当 t ta时拒绝时拒绝H0,否则接受,否则接受H0 【例例】1998年全国人均年消费支出为年全国人均年消费支出为1590元,元,同期在新疆一个同期在新疆一个25户家庭组成的样本表明,其户家庭组成的样本表明,其年人均消费支出为年人均消费支出为1450元,样本标准差为元,样本标准差为220元。试以的显著性水平判断,新疆的人均年消元。试以的显著性水平判断,新疆的人均年消费支出是否明显地低于全国平均水平?费支出是否明显地低于全国平均水平?10/28/202254三 峡 大 学经济与管理学院解:设解:设 H H0
45、 0:1590 1590 H H1 1:1590 1590 由由 =0.1=0.1 有:有:-t-t(25-125-1)=由于由于 t t 值值小于小于-t-t ,落在拒绝域中,故拒落在拒绝域中,故拒绝原假设,接受备择假设。绝原假设,接受备择假设。10/28/202255三 峡 大 学经济与管理学院3.总体比例的假设检验总体比例的假设检验 大样本下近似采用大样本下近似采用Z检验法检验法提出假设:提出假设:H0:Pp0;H1:P p0确定检验统计量:确定检验统计量:确定临界值确定临界值Za/2(Za)比较临界值与检验统计量的大小,作出判断比较临界值与检验统计量的大小,作出判断例(例(P119例例
46、6-4)10/28/202256三 峡 大 学经济与管理学院关键点:原假设与备择假设的选择关键点:原假设与备择假设的选择定义定义:原假设通常是研究者想收集证据予以反对的假设原假设通常是研究者想收集证据予以反对的假设备择假设是是研究者想收集证据予以支持的假设备择假设是是研究者想收集证据予以支持的假设原则:原则:1、两者相互对立,是完备事件组、两者相互对立,是完备事件组2、一般先确定备择假设,然后再确定原假设、一般先确定备择假设,然后再确定原假设3、在假设检验中、在假设检验中“=”总是放在原假设上。总是放在原假设上。4、两者有一定的主观色彩,取决于研究目的。、两者有一定的主观色彩,取决于研究目的。
47、5、假设检验目的主要是收集证据来拒绝原假设。不拒、假设检验目的主要是收集证据来拒绝原假设。不拒绝原假设,不意味着接受原假设。绝原假设,不意味着接受原假设。10/28/202257三 峡 大 学经济与管理学院五、五、假设检验中的其它问题假设检验中的其它问题1.区间估计与假设检验的关系区间估计与假设检验的关系(1)两者的区别)两者的区别区间估计是根据样本资料估计总体参数的真值,而假设检验是根据样本资料来检验对总体参数的先验假设是否成立区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验也常常有单侧检验10/28/202258三 峡 大 学经济与管理学院区间估计立足于大概率
48、,以较大的概率(1a)去估计总体参数的置信区间,而假设检验立足于小概率,通常给定很小的显著性水平a去检验对总体参数的先验性假设是否成立(2)相同点)相同点都是根据样本信息对总体参数进行推断都是以抽样分布理论为依据,建立在概率基础上推断推断的结果都有一定的可信程度或者风险10/28/202259三 峡 大 学经济与管理学院【例例】高尔夫球生产企业规定,合格球的射程为】高尔夫球生产企业规定,合格球的射程为280 码。某日随机抽取码。某日随机抽取36 个球组成一个样本,测得个球组成一个样本,测得其平均射程为其平均射程为 码,标准差为码,标准差为12码。试在显著性水平码。试在显著性水平为条件下,检验该
49、批球的射程是否不为为条件下,检验该批球的射程是否不为280码。码。不能拒绝原假设,即不能拒绝原假设,即不能否定不能否定 0=280 码码。280码处于置信区间之码处于置信区间之中,不能拒绝原假设。中,不能拒绝原假设。10/28/202260三 峡 大 学经济与管理学院本章作业本章作业教材P242练习6;7;8;10;1110/28/202261三 峡 大 学经济与管理学院本章练习本章练习一、填空一、填空1.1.抽样推断最基本的组织形式是抽样推断最基本的组织形式是 ,在这种,在这种形式下,若成数及其允许误差不超过形式下,若成数及其允许误差不超过5050,概,概率为,则必要抽样数目为率为,则必要抽
50、样数目为 。2.2.抽样估计的方法有两种,即抽样估计的方法有两种,即 和和 。3.3.抽样估计的目的在于由抽样估计的目的在于由 指标来估计总体指标来估计总体指标。指标。10/28/202262三 峡 大 学经济与管理学院二、选择二、选择1.1.用简单随机抽样(重复抽样)方法抽取样本单用简单随机抽样(重复抽样)方法抽取样本单位,如果要使用抽样平均误差降低位,如果要使用抽样平均误差降低5050,则样,则样本容量需扩大到原来的(本容量需扩大到原来的().倍倍 .倍倍 .倍倍 .倍倍2.2.某某机机械械厂厂生生产产的的铸铸件件合合格格率率为为9090,则则其其标标准准差为(差为().0.9 .0.9