《(专科)ch7参数估计教学ppt课件.pptx》由会员分享,可在线阅读,更多相关《(专科)ch7参数估计教学ppt课件.pptx(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(专科)ch7参数估计教学ppt课件第7章 参数估计PPT模板下载:行业PPT模板:节日PPT模板:素材下载:PPT背景图片:图表下载:优秀PPT下载:教程: Word教程: 教程:资料下载:课件下载:范文下载:试卷下载:教案下载:论坛: 本章目录CONTENTS 7.1 估计抽样的基本问题017.2 点估计及评价标准027.4 必要样本量的确定047.3 区间估计037.参数估计数理统计的基本问题之一是根据样本所提供的信息,对总体的分布以及分布的数字特征做出统计推断。通过样本估计总体未知参数的方法主要包括参数估计和非参数估计法。这里的参数可以是总体分布中的未知参数,也可以是总体的某个数字特征
2、。参数估计通常是通过构造样本的函数样本统计量来实现的。7.参数估计 参数估计是在抽样调查的基础上所进行的数据推测,即用抽样调查所得到的一部分单位的数量特征来估计和推算总体的数量特征。除了描述统计之外,抽样估计是对总体进行研究的另一种重要方法。它具有花费小、适用性强、科学性高等特点。7.参数估计总体样本统计量描述作出推断统计量是进行参数估计的关键.不同的参数估计方法得到的统计量可能不同.在这里,我们介绍两种常用的参数估计方法:点估计法和区间估计法.随机抽样 抽样设计1.抽样框抽样框是包含所有抽样单位的名单框架,基本元素是抽样单位。抽样单位既可以是单个的总体单位,也可以是多个总体单位组成的群体。按
3、照抽样单位的属性,可以把抽样框划分为名单抽样框、时间抽样框、区域抽样框等。名单抽样框是包括总体单位的名单框架。名单抽样框是包括总体单位的名单框架。比如调查某企业的职工薪酬水平时,可以将该企业职工名单作为抽样框。时间抽样框是以时间作为抽样单位的一种抽样框,这种抽样框可以借助时间的自然属性进行抽样,一般是用在连续作业的情况下。例如,调查24小时作业的流水生产线产品质量,每隔1小时抽取一分钟的产品,可以把每分钟视作一个抽样单位,这样全天的产品都包括在1440分钟内,这里的抽样框就是一个时间抽样框。区域抽样框是将自然地理区域或者性质区域作为抽样单位的一种抽样框。例如,城市居民生活水平调查时,可以按照街
4、道将总体单位进行划分,以街道为单位进行抽样。7.1.1 抽样估计2.抽样方法抽样方法按照总体单位样本中是否重复出现,可以将抽样方法分为重复抽样与不重复抽样两类。重复抽样也称为有放回抽样,是指从总体中抽出某个(些)总体单位,对某个(些)总体单位进行观测、登记等之后,又将其放回总体中,再继续抽样,相当于进行了n次独立随机试验。换句话说,一个容量为N的总体,每次抽样都是在这N个总体单位中进行的,总体中每个总体单位都有可能被抽到,每次每个总体单位被抽到的概率都是1/N。不重复抽样也称为无放回抽样,是从总体中抽出某个(些)总体单位后,不再将这个(些)总体单位放回总体中,下次抽样是在剩余的总体单位中抽取。
5、不重复抽样的特点是每个总体单位可能被抽到的次数只有一次,每个总体单位不会重复出现在样本中,并且n次抽样之间相互并不独立。7.1.2 估计抽样误差用样本估计总体必然存在误差。误差的来源有许多方面,根据来源不同,总误差可以分为:总误差登记性误差代表性误差系统性误差(偏差)随机误差(抽样误差)l 第一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都可能发生的。l 另一类是代表性误差,即样本的结构不足以代表总体而引起的误差。代表性误差分为两种情况:1. 一种情况是系统性误差,由于违反抽样调查的随机原则,人为的控制样本的选择,如有意地多选较好的单位或
6、较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,形成系统性误差。系统性误差和登记性误差是可以采取措施避免发生或将其减小到最小限度。2. 另一种情况是随机代表性误差,即使遵守随机原则,由于被抽选的样本单位多种多样,出现或大或小的随机代表性误差。7.1.2 估计抽样误差7.2 点估计及评价标准随机抽查50天的销售金额(单位:万元):30,27,26,38,35,22,41 呢 ? 据此,我们应如何估计和而全部信息就由这50个数组成 .点估计包括矩估计法、极大似然估计法、顺序统计量法、贝叶斯估计法和最小二乘法等。7.2.1 矩估计法 矩估计法是一种古老的点估计方法,是英国统计
7、学家K.Pearson提出的,矩估计的基本思想是替换原则,即用样本矩去替换总体矩。常用的矩估计量 1.样本k阶原点矩作为总体同阶原点矩的矩估计,即7.2.1 矩估计法 矩估计的优点与局限矩估计法的优点在于步骤较为简单,使用方便,并且当总体分布未知时该方法也可使用。但也有以下几点局限性:一、由于矩估计法只利用了总体矩的部分信息,并未用到总体的分布,在体现总体分布一、由于矩估计法只利用了总体矩的部分信息,并未用到总体的分布,在体现总体分布特征上往往性质较差。特征上往往性质较差。二、在使用矩估计法时需要首先检验总体二、在使用矩估计法时需要首先检验总体k阶矩是否存在,矩估计法并不适用总体阶矩是否存在,
8、矩估计法并不适用总体k阶矩阶矩不存在的情况。不存在的情况。三、在一些情况下,矩估计结果可能并不唯一。例如泊松分布参数三、在一些情况下,矩估计结果可能并不唯一。例如泊松分布参数,如果用样本均值和,如果用样本均值和方差去估计方差去估计,将得到不同的结果。,将得到不同的结果。矩估计法的具体做法:7.2.1 矩估计法 矩估计法的具体做法:7.2.1 矩估计法 对于同一个未知参数, 不同的方法得到的估计量可能不同,于是提出问题应该选用哪一种估计量?用什么标准来评价一个估计量的好坏?(1) 无偏性(3) 一致性(2) 有效性常用标准7.2.2 估计量的评价标准 -5-4-3-2-101234500.050
9、.10.150.20.250.30.350.41、无偏性( )f7.2.2 估计量的评价标准 22221112221112212122211211211)()(1111nnnnnnXEXEnXEnXEXXEXEnXXEnXXnESnininiinininiiiniinii7.2.2 估计量的评价标准 2有效性有效性既然无偏估计量不一定唯一,有多个无偏估计量时,如何从中选取更好的估计量呢?这种差异程度用均方误差MSE来度量,下面来看看MSE的构造:- 20- 15- 10- 50510152000.020.040.060.080.10.120.140.160.180.2有效性反映了点估计的稳定性
10、1( )f2( )f7.2.2 估计量的评价标准 2有效性有效性7.2.2 估计量的评价标准 2有效性有效性 iniiXEXnEXE11 2211iniiXDnXnDXD7.2.2 估计量的评价标准 3.一致性一致性7.2.2 估计量的评价标准 3.一致性一致性-15-10-505101500.050.10.150.20.2550()f10()f20()f7.2.2 估计量的评价标准 3.一致性一致性21111niiniiXnDXnp22211nXnDnii7.3 区间估计7.3.1 区间估计的基本问题7.3.1 区间估计的基本问题1置信区间置信区间7.3 区间规矩7.3.1 区间估计的基本问
11、题7.3.1 区间估计的基本问题2抽样平均误差与抽样极限误差7.3.1 区间估计的基本问题2抽样平均误差与抽样极限误差 重复抽样条件下: 不重复抽样条件下:7.3.1 区间估计的基本问题2抽样平均误差与抽样极限误差 这里的“概率”也称为:置信度、可信程度、把握程度、概率保证程度,通常用 (1 )表示。7.3.1 区间估计的基本问题2抽样平均误差与抽样极限误差 抽样极限误差反映了在一定概率把握度下,抽样估计的抽样极限误差反映了在一定概率把握度下,抽样估计的精确度。精确度。单个总体的区间估计1大样本总体均值的区间估计单个总体的区间估计1大样本总体均值的区间估计【例7-5】某商业银行推出一批理财产品
12、,为了解客户购买意愿,随机抽取1000名客户调查可能的购买金额,调查结果如下:某商业银行理财产品购买情况表某商业银行理财产品购买情况表购买金额(元)人数(人)5000以下205000100001501000015000300150002000043020000以上100合计1000在在95.45%的概率保证下,试求该理财产品购买金额的可能范围。的概率保证下,试求该理财产品购买金额的可能范围。单个总体的区间估计1大样本总体均值的区间估计单个总体的区间估计2小样本总体均值的区间估计X/X/ZX,ZX22nSntXnSntX1,12/2/2小样本总体均值的区间估计【例7-6】某研究机构进行一项调查来
13、估计吸烟者一个月买烟的平均支出。假定吸烟者买烟的月支出近似服从正态分布。该机构随机抽取了样本容量为26的一个样本进行调查,得到样本平均数为80元,样本标准差为20元。在95%的概率保证程度下,求全部吸烟者月均吸烟支出的置信区间。3.总体成数的区间估计3.总体成数的区间估计【例7-7】某电视台想了解每日“晚间新闻”栏目的收视率,随机抽取了400人进行调查,结果表明有71.2%的人观看此节目。要求以90%的概率保证程度,估计该栏目的收视率。4.总体方差的区间估计4.总体方差的区间估计4.总体方差的区间估计 步骤1:由于例7-8中已给出221.65S 故可知标准差S=1.65。特别地,对于没有直接给
14、出样本方差或标准差数值的情况,可以利用Excel中的“STDEV.S( )STDEV.S( )”函数计算修正后的样本标准差,进而对其平方得到修正后的样本方差。122/1n122/n步骤2:通过Excel中的“CHIINV”函数,得到临界值和选中单元格A1,点击插入函数。选择选择“CHIINV”CHIINV”函数函数,单击确定。利用Excel进行单个总体方差期间估计的操作方法。4.总体方差的区间估计利用Excel进行单个总体方差期间估计的操作方法。4.总体方差的区间估计弹出如下窗口:22/20.0511423.68479n221/20.951146.57063n利用Excel进行单个总体方差期间
15、估计的操作方法。 设样本均值与总体均值之间的允许误差为 ,已知总体方差时 ,在 1 的置信度下,估计总体均值时的样本容量为:重复抽样下:不重复抽样下:2222)(xZn 2222222ZNNZnx )(x7.4 必要样本量的确定 1、总体的变异程度高低(总体方差的大小)2、允许误差的大小3、概率保证度的大小4、抽样方法5、抽样组织形式影响样本容量的因素7.4 必要样本量的确定 7.4 必要样本量的确定【例7-9】某校调查住校生的寝室卫生合格情况,该校共有5000间寝室,根据过去几次的卫生抽查,被抽查的寝室的卫生合格率为96%,90%和93%,要求在卫生合格率的允许误差不超过3%的条件下,在95
16、.45%的概率下应该抽查几间寝室?情景一:为了解某村5000多名村名的身体状况,特随机的抽取期中的200名村名做免费的体检。如果你是村长,你觉得在这个抽样的过程中应注意什么?老人家,青壮年,少年儿童的身体状况会相同吗?7.5 其他抽样组织方式的抽样误差情景二:为了解某单位员工的年收入状况,在14000名员工的单位中抽取其中的560名做调查,问应注意什么问题。企业高管,中层领导,普通白领,后勤保障人员的收入状况能一样吗?分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这
17、种抽样叫做“分层抽样分层抽样”,其中所分成的各部分叫做“层”。分层抽样的特点 1)分层抽样的实质是在各层内作抽样调查。因此,分层抽样的误差只与各层内的差异有关。 2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性。分层抽样的抽样误差分层抽样的抽样误差7.5 其他抽样组织方式的抽样误差【例7-10】调查某大学的学生生活消费支出,将该大学的大学生生分成本科生和研究生进行调查,分别在本科生和研究生中各抽取300人和200人,调查所获得的数据如表7.3所示试求该大学的学生生活消费支出的平均抽样误差。某地区大学生生活费消费状况表 调查人数(人)平均
18、月生活(元)标准差(元)本科生3001100150研究生20015001207.5 其他抽样组织方式的抽样误差2. 等距抽样的抽样误差 一个例子:某学院有200个学生,要抽取10个学生作为样本。首先按照序号对学生排序,在19中随机抽取一个数字,假设抽中排列中第3位的学生,则其它入样单元依次为23,43,63,83,103,123,143,163,183。 对称等距抽样k k k k+r 2k+r (n-1)k+rrk(k为抽取间隔)从整体来看,样本不会出现系统性的偏大或者偏小的情况,能够提高样本代表性,并保证抽样的随机性 1.半距起点抽样 2.半距起点等距抽样(中心系统抽样)。半距起点系统抽样
19、是以第一个抽样距离的一半作为抽样起点,每间隔个单位各抽取一个单位。这样抽取出来的样本单位处于每个抽样距离的中点。由于总体单位标志值大致是顺序排列,这样得到的样本能较好地代表所在组的一般水平。这种方法的抽样起点一旦确定,样本单位也随之而确定,限制了抽样的随机性。为克服这一不足,在实践中对这一方法进行改进,产生了对称等距抽样。 3.有关标志排队等距抽样的抽样误差有关标志排队等距抽样相当于将总体分为同等大小的n个层,每层只抽取一个调查单位的分层抽样,所以有关标志排队等距抽样的抽样效果类似于分层抽样,其抽样误差一般按照分层抽样的误差公式近似计算。 4.无关标志排队等距抽样的抽样误差无关标志排队是按照与
20、调查内容没有直接关系的标志排序,抽样的起点并不会对调查结果有系统性的影响。因此,抽样起点可以随机地确定,第一个抽样起点仍然为。实际上,无关标志排队等距抽样的效果与简单随机抽样比较接近,其抽样误差通常按照简单随机抽样的抽样误差公式近似计算。3.整群抽样的抽样误差 整群抽样是首先将总体按照人为标准或者自然形成的方式划分为若干群,对选中的群进行全面调查的一种抽样调查方式。例如,了解学生考试成绩时,可以随机选取某些班级学生进行调查。调查产品的销售情况时,可以按照选择某些销售网点进行调查。 由于整群抽样对所选群内单位进行全面调查,因此样本代表性取决于抽中群体对全部群体的代表性。群体之间差异越大,样本代表
21、性越差;如果群体之间差异越小,样本代表性越好。假设各群体内部结构相同,即群体之间没有差异,则样本能够完全代表总体。 整群抽样对抽取的群体来说是完全调查,对各个群体而言是抽样调查, 抽样误差取决于群间差异的大小,而不受群体内部差异程度的影响。总体均值估计量的抽样平均误差为: 2211riixXXr【例7-11】假设某街道有50栋居民楼,每个居民楼均有16户人家。现已居民楼为群进行整群抽样,随机抽取10栋居民楼,调查每户每月教育支出,观察结果如下表所示,试计算平均每户每月教育支出的抽样误差。10栋居民楼计平均每户每月教育支出表楼号1121521273637424550平均每月教育支出(元)840.
22、5800918.6850.4804.5814.8880.4885.5820.8802.24.多阶段抽样的抽样误差 多阶段抽样是从大到小、层层深入的一种抽样方法, 它是实际工作中运用较多的抽样方法。具体而言,首先通过第一阶段的抽样,从总体中抽出一定的样本点构成第一阶段样本单位,再通过第二阶段抽样,从一阶段抽中样本点中抽取一定样本单位构成第二阶段样本单位。依次类推,直到抽出最终样本单位。例如,在调查城市居民日常消费调查中,第一阶段的抽样可以在全国范围内抽取出一部份城市,第二阶段在抽中的城市取若干社区,第三阶段对抽中的社区再抽取若干居民户作为样本。在调查某校学生课外读物的支出时,第一阶段可以在全校范
23、围内抽取一些班级,第二阶段在抽中的班级中再抽取部分同学作为样本。 多阶段抽样是多种抽样方法的综合应用,可以根据每阶段抽样的不同情况,灵活选用抽样方法。比如第一阶段抽样时可以利用分层抽样的方法从总体中抽取第一级抽样单位,后边阶段可以采用整群抽样等方式。当总体单位数量很多并且分布分散的时候,编制抽样框十分困难,多阶段抽样更便于大规模大范围的抽样调查的组织与实施。目前,我国城市和农村住户调查、人口抽样调查等都是采用多阶段抽样。但是,随着抽样阶段的增加,抽样误差会相应增大。【例【例7-11】某小区有】某小区有20个单元楼,每个单元楼有个单元楼,每个单元楼有20户居民,欲调查当月各居民楼的电费情户居民,
24、欲调查当月各居民楼的电费情况,调查人员随机抽取了况,调查人员随机抽取了5个单元楼,再从这些单元楼中各抽个单元楼,再从这些单元楼中各抽10户进行调查,调查的结果如下:户进行调查,调查的结果如下:某小区居民家庭电费情况表单位:元居民户单元楼123456789101100.2162.4142.3227.4161.6203.5123.4154.6256.5172.42100.1163.4154.1163.5171.9221.5202.5233.8123.1165.63300.5301.5252.5231.6162.4244.6183.1220.6171.6173.24200.5151.7252.623
25、1.6175.3204.8141.9162.4235.3162.75203.3272.6151.4172.3162.5143.6212.7132.6162.4132.4根据以上资料,计算抽样平均误差。根据以上资料,计算抽样平均误差。本章小结6801 02 03 04 点估计和区间估计是常用的两种参数估计方法主要方法。矩估计和极大似然估计是常用的点估计法。点估计的优良性标准主要包括无偏性、有效性和一致性。区间估计是在一定概率把握程度下,构造待估参数可能的区间范围作为未知参数的估计。与点估计相比,区间估计得到的是参数可能的区间,并且可以说明估计的把握程度与精确程度。05区间估计常用的分布有正态分布、t分布、 分布和F分布等。区间估计的关键在于正确构造样本估计量并找出其分布。特别是,同一统计量在大样本和小样本条件下可能有不同的分布。抽样平均误差是总体未知参数估计量的标准差,在给定置信水平条件下,可以通过抽样平均误差求出抽样极限误差。必要抽样数目是为使抽样极限误差不超过给定允许范围至少应该抽取的样本单位数,可以根据抽样极限误差和抽样数目的关系来确定。简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样是常见的几种随机抽样组织方式。不同抽样组织方式的抽样误差计算方法并不一样。科学设计抽样框,合理选择抽样组织方式是减少抽样误差的重要途径。