估计与假设检验.pptx

上传人:一*** 文档编号:71944000 上传时间:2023-02-07 格式:PPTX 页数:37 大小:601.17KB
返回 下载 相关 举报
估计与假设检验.pptx_第1页
第1页 / 共37页
估计与假设检验.pptx_第2页
第2页 / 共37页
点击查看更多>>
资源描述

《估计与假设检验.pptx》由会员分享,可在线阅读,更多相关《估计与假设检验.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、参数估计与假设检验在统计方法中的地位参数估计参数估计假设检验假设检验o统计方法统计方法描述统计描述统计推断统计推断统计第1页/共37页4.1 参数估计一、估计量与估计值二、点估计三、评价估计量的标准四、区间估计五、样本容量的确定第2页/共37页1.估计量:用于估计总体参数的随机变量如样本均值,样本比率、样本方差等例如:样本均值就是总体均值 的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值如果样本均值 x=80,则80就是的估计值一、估计量与估计值(estimator&estimated value)第3页/共37页二、点估计(point estimat

2、e)1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等第4页/共37页三、点估计的常用评价标准无偏性有效性一致性第5页/共37页无偏性(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数 P P()B BA A无偏无偏无偏有偏有偏有偏第6页/共37页有效性(efficiency)有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分

3、布 的抽样分布的抽样分布P P()第7页/共37页一致性(consistency)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P()第8页/共37页四、区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%样本统计量样本统计量 (点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限第9页/共37

4、页区间估计的图示 x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第10页/共37页将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平 1.表示为(1-为总体参数未在区间内的比率3.常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10置信水平 第11页/共37页1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某

5、种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间(confidence interval)第12页/共37页置信区间与置信水平 样本均值的抽样分布样本均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 1 1 /2 2 /2 2第13页/共37页影响区间宽度的因素1、总体数据的离散程度,用来测度2、样本容量,3、置信水平(1-),

6、影响 z 的大小第14页/共37页一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比率比率方差方差第15页/共37页1、大样本总体均值的区间估计假定条件总体服从正态分布如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 zp总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为(一)总体均值的区间估计第16页/共37页总体均值的区间估计(例题分析)【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如

7、下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第17页/共37页总体均值的区间估计(例题分析)解:解:已知已知 N N(,10102 2),n n=25,1-=25,1-=95%=95%,z z/2/2=1.96=1.96。根据样本数据计算得:。根据样

8、本数据计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g第18页/共37页总体均值的区间估计(例题分析)【例例】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724

9、342839364440394938344850343945484532第19页/共37页总体均值的区间估计(例题分析)解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据据计算得:计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁第20页/共37页2、小样本总体均值的区间估计1.假定条件总体服从正态分布,且方差()未知小样本(n 30)p使用 t 分布统计量p总体均值 在1-置信水平下的置信区

10、间为第21页/共37页总体均值的区间估计(例题分析)【例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第22页/共37页总体均值的区间估计(例题分析)解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=

11、95%=95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时第23页/共37页总体分布总体分布样本容量样本容量已知已知未知未知正态分布正态分布大样本大样本小样本小样本非正态分布非正态分布大样本大样本第24页/共37页(二)总体比率的区间估计当 时总体比例的置信区间可以使用正态分布来进行区间估计。pp总体比率总体比率总体比率总体比率 在在在在1-1-置信水平下

12、置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为第25页/共37页总体比率的区间估计(例题分析)【例】某城市想要估计下岗职工中女性所占的比率,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比率的置信区间解:解:已知已知 n n=100=100,p p65%65%,1,1-=95%=95%,z z/2/2=1.96=1.96该城市下岗职工中女性比率的置信区间为55.65%74.35%第26页/共37页总体比例的区间估计解:显然有因此可以用正态分布进行估计。/2=1.645结论:我们有90的把握认为悉尼青少年中每天都抽

13、烟的青少年比例在19.55%23.85%之间。19861986年对悉尼995995名青少年的随机调查发现,有21.7%21.7%的人每天都抽烟。试估计悉尼青少年中每天都抽烟的青少年比例的90%90%的置信区间。第27页/共37页(三)总体方差的区间估计()1、估计一个总体的方差或标准差2、假设总体服从正态分布3、总体方差 2 的点估计量为s2,且4、总体方差在1-置信水平下的置信区间为第28页/共37页五、样本容量的确定(一)影响样本容量的主要因素:1、总体标准差。总体的变异程度越大,必要样本容量也就越大。2、最大允许误差。最大允许误差越大,需要的样本容量越小。3、置信度1-。要求的置信度越高

14、,需要的样本容量越大。4、抽样方式。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。第29页/共37页简单随机抽样下估计总体均值时样本容量的确定式中的总体方差可以通过以下方式估计:n根据历史资料确定n通过试验性调查估计第30页/共37页简单随机抽样下估计总体比例时样本容量的确定o式中的总体比例p可以通过以下方式估计:n根据历史资料确定n通过试验性调查估计n取为0.5。第31页/共37页样本容量的确定(实例1)需要多大规模的样本才能在 90%的置信水平上保证均值的误差在 5 之内?前期研究表明总体标准差为 45.nZE=222222(1645

15、)(45)(5)219.2 220.向上取整第32页/共37页样本容量的确定(实例2)一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司 希 望 对 比 例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?解:已知E=0.05,=0.05,Z/2=1.96,当p未知时取为0.5。第33页/共37页练习你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有 95%置信度使得样本均值的误差在$50 以内。过去的研究表明 约为$400。需要多大的样本容量?nZE=222222(196)(400)(50)24586 246.第34页/共37页第35页/共37页4.2 假设检验第36页/共37页感谢您的观看。第37页/共37页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁