《《统计学—基于SPSS》((05)第5章--参数估计(S3).pptx》由会员分享,可在线阅读,更多相关《《统计学—基于SPSS》((05)第5章--参数估计(S3).pptx(84页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1-1-1 1统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)统计学基于SPSS课程内容课程内容描述统计、推断统计、其他常描述统计、推断统计、其他常用方法用方法使用软件使用软件SPSSSPSS学分与课时学分与课时3 3学分,学分,117117周,每周周,每周3 3课时课时第第 5 章章 参数估计参数估计5.1 参数估计的基本原理参数估计的基本原理 5.2 总体均值的区间估计总体均值的区间估计5.3 总体比例的区间估计总体比例的区间估计5.4 总体方差的区间估计总体方差的区间估计5.4 样本量的确定样本量的确定5-5-3 3统计学统计学统计学统计学基于基于基
2、于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5学习目标学习目标l参数估计的基本原理参数估计的基本原理l点估计与区间估计点估计与区间估计l评价估计量优良性的标准评价估计量优良性的标准l总体均值的区间估计方法总体均值的区间估计方法l总体比例的区间估计方法总体比例的区间估计方法l总体方差的区间估计方法总体方差的区间估计方法l样本量的确定方法样本量的确定方法5-5-4 4统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5问题与思考问题与思考问题与思考问题与思考科学家做出重大贡献时的最佳年龄是多少科
3、学家做出重大贡献时的最佳年龄是多少科学家做出重大贡献时的最佳年龄是多少科学家做出重大贡献时的最佳年龄是多少科科学学家家在在哪哪个个年年龄龄段段易易取取得得重重大大突突破破?有有研研究究表表明明:杰杰出出科科学学家家做做出出重重大大贡贡献献的的最最佳佳年年龄龄区区在在25254545岁岁之之间间,其其最最佳佳峰峰值值年年龄龄和和首首次次贡贡献献的的最最佳佳成成名名年年龄龄随随着着时时代代的的变变化化而而逐逐渐渐增增大大。伟伟大大的的科科学学发发现现很很多多是是由由富富于于创创造造力力的的年年轻轻人人所所提提出出的的。下下表表是是1616世世纪纪中中叶叶至至2020世世纪纪的的1212个个重重大大
4、科科学突破的资料学突破的资料 5.1 参数估计的基本原理参数估计的基本原理 5.1.1 点估计与区间估计点估计与区间估计 5.1.2 评价估计量的标准评价估计量的标准第第 5 章章 参数估计参数估计5.1.1 点估计与区间估计点估计与区间估计5.1 参数估计的基本原理参数估计的基本原理5-5-7 7统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.参参数数估估计计(parameter(parameter estimation)estimation)就就是是用用样样本本统统计计量去估计总体的参数量去估计总体的参数2.估计量:
5、用于估计总体参数的统计量的名称估计量:用于估计总体参数的统计量的名称n n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n n例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.参数用参数用 表示,估计量表示,估计量用用 表示表示4.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值n n如果样本均值如果样本均值 x x=80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)5-5-8 8统计学统计学统计学统计学基于基于基于基于SPSS
6、SPSS(第第第第 3 3 版版版版)2019-5-52019-5-5点估计点估计(point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的的样样本本得得到到的的估计值很可能不同于总体真值估计值很可能不同于总体真值n n一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的抽抽样样标标准准误误差差来
7、来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 5-5-9 9统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个估估计计区区间,该区间由样本统计量加减估计误差而得到间,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出
8、一个概率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%5-5-1010统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5区间估计的图示区间估计的图示5-5-1111统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度 2.表示为(1-n n 为是总体参数为是总体参数未在未在区间内
9、的比例区间内的比例 3.常用的置信水平值有 99%,95%,90%n n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平(confidence level)5-5-1212统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.由样本估计量构造出的总体参数在一定置信水平由样本估计量构造出的总体参数在一定置信水平下的估计区间下的估计区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间3.
10、如果用某种方法构造的所有区间中有如果用某种方法构造的所有区间中有95%95%的区间的区间包含总体参数的真值,包含总体参数的真值,5%5%的区间不包含总体参数的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水的真值,那么,用该方法构造的区间称为置信水平为平为95%95%的置信区间。同样,其他置信水平的区的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述间也可以用类似的方式进行表述置信区间的表述置信区间的表述(confidence interval)5-5-1313统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019
11、-5-51.总总体体参参数数的的真真值值是是固固定定的的,而而用用样样本本构构造造的的区区间间则则是是不不固固定定的的,因因此此置置信信区区间间是是一一个个随随机机区区间间,它它会会因因样样本本的的不不同同而而变变化化,而而且且不不是是所所有有的区间都包含总体参数的区间都包含总体参数2.实实际际估估计计时时往往往往只只抽抽取取一一个个样样本本,此此时时所所构构造造的的是是与与该该样样本本相相联联系系的的一一定定置置信信水水平平(比比如如95%)95%)下下的的置置信信区区间间。我我们们只只能能希希望望这这个个区区间间是是大大量量包包含含总总体体参参数数真真值值的的区区间间中中的的一一个个,但但
12、它它也也可可能是少数几个不包含参数真值的区间中的一个能是少数几个不包含参数真值的区间中的一个置信区间的表述置信区间的表述(confidence interval)5-5-1414统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.1.当当抽抽取取了了一一个个具具体体的的样样本本,用用该该样样本本所所构构造造的的区区间间是是一一个个特特定定的的常常数数区区间间,我我们们无无法法知知道道这这个个样样本本所所产产生生的的区区间间是是否否包包含含总总体体参参数数的的真真值值,因因为为它它可可能能是是包包含含总总体体均均值值的的区区间
13、间中中的的一一个个,也也可可能能是是未未包包含含总总体体均均值值的那一个的那一个2.2.一一个个特特定定的的区区间间总总是是“包包含含”或或“绝绝对对不不包包含含”参参数数的的真真值值,不不存存在在“以以多多大大的的概概率率包包含含总总体体参参数数”的的问问题题3.3.置置信信水水平平只只是是告告诉诉我我们们在在多多次次估估计计得得到到的的区区间间中中大大概概有有多多少少个个区区间间包包含含了了参参数数的的真真值值,而而不不是是针针对对所所抽抽取取的这个样本所构建的区间而言的的这个样本所构建的区间而言的 置信区间的表述置信区间的表述(confidence interval)5-5-1515统计
14、学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5置信区间的表述置信区间的表述(95%的置信区间的置信区间)重复重复重复重复构造出的构造出的构造出的构造出的 的的的的10100 0个个个个置信区间置信区间置信区间置信区间5-5-1616统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.1.使使用用一一个个较较大大的的置置信信水水平平会会得得到到一一个个比比较较宽宽的的置置信信区区间间,而而使使用用一一个个较较大大的的样样本本则则会会得得到到一一个个较较准准确确
15、(较较窄窄)的的区区间间。直直观观地地说说,较较宽宽的的区区间间会会有有更更大大的的可可能能性包含参数性包含参数2.2.但实际应用中,过宽的区间往往没有实际意义但实际应用中,过宽的区间往往没有实际意义l l比比如如,天天气气预预报报说说“在在一一年年内内会会下下一一场场雨雨”,虽虽然然这这很很有有把把握握,但但有有什什么么意意义义呢呢?另另一一方方面面,要要求求过过于于准准确确(过过窄窄)的的区区间间同同样样不不一一定定有有意意义义,因因为为过过窄窄的的区区间间虽虽然然看看上上去去很很准准确确,但但把把握握性性就就会会降降低低,除除非非无无限限制制增增加加样样本本量量,而而现现实中样本量总是有
16、限的实中样本量总是有限的3.3.区间估计总是要给结论留点儿余地区间估计总是要给结论留点儿余地 置信区间的表述置信区间的表述(confidence interval)5.1.2 评价估计量的标准评价估计量的标准5.1 参数估计的基本原理参数估计的基本原理5-5-1818统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5无偏性无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数5-5-1919统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-
17、5-52019-5-5有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 5-5-2020统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一致性一致性(consistency)一致性:一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数5.2 总体均值的区间估计总体均值的区间估计 5.2.1 一个总体均值的区间估计一个总体均值的区间估计 5.2.2 两个总体均值之差的区间估计两个总体均值之差的区间估计第第 5 章章 参数估计参数估计5.2.1 一个总
18、体均值的区间估计一个总体均值的区间估计5.2 总体均值的区间估计总体均值的区间估计5-5-2323统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一个总体均值区间的一般表达式一个总体均值区间的一般表达式1.总体均值的置信区间是由样本均值加减估计误差总体均值的置信区间是由样本均值加减估计误差得到的得到的2.估计误差由两部分组成:一是点估计量的标准误估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积时所要的求置信
19、水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度为的分位数值,它取决于事先所要求的可靠程度3.总体均值在置信水平下的置信区间可一般性地表总体均值在置信水平下的置信区间可一般性地表达为达为 样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差5-5-2424统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)1.1.假定条件假定条件n n总体服从正态分布总体服从正态分布,且方差且方差()已已知知n n如果不是正态分布,可由正态分布
20、来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.使用正态分布统计量使用正态分布统计量 z z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为5-5-2525统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)【例例例例5-15-1】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据如下表。试建立投保人年
21、龄如下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 2335392736443642464331334253455447243428393644403949383448503439454845325-5-2626统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样
22、本本数数据据计算得:计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.437.4岁岁41.641.6岁岁5-5-2727统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)1.假定条件n n总体服从正态分布总体服从正态分布,但方差但方差()未知未知n n小样本小样本 (n n 30)30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为5-5-2828统计学
23、统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)【例例例例5-25-2】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态
24、分分布布,且且总总总总体体体体标标标标准准准准差差差差为为为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的置信区间,置信水平为的置信区间,置信水平为95%95%2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.35-5-2929统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-
25、52019-5-5总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)解解解解:已已 知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,t t/2/2=2.0639=2.0639。根根据据样样本本数数据据计计算算得得:。由由于于是是正正态态总总体体,且且方方差差已已知知。总总体体均均值值 在在1-1-置置信水平下的置信区间为信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.375101.375克克109.345109.345克克 5-5-3030统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版
26、版版版)2019-5-52019-5-5用用SPSS求置信区间求置信区间(小样本小样本)求置信区间求置信区间求置信区间求置信区间5.2.2 两个总体均值之差的区间估计两个总体均值之差的区间估计5.2 总体均值的区间估计总体均值的区间估计5-5-3232统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5均值之差区间的一般表达式均值之差区间的一般表达式1.两个总体均值的置信区间是由两个样本均值之差两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的加减估计误差得到的2.估计误差由两部分组成:一是点估计量的标准误估计误差由两
27、部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度为的分位数值,它取决于事先所要求的可靠程度3.两个总体均值之差两个总体均值之差(1 1-2 2)在置信水平下的置信在置信水平下的置信区间可一般性地表达为区间可一般性地表达为 (x1-x2)分位数值分位数值(x1-x2)的标准误差的标准误差5-5-3333统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-520
28、19-5-5两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1.假定条件 两个两个总体都服从正态分布,总体都服从正态分布,1 1、2 2已知已知 若若不不是是正正态态分分布布,可可以以用用正正态态分分布布来来近近似似(n n1 1 3030和和n n2 2 30)30)两个样本是独立的随机样本两个样本是独立的随机样本2.使用正态分布统计量 z5-5-3434统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1.1.1 1,2 2已已知知时时
29、,两两个个总总体体均均值值之之差差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为2.1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为5-5-3535统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)【例例例例5-35-3】某某地地区区教教育育管管理理部部门门想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为
30、此此在在两两所所中中学学独独立立地地抽抽取取两两个个随随机机样样本本,有有关关数数据据如如表表5454所所示示。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%95%的置信区间的置信区间 5-5-3636统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)解解解解:两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.03
31、5.03分分10.9710.97分分5-5-3737统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 12 2=2 22 2)1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相等:1 1=2 2 两个独立的小样本两个独立的小样本(n n1 1 3030和和n n2 2 30)30)2.2.总体方差的合并估计量总体方差的合并估计量3.3.估计估计量量 x x1 1-x x2 2的抽样标准差的抽
32、样标准差5-5-3838统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 12 2=2 22 2)1.两个样本均值之差的标准化2.两两个个总总体体均均值值之之差差 1 1-2 2在在1-1-置置信信水水平平下下的的置置信区间为信区间为5-5-3939统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 12 2 2 22
33、2)1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知且不相等:两个总体方差未知且不相等:1 1 2 2 两个独立的小样本两个独立的小样本(n n1 1 3030和和n n2 2 30)30)2.使用统计量使用统计量5-5-4040统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 12 2 2 22 2)两个总体均值之差1-2在1-置信水平下的置信区间为自由度自由度5-5-4141统计学统计学统计学统计学基于基于基于基
34、于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 12 2=2 22 2)5-5-4242统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5用用SPSS求两个总体均值之差置信区间求两个总体均值之差置信区间(独立小样本,独立小样本,12=22;12 22)求置信区间求置信区间求置信区间求置信区间5-5-4343统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两
35、个总体均值之差的估计两个总体均值之差的估计(配对大样本配对大样本)1.假定条件两个配对的大样本两个配对的大样本(n n1 1 3030和和n n2 2 30)30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布2.两个总体均值之差d=1-2在1-置信水平下的置信区间为 d 分位数值分位数值 d 的标准误差的标准误差5-5-4444统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)1.假定条件两个匹配的小样本两个匹配的小样本(n n1
36、1 3030和和n n2 2 30)30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差d=1-2在1-置信水平下的置信区间为5-5-4545统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)【例例例例5-55-5】由由1010名名学学生生组组成成一一个个随随机机样样本本,让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行测测试试,结结果果如如表表5757所所示示。假假定定两两套套试试卷卷分分数
37、数之之差差服服从从正正态态分分布布,试试建建立立两两种种试试卷卷平平均均 分分 数数 之之 差差 d d=1 1-2 2 95%95%的的置信区间置信区间5.3 总体比例的区间估计总体比例的区间估计 5.3.1 一个总体比例的区间估计一个总体比例的区间估计 5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计第第 5 章章 参数估计参数估计5.3.1 一个总体比例的区间估计一个总体比例的区间估计5.3 总体比例的区间估计总体比例的区间估计5-5-4848统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一个总体比例
38、的区间估计一个总体比例的区间估计(传统方法传统方法)1.1.假定条件假定条件n n总体服从二项分布总体服从二项分布n n可以由正态分布来近似可以由正态分布来近似n nnpnp(成功次数成功次数)和和n n(1-(1-p p)()(失败次数失败次数)均应该大于均应该大于10102.2.使用正态分布统计量使用正态分布统计量 z z3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差5-5-4949统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第
39、 3 3 版版版版)2019-5-52019-5-5总体比例的区间估计总体比例的区间估计(例题分析例题分析传统方法传统方法)【例例例例5-65-6】某某城城市市想想要要进进行行一一项项交交通通措措施施改改革革,为为征征求求市市民民对对该该项项改改革革措措施施的的意意见见,在在成成年年人人中中随随机机调调查查了了500500个个市市民民,其其中中325325人人赞赞成成改改革革措措施施。用用95%95%的的置置信信水水平平估估计计该该城城市市成成年年人人口口中中赞赞成成该该项改革的人数比例的置信区间项改革的人数比例的置信区间即即(60.82%60.82%,69.18%69.18%),该该城城市市
40、人人口口中中赞赞成成该该项项改改革革的的比例比例95%95%的置信区间为的置信区间为60.82%69.18%60.82%69.18%5-5-5050统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一个总体比例的区间估计一个总体比例的区间估计(改进方法改进方法)1.按照传统方法计算出来的置信水平为按照传统方法计算出来的置信水平为(1-(1-)的置信的置信区间能够覆盖总体真实比例的概率小于区间能够覆盖总体真实比例的概率小于(1-(1-),既,既是大样本也是如此,更不可能应用于小样本是大样本也是如此,更不可能应用于小样本2.根据经
41、验法则:传统方法要求根据经验法则:传统方法要求npnp(成功次数成功次数)和和n n(1-(1-p p)()(失败次数失败次数)均应该大于均应该大于1010(也有些书上说大也有些书上说大于于5)5)3.对于非常大的样本,传统方法对于非常大的样本,传统方法和改进方法的和改进方法的结果结果几乎相同,但对于小样本或中等几乎相同,但对于小样本或中等样本改进方法更样本改进方法更适用适用5-5-5151统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一个总体比例的区间估计一个总体比例的区间估计(改进方法改进方法)1.通过修正试验次数通过
42、修正试验次数n n(样本量样本量)和试验成功的比例和试验成功的比例P P(样本比例样本比例)改进置信区间改进置信区间2.将试验次数将试验次数n n加上加上4 4,即用,即用 代替代替n n;将试;将试验成功的次数验成功的次数x x加上加上2 2,即用,即用 代替代替p p3.对于任意大小的样本都可以使用该方法计算置信对于任意大小的样本都可以使用该方法计算置信区间区间4.只是在样本较小时,偶尔会有区间下限小于只是在样本较小时,偶尔会有区间下限小于0 0或或区间上限大于区间上限大于1 1的情况发生。此时可用的情况发生。此时可用0 0代替小于代替小于0 0的下限,用的下限,用1 1代替大于代替大于1
43、 1的上限的上限5-5-5252统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5一个总体比例的区间估计一个总体比例的区间估计(改进方法改进方法)1.1.设总体服从二项分布,即设总体服从二项分布,即X X(n n,p p),x x为为n n次独立伯努次独立伯努利试验成功的次数,利试验成功的次数,P P为成功的概率为成功的概率2.2.定义定义 和和 3.3.总体比例总体比例 在在1-1-置信水平下置信水平下的置信区间的置信区间4.4.该区间也称为该区间也称为Agresti-CoullAgresti-Coull区间区间(由由Ala
44、n AgrestiAlan Agresti和和Brent Brent CoullCoull给出,以其姓氏命名给出,以其姓氏命名)5.5.如果下限小于如果下限小于0 0则用则用0 0代替;如果上限大于代替;如果上限大于1 1则用则用1 1代替代替5-5-5353统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5总体比例的区间估计总体比例的区间估计(例题分析例题分析改进方法改进方法)【例例例例5-75-7】某某城城市市想想要要进进行行一一项项交交通通措措施施改改革革,为为征征求求市市民民对对该该项项改改革革措措施施的的意意见见,在
45、在成成年年人人中中随随机机调调查查了了500500个个市市民民,其其中中325325人人赞赞成成改改革革措措施施。用用95%95%的的置置信信水水平平估估计计该该城城市市成成年年人人口口中中赞赞成成该该项改革的人数比例的置信区间项改革的人数比例的置信区间即即(60.71%60.71%,69.05%69.05%),该该城城市市成成年年人人口口中中赞赞成成该该项项改改革的人数比例革的人数比例95%95%的置信区间为的置信区间为60.71%69.05%60.71%69.05%5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计5.3 总体比例的区间估计总体比例的区间估计5-5-5555统
46、计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-51.1.假定条件假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似 两个样本是独立的两个样本是独立的 n n1 1p p1 1和和n n1 1(1-(1-p p1 1),n n2 2p p2 2和和n n2 2(1-(1-p p2 2),均应该大于,均应该大于10102.2.两个总体比例之差两个总体比例之差 1 1-2 2在在1-1-置信水平下的置信置信水平下的置信区间为区间为两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法
47、传统方法)(p1-p2)分位数值分位数值(p1-p2)的标准误差的标准误差5-5-5656统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体比例之差的区间估计两个总体比例之差的区间估计(改进方法改进方法)1.通过修正试验次数通过修正试验次数n n1 1、n n2 2(样本量样本量)和试验成功的和试验成功的比例比例P P1 1、P P2 2(样本比例样本比例)改进置信区间改进置信区间2.将试验次数将试验次数n n1 1和和n n1 1各加上各加上2 2,即用,即用 代代n n1 1,代替代替n n2 2;将试验成功的次数
48、;将试验成功的次数x x1 1和和x x2 2各加各加上上1 1,即用,即用 代替代替p p1 1,用,用 代替代替p p2 23.对于任意大小的样本都可以使用该方法计算置信对于任意大小的样本都可以使用该方法计算置信区间区间5-5-5757统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体比例之差的区间估计两个总体比例之差的区间估计(改进方法改进方法)1.1.设设两两总总体体都都服服从从二二项项分分布布,即即X X1 1(n n1 1,p p1 1),X X2 2(n n2 2,p p2 2)。x x1 1为为n n1
49、 1次次独独立立伯伯努努利利试试验验成成功功的的次次数数,P P1 1为为成成功功的的概概率率,x x2 2 为为n n2 2次独立伯努利试验成功的次数,次独立伯努利试验成功的次数,P P2 2为成功的概率为成功的概率2.2.定义定义 ,;,3.3.1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间4.4.该该区区间间也也称称为为Agresti-CaffoAgresti-Caffo区区间间(由由Alan Alan AgrestiAgresti和和Brian Brian CaffoCaffo给出,以其姓氏命名给出,以其姓氏命名)5.5.如果下限小于如果下限小于-1-1则用则用-1
50、-1代替;如果上限大于代替;如果上限大于1 1则用则用1 1代替代替5-5-5858统计学统计学统计学统计学基于基于基于基于SPSSSPSS(第第第第 3 3 版版版版)2019-5-52019-5-5两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析传统方法传统方法)【例例例例5858、9 9】在在某某个个电电视视节节目目的的收收视视率率调调查查中中,女女性性观观众众随随机机调调查查了了500500人人,有有225225人人收收看看了了该该节节目目;男男性性观观众众随随机机调调查查了了400400人人,有有128128人人收收看看了了该该节节目目。用用95%95%的的置置信信水水