《SPSS第三章参数估计.ppt》由会员分享,可在线阅读,更多相关《SPSS第三章参数估计.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第三章参数估计参数估计参考文献1.张亮亮大学生月消费情调查以南京邮电大学为例统计教育2009.2(61)2.董秀良 吴仁水股票交叉上市与价格发现来自中国“A+H”股的经验证据2008.11(1085)3.1 概述参数估计的方法有点估计和区间估计二种参数估计的方法有点估计和区间估计二种.区间估计给出总体未知参数所在的可能区间即置信区区间估计给出总体未知参数所在的可能区间即置信区间间,它会随样本的不同而不同它会随样本的不同而不同,可以解决参数估计的精可以解决参数估计的精确度与可靠性问题确度与可靠性问题,它能够以一定的置信度保证估计的它能够以一定的置信度保证估计的正确性正确性.置信度与精确度关系置
2、信度与精确度关系:一般情况下一般情况下,置信度越高置信度越高,允许允许误差越大误差越大,精确度越低精确度越低.在样本容量一定时在样本容量一定时,通常是在确保一定置信度的前提下通常是在确保一定置信度的前提下提高精确度提高精确度.掌握的样本不同所用区间估计的公式不同掌握的样本不同所用区间估计的公式不同.待估计参数待估计参数已知条件已知条件置信区间置信区间正态总体,正态总体,2 2已知已知正态总体,正态总体,2 2未知未知n n30非正态总体,非正态总体,n30 n30 未知时,用未知时,用S有限总体,有限总体,n30n30(不重复(不重复)总体均值总体均值 ()未知时,用未知时,用S S3.2 3
3、.2 区间估计公式区间估计公式(1)(1)(一)一个总体均值的区间估计(一)一个总体均值的区间估计(二)一个总体比率的区间估计(二)一个总体比率的区间估计待估计参数待估计参数已知条件已知条件置信区间置信区间无限总体,无限总体,npnp和和nqnq都大于都大于5 5总体比率总体比率 (p p)有限总体,有限总体,npnp和和nqnq都大于都大于5 53.3已知原始数据资料的参数估计 Analyze Compare means Analyze Compare means 3.3.1单个总体均值的区间估计步骤:1、选择Analyze Compare means one-Analyze Compare
4、 means one-sample T Test sample T Test 对话框对话框检验值栏选择置信度和控制缺失值处理检验变量栏OptionsOptions子对话框子对话框-选择置信度和控制缺失值处理选择置信度和控制缺失值处理删除所有带缺失值的观测量只删除与分析有关的带有缺失值的观测量(三)两个总体均值之差的区间估计待估计参数待估计参数已知条件已知条件置信区间置信区间两个正态总体两个正态总体已知已知两个正态总体两个正态总体未知但相等未知但相等两个非正态总体两个非正态总体n1,n230两个总体两个总体均值之差均值之差1-23.2 3.2 区间估计公式区间估计公式(2)(2)(四)两个总体比
5、率(成数)之差的区间估计待估计参数待估计参数已知条件已知条件置信区间置信区间两个总体两个总体成数之差成数之差(P1-P2)无限总体,无限总体,N1P15,n1q15N2P25,n2q25有限总体,有限总体,N1P15,n1q15N2P25,n2q253.3.23.3.2两个总体均值之差的区间估计步骤两个总体均值之差的区间估计步骤1 1、若是两个独立样本、若是两个独立样本(n(n1 1 nn2 2 )则运行两个独立则运行两个独立样本之差的样本之差的T T检验检验Independent-Samples T Independent-Samples T TestTest过程过程;2 2、若是两个独立样
6、本、若是两个独立样本(n(n1 1=n=n2 2),),则运行两个配对则运行两个配对样本均值之差的样本均值之差的T T检验检验Paired Samples T Paired Samples T TestTest过程过程.意义意义:运行检验过程可得两个总体均值之差在一运行检验过程可得两个总体均值之差在一定把握程度下的区间估计定把握程度下的区间估计.二者比较二者比较:利用配对样本可使两个样本中许多其利用配对样本可使两个样本中许多其它因素保持完全相同它因素保持完全相同.因此估计误差会比独立因此估计误差会比独立样本小样本小.1 1、Independent-Sample T TestIndependen
7、t-Sample T Test过程过程选择选择Analyze Analyze Compare Means Compare Means Independent-Samples T Test,Independent-Samples T Test,打开打开Independent-Samples T TestIndependent-Samples T Test对话框对话框,打开打开Independent-Samples T TestIndependent-Samples T Test对话框对话框,检验变量栏分组变量栏,只能有一个分组变量定义分组按钮案例11、学生对教学改革态度的分析学生对教学改革态度的
8、分析(one sample)(one sample)某校在对实行挂牌上课教学改革措施的效果评价某校在对实行挂牌上课教学改革措施的效果评价中,随机抽选了中,随机抽选了6060位学生进行态度调查,他们的位学生进行态度调查,他们的1010项态度量表的态度反映资料如下项态度量表的态度反映资料如下:挂牌上课态度反映得分(挂牌上课态度反映得分(X X)人数(人数(f)f)1020102020302030304030404050405050605060607060702 26 61010121220201010合计6060案例案例1 1 (1(1分表示分表示“很不同意很不同意”,7 7分表示分表示“很同意很
9、同意”,将,将1010项态度分累加后得一总态度分,这种量项态度分累加后得一总态度分,这种量叫叫7 7级李克累加量表):级李克累加量表):试计算:试计算:(1 1)学生态度得分的平均值和标准差;)学生态度得分的平均值和标准差;(2 2)构造学生态度得分平均值的)构造学生态度得分平均值的98%98%置信区间。置信区间。操作步骤操作步骤:(1 1)定义变量)定义变量X X和和f,X f,X 为组中值,输入数据资为组中值,输入数据资料;料;(2 2)选择)选择Data Weight Cases,Data Weight Cases,对对f f 进行加权。进行加权。(3 3)选择)选择Analyze Co
10、mpare means one-Analyze Compare means one-sample T Testsample T Test(4 4)将变量)将变量X X放入放入TestTest栏中栏中(5 5)激活)激活 子对话框,置信度为子对话框,置信度为98%98%,单击单击 按钮,返回按钮,返回one-sample T one-sample T TestTest主对话框;主对话框;(6 6)单击)单击 按钮执行。按钮执行。Options Continue OK T-TestT-Test结论结论:表表1:1:学生态度得分的平均值为学生态度得分的平均值为4747分分,标准差标准差为为13.62
11、9513.6295分分.表表2:2:以以98%98%的置信区间估计学生总体态度得的置信区间估计学生总体态度得分平均值的置信区间为分平均值的置信区间为(42.7925,51.2075)(42.7925,51.2075)从中可以反映出学生对挂牌上课这一教改从中可以反映出学生对挂牌上课这一教改措施普遍赞成措施普遍赞成,但并不十分拥护但并不十分拥护,可见还可见还需进一步改进和完善需进一步改进和完善.案例2_电视广告平均受益量的估计2、某电视台广告部想要估计一下各企业在该电台某电视台广告部想要估计一下各企业在该电台的黄金时间播放电视广告后的一个月内的平均受的黄金时间播放电视广告后的一个月内的平均受益量益
12、量.为此他们抽取了为此他们抽取了3333家播放广告的同类企业的家播放广告的同类企业的随机样本随机样本,资料如下资料如下:该电视台想以该电视台想以95%95%的置信度宣布平均受益量的置信度宣布平均受益量(平均利润增长量平均利润增长量),),试构造适当的置信区间试构造适当的置信区间.案例2企业企业序号序号1 12 23 34 45 56 67 78 89 910101111利润增利润增量量(万万元元)7.37.38.68.67.77.76.56.59.49.48.38.37.17.110.210.25.45.49.29.28.88.8企业企业序号序号121213131313141415151616
13、17171818191920202121利润增利润增量量(万万元元)9.79.76.96.94.34.311.11.2 28.28.28.78.77.67.69.19.16.66.68.58.58.98.9企业企业序号序号23232424252526262727282829293030313132323333利润增利润增量量(万万元元)10.410.412.12.8 814.14.6 67.57.511.711.76.06.013.213.213.613.69.09.05.95.99.69.6单侧和双侧区间估计公式及图形不重复抽样公式解:该电视台宣布的平均受益量应该是最小受益量,故构造置信下限
14、.设X为企业利润增量.操作步骤:(1 1)定义变量)定义变量X X输入数据资料;输入数据资料;(2 2)选择)选择Analyze Compare means Analyze Compare means one-sample T Testone-sample T Test(3 3)将变量)将变量X X放入放入TestTest栏中栏中(4 4)激活)激活 子对话框,置信度改子对话框,置信度改为为90%90%,单击,单击 按钮,返回按钮,返回one-one-sample T Testsample T Test主对话框;主对话框;(5 5)单击)单击OK OK 按钮执行按钮执行Options Cont
15、inue T-TestT-Test结论结论:表表1:331:33家平均受益量为家平均受益量为 8.86368.8636万元万元,标准标准差为差为2.40272.4027万元万元.表表2:2:该项电视台可以该项电视台可以95%95%的置信度宣布在该的置信度宣布在该电台黄金时间做广告给企业带来的平均电台黄金时间做广告给企业带来的平均受益量至少在受益量至少在8.15528.1552万元以上万元以上.实例分析实例分析3_3_新旧电池使用寿命比较新旧电池使用寿命比较(Independent)Independent)某一个新的制造过程可以增加电池的使用某一个新的制造过程可以增加电池的使用寿命寿命,假设电池
16、使用寿命服从正态分布假设电池使用寿命服从正态分布.在新电在新电池中随机抽取池中随机抽取1515个个,而在旧电中随机抽取而在旧电中随机抽取1212个同个同时测试其使用寿命时测试其使用寿命,资料如下资料如下:新旧两种电池平新旧两种电池平均使用寿命之差均使用寿命之差95%95%的置信区间的置信区间.新电池新电池(日日):18.210.412.618.011.715.024.017.623.62):18.210.412.618.011.715.024.017.623.624.819.320.519.817.116.34.819.320.519.817.116.3旧电池旧电池(日日):12.117.58
17、.613.97.815.117.910.613.814.):12.117.58.613.97.815.117.910.613.814.215.311.6215.311.6解:已知的原始数据是总体服从正态分布的两个解:已知的原始数据是总体服从正态分布的两个独立样本。设独立样本。设X X代表电池使用寿命,代表电池使用寿命,g g代表分组号代表分组号操作步骤:操作步骤:(1 1)定义变量)定义变量X X和和g g,输入数据资料,新旧电池寿命数据全部输入,输入数据资料,新旧电池寿命数据全部输入X X同一列中,同一列中,g g分别取分别取1 1和和2 2,新电池组号为,新电池组号为1 1,旧电池组号为,
18、旧电池组号为2 2(2 2)选择)选择Analyze Compare Means Analyze Compare Means Independent-Samples T Independent-Samples T Test,Test,打开打开Independent-Samples T TestIndependent-Samples T Test对话框对话框,(3 3)将变量)将变量X X放入放入TestTest栏中栏中(4 4)激活)激活Define Groups Define Groups 按钮,打开该对话框按钮,打开该对话框Groups1Groups1中输入中输入1 1 Groups2Gr
19、oups2中输入中输入2 2,单击,单击ContinueContinue返回主对话框;返回主对话框;(5 5)单击)单击OK OK 按钮执行按钮执行T-TestT-Test结论:表表1 1:得出两个独立样本各自的均值,标准:得出两个独立样本各自的均值,标准差以及平均标准误差差以及平均标准误差.新电池的平均使用新电池的平均使用寿命明显长于旧电池。寿命明显长于旧电池。表表2 2:可以看出新旧电池平均使用寿命之差:可以看出新旧电池平均使用寿命之差的的95%95%的置信区间为:若两个样本方差相的置信区间为:若两个样本方差相等则为(等则为(2.44542.4454,8.67468.6746);若两个样)
20、;若两个样本方差不等则为(本方差不等则为(2.54372.5437,8.57638.5763)2 2、Paired-Samples T TestPaired-Samples T Test过程过程选择选择Analyze Analyze Compare Means Compare Means Paired-Sample T Test,Paired-Sample T Test,打开打开Paired-Sample T TestPaired-Sample T Test主主对话对话框框2 2、Paired-Samples T TestPaired-Samples T Test过程过程配对变量栏当前选择栏选
21、择项按钮实例分析实例分析4 _4 _吸烟有害广告作用的分析吸烟有害广告作用的分析(Paired)(Paired)形形色色的广告已深入到社会各个方面形形色色的广告已深入到社会各个方面,与与人民生活密不可分人民生活密不可分.成功的广告将留给人们较深成功的广告将留给人们较深的印象的印象,并带给企业丰厚的回报并带给企业丰厚的回报,如何鉴定广告如何鉴定广告的效果的效果,如何选择最佳的广告制作如何选择最佳的广告制作,对此西方国对此西方国家更多地采用统计方法来判断家更多地采用统计方法来判断,举例如下举例如下:为了研究吸烟有害广告对吸烟者减少吸烟为了研究吸烟有害广告对吸烟者减少吸烟量甚至戒烟是否有作用量甚至戒
22、烟是否有作用,从某吸烟者中随机抽取从某吸烟者中随机抽取3333位吸烟者位吸烟者,调查他们在观看广告前后的每天吸调查他们在观看广告前后的每天吸烟量烟量(支支)数据如下表数据如下表.试问影片对他们的吸烟量试问影片对他们的吸烟量有无产生作用有无产生作用?为了支持你的答案为了支持你的答案,请构造一个请构造一个99%99%的置信区间的置信区间.吸烟者编号1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸烟者编号1213141516171819202122看前X1(支)看后X2(支)171033342520844140
23、1910263016163120271862吸烟者编号2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821解:配对样本的试验,比较观看前后平均数的大小可解决第一个问题,求出两平均数之差的99%的双侧置信区间可解答第二个问题.操作步骤:1 1)定义变量)定义变量X1X1和和X2,X2,输入数据;输入数据;(2 2)选择)选择Analyze Compare means Paired-Analyze Compare means Paired-samples T Testsamples T Test(
24、3 3)将变量)将变量X1X1和和X2X2放入放入TestTest栏中栏中(4 4)激活)激活 Options Options 子对话框,置信度改为子对话框,置信度改为99%99%,单击,单击Continue Continue 按钮,返回按钮,返回Paired-Paired-samples T Testsamples T Test主对话框;主对话框;(5 5)单击)单击OK OK 按钮执行按钮执行T-TestT-Test结论:表表1:1:显示观看影片前的平均每日吸烟量约为显示观看影片前的平均每日吸烟量约为21.575821.5758支支.观看影片后的平均每日吸烟量约为观看影片后的平均每日吸烟量
25、约为17.575817.5758支支,说明该影片发生了作用说明该影片发生了作用.表表2:2:反映了影片观看前与后存在着显著相关关系反映了影片观看前与后存在着显著相关关系,相关系数为相关系数为0.878.0.878.表表3:3:显示了前后两个总体平均每日吸烟量之差的显示了前后两个总体平均每日吸烟量之差的99%99%置信区间为置信区间为(1.4888,6.5112),(1.4888,6.5112),这意味着不这意味着不管随机抽到哪几对样本单位做调查管随机抽到哪几对样本单位做调查,均有均有99%99%的的把握保证把握保证,观看影片前的平均每日吸烟量大于观看影片前的平均每日吸烟量大于观看影片后的平均每
26、日吸烟量之差在观看影片后的平均每日吸烟量之差在(1.4888(1.4888支至支至6.51126.5112支之间支之间,即大约在即大约在2727支之间支之间.3.4未知原始数据资料的参数估计 在现实中可能遇到没有完整的原始资料,只有几在现实中可能遇到没有完整的原始资料,只有几个样本数据特征的情况。此时可用个样本数据特征的情况。此时可用Compute Compute 过程可解过程可解决样本平均数抽样分布和未知原始数据资料情况下的决样本平均数抽样分布和未知原始数据资料情况下的参数区间估计问题。参数区间估计问题。步骤:步骤:(1)(1)定义变量定义变量X X (2 2)选择)选择Transform
27、Compute Transform Compute 打开打开 Compute Compute Variable Variable 对话框对话框 (3 3)在目标变量)在目标变量Target Target 栏中,输入新变量名栏中,输入新变量名cdfcdf (分布函数形式出现分布函数形式出现)idfidf(正态分布的反函数正态分布的反函数););在在numeric Expressionnumeric Expression框中输入数学表达式框中输入数学表达式 (4 4)单击)单击OKOK。案例分析案例分析55农民年平均收入估计农民年平均收入估计(Compute)(Compute):1 1、为了解某村
28、、为了解某村13001300户农民的年纯收入状况,户农民的年纯收入状况,不重复抽取一个由不重复抽取一个由7070户组成的样本进行调查户组成的样本进行调查得出每户农民年平均收入为得出每户农民年平均收入为45004500元,标准差元,标准差为为260260元。试求该村每户农民年平均纯收入元。试求该村每户农民年平均纯收入置信度为置信度为95%95%的置信区间。的置信区间。(4440.75,4559.25)(4440.75,4559.25)案例分析案例分析66产品包装容量分析产品包装容量分析:某产品包装容量为正态分布,随机抽取某产品包装容量为正态分布,随机抽取125125包包产品,发现产品,发现101
29、0包分量不足,试求分量不足比包分量不足,试求分量不足比例的例的90%90%的信赖区间。若误差界限为的信赖区间。若误差界限为0.020.02,把,把握程度为握程度为95%95%应抽多少样本单位?根据过去资应抽多少样本单位?根据过去资料包装分量不足的比例大约为料包装分量不足的比例大约为0.06.(0.04,0.1199)0.06.(0.04,0.1199)案例分析案例分析77产品购买量分析产品购买量分析:3、某公司作市场调查某公司作市场调查,在甲居民区抽取在甲居民区抽取500500户家户家庭庭,其中有其中有35%35%的家庭购买过该公司的产品的家庭购买过该公司的产品.在在居民区抽取居民区抽取600
30、600户家庭户家庭,其中有其中有22%22%的家庭购买的家庭购买过该公司的产品过该公司的产品,试求总体成数之差置信度为试求总体成数之差置信度为95%95%的置信区间的置信区间.本章小结本章小结抽样分布是参数估计的基础抽样分布是参数估计的基础,中心极限定理在抽中心极限定理在抽样分布理论中占有十分重要的地位样分布理论中占有十分重要的地位,进行参数估进行参数估计需要根据研究的问题和已知条件的不同采用计需要根据研究的问题和已知条件的不同采用不同的方法不同的方法.在在SPSSSPSS软件中参数估计分已知原始资料和未知软件中参数估计分已知原始资料和未知原始资料两种情况原始资料两种情况,根据原始数据资料运行根据原始数据资料运行Compare MeansCompare Means过程过程,未知原始资料则运行未知原始资料则运行 Compute Compute 过程过程.参数估计有双侧区间估计和单侧区间估计之分参数估计有双侧区间估计和单侧区间估计之分,而软件直接显示的是双侧区间的估计值而软件直接显示的是双侧区间的估计值,因此在因此在单侧区间估计时应注意将置信度单侧区间估计时应注意将置信度 转换转换为为 .