《《推论统计专题》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《推论统计专题》PPT课件.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、仅供教学参考之用请勿随意复制外传 发现错误敬请指正社会研究方法Methods of Social Research中南大学公共管理学院阳建国第七讲 推论统计专题 Inferential statisticsOutline描述统计与推断统计的关系描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据总体内在的总体内在的总体内在的总体内在的数量规律性数量规律性数量规律性数量规律性推断统计推断统计推断统计推断统计(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体
2、的数量特征进行估计和检验等)行估计和检验等)行估计和检验等)行估计和检验等)概率论概率论概率论概率论(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律和中心极限定理等)和中心极限定理等)和中心极限定理等)和中心极限定理等)描述统计描述统计描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的
3、过程1 参数估计1 点值估计(point estimate)和区间估计(interval estimate)2 均值估计3 百分数估计1.1 点值估计以一个最适当的样本统计值(statistic)来代表总体的参数值(parameter)为了知道某地青年人有多少人赞成计划生育政策,从该地区抽取一个青年人样本,假定发现样本中60赞成,我们便推论整个地区大约有60的青年赞成计划生育政策。为知道该地区的青年人的平均收入,我们就以样本均值作为估计值。1.2 区间估计1、根据样本统计值以区间数据来估计总体参数值2、置信区间和置信度3、例如:总体均值落在5070之间,置信度为 95%样本统计量样本统计量样本
4、统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限区间估计陈述我们有95%的把握认为,全市职工的月工资收入在1500元-1600元之间。全省人口中,女性占50%-52%的可能性是99%。落在总体均值某一区间内的样本 x_XX=Z x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.6
5、5 x x2.1 均值的区间估计总体均值的区间估计公式:其中,其中,为样本均值;为样本均值;S S为样本标准差;为样本标准差;为为置信度是置信度是 的的Z Z值;值;n n为样本规模为样本规模 习题1 调查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为1600元,标准差为1200元。求(1)在95%的置信度下,全厂职工的月平均工资的置信区间是多少?()若将置信度提高到99%,全厂职工的月平均工资的置信区间又多少?解()将调查数据代入总体均值的区间估计公式得:查值得,故总体均值的置信区间为:即1522元1678元()查值得,故总体均值的置信区间为:即1497元1703
6、元习题依据2-2数据,在95%的置信度下,1997年全球婴儿死亡率的置信区间是多少?2.2 总体成数的区间估计其中,其中,p p 为样本中的百分比为样本中的百分比习题:从某城市随机选取323名青年人,发现失业率是21.7。如果要求99的可信度,试估计该城市青年人的失业情况。解代入公式得:即16%28%2 假设检验:均值与百分比总体总体总体总体假设检验的过程假设检验的过程(提出假设抽取样本作出决策)抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选
7、择别无选择.作出决策作出决策作出决策作出决策假设检验的基本思想假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 MMM =50=50=50.如果这是总如果这是总如果这是总如果这是总如果这是总如果这是总体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值样本均值样本均值样本均值MMMM=50=50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均
8、值样本均值样本均值样本均值样本均值样本均值 .202020假设检验之基本知识研究假设与虚无假设(null hypothesis)虚无假设:H0:1=2研究假设:H1:12 H1:12H1:12单尾检验(one-tailed test)考验单一方向性的问题。其统计假设如下:H0:1=2 H1:12 双尾检验(two-tailed test)不强调方向性,只强调有差异的假设考验。其统计假设如下:H0:1=2 H1:12第一类型错误(typeerror)拒绝H0时所犯的错误。亦即拒绝H0,但事实上H0是真的。其概率大小为(显著水平)。第二类型错误(typeerror)接受H0时所犯的错误。亦即接受H
9、0,但事实上H0是假的。其概率大小为。统计检定力正确拒绝H0的机率,亦即亦即拒绝H0,但事实上H0是假的。其机率大小为(1-)。否定域(CR)假设检定的步骤写出统计假设(包括H0和H1)选择适当的检验统计法决定显著度,并已H1的性质选用一端或二端检验,并确定否定域根据样本资料计算检验值,从而做出决策z检验:均值z检验:百分数 p为样本百分数,为样本百分数,P为所设总体百分数为所设总体百分数检验法:z检验(大样本)单样本T检验:均值单样本t检验:百分数 p为样本百分数,为样本百分数,P为所设总体百分数为所设总体百分数检验法:t检验(小样本)习题4从某城市随机选取323名青年人,发现失业率是21.
10、7。假设全国城市平均失业率为18%,如果要求95可信度,请问该城市青年人的失业是否严重?解首先建立虚无假设和对立假设,即有:H0:P18%H1:P 18%选择显著性水平a=0.05,由标准正态分布表查得,然后根据样本数据计算统计值,其公式为:由于Z=1.73 ,所以,拒绝虚无假设,接受研究假设,即该城市青年人的失业较严重,失业率超过全国平均水平。卡方检验T检验两个独立样本T检验配对样本T检验3、F检验方差分析的检验对两个总体或多个总体的差异的检验R相关系数与回归系数的检验检验法3 假设检验:两个变量之相关卡方检验习题5为了研究青年人的性别特征是否影响他们的人生志趣,随机抽取100名青年进行调查,得到表1数据。请问青年人的性别特征是否影响他们的人生志趣?作业作业 习题6某官员声称,某地区生活水平明显提高,人均月收入高于1200元。某研究者对此表示怀疑,以抽样调查的方法去验证该官员的结论。他从该地区随机抽取1000人,调查得到人均月收入1100元,标准差800元。根据这个调查结果,能否证实或否定该官员的结论?习题7研究不同性别的学生对父母的敬重程度。从一个随机样本中得到表1的次数分布。我们的研究假设是不同性别的学生对父母的敬重程度不同。显著度为0.05,卡方检验原假设是否成立。性别最敬重父母男女总和总和4582611972331627122599126