《抽样误差和统计推断.ppt》由会员分享,可在线阅读,更多相关《抽样误差和统计推断.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样误差和统计推断现在学习的是第1页,共30页第一节 抽样研究与抽样误差u抽样误差:抽样造成的这种样本均数与样本均数之抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异间、样本均数与总体均数之间的差异u标准误:用于表示均数抽样误差大小的指标,也标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了叫样本均数的标准差,它反映了样本样本均数之间的离均数之间的离散程度。散程度。现在学习的是第2页,共30页均数的分布及其标准误 数理统计的中心极限定理和大数定理表明:数理统计的中心极限定理和大数定理表明:从正态总体从正态总体N(,2)中随机抽取含量为)中随机抽取
2、含量为n的样本,其样本均数服从正态分布;即使从偏的样本,其样本均数服从正态分布;即使从偏态总体中随机抽样,当态总体中随机抽样,当n足够大时(如足够大时(如n30),),样本均数也近似正态分布;样本均数也近似正态分布;从均数为从均数为,标,标准差为准差为的总体中随机抽取含量为的总体中随机抽取含量为n的样本,则的样本,则样本均数的均数也为样本均数的均数也为,样本均数的标准差为。,样本均数的标准差为。现在学习的是第3页,共30页现在学习的是第4页,共30页 例例3-1 某地随机抽取某地随机抽取20岁健康男性岁健康男性20名,求得其血名,求得其血中葡萄糖样本均数中葡萄糖样本均数=39.5mg/100m
3、l,标准差,标准差S=0.69mg/100ml,问其抽样误差是多少?问其抽样误差是多少?本例:本例:s=0.69mg/100ml,n=20,将其代入公式得,将其代入公式得即该研究的抽样误差为即该研究的抽样误差为0.15mg/100ml。现在学习的是第5页,共30页现在学习的是第6页,共30页现在学习的是第7页,共30页t值的分布与自由度值的分布与自由度 有关(实际是样本含量有关(实际是样本含量n不同)。不同)。t 分布的图形不是一条曲线,而是分布的图形不是一条曲线,而是一簇曲线。一簇曲线。=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3 不同自由度下的不同自
4、由度下的t t分布图分布图现在学习的是第8页,共30页t 分布的图形有如下特征:分布的图形有如下特征:单峰分布,以单峰分布,以0为中心,左右对称,类似于标为中心,左右对称,类似于标准正态分布。准正态分布。自由度自由度 越小,则越大,越小,则越大,t值越分散,曲线值越分散,曲线的峰部越矮,尾部越高;的峰部越矮,尾部越高;随着自由度随着自由度 逐渐增大,逐渐增大,t分布逐渐逼近标分布逐渐逼近标准正态分布;当准正态分布;当 趋于趋于 时,时,t分布就完全成分布就完全成为标准正态分布,故标准正态分布是为标准正态分布,故标准正态分布是t分布的分布的特例。特例。现在学习的是第9页,共30页 统计学家将统计
5、学家将t分布曲线下的尾部面积(即概率分布曲线下的尾部面积(即概率P)与)与横轴横轴t值间的关系编制了不同自由度值间的关系编制了不同自由度 下的下的t界值表(附表界值表(附表2)。)。t界值表:横标目为自由度界值表:横标目为自由度 ,纵标目为概率,纵标目为概率P。t临界值:表中数字表示当临界值:表中数字表示当 和和P 确定时,对应的值。确定时,对应的值。单侧概率单侧概率(one-tailed probability):用:用t,表示表示双侧概率双侧概率(two-tailed probability):用:用t/2,表示表示现在学习的是第10页,共30页例如例如,当当 =16,单侧概率,单侧概率P
6、=0.05时,由表中查得单侧时,由表中查得单侧t0.05,16=1.746;而当;而当 =16,双侧概率,双侧概率P=0.05时,由表中时,由表中查得双侧查得双侧t0.05/2,16=2.120。按。按t分布的规律,理论上有分布的规律,理论上有单侧:单侧:P(t t0.05,16)=0.05 和和P(t t0.05,16)=0.05 双侧:双侧:P(t t0.05/2,16)P(t t0.05/2,16)=0.05 现在学习的是第11页,共30页更一般的表示方法如图更一般的表示方法如图(a)和和(b)中阴影部分所示为:中阴影部分所示为:单侧:单侧:P(t t,)=和和P(t t,)=双侧:双侧
7、:P(t t/2,)P(t t/2,)=现在学习的是第12页,共30页现在学习的是第13页,共30页总体总体样本样本抽取部分观察单位抽取部分观察单位统计量统计量统计量统计量参参 数数统计推断统计推断统统 计计 推推 断断 statistical inferencestatistical inference如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)包括:点估计与区间包括:点估计与区间估计估计2.假设检验假设检验(test of h
8、ypothesis)现在学习的是第14页,共30页参数估计参数估计参数估计的概念参数估计的概念参数估计:指用样本指标(统计量)估计总体指标(参数)。参数估计:指用样本指标(统计量)估计总体指标(参数)。参数估计有参数估计有点估计(点估计(point estimation)区间估计(区间估计(interval estimation)现在学习的是第15页,共30页参数估计参数估计点估计:用样本统计量直接作为总体参数的点估计值,即点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数直接用随机样本的样本均数作为总体均数 的点估计的点估计值值,用样本频率用样本频率p作为
9、总体概率作为总体概率 的点估计值的点估计值缺点:没有考虑抽样误差,无法评价其可信度估计值它缺点:没有考虑抽样误差,无法评价其可信度估计值它与真值之间的差距。与真值之间的差距。现在学习的是第16页,共30页参数估计参数估计95%CL:125 2.056 =(119.06,130.94)g/L 99%CL:125 2.779 =(116.98,133.02)g/L 该市健康成年男子血红蛋白平均含量:该市健康成年男子血红蛋白平均含量:95%置信区间为(置信区间为(119.06,130.94)g/L,99%置信置信区间为(区间为(116.98,133.02)g/L。现在学习的是第17页,共30页 二、
10、假设检验的基本步骤二、假设检验的基本步骤现在学习的是第18页,共30页 1建立检验假设、确定检验水准建立检验假设、确定检验水准 检检验验假假设设有有两两种种:一一种种是是无无效效假假设设(null hypothesis),符符号号为为H0,即即假假设设均均数数来来自自同同一一总总体体,它它们们的的总总体体均均数数相相同同,样本均数间无本质的不同,差别仅由抽样误差引起;样本均数间无本质的不同,差别仅由抽样误差引起;另另一一种种是是备备择择假假设设(alternative hypothesis),符符号号为为H1,即即假假设设均均数数来来自自不不同同总总体体,它它们们之之间间的的差差别别存存在在本
11、质的不同,并非仅由抽样误差引起。本质的不同,并非仅由抽样误差引起。检验水准(检验水准(size of a test)亦称显著性水准)亦称显著性水准(significance level),符号为),符号为。现在学习的是第19页,共30页 2.选择和计算统计量选择和计算统计量根据统计推断的目的和资料的性质、特点选择合适的根据统计推断的目的和资料的性质、特点选择合适的检验统计量。检验统计量。3确定确定P值值P值是指由值是指由H0所规定的总体中随机抽样,获得等于及所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本所获得的检验统计量值大于(或等于及小于)现有样本所获得的检验统计量值的概率。
12、求得检验统计量后,一般可通过特别的统计表的概率。求得检验统计量后,一般可通过特别的统计表直接查出直接查出P值。例如值。例如t值可查值可查t界值表,界值表,u值可查值可查u界值表界值表 现在学习的是第20页,共30页 4判断结果判断结果 当当P时时,结结论论为为按按所所取取检检验验水水准准拒拒绝绝H0,接接受受H1,两两均均数数差差别别有有统统计计意意义义(或或称称显显著著性性意意义义),即即它它们们之之间间存存在在着着本本质质的的不不同同(数数学学上上认认为为小小概概率率事事件件在在一一次次实实验验中中不不可可能能发发生生。P,即即被被推推断断为为小小概概率率事事件件);当当P时时,结结论论为
13、为按按所所取取检检验验水水准准尚尚不不能能拒拒绝绝H0,可可认认为为两两均均数数差差别别无无统统计计意意义义,即即它它们们之之间间无无本本质质的的不不同同,差差别别仅仅由由抽抽样样误差引起。误差引起。现在学习的是第21页,共30页三、三、t检验检验概概念念:选选用用检检验验统统计计量量t进进行行假假设设检检验验的的方方法法,称称t 检验。检验。用途:用途:样本均数与总体均数的比较样本均数与总体均数的比较配对计量资料的比较配对计量资料的比较两样本均数的比较两样本均数的比较 应应用用条条件件:正正态态分分布布:当当样样本本含含量量较较小小时时,要要求求样样本来自正态总体。本来自正态总体。方差齐性:
14、两样本均数比较时,要方差齐性:两样本均数比较时,要求两总体方差相等。求两总体方差相等。现在学习的是第22页,共30页、单个样本均数的、单个样本均数的t检验检验 目目的的:推推断断样样本本所所代代表表的的未未知知总总体体均均数数与与已已知知总总体体均数均数0是否相等。是否相等。例经产科大量调查得知某市婴儿体重均数为例经产科大量调查得知某市婴儿体重均数为3.20kg,今随机测得,今随机测得25名难产儿平均出生体重为名难产儿平均出生体重为3.42kg,标准差为标准差为0.42kg。问该市难产儿出生体重与一般婴儿是。问该市难产儿出生体重与一般婴儿是否不同?否不同?现在学习的是第23页,共30页配对类型
15、:配对类型:配在对子的同对受试对象分别给予两种不同处理;配在对子的同对受试对象分别给予两种不同处理;同一受试对象分别接受两种不同处理;同一受试对象分别接受两种不同处理;同一受试对象处理前后的比较。同一受试对象处理前后的比较。目的:推断某种处理有无作用或两种处理效应有无差别,即目的:推断某种处理有无作用或两种处理效应有无差别,即推断样本差值的总体均数推断样本差值的总体均数d是否等于零是否等于零。配对资料的比较配对资料的比较现在学习的是第24页,共30页现在学习的是第25页,共30页现在学习的是第26页,共30页四、四、u检验检验概概念念:选选用用检检验验统统计计量量u值值进进行行假假设设检检验验
16、的的方方法法称称u检验。检验。用途:同用途:同t检验。检验。应用条件:应用条件:大样本(如大样本(如n50););小样本,小样本,已知且样本来自已知且样本来自正态总体。正态总体。检验目的:同检验目的:同t检验。检验。统计量的计算公式:统计量的计算公式:现在学习的是第27页,共30页五、两类错误 假设检验是以样本推断总体,作出的结论假设检验是以样本推断总体,作出的结论是概率性的,并非绝对正确,是概率性的,并非绝对正确,可能可能发生两类发生两类错误错误:1)如果无效假设如果无效假设H0为真,拒绝了它,称第一为真,拒绝了它,称第一类错误或类错误或型错误(型错误(type error).2)如果无效假
17、设如果无效假设H0不真,不拒绝它,称第二不真,不拒绝它,称第二类错误或类错误或型错误(型错误(type error)。)。现在学习的是第28页,共30页两类错误的关系图两类错误的关系图现在学习的是第29页,共30页六、假设检验注意事项六、假设检验注意事项 1假假设设检检验验的的前前提提是是要要有有严严密密的的抽抽样样设设计计,保保证证样样本本是是从从同同质质总总体体中中随随机机抽抽取取。并并且且,组组间间的的均均衡衡性性和和资资料料的的可可比比性性应应予予特特别别注注意意,除除了了对对比比的的因因素素外外,其其它它影影响结果的因素应尽可能相同或基本相同。响结果的因素应尽可能相同或基本相同。2选用的检验方法应符合其应用条件。选用的检验方法应符合其应用条件。3.正确理解差别有无统计意义的涵义。正确理解差别有无统计意义的涵义。4.结论不能绝对化。结论不能绝对化。5正确选用单侧还是双侧检验。正确选用单侧还是双侧检验。6报告结论时,应列出现有样本检验统计量值,说明采报告结论时,应列出现有样本检验统计量值,说明采用的单侧还是双侧检验,并列出用的单侧还是双侧检验,并列出P值的确切范围。值的确切范围。现在学习的是第30页,共30页