医学统计学第讲区间估计和假设检验精品文稿.ppt

上传人:石*** 文档编号:71821358 上传时间:2023-02-06 格式:PPT 页数:38 大小:1.80MB
返回 下载 相关 举报
医学统计学第讲区间估计和假设检验精品文稿.ppt_第1页
第1页 / 共38页
医学统计学第讲区间估计和假设检验精品文稿.ppt_第2页
第2页 / 共38页
点击查看更多>>
资源描述

《医学统计学第讲区间估计和假设检验精品文稿.ppt》由会员分享,可在线阅读,更多相关《医学统计学第讲区间估计和假设检验精品文稿.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、医学统计学第讲区间估计和假设检验第1页,本讲稿共38页统计统计统计描述统计描述统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计第2页,本讲稿共38页点估计直接用样本统计量作为总体参数的估计值。特点:简单直观,但却不能从样本获得更多的信息。如用均数作为总体均数的估计值。示例:第3页,本讲稿共38页点估计示例用样本均数作为总体均数 的一个估计,用样本的标准差s作为总体标准差 的一个估计。某地区所有12岁正常男孩的身高是一个总体,但该总体的参数 平均身高未知。为此,随机抽取该地区120名12岁正常男孩,测得其平均身高为142.67cm,标准差为s=6.00cm,这是样本统

2、计量。该地区所有12岁正常男孩的平均身高为142.67cm,标准差为6.00cm。这就是点估计。如果有另一个研究者作同样的研究,测得当地另外120名12岁男孩的平均身高为=141.95cm,当然也可以此作为总体平均身高的另一个点估计。谁的结论更可信?第4页,本讲稿共38页参数的估计参数的估计点估计点估计:用样本统计量:用样本统计量 直接作为总体参数直接作为总体参数 的的估计值估计值区间估计区间估计:在一定:在一定可信度可信度(Confidence level)下,下,同时考虑抽样误差同时考虑抽样误差点估计:点估计:这种方法简单易行,但未考虑抽样误差,而抽这种方法简单易行,但未考虑抽样误差,而抽

3、样误差是不可避免的,因此样本抽的不同,可以对总体样误差是不可避免的,因此样本抽的不同,可以对总体参数做出不同的点估计。参数做出不同的点估计。第5页,本讲稿共38页以预先给定的概率(可信度1-)估计总体参数在哪个范围内的估计方法称为区间估计。其概率用1-表示,称为可信度或置信度。由此估计的区间称为1-可信区间。区间估计区间估计可信区间的两个端点称为可信区间的两个端点称为可信限可信限,其中较小者称,其中较小者称下限或下可信限,较大者称上限或上可信限。可信下限或下可信限,较大者称上限或上可信限。可信区间是一开区间区间是一开区间(CL,CU)。第6页,本讲稿共38页总体均数的可信区间总体均数的可信区间

4、总体均数的可信区间总体均数的可信区间第7页,本讲稿共38页1)未知,且n较小例例例例:对某人群随机抽取20人,用某批号的结核菌素做皮试,平均直径为10.9mm,标准差为3.86mm,问这批结核菌素在该人群中使用,皮试直径的95%可信区间?n=20,=20-1=19,=0.05t 0.05,19=2.093(10.9-2.093*3.86/20,10.9-2.093*3.86/20)=(9.10,12.70)下限下限上限上限第8页,本讲稿共38页例例:n=144,x=5.38,s=0.44,求总体均数的总体均数的95%可信可信区间。区间。(5.38-1.96*0.44/144,5.38+1.96

5、*0.44/144)=(5.31,5.45)总体均数的双侧总体均数的双侧95%可信区间可信区间2)当样本含量n较大时,如n100,t分布近似标准正态分布,此时可用标准正态分布u分布代替t分布第9页,本讲稿共38页两均数之差的区间估计两均数之差的区间估计两均数之差的区间估计两均数之差的区间估计两均数之差的标准误合并方差第10页,本讲稿共38页 正常组 肝炎组 2?均 数:231.86ug/dL标准差:12.17ug/dL 1?均 数:273.18ug/dL标准差:9.77ug/dL 1-2?第11页,本讲稿共38页第12页,本讲稿共38页可信度为可信度为1-的可信区间的的可信区间的确切涵义确切涵

6、义是:是:每每100个个样本所算得的样本所算得的100(1-)%可信区间,平均有可信区间,平均有100(1-)个包含了总体参数。)个包含了总体参数。可信区间的涵义可信区间的涵义可信区间的涵义可信区间的涵义 9595可信区间可信区间:从总体中作随机抽样,作:从总体中作随机抽样,作100100次抽样,每个样本可算得一个可信区间,得次抽样,每个样本可算得一个可信区间,得100100个可信区间,平均有个可信区间,平均有9595个可信区间包括个可信区间包括(估计正确估计正确),只有,只有5 5个可信区间不包括个可信区间不包括(估计估计错误错误)。第13页,本讲稿共38页95%可信区间的含义可信区间的含义

7、-2 -1 0 1 2 按这种方法构建的可信区间,理 论 上 平 均 每100次,有95次可以估计到总体参数。第14页,本讲稿共38页可信区间的两个要素可信区间的两个要素可信区间的两个要素可信区间的两个要素 9595可信区间可信区间 9999可信区间可信区间 公式公式 区间范围区间范围 窄窄 宽宽 估计错误的概率估计错误的概率 大(大(0.050.05)小(小(0.010.01)可信度(Confidence):准确性,可靠性,即1-。一般取90%,95,可人为控制精确性(Precision):区间的大小,越小越好。第15页,本讲稿共38页可信区间的宽度及影响因素可信区间的宽度及影响因素均数的9

8、5%可信区间为则其宽度为第16页,本讲稿共38页可信度越大,可信区间越宽,说明用该区间来估计总体参数(总体均数)越可靠。标准差越小,可信区间就越窄,意味着如果总体内变异程度较小时,在相同的可信度下,只需要一个比较窄的可信区间就可以估计总体均数。随着样本含量的增加,可信区间逐渐变窄。第17页,本讲稿共38页下列说法正确吗?下列说法正确吗?下列说法正确吗?下列说法正确吗?算得某95%的可信区间,则:总体参数有95%的可能落在该区间。有95%的总体参数在该区间内。该区间包含95%的总体参数。该区间有95%的可能包含总体参数。该区间包含总体参数,可信度为95%。第18页,本讲稿共38页均数可信区间与参

9、考值范围的均数可信区间与参考值范围的区别区别:区别点区别点均数的可信区间均数的可信区间均数的可信区间均数的可信区间参考值范围参考值范围参考值范围参考值范围意义意义按预先给定的概率,确定未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大的可能性包含了总体均数。“正常人”的解剖、生理、生化指标的波动范围。第19页,本讲稿共38页计算公式计算公式用途用途均数的可信区间均数的可信区间均数的可信区间均数的可信区间参考值范围参考值范围参考值范围参考值范围估计总体均数判断观察对象的某项指标正常与否第20页,本讲稿共38页分辨两个样本是否属一个总体或两个

10、不同的总体,并对总体作出适当的结论。假假假假设检验设检验的基本目的:的基本目的:的基本目的:的基本目的:第21页,本讲稿共38页模拟实验实验1:总体A是100例正常成年男子的红细胞数,从中随机抽取样本 和样本实验2:总体B是不同于总体A的又一正常成年男子的红细胞数,从中随机抽取样本b。(样本含量均为10例)第22页,本讲稿共38页Population APopulation Bsample sample 2asample b第23页,本讲稿共38页 假设检验的实质假设检验的实质是先对总体的参数或是先对总体的参数或分布做出某种假设,然后用适当的方法根据分布做出某种假设,然后用适当的方法根据样本对

11、总体提供的信息,推断此假设应当拒样本对总体提供的信息,推断此假设应当拒绝,或不拒绝,其结果将有助于研究者做出绝,或不拒绝,其结果将有助于研究者做出决策,采取措施。决策,采取措施。第24页,本讲稿共38页假设检验的基本思想假设检验的基本思想提出一个假设如果假设成立,得到现有样本的可能性可能性很小(小概率事件小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。可能性较大(不是小概率事件小概率事件),即有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设(没理由)第25页,本讲稿共38页例例例例:根据大量调查,已知健康成年男子的脉搏均数:根据大量调查,已知健康成年男子

12、的脉搏均数 0为为72次次/分,某医生在一山区随机调查了分,某医生在一山区随机调查了25名健康成名健康成年男子,求得其脉搏均数为年男子,求得其脉搏均数为74.2次次/分,标准差分,标准差6.0次次/分,能否认定该山区成年男子的脉搏均数高于一般分,能否认定该山区成年男子的脉搏均数高于一般成年男子?成年男子?74.2 72环境因素环境因素抽样误差抽样误差第26页,本讲稿共38页如何回答例题中的问题?如何回答例题中的问题?统计上是通过假设检验,按小概率事件和反证法相结合的原理来回答这个问题。假设检验的方法很多,但其检验的基本步骤是一致的。第27页,本讲稿共38页步骤步骤1:建立假设:建立假设在假设的

13、前提下有规律可寻 检验假设(hypothesis to be tested),亦称无效假设或零假设(null hypothesis),记为H0,表示目前的差异是由于抽样误差引起的。备择假设(alternative hypothesis),记为H1,表示目前的差异是主要由于本质上的差别引起。第28页,本讲稿共38页 H0假设比较简单、明确,且在该假设前提下其分布有规律可寻。而H1假设包含的情况比较复杂。因此,检验是针对H0分布进行的。统计学上,将“拒绝H0,接受,接受H1”称为有统计学意义;“不拒绝H0”称为无统计学意义。称为无统计学意义。第29页,本讲稿共38页H0:两总体均数相等,即1=2H

14、1:1 2(1 2)情形1 两均数比较第30页,本讲稿共38页H0的意义与(1)相似,只不过总体均数多于2个罢了;而H1的意义比较复杂,因为拒绝H0之后,可供选择的结果远不止一个,如1=2,23;12,2=3;123;皆符合与H0对立的要求。H0:1=2=3;H1:1、2、3之间不等或不全等。情形2 多个均数间比较第31页,本讲稿共38页在多个均数相比较时,如果拒绝H0,则往往要再分别比较 1与 2、1与 3、2与 3,即进行多重比较,才可得到具体的结果。第32页,本讲稿共38页H0:d=0,即总体差值均数为0 H1:0,则表示治疗前后有差异 情形3 其它情形第33页,本讲稿共38页步骤步骤2

15、:确立检验水准:确立检验水准(significance level)用于确定何时拒绝H0 如果在H0所规定的总体中随机抽样,获得手头样本的概率不超过,我们将如何抉择?一般取0.05=0.05 检验水准检验水准检验水准检验水准 表示表示表示表示在所设H0的总体随机获得手头样本的概率不允许超过5。(界定小概率的标准)“手头样本”也包括与总体参数偏离更大的样本在内。第34页,本讲稿共38页步骤步骤3:计算检验统计量和:计算检验统计量和P值值计算检验统计量即计算样本与所假设总体的偏离。计算概率P值即与统计量t值对应的概率。一个样本按某一检验方法只能得出一个一个样本按某一检验方法只能得出一个P值,值,但

16、供研究者用来界定此但供研究者用来界定此P值的值的水准却有多个。水准却有多个。第35页,本讲稿共38页P ,拒绝,拒绝H0,接受,接受H1,差异有统计学意义,差异有统计学意义P ,不拒绝不拒绝H0,差异无统计学意义,差异无统计学意义统计结论专业结论P值越小差别越大步骤步骤4:作出推断结论:作出推断结论第36页,本讲稿共38页假设检验的正确应用假设检验是建立在样本随机客观的基础上的。P值的含义:P值表明以多大的误差拒绝H0,接受,接受H1。Significant的含义。检验水准在假设检验结论中的意义。按误差不超过 的条件拒绝 ;接受第37页,本讲稿共38页假设检验与参数估计的关系假设检验与参数估计的关系目标不同,对问题的直接回答目标不同,对问题的直接回答也不同也不同区别:区别:区别:区别:联系:联系:联系:联系:可以从两个角度说明同一个问题,可以从两个角度说明同一个问题,两者结果可以互相印证两者结果可以互相印证第38页,本讲稿共38页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁