医学统计学李琳琳参数估计.pptx

上传人:莉*** 文档编号:87174236 上传时间:2023-04-16 格式:PPTX 页数:57 大小:858.43KB
返回 下载 相关 举报
医学统计学李琳琳参数估计.pptx_第1页
第1页 / 共57页
医学统计学李琳琳参数估计.pptx_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《医学统计学李琳琳参数估计.pptx》由会员分享,可在线阅读,更多相关《医学统计学李琳琳参数估计.pptx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 统计推断是统计学学习的主要任务之一,期间,经常会采用抽样调查的方法。抽样调查的目的不在于了解部分单位的情况,只是作为一种手段,从而认识总体的数量特征。引引 言言第1页/共57页总体总体总体总体样本样本样本样本样本统计量样本统计量样本统计量样本统计量参数估计参数估计参数估计参数估计误差第2页/共57页教教 学学 内内 容容抽样研究与抽样误差总体均数的参数估计率的抽样误差和区间估计第3页/共57页第4页/共57页 通过电脑模拟实验从正态总体 N(74.5,5.62)中抽取一个样本含量为10的样本,比较样本均数与总体均数以及样本标准差与总体标准差的异同;重复抽样100100次,结果又如何?样本均数

2、的分布有什么特征?【电脑模拟实例电脑模拟实例】t distribution第5页/共57页 从上边电脑模拟实验我们可以发现,我们抽样得到的100个样本均数各不相同,与总体均数74.5也不相同;此外,得到的100个标准差各不相同,与总体标准差5.6也不相同。原因何在?我们从总体中抽取一个样本含量为10的样本(即抽样研究),会产生误差(抽样误差)。案例解析案例解析 第6页/共57页误差(error):指测量值和真值之间的差别。抽样误差(sampling error):在抽样研究中,因抽样造成的样本统计量与样本统计量、样本统计量与总体参数的差别统称为抽样误差。原因:个体变异特征:A 不可避免性 B

3、可控性第7页/共57页 借助于电脑模拟实验,研究样本均数的抽样分布。以样本均数作为一个新的变量,借助于频数分布图来看看样本均数的分布特征。【抽样分布抽样分布】第8页/共57页图5-1 100个样本均数的频数分布图第9页/共57页以样本均数作为随机变量,有以下特点:(1)各样本均数未必等于总体均数。(2)样本均数之间存在差异。(3)样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称。(4)样本均数的变异范围较之原变量的变异范围大大缩小。第10页/共57页数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。样本均数的标准差(简称标准误标准误,standard er

4、ror,SE)是描述均数的抽样误差大小的指标。标准误的概念第11页/共57页标准误的理论值标准误的理论值的估计值标准误的计算s抽样误差抽样误差n抽样误差抽样误差 前提:无限总体完全随机抽样第12页/共57页【例5-1】随机抽取了60名成年男性,得到其脉搏均数为72次/分,标准差为5.8次/分,试计算其抽样误差。=0.75(次/分)第13页/共57页中心极限定理中心极限定理 .从正态分布资料中,随机抽取例数n的样本,其样本均数也服从正态分布;当n足够大时(n50),从偏态总体中抽样,其均数也近似于正态分布。2.从正态分布资料中,随机抽取例数n的样本,其样本均数的总体均数也为,其标准差为。第14页

5、/共57页 =50=50=50 =10=10=10总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16第15页/共57页当样本含量足够当样本含量足够大时大时(n n 550)0),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布偏态分偏态分布总体布总体X X第16页/共57页标准误的用途1.衡量样本均数的可靠性 由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠。2.估计总体均数的置信区间。3.用于均数的假设检验。第17页/共57页标准误和标准差的区别与联系第18页/共57页 t t分布的概

6、念分布的概念 对于正态变量X N(,2)N(0,1)第19页/共57页抽出无数个样本含量为n的样本随机抽样均数标准差为 如果我们从一个总体中抽取无数个样本含量n足够大的样本,样本均数的分布服从正态分布:均数标准差为第20页/共57页 若未知,人们只能用S代替,从而以 代替 ,显然 ,它不再服从标准正态分布。W.S.Gosett于1908年用笔名student研究了它的分布规律,称之为t分布。第21页/共57页 n-1Z分布t分布第22页/共57页图2 不同自由度的t分布曲线 第23页/共57页1.t分布是一簇曲线。t分布有一个参数。2.t分布曲线以0为中心,左右对称;越小,曲线越扁平。3.t分

7、布曲线较标准正态曲线要扁平些,逐渐增大,t分布曲线逐渐的逼近于标准正态曲线,若,则t分布曲线和标准正态曲线完全吻合。4.t分布曲线下的面积分布有一定规律(P380)。t t分布图形的特点第24页/共57页生物医学研究的统计方法 第4章第25页/共57页图5-3 自由度等于20时的t分布曲线2.086-2.086第26页/共57页单侧概率的单侧概率的t t 临界值临界值,记作,记作t t(,)双侧概率的双侧概率的t t 临界值临界值,记作,记作t t(/2,)第27页/共57页第28页/共57页统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验区间估计区间估计点值估计点值估

8、计第29页/共57页 参数估计:用样本统计量来估计总体参数。点值估计点值估计:不计抽样误差,直接用样本均数来估计。区间估计区间估计:根据抽样误差的规律,按一定的概率估计总体均数的所在范围。统计上习惯用95%或99%可信区间表示总体均数可能所在范围。置信区间置信区间第30页/共57页样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间下限下限下限下限上限上限上限上限第31页/共57页置信限与置信区间置信限与置信区间 置 信 限 是 指置信区间的下限和上限,即可置信区间的两个端点值。置信区间指以上、下可信限为界的一个范围。如的1-可信区间指一个范围

9、,该范围包含在内的可能性为1-,不包含在内的可能性为。常用的可信区间为95%和99%。第32页/共57页 总体均数的95%置信区间表示的实际涵义是:如果从同一总体中重复抽取100份样本含量相同的独立样本,每份样本分别计算1个置信区间,在100个置信区间中,将大约有95个置信区间覆盖总体均数,5个置信区间不覆盖总体均数。第33页/共57页 通常情况下,我们只进行一次抽样,对于某一次估计的置信区间,我们总是宣称这个区间覆盖了总体均数,但不一定是真的覆盖了总体均数,于是,我们补充一句:置信水平为95%。第34页/共57页均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间

10、包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1-1-a a a aa a a a/2 2a a a a/2 2第35页/共57页 总体均数总体均数的区间估计:的区间估计:正态分布法正态分布法1.1.已知已知2.2.未知,但未知,但n5050时时 t t 分布法分布法未知,且未知,且n5050时:时:Z Z分布:分布:置信区间:置信区间:t t=t t分布:分布:置信区间:置信区间:第36页/共57页(一)正态分布法(一)正态分布法适用条件:已知或未知但n较大时(n50)第37页/共57页 x_X95%95%的样本的样本的样本的样本99%99%的样本的

11、样本的样本的样本第38页/共57页 例 在郑州市随机抽取了100名成年男性,测得其血清胆固醇含量为192.5mg/dl,标准差为28.6mg/dl,试估计郑州市成年男性血清胆固醇总体均数的95%置信区间。郑州市成年男性血清胆固醇总体均数的95%置信区间为(186.9,198.1)mg/dl。第39页/共57页(二)t分布法 适用条件:未知且n较小时(n 50 50)第40页/共57页【例5-3】已知某地25名成年女性腰围均数为77.8cm,标准差为9.2 cm,试计算该地成年女性腰围均数的95%和99%置信区间。第41页/共57页生物医学研究的统计方法 第4章第42页/共57页第43页/共57

12、页区别点区别点 均数的置信区间 参考值范围意义 包含总体均数的可 “正常人”的解剖、生理 能范围 生化指标的波动范围计算公式用途 估计总体均数 判断观察对象的某 项指标是否正常置信区间与医学参考值范围不同 第44页/共57页第45页/共57页率的抽样误差:从同一总体中随机抽取样本含量相同的若干个样本,各样本率之间不完全相同,这些样本率间的差异,同时反映了样本率与总体率之间的差异,这种由抽样这种由抽样造成的样本率与总体率的差异称为造成的样本率与总体率的差异称为率的抽样率的抽样误差误差。第46页/共57页 标准误:衡量率的抽样误差大小的指标是率的标准误(率的标准误(p p)。率的标准误越小,率的抽

13、样误差越小,用样本率估计总体率的可靠性越好,反之亦然。第47页/共57页 3 率的标准误的计算:实际工作中,由于往往是未知的,可用样本率p作的估计值,计算率的标准误的估计值。第48页/共57页 4 率的标准误的用途(1)衡量样本率的抽样误差的大小;(2)估计总体率的可信区间;(3)检验样本率间差异的显著性。第49页/共57页 总体率的估计有点(值)估计和区间估计,点估计是简单地用样本率来估计总体率;区间估计是求出总体率的可能范围。样本率的理论分布和样本含量n、阳性率p的大小有关,所以需要根据n和p的大小不同,分别选用下列两种方法:第50页/共57页 查表法:当样本含量n较小,如n50,特别是p

14、很接近于0或1时,可直接根据样本含量n和阳性数X查出总体率的可信区间。第51页/共57页 例 2003年4-6月某医院重症监护病房收治重症SARS患者38人,其中死亡12人,求SARS病死率的95%置信区间。查百分率的可信区间(P393),在n=38和X=12的交叉点处下、上限界值为18和49。SARS病死率的95%置信区间18%49%。第52页/共57页 由于附表百分率的可信区间中X值只列出了Xn/2的部分,当Xn/2时,应以n-X 查表,再从100中减去查得的数值即为所求置信区间。第53页/共57页 正态分布法:n50 np5 n(1-p)5第54页/共57页【例5-7】为了解中老年人高血压的患病情况,某研究人员在某市随机调查了年龄在40岁以上的居民共2500人,检查出高血压患者800人,估计该市中老年人高血压患病率的95%置信区间。即该市中老年人高血压患病率的95%置信区间为(30.2%,33.8%)。第55页/共57页生物医学研究的统计方法 第4章第56页/共57页谢谢您的观看!第57页/共57页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁