医学统计学总体均数的估计与假设检验教学提纲.ppt

上传人:豆**** 文档编号:77687087 上传时间:2023-03-16 格式:PPT 页数:75 大小:2.22MB
返回 下载 相关 举报
医学统计学总体均数的估计与假设检验教学提纲.ppt_第1页
第1页 / 共75页
医学统计学总体均数的估计与假设检验教学提纲.ppt_第2页
第2页 / 共75页
点击查看更多>>
资源描述

《医学统计学总体均数的估计与假设检验教学提纲.ppt》由会员分享,可在线阅读,更多相关《医学统计学总体均数的估计与假设检验教学提纲.ppt(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、医学统计学总体均数的估计与假设检验第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验 均数的抽样误差与标准误均数的抽样误差与标准误 t分布分布 总体均数的估计总体均数的估计 假设检验的一般步骤假设检验的一般步骤检验检验 u 检验检验 两均数的等效检验两均数的等效检验 正态性检验正态性检验 两样本方差齐性检验两样本方差齐性检验 假设检验时应注意的问题假设检验时应注意的问题 利用总体均数的可信区间进行假设检验利用总体均数的可信区间进行假设检验 课堂讨论课堂讨论 例例4.1某市随机抽查某市随机抽查12岁男孩岁男孩100人,人,得身高均数得身高均数139.6cm,标准差,标准差6.85cm

2、,资料,求标准误?,资料,求标准误?若若X或或 X服从正态分布服从正态分布 N(,2),则可作正),则可作正态变量态变量 X或或 X的的 u 代换代换。则则 u 服从标准正态分布服从标准正态分布 N(0,1)二、二、t 分布分布 实际工作中,实际工作中,往往未知,往往未知,S 代替代替,此时此时就不是就不是u代换,而是代换,而是 t 代换。代换。无数无数t点所组成的分布,称点所组成的分布,称t分布。分布。t 分布的特征分布的特征:(1)以)以 0 为中心,两侧对称的单峰分布为中心,两侧对称的单峰分布 (2)与)与 u 分布比较,峰值较低,两边上翘分布比较,峰值较低,两边上翘 (3)有一个参数)

3、有一个参数 ,当,当 ,t分布分布u分布分布P804 (1)点估计点估计:X (2)区间估计区间估计:按一定的概率(按一定的概率(1-)估计总体均数所在范围)估计总体均数所在范围(或称可信区间),常用(或称可信区间),常用95%和和99%的概率估计。的概率估计。1)当当 未知时未知时三、三、总体均数的估计总体均数的估计 例例2.12 11名名18岁男大学生身高得均数岁男大学生身高得均数172.25厘米,标准差厘米,标准差3.31厘米,试估计该地厘米,试估计该地18岁男大学生总体身高均数的岁男大学生总体身高均数的95%可信区间。可信区间。本例本例n=11,则,则=10,查,查t界值表得:双侧界值

4、表得:双侧t0.0510=2.228 2)未知,但未知,但n足够大时足够大时;例某地例某地110名名18岁男大学生身高均数为岁男大学生身高均数为172.73厘厘米,标准差为米,标准差为4.09厘米,试估计该地厘米,试估计该地18岁男大学岁男大学生总体身高均数的生总体身高均数的95%可信区间。可信区间。本例本例n=110,双侧双侧u0.05=1.96 3)当当 已知时。已知时。关于可信区间的准确性和精密度关于可信区间的准确性和精密度准确度准确度反映在可信度(反映在可信度(1-)的大小上;)的大小上;精密度精密度反映在可信区间的长度上。反映在可信区间的长度上。四、四、假设检验的一般步骤假设检验的一

5、般步骤例例:据大量调查知,健康成年男子脉搏的均数为据大量调查知,健康成年男子脉搏的均数为72次分,某医生在山区随机调查了次分,某医生在山区随机调查了25名健康男子,其名健康男子,其脉搏均数为脉搏均数为74.2次次/分,标准差为分,标准差为6.0次次/分,能否认分,能否认为该山区成年男子的脉搏高于一般人群?为该山区成年男子的脉搏高于一般人群?分析两均数不等的原因有两种可能性分析两均数不等的原因有两种可能性:(1)仅仅由于抽样误差所致;)仅仅由于抽样误差所致;(2)除抽样误差外还由于环境条件的影响。)除抽样误差外还由于环境条件的影响。如何判断?如何判断?统计上是通过假设检验来回答这个问题。统计上是

6、通过假设检验来回答这个问题。(1)建立假设建立假设:H0:(检验假设或无效假设检验假设或无效假设)总体参数相等总体参数相等 为什么称其为为什么称其为无效假设无效假设?H1:(备择假设备择假设)总体参数不等总体参数不等(2)确立检验水准确立检验水准 指拒绝实际上成立指拒绝实际上成立 H0 的所犯错误的概率的所犯错误的概率(I 类错误)。通常类错误)。通常 =0.05,但并不绝对。,但并不绝对。为什么检验水准为什么检验水准 通常取通常取0.05?(3)选定检验方法和计算检验统计量选定检验方法和计算检验统计量 如:、如:、F、X2 等等(4)确定确定P值,作出推断结论值,作出推断结论 P值值是指由所

7、规定的总体中(本例是指由所规定的总体中(本例 =0)作随机抽样,获得等于或大于现)作随机抽样,获得等于或大于现由样本计算得到的检验统计量值的概率。由样本计算得到的检验统计量值的概率。即即 P(t或或u、F、X2 等)等)。若:若:P 时,则拒绝时,则拒绝H0,接受,接受H1 P 时,则不拒绝时,则不拒绝H0 应用应用:用于两均数比较的假设检验;用于两均数比较的假设检验;资料要求资料要求:(1)资料随机取自正态总体;)资料随机取自正态总体;(2)两总体方差齐性(相等)。)两总体方差齐性(相等)。五、五、t t 检验检验1、样本均数与总体均数比较样本均数与总体均数比较 例例4.4 据大量调查知,健

8、康成年男子脉搏据大量调查知,健康成年男子脉搏的均数为的均数为72次次/分,某一身在山区随机调查了分,某一身在山区随机调查了25名健康男子,其脉搏均数为名健康男子,其脉搏均数为74.2次次/分,标分,标准差为准差为6.0次次/分,能否认为该山区成年男子的分,能否认为该山区成年男子的脉搏高于一般人群?脉搏高于一般人群?H0:=0 H1:0 单侧:单侧:=0.05 125 24 查查t界值表(界值表(P804),得单侧),得单侧 t0.05,24=1.711 因因:t=1.833 t0.05,24 所以:所以:P 0.05 结论:按照结论:按照 =0.05水准,拒绝水准,拒绝H0,故可,故可认为该山

9、区健康成年男子脉搏高于一般人群。认为该山区健康成年男子脉搏高于一般人群。上例如用上例如用双侧检验双侧检验,查表得双侧,查表得双侧 t0.05,24=2.064 则则:t=1.833 0.05。结论相反。结论相反。单侧检验效率要高于双侧检验单侧检验效率要高于双侧检验。如何选择单侧或双侧检验?如何选择单侧或双侧检验?主要根据专业知识而定。主要根据专业知识而定。如某指标只高不低或只低不高。如某指标只高不低或只低不高。2、配对设计的两均数比较配对设计的两均数比较 同源配对同源配对 观察指标测自同一受试对象或标本。观察指标测自同一受试对象或标本。异源配对异源配对 观察指标测自不同受试对象或标本,观察指标

10、测自不同受试对象或标本,但不同受试对象或标本配成对子,每对除处但不同受试对象或标本配成对子,每对除处理因素不同外,其它非处理因素一致或基本理因素不同外,其它非处理因素一致或基本一致。一致。统计分析是比较配对差值与总体均数统计分析是比较配对差值与总体均数 0 的差别进行的的差别进行的 H0:d=0 H1:d 0 =0.05 1=11 n为对子数或差值个数为对子数或差值个数t0.10,11=1.796,t0.20,11=1.363,故故 0.20 P 0.10。例:某单位研究饮食中缺乏维生素例:某单位研究饮食中缺乏维生素E与肝中维生与肝中维生素素A含量的关系,将同种属的大白鼠按性别相同,年含量的关

11、系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共龄、体重相近者配成对子,共8对,并将每对中的两对,并将每对中的两头动物随机分到正常饲料组和头动物随机分到正常饲料组和E缺乏组,过一定时期缺乏组,过一定时期将大白鼠杀死,测得其肝中将大白鼠杀死,测得其肝中A的含量如下表,问不同的含量如下表,问不同饲料的大白鼠肝中维生素饲料的大白鼠肝中维生素A含量有无差别?含量有无差别?(3)成组设计两样本均数的比较成组设计两样本均数的比较 n 122本例本例 t=1.80.05H0:1=2 H1:1 2 =0.05(4)成组设计的两样本几何均数的比较成组设计的两样本几何均数的比较 一般认为此类资料呈对数

12、正态分布,因此,需将一般认为此类资料呈对数正态分布,因此,需将原始资料取对数后,再作两组对数值均数的原始资料取对数后,再作两组对数值均数的t检验。检验。分别 H0:两株的总体几何均数相等两株的总体几何均数相等 H1:两株的总体几何均数不等两株的总体几何均数不等 =0.05 将两组数据分别取对数,将两组数据分别取对数,X1=lgA,X2=lgB (A、B 分别代表两组原始数据)分别代表两组原始数据)注意:这里直接比较的是注意:这里直接比较的是 lgG1 与与 lgG2,但间接说明,但间接说明 了了 G1 与与 G2 的差别。的差别。应用:应用:当当 已知;或已知;或 未知,但未知,但n足够大时(

13、此时足够大时(此时t分布接近分布接近u 分布)。用于两均数的比较。分布)。用于两均数的比较。常用于两大样本均数的比较。常用于两大样本均数的比较。其它资料要求同其它资料要求同t检验。检验。六、六、u 检验检验 例例2.18 某地抽样调查了部分健康成人的红细胞数,某地抽样调查了部分健康成人的红细胞数,其中男性其中男性360人,均数为人,均数为4.660 1012/L,标准差为,标准差为0.575 1012/L;女性;女性255人,均数为人,均数为4.178 1012/L,标准差为,标准差为0.291 1012/L,试问该地男、女平均红,试问该地男、女平均红细胞数有无差别?细胞数有无差别?七、两均数

14、的等效检验七、两均数的等效检验七、两均数的等效检验七、两均数的等效检验是推断两种处理效果是否是推断两种处理效果是否相近或相等相近或相等的统计方法。的统计方法。为什么推断两种处理效果是否相近或相等不能用为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?前面所述的假设检验方法?等效检验的假设等效检验的假设 H0:|1-2|H1:|1-2|为等效界值,若两总体均数差值在为等效界值,若两总体均数差值在 范围内为范围内为等效,超过则为不等效。等效,超过则为不等效。检验水准、自由度及结果判断同检验水准、自由度及结果判断同t检验检验检验检验。两样本均数等效检验公式为:两样本均数等效检验公式为

15、:注意事项注意事项q 值的选定在等效检验中十分重要,值的选定在等效检验中十分重要,一般把一般把专业上或公认的有意义的两种处理措施的差专业上或公认的有意义的两种处理措施的差值作为等效检验的值作为等效检验的 值。值。如:血压的如:血压的 值为值为5mmHg,白细胞为,白细胞为500个个/mm3。q要求样本要求样本:H0:|1-2|H1:|1-2|=0.05 122=2340.02 P 0.5 H0:r 1=0;r 2=0 H1:r1 0;r2 0 =0.10或或0.2(宜稍大以减少宜稍大以减少型错误型错误)(1)偏度系数)偏度系数=0.156/0.230=0.678P 0.53、柯尔莫柯罗夫、柯尔

16、莫柯罗夫-斯米尔诺夫斯米尔诺夫(Kolmogorov-Smirnov)检验)检验一般作为小样本的正态检验方法一般作为小样本的正态检验方法例抽样调查某地20名3岁女孩身高(cm)的原始数据如下:80.1 89.3 92.4 97.1 97.0 82.5 89.1 92.6 96.2 96.7 84.4 91.3 94.7 99.5 97.9 87.3 90.5 94.8 100.1 100.7 检验样本所属的总体是否呈正态分布?本例经计算 X=92.71 S=5.89抽样调查某地抽样调查某地 20名名3岁女孩身高(岁女孩身高(cm)资料如下:)资料如下:检验统计量为:检验统计量为:dmax=0.

17、0869,查表得:查表得:P0.8九、九、两样本方差齐性检验两样本方差齐性检验S21 较大,较大,S22 较小。较小。(方差不齐的(方差不齐的Levene检验:不依赖总体分布的具体形式)检验:不依赖总体分布的具体形式)例:由例:由X光片上测得两组病人的肺门横径右侧(光片上测得两组病人的肺门横径右侧(cm),),算得结果如下,试检验两个方差的齐性。算得结果如下,试检验两个方差的齐性。肺癌病人:肺癌病人:n1=10,X1=6.21,S1=1.79cm 矽肺矽肺0期病人:期病人:n2=50,X2=4.34,S2=0.56cmn 1 1=10 1=9,=21=50 1=49查附表查附表3,P806(齐

18、性检验用双尾界值)(齐性检验用双尾界值)得:得:F0.10/2,(9,49)F0.10/2,(9,48)=2.08,所以所以 P 0.10H0:两总体方差相等两总体方差相等 H1:两总体方差不等两总体方差不等 =0.10=1.792/0.562=10.22 一般同质的两组资料方差相差不大,若两样本方差一般同质的两组资料方差相差不大,若两样本方差相差一倍左右,要注意方差不齐的可能。相差一倍左右,要注意方差不齐的可能。问题:问题:若方差不齐,将如何处理?若方差不齐,将如何处理?(1)采用适当的变量变换,使达到方差齐性;)采用适当的变量变换,使达到方差齐性;(2)采用秩和检验;)采用秩和检验;(3)

19、采用近似法)采用近似法 t检验:检验:Cochran&Cox法法 Satterthwaite法法例:由例:由X光片上测得两组病人的肺门横径右侧光片上测得两组病人的肺门横径右侧(cm),算得结果如下,试检验两个方差的齐性。),算得结果如下,试检验两个方差的齐性。肺癌病人:肺癌病人:n1=10,X1=6.21,S1=1.79cm 矽肺矽肺0期病人:期病人:n2=50,X2=4.34,S2=0.56cm H H0 0:=2 2 H H1 1:2 2 =0.05=0.05(1)选用的方法应符合其应用条件)选用的方法应符合其应用条件(2)正确理解差别有无显著性的统计意义)正确理解差别有无显著性的统计意义

20、 结论中的结论中的“拒绝拒绝 H0,接受,接受H1”,习惯上亦称,习惯上亦称“差别显著差别显著”,不应误解为相差很大。反之,不应误解为相差很大。反之,“不拒绝不拒绝H0”,不应误解为相差不大或一定相等。,不应误解为相差不大或一定相等。例两篇同类文章,两样本均数比较,甲文例两篇同类文章,两样本均数比较,甲文P0.05;乙文乙文 P0.01。是否可认为乙文中两样本均。是否可认为乙文中两样本均数差值较甲文大?为什么?数差值较甲文大?为什么?十、十、假设检验时应注意的问题假设检验时应注意的问题(3)结论不能绝对化)结论不能绝对化 统计的结论是按着概率大小作出判断,若统计的结论是按着概率大小作出判断,若

21、取取 =0.05,此时拒绝,此时拒绝H0,仍有,仍有0.05的概率犯的概率犯错误;同样,不拒绝错误;同样,不拒绝H0,也可产生错误。,也可产生错误。第一类错误:第一类错误:拒绝实际上成立的拒绝实际上成立的H0所犯的错误。所犯的错误。P=第二类错误:第二类错误:不拒绝实际上不成立的不拒绝实际上不成立的H0所犯的错误。所犯的错误。P=,而,而 未知。未知。样本含量一定时,增大样本含量一定时,增大,则减少,则减少,减少,减少 则增大则增大,所以,所以,的确定并不是越小越好,一般取的确定并不是越小越好,一般取0.05较较合理。合理。怎样才能同时减少怎样才能同时减少、?(4)结论时,尽可能明确概率范围)

22、结论时,尽可能明确概率范围(5)统计结论应与专业结论相结合。)统计结论应与专业结论相结合。十一、十一、利用总体均数的可信区间进行假设检验利用总体均数的可信区间进行假设检验(1)样本均数与总体均数比较)样本均数与总体均数比较 例例2.14 据大量调查知,健康成年男子脉搏的均数据大量调查知,健康成年男子脉搏的均数为为72次分,某一身在山区随机调查了次分,某一身在山区随机调查了25名健康男子,名健康男子,其脉搏均数为其脉搏均数为74.2次次/分,标准差为分,标准差为6.0次次/分,能否认分,能否认为该山区成年男子的脉搏高于一般人群?为该山区成年男子的脉搏高于一般人群?单侧总体均数的单侧总体均数的95

23、%可信区间:可信区间:不包括不包括 0=72,P0.05总体均数的总体均数的95%可信区间:可信区间:(3)成组设计两样本均数的比较)成组设计两样本均数的比较 H0:1=2 H1:1 2 =0.05总体均数的总体均数的95%可信区间:可信区间:包括包括 1-2=0,P0.051.H0:0=2.H0:d=03.3.H H0 0:1 1-2 2=0=0抽样调查得甲地抽样调查得甲地100名健康男工人的血胆固醇名健康男工人的血胆固醇(mg/100ml)得得 X=180,S=30,假定血胆固醇呈正假定血胆固醇呈正态分布态分布,问问:(1)甲地全体健康男工人的血胆固醇平均数估计在什么范围?(2)乙地抽样查

24、得男工人血胆固醇 X=190,S=35,n=125,甲乙两地男工人血胆固醇是否相同?某实验室观察局部温热治疗小鼠移植性肿某实验室观察局部温热治疗小鼠移植性肿瘤的疗效瘤的疗效,以生存日数作观察指标以生存日数作观察指标,结果如下结果如下.问问两组生存日数有无差别两组生存日数有无差别?10名某病患者名某病患者,用某药治疗用某药治疗,测得治疗前及治疗测得治疗前及治疗后一个月的后一个月的 血沉(mm/小时)如下表:病人号 1 2 3 4 5 6 7 8 9 10 治疗前 10 13 6 11 10 7 8 8 5 9 治疗后 6 9 3 10 10 4 2 5 3 3 问该药是否有效问该药是否有效?用二乙胺化学法与气相色谱法测定车间空气中CS2的含量,结果如下,问两法所得结果有无差别(提示:资料不呈正态分布)?THE END

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁