《第09章数值变量资料的统计推断ppt课件.ppt》由会员分享,可在线阅读,更多相关《第09章数值变量资料的统计推断ppt课件.ppt(111页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章第九章 数值变量资料的统计推断数值变量资料的统计推断流行病与卫生统计学系流行病与卫生统计学系 王增珍王增珍.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。回顾上一章内容:回顾上一章内容:集中趋势指标:集中趋势指标:算术均数、中位数、几何均数算术均数、中位数、几何均数离散趋势指标离散趋势指标:全距、四分位数间距、全距、四分位数间距、方差、标准差、变异系数方差、标准差、变异系数正态分布:正态分布:概念、特征、面积规律、应用概念、特征、面积规律、应用医学参考值估计医学参考值估计:步骤、估计方法步骤、估计方法.A.研究武汉市大一学
2、生男性身高。研究武汉市大一学生男性身高。B.根据某几个学校男大一学生的入学体检身根据某几个学校男大一学生的入学体检身高资料,推测武汉市大一学生男性身高。高资料,推测武汉市大一学生男性身高。总体参数的估计总体参数的估计.A.经常参加锻炼的女子脉搏是否等于经常参加锻炼的女子脉搏是否等于74次次/分;分;B.比较来自中国广东省与河北省的一年级男大学生身比较来自中国广东省与河北省的一年级男大学生身高。以在武汉大学和华中科技大学的两省男生为样高。以在武汉大学和华中科技大学的两省男生为样本,得出样本均值分别为本,得出样本均值分别为168.2cm与与169.9cm,推,推测总体均值是否相等。测总体均值是否相
3、等。推测某个总体参数是否等于某个值或两个推测某个总体参数是否等于某个值或两个或两个以上的总体参数是否相等或两个以上的总体参数是否相等.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。本次讲授内容本次讲授内容n均数的抽样误差均数的抽样误差nt分布,分布,t分布与分布与u分布的区别分布的区别n总体均数的可信区间估计总体均数的可信区间估计.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。一、均数的抽样误差和标准误一、均数的抽样误差和标准误第一节 均数的抽样误差与总体均数的估
4、计.例如,从总体均数例如,从总体均数为为4.83 /L4.83 /L、标准差、标准差 为为 0.52 /L 0.52 /L的正态分布总体的正态分布总体N N(4.83,0.522)(4.83,0.522)中,随机中,随机 抽取抽取1010人为一个样本人为一个样本(n n=10=10),并计算该样本的均数、),并计算该样本的均数、标准差。如此重复抽取标准差。如此重复抽取100100次(次(g=100g=100),可得到),可得到100100份份 样本,可得到样本,可得到100100对均数对均数 和标准差和标准差S。正态总体=4.83=0.521.4.58,0.382.4.90,0.453.4.7
5、6,0.49 99.4.87,0.59100.4.79,0.39S.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。抽样误差抽样误差 sampling error of meansampling error of mean:由于抽样而引起的差异。:由于抽样而引起的差异。.图图9-1 随机抽样所得随机抽样所得100个样本均数的分布个样本均数的分布.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误标准误(standard error,SE)概念:概念:样本均数的标准
6、差,可用于衡量抽样误样本均数的标准差,可用于衡量抽样误差的大小。差的大小。未知未知已知已知.计计算算了了100个个样样本本的的标标准准差差S,由由此此可可计计算算样本的标准误大小。样本的标准误大小。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。100个样本均数的抽样分布特点:样本均数的抽样分布特点:100个样本均数中,各样本均数间存在差样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。异,但各样本均数在总体均数周围波动。样本均数的分布曲线为中间高,两边低,样本均数的分布曲线为中间高,两边低,左右对称,近似服从左
7、右对称,近似服从正态分布正态分布。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误的特点:当样本例数当样本例数n一定时,标准一定时,标准误与标准差呈正比;误与标准差呈正比;当标准差一定时,标准误与当标准差一定时,标准误与样本含量样本含量n的平方根呈反比。的平方根呈反比。通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。.n=5n=103 3个抽样实验结果图示个抽样实验结果图示.标准误的用途标准误的用途衡量抽样误差的大小;衡量抽样误差的大小;估计总体均数的置信区间;估计总体均数的置信区间;用于假设检验。用于假
8、设检验。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误与标准差的区别与联系标准误与标准差的区别与联系区别:区别:标准误标准误 标准差标准差定义反映抽样误差 反映个体变异用途总体均数可信区间 医学参考值范围进行统计学检验 计算标准误、CV联系:联系:当当n一定时标准差大,标准误也大一定时标准差大,标准误也大.抽样实验小结抽样实验小结 样样本的均数本的均数围绕总围绕总体均数上下波体均数上下波动动。均数的均数的标标准差即准差即标标准准误误 样样本均数的本均数的标标准准误误(Standard Error)Standard Err
9、or)计计算公式算公式为为:样样本本标标准差准差/从正从正态总态总体体N N(,(,2 2)中抽取中抽取样样本,本,获获得均数得均数的分布仍近似呈正的分布仍近似呈正态态分布分布N N(,(,2 2/n n)。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。二、二、t 分布分布(t-distribution)随机变量随机变量X XN N(m m,2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换.均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自
10、由度:n n-1-1.图9-1 不同自由度下的t 分布图.t t 分布的特征分布的特征 以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于时,t分布即为u分布。.附表附表9-1 t 界值表界值表.参数的估计参数的估计点估计:点估计:由样本统计量由样本统计量 直接估计总体参数直接估计总体参数区间估计:区间估计:在一定置信度在一定置信度(Confidence level)下,估计总)下,估计总体参数可能存在的范围体参数可能存在的范围三、总体均数的可信区间估计三、总体
11、均数的可信区间估计.估计正确的概率估计正确的概率(1(1 )称为可信度或置信度称为可信度或置信度(confidence levelconfidence level),常取),常取9595或或9999。置信区间置信区间(confidence interval,CIconfidence interval,CI)是根据)是根据一定的置信度估计得到的区间。一定的置信度估计得到的区间。总总体体均均数数的的95%95%置置信信区区间间的的涵涵义义是是指指:从从理理论论上上来来说说,做做100100次次抽抽样样,可可算算得得100100个个置置信信区区间间,平平均均有有9595个个置置信信区区间间包包括括总
12、总体体均均数数,只只有有5 5个个置置信区间不包括总体均数。信区间不包括总体均数。(一)置信区间的有关概念(一)置信区间的有关概念.(二)总体均数置信区间的计算(二)总体均数置信区间的计算 未知,且未知,且n 较小,较小,按按t分布分布 已知,或已知,或 未知但未知但n足够大,按足够大,按 u 分布分布.u0.05/2=1.962.未知但未知但n较大时,按较大时,按u分布计算总体均数分布计算总体均数的可信区间。双侧的可信区间。双侧1-可信区间为:可信区间为:3.已知时,总体均数双侧已知时,总体均数双侧1-可信区间为:可信区间为:u0.05/2=1.96=.(四)总体均数可信区间与参考值范围的区
13、别(四)总体均数可信区间与参考值范围的区别.本讲小结 均数的抽样误差均数的抽样误差 标准误:计算公式、意义和特点标准误:计算公式、意义和特点 t分布及其特征分布及其特征 总体均数可信区间总体均数可信区间 含义含义 估计方法估计方法 与医学参考值的区别与医学参考值的区别.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。正态曲线下面积分布规律是正态曲线下面积分布规律是:A.1.96 A.1.96范围内占曲线下面积的范围内占曲线下面积的99%99%B.1.96 B.1.96范围内占曲线下面积的范围内占曲线下面积的95%95%C.1 C.
14、1 范围内占曲线下面积的范围内占曲线下面积的68%68%D.2.58 D.2.58范围内占曲线下面积的范围内占曲线下面积的95%95%E.2.58 E.2.58范围内占曲线下面积的范围内占曲线下面积的99%99%课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。某市某市120120名名1212岁男孩平均身高岁男孩平均身高X=143.10cm,X=143.10cm,S=5.67cm,S=5.67cm,则身高在则身高在128.24-157.96cm128.24-157.96cm范围内的范围内的理论频数最接近下列哪个
15、值理论频数最接近下列哪个值?A.114 B.119 A.114 B.119 C.64 D.72 C.64 D.72 E.96 E.96课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。衡量抽样误差大小的统计指标是:衡量抽样误差大小的统计指标是:A.A.标准差标准差 B.B.变异系数变异系数 C.C.方差方差 D.D.标准误标准误课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。关于关于t t值有值有:A.A.与总体均数和样本均数
16、之差成正比与总体均数和样本均数之差成正比 B.B.与标准误成反比与标准误成反比 C.C.与样本含量有关与样本含量有关 D.D.自由度一定时自由度一定时,t,t值愈大值愈大,P,P值越小值越小 E.E.符合正态分布符合正态分布 课堂练习题课堂练习题.数值变量资料的统计推断数值变量资料的统计推断第二节第二节 假设检验的基本思想和基本步骤假设检验的基本思想和基本步骤.学习要点:1.1.熟悉假设检验的基本思想和步骤;熟悉假设检验的基本思想和步骤;2.2.掌握掌握t t检验和检验和u u检验的方法;检验的方法;.(一)假设检验的基本思想(一)假设检验的基本思想利用反证法的思想假设检验的基本思想和步骤假设
17、检验的基本思想和步骤 利用小概率反证法思想,从问题的对立面(利用小概率反证法思想,从问题的对立面(H H0 0)出发间接判断要解决的问题(出发间接判断要解决的问题(H H1 1)是否成立。然后在)是否成立。然后在H H0 0成立的条件下计算检验统计量,最后获得成立的条件下计算检验统计量,最后获得P P值来判值来判断。当断。当P P小于或等于预先规定的概率值小于或等于预先规定的概率值,就是小概,就是小概率事件。根据小概率事件的原理:小概率事件在一次率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设怀
18、疑原假设H H0 0,认为其对立面,认为其对立面H H1 1成立,该结论可能犯成立,该结论可能犯大小为大小为的错误。的错误。.例例9.2 某某地地抽抽样样调调查查了了2626名名男男性性管管理理人人员员的的空空腹腹 血血 糖糖,均均 数数 为为 4.84mol/L4.84mol/L,标标 准准 差差 为为0.85mol/L0.85mol/L。已已知知大大量量调调查查的的一一般般健健康康成成年年男男性性空空腹腹静静脉脉血血糖糖的的均均数数为为4.70mol/L4.70mol/L。试试问问能能否否认认为为该该地地健健康康男男性性管管理理人人员员的的空空腹腹血血糖糖的的均均值与一般正常健康成年男性的
19、的均值不同?值与一般正常健康成年男性的的均值不同?.差异的原因:差异的原因:(1)由于抽样误差造成的由于抽样误差造成的.(实际上实际上 ,但,但由于抽样误差由于抽样误差 不能很好代表不能很好代表 )(2)该地男性管理人员的空腹血糖与一般健康成年该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖男性空腹静脉血糖()().假设检验的目的就是假设检验的目的就是判断差异的原因判断差异的原因:求出由抽样误差造成此差异的可能性求出由抽样误差造成此差异的可能性(概率概率P)有有多大多大!若若 P 较大较大(P0.05),认为是由于抽样误差造成的。,认为是由于抽样误差造成的。原因(原因(1),实际上),
20、实际上 若若 P 较小较小(P0.05),认为不是由于抽样误差造成的。,认为不是由于抽样误差造成的。原因(原因(2),实际上),实际上 .(二)假设检验的基本步骤(二)假设检验的基本步骤1.1.建立假设,确定检验水准建立假设,确定检验水准2.2.选定检验统计方法,计算检验统计量选定检验统计方法,计算检验统计量3.3.确定确定P P值,作出推断结论值,作出推断结论.1、建立假设,确定检验水准建立假设,确定检验水准H0:(无效(无效假设)假设)=0H1:(备择假设)(备择假设)0(0)检验水准的意义及确定检验水准的意义及确定单、双侧检验的选择:单、双侧检验的选择:(1 1)根据专业知识)根据专业知
21、识 事先不知道会出现什么结果事先不知道会出现什么结果 双侧双侧 事先知道只能出现某种结果事先知道只能出现某种结果 单侧单侧(2 2)问题的提法)问题的提法*通常用双侧通常用双侧(除非有充足的理由选用单侧之外除非有充足的理由选用单侧之外,一般选用一般选用保守的双侧较稳妥保守的双侧较稳妥).2、选定检验方法,计算检验统计量选定检验方法,计算检验统计量3 3、确定、确定P P值,作出推断结论值,作出推断结论P值:在H0成立的情况下,获得比现有统计量更极端的概率。.(推断的结论统计结论专业结论)P P0.050.05,按,按 检验水准,检验水准,不拒绝不拒绝H H0 0,差异无统计学,差异无统计学 意
22、义意义(差异无显著性差异无显著性),还不能认为还不能认为不同或不等。不同或不等。P0.05P0.05 ,按,按 检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1,差异有统计学意义差异有统计学意义(差异有显著性差异有显著性),可以认为,可以认为不不同或不等。同或不等。P0.01P0.01,按,按 检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1,差异有差异有高度高度统计学意义统计学意义(差异有差异有高度高度显著性显著性),可以认,可以认为为不同或不等。不同或不等。.确定确定P 值:值:(用求出的(用求出的t 值与查表查出的值与查表查出的t 值比较)值比较)查查t
23、值表:值表:(t 越大,越大,P 越小越小)(1)求出求出t=1.833,P0.05 (2)求出求出t=4.18,P0.01 (3)求出求出t=2.96,0.01P0.05 (简写为简写为P0.05)(4)求出求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P0.054.18P0.01P0.052.96.第三节第三节 t t 检验和检验和 u u 检验检验t t 检验应用条件:检验应用条件:当当n100n0 0 即即脂肪肝患者尿素氮测定值脂肪肝患者尿素氮测定值 的均值高于一般健康人的均值高于一般健康人.(2 2)选定检验方法,计算检验统计量)选定检验方法,计算检
24、验统计量n=16100n=16100,故选用,故选用t t检验。检验。已知已知.(3)(3)确定确定P P值,作出推断结论值,作出推断结论 查查 t t 界值表界值表 为单侧检验为单侧检验Pt0.050.012.6021.725P0.0252.32P0.05,P0.05,按按 检验水准,拒绝检验水准,拒绝H H0 0 ,接,接受受H H1 1,认为,认为脂肪肝患者尿素氮测定值的均数脂肪肝患者尿素氮测定值的均数高于健康人高于健康人。0.0252.131.二、配对设计的均数比较常见的配对设计主要有以下情形:常见的配对设计主要有以下情形:自身比较:自身比较:同一受试对象处理前后或不同部位测同一受试对
25、象处理前后或不同部位测定值的比较。定值的比较。(目的是判断此处理有无作用目的是判断此处理有无作用)同一受试对象同一受试对象(或样品或样品)分别接受两种不同的处理。分别接受两种不同的处理。(目的是比较不同方法之间的差异目的是比较不同方法之间的差异)成对设计:成对设计:将条件近似的观察对象两两配成对子,将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。对子中的两个个体分别给予不同的处理。(目的是比较不同方法之间的差异目的是比较不同方法之间的差异).配对配对t t检验的基本原理:检验的基本原理:假设两种处理的效应相同,即假设两种处理的效应相同,即 1 1=2 2 ,则则 1 1-
26、2 2=0=0,即可看成是差值的样本均数即可看成是差值的样本均数 所代表的未知总体均数所代表的未知总体均数 d d 与已知总体均数与已知总体均数 0 0=0=0的比较,此时,我们可套用前述的比较,此时,我们可套用前述t t检验检验的公式。的公式。.例例9.4 应用某药治疗应用某药治疗8 8例高胆固醇患者,观察治疗例高胆固醇患者,观察治疗前后血浆胆固醇变化情况,如表前后血浆胆固醇变化情况,如表9-19-1,问该药是否,问该药是否对患者治疗前后血浆胆固醇变化有影响?对患者治疗前后血浆胆固醇变化有影响?表表9-1 用某药治疗前后血浆胆固醇变化情况用某药治疗前后血浆胆固醇变化情况病人编号病人编号血浆胆
27、固醇(血浆胆固醇(mmol/L)差值差值dd2治疗前治疗前治疗后治疗后-1 10.10 6.69 3.4111.632 6.78 5.40 1.83 3.353 13.22 12.67 0.55 0.304 7.78 6.56 1.22 1.495 7.47 5.65 1.82 3.316 6.11 5.26 0.85 0.727 6.02 5.43 0.59 0.358 8.08 6.26 1.823.319 7.56 5.06 2.50 6.25合计合计 14.59 30.71.H0:该药对血浆胆固醇无影响。该药对血浆胆固醇无影响。H1:该药对血浆胆固醇有影响。该药对血浆胆固醇有影响。.P
28、t0.050.011.860P5050).(3)(3)查查u u 界值表界值表(t t 界值表中自由度为界值表中自由度为 的一行的一行 ),),u=1.021.96u=1.020.05P0.05,按,按 =0.05 =0.05水准,水准,不拒绝不拒绝H H0 0,差异无统计学意义;尚不能认为,差异无统计学意义;尚不能认为正常男女血中正常男女血中胆固醇胆固醇浓度均数不同。浓度均数不同。.2、两个小样本均数的比较、两个小样本均数的比较.例例9.6 从从40405959岁有无肾脏囊肿的女性中分别随岁有无肾脏囊肿的女性中分别随机抽取机抽取1010与与1212人,测定她们的尿素氮水平人,测定她们的尿素氮
29、水平(mmol/Lmmol/L)见表)见表9 92 2,问两组女性尿素氮水平有,问两组女性尿素氮水平有无不同?无不同?表表9-2 4059岁有无肾脏囊肿的女性尿素氮水平(岁有无肾脏囊肿的女性尿素氮水平(mmol/L)无肾囊肿无肾囊肿4.054.185.934.302.417.606.612.985.934.184.05有肾囊肿有肾囊肿4.544.633.64 5.076.445.62 6.144.816.42.建立假设,确定检验水准建立假设,确定检验水准H H0 0:1 12 2H H1 1:1 1 2 20.050.05选择检验方法,计算检验统计量选择检验方法,计算检验统计量t t值值.确定
30、确定P P 值,判断结果值,判断结果 查表查表9-19-1t t界值表,界值表,t t0.05,200.05,201.7251.725,今,今1.461.461.7251.725,故,故P P0.050.05,故按,故按0.050.05水水准,不拒绝准,不拒绝H H0 0,尚不能认为,尚不能认为有肾囊肿的女性有肾囊肿的女性尿素氮水平尿素氮水平高于无高于无肾囊肿的女性肾囊肿的女性。PP=?t=1.46P=0.05P=0.05tt=1.725.思考题:两样本比较作 t 检验,差别有显著性时,P 值越小说明A A 两样本均数差别越大两样本均数差别越大B B 两总体均数差别越大两总体均数差别越大C C
31、 两总体均数差别越小两总体均数差别越小D D 越有理由认为两样本均数不同越有理由认为两样本均数不同E E 越有理由认为两总体均数不同越有理由认为两总体均数不同.第四节 方差分析 (analysis of variance,ANOVA)又称变异数分析或又称变异数分析或F F检验检验*用途:用途:用途:用途:适用于对多个平均值进行假设检验;适用于对多个平均值进行假设检验;适用于对多个平均值进行假设检验;适用于对多个平均值进行假设检验;以检验所得的多个平均值是否来自相同总体。以检验所得的多个平均值是否来自相同总体。以检验所得的多个平均值是否来自相同总体。以检验所得的多个平均值是否来自相同总体。*对资
32、料的要求:对资料的要求:对资料的要求:对资料的要求:每个个体的测量值相互独立;每个个体的测量值相互独立;每个个体的测量值相互独立;每个个体的测量值相互独立;服从正态分布或近似服从正态分布;服从正态分布或近似服从正态分布;服从正态分布或近似服从正态分布;服从正态分布或近似服从正态分布;总体的方差相等总体的方差相等总体的方差相等总体的方差相等。.一、一、单因素方差分析单因素方差分析n或称单向方差分析(one way analysis of variance)或成组设计(完全随机设计)方差分析,是指试验研究的处理因素,或调查研究资料的分类方式只有一种。n这个处理因素(或分类方式)包含有多个离散的水平
33、,分析在不同水平上应变量的平均值是否来自相同总体.Xij表示第i个处理组的第j个观察值,i=1,2,k,j=1,2,ni *(一)(一)基本思想基本思想.例 某院外科对自行制备的三种消毒剂的杀菌效果进行考察,经过使用,以被消毒物品的残余细菌数(cfu/m2)为评价指标。试验结果如表12-5所示,试问三种消毒剂的效果是否存在差异?.n变异原因变异原因 变异表现变异表现处理因素(如不同的预防、治疗方案、不同的自然条件等)组间变异随机因素(含随机测量误差,抽样误差,个体变异等)组内变异T+EE组间均方MS组间组内均方MS组内F=MS组间/MS组内n若无效假设成立,组内均方MS组间和组间均方MS组内是
34、随机误差方差2的估计值,F值理论上应当等于1,F值有抽样误差;F分布是一种偏态分布。它的分布曲线由分子与分母两个自由度决定。l方差分析基本思想示意图.1=4,2=10的F值曲线和=0.05时界值统计量F值等于或大于临界F(1,2)值时,就在水准上拒绝无效假设,否则就不拒绝无效假设。.1、总变异(sum of squares of deviation from mean).2、组间变异、组间变异3、组内变异.4、三种变异的关系、三种变异的关系5、假设检验统计量.(二)分析步骤1.提出检验假设及规定类错误概率水准的大小。H0:1=2=k,各组所代表的总体平均值相等;H1:ij,至少有一个不等式成立
35、。i、j1,2,ij。0.05。2.计算统计量F3.确定概率,统计推断.1.建立假设:H0:三类人的空腹血糖均数相同 H1:三类人的空腹血糖均数不全相同0.05。2.计算各种离均差平方和、自由度、均方、F值.n 总 N-133-132,n组间k-13-12,n组内N-k33-330nMS组间SS组间组间6.723.35,nMS组内SS组内组内5.63300.19n F MS组间MS组内3.350.1917.63.随机区组设计的两因素方差分析 随机区组设计(randomized block design)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),相当于配对的
36、扩大。例5.2.l1、随机区组设计方差分析变异的分解.上式中,总平均值为:处理组平均值为:区组平均值为:.2、分析计算步骤(1)建立检验假设和确定检验水准H0:三种营养素喂养的小白鼠体重增量相等,8个区组的体重增量相等,即 1=2=3,1=2=3=4=5=6=7=8H1:三种营养素喂养的小白鼠体重增量不相等,或不全相等;8个区组的体重增量相等或不全相等,=0.05(2)计算检验统计量F值.上式中:.(3)确定P值和作出 推断结论F0.05(2,14)=3.74,F处理0.05,不拒绝H0。F0.05(7,14)=2.77,F区组 F,P0.05,拒绝H0。.二、多个样本均数间两两比较的q检验
37、在有k个样本均数的情形下,若进行t检验,可作 k!/2!(k-2)!次比较,对每个样本均数都要重复比较k-1次,5个均数比较,作10次t检验,=0.05,不犯I类错误的概率(1-0.05)10=0.9510=0.5987,总的检验水准为1-.5987=0.4013。本来差别无统计学意义,则判断为差别有统计学意义。故应用多重比较方法。检验多个样本均数间差别的无效假设H0,检验总体均数是否相等.二、多个样本均数间两两比较的q检验将比较的均数按大小顺序排列,标上秩次,计算q值.变量变换 1、对数变换 常用于(1)使对数正态分布资料正态化,(2)使方差齐性,特别是标准差与均数成比例,或变异系数接近常数
38、。2、平方根变换 用途(1)Poisson分布计数资料或轻度偏态资料正态化,(2)样本方差与均数呈正相关,可使资料达到方差齐性。3、倒数转换 用途:数据两端波动较大的资料,使极端值的影响减小。4、平方根反正弦变换 用途:服从二项分布的率或百分比资料。.n用角度表示:n用弧度表示:.数值变量的统计分析总结n一、描述性分析n集中趋势:n离散趋势:n正态分布:n医学参考值估计n二、统计推断n抽样误差、标准误、t分布、u分布n总体均数可信区间n两个均数的比较:与总体均数、配对资料、两个均数比较n两个及两个以上的均数比较:方差分析、q检验.第五节第五节 假设检验中的两类错误及应假设检验中的两类错误及应注
39、意的问题注意的问题一、两类错误一、两类错误n假设检验建立在小概率原理上的判断,无论拒绝还是不拒假设检验建立在小概率原理上的判断,无论拒绝还是不拒绝绝H0,都有可能犯错误。,都有可能犯错误。n拒绝了实际正确的无效假设拒绝了实际正确的无效假设H0称为犯了第称为犯了第类错误类错误(type I error),概率用,概率用 表示,通常称之为检验水准表示,通常称之为检验水准(level of significance),常取,常取=0.05;n接受了实际上错误的无效假设接受了实际上错误的无效假设H0称为犯了第称为犯了第类错误类错误(type error)。概率用。概率用 表示。在统计学中将表示。在统计
40、学中将1-称为称为检验效能检验效能(power of test),其意义是当两个总体存在差,其意义是当两个总体存在差异时异时(即备择假设即备择假设H1成立时成立时),所使用的统计检验能够发,所使用的统计检验能够发现这种差异现这种差异(拒绝无效假设拒绝无效假设H0)的能力。的能力。.9.二、假设检验应注意的问题二、假设检验应注意的问题n1、资料必须合乎随机化抽样原则资料必须合乎随机化抽样原则 这样这样的样本具有代表性和均衡可比性。的样本具有代表性和均衡可比性。n2、选用的假设检验方法应符合其应用条、选用的假设检验方法应符合其应用条件件 资料性质不同、设计类型不同以及样资料性质不同、设计类型不同以及样本例数的多少,所选用的检验方法也不本例数的多少,所选用的检验方法也不同。同。.n3、实际差别大小与统计意义的区别实际差别大小与统计意义的区别 要要正确理解假设检验的结论。正确理解假设检验的结论。n4、进行假设检验时,对差异有无显著性、进行假设检验时,对差异有无显著性或有无统计意义的判断不能绝对化。或有无统计意义的判断不能绝对化。n5、假设检验的单侧检验与双侧检验的正、假设检验的单侧检验与双侧检验的正确选择。确选择。.案例:多组均数的比较:多组均数的比较:.