《【医学课件大全】数值变量资料的假设检验.ppt》由会员分享,可在线阅读,更多相关《【医学课件大全】数值变量资料的假设检验.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 数值变量资料的假设检验数值变量资料的假设检验主要内容主要内容1 假设检验的基本思想和步骤假设检验的基本思想和步骤 2 t 检验检验 3 u 检验检验 4 正态性检验(自学)正态性检验(自学)5 两个方差的齐性检验两个方差的齐性检验 6 型错误和型错误和型错误型错误 7 假设检验时应注意的事项假设检验时应注意的事项 21 假设检验的基本思想假设检验的基本思想假设检验的目的假设检验的目的 假设检验的原理假设检验的原理假设检验的基本步骤假设检验的基本步骤3一、假设检验的目的一、假设检验的目的据大量调查得知,健康成年男子脉搏的均数为据大量调查得知,健康成年男子脉搏的均数为7272次次/分
2、,某分,某医生在山区随机调查了医生在山区随机调查了2525名健康成年男子,其脉搏均数为名健康成年男子,其脉搏均数为74.274.2次次/分,标准差为分,标准差为6.56.5次次/分,能否认为该山区成年男子的脉搏分,能否认为该山区成年男子的脉搏高于一般健康成年男子?高于一般健康成年男子?判断均数差别引起的原因:判断均数差别引起的原因:一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由抽样误差造成的;抽样误差造成的;另一种可能是,样本不是从该总体中随机抽取的,而是有本质另一种可能是,样本不是从该总体中随机抽取的,而是有本质上的不同,单纯用抽
3、样误差解释不了。上的不同,单纯用抽样误差解释不了。40t 分布分布一簇曲线一簇曲线0N(0,1)n n足够大时,足够大时,(1)(1)(2)(2)(3)(3)以固定以固定 n 随机抽样随机抽样二、假设检验的基本思想二、假设检验的基本思想5当以固定当以固定 n n 从均数为从均数为 的正态分布总体中随机的正态分布总体中随机抽样时,抽样时,对于对于 u u 分布,理论上,有分布,理论上,有9595的的 ,有,有5 5的的 。若进若进行一次抽样,则有行一次抽样,则有9595的可能的可能 ,而,而 的可能只有的可能只有5 5。-1.961.962.5%2.5%95%6n对于 t 分布,理论上有95的
4、,有5的 ;若进行一次抽样时,有95的可能 ,而 的可能只有5。0-t0.05/2,vt0.05/2,v2.5%2.5%95%t t7三、假设检验的基本步骤三、假设检验的基本步骤 适用于任何类型的变量适用于任何类型的变量 通过实例说明:据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般健康成年男子?8(一一)建立假设和确定检验水准建立假设和确定检验水准1.建立假设建立假设:检验假设检验假设(常称无效假设或零假设,null hypothesis,hypothesis u
5、nder test)用 表示,假设样本所代表的总体参数与已知总体参数相等();备择假设备择假设(alternative hypothesis),用 表示,与 是对立且相互联系的假设,假设样本所代表的总体参数与已知的总体参数不等(,或 ,或72次/分,。假设检验的基本步骤假设检验的基本步骤10(一一)建立假设和确定检验水准建立假设和确定检验水准 2.确定单、双侧检验确定单、双侧检验建立假设前,先要根据专业知识和研究目的来确定是单侧检验还是双侧检验。若从专业知识和研究目的上考虑,未知的总体参数只能大于(或只能小于)已知总体参数时,用单侧检验;若从专业知识和研究目的上认为,未知的总体参数大于或小于已
6、知总体参数的两种情况都可能存在时,用双侧检验。通常用双侧检验。单、双侧检验的区别可从备择假设反映出来:双侧检验时,;单侧检验时,。假设检验的基本步骤假设检验的基本步骤11(一一)建立假设和确定检验水准建立假设和确定检验水准 3.确定检验水准确定检验水准是判断拒绝或不拒绝无效假设的水准是判断拒绝或不拒绝无效假设的水准假设检验的基本步骤假设检验的基本步骤12(二二)选定检验方法和计算统计量选定检验方法和计算统计量假设检验的方法很多,如t检验、u检验、方差分析、检验、秩和检验、,各检验方法都有其应用条件。选择时,须根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检
7、验统计量。如本例,是样本与总体均数的比较,样本是按完全随机设计抽取的,是数值变量资料,且样本含量较小,总体标准差未知,须选用样本均数与总体均数比较的t检验。假设检验的基本步骤假设检验的基本步骤13求出检验统计量后,查相应的统计用表,得出概率P值。P值是指从 所规定的总体中随机抽样时,获得等于及大于(负值时为等于及小于)现有样本统计量的概率。(三三)确定确定P值,做出推断结论值,做出推断结论假设检验的基本步骤假设检验的基本步骤14(三三)确定确定P值,做出推断结论值,做出推断结论若所得的概率 时,认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的,不拒绝 ;若 时,认为从该总体抽到现有样
8、本的可能性很小,其差别并非是由单纯的抽样误差造成的,根据小概率事件一次不可能发生的定理,拒绝 ,接受 。以上为统计推断,还要结合专业做出专业结论。本例,按 检验水准,不拒绝 ,尚不能认为山区成年男子的总体脉搏均数高于一般人群。假设检验的基本步骤假设检验的基本步骤15第二节第二节 t 检验检验nt 检验(t-test),其理论基础为1908年W.S.Gosset以笔名“student”发表的 t 分布,故 t 检验亦称students t-test。nt 检验适用于:检验适用于:样本均数与总体均数比较(未知且 或 );成组设计的两小样本均数比较(均小于30或50);配对设计的两样本均数比较。16
9、t 检验检验t 检验的应用条件:检验的应用条件:当样本含量较小(或 )时,要求样本来自正态分布总体;用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。主要包括:主要包括:单样本 t 检验 配对 t 检验 两样本 t 检验 171.单样本单样本 t 检验检验(one sample t-test)用于用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。研究目的:研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。计算公式:计算公式:18 对例对例4.1进行进行 t 检验检验(1)建立假设,确定检验水准建立假设,确定检验水准 单侧(2
10、)计算统计量计算统计量 本例,次/min,次/min,次/min 单样本单样本 t 检验检验19(3)确定确定P 值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得单侧 ,按 检验水准不拒绝 ,根据本资料尚不能认为男性汽车司机的脉搏平均数高于一般男性脉搏平均数。对例对例4.1进行进行 t 检验检验 单样本单样本 t 检验检验202.配对配对 t 检验检验(paired t-test for dependent samples)用于用于配对设计资料的两均数的比较。配对设计类型:配对设计类型:先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同处理组;同一
11、对象分别接受2种不同处理(同一标本、不同部位);同一对象处理前后。研究目的:研究目的:推断2种处理的效果有无差别(或),推断某种处理有无作用()。21配对配对 t 检验检验计算公式:计算公式:式中,为差值d 的样本均数;为 所代表的未知总体均数,当2种处理的效应相同或某种处理无作用时 ;为差值的标准差,为差值样本均数的标准误;n为对子数,为自由度。22例例4.3例4.3 将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?配对配对 t 检验检验23配对
12、配对 t 检验检验24例例4.3(1)建立假设,确定检验水准建立假设,确定检验水准 (2)计算统计量计算统计量 本例,配对配对 t 检验检验25(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得双侧 ,按 检验水准拒绝 ,接受 ,可认为2组大白鼠肝脏维生素A含量的差别有统计学意义,维生素E缺乏组的大白鼠肝脏维生素A含量低于正常饲料组。例例4.3配对配对 t 检验检验26 例例4.4 有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。配对配对 t 检验检验27例例4.4(1)建立假设,确定检验水准
13、建立假设,确定检验水准 单侧 (2)计算统计量计算统计量 本例,配对配对 t 检验检验28(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得单侧 ,按 检验水准不拒绝 ,根据本资料尚不能认为该减肥药有效。例例4.3配对配对 t 检验检验293.两样本两样本 t 检验检验(two-sample/group t-test for independent samples)用于用于完全随机设计的两样本均数的比较,两样本 来自于两个总体(如不同的处理方法、不同 职业、性别等)。研究目的:研究目的:推断两样本所分别代表的总体均数 是否相等。30两样本两样本 t 检验检验n计算公
14、式:计算公式:式中,为两样本均数差值的标准误,为两样本的合并方差,、分别为两样本的方差。31例例4.5例4.5 将19只雌性大白鼠随机分为2组,分别饲以高蛋白和低蛋白饲料8周,各鼠体重的增加克数如下,问不同饲料组大白鼠的增重有无差别?高蛋白组(高蛋白组():134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组(低蛋白组():70 118 101 85 107 132 94两样本两样本 t 检验检验32(1)建立假设,确定检验水准建立假设,确定检验水准两样本两样本 t 检验检验例例4.533(2)计算统计量计算统计量 本例本例 例例4.5两样本两样
15、本 t 检验检验34(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得双侧 ,按 检验水准不拒绝 ,可认为两组雌性大白鼠增重的差别无统计学意义,尚不能认为两种饲料对雌鼠的增重不同。例例4.5两样本两样本 t 检验检验35成组设计的两样本几何均数比较成组设计的两样本几何均数比较在医学研究中,有些资料为对数正态分布资料和倍数资料,其平均水平宜用几何均数表示。当成组设计的两样本几何均数比较时,其检验统计量值计算公式为:36例例4.6例4.6 将20份钩端螺旋体患者的血清随机分为2组,分别用标准株和水生株做凝溶试验,结果见表4-3。试比较两法测得的血清抗体平均效价有无差别。
16、成组设计的两样本几何均数比较成组设计的两样本几何均数比较37成组设计的两样本几何均数比较成组设计的两样本几何均数比较38例例4.6(1)建立假设,确定检验水准建立假设,确定检验水准 :两总体几何均数相等 :两总体几何均数不等(2)计算统计量计算统计量本例本例成组设计的两样本几何均数比较成组设计的两样本几何均数比较39例例4.6成组设计的两样本几何均数比较成组设计的两样本几何均数比较40(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得双侧 ,按 检验水准拒绝 ,接受 ,认为两组抗体平均效价的差别有统计学意义,标准株组高于水生株组。例例4.6成组设计的两样本几何均数比
17、较成组设计的两样本几何均数比较41第三节第三节 u 检验检验u 检验(u-test),亦称Z-test。适用于:适用于:样本均数与总体均数的比较;成组设计两样本均数的比较。应用条件:应用条件:样本含量n足够大(n50),或n虽小 但 已知时。包括:包括:单样本u检验 两样本u检验421.单样本单样本 u 检验检验(one sample u-test)用于用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。研究目的:研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。计算公式:计算公式:43例例4.7n例4.7 一般男性血色素含量的医学参考值为1
18、4.0g()。某研究者从某高原地区人群中随机抽取120名健康男性,测得其血色素均数 g(),标准差 g()。问该高原地区健康男性血色素含量是否高于一般男性?单样本单样本 u 检验检验44例例4.7(1)建立假设,确定检验水准建立假设,确定检验水准 单侧(2)计算统计量计算统计量 本例,单样本单样本 u 检验检验45例例4.7(3)确定确定P值,做出推断结论值,做出推断结论 ,按 检验水准拒绝 ,接受 ,该地健康男性与一般男性血色素含量的差别有统计学意义,可认为该高原地区健康男性血色素含量高于一般男性。单样本单样本 u 检验检验462.两样本两样本 u 检验检验(two-sample u-tes
19、t for independent samples)用于用于完全随机设计的两样本均数的比较,两样本 来自于两个总体。研究目的:研究目的:推断两样本所分别代表的总体均数 是否相等。计算公式:计算公式:47例例4.8例4.8 某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人143名,均数为3.52mol/L,标准差为0.49mol/L;检测农民156名,均数为3.36mol/L,标准差为0.53mol/L。问该地工人与农民全血胆碱脂酶活力有无差别?两样本两样本 u 检验检验48例例4.8(1)建立假设,确定检验水准建立假设,确定检验水准 (2)计算统计量计算统计量 本例,两样本两样本 u 检验
20、检验49例例4.8(3)确定确定P值,做出推断结论值,做出推断结论 ,按 检验水准拒绝 ,接受 ,可认为该地工人与农民的全血胆碱脂酶活力不同,工人高于农民。两样本两样本 u 检验检验50第四节第四节 正态性检验正态性检验医学统计学中,许多统计方法仅适用于正态分布或近似正态分布资料。例如,用均数和标准差描述数值变量资料的分布特征,以及t、u检验和方差分析时,均要求样本资料服从正态分布。因此,选定统计方法时,首先要检验资料是否服从正态分布。正态性检验(test of normality)是推断资料是否服从正态分布,或样本是否来自正态分布总体的方法。51正态分布有2个特征,即对称性(symmetry
21、)和正态峰(mesokurtosis)。当频数分布不对称时为偏态(skewness)。依据高峰所处的位置,又可分为正偏态和负偏态:高峰偏左,长尾向右侧延伸的为正偏态;高峰偏右,长尾向左侧延伸的为负偏态。在医学研究中,偏态资料以正偏态居多。5253 非正态峰又有尖峭峰(leptokurtosis)和平阔峰(platykurtosis)之分:峰态尖峭而尾部伸展,两尾部曲线在正态曲线之上的为尖峭峰;峰态平阔而尾部短促,两尾部曲线在正态曲线之下的为平阔峰。54正态性检验方法正态性检验方法正态性检验的方法有正态性检验的方法有2类类(本节仅介绍矩法):对偏度和峰度分别用一个指标评定,其中矩法(method
22、 of moment)效率较高;仅用一个指标综合评定,其中W 检验和D 检验效率较高。矩法矩法亦称动差法。它是应用数学上矩的原理检验偏度和峰度。为偏度系数(coefficient of skewness),为峰度系数(coefficient of kurtosis)。55矩法计算公式矩法计算公式式中,式中,为变量值,为变量值,为相同为相同 的个数,的个数,n为样本含为样本含量;对于频数表资料,量;对于频数表资料,为组中值,为组中值,为各组段的为各组段的频数,频数,。56理论上,总体偏度系数 为对称,为正偏态,为负偏态;总体峰度系数 为正态峰,为尖峭峰,为平阔峰。和 为统计量,其抽样分布为近似正
23、态分布,故在计算其标准误(和 )后,可通过 u 检验推断资料的正态性。5758第五节第五节 两个方差的齐性检验两个方差的齐性检验n两个方差的齐性检验两个方差的齐性检验用于推断两样本方差 和 所分别代表的总体方差 和 是否相等。当 和 分别代表的总体方差相等时称两样本方差齐;反之,当 和 分别代表的总体方差不等时称两样本方差不齐。n两样本的t检验要求两样本来自方差相等的总体,即方差齐。因此,在两样本t检验时,需先进行两个方差的齐性检验。59两样本方差齐性检验方法两样本方差齐性检验方法nF 检验:检验:式中,为较大的样本方差,为较小的样本方差,为分子的自由度,为分母的自由度,n1和n2分别为相应的
24、样本含量。60例例4.9n例4.9 来自正态分布总体的2个随机样本的血清IgA(u/ml)测定结果如下,试检验两个方差的齐性。肺气肿组:健康组:61例例4.9(1)建立假设,确定检验水准(2)计算统计量(3)确定P值,做出推断结论 以 ,查附表3F界值表得 ,按 检验 水准不拒绝 ,可认为两总体方差相等,即两样 本方差齐。62第六节第六节 型错误和型错误和型错误型错误 假设检验利用小概率反证法的思想,根据样本统计量做出的推断结论具有概率性,因此其结论有可能出现判断错误,通常可能发生以下两类错误。以单样本t检验为例说明。6364型错误型错误(type error)型错误型错误 拒绝了实际上成立的
25、 ,即样本来自 的总体,由于抽样的偶然性,检验统计量 ,按 检验水准拒绝 ,接受 ()。这类在假设检验中拒绝了原本正确的 的错误为型错误。理论上犯型错误的概率为 ,值的大小视研究目的确定。通常设 ,即允许犯型错误的概率为0.05。65型错误型错误(type error)型错误型错误 不拒绝实际上不成立的 ,即样本来自 的总体,由于抽样的偶然性,检验统计量 ,按 检验水准不拒绝 。这类在假设检验中不拒绝原本不正确的 的错误为型错误。犯型错误的概率为 ,它只有与特定的 结合起来才有意义。6667型错误的概率 只取单尾,通常在假设检验时其大小是未知的,需在已知两总体差值 、总体标准差 、检验水准 和
26、样本含量n时尚能算出(详见第10章实验设计概述)。通常,当样本含量不变时,越小,越大;反之,越大,越小。同时减少 和 的方法是增加样本含量。68 称为检验效能或把握度(power of a test),即两总体确有差别时,按 水准能识别该差别的能力。如 表示:若两总体确有差别,理论上平均100次抽样中,有95次能得出两总体有差别的结论。在假设检验中,值的大小是事先确定的。严格地说,值也应事先确定,以保证一定检验效能()。69第七节第七节 假设检验时应注意的事项假设检验时应注意的事项 要有严密的抽样研究设计要有严密的抽样研究设计 正确选用检验方法正确选用检验方法 正确理解正确理解“显著性显著性”的含义的含义对差别有无统计学意义的判断不能绝对化对差别有无统计学意义的判断不能绝对化 70