《t检验讲学习教程.pptx》由会员分享,可在线阅读,更多相关《t检验讲学习教程.pptx(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/2/211 学习要求 了解:正态性检验和变量变换的基本概念。熟悉:方差齐性检验的基本概念;两样本方差齐性检验的计算;t t检验的计算。掌握:t t检验的步骤和t t分布的关系;样本均数和总体均数比较、配对设计均数的比较、两样本均数的比较t t检验的方法与步骤。第1页/共49页2023/2/212 t检验(t test)亦称Students t test,是以t分布理论为基础,定量资料分析常用的假设检验方法。小样本的样本均数与总体均数的比较以及两个样本均数的比较要用t检验。t 检验的适用条件:样本来自正态总体或近似正态总体;两样本总体方差相等。第一节第一节 样本均数与总体均数的比较样本
2、均数与总体均数的比较 亦称为单样本t检验(one sample t-test)。即样本均数代表的未知总体均数与已知的总体均数0(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较。第2页/共49页2023/2/213 例8.1 已知某地新生儿出生体重均数为3.36kg。从该地农村随机抽取40名新生儿,测得其平均体重为3.27kg,标准差为0.44kg,问该地农村新生儿出生体重是否与该地新生儿平均体重不同?(1)建立检验假设,确定检验水准 H0:=0=3.36 H0:0 =0.05=n-1第3页/共49页2023/2/214(2)计算t值 本例n=40,s=0.44,=3.27,=3.3
3、6,代入公式得(3)确定P值,作出推断结论 本例=401=39,查t界值表,得t0.40/2,39=0.851,t0.20/2,39=1.305,现t0.40/2,39tt0.20/2,39,故0.40P0.20。按=0.05的水准,不拒绝H0,差异无统计学意义,尚不能认为该地农村新生儿体重与该地新生儿平均体重不同。第4页/共49页2023/2/215如果在总体标准差0已知的情况下,样本均数与总体均数比较可用z检验,因为z值符合标准正态分布,其计算公式为:若zz或z;若z或zz/2,则P。z或z/2值查t界值表,=栏即可。第5页/共49页2023/2/216 第二节第二节 配对设计均数的比较配
4、对设计均数的比较 在医学研究中,为了减少误差,提高统计检验效率,我们常常采用配对实验设计(详见第三章)的方法。配对设计同源配对设计同质配对设计自身对照:治疗前后的比较。同一样品两种测试方法的比较。动物同窝别、同性别。病人:同性别、同病情、同年龄动物:同种属、同性别、同体重第6页/共49页2023/2/217 配对资料的t检验(paired samples t-test)先求出各对子的差值d的均值 ,若两种处理的效应无差别,理论上差值d的总体均数 应为0。所以这类资料的比较可看作是样本均数 与总体均数0的比较。要求差值的总体分布为正态分布。t检验的公式为:公式中,为差数的均数,Sd 为差数的标准
5、差,为差数均数的标准误。=n-1第7页/共49页2023/2/218 例8.2 对24名接种卡介苗。胺同年龄、同性别配成12对,每对重的2名儿童分别接种两种结核菌素,一种为标准品,另一种为新制品。72小时后记录两种结核菌素的皮肤反应平均直径,数据见表8.1。问儿童对两种不同结核菌素的皮肤反应直径有无不同?(1)建立检验假设,确定检验水准 H0:,儿童的皮肤反应直径无差别 H1:,儿童的皮肤反应直径有差别第8页/共49页2023/2/219(2)计算t值 本例n=12,d=39,d2=195,=d/n=39/12=3.25(mm)(3)确定P值,作出推断结论 =n-1=12-1=11,t界值表,
6、得t0.001/2,11=4.437,现tt0.001/2,11,故P0.001。按水准,拒绝H0,接受H1,差异有统计学意义。可以认为两种不同结核菌素对儿童的皮肤反应直径有差别,新制品反应小于标准品。第9页/共49页2023/2/2110第三节第三节 两样本均数比较两样本均数比较 两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independent samples t-test)。适用于比较按完全随机设计而得到的两组资料,比较的目的是推断两样本均数各自所代表的总体均数1和2是否相等。两样本含量可以相等也可以不相等,但在总例数不变的条件下,当两样本含量相等时,统计检验的效率最高。
7、本检验要求:两总体分布为正态分布,且方差齐同 .第10页/共49页2023/2/2111 一、两样本均数比较的t检验 式中,称为两均数之差的标准误的估计值,其计算公式为式中,S2称为两均数合并的方差,计算公式为:=n1+n2-1第11页/共49页2023/2/2112上式如果n1=n2,则第12页/共49页2023/2/2113 例8.3 某医生研究血清白介素-6(IL-6)与银屑病的关系,见表8.2结果。问银屑病患者与正常人的血清IL-6平均水平是否不同?表8.2 银屑病组与正常对照组的血清IL-6(pg/mL)组别组别例数例数均数均数标准差标准差银屑病组银屑病组正常人组正常人组121218
8、2.4149.727.719.5第13页/共49页2023/2/2114(1)建立检验假设 ,确定检验水准 H0:,银屑病患者与正常人的血清IL-6均数相同 H1:,银屑病患者与正常人的血清IL-6均数不同(2)计算t值 本例n1=n2,即可按下式计算t值。第14页/共49页2023/2/2115 (3)确定P值 作出推断结论 =12+12-2=22,查t界值表,得t0.005/2,22=3.119,t0.001/2,22=3.505,现t0.005/2,22tP0.002。按水准,拒绝H0,接受H1,差异有统计学意义。可以认为银屑病患者与正常人的血清IL-6平均水平不同,银屑病患者血清IL-
9、6平均水平较高。当两样本含量n1和n2均大于50时,t分布非常接近z分布,近似可按下式计算在z值:z或z/2值查t界值表,=栏即可。第15页/共49页2023/2/2116二、两样本几何均数t检验 比较两样本几何均数的目的是推断它们各自代表的总体几何均数有无差异。适用于:观察值呈等比关系,如血清滴度;观察值呈对数正态分布,如人体血铅含量等。两样本几何均数比较的t检验公式与两样本均数比较的t检验公式相同。只需将观察X用lgX来代替就行了。例 将2020名钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,抗体滴度的倒数(即稀释度)结果如下。问两组抗体的平均效价有无差别?第16页/共
10、49页2023/2/2117标准株(11人):100 200 400 400 400 400 800 1600 1600 1600 3200水生株(9人):100 100 100 200 200 200 200 400 1600(1)建立检验假设,确定检验水准 H0:,即两组对数值的总体均数相等。H1:,即两组对数值的总体均数不等。=0.05。第17页/共49页2023/2/2118(2)计算t值 将两组数据分别取对数,记为x1,x2。x1:2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 3.204 3.505 x2:2.000 2.
11、000 2.000 2.301 2.301 2.301 2.301 2.602 3.204用变换后的数据计算 ,s1,s2得:=2.7935,s1=0.4520,=2.3344,s2=0.3821,n1=11,n2=9第18页/共49页2023/2/2119 (3)确定P值 作出推断结论=11+9-2=18,查t界值表,得t0.05/2,18=2.011,t0.02/2,18=2.552,现t0.05/2,18tP0.02。按=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为两组抗体的平均效价不同,标准株高于水生株。第19页/共49页2023/2/2120第四节第四节 正态性检验和两
12、总体方差的齐性检验正态性检验和两总体方差的齐性检验 一、正态性检验 正态性检验只介绍以下基本概念。定量资料的假设检验方法,如t 检验、F检验等大都要求资料服从于正态分布,通过频数分布表可近似的看出资料的分布形态,但要确定资料是否为正态分布要通过假设检验的方法。(一)图示法:常用的图示法包括P-P图法和Q-Q图法。图中数据呈直线关系可认为呈正态分布,不呈直线关系可认为呈偏态分布。主要通过SAS或SPSS统计软件实现的。第20页/共49页2023/2/2121第21页/共49页2023/2/2122 (二)统计检验法 1.W检验和D检验:两种方法的检验假设为:H0:样本来自正态分布,H1:样本不来
13、自正态分布。由于两种方法的计算公式繁琐,一般用SAS或SPSS统计软件处理,当P0.05,则不拒绝H0;P0.05,则拒绝H0。注意:SAS规定,当样本含量n 2000时,以W检验结果为准;当样本含量n 2000时,以D检验结果为准。第22页/共49页2023/2/2123 如例4.2 120名9岁男孩的肺活量资料,通过SAS进行正态性检验,其结果如下:第23页/共49页2023/2/2124 2.2.矩法检验 分别对总体分布的偏度和峰度进行检验。(1)偏度检验:主要计算偏度系数(coefficient of skewness,SKEW),一般用g1来表示。检验假设为:H0:G1=0,总体分布
14、对称 H1:G10,总体分布不对称。第24页/共49页2023/2/2125 (2)峰度检验 主要计算峰度系数(coefficient of kurtosis,KURT),一般用g2来表示。检验假设为:H0:G2=0,总体分布为正态峰 H1:G20,总体分布不是正态峰 G2=0,为标准正态峰;G20,为尖峭峰;G20.05时,不拒绝H0;P0.05时,拒绝H0。一般认为两种检验方法均为P0.05时,才能认为总体分布为正态分布。第26页/共49页2023/2/2127 二、两样本方差的齐性检验 两样本均数比较的t检验,要求相应的两总体方差相等,即方差齐性(homogeneity of varia
15、nce)。两样本方差 和 分别是两总体方差 和 的无偏估计。即使 ,但由于抽样误差的关系,两样本方差也很少相等,但相差不会很大,当两样本方差相差较大时,需作方差齐性检验,以推断两总体方差是否相等。常用F 检验,其计算公式为:第27页/共49页2023/2/2128,式中 为较大的样本方差,为较小的样本方差,分子的自由度为 ,分母的自由度为 ,相应的样本例数分别为n1和n2。F值是两个样本方差之比,如仅是抽样误差的影响,它一般不会离1太远,反之,F 值较大,两总体方差相同的可能性较小。F分布就是反映此概率的分布。求得F值后,查附表4,F界值表得P值,F,不拒绝H0,可认为两总体方差相等;FF/2
16、(1,2),则P,拒绝H0,可认为两总体方差不等。第28页/共49页2023/2/2129 方差齐性检验应为双侧检验,但规定的是较大的方差除以较小的方差,其F值必然大于1,另外F界值表只规定单侧为0.05和0.01的界值,F0.05(1,2)=F0.10/2(1,2),所以方差齐性检验一般定检验水准=0.10。注意:当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验。例8.68.6 由X X线胸片上测得两组患者的肺门横径右侧距R R1 1值 (cm)(cm),计算的结果如下,比较其方差是否齐性?肺癌患者:n1=10,=6.21(cm),S1=1.79(cm)矽肺患者:n2=50,
17、=4.34(cm),S2=0.56(cm)第29页/共49页2023/2/2130(1)建立检验假设,确定检验水准 H0:,即两总体方差相等。H1:,即两总体方差不等。=0.10(2)计算F值(3)确定P值 作出推断结论 本例1=10-1=9,2=50-1=49,查附表4,F界值表,F0.10/2(9,49=2.80,得P0.05,按=0.10,拒绝H0,接受H1,故可认为两总体方差不齐。第30页/共49页2023/2/2131第五节第五节 t 检验和变量变换检验和变量变换 方差不齐时,两小样本均数的比较,可选用以下方法:采用近似法t 检验;采用适当的变量变换,使达到方差齐的要求;采用秩和检验
18、。一、t检验 t检验又称为近似t检验,常用的方法是Cochran&Cox法和Satterthwaite法。Cochran&Cox法近似t检验 该法是对临界值的校正。第31页/共49页2023/2/2132例8.5 由X线胸片上测得两组患者的肺门横径右侧距R1值(cm),计算的结果如下,已知总体方差不齐,用t检验进行两样本均数的比较 肺癌患者:n1=10,=6.21(cm),S1=1.79(cm)矽肺患者:n2=50,=4.34(cm),S2=0.56(cm)第32页/共49页2023/2/2133 (1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:1=2,两组病人,两组病人R1
19、值的总体均数相等值的总体均数相等 H1:12,两组病人,两组病人R1值的总体均数不等值的总体均数不等 =0.05 (2)计算计算t值和值和 界值界值 1=10-1=9,2=50-1=49,查附表3,t界值表,得t0.05/2,9=2.262,双侧t0.05/2,49=2.009,代入公式计算 值。第33页/共49页2023/2/2134(3)确定P值 作出推断结论 本例 t ,则P0.05,按=0.05水准,拒绝H0,差异有统计学意义,可以认为两种病人的R1值不同。当1=2=时,可直接根据由附表3,t界值表查出,而不需要计算。第34页/共49页2023/2/2135 Satterthwaite
20、法近似t检验 该法是对自由度校正。上例资料的计算为第35页/共49页2023/2/2136以=9查 t界值表,t0.01/2,9 t t0.005/2,9,故0.005P0.01,按=0.05水准,拒绝H0,差异有统计学意义,可以认为两种病人的R1值不同。两种方法统计学结论相同。的计算公式亦可看出:当n1=n2时,=1=2,而不需要计算。第36页/共49页2023/2/2137 二、变量变换 但资料不服从正态分布或总体方差不齐时,不能直接进行t检验、F检验等,解决的方法之一就是将原始数据进行数学函数的变换,使变换后的数据符合正态分布和方差齐性的要求,在进行t检验、F检验。常用的变量变换的方法有
21、以下几种:1.对数变换(logarithmic transformation)将原始数据X取自然对数或常用对数,将对数值作为新的分析数据。第37页/共49页2023/2/2138 Y=lnX 或 Y=lgX 如果数据包含0或太小的数值,可取 Y=ln(X+k)或 Y=lg(X+k)对数变换适用于:对数正态分布资料,如抗体滴度资料,疾病潜伏期等;几组资料的标准差与均数的比值都比较接近,用来消除方差不齐。例如一组抗体滴度资料:100 200 400 400 400 400 800 1600 1600 1600 3200 用SAS统计分析作正态性检验第38页/共49页2023/2/2139经对数转换
22、后:第39页/共49页2023/2/2140 又如两组数据:一组:0.24 0.54 0.50 0.34 0.40 0.76 0.30 0.20 =0.410 ,S1=0.1841 ,二组:1.99 0.99 1.22 1.17 1.96 0.71 1.25 1.23 =1.315,S2=0.4447 SAS统计软件分析两组是否方差齐性第40页/共49页2023/2/2141对原始数据作lg(X+1)变换后:S1=0.055,S2=0.081,2.平方根变换(square root transformation)将原始数据X的平方根作为新的分析数据。第41页/共49页2023/2/2142 当
23、原始数据中有太小值或零值时,可用下式:或 平方根变换适用于:使服从Poisson分布的分类资料或轻度偏态的的资料正态化;当各样本的方差与均数呈正相关时,可是资料达到方差齐性的要求。例 小白鼠按不同处理分为三组,在注射某同位素24小时后,测定脾脏蛋白质中的放射性次数见下表。问:该资料是否方差齐性?若不能试作适当变换。第42页/共49页2023/2/2143表 三组小白鼠脾脏蛋白质中放射性(次/分.克)X对照组对照组芥子气芥子气中毒组中毒组电离辐电离辐射组射组对照组对照组芥子气芥子气中毒组中毒组电离辐电离辐射组射组 3.8 9.0 2.5 8.2 7.111.011.5 9.011.0 7.95.
24、64.03.08.03.84.06.44.24.07.01.53.85.52.03.05.13.34.02.12.71.94943.00001.58112.86362.66463.31663.39123.00003.31662.81072.36642.00001.73202.86361.94942.00002.52982.04942.00002.64581.22471.94942.34521.41421.73202.25831.81662.00001.44911.64328.18.98891.10975.02.71110.52663.31.73780.52662.78940.35490.127
25、22.21010.12820.05801.78330.13320.0747第43页/共49页2023/2/2144 数据变换前,存在均数大方差也大,均数小方差宜小;数据转换后,此现象基本消除。数据变换前,SAS统计分析方差齐性检验结果:数据变换后,SAS统计分析方差齐性检验结果:第44页/共49页2023/2/2145 3.倒数变换(reciprocal transformation)Y=1/X 常用于数据两端波动较大的资料,减少极端值的影响。4.平方根反正旋变换(arcsine square root transformation)将百分率p取平方根后,再计算反正旋的值。第45页/共49页2023/2/2146 平方根反正旋变换主要适用于率和百分比的资料。百分率服从二项分布,特别是当百分率偏离50%较远,如大于70%或小于30%时,二项分布偏离正态分布较远。当p=0时可用下式:当p=100%时可用下式:第46页/共49页2023/2/2147思考题1.t检验的应用条件是什么?2.t检验是减少了型错误还是错误?3.变量变换的目的是什么?4.四种变量变换方法各适合于什么类型资料?第47页/共49页2023/2/2148第48页/共49页2023/2/2149谢谢您的观看!第49页/共49页