《第八章 t检验讲精选文档.ppt》由会员分享,可在线阅读,更多相关《第八章 t检验讲精选文档.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章 t检验讲2022/9/241本讲稿第一页,共四十九页 学习要求学习要求 了解:了解:正态性检验和变量变换的基本概念。正态性检验和变量变换的基本概念。熟悉:熟悉:方差齐性检验的基本概念;两样本方差齐性检验方差齐性检验的基本概念;两样本方差齐性检验的计算;的计算;t t检验的计算。检验的计算。掌握:掌握:t t检验的步骤和检验的步骤和t t分布的关系;样本均数和总体均数比分布的关系;样本均数和总体均数比较、配对设计均数的比较、两样本均数的比较较、配对设计均数的比较、两样本均数的比较t t检验的方法与检验的方法与步骤。步骤。2022/9/242本讲稿第二页,共四十九页 t检验(检验(t te
2、st)亦称)亦称Students t test,是以,是以t分布理论为基础,定量资分布理论为基础,定量资料分析常用的假设检验方法。小样本的样本均数与总体均数的比较以及两料分析常用的假设检验方法。小样本的样本均数与总体均数的比较以及两个样本均数的比较要用个样本均数的比较要用t检验。检验。t 检验的适用条件:检验的适用条件:样本来自正态总体样本来自正态总体或近似正态总体;或近似正态总体;两样本总体方差相等。两样本总体方差相等。第一节第一节 样本均数与总体均数的比较样本均数与总体均数的比较 亦称为单样本亦称为单样本t检验(检验(one sample t-test)。)。即样本均数代表的未即样本均数代
3、表的未知总体均数知总体均数与已知的总体均数与已知的总体均数0(一般为理论值、标准值或经过大(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较。量观察所得的稳定值等)进行比较。2022/9/243本讲稿第三页,共四十九页 例例8.1 已已知知某某地地新新生生儿儿出出生生体体重重均均数数为为3.36kg。从从该该地地农农村村随随机机抽抽取取40名名新新生生儿儿,测测得得其其平平均均体体重重为为3.27kg,标标准准差差为为0.44kg,问问该该地地农农村村新新生生儿儿出出生生体体重重是是否否与与该该地地新新生生儿儿平平均均体体重不同?重不同?(1)建立检验假设,确定检验水准)建立检验假设
4、,确定检验水准 H0:=0=3.36 H0:0 =0.05=n-12022/9/244本讲稿第四页,共四十九页(2)计计算算t值值 本本例例n=40,s=0.44,=3.27,=3.36,代代入入公公式式得得(3)确确定定P值值,作作出出推推断断结结论论 本本例例=401=39,查查t界界值值表表,得得t0.40/2,39=0.851,t0.20/2,39=1.305,现现t0.40/2,39tt0.20/2,39,故故0.40P0.20。按按=0.05的的水水准准,不不拒拒绝绝H0,差差异异无无统统计计学学意意义义,尚尚不不能能认认为为该该地地农村新生儿体重与该地新生儿平均体重不同。农村新生
5、儿体重与该地新生儿平均体重不同。2022/9/245本讲稿第五页,共四十九页如果在总体标准差如果在总体标准差0已知的情况下,样本均数与总体均数比较已知的情况下,样本均数与总体均数比较可用可用z检验,因为检验,因为z值符合标准正态分布,其计算公式为:值符合标准正态分布,其计算公式为:若若zz或或z;若若z或或zz/2,则,则P。z或或z/2值查值查t界值表,界值表,=栏即可。栏即可。2022/9/246本讲稿第六页,共四十九页 第二节第二节 配对设计均数的比较配对设计均数的比较 在在医医学学研研究究中中,为为了了减减少少误误差差,提提高高统统计计检检验验效效率率,我我们们常常常采用配对实验设计(
6、详见第三章)的方法。常采用配对实验设计(详见第三章)的方法。配对设计配对设计同源配对设计同源配对设计同质配对设计同质配对设计自身对照:治疗前后的比较。自身对照:治疗前后的比较。同一样品两种测试方法的比较。同一样品两种测试方法的比较。动物同窝别、同性别。动物同窝别、同性别。病人:同性别、同病情、同年龄病人:同性别、同病情、同年龄动物:同种属、同性别、同体重动物:同种属、同性别、同体重2022/9/247本讲稿第七页,共四十九页 配配对对资资料料的的t检检验验(paired samples t-test)先先求求出出各各对对子子的的差差值值d的的均均值值 ,若若两两种种处处理理的的效效应应无无差差
7、别别,理理论论上上差差值值d的的总总体体均均数数 应应为为0。所所以以这这类类资资料料的的比比较较可可看看作作是是样样本本均均数数 与与总总体体均均数数0的的比比较较。要要求求差差值值的的总体分布为正态分布。总体分布为正态分布。t检验的公式为:检验的公式为:公式中,公式中,为差数的均数,为差数的均数,Sd 为差数的标准差,为差数的标准差,为差数均数为差数均数的标准误。的标准误。=n-12022/9/248本讲稿第八页,共四十九页 例例8.2 对对24名名接接种种卡卡介介苗苗。胺胺同同年年龄龄、同同性性别别配配成成12对对,每每对对重重的的2名名儿儿童童分分别别接接种种两两种种结结核核菌菌素素,
8、一一种种为为标标准准品品,另另一一种种为为新新制制品品。72小小时时后后记记录录两两种种结结核核菌菌素素的的皮皮肤肤反反应应平平均均直直径径,数数据据见见表表8.1。问儿童对两种不同结核菌素的皮肤反应直径有无不同?。问儿童对两种不同结核菌素的皮肤反应直径有无不同?(1)建立检验假设)建立检验假设,确定检验水准,确定检验水准 H0:,儿童的皮肤反应直径无差别儿童的皮肤反应直径无差别 H1:,儿童的皮肤反应直径有差别儿童的皮肤反应直径有差别2022/9/249本讲稿第九页,共四十九页(2)计算)计算t值值 本例本例n=12,d=39,d2=195,=d/n=39/12=3.25(mm)(3)确确定
9、定P值值,作作出出推推断断结结论论 =n-1=12-1=11,t界界值值表表,得得t0.001/2,11=4.437,现现tt0.001/2,11,故故P0.001。按按水水准准,拒拒绝绝H0,接接受受H1,差差异异有有统统计计学学意意义义。可可以以认认为为两两种种不不同同结结核核菌菌素素对对儿儿童童的的皮皮肤肤反反应应直直径径有有差别,新制品反应小于标准品差别,新制品反应小于标准品。2022/9/2410本讲稿第十页,共四十九页第三节第三节 两样本均数比较两样本均数比较 两本均数比较的两本均数比较的t检验亦称为成组检验亦称为成组t检验,又称为独立样本检验,又称为独立样本t检验检验(indep
10、endent samples t-test)。)。适用于比较按完全随机设计而得到适用于比较按完全随机设计而得到的两组资料,比较的目的是推断两样本均数各自所代表的总体均的两组资料,比较的目的是推断两样本均数各自所代表的总体均数数1和和2是否相等。两样本含量可以相等也可以不相等,但在总例数不是否相等。两样本含量可以相等也可以不相等,但在总例数不变的条件下,当两样本含量相等时,统计检验的效率最高。本检验要求:变的条件下,当两样本含量相等时,统计检验的效率最高。本检验要求:两总体分布为正态分布,且方差齐同两总体分布为正态分布,且方差齐同 .2022/9/2411本讲稿第十一页,共四十九页 一、两样本均
11、数比较的一、两样本均数比较的t检验检验 式中,式中,称为两均数之差的标准误的估计值,其计算公称为两均数之差的标准误的估计值,其计算公式为式为式中,式中,S2称为两均数合并的方差,计算公式为:称为两均数合并的方差,计算公式为:=n1+n2-12022/9/2412本讲稿第十二页,共四十九页上式如果上式如果n1=n2,则,则2022/9/2413本讲稿第十三页,共四十九页 例例8.3 某某医医生生研研究究血血清清白白介介素素-6(IL-6)与与银银屑屑病病的的关关系系,见见表表8.2结结果。问银屑病患者与正常人的血清果。问银屑病患者与正常人的血清IL-6平均水平是否不同?平均水平是否不同?表表8.
12、2 银屑病组与正常对照组的血清银屑病组与正常对照组的血清IL-6(pg/mL)组别组别例数例数均数均数标准差标准差银屑病组银屑病组正常人组正常人组1212182.4149.727.719.52022/9/2414本讲稿第十四页,共四十九页(1)建立检验假设)建立检验假设 ,确定检验水准确定检验水准 H0:,银屑病患者与正常人的血清银屑病患者与正常人的血清IL-6均数相同均数相同 H1:,银屑病患者与正常人的血清银屑病患者与正常人的血清IL-6均数不同均数不同(2)计算)计算t值值 本例本例n1=n2,即可按下式计算即可按下式计算t值。值。2022/9/2415本讲稿第十五页,共四十九页 (3)
13、确定)确定P值值 作出推断结论作出推断结论 =12+12-2=22,查,查t界值表,得界值表,得t0.005/2,22=3.119,t0.001/2,22=3.505,现现t0.005/2,22tP0.002。按按水准,拒绝水准,拒绝H0,接受接受H1,差异有统计学意义。可以认为,差异有统计学意义。可以认为银屑病银屑病患者与正常人的血清患者与正常人的血清IL-6平均水平不同,银屑病患者血清平均水平不同,银屑病患者血清IL-6平均水平均水平较高平较高。当两样本含量当两样本含量n1和和n2均大于均大于50时,时,t分布非常接近分布非常接近z分布,近似可分布,近似可按下式计算在按下式计算在z值:值:
14、z或或z/2值查值查t界值表界值表,=栏即可。栏即可。2022/9/2416本讲稿第十六页,共四十九页二、二、两样本几何均数两样本几何均数t检验检验 比较两样本几何均数的目的是推断它们各自代表的总体几何均比较两样本几何均数的目的是推断它们各自代表的总体几何均数有无差异。适用于:数有无差异。适用于:观察值呈等比关系,如血清滴度;观察值呈等比关系,如血清滴度;观观察值呈对数正态分布,如人体血铅含量等。两样本几何均数比较察值呈对数正态分布,如人体血铅含量等。两样本几何均数比较的的t检验公式与两样本均数比较的检验公式与两样本均数比较的t检验公式相同。只需将观察检验公式相同。只需将观察X用用lgX来代替
15、就行了。来代替就行了。例例 将将2020名名钩钩端端螺螺旋旋体体病病人人的的血血清清随随机机分分为为两两组组,分分别别用用标标准准株株和和水水生生株株作作凝凝溶溶试试验验,抗抗体体滴滴度度的的倒倒数数(即即稀稀释释度度)结结果果如如下下。问两组抗体的平均效价有无差别?问两组抗体的平均效价有无差别?2022/9/2417本讲稿第十七页,共四十九页标准株标准株(11人人):100 200 400 400 400 400 800 1600 1600 1600 3200水生株水生株(9人人):100 100 100 200 200 200 200 400 1600(1)建立检验假设,确定检验水准)建立
16、检验假设,确定检验水准 H0:,即两组对数值的总体均数相等。即两组对数值的总体均数相等。H1:,即两组对数值的总体均数不等。即两组对数值的总体均数不等。=0.05。2022/9/2418本讲稿第十八页,共四十九页(2)计算)计算t值值 将两组数据分别取对数,记为将两组数据分别取对数,记为x1,x2。x1:2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 3.204 3.505 x2:2.000 2.000 2.000 2.301 2.301 2.301 2.301 2.602 3.204用变换后的数据计算用变换后的数据计算 ,s1,s2
17、得:得:=2.7935,s1=0.4520,=2.3344,s2=0.3821,n1=11,n2=92022/9/2419本讲稿第十九页,共四十九页 (3)确定确定P值值 作出推断结论作出推断结论=11+9-2=18,查查t界值表,得界值表,得t0.05/2,18=2.011,t0.02/2,18=2.552,现现t0.05/2,18tP0.02。按按=0.05水准,拒绝水准,拒绝H0,接受接受H1,差异有统计学意义。可认为两组差异有统计学意义。可认为两组抗体的平均效价不同,标准株高于水生株。抗体的平均效价不同,标准株高于水生株。2022/9/2420本讲稿第二十页,共四十九页第四节第四节 正
18、态性检验和两总体方差的齐性检验正态性检验和两总体方差的齐性检验 一、正态性检验一、正态性检验 正态性检验只介绍以下基本概念。定量资料的假设检验方法,如正态性检验只介绍以下基本概念。定量资料的假设检验方法,如t 检检验、验、F检验检验等大都要求资料服从于正态分布,通过频数分布表可等大都要求资料服从于正态分布,通过频数分布表可近似的看出资料的分布形态,但要确定资料是否为正态分布要通近似的看出资料的分布形态,但要确定资料是否为正态分布要通过假设检验的方法。过假设检验的方法。(一)图示法(一)图示法:常用的图示法包括常用的图示法包括P-P图法和图法和Q-Q图法。图中数据图法。图中数据呈直线关系可认为呈
19、正态分布,不呈直线关系可认为呈偏态分布。呈直线关系可认为呈正态分布,不呈直线关系可认为呈偏态分布。主要通过主要通过SAS或或SPSS统计软件实现的。统计软件实现的。2022/9/2421本讲稿第二十一页,共四十九页2022/9/2422本讲稿第二十二页,共四十九页 (二二)统计检验法统计检验法 1.W检验和检验和D检验:检验:两种方法的检验假设为:两种方法的检验假设为:H0:样本来自正态分布,:样本来自正态分布,H1:样本不来自正态分布。:样本不来自正态分布。由于两种方法的计算公式繁琐,一般用由于两种方法的计算公式繁琐,一般用SAS或或SPSS统计软件处理,统计软件处理,当当P0.05,则不拒
20、绝,则不拒绝H0;P0.05,则拒绝,则拒绝H0。注意:注意:SAS规定,当样本含量规定,当样本含量n 2000时,以时,以W检验结果为准;检验结果为准;当样本含量当样本含量n 2000时,以时,以D检验结果为准。检验结果为准。2022/9/2423本讲稿第二十三页,共四十九页 如例4.2 120名9岁男孩的肺活量资料,通过SAS进行正态性检验,其结果如下:2022/9/2424本讲稿第二十四页,共四十九页 2.2.矩法检验矩法检验 分别对总体分布的偏度和峰度进行检验。分别对总体分布的偏度和峰度进行检验。(1)偏度检验:偏度检验:主要计算偏度系数(主要计算偏度系数(coefficient of
21、 skewness,SKEW),一般用),一般用g1来表示。检验假设为:来表示。检验假设为:H0:G1=0,总体分布对称,总体分布对称 H1:G10,总体分布不对称。,总体分布不对称。2022/9/2425本讲稿第二十五页,共四十九页 (2)峰度检验峰度检验 主要计算峰度系数(主要计算峰度系数(coefficient of kurtosis,KURT),一般用),一般用g2来表示。检验假设为:来表示。检验假设为:H0:G2=0,总体分布为正态峰,总体分布为正态峰 H1:G20,总体分布不是正态峰,总体分布不是正态峰 G2=0,为标准正态峰;,为标准正态峰;G20,为尖峭峰;,为尖峭峰;G20.
22、05时,不拒绝时,不拒绝H0;P0.05时,时,拒绝拒绝H0。一般认为两种检验方法均为。一般认为两种检验方法均为P0.05时,才能认为总体分布时,才能认为总体分布为正态分布。为正态分布。2022/9/2427本讲稿第二十七页,共四十九页 二、两样本方差的齐性检验二、两样本方差的齐性检验 两样本均数比较的两样本均数比较的t检验,要求相应的两总体方差相等,即方差齐检验,要求相应的两总体方差相等,即方差齐性性(homogeneity of variance)。两样本方差两样本方差 和和 分别是两总体方差分别是两总体方差 和和 的无偏估计。即使的无偏估计。即使 ,但由于抽样误差的关系,两样本方差也很,
23、但由于抽样误差的关系,两样本方差也很少相等,但相差不会很大,当两样本方差相差较大时,需作方差齐性检验,少相等,但相差不会很大,当两样本方差相差较大时,需作方差齐性检验,以推断两总体方差是否相等。常用以推断两总体方差是否相等。常用F 检验,其计算公式为:检验,其计算公式为:2022/9/2428本讲稿第二十八页,共四十九页,式式中中 为为较较大大的的样样本本方方差差,为为较较小小的的样样本本方方差差,分分子子的的自自由由度度为为 ,分分母母的的自自由由度度为为 ,相相应应的的样样本本例例数数分分别别为为n1和和n2。F值值是是两两个个样样本本方方差差之之比比,如如仅仅是是抽抽样样误误差差的的影影
24、响响,它它一一般般不不会会离离1太太远远,反反之之,F 值值较较大大,两两总总体体方方差差相相同同的的可可能能性性较较小小。F分分布布就就是是反反映映此此概概率率的的分分布布。求求得得F值值后后,查查附附表表4,F界界值值表表得得P值值,F,不不拒拒绝绝H0,可可认认为为两两总总体体方方差差相相等等;FF/2(1,2),则则P,拒拒绝绝H0,可认为两总体方差不等。,可认为两总体方差不等。2022/9/2429本讲稿第二十九页,共四十九页 方方差差齐齐性性检检验验应应为为双双侧侧检检验验,但但规规定定的的是是较较大大的的方方差差除除以以较较小小的的方方差差,其其F值值必必然然大大于于1,另另外外
25、F界界值值表表只只规规定定单单侧侧为为0.05和和0.01的的界界值值,F0.05(1,2)=F0.10/2(1,2),所所以以方方差差齐齐性性检检验验一一般般定定检检验水准验水准=0.10。注注意意:当当样样本本含含量量较较大大时时(如如n1和和n2均均大大于于50),可可不不必必作作方方差齐性检验。差齐性检验。例例8.68.6 由由X X线线胸胸片片上上测测得得两两组组患患者者的的肺肺门门横横径径右右侧侧距距R R1 1值值 (cm)(cm),计计算的结果如下,比较其方差是否齐性?算的结果如下,比较其方差是否齐性?肺癌患者肺癌患者:n1=10,=6.21(cm),S1=1.79(cm)矽肺
26、患者:矽肺患者:n2=50,=4.34(cm),S2=0.56(cm)2022/9/2430本讲稿第三十页,共四十九页(1)建立检验假设建立检验假设,确定检验水准确定检验水准 H0:,即两总体方差相等。即两总体方差相等。H1:,即两总体方差不等。即两总体方差不等。=0.10(2)计算)计算F值值(3)确定)确定P值值 作出推断结论作出推断结论 本例本例1=10-1=9,2=50-1=49,查附查附表表4,F界值表,界值表,F0.10/2(9,49=2.80,得,得P0.05,按按=0.10,拒绝拒绝H0,接接受受H1,故可认为两总体方差不齐。故可认为两总体方差不齐。2022/9/2431本讲稿
27、第三十一页,共四十九页第五节第五节 t 检验和变量变换检验和变量变换 方方差差不不齐齐时时,两两小小样样本本均均数数的的比比较较,可可选选用用以以下下方方法法:采采用用近近似似法法t 检检验验;采采用用适适当当的的变变量量变变换换,使使达达到到方方差差齐齐的的要要求求;采用秩和检验。采用秩和检验。一、一、t检验检验 t检检验验又又称称为为近近似似t检检验验,常常用用的的方方法法是是Cochran&Cox法法和和Satterthwaite法。法。Cochran&Cox法法近似近似t检验检验 该该法是对临界值的校正。法是对临界值的校正。2022/9/2432本讲稿第三十二页,共四十九页例例8.5
28、由由X线胸片上测得两组患者的肺门横径右侧距线胸片上测得两组患者的肺门横径右侧距R1值值(cm),计算,计算的结果如下,已知总体方差不齐,用的结果如下,已知总体方差不齐,用t检验进行两样本均数的比较检验进行两样本均数的比较 肺癌患者:肺癌患者:n1=10,=6.21(cm),S1=1.79(cm)矽肺患者:矽肺患者:n2=50,=4.34(cm),S2=0.56(cm)2022/9/2433本讲稿第三十三页,共四十九页 (1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:1=2,两组病人,两组病人R1值的总体均数相等值的总体均数相等 H1:12,两组病人,两组病人R1值的总体均数不
29、等值的总体均数不等 =0.05 (2)计算计算t值和值和 界值界值 1=10-1=9,2=50-1=49,查附表查附表3,t界值表,得界值表,得t0.05/2,9=2.262,双侧双侧t0.05/2,49=2.009,代入公式计算,代入公式计算 值。值。2022/9/2434本讲稿第三十四页,共四十九页(3)确定确定P值值 作出推断结论作出推断结论 本例本例 t ,则则P0.05,按按=0.05水准,水准,拒绝拒绝H0,差异有统计学意义,可以认为两种病人的差异有统计学意义,可以认为两种病人的R1值不同。值不同。当当1=2=时,时,可直接根据由附表可直接根据由附表3,t界值表查出,而不界值表查出
30、,而不需要计算。需要计算。2022/9/2435本讲稿第三十五页,共四十九页 Satterthwaite法近似法近似t检验检验 该法是对自由度该法是对自由度校正。校正。上例资料的计算为2022/9/2436本讲稿第三十六页,共四十九页以以=9查查 t界值表,界值表,t0.01/2,9 t t0.005/2,9,故,故0.005P0.01,按按=0.05水水准,拒绝准,拒绝H0,差异有统计学意义,可以认为两种病人的差异有统计学意义,可以认为两种病人的R1值不同。两值不同。两种方法统计学结论相同。种方法统计学结论相同。的计算公式亦可看出:的计算公式亦可看出:当当n1=n2时,时,=1=2,而不需要
31、计算。,而不需要计算。2022/9/2437本讲稿第三十七页,共四十九页 二、变量变换二、变量变换 但资料不服从正态分布或总体方差不齐时,不能直接进行但资料不服从正态分布或总体方差不齐时,不能直接进行t检检验、验、F检验等,解决的方法之一就是将原始数据进行数学函数的变检验等,解决的方法之一就是将原始数据进行数学函数的变换,使变换后的数据符合正态分布和方差齐性的要求,在进行换,使变换后的数据符合正态分布和方差齐性的要求,在进行t检检验、验、F检验。常用的变量变换的方法有以下几种:检验。常用的变量变换的方法有以下几种:1.对数变换对数变换(logarithmic transformation)将原
32、始数据将原始数据X取自然对取自然对数或常用对数,将对数值作为新的分析数据。数或常用对数,将对数值作为新的分析数据。2022/9/2438本讲稿第三十八页,共四十九页 Y=lnX 或或 Y=lgX 如果数据包含如果数据包含0或太小的数值,可取或太小的数值,可取 Y=ln(X+k)或或 Y=lg(X+k)对数变换适用于:对数变换适用于:对数正态分布资料,如抗体滴度资料,疾对数正态分布资料,如抗体滴度资料,疾病潜伏期等;病潜伏期等;几组资料的标准差与均数的比值都比较接近,用来几组资料的标准差与均数的比值都比较接近,用来消除方差不齐。消除方差不齐。例如一组抗体滴度资料:例如一组抗体滴度资料:100 2
33、00 400 400 400 400 800 1600 1600 1600 3200 用用SAS统计分析作正态性检验统计分析作正态性检验2022/9/2439本讲稿第三十九页,共四十九页经对数转换后:经对数转换后:2022/9/2440本讲稿第四十页,共四十九页 又如两组数据:又如两组数据:一组:一组:0.24 0.54 0.50 0.34 0.40 0.76 0.30 0.20 =0.410 ,S1=0.1841 ,二组:二组:1.99 0.99 1.22 1.17 1.96 0.71 1.25 1.23 =1.315,S2=0.4447 SAS统计软件分析两组是否方差齐性统计软件分析两组是
34、否方差齐性2022/9/2441本讲稿第四十一页,共四十九页对原始数据作对原始数据作lg(X+1)变换后:变换后:S1=0.055,S2=0.081,2.平方根变换(平方根变换(square root transformation)将原始数据将原始数据X的平方的平方根作为新的分析数据。根作为新的分析数据。2022/9/2442本讲稿第四十二页,共四十九页 当原始数据中有太小值或零值时,可用下式:当原始数据中有太小值或零值时,可用下式:或或 平方根变换适用于:平方根变换适用于:使服从使服从Poisson分布的分类资料或轻度偏态分布的分类资料或轻度偏态的的资料正态化;的的资料正态化;当各样本的方差
35、与均数呈正相关时,可是资料达到当各样本的方差与均数呈正相关时,可是资料达到方差齐性的要求。方差齐性的要求。例例 小白鼠按不同处理分为三组,在注射某同位素小白鼠按不同处理分为三组,在注射某同位素24小时后,小时后,测定脾脏蛋白质中的放射性次数见下表。问:该资料是否方差齐性测定脾脏蛋白质中的放射性次数见下表。问:该资料是否方差齐性?若不能试作适当变换。?若不能试作适当变换。2022/9/2443本讲稿第四十三页,共四十九页表表 三组小白鼠脾脏蛋白质中放射性(次三组小白鼠脾脏蛋白质中放射性(次/分分.克)克)X对照组对照组芥子气芥子气中毒组中毒组电离辐电离辐射组射组对照组对照组芥子气芥子气中毒组中毒
36、组电离辐电离辐射组射组 3.8 9.0 2.5 8.2 7.111.011.5 9.011.0 7.95.64.03.08.03.84.06.44.24.07.01.53.85.52.03.05.13.34.02.12.71.94943.00001.58112.86362.66463.31663.39123.00003.31662.81072.36642.00001.73202.86361.94942.00002.52982.04942.00002.64581.22471.94942.34521.41421.73202.25831.81662.00001.44911.64328.18.9889
37、1.10975.02.71110.52663.31.73780.52662.78940.35490.12722.21010.12820.05801.78330.13320.07472022/9/2444本讲稿第四十四页,共四十九页 数据变换前,存在均数大方差也大,均数小方差宜小;数据转数据变换前,存在均数大方差也大,均数小方差宜小;数据转换后,此现象基本消除。换后,此现象基本消除。数据变换前,数据变换前,SAS统计分析方差齐性检验结果:统计分析方差齐性检验结果:数据变换后,数据变换后,SAS统计分析方差齐性检验结果:统计分析方差齐性检验结果:2022/9/2445本讲稿第四十五页,共四十九页
38、3.倒数变换(倒数变换(reciprocal transformation)Y=1/X 常用于数据两端波动较大的资料,减少极端值的影响。常用于数据两端波动较大的资料,减少极端值的影响。4.平方根反正旋变换(平方根反正旋变换(arcsine square root transformation)将百将百分率分率p取平方根后,再计算反正旋的值。取平方根后,再计算反正旋的值。2022/9/2446本讲稿第四十六页,共四十九页 平方根反正旋变换主要适用于率和百分比的资料。百分率服从二平方根反正旋变换主要适用于率和百分比的资料。百分率服从二项分布,特别是当百分率偏离项分布,特别是当百分率偏离50%较远,如大于较远,如大于70%或小于或小于30%时,二时,二项分布偏离正态分布较远。项分布偏离正态分布较远。当当p=0时可用下式:时可用下式:当当p=100%时可用下式:时可用下式:2022/9/2447本讲稿第四十七页,共四十九页思考题思考题1.t检验的应用条件是什么?检验的应用条件是什么?2.t检验是减少了检验是减少了型错误还是型错误还是错误?错误?3.变量变换的目的是什么?变量变换的目的是什么?4.四种变量变换方法各适合于什么类型资料?四种变量变换方法各适合于什么类型资料?2022/9/2448本讲稿第四十八页,共四十九页2022/9/2449本讲稿第四十九页,共四十九页