《医学研究生医学统计学非参数检验.pptx》由会员分享,可在线阅读,更多相关《医学研究生医学统计学非参数检验.pptx(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/2/221/62参数统计参数统计(parametric statistics)是以样本来自某已知分布总体(如正态分布、t分布、F分布等)为假设基础,对总体参数(如总体均数、总体方差等)进行估计或检验的方法。第1页/共70页2023/2/222/62在实践中常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等,这类资料:1.资料的总体分布类型未知;2.或某些变量可能无法精确测量:疼痛程度无、轻度、中度、重度疾病治疗结果控制、显效、有效、无效。第2页/共70页2023/2/223/62非参数统计非参数统计(nonparam
2、etric statistics)是一种不依赖于总体分布类型,不考虑被研究对象为何种分布以及分布是否已知的统计推断方法,此类方法通常不涉及研究对象的参数。这时统计推断是比较分布而不是参数。第3页/共70页2023/2/224/62非参数统计的基本思想一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中所占的位置和次序,称为秩(rank)。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。第4页/共70页2023/2/225/62非参数统计方法的优缺点优点:l适用范围广:对变量的类型和分布无特殊要求。l对数据要求不严:对某些指
3、标不便准确测定,只能以严重程度,优劣等级,先后次序等作记录的资料也可应用。l对样本量无严格要求。缺点:l对于符合参数检验的资料如果用非参数检验,由于没有充分利用资料提供的信息,故检验效能低于参数检验,若要使检验效能相同,往往需要更大的样本含量。第5页/共70页2023/2/226/62应用范围:对于计量资料:1.不满足正态和方差齐性条件的小样本资料;2.分布不明的小样本资料;3.一端或两端是不确定数值(如或某一数值)的资料。对于等级资料:若选行列表资料的 2检验,只能推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。第6页/共70页2023/2/227/62WilcoxonWilco
4、xon于 19451945年 提 出的 符 号 秩 和 检 验(Wilcoxon(Wilcoxon singned-rank singned-rank test)test),亦 称符号秩检验,可用以推断总体中位数是否等于某已知数值,也可推断配对样本差值的总体中位数是否为0 0。第一节 单样本和配对设计资料的符号秩和检验第7页/共70页2023/2/228/62一、单样本资料的符号秩和检验Wilcoxon符符号号秩秩和和检检验验常常用用于于不不满满足足t检检验验条条件件的的单单样样本本定定量量资资料料的的比比较较。其其目目的的是是推推断断样样本中位数与已知总体中位数是否相等。本中位数与已知总体中
5、位数是否相等。例例 1:已已 知知 某某 地地 正正 常常 人人 尿尿 铅铅 含含 量量 的的 中中 位位 数数 为为2.50m mmol/L。今今在在该该地地随随机机抽抽取取16名名工工人人,测测得得尿尿铅铅含含量量,问问该该厂厂工工人人的的尿尿铅铅含含量量是是否否高高于于当当地正常人?地正常人?第8页/共70页2023/2/229/62表1 161 16名工人与当地正常人到尿铅含量(mol/Lmol/L)测定结果尿铅含量(尿铅含量(X X)尿铅含量(尿铅含量(X X)0.620.623.133.130.780.783.273.272.132.133.543.542.482.484.384.
6、382.542.544.384.382.682.685.055.052.732.736.086.083.013.0111.2711.27第9页/共70页2023/2/2210/62尿铅含量的直方图第10页/共70页2023/2/2211/621.建立检验假设,确定检验水准H0:差值的总体中位数等于0,即该厂工人的尿铅含量与正常人相同H1:差值的总体中位数大于0,即该厂工人的尿铅含量高于正常人a a=0.05第11页/共70页2023/2/2212/622.计算检验统计量T值(1)求差值(2)编秩差值为0/差值的绝对值相同(3)分别求正、负秩和(4)确定检验统计量:任意取T+或T-第12页/共7
7、0页2023/2/2213/62表2 162 16名工人与当地正常人到尿铅含量(mol/Lmol/L)测定结果尿铅含量(尿铅含量(X X)差值(差值(d d)秩次秩次尿铅含量(尿铅含量(X X)差值(差值(d d)秩次秩次0.620.621.88123.133.130.6370.780.781.72103.273.270.7782.132.130.3753.543.541.0492.482.480.0214.384.381.88122.542.540.0424.384.381.88122.682.680.1835.055.052.55142.732.730.2346.086.083.58153
8、.013.010.51611.2711.278.7716第13页/共70页2023/2/2214/62编秩:将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,如差值的绝对值为1.88的有3个,它们的位次是11、12、13,取平均秩次为(11+12+13)/3=12。编秩时如遇差值为0,则舍去不计。第14页/共70页2023/2/2215/623.确定P值,并做出推断结论(1)查表法5n50,判断原则:内大外小本例,n=16,T=28或T=108,查用T界值表,得0.01P50时)超出附表9范围,可用正态近似法作u检验。第16页/共70页2023
9、/2/2217/62若多次出现相持现象(如超过25%),求得的Z值偏小,应计算校正的统计量值Zc。式中tj为第j(j=1,2)个相同秩次的个数。如有2个差值的绝对值为2.5,则t1=2;有3个差值均为5,则t2=3。于是,(23-2)+(33-3)第17页/共70页2023/2/2218/62二、配对设计资料的符号秩和检验目的是推断配对样本差值的总体中位数是否与0有差别,即两个总体中位数是否有差别。例2:对11份工业污水测定氟离子浓度(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表。问就总体而言,这两种方法的测定结果有无差别?第18页/共70页表3两法测定11份工业污水中氟离子浓
10、度结果样品号样品号氟离子浓度(氟离子浓度(mg/Lmg/L)差值差值 d d秩次秩次-1-1电极法电极法(2)(2)分光光度法分光光度法(3)(3)-4-4-5-51 110.510.58.88.81.71.74 42 221.621.618.818.82.82.89 93 314.914.913.513.51.41.43 34 430.230.227.627.62.62.68 85 58.48.49.19.10.70.71.51.56 67.77.77 70.70.71.51.57 716.416.414.714.71.71.75 58 819.519.517.217.22.32.36 69
11、 912712715515528.028.01010101018.718.716.316.32.42.47 711119.59.59.59.50 0第19页/共70页2023/2/2220/62本例配对样本差值经正态性检验,推断得总体不服从正态分布,现用Wilcoxon符号秩检验。1.建立检验假设,确定检验水准H0:差值的总体中位数等于0H1:差值的总体中位数不等于0a a=0.052.求检验统计量T值(1)求差值(2)编秩(3)求秩和(4)确定统计量第20页/共70页2023/2/2221/623.确定P值,作出推断查表法5n 50,查T界值表(附表9)任取正秩和或负秩和为T,本例为T=11
12、.5或T=43.5。P0.10,按照a a=0.05=0.05水准不拒绝H H0 0,尚不能认为两法测定结果有差别。第21页/共70页2023/2/2222/62第二节 两组独立样本比较的秩和检验理论上零假设H0为两总体分布相同,即两样本来自同一总体;其对立假设H1为两总体分布不同。秩和检验对两总体分布形状的差别不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总体分布形状是否有差别,故H1不能为两总体分布不同,而是两总体分布位置不同,简化为两总体的中位数相等。第22页/共70页2023/2/2223/62一、定量变量两组独立样本的秩和检验例3:用两种药物杀灭钉螺,每批用200300只
13、钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),问两种药物杀灭钉螺的效果有无差别?第23页/共70页2023/2/2224/62甲药乙药死亡率(%)秩次死亡率(%)秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5表4 两种药物杀灭钉螺死亡率(%)的比较第24页/共70页2023/2/2225/621.建立检验假设,确定检验水准H0:两种药物杀灭钉螺死亡率的总体中位数相等H1:两种药物杀灭钉螺死亡率的总体中位数不相等a a=0.05第2
14、5页/共70页2023/2/2226/622.计算检验统计量T值(1)编秩把两样本数据混合从小到大编秩,同组/不同组;(2)求各组秩和以样本例数小者为n1,其秩和为T1,(3)确定检验统计量T值:若n1n2,则T=T1;若两样本例数相等,可任取一样本的秩和本例n1=n2,可取T=T1=71.5或T=T2=33.5。第26页/共70页2023/2/2227/62甲药乙药死亡率(%)秩次死亡率(%)秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=3
15、3.5表4 两种药物杀灭钉螺死亡率(%)的比较第27页/共70页2023/2/2228/623.确定P值,作出推断(1)查表法查T界值表(成组设计用)n1=7,n2-n1=0,T=71.5或T=33.50.01P10或n2-n110第29页/共70页2023/2/2230/62二、有序分类变量两组独立样本的秩和检验例4:某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿,测定体内核黄素含量,试比较该地居民夏冬两个季节体内核黄素含量有无差别?表5某地居民夏冬两个季节体内核黄素营养状况比较核黄素核黄素营养状况营养状况例数例数合计合计秩次
16、范围秩次范围平均秩次平均秩次夏季夏季冬季冬季缺乏缺乏10223213216.5不足不足141832336448.5适宜适宜16420658474.5合计合计404484 第30页/共70页2023/2/2231/621.建立检验假设,确定检验水准H0:夏冬两个季节居民体内核黄素含量的总体中位数相等H1:夏冬两个季节居民体内核黄素含量的总体中位数不相等a a=0.052.计算检验统计量T值(1)编秩:先确定各等级的合计、秩范围和平均秩(2)求各组秩和(3)确定检验统计量T值T1=16.510+48.514+74.516=2036T2=16.522+48.518+74.54=1534T=T1=20
17、36第31页/共70页2023/2/2232/623.确定P值,作出推断本例n1=40,超出T界值表可查范围,用正态近似法。两独立样本的非参检验:Mann-WhitneyU检验(SPSS)和Wilcoxon秩和检验是等价的。第32页/共70页2023/2/2233/62第三节 多组独立样本比较的秩和检验一、定量变量多组独立样本的秩和检验二、有序变量多组独立样本的秩和检验三、多个独立样本间的多重比较Kruskal-WallisH检验第33页/共70页一、定量变量多组独立样本的秩和检验例5 5:某医院用3 3种不同方法治疗1515例胰腺癌患者,每种方法各治疗5 5例。治疗后生存月数见表,问这3 3
18、种方法对胰腺癌患者的疗效有无差别?表6 36 3种方法治疗胰腺癌患者的生存月数比较甲法甲法乙法乙法丙法丙法生存月数生存月数秩次秩次生存月数生存月数秩次秩次生存月数生存月数秩次秩次32.566214491232.577.5101355810121477.58101315810Ri346026ni555第34页/共70页2023/2/2235/621.建立检验假设,确定检验水准H0:3种方法治疗后患者生存月数的中位数相等H1:3种方法治疗后患者生存月数的中位数不全相等a a=0.052.计算检验统计量H值(1)编秩三组统一编秩,相同数据同一组,可顺次编秩;在不同组,求平均秩次。(2)求各组秩和第3
19、5页/共70页2023/2/2236/62(3)确定检验统计量H值:若相持较多(如超过25%),应计算校正值第36页/共70页2023/2/2237/623确定P值,做出推断(1)当组数k=3,ni5,可查附表11中的界值,H的临界值等于5.78,P0.05,拒绝H0,接受H1,故可认为3种方法治疗后胰腺癌患者的生存月数有差别。(2)当不满足条件(1)时,近似地服从自由度为k-1的 2分布,可查附表8的 2界值表得到P值。Kruskal-WallisH检验的基本思想类似于单因素方差分析。相当于将秩次看做原始数据进行比较。第37页/共70页2023/2/2238/62二、有序变量多组独立样本的秩
20、和检验例6:某医院用3种方法治疗慢性喉炎,结果见表7。问这3种方法的疗效是否有差别?表73种方法治疗慢性喉炎的疗效比较疗效等级疗效等级例数例数秩次范围秩次范围平均秩次平均秩次甲法甲法乙法乙法丙法丙法合计合计无效无效 2420206416432.5好转好转261622646512896.5显效显效722414110129238183.5治愈治愈1863222240239478358.5合计合计3089278478第38页/共70页2023/2/2239/621.建立检验假设,确定检验水准H0:3种方法疗效的总体分布位置相同H1:3种方法疗效的总体分布位置不全相同a a=0.052.计算检验统计量
21、H值(1)编秩:先计算各等级的合计,再确定秩次范围及平均秩次。(2)求各组秩和如本例.第39页/共70页2023/2/2240/62疗效等级疗效等级例数例数秩次范围秩次范围平均秩次平均秩次甲法甲法乙法乙法丙法丙法合计合计无效无效2420206416432.5好转好转261622646512896.5显效显效722414110129238183.5治愈治愈1863222240239478358.5合计合计3089278478表7 3种方法治疗慢性喉炎的疗效比较第40页/共70页2023/2/2241/62(3)计算检验统计量H由于相持较多,故需校正。第41页/共70页2023/2/2242/62
22、3确定P值并做出推断结论k=3,各组例数均大于5,近似服从n n=k-1=2的 2分布。查 2界值表,得P15或g15时,超出附表12的范围,可用 2近似法,按下式计算 2值。第51页/共70页2023/2/2252/62当各区组间相同的秩次较多时,须进行校正:式中t为各区组内第j个具有相同秩次的个数,n为配伍组数,g为处理组数。由于C1,故校正的 2对应的P值减小。在下列情况下校正的意义较大:相同数据的个数在各配伍组中所占比重较大时;所得P值在检验水准附近时。第52页/共70页2023/2/2253/62(三)F近似法:当区组个数较多时,还可近似用秩转换的F检验1.对每个区组数据由小到大分别
23、编秩次,相同数据取平均秩次,得到每个数据的秩次Tng2.计算各处理组的秩和Tg。3.计算所有秩次的平方和AA=T2ij,或者A=ng(g+1)(2g+1)/64.计算各处理组秩次平方和的均值B:B=(T2)ij5.计算F值:6.确定P值:以n1=g-1,n2=(g-1)(n-1)查方差分析用F界值表。第53页/共70页2023/2/2254/62二、随机区组多个样本两两比较的检验(一)M检验后的两两比较当经过多个相关样本比较的FriedmanM检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。第54页/共70页2023/2/2255/6
24、2(二)F检验后的两两比较1.计算处理组秩和Ti;2.计算各对比组秩和的差值绝对值|TA-TB|;3.计算在a a检验水准下的界值Ca a;4.确定概率P值:若|TA-TB|Ca a,则Pa a;|TA-TB|a a。第55页/共70页2023/2/2256/62 小结1.1.非参数检验在假设检验中不对参数作明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。当资料适用参数检验方法时,用非参常会损失部分信息,降低检验效能。2.2.秩秩和和检检验验是是通通过过对对数数据据依依小小到到大大排排列列秩秩次次,求求秩秩和和来来进进行行假假设设检检验验的的方方法法,可可用用于于两两独独立立样样
25、本本比比较较、配配对对资资料料比比较较、多多个个独独立立样样本本比较、随机配伍组比较等。比较、随机配伍组比较等。第56页/共70页2023/2/2257/623.正确应用秩和检验方法秩和检验既能分析定量变量资料,又能分析有序变量或等级变量资料,实际中要注意其应用条件。对于定量变量资料,如果符合参数检验方法的前提条件,要用参数统计方法,在不符合参数统计方法条件时,用秩和检验;对有序变量或等级变量资料,如果是疗效检验,用秩和检验,不用 2检验。第57页/共70页已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数 参数检验 (parametric test)非参数检验(nonp
26、arametric test)对总体的分布类型不作严格要求 不受分布类型的影响,比较的是总体分布位置 优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同第58页/共70页2023/2/2259/62SummarylWilcoxon符号秩检验:单样本资料、配对设计两样本比较(T/Z值)lWilcoxon秩和检验:两组独立样本比较(T/Z值)lKruskal-Wallis秩和检验:完全随机设计的多组样本比较(H/
27、2值)l多个独立样本间的两两比较(t检验/2值)lFriedman秩和检验:随机区组设计资料的多样本比较(M/2值)第59页/共70页2023/2/2260/62不同研究设计和数据类型的数据分析方法选择变量类型变量类型研究设计类型研究设计类型两组比较两组比较实验前后比较实验前后比较两组以上比较两组以上比较随机区组设计随机区组设计 数值变量数值变量 t检验检验配对配对t检验检验方差分析方差分析方差分析方差分析 分类变量分类变量 c c2 2检验检验配对配对c c2 2检验检验c c2 2检验检验 有序变量有序变量Mann-Whitney秩和检验秩和检验Wilcoxon符号秩和检验符号秩和检验Kr
28、uskal-WallisH H检验检验Friedman M检验检验c c2 2检验检验F F检验检验第60页/共70页2023/2/2261/62l了解:不同设计类型的秩和检验和相应t检验的功效有何不同。l熟悉:非参数统计的概念;不同设计类型的秩和检验方法。l掌握:不同设计类型的秩和检验的实施方法及其应用条件。教学要求第61页/共70页2023/2/2262/62练习第62页/共70页2023/2/2263/62单项选择:1以下检验方法除外,其余均属非参数方法。A.t检验B.H检验C.M检验D.2检验 E.符号秩和检验2两小样本定量资料比较的假设检验,首先应考虑。A.用t检验B.用秩和检验C.
29、资料符合t检验还是秩和检验的条件.D.t检验与秩和检验均可E.c2检验第63页/共70页2023/2/2264/623.在作等级资料的比较时,宜用。A.t检验B.2检验C.秩和检验D.F检验E.方差分析4.在作两样本均数比较时,已知n1、n2均小于30,总体方差不齐且极度偏峰的资料宜用。A.t检验B.t检验C.u检验D.秩和检验E.t检验与秩和检验均可5.三组比较的秩和检验,样本例数均为3,确定P值应查。A.2界值表B.H界值表 C.T界值表D.M界值表E.以上均不可第64页/共70页2023/2/2265/626.两样本秩和检验的H0是。A.两样本秩和相等B.两总体分布相同C.两样本分布相同
30、D.两总体秩和相等E.两总体分布无关7.在统计检验中是否选用非参数统计方法,。A.要根据研究目的和数据特征作决定B.可在算出几个统计量和得出初步结论后进行选择C.要看哪个统计结论符合专业理论D.要看哪个P值更小E.只看研究目的第65页/共70页2023/2/2266/62某医院用某种药物治疗某种疾病,不同病型病人的疗效如下表。某药物对三种病型的疗效比较疗效疗效病人数病人数A型型B型型C型型控制控制607051显效显效18176有效有效303623无效无效121811第66页/共70页2023/2/2267/62 A.A.2检验 B.B.校正 2检验 C.C.Wilcoxon秩和检验 D.D.K
31、ruskal-WallisH秩和检验 E.E.FriedmanM秩和检验9.9.欲说明该药物对哪种病型的疗效更好,应选用。10.10.欲说明该药物对三种病型疗效的构成有无不同,应选用。第67页/共70页2023/2/2268/62用非诺洛芬治疗不同类型关节炎的结果如下,试问该药治疗不同类型的关节炎疗效是否相同?表9非诺洛芬治疗不同类型关节炎疗效组别组别有效有效无效无效合计合计类风湿关节炎类风湿关节炎14025165风湿性关节炎风湿性关节炎502777骨性关节炎骨性关节炎182240合计合计20874282第68页/共70页2023/2/2269/62第69页/共70页2023/2/2270/62谢谢您的观看!第70页/共70页