研究生统计学讲义非参数检验与Ridit分析.pptx-淘文阁

资源描述

《研究生统计学讲义非参数检验与Ridit分析.pptx》由会员分享，可在线阅读，更多相关《研究生统计学讲义非参数检验与Ridit分析.pptx（67页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1研究生统计学讲义非参数检验与研究生统计学讲义非参数检验与Ridit分分析析非参数统计的优点是不受总体分布类型的限制，应用范围广，对数据的要求不象参数检验那样严格，不论定量变量和分类变量均可用非参数检验。非参数检验的不足之处是：对符合用参数统计的资料，用非参数检验(如两样本均数比较，符合检验条件时，用秩和检验)，一般犯第二类错误的概率比参数检验大，若要使相同，非参数检验要比参数检验需要更多的样本例数。故适合参数统计条件的资料，一般先选参数检验，若参数检验的应用条件得不到满足，才用非参数检验。用SPSS11.5 进行非参数检验，由主菜单Analysis下拉菜单中的Nonparametric

2、tests菜单导出，其中列出了8种非参数分析方法：第1页/共67页1.Chi-squaretest（2检验）：用2检验作同一样本中两个或多个构成比的比较，操作过程如例8.14，检验变量的几个取值所占百分比和期望的比例有无统计学差异。注意：该检验和一般用的2检验不一样，一般的2检验用Analyze中DescriptiveStatistics下拉菜单的Crosstable完成，而不是这里。具体见P143E8.15。2.BinomialTest（二项分布检验）：用于检验所给的变量是否符合二项分布，变量可以是两分类的，也可以是连续性变量，按给出的分界点检验。3.RunsTest（游程检验）：用于检验某

3、变量值的变化是否随机，是否是围绕着某个数值（如均数、中位数、众数或自定义数值）随机波动。操作过程如P154 例9.8、第2页/共67页4.1-SampleK-STest（即One-SampleKolmogorov-SmirnovTest单个样本的柯尔莫哥诺夫-斯米尔诺夫检验）：用于分析变量是否符合某种分布，可检验Normal（正态分布）、Uniform（均匀分布）、Poisson（Poission分布）和Exponential（指数分布）。操作过程如例3.1(血糖）中所做的探索性分析。5.2Independent-SamplesTests（两个独立样本检验）：完全随机设计的两样本均数比较的非参

4、数检验，操作过程如例11.3。6.KIndependentSamples（多个独立样本检验）：完全随机设计的多个样本均数比较的非参数检验，操作过程如例11.5第3页/共67页7、2Related-SamplesTests（两相关样本检验）：配对设计两样本均数的非参数检验。操作过程如例11.1、例9.1。8、KRelatedSamplesTest（多个相关样本检验）：配伍设计多个样本均数的非参数检验，操作如例11.7第二节配对设计资料的秩和检验(Wilcoxon法)所谓秩(rank),又称等级,实际上就是按数值大小顺序作1,2,3,等级的一种编码.秩和检验常用于有序分类变量或不符合用参数检验的资

5、料.两个或多个有序分类变量(等级资料)的比较,如临床疗效分为治愈,显效，好转,无效;尿糖分为,;针麻效果分为，级等.第4页/共67页可以列成2k表或RC表，用RC表的2检验比较差异，但2检验能说明各等级构成或各对比率是否相同，但不能说明对比各组疗效的优劣或针麻效果好坏等。而秩和检验与Ridit分析则可以起作用。配对设计资料的符号秩和检验（Wilcoxon法）不仅可用于配对比较，亦可用于样本中位数与总体中位数比较，基本思想是：若H0成立，则配对数值的差值应服从均数T:标准差T:T=n(n+1)/4，的对称分布,将配对的差值按绝对值大小编秩并标上原来差值的符号后,带正号、带负号的秩和在理论上是均匀

6、的,即使有些差别,也只是随机因素造成的差别,应在一定范围内。第5页/共67页如果正、负秩和相差悬殊，统计量T特别小或特别大，则H0为真的可能性很小，从T界值表(附表12)也可看出，当n确定以后，T界值的下限愈小，上限愈大时，P值愈小。因而可按小概率原理，拒绝H0；反之，不能拒绝H0。随着n增大，T分布逐渐逼近:均数:T=n(n1)/4，方差为:的正态分布。可用u检验。Wilcoxon法配对符号秩和检验对子数n必须大于5。因n5时，可以排出差值编秩的所有组成共有32种情况。当各配对的差值符号相同时，秩和绝对值较小者为0，较大者为15的5个自然数之和15，即T0或T15；其它情况下0T15；可知n

7、5时，T的取值范围是015，第6页/共67页而P(T0)P(T15)1/320.03125，双侧概率为0.031252 0.06250，已大于0.05。所以当n5时，用符号秩和检验不能得出双侧概率P0.05，以0.05水准不拒绝H0，差值总体中位数与0的差异有无统计意义，尚不能认为两法检测谷-丙转氨酶的结果不同。a.在n25 时，可查统计用表11，用T值与T界值进行比较若T值在上、下界范围内，则P值大于相应概率；若T值为上、下界值或范围外，则P值小于相应概率第8页/共67页在n25时，可用连续的u检验作不连续T分布的近似，即:在相同差值太多时（不包括差值为0），由于求得的u值偏小，要进行校正，

8、即ti为第i个相同秩次的个数第9页/共67页SPSS11.5，建立数据文件P147E1.sav,Analyze，NonparametricTests，2RelatedSamples解法2:软件计算第10页/共67页表中显示：按y-x的正秩输出，检验统计量Z=-1.913，双侧大约概率P=0.056，故以=0.05水准不拒绝H0，接受H1。第11页/共67页二、单样本资料的秩和检验样本中位数与总体中位数比较的目的是推断样本是否来自某已知中位数的总体。检验方法步骤和配对比较的符号秩和检验一样，唯一不同的是用每一个样本观测值与已知总体中位数相减来计算“差值”。【例9.2】已知某地正常人尿氟含量的中

9、位数为0.86mg/L，今在该地某厂随机抽取12名工人，测得尿氟含量（mg/L）为：0.84，0.86，0.88，0.94，0.97，1.01，1.05，1.09，1.20，1.28，1.35，1.83。推断该厂工人的尿氟含量是否高于当地正常人。因据经验尿氟含量不满足正态性，本例小样本资料，虽经正态性检验不拒绝H0，还是按不满足正态性处理，采用Wilcoxon符号秩和检验。第12页/共67页H0：该厂工人的尿氟含量与当地正常人相同，中位数Md0.86；H1：该厂工人的尿氟含量高于当地正常人，Md0.86。0.05。分别求12个观测值与总体中位数0.86之差（标明正负号），有一个差值为0，不编秩

10、，依差值的绝对值从小到大编秩11个，标上原差值的正负号，统计正、负秩和分别为1.5、64.5，取T1.5。用n11查配对秩和检验T界值表（附表11），T1.5在单侧T0.005/2（12）561的范围外，P0.05，只能以0.05水准接受H0，两总体分布相同，不能认为两种剂量的效果不同解法2:用SPSS11.5 统计软件第18页/共67页H0：两总体分布相同；H1：两总体分布不相同0.05。第19页/共67页第20页/共67页TestStatisticsb表中给出了Mann-WhitneyU统计量为15、WilcoxonW统计量为43,两法的检验统计量Z=-0.857,双侧近似P值=0.391

11、,确切概率=0.445。故双侧检验接受H0两总体分布相同,不能认为葛根两种剂量的效果不同。第21页/共67页解法3:用DPS数据处理系统输入两组数据试验统计非参数检验两样本检验结果各个处理数据的秩3g组12.02.01.05.06.07.010.05g组13.04.08.03.011.09.0Wilcoxon检验n1=7n2=6秩和T=48.00Txy=15两组间差异显著检验的精确p=0.4452214正态近似统计量U=0.7857p=0.4320351第22页/共67页2分类资料的两样本比较例用蠲哮汤治疗热哮型支气管哮喘67例，对照组30例以牡荆油胶丸治疗，两组在年龄、病情等到方面具有可比性

12、，两组的疗效见表11-3，试作比较。H0:两组总疗效相同;H1:两组疗效不相同;0.05。临控显效有效无效合计治疗组232712567对照组4691130合计2733211697表11-3某药对两种病情支气管炎疗效的秩和检验计算表第23页/共67页第24页/共67页第25页/共67页第26页/共67页第27页/共67页TestStatisticsb表给出Mann-WhitneyU统计量=531.500、WilcoxonW统计量=2809.5，两法的检验统计量Z=-3.844，双侧近似P值=0.000，故可拒绝H0，接受H1，认为两组的总疗效不相同，可认为蠲哮汤治疗哮型支气管哮喘的总疗效优于牡荆

13、油胶丸。第28页/共67页第四节完全随机设计多样本比较的秩和检验(H检验)完全随机分组资料比较,H0为各总体分布相同.H0成立时,容量分别为ni(1ik)的k个样本来自同一总体.定量资料编秩时,同组相同数据取顺序秩次,不同组相同数据取平均秩次.分类资料编秩时,同一等级取平均秩次.记N=ni,Ti为容量为ni样本的秩和当ni增大时,Ti构成的H统计量近似于自由度为k1的卡方分布，即x2，dfk1第29页/共67页这种方法称完全随机分组秩和检验（KruskalWallis法）,在ni较小时,可查统计用表13,用H值与H界值进行比较在ni较大时，可用H统计量近似作x2检验，并在相同秩次太多时校正，即

14、例为比较不同批号药盒检验结果是否一致，将三个批号各四个药盒一一测定了某一标本。结果如表11-4，试问不同批号测定结果有无差别？H0:不同批号测定值总体分布位置同；H1:不同批号的测定值总体分布位置不同或不全相同.0.05。第30页/共67页1号1.801.922.002.012.11n1=52号2.112.212.252.57n2=43号2.753.103.273.27n3=4rank12345.5T1=15.5rank5.5789T2=29.5rank101112.512.5T3=46n1+n2+n3=N=13H=10.449，P值0.05，B药和C药比较，尚需增大样本含量才能了解是否总体分

15、布位置不同。第42页/共67页二、等级资料多样本比较的秩和检验【例9.6】某医院以蛞蝓胶囊为主综合治疗（简称蛞蝓综合法）中晚期肺癌，并与中西医结合治疗及联合化疗作比较观察，其近期疗效分部分缓解，稳定，扩展三级，资料见表9-5，比较三组的疗效。H0：三组疗效相同；H1：三组疗效不全相同；=0.05。第43页/共67页疗效蛞蝓综合法中西医结合联合化疗合计秩次范围平均秩次=蛞蝓综合法秩和=中西医结合秩和=联合化疗秩和缓解109163513518180162288稳定41027413676562245601512扩展241016779284.5169338845合计n1=16n2=23n3=53N=9

16、2T1=573T2=1060T3=2645表9-5 三种方法治疗中晚期肺癌近期疗效秩和检验计算表第44页/共67页等级资料（单向有序RC表）,用Kruskal-wallisH检验。取0.05H0：三种方法疗效的总体分布位置相同，H1：三种方法疗效的总体分布位置不全相同。编秩，求秩和，见表9-5第栏。按（式9.4）、（式9.5）：3.4309第45页/共67页（ti3ti）（35235）+（41241）+（16216）=115800Hc3.4309/1115800/（92392）=4.0303以自由度dfk-12查2界值表（附表4），20.1（2）=4.61，故P0.10，按=0.05水准不能

17、拒绝H0，不能认为三种方法的疗效不同。第五节配伍组设计多个样本比较的秩和检验1配伍设计多个样本比较的秩和检验这里介绍FriedmanM检验。第46页/共67页【例9.7】某医师按中医辨证，把肺癌病人分成五类，研究辨证分型的疗效，由于疗效又受病期的影响，所以又按病期分为、三个配伍组（b3），资料见表9-6。分析不同辨证分型肺癌病人的一年生存率是否不同。24/5120/292/72/80/124/5020/354/153/81/2注：表中分母为观察数，分子为一年生存数。表9-6肺癌病人辩证与一年生存比例病期别（区组数b=ni=3）阳虚气阴两虚气虚阴阳两虚气滞血瘀21/578/263/122/40/

18、6第47页/共67页0.471（4）0.690（5）0.286（3）0.250（2）0.000（1）0.480（3）0.571（5）0.267（1）0.375（2）0.500（4）各处理组的秩和Ti1113696表9-7 用小数表示各期病人的一年生存率病期（b=ni=3）阳虚气阴两虚气虚阴阳两虚气滞血瘀0.268（4）0.308（3）0.250（2）0.500（5）0.000（1）Ti2430第48页/共67页第49页/共67页第50页/共67页第六节游程检验第51页/共67页第七节Ridit分析一、意义Ridit分析(Riditanalysis)亦称参照单位分析，系I.D.J.Bross于2

19、0世纪五十年代中期所提出，Ridit一词为relativetoanidentifieddistribution的缩写Rid与unit的词尾it组成，意为“与特定分布相对应的单位”。适用于两个或多个有序分类变量以及如抗体滴度等具有无确切数字(如1:320)的半定量变量比较，它不光能说明各等级构成或各对比率是否相同，又能说明对比各组的优劣。其独到之处在于将有序分类资料或等级分配的数据，经过特定的变换转化为定量数据(连续型变量值)，从而可按正态分布的理论来作统计推断。由于存在一种似近算法，不需作平方和的运算就能估计标准误，所以应用简便。第52页/共67页例9.9某医院用中草药制剂甲治疗慢性支气管炎病

20、人3420 例，疗效很好。今又制成一种中草药新的制剂乙，与甲制剂相比，不知乙制剂疗效如何？为此，又进行了105例临床试验，结果如表11-7。检验步骤如下：表9-8两制剂对慢性支气管炎的疗效制剂无效好转显效痊愈合计甲7761926685333420乙11552415105第53页/共67页1.参照单位R的定义设有等级资料:等级i12k合计频数m1m2mkn频率f1f2fkRiR1R2Rk其中,n=m1+m2+mkRi称为第 i 等级的参照单位或Ridit值,.,第54页/共67页把按等级分布的计数资料变换为一组计量资料.由数理统计可以得知:R服从0，1上的均匀分布，由均匀分布的理论知：标准误当n

21、充分大时,近似服从近似服从标准正态分布N(0,1)的1的置信区间为：第55页/共67页若0.05，则的95%的置信区间为:可以证明，参照组（或标准组）0.5，因此参照组95%的置信区间为：2、应用条件:适用于单向有序资料3、方法1)取例数多的一组作为参照组（标准组）2)一般取合并组为参照组(平均Ridit分析)第56页/共67页4、判断二、样本与总体比较的Ridit分析设对比组的R的总体均数为设H0：若对比组的置信区间不包含0.5,则以显著水平拒绝H0,认为与平均疗效0.5的差异有统计意义,若等级从“差好”,值越大，表示效果越“好”；同时，注意到是在0，1上取的值,所以在作对比分析时可把它理解

22、为对比组中的个体效果更好的概率。例如，若=0.8，则该组中的个体比标准组中的个体获得较好效果的可能性为80，即平均100例中约有80例获得较好效果。第57页/共67页返回到例9.9,(1)选定标准组：(2)H0:乙制剂治疗慢性支气管炎效果与甲制剂相同，即对比组总体0.5；H1:乙制剂治疗慢性支气管炎效果与甲制剂不相同，即对比组总体0.5。0.05等级无效好转显效痊愈合计频数7761926685333420频率0.22690.56310.20020.0096R值0.11350.50850.89020.9952(3)计算标准组各等级的R值。第58页/共67页可见R值计算无误。(4)计算对比组的值：

23、(5)计算对比组总体值的可信区间。u/=0.62392.58/=0.55120.6966(6)推断结论：如果对比组总体值的可信区间不包括0.5，可认为对比组与标准组差别有统计学意义；反之，如果对比组总体值的可信区间包括0.5，则不能认为对比组与标准组有差别。第59页/共67页本例样本与总体比较的Ridit分析，对比组总体值的99可信区间不包括0.5，故在0.01的水准上拒绝H0，接受H1(P0.01)。从表11-23中可以看出，疗效越好，R值越大，本例对比组值大于标准组，可认为乙制剂治疗慢性支气管炎优于标准组(甲制剂)。虚线为标准组值,供比较用。小圆圈为对比组的值,小圆圈上下的两条短横线表示可

24、信区间。可信区间与横线相交,表示对比组与标准组差别无统计学意义；可信区间不与横线相交,则表示对比组与标准组差别有统计学意义。第60页/共67页例9.10观察针刺与药物治疗内分泌性突眼症的临床疗效,资料见表11-9,试比较两疗法的疗效有无差别？等级痊愈显效好转无效合计针刺193281372合计22381242114药疗3642942频率0.19290.33330.10520.3684R值0.09650.35960.57890.8158第61页/共67页(5)推断两R值差别有无统计意义：方法1:可信区间重叠法.先分别各对比组求出总体值的(1)可信区间，若可信区间有重叠，则按水准认为差别无统计学意义

25、;如可信区间不重叠,则不能认为差异有统计学意义.差别无统计学意义时,若等级按“差”到“好”排列,则较大的那组效果较佳；反之，若等级按“好”到“差”排列，则较小的那组效果较佳本例,分别各对比组按式(11.25)计算总体值95的可信区间：针刺组：1/=0.39691/=0.39690.0680=0.32890.4649药物组：0.67671/=0.67670.0891=0.58760.7658第62页/共67页推断结论：本例两组的可信区间无重叠，故认为差别有统计学意义。方法2：u检验法。计算检验统计量为P0.01，认为差别有统计学意义。两法结论相同。因值是判断优劣的指标，本例疗效等级由“好”到“差

26、”顺序排列，值较大者疗效差，故针刺法治疗内分泌性突眼症在疗效优于药物疗法。第63页/共67页四.多样本比较的Ridit分析:Ridit分析用于多组资料比较时，可用前述可信区间重叠法；也可用近似2法，即按式(9.17)计算统计量2值，其自由度dfk1。i=1,2,k.k为对比组数例9.11某医院在进行黄连、黄柏双黄气雾剂治疗急性呼吸道感染的课题研究中，对三种不同剂型的双黄制剂的疗效进行了比较，其结果见表11-12，试比较三种不同剂型的疗效。(1)H0：不同病型疗效相同；H1：不同病型疗效不同。0.05。(2)以各型合并作为标准，计算标准组各等级R值，方法同前第64页/共67页(3)以标准组各等级

27、的R值为基准，按式(11.26)计算对比组值。得：=0.4970，0.4841，=0.5482，(4)推断结论：方法1：可信区间重叠法。按式(11.25)计算各对比组总体值的可信区间。得：总体值95的可信区间为(0.4564，0.5376)；总体值95的可信区间为(0.4252，0.5430)；总体值95的可信区间为(0.4612，0.6352)。95%可信区间重叠，故认为三种双黄连剂型治疗急性呼吸道感染的疗效相同。疗效都显著第65页/共67页方法2：近似2法。计算统计量2值：12202(0.4970 0.5)2+96(0.4841 0.5)2+44(0.5482 0.5)2=1.5397。本例为3组k3，自由度df312，20.05(2)5.99，P0.05，按0.05水平不拒绝H0，认为三种双黄剂型治疗急性呼吸道感染的疗效相同，从而表明双黄气雾剂是一种适用于急性呼吸道感染的新型中药剂型。两法结论相同。第66页/共67页

展开阅读全文