《医学统计学非参数检验秩和检验.pptx》由会员分享,可在线阅读,更多相关《医学统计学非参数检验秩和检验.pptx(155页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、两个独立样本比较的非参数检验两个独立样本比较的非参数检验多个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检随机区组设计多个样本比较的非参数检验验n诊断试验诊断试验ROCROC曲线分析曲线分析n基于秩次的非参数检验基于秩次的非参数检验第1页/共155页非参数检验非参数检验又称为任意分布检验又称为任意分布检验,这类方法并不依赖总体分布的具体形式,应用这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的不是参数之间的检时可以不考虑研究变量为何种分布以及分布是否已知,进行的
2、不是参数之间的检验,故称非参数检验。验,故称非参数检验。第2页/共155页基本特点:基本特点:与分布无关与分布无关基本方法:基本方法:2 2 检验检验基于秩基于秩(等级,等级,rank)rank)的方法的方法基于特定参照点(如中位数)的方法基于特定参照点(如中位数)的方法第3页/共155页非参数检验的优点:非参数检验的优点:适用范围广适用范围广受限条件少。受限条件少。参数检验对总体分布等有特别限参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。布的限制,更适合一般的情况。具有稳健性。具有稳健性。参数检验是
3、建立在严格的假设条参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。的假定,所受的限制很少,稳健性好。第4页/共155页对符合用参数检验的资料,如用非参对符合用参数检验的资料,如用非参数检验,会丢失部分信息。数检验,会丢失部分信息。虽然非参数检验计算简便,但有些问虽然非参数检验计算简便,但有些问题的计算仍显繁冗。题的计算仍显繁冗。非参数检验的缺点:非参数检验的缺点:第5页/共155页已知总体分布类型已知总体分布类型,
4、对,对未知参数进行统计推断未知参数进行统计推断依赖于特定分布类依赖于特定分布类型,比较的是型,比较的是参数参数 参数检验参数检验 (parametric testparametric test)非参数检验非参数检验 (nonparametric testnonparametric test)对总体的分布类型对总体的分布类型不作严格要求不作严格要求 不受分布类型的影响,比不受分布类型的影响,比较的是较的是总体分布位置总体分布位置 优点优点:方法简便、易学易用,易于推广使用、:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料(如等级
5、资料,或含数值如等级资料,或含数值“50mg50mg”等等 )缺点缺点:方法比较粗糙,对于符合参数检验条件者,采用:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其非参数检验会损失部分信息,其检验效能较低检验效能较低;样本含;样本含量较大时,两者结论常相同量较大时,两者结论常相同第6页/共155页应用非参数检验的情况应用非参数检验的情况1.1.不满足正态和方差齐性条件的小样本资料;不满足正态和方差齐性条件的小样本资料;2.2.总体分布类型不明的小样本资料;总体分布类型不明的小样本资料;3.3.一端或两端是不确定数值(如、一端或两端是不确定数值(如、6565等)的资料(必选
6、);等)的资料(必选);4.4.单向(双向)有序列联表资料;单向(双向)有序列联表资料;5.5.各种资料的初步分析。各种资料的初步分析。第7页/共155页方法的起点排队与秩次方法的起点排队与秩次统计描述中排秩思想的成功应用统计描述中排秩思想的成功应用百分位数、中位数百分位数、中位数排队的优点排队的优点广泛适用于多种分布广泛适用于多种分布排队的结果排队的结果将原始数据的比较转化为将原始数据的比较转化为秩次秩次的比较的比较第8页/共155页秩秩次次(rank)(rank)将将数数值值变变量量值值从从小小到到大大,或或等等级级变变量量值值从从弱弱到到强强所排列的序号。所排列的序号。例例1 11只大鼠
7、存活天数:只大鼠存活天数:存活天数存活天数4,10,7,50,3,15,2,9,13,60,60例例2 9名名 肺炎病人的治疗结果:肺炎病人的治疗结果:疗效疗效 治愈治愈 治愈治愈 死亡死亡 无效无效 治愈治愈 有效有效 治愈治愈 有效有效 无效无效 秩次秩次 3 6 4 9 2 8 1 5 7 10 113 6 4 9 2 8 1 5 7 10 11 平均秩次平均秩次平均秩次平均秩次 秩次秩次 1 2 9 7 3 5 4 6 81 2 9 7 3 5 4 6 8第9页/共155页SPSS中的菜单位置中的菜单位置第10页/共155页两个独立样本比较的非参数检验两个独立样本比较的非参数检验多个独
8、立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检随机区组设计多个样本比较的非参数检验验n诊断试验诊断试验ROCROC曲线分析曲线分析n基于秩次的非参数检验基于秩次的非参数检验第11页/共155页1 1建立检验假设,确定检验水准建立检验假设,确定检验水准()H H0 0:两总体分布相同两总体分布相同H H1 1:两总体分布不同。两总体分布不同。2 2编秩编秩按数值由小到大排列,若有相同数据按数值由小到大排列,若有相同数据,取取平均秩。平均秩。分析步骤:分析步骤:第12页/共155页基本思想基本思想两样本来自同一总
9、体两样本来自同一总体 任一组秩和不应太大或太小任一组秩和不应太大或太小 假定:两组样本的总体分布形状相同假定:两组样本的总体分布形状相同 T T 与平均秩和应相差不大与平均秩和应相差不大 3 3计算秩和,确定检验统计量秩和计算秩和,确定检验统计量秩和T T值值第13页/共155页当当n n1 11010或(或(n n2 2-n-n1 1)1010时,则可采用时,则可采用正态近似法求正态近似法求u u(Z Z)值来确定)值来确定P P值,其值,其公式如下:公式如下:4 4确定确定P P值和作出推断结论值和作出推断结论 当当n n1 1=10=10或(或(n n2 2-n-n1 1)=10 T在界
10、值范围外 P3k3或或n ni i55时,时,H H值的分布近值的分布近似于自由度为似于自由度为k-1k-1的的2 2分布,此时可分布,此时可查查2 2界值表得到界值表得到P P值。值。最后按最后按P P值作出推断结论。值作出推断结论。分析步骤:分析步骤:第39页/共155页【例例3 3】比较小白鼠接种三种不同菌型伤寒杆菌比较小白鼠接种三种不同菌型伤寒杆菌9D9D、11C11C和和DSCDSC1 1后存活日数,结果见表。后存活日数,结果见表。问问小白鼠接种三种不同菌型伤寒杆菌的存活日小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?数有无差别?序号序号12345678910119D222344
11、457711C55666781012DSC135666779101111第40页/共155页第41页/共155页P=1-CDF.CHISQ(9.97,2)第42页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第43页/共155页第二步:输入原始数据第二步:输入原始数据第44页/共155页第三步:非参数检验第三步:非参数检验第45页/共155页第四步:结果解读第四步:结果解读结果解读:结果解读:x x2 2第46页/共155页【例例4 4】四种疾病患者痰液内嗜酸性白细胞的检四种疾病患者痰液内嗜酸性白细胞的检查结果见表。查结果见表。问四种疾病患者痰液内的嗜酸性问四种疾病患者痰液内
12、的嗜酸性白细胞有无差别?白细胞有无差别?白细胞白细胞-+支气扩张支气扩张0296肺水肿肺水肿3552肺癌肺癌5732病毒性呼吸道感染病毒性呼吸道感染3530第47页/共155页第48页/共155页P=1-CDF.CHISQ(15.52,3)第49页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第50页/共155页第二步:第二步:输入原始数据输入原始数据第51页/共155页第三步:加权个案第三步:加权个案第52页/共155页第四步:非参数检验第四步:非参数检验第53页/共155页第五步:结果解读第五步:结果解读结果解读:结果解读:x x2 2第54页/共155页【例例5 5】某
13、临床药理基地观察某临床药理基地观察5 5组接受不同治疗的组接受不同治疗的妇科病人,结果见表。妇科病人,结果见表。问问5 5组疗效有无差别组疗效有无差别?疗效疗效对照组对照组 中药中药A A组组 中药中药B B组组 中药中药C C组组 西药组西药组合计合计I211900040II44413052III006113148IV023154262V000217798第55页/共155页第56页/共155页P=1-CDF.CHISQ(195.50,4)第57页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第58页/共155页第二步:输入原始数据第二步:输入原始数据第59页/共155页第
14、三步:加权个案第三步:加权个案第60页/共155页第四步:非参数检验第四步:非参数检验第61页/共155页第五步:结果解读第五步:结果解读结果解读:结果解读:x x2 2第62页/共155页两个独立样本比较的非参数检验两个独立样本比较的非参数检验多个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检随机区组设计多个样本比较的非参数检验验n诊断试验诊断试验ROCROC曲线分析曲线分析n基于秩次的非参数检验基于秩次的非参数检验第63页/共155页 配对设计差值比较的符号秩和检验配对设计差值比较的符号秩和检验由由Wi
15、lcoxonWilcoxon19451945年提出,又称年提出,又称WilcoxonWilcoxon符号秩和检验符号秩和检验,常用于检验常用于检验差值的总体中位数是否等于零。差值的总体中位数是否等于零。第64页/共155页(1 1)建立检验假设,确定检验水准)建立检验假设,确定检验水准 H Ho o:差值总体差值总体中位数中位数MMd d=0=0 H H1 1:差值总体差值总体中位数中位数MMd d00 分析步骤:(2 2)编秩:)编秩:求差值求差值编秩方法:依差值的绝对值从小到大编秩。编秩方法:依差值的绝对值从小到大编秩。编秩时注意两点:编秩时注意两点:遇差值为遇差值为0 0者,舍去不计,者
16、,舍去不计,n n相应减少相应减少 差值的绝对值相等差值的绝对值相等,符号不同者应取平均秩次符号不同者应取平均秩次编秩后,按差值的正负给秩次冠上符号。编秩后,按差值的正负给秩次冠上符号。第65页/共155页(3 3)求差值为)求差值为正或负正或负的秩和的秩和 差值为正的秩和以差值为正的秩和以T T+表示表示 差值为负的秩和以差值为负的秩和以T T-表示。表示。T T+T+T-=n(n+1)/2=n(n+1)/2 T=min T=min(T T+,T T-)(4 4)确定)确定P P值和作出推断结论:值和作出推断结论:当当n50n50时,查时,查T T界值表界值表 T T在界值范围内在界值范围内
17、 PP T T在界值范围外在界值范围外 P P50n50,可采用正态近似法,计算可采用正态近似法,计算u u值。值。正正 态态 近近 似似 法法 第67页/共155页 若相同秩次较多,应作校正计算。若相同秩次较多,应作校正计算。Z Z 或或 式中,式中,t tj j为第为第j j(j=1j=1,2 2,)个相个相同差值的个数。同差值的个数。正正 态态 近近 似似 法法第68页/共155页【例例6 6】对对1010名患者分别用甲法与乙法,测得血汞值。名患者分别用甲法与乙法,测得血汞值。问两种方法的结果有无差别问两种方法的结果有无差别?第69页/共155页n=10-1=9第70页/共155页n=9
18、第71页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第72页/共155页第二步:输入原第二步:输入原始数据始数据第73页/共155页第三步:非参数检验(第三步:非参数检验(1 1)第74页/共155页第三步:非参数检验(第三步:非参数检验(2 2)第75页/共155页第四步:结果解读(第四步:结果解读(1 1)结果解读:结果解读:例数、均数、标准差、中位数、四分例数、均数、标准差、中位数、四分位间距等。位间距等。标准差较大标准差较大第76页/共155页第四步:结果解读(第四步:结果解读(2 2)结果解读:结果解读:第77页/共155页【例例7 7】对对1212份血清分别用原
19、方法(检测时间份血清分别用原方法(检测时间2020分钟)和新方法(检测时间分钟)和新方法(检测时间1010分钟)测谷分钟)测谷-丙丙转氨酶,结果见表。转氨酶,结果见表。问两法所得结果有无差别问两法所得结果有无差别?序号序号123456789101112原法原法6014219580242220190251983823695新法新法76152243822402202053824344190100第78页/共155页第79页/共155页n=11第80页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第81页/共155页第二步:输入原第二步:输入原始数据始数据第82页/共155页第三步
20、:非参数检验(第三步:非参数检验(1 1)第83页/共155页第三步:非参数检验(第三步:非参数检验(2 2)第84页/共155页第四步:结果解读(第四步:结果解读(1 1)结果解读:结果解读:例数、均数、标准差、中位数、四分例数、均数、标准差、中位数、四分位间距等。位间距等。标准差较大标准差较大第85页/共155页第四步:第四步:结果解读(结果解读(2 2)结果解读:结果解读:第86页/共155页两个独立样本比较的非参数检验两个独立样本比较的非参数检验多个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检随机
21、区组设计多个样本比较的非参数检验验n诊断试验诊断试验ROCROC曲线分析曲线分析n基于秩次的非参数检验基于秩次的非参数检验第87页/共155页 随机区组设计资料比较,如果观察结随机区组设计资料比较,如果观察结果不满足方差分析条件,可用果不满足方差分析条件,可用FriedmanFriedman检验(检验(Friedman testFriedman test)。)。第88页/共155页1.1.建立检验假设和确定检验水准建立检验假设和确定检验水准2.2.编秩:编秩:先在每一配伍组内将数据从小到大编秩,先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;如有相同数据,取平均秩次;再求各处理组
22、秩和再求各处理组秩和RiRi,i i=1=1,2 2,.,g g。分析步骤分析步骤第89页/共155页3.3.计算检验统计量计算检验统计量MM值值(1 1)查表法)查表法(n15(n15,g15)g15):M=M=(R Rj j-R-R)2 2 (R=R=R Rj j/g/g)=MM界值表界值表基于基于2 2分布近似法得到分布近似法得到2 2值查有关的值查有关的2 2界值表界值表(2 2)2 2分布近似法分布近似法分析步骤:分析步骤:自由度为(自由度为(g-1g-1)第90页/共155页当各区组间出现相同秩次时,需进行校正当各区组间出现相同秩次时,需进行校正 校正公式为校正公式为b为区组个数为
23、区组个数,k为处理组个数为处理组个数4 4确定确定P P值和作出推断结论值和作出推断结论第91页/共155页【例例8 8】8 8名受试对象在相同实验条件下分别接受名受试对象在相同实验条件下分别接受4 4种不同频率声音的刺激,他们的反应率(种不同频率声音的刺激,他们的反应率(%)资料见表。资料见表。问问4 4种频率声音刺激的反应率是否有种频率声音刺激的反应率是否有差别?差别?第92页/共155页第93页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第94页/共155页第二步:输入原始数据第二步:输入原始数据第95页/共155页第三步:非参数检验(第三步:非参数检验(1 1)第9
24、6页/共155页第三步:非参数检验(第三步:非参数检验(2 2)第97页/共155页第四步:结果解读(第四步:结果解读(1 1)结果解读:结果解读:例数、均数、标准差、中位数、四分例数、均数、标准差、中位数、四分位间距等。位间距等。第98页/共155页第四步:第四步:结果解读(结果解读(2 2)结果解读:结果解读:x x2 2第99页/共155页一个讨论案例一个讨论案例【例例9 9】某中医医院采用中西医结合方法治疗某中医医院采用中西医结合方法治疗228228例例不同病情的脑卒中患者,疗效情况如下表不同病情的脑卒中患者,疗效情况如下表。第100页/共155页SPSS软件操作第一步:建立变量。第一
25、步:建立变量。第101页/共155页第二步:输入原始数据第二步:输入原始数据第102页/共155页第三步:加权个案第三步:加权个案第103页/共155页1 1、不同病情的脑卒中患者,疗效有无差别、不同病情的脑卒中患者,疗效有无差别?第104页/共155页第三步:秩和检验第三步:秩和检验第105页/共155页第四步:第四步:结果解读结果解读结果解读:结果解读:x x2 2第106页/共155页2 2、脑卒中患者病情与疗效有无相关?、脑卒中患者病情与疗效有无相关?第107页/共155页第三步:等级相关分析第三步:等级相关分析第108页/共155页第四步:结果解读第四步:结果解读结果解读:结果解读:
26、r rs s第109页/共155页3 3、脑卒中患者病情与疗效变化趋势如何?、脑卒中患者病情与疗效变化趋势如何?第110页/共155页第三步:线性趋势检验(第三步:线性趋势检验(1 1)第111页/共155页第三步:线性趋势检验(第三步:线性趋势检验(2 2)第112页/共155页输出输出4 4种卡方种卡方检验结果:检验结果:1 1、pearsonpearson卡方卡方2 2、卡方值的校正、卡方值的校正值值3 3、似然比卡方,、似然比卡方,一般用于对数线性一般用于对数线性模型。模型。4 4、fisherfisher的精确检的精确检验验线性趋势检验线性趋势检验第113页/共155页第四步:第四步
27、:结果解读结果解读结果解读:结果解读:x x2 2第114页/共155页线性趋势检验线性趋势检验计量资料计量资料线性回归线性回归等级有序资料等级有序资料线性趋势检验线性趋势检验基本原则:将基本原则:将x2值进行分解,将总变异分为线性回归分量和偏离线性回归分量。值进行分解,将总变异分为线性回归分量和偏离线性回归分量。总变异线性回归分量第115页/共155页两个独立样本比较的非参数检验两个独立样本比较的非参数检验多个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检随机区组设计多个样本比较的非参数检验验n诊断试验诊
28、断试验ROCROC曲线分析曲线分析n基于秩次的非参数检验基于秩次的非参数检验第116页/共155页诊断试验的概念诊断试验的概念评价某种疾病诊断方法的临床试验。评价某种疾病诊断方法的临床试验。诊断试验的用途诊断试验的用途诊断疾病诊断疾病筛选无症状的病人筛选无症状的病人判断疾病的严重程度判断疾病的严重程度估计疾病临床过程及预后估计疾病临床过程及预后估计对治疗的反应估计对治疗的反应判断治疗效果判断治疗效果第117页/共155页金标准金标准目目标标人人群群病人病人非病非病人人待评价诊待评价诊断方法断方法评价指标评价指标 诊断试验原理诊断试验原理第118页/共155页确定金标准确定金标准当前医学界公认的
29、诊断某疾病最可靠、准确度最高的诊断方法。当前医学界公认的诊断某疾病最可靠、准确度最高的诊断方法。常用的金标准包括常用的金标准包括病理学诊断(活检、尸检)病理学诊断(活检、尸检)外科手术或诊断性操作外科手术或诊断性操作特殊的影像学诊断特殊的影像学诊断权威机构颁布的综合诊断标准权威机构颁布的综合诊断标准第119页/共155页选择研究对象选择研究对象要求:代表性好、盲法要求:代表性好、盲法试验组试验组经金标准确诊为某疾病的患者,具有反应该疾病的全部特征,如病情、经金标准确诊为某疾病的患者,具有反应该疾病的全部特征,如病情、病程、症状体征、并发症、治疗或未治疗等。病程、症状体征、并发症、治疗或未治疗等
30、。对照组对照组经金标准证实未患该疾病的患者(可患其它疾病)或正常人。经金标准证实未患该疾病的患者(可患其它疾病)或正常人。第120页/共155页诊断试验结果表诊断试验结果表诊断试验金标准合计有病(D+)无病(D-)阳性(T+)aba+b阴性(T-)cdc+d合计a+cb+da+b+c+d第121页/共155页诊断试验的评价指标诊断试验的评价指标基本指标基本指标灵敏度、特异度、误诊率、漏诊率灵敏度、特异度、误诊率、漏诊率预测值预测值阳性预测值、阴性预测值阳性预测值、阴性预测值综合评价指标综合评价指标正确率、约登指数、优势比、似然比正确率、约登指数、优势比、似然比阳性似然比、阴性似然比阳性似然比、
31、阴性似然比第122页/共155页灵敏度(灵敏度(SensitivitySensitivity,SeSe)计算公式:计算公式:SeSe=a a/(/(a a+c c)又称真阳性率又称真阳性率将实际有病的人正确判断为患者的能力将实际有病的人正确判断为患者的能力漏诊率(漏诊率(omission diagnosticomission diagnostic,)计算公式:计算公式:=c c/(/(a a+c c)又称假阴性率又称假阴性率将实际有病的人错误判断为非患者的比将实际有病的人错误判断为非患者的比例例高灵敏度试验的适用范围漏诊可能造成严重后果排除某病的其他诊断筛检无症状病人而且该病发病率较低第123
32、页/共155页特异度(特异度(SpecificitySpecificity,SpSp)计算公式:计算公式:SpSp=d d/(/(b b+d d)又称真阴性率又称真阴性率将实际无病的人正确判断为非患者的能将实际无病的人正确判断为非患者的能力力误诊率(误诊率(mistake diagnostic ratemistake diagnostic rate,)计算公式:计算公式:=b b/(/(b b+d d)又称假阳性率又称假阳性率将实际无病的人错误判断为患者的比例将实际无病的人错误判断为患者的比例高特异度试验的适用范围假阳性会使病人受到严重危害确诊某病第124页/共155页灵敏度和特异度的关系灵敏
33、度和特异度的关系都是反映诊断试验准确性的最基本指标都是反映诊断试验准确性的最基本指标提高一方面水平,会降低另一方面水平提高一方面水平,会降低另一方面水平一般选择敏感度和特异度都较高的试验作为诊断依据一般选择敏感度和特异度都较高的试验作为诊断依据根据研究目的,调整灵敏度和特异度来确定临界根据研究目的,调整灵敏度和特异度来确定临界值值以产生漏诊和误诊之和最小时的数据确定临界值以产生漏诊和误诊之和最小时的数据确定临界值第125页/共155页ROCROC曲线评价方法曲线评价方法受试者工作特征曲线(受试者工作特征曲线(Receiver Operator Receiver Operator Charact
34、eristic curveCharacteristic curve,简称,简称ROCROC曲线)曲线)表示一个特定的诊断方法对区别特定的患者组与非患表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测性能。者组样本的检测性能。表示不同诊断水平的真阳性率对假阳性率的函数关系。表示不同诊断水平的真阳性率对假阳性率的函数关系。第126页/共155页受试者工作特征曲线受试者工作特征曲线receiver operating characteristic curve,ROCreceiver operating characteristic curve,ROC 1 0 0.2 0.4 0.6 0.8
35、 1完全无价值的诊断完全无价值的诊断试验其试验其ROCROC曲线与曲线与机会线重合,而机会线重合,而ROCROC曲线越偏离机曲线越偏离机会线,会线,ROCROC曲线下曲线下面积就越大,则诊面积就越大,则诊断试验的真实性也断试验的真实性也就越好。就越好。第127页/共155页ROCROC曲线评价方法曲线评价方法以灵敏度和假阳性率为两个轴的取值作的图性;以灵敏度和假阳性率为两个轴的取值作的图性;通常用于测定值为连续或等级数据;通常用于测定值为连续或等级数据;常用于确定最佳临界值,也可用于比较两种和两种以上诊断试常用于确定最佳临界值,也可用于比较两种和两种以上诊断试验的诊断价值。验的诊断价值。以试验
36、灵敏度为以试验灵敏度为y y轴,以假阳性率为轴,以假阳性率为x x轴,由不同决策界值产轴,由不同决策界值产生图中各个点,采用线段连接图中所有的点,绘制而成的线图。生图中各个点,采用线段连接图中所有的点,绘制而成的线图。图中反映了随着灵敏度的增加,假阳性率也随之增加。图中反映了随着灵敏度的增加,假阳性率也随之增加。第128页/共155页ROCROC曲线的特点曲线的特点综合了灵敏度和特异度两个指标;综合了灵敏度和特异度两个指标;不受患病率的影响;不受患病率的影响;考虑了所有可能的诊断临界值的影响;考虑了所有可能的诊断临界值的影响;全面客观地评价诊断试验的准确性;全面客观地评价诊断试验的准确性;描述
37、了诊断试验区分事件发生与不发生的固有能力。描述了诊断试验区分事件发生与不发生的固有能力。第129页/共155页ROCROC曲线下的面积曲线下的面积Area Under CurveArea Under Curve,简称,简称AUCAUC以点以点(0(0,0)0)、(1(1,0)0)、(0(0、1)1)和和(1(1,1)1)围成的面积做为围成的面积做为1 1或或100100。ROCROC曲线和曲线和X X轴围成的面积轴围成的面积占总面积的百分比作为曲线占总面积的百分比作为曲线面积的估计值。面积的估计值。ROCROC曲线下面积的取值在曲线下面积的取值在0 01 1之间。之间。第130页/共155页曲
38、线越接近左上角,面积越曲线越接近左上角,面积越接近接近1 1,说明试验的准确度越,说明试验的准确度越高;高;越接近对角线,越接近,则越接近对角线,越接近,则说明试验的准确度越差;说明试验的准确度越差;一般认为:面积在之间时一般认为:面积在之间时诊断价值较低,在之间时诊断价值较低,在之间时诊断价值中等,在以上时诊诊断价值中等,在以上时诊断价值较高。断价值较高。ROCROC曲线下的面积曲线下的面积第131页/共155页最佳诊断界值的确定最佳诊断界值的确定ROCROC曲线上最靠近左上角的点所对应的灵曲线上最靠近左上角的点所对应的灵敏度和特异度都是较大的,该点为敏度和特异度都是较大的,该点为ROCRO
39、C曲曲线的正切线与曲线相交的点,常以此点所线的正切线与曲线相交的点,常以此点所对应的诊断界值作为最佳诊断界值。对应的诊断界值作为最佳诊断界值。灵敏度灵敏度+特异度最大的点就是最佳诊断界值。特异度最大的点就是最佳诊断界值。通过解拟合通过解拟合ROCROC曲线的方程寻找该点。曲线的方程寻找该点。第132页/共155页理想的正常人群与糖尿病病人血糖水平分布现实的正常人群与糖尿病病人血糖水平分布第133页/共155页采用不同血糖阳性界值所致假阳性和假阴性 第134页/共155页病人与非病人某项诊断指标数值分布示意图 第135页/共155页ROCROC分析分析ROCROC分析主要做三件事:分析主要做三件
40、事:计算计算ROCROC曲线下面积及其曲线下面积及其95%CI95%CI绘制绘制ROCROC曲线图曲线图寻找截断点(寻找截断点(cut offcut off)第136页/共155页【例例1010】为评价红细胞平均容积(为评价红细胞平均容积(MCVMCV)对缺铁)对缺铁性贫血患者的诊断价值,以性贫血患者的诊断价值,以100100例可疑为缺铁性贫例可疑为缺铁性贫血患者作诊断,并以骨髓诊断作为金标准。将金标血患者作诊断,并以骨髓诊断作为金标准。将金标准确诊为缺铁性贫血的准确诊为缺铁性贫血的3434例作为病例组,其余例作为病例组,其余6666例作为对照组。然后对每组的每一例测量红细胞平例作为对照组。然
41、后对每组的每一例测量红细胞平均容积(均容积(MCVMCV)。骨髓诊断(金标准)MCV结果正常组60666869717173747474767777777778787979808081818182828383838383838384848484858586868687888888898989909091919293939394949494969798 100 103异常组52586265676869717272737374757677777879808081818182838485858688889092第137页/共155页SPSS软件操作第一步:建立变量。第一步:建立变量。第138页/共15
42、5页第二步:输入原始数据第139页/共155页第三步:ROC分析(1)第140页/共155页第四步:初步结果第141页/共155页第五步:ROC分析(2)第142页/共155页第六步:结果解读(第六步:结果解读(1 1)结果解读:基本的例数描述第143页/共155页第六步:结果解读(第六步:结果解读(2 2)结果解读:ROC曲线图第144页/共155页第六步:结果解读(第六步:结果解读(3 3)结果解读:ROC曲线下面积大小及统计学意义第145页/共155页ROCROC曲线下面积的临床意义曲线下面积的临床意义小于,表示诊断准确度较低;小于,表示诊断准确度较低;,表示诊断准确度为中等;,表示诊断
43、准确度为中等;大于,表示诊断准确度较高。大于,表示诊断准确度较高。第146页/共155页第六步:结果解读(第六步:结果解读(4 4)结果解读:给出不同截断点的灵敏度和1-特异度大小。第147页/共155页截断点(截断点(cut offcut off)的选择)的选择在该截断点下作的诊断:在该截断点下作的诊断:误诊率与漏诊率之和为最小;误诊率与漏诊率之和为最小;或灵敏度与特异度之和最大。或灵敏度与特异度之和最大。第148页/共155页第七步:寻找截断点第七步:寻找截断点(1 1)将SPSS结果复制到EXCEL中第149页/共155页第七步:寻找截断点第七步:寻找截断点(2 2)利用EXCEL的函数
44、功能进行计算(灵敏度+特异度)的值第150页/共155页第七步:寻找截断点第七步:寻找截断点(3 3)按照(灵敏度+特异度)由大到小排序第151页/共155页第七步:寻找截断点第七步:寻找截断点(4 4)按照(灵敏度+特异度)由大到小排序。(灵敏度+特异度)值最大的点所对应的MCV结果值就是截断点值。本例就是所要找的截断点。第152页/共155页两条两条ROCROC曲线的比较曲线的比较可信区间法:计算两条曲线可信区间法:计算两条曲线AUCAUC的可信区间的可信区间如果两个可信区间有重合部分,则表示两种方法诊断价值的差异如果两个可信区间有重合部分,则表示两种方法诊断价值的差异无统计学意义;反之则无统计学意义;反之则AUCAUC值大的那种方法的价值更高。值大的那种方法的价值更高。第153页/共155页谢 谢!第154页/共155页感谢您的观看!第155页/共155页