《非参数统计 精选文档.ppt》由会员分享,可在线阅读,更多相关《非参数统计 精选文档.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非参数统计 1本讲稿第一页,共三十二页非非 参参 数数 统统 计计(nonparametric statistics)本讲稿第二页,共三十二页复习:参数(parameter)参数统计参数统计:假定被检验的总体分布类型为已知的一类统计方法。例如t检验、ANOVA要求总体:正态性和方差齐性等。3本讲稿第三页,共三十二页非参数统计非参数统计(nonparametric statistics)不依赖总体分布的类型,不对总体不依赖总体分布的类型,不对总体参数作估计或推断,只是检验分布(具参数作估计或推断,只是检验分布(具体说是分布的位置)是否相同的一类统体说是分布的位置)是否相同的一类统计方法。计方法。
2、4本讲稿第四页,共三十二页非参数统计的优缺点非参数统计的优缺点 优点:优点:对资料无前提要求,应用范围广对资料无前提要求,应用范围广;资料的收集和统计分析简便。资料的收集和统计分析简便。缺点:缺点:对符合参数检验资料用非参数对符合参数检验资料用非参数 检验时,因没有充分利用信息,检验时,因没有充分利用信息,使检验效能使检验效能;历史较短,复杂的设计无对应方法;历史较短,复杂的设计无对应方法;无概括性的数字说明总体。无概括性的数字说明总体。5本讲稿第五页,共三十二页非参数统计应用范围非参数统计应用范围 不符合参数统计分析要求或不能通过数据不符合参数统计分析要求或不能通过数据 变换使资料满足参数检
3、验要求的资料可用非参变换使资料满足参数检验要求的资料可用非参 数检验来分析。数检验来分析。偏态分布或未知分布资料或例数过少偏态分布或未知分布资料或例数过少(难定分布难定分布););分布一端或两端无界:如分布一端或两端无界:如10以下或以下或10以上;以上;不能或未加精确测量的资料:如等级资料;不能或未加精确测量的资料:如等级资料;个别数值偏离过大;个别数值偏离过大;各组离散程度相差悬殊(即方差不齐);各组离散程度相差悬殊(即方差不齐);不能满足参数检验要求的资料等。不能满足参数检验要求的资料等。综上所述:资料符合参数检验时,综上所述:资料符合参数检验时,首选首选参数检验参数检验6本讲稿第六页,
4、共三十二页常用的秩和检验(rank sum test)配对设计配对设计 Wilcoxon signed rank test成组设计(两组)成组设计(两组)Wilcoxon rank sum test成组设计(多组)成组设计(多组)Kruskal Wallis test多个样本两两比较多个样本两两比较 Nemenyi test随机区组设计资料随机区组设计资料 Friedmans M test7本讲稿第七页,共三十二页 (一一)配对设计的符号秩和检验配对设计的符号秩和检验 (wilcoxon signed rank test)由由 Wilcoxon 于于1945 年提出。年提出。检验配对资料的差值
5、是否来自中位数检验配对资料的差值是否来自中位数为为 0 的总体。的总体。亦可用于单样本资料亦可用于单样本资料(样本中位数与样本中位数与总体中位数的比较总体中位数的比较)。8本讲稿第八页,共三十二页建立假设建立假设 H 0:M d=0,H 1:M d 0,=0.05计算检验统计量计算检验统计量 T 求差值求差值 d。编秩:编秩:d=0 者舍去者舍去,按,按|d|从小到大编秩并标记从小到大编秩并标记 d 的正负号。的正负号。|d|相同者相同者,同符号顺编;不同符号同符号顺编;不同符号时,计算平均秩并时,计算平均秩并 给秩次加上原差值给秩次加上原差值 的正负号。的正负号。分别计算正、负秩和分别计算正
6、、负秩和 T+和和 T-。验算:验算:T+T-=n(n+1)/2 任选任选T+或或 T 作为检验统计量作为检验统计量 T。确定确定 P 值,作出推断。值,作出推断。n 为为 d 0 的对子数。的对子数。9本讲稿第九页,共三十二页查表法:当查表法:当 n 50时时(n 为为 d 0 的对子数的对子数)T 在在 T ,n 的范围内,的范围内,P ;T 在在 T 。n 的范围外,的范围外,P ;T 在在 T ,n 的范围上,的范围上,P 50 时时 10本讲稿第十页,共三十二页 当当 相同的秩次较多时要用相同的秩次较多时要用 u c 校正校正 (Lehmamn 于于1975 年提出年提出)t j 为
7、第为第 j 个相同个相同 秩次的个数秩次的个数(或频数或频数)。(j=1,2,)11本讲稿第十一页,共三十二页基本思想基本思想 在在 H 0 成立的条件下成立的条件下(M d=0),差值的正负是随机的,则差值的正负是随机的,则 T+值与值与 T 值应相差不会太大;反之,若值应相差不会太大;反之,若 T+值与值与 T-值相差太悬殊,或曰样本的分布与值相差太悬殊,或曰样本的分布与 M d=0 的分布相差甚远,则认为的分布相差甚远,则认为 H 0 的的 正确性受到怀疑,从而拒绝正确性受到怀疑,从而拒绝 H 0。注:若H0成立,则样本正、负秩和应接近于12本讲稿第十二页,共三十二页 (二二)成组设计两
8、样本比较的秩和检验成组设计两样本比较的秩和检验 (Wilcoxon rank sum test)建立假设建立假设 H 0:两组:两组总体分布相同总体分布相同 H 1:两组:两组总体分布不同总体分布不同,=0.05计算检验统计量计算检验统计量 T (1)混合编秩:把两组原始数据从小到大编秩。混合编秩:把两组原始数据从小到大编秩。数据相同者,同组顺编秩,不同数据相同者,同组顺编秩,不同 组编平均秩组编平均秩。(2)分别计算两组的秩和分别计算两组的秩和 T 1 和和 T 2。(3)当当 n 1=n 2 时,以时,以min(T1,T2)为检验统计量为检验统计量 T;当当 n 1 ;T 在在 T (n
9、1,n 2 n 1)的范围外,的范围外,P ;T 在在 T (n 1,n 2 n 1)的范围上,的范围上,P 10 或或 n2-n 1 10时时 n=n1+n214本讲稿第十四页,共三十二页当相同秩的例数较多时要用当相同秩的例数较多时要用 u c 校正校正 t j 为第为第 j个相同秩次的个数。个相同秩次的个数。(j=1,2,)15本讲稿第十五页,共三十二页 2.频数表资料频数表资料(或等级或等级)资料的两样本比较资料的两样本比较 例例8-4 P167 H 0:两组:两组总体分布相同总体分布相同 H 1:两组:两组总体分布不同总体分布不同 =0.05 16本讲稿第十六页,共三十二页基本思想:基
10、本思想:在在 H 0 成立的条件下,来自同一总成立的条件下,来自同一总 体或来自分布相同的两总体的两样本体或来自分布相同的两总体的两样本 n 1 和和 n 2,n 1 样本的秩和样本的秩和 T 与平均秩和与平均秩和 n 1(n+1)/2 应相差不大,即应相差不大,即 u 3 或或 n i 5时,时,=k 1,查,查 2 界值表。界值表。19本讲稿第十九页,共三十二页(四四)多个样本两两比较的秩和检验多个样本两两比较的秩和检验 (Nemenyi 法)法)H0:任两总体:任两总体(第第i、j个个)的的总体分布相同总体分布相同 H1:i、j两总体两总体分布不同分布不同 =0.05 其中,C为校正系数
11、,*尚未发现哪一个软件采纳。20本讲稿第二十页,共三十二页 Dunn方法Fundamentals of Biostatistics.5th Edition.By Bernard Rosner.Copyright.2000*软件GraphPad Prism中所采用。21本讲稿第二十一页,共三十二页*完全随机设计多样本两两完全随机设计多样本两两 比较的秩和检验的其他方法比较的秩和检验的其他方法 1.q 检验检验 (中国医学百科全书中国医学百科全书.医学统计学医学统计学 P139)要求:各样本例数相等要求:各样本例数相等 n i =n 方法:与方差分析两两比较方法:与方差分析两两比较 q 检验相似检
12、验相似 将各样本秩和将各样本秩和 R i 从小到大排列,从小到大排列,a 为两对比组所包含的组数。为两对比组所包含的组数。,=查查 q 界值表界值表:q q (a,),P ;反之;反之 P 。22本讲稿第二十二页,共三十二页2.扩展扩展 t 检验检验 适用:各样本例数等或不等。适用:各样本例数等或不等。n=n i,k=组数,组数,=n k H或或Hc为多样本比较秩和检验中的统计量。为多样本比较秩和检验中的统计量。查查t界值表界值表:t t ,,P ;反之;反之 P 。23本讲稿第二十三页,共三十二页3.正态近似法正态近似法 (陈启光(陈启光.医学统计学医学统计学 P119)适用:各样本例数等或
13、不等。适用:各样本例数等或不等。n=n i24本讲稿第二十四页,共三十二页(五五)随机区组设计资料的秩和检验随机区组设计资料的秩和检验 建立假设建立假设 H 0:各处理组总:各处理组总体分布相同体分布相同 H 1:至少有两个处理组:至少有两个处理组总体总体 分布不同分布不同 =0.05 计算统计量计算统计量 (1)把各区组内数据从小到大编秩。把各区组内数据从小到大编秩。数据相同者编平均秩。数据相同者编平均秩。(不混编不混编)(2)计算各处理组的秩和计算各处理组的秩和 R i (3)计算总平均秩和计算总平均秩和 (4)计算统计量计算统计量 确定确定 P 值,作出推断。值,作出推断。25本讲稿第二
14、十五页,共三十二页1.M 检验法(检验法(Friedman 法)法)适用于:适用于:b 15且且k 15 统计量统计量 b为区组数,为区组数,k为处理组数。为处理组数。查随机区组设计秩和检验的查随机区组设计秩和检验的M界值表:界值表:M M (b,k),P ,拒绝,拒绝H0;M ,不拒绝,不拒绝H0。26本讲稿第二十六页,共三十二页若超出M界值表范围近似法(P175,公式88)27本讲稿第二十七页,共三十二页2.近似近似F 检验法检验法(了解,了解,P177)适用于:适用于:b 15 或或 k 15 28本讲稿第二十八页,共三十二页随机区组设计多样本两两比较随机区组设计多样本两两比较 1.q
15、检验检验 (P177)将各样本秩和将各样本秩和 R i 从小到大排列从小到大排列 a 为两对比组所包含的组数,为两对比组所包含的组数,g为组数。为组数。29本讲稿第二十九页,共三十二页2.扩展扩展 t 检验检验(了解)了解)方法与完全随机设计多样本两两比较的方法与完全随机设计多样本两两比较的秩和检验的扩展秩和检验的扩展 t 检验方法相同。检验方法相同。3.正态近似法正态近似法(了解)(了解)(方积乾书(方积乾书 P105)k为组数,为组数,b为区组数。为区组数。30本讲稿第三十页,共三十二页常用参数检验与非参数检验比较常用参数检验与非参数检验比较 1.特点特点 参数检验参数检验 非参数检验非参
16、数检验 用随机变量的用随机变量的 用观察值大小的用观察值大小的 观察值作分析观察值作分析 秩次作分析秩次作分析 对总体参数作估计对总体参数作估计 不对总体参数作估计不对总体参数作估计 对总体参数作检验对总体参数作检验 对总体分布作检验对总体分布作检验 资料满足参数检验要资料满足参数检验要 资料满足参数检验要求资料满足参数检验要求 求时,首选参数检验求时,首选参数检验 而用非参数检验时,而用非参数检验时,31本讲稿第三十一页,共三十二页Ridit分析(不要求)Ridit是 relative to an identified distribution unit 的缩写。Ridit分析用于处理两组或多组有序分类变量的一种统计方法。32本讲稿第三十二页,共三十二页