16、第七章 非参数检验.ppt

上传人:hwp****526 文档编号:84357478 上传时间:2023-04-05 格式:PPT 页数:45 大小:1.38MB
返回 下载 相关 举报
16、第七章 非参数检验.ppt_第1页
第1页 / 共45页
16、第七章 非参数检验.ppt_第2页
第2页 / 共45页
点击查看更多>>
资源描述

《16、第七章 非参数检验.ppt》由会员分享,可在线阅读,更多相关《16、第七章 非参数检验.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、0第七章第七章 非参数检验非参数检验1非非参参数数检检验验2参数统计参数统计(parametric statistics):以样本来自已知分布(如正态分布)的总体为假设基础,对未知总体参数进行估计或检验的方法,如t 检验、u 检验和方差分析等;非参数统计非参数统计(nonparametric statistics):总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数统计条件。3非参数检验非参数检验(nonparametrictest)对总体分布不作严格假定,又称任意分布检验对总体分布不作严格假定,又称任意分布检验(distribution-free test)。)。先

2、将变量按照先将变量按照数值由小到大数值由小到大,或,或等级由弱到强等级由弱到强转转换成秩后,再计算检验统计量。换成秩后,再计算检验统计量。非参数检验的基础:比较总体分布是否相同,而非参数检验的基础:比较总体分布是否相同,而不是比较总体参数是否相等。不是比较总体参数是否相等。特点:假设检验的结果对总体分布的形状差别不特点:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。敏感,只对总体分布的位置差别敏感。4非参数检验的优点与缺点非参数检验的优点与缺点优点:优点:适用范围广,不受总体分布的限制;适用范围广,不受总体分布的限制;对数据的要求不严,如某些指标难以准确测定,只对数据的

3、要求不严,如某些指标难以准确测定,只能以严重程度、优劣等级、先后次序等表示的资料能以严重程度、优劣等级、先后次序等表示的资料 也可应用;也可应用;方法简便,易于理解和掌握。方法简便,易于理解和掌握。缺点:缺点:如果对符合参数检验的资料应用非参数检验,因不能如果对符合参数检验的资料应用非参数检验,因不能充分利用资料提供的信息,会使充分利用资料提供的信息,会使检验效能低于参数检验效能低于参数检验检验;若要使检验效能相同往往需要更大的样本含;若要使检验效能相同往往需要更大的样本含量。量。5本章主要内容1 Wilcoxon 符号秩和检验2 Wilcoxon 两样本比较法3 完全随机设计多样本比较的 K

4、ruskal-Wallis 检验4 随机区组设计的Friedman检验6第一节第一节 Wilcoxon符号秩和检验符号秩和检验Wilcoxon符号秩和检验(Wilcoxonsignedranksumtest)是推断其差值是否来自中位数为零的总体的方法,可用于:配对设计的两样本的比较配对设计的两样本的比较单一样本与总体中位数的比较单一样本与总体中位数的比较7一、配对设计的两样本的比较一、配对设计的两样本的比较 例7.1某医院用中草药“抗苯一号”治疗9例苯中毒患者,其治疗前后的白细胞总数如表7-1,问该药是否对患者的白细胞总数有影响?8查表法:查表法:1建立检验假设,确定检验水准建立检验假设,确定

5、检验水准 H0:Md=0H1:Md0=0.052计算检验统计量计算检验统计量T 值值(1)求各对的差值求各对的差值(2)编编秩秩按差值的绝对值由小到大编秩,依差值的正负给秩次冠以正负号。编秩时,若若差差值值为为0,舍舍去去不不计计;若差值的绝对值相等,则取其平均秩次差值的绝对值相等,则取其平均秩次。配对设计两样本比较配对设计两样本比较9 (3)求求秩秩和和并并确确定定统统计计量量T分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,可任任取取正正秩秩和和或或负秩和为统计量负秩和为统计量T。T+T-=n(n+1)/2,n为不等于0的对子数。3确定确定P值,做出推断结论值,做出推断结论 当

6、当n25时时,以T值查“附表10 T界值表”(配对设计用),若若检检验验统统计计量量T值值在在T界界值值范范围围内内,则则P值值大大于于相相应应的的概概率率水水平平;若若T值值在在T界界值值范范围围外外或或等等于于界界值值,则则P值小于或等于相应的概率水平。值小于或等于相应的概率水平。配对设计两样本比较配对设计两样本比较10WilcoxonWilcoxonWilcoxonWilcoxon符号秩和检验的基本思想符号秩和检验的基本思想符号秩和检验的基本思想符号秩和检验的基本思想T分分布布以以均均数数为为中中心心,均均数数处处频频数数最最多多,左左右右对对称称,向向两两侧侧逐逐渐渐减减少少。当当H0

7、 成成立立时时,从从总总体体随随机机抽抽取取的的一一个个样样本本,所所得得T值值在在均均数数附附近近的的概概率率最最大大,而而T值值远远离离均均数数的的概概率率较较小小。随随着着n增增大大,T分分布布逐逐渐渐逼逼近近正正态态分分布布,当当n25时,时,T分布较好地近似正态分布。分布较好地近似正态分布。u假定从一总体中,随机抽取n=5的样本,按上述步骤,可以求出T+、T-。当重复抽取所有可能组合的样本,秩和T+的分布见下表。u配对设计符号秩和检验,配对设计符号秩和检验,n必须大于必须大于5。1112正态近似法:正态近似法:若若n 25,超出附表的范围,用正态近似法作u 检验:若相同秩次较多时相同

8、秩次较多时(不包括差值为0者),计算校正uc:其中tj为第j(j=1,2)组相同秩次的个数。配对设计两样本比较配对设计两样本比较13二、单一样本与总体中位数的比较二、单一样本与总体中位数的比较例7.2已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量如表。问该厂工人的尿氟含量是否高于当地正常人?141建立检验假设,确定检验水准建立检验假设,确定检验水准H0:M=2.15H1:M 2.15单侧=0.052计算检验统计量计算检验统计量(1)求差值求差值差值为各观察值与已知总体中位数之差。(2)编秩次编秩次方法同配对设计。(3)求秩和并确定统计量求秩和

9、并确定统计量本例T+=62.5,T-=3.5,取T=3.5。3确定确定P 值,做出推断结论值,做出推断结论 本例n=11,T=3.5,查T界值表,得P0.005,按=0.05检验水准,拒绝H0,接受H1,可认为单一样本与总体中位数比较单一样本与总体中位数比较15第二节第二节 成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验(Wilcoxon两样本比较法,Wilcoxon two-Sample test),研究目的是推推断两样本分别代表的总体分布是否相同断两样本分别代表的总体分布是否相同。原始数据的两样本比较原始数据的两样本比较频数表资料(或等级资料)的两样本

10、比较频数表资料(或等级资料)的两样本比较 16一、原始数据的两样本比较一、原始数据的两样本比较例7.3某医师为研究血铁蛋白与肺炎的关系,随机抽查了10名肺炎患者和16名正常志愿者,测得血铁蛋白(g/L)见表7-3,问肺炎患者与正常人血铁蛋白含量有无差别?1建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:肺炎患者与正常人的血清铁蛋白总体分布相同H1:肺炎患者与正常人的血清铁蛋白总体分布不同 =0.05 成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验1718 2计算统计量计算统计量T 值值(1)编秩次)编秩次将2组数据由小到大统一编秩。遇有相同数据且不同组时取平均秩次。(2)

11、求秩和并确定统计量)求秩和并确定统计量T 2组秩次分别相加,其对应的秩和分别为183.5和167.5。若2组例数相等,则任取一组的秩和为统计量;若2组例数不等,以样本例数较小者为n1,其对应的秩和为统计量T。3确定确定P值,做出推断结论值,做出推断结论 以n1、(n2-n1)和检验统计量T 值查“附表11 T界值表”确定P值:若若T 值在界值范围内,则值在界值范围内,则P 值大于相应值大于相应的概率的概率;若若T 值在界值范围外或等于界值,则值在界值范围外或等于界值,则P 值小值小于或等于相应概率于或等于相应概率。本例本例0.01P0.02,成组设计两样本比较的秩和检验成组设计两样本比较的秩和

12、检验原始数据的两样本比较原始数据的两样本比较19若若n1 或或n2-n1 超超出出了了附附表表11 T 界界值值表表的的范范围围,可用正态近似法:式中N=n1+n2,0.5为连续性校正数。若相同秩次较多(如超过若相同秩次较多(如超过25%)时应进行校正,)时应进行校正,其中 tj为第j个相同秩次的个数。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验原始数据的两样本比较原始数据的两样本比较正态近似法:正态近似法:20 二、频数表资料二、频数表资料(或等级资料或等级资料)的两样本比较的两样本比较 例7.4用某药治疗不同病型的老年慢性支气管炎病人,疗效见表7-4,试比较该药对2种病型的疗效

13、?211建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:两种病型的病人疗效总体分布相同 H1:两种病型的病人疗效总体分布不同=0.052计算检验统计量计算检验统计量(1)编秩编秩本例为等级资料,先计算各等级的合计人数,再确定各等级的秩次范围,并计算其平均秩次。(2)求秩和并检验统计量求秩和并检验统计量以各等级的平均秩次分别乘以两组相应等级的例数,再分别求秩和得到T1、T2。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验频数表或等级资料的两样本比较频数表或等级资料的两样本比较2223本例T1=8780.5,T2=12955.5,n1=82,n2=126,故检验统计量T=87

14、80.5。因n1=82,需用u检验;又因该等级资料的相同秩次过多,需进行校正:3确定确定P值,做出推断结论值,做出推断结论 uc=0.54130.5,按=0.05检验水准,不拒绝H0,尚不能认为该药对两种病型支气管病人的疗效分布不同。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验频数表或等级资料的两样本比较频数表或等级资料的两样本比较24基本思想基本思想n分别有n1与n2的两个样本,来自同一总体或分布相同的两个总体(即检验假设H0成立),则n1样本的秩和T与平均秩和n1(N+1)/2一般相差不大,也就是u;若T与平均秩和n1(N+1)/2相差悬殊,即uu/2,P,则表示抽得现有样本统

15、计量T值得概率很小,因而拒绝检验假设H0。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验25第三节第三节 成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验KruskalWallis检验检验。该法是由Kruskal和Wallis在Wilcoxon秩和检验的基础上扩展的方法,亦称为K-W检验检验或H检验检验。研究目的是推断各样本分别推断各样本分别代表的总体分布有无差别代表的总体分布有无差别。n原始数据的比较原始数据的比较n频数表资料的比较频数表资料的比较26基本思想:n若若0 0成立,第成立,第i 组的秩和组的秩和Ti 的期望与方差分别为的期望与方差分别为:其检验统计量为其检验统

16、计量为:27一、原始数据的比较一、原始数据的比较例例7.5 某院外科用某院外科用3种手术方法治疗肝癌患者种手术方法治疗肝癌患者15例,每组例,每组5例,每例术后生存月数如表例,每例术后生存月数如表7-5。试问。试问3种不同手术方法治种不同手术方法治疗肝癌的效果有无不同?疗肝癌的效果有无不同?281建立检验假设,确定检验水准建立检验假设,确定检验水准H0:3个总体的分布位置相同H1:3个总体的分布位置不同或不全相同0.052计算统计量计算统计量H值值(1)编秩编秩将各组数据统一由小到大编秩,如遇有相等数值且不在同组者取平均秩次。(2)求秩和并计算检验统计量求秩和并计算检验统计量分别将各组秩次相加

17、,得出各组的秩和Ti;计算H值:Ti为各组的秩和,ni为各组例数,N=ni。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验原始数据的比较原始数据的比较29 3确定确定P 值,做出推断结论值,做出推断结论以 N=15,n1 n2 n3 5查 附 表 12.1 H界 值 表,得0.01P0.05,按0.05检验水准,拒绝H0,接受H1,可认为3种手术方法术后生存月数不同。当组数当组数k=2,每组例数,每组例数ni10;或;或k=3,ni5时,时,H分布分布 近似服从于近似服从于=k-1的的x2分布,查分布,查x2界值表,确定界值表,确定P值。值。当相同秩次较多时当相同秩次较多时(如超过如

18、超过25%),应计算校正值,应计算校正值HC:HC=H/C,式中,式中C=1-(tj3-tj)/(N3-N)。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验原始数据的比较原始数据的比较30二、频数表资料的比较二、频数表资料的比较例7.6某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为早、中、晚3个阶段,用来分析不同妊娠阶段时胎盘过早剥离的失血量,资料见表7-6。问妊娠妇女在不同阶段时胎盘过早剥离的出血量有无差别?311建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:3个妊娠阶段胎盘过早剥离时失血量总体分布相同。H1:3个阶段总体的分布位置不同或不全相同。=0.052

19、计算统计量计算统计量H(1)编秩编秩同“频数表资料的两样本比较”;(2)求秩和并计算检验统计量求秩和并计算检验统计量求秩和的方法同“频数表资料的两样本比较”;计算检验统计量H 值:成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验频数表资料的比较频数表资料的比较32因相同秩次较多,须进行校正。3确定确定 P 值,做出推断结论值,做出推断结论因本例组数k=3,=k-1=2,近似服从=2的x2分布,查附表9x2界值表,得0.10P0.25;按=0.05检验水准,不拒绝H0,尚不能认为妊娠妇女在不同阶段时胎盘过早剥离的出血量的差别有统计学意义。成组设计多样本比较的秩和检验成组设计多样本比较的秩

20、和检验频数表资料的比较频数表资料的比较33三、多个样本间两两比较的秩和检验三、多个样本间两两比较的秩和检验当经多样本的H检验拒绝H0时,只能得出各组的总体分布位置不同或不全相同的结论,常需进一步作组间的多重比较,以推断哪两个总体分布不同。可用扩展了的t 检验,各组例数相等或不相等时均适用。式中,、和nA、nB分别为任2个对比组(A、B)的平均秩和与样本含量,k为处理组数,N为各处理组的总例数,H为秩和检验中算得的统计量H值或Hc 值。34例7.7对例7.5资料作两两比较。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验多个样本间两两比较多个样本间两两比较351建立检验假设,确定检验水准

21、建立检验假设,确定检验水准 H0:3个处理组中任两个总体的分布相同 H1:任2个总体的分布不同0.052计算统计量计算统计量 t 值值如1组与2组比较3确定确定P值,做出推断结论值,做出推断结论以Nk 和各对比组的t 值,查t 界值表得P 值。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验多个样本间两两比较多个样本间两两比较3637第四节第四节 随机区组设计资料的秩和检验随机区组设计资料的秩和检验 Friedman检验检验,该法由M.Friedman在符号检验的基础上提出来的,也称M检验检验。用于配伍组设计资料的比较。n各处理组间总的比较n多个样本间两两比较的秩和检验。38一、原始数

22、据的比较一、原始数据的比较例7.8不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)如下表,试比较4组雌性大白鼠子宫重量的差别有无统计学意义。391建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:3种剂量雌激素注射后子宫重量总体分布相同 H1:3个总体分布不同或不全相同=0.052计算统计量计算统计量M 值值(1)编秩编秩先将各配伍组内各配伍组内数据由小到大编秩,相同数值者取平均秩次。(2)求秩和并计算检验统计量求秩和并计算检验统计量计算各处理组的秩和Ti;(3)计算检验统计量M:,,k 为处理组数 随机区组设计资料的秩和检验随机区组设计资料的秩和检验原始数据的比较原始数据的比较

23、403确定确定P值,做出推断结论值,做出推断结论以处理组数处理组数 k 和配伍组数和配伍组数 b 查附表查附表12.2 M 界值表界值表,得出P值。本例,k=3,b=4,查M 界值表,M0.05(3,4)=26,M=180.05,按=0.05检验水准不拒绝H0,尚不能认为随机区组设计资料的秩和检验随机区组设计资料的秩和检验原始数据的比较原始数据的比较本例,41当处理组数k 或配伍组数b 超出M 界值表的范围时,可采用近似x2分布法:式中,k为处理组数,b为配伍组数,Ti为第i个处理组的秩和。当各区组间相同的秩次较多时,须进行校正:C=1-(tj3-tj)/bk(k2-1)。式中,t 为各区组内

24、第j 个具有相同秩次的个数,b为配伍组数,k为处理组数。由于C 1,故校正的,对应的P 值减小。在下列情况下意义较大:相同数据的个数在各配伍组中所占比重较大时;所得P 值在检验水准附近时。=k-142二、多个样本间两两比较的秩和检验二、多个样本间两两比较的秩和检验 方法步骤与方差分析的q 检验基本相同:1将各处理组的秩和将各处理组的秩和Ti由小到大排序,并列出各对比组由小到大排序,并列出各对比组 及其包括的组数及其包括的组数a。2求统计量求统计量q:其中,k为处理组数,b为配伍组数,TA、TB分别为对比组的秩和,是其对应的标准误。3以以和和组组数数a查查附附表表5 q界界值值表表,得得P值值,按按所所取取检检验验水准做出推断结论。水准做出推断结论。4344

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁