《非参数检验 (2)精选文档.ppt》由会员分享,可在线阅读,更多相关《非参数检验 (2)精选文档.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非参数检验非参数检验本讲稿第一页,共三十八页1参数统计参数统计(parametric statistics):以样本来自已知分布(如正态分布)总体为假设基础,对未知总体参数进行估计或检验的方法,如t 检验、u 检验和方差分析等;非参数统计非参数统计(nonparametric statistics):总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数统计条件。非参数统计比较分布而不是比较参数。非参数统计比较分布而不是比较参数。本讲稿第二页,共三十八页2非参数统计的优点与缺点非参数统计的优点与缺点优点:优点:适用范围广,不受总体分布的限制;对数据的要求不严,如某些指标难
2、以准确测定,只能以严重程度、优劣等级、先后次序等表示的资料也可应用;方法简便,易于理解和掌握;具有较好的稳健性。缺点:缺点:如果对符合参数检验的资料应用非参数检验,因不能充分利用资料提供的信息,会使检验效能低于参数检验;若要使检验效能相同往往需要更大的样本含量。本讲稿第三页,共三十八页3主要内容主要内容配对设计的符号秩和检验成组设计两样本比较的秩和检验成组设计多样本比较的秩和检验随机区组设计资料的秩和检验本讲稿第四页,共三十八页4第一节第一节 配对设计的符号秩和检验配对设计的符号秩和检验Wilcoxon符号秩和检验(Wilcoxonsignedranktest)是推断其差值是否来自中位数为零的
3、总体的方法,可用于:配对设计的两样本的比较配对设计的两样本的比较单一样本与总体中位数的比较单一样本与总体中位数的比较本讲稿第五页,共三十八页5一、配对设计的两样本的比较一、配对设计的两样本的比较一、配对设计的两样本的比较一、配对设计的两样本的比较 例7.1某医院用中草药“抗苯一号”治疗9例苯中毒患者,其治疗前后的白细胞总数如表7-1,问该药是否对患者的白细胞总数有影响?本讲稿第六页,共三十八页6查表法(查表法(n25)1建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:Md=0H1:Md0=0.052计算检验统计量计算检验统计量T 值值(1)求各对的差值求各对的差值(2)编编秩秩按差
4、值的绝对值由小到大编秩,依差值的正负给秩次冠以正负号。编秩时,若若差差值值为为0,舍舍去去不不计计;若差差值值的的绝绝对对值相等,则取其平均秩次值相等,则取其平均秩次。配对设计两样本比较配对设计两样本比较本讲稿第七页,共三十八页7 (3)求求秩秩和和并并确确定定统统计计量量T分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,可任任取取正正秩秩和和或或负负秩秩和和为为统计量统计量T。T+T-=n(n+1)/2,n为不等于0的对子数。3确定确定P值,做出推断结论值,做出推断结论 当当n25时时,以T值查附表10T界值表(配对设计用),若若检检验验统统计计量量T值值在在T界界值值范范围围内
5、内,则则P值值大大于于相相应应的的概概率率水水平平;若若T值值在在T界界值值范范围围外外或或等等于于界界值值,则则P值值小小于于或或等等于于相相应应的的概率水平。概率水平。配对设计两样本比较配对设计两样本比较本讲稿第八页,共三十八页8本例n=9,T=15.5,查附表10T界值表,得双侧P0.05;故按=0.05检验水准,不拒绝H0,尚不能认为患者治疗前后的白细胞总数的差别有统计学意义;即尚不能认为中草药“抗苯一号”对苯中毒患者的白细胞总数有影响。当当n5时,应用秩和检验不能得出双侧有统计学意义时,应用秩和检验不能得出双侧有统计学意义的概率,故的概率,故n必须大于必须大于5。配对设计两样本比较配
6、对设计两样本比较本讲稿第九页,共三十八页9正态近似法:正态近似法:若若n 25,超出附表的范围,用正态近似法作u 检验:若相同秩次较多时相同秩次较多时(不包括差值为0者),计算校正uc:其中tj为第j(j=1,2)个相同秩次的个数。配对设计两样本比较配对设计两样本比较本讲稿第十页,共三十八页10T分布以均数为中心,均数处频数最多,左右对称,向两侧逐渐减少。当H0成立时,从总体随机抽取n=5的一个样本,所得T值在均数附近的概率最大,而T值远离均数的概率较小。随着n增大,T分布逐渐逼近正态分布,其均数为n(n+1)/4,方差为n(n+1)(2n+1)/24;当n25时,T分布较好的近似正态分布。配
7、对设计符号秩和检验,配对设计符号秩和检验,n必须大于必须大于5。T 分布分布本讲稿第十一页,共三十八页11二、单一样本与总体中位数的比较二、单一样本与总体中位数的比较二、单一样本与总体中位数的比较二、单一样本与总体中位数的比较例7.2已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量如表。问该厂工人的尿氟含量是否高于当地正常人?本讲稿第十二页,共三十八页121建立检验假设,确定检验水准建立检验假设,确定检验水准H0:M=2.15H1:M 2.15单侧=0.052计算检验统计量计算检验统计量(1)求差值求差值差值为各观察值与已知总体中位数之差。(2
8、)编秩次编秩次方法同配对设计。(3)求秩和并确定统计量求秩和并确定统计量本例T+=62.5,T-=3.5,取T=3.5。3确定确定P 值,做出推断结论值,做出推断结论 本例n=11,T=3.5,查T界值表,得P0.005,按=0.05检验水准,拒绝H0,接受H1,可认为单一样本与总体中位数比较单一样本与总体中位数比较本讲稿第十三页,共三十八页13第二节第二节 成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验(Wilcoxon两样本比较法),研究目的是推断两样本分别代表的总体分布是否相同推断两样本分别代表的总体分布是否相同。原始数据的两样本比较原始数据的两样本
9、比较频数表资料(或等级资料)的两样本比较频数表资料(或等级资料)的两样本比较 本讲稿第十四页,共三十八页14一、原始数据的两样本比较一、原始数据的两样本比较例7.3某医师为研究血铁蛋白与肺炎的关系,随机抽查了10名肺炎患者和16名正常志愿者,测得血铁蛋白(g/L)见表7-3,问肺炎患者与正常人血铁蛋白含量有无差别?1建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:肺炎患者与正常人的血清铁蛋白总体分布相同H1:肺炎患者与正常人的血清铁蛋白总体分布不同 =0.05 成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验本讲稿第十五页,共三十八页15本讲稿第十六页,共三十八页16 2计
10、算统计量计算统计量T 值值(1)编秩次)编秩次将2组数据由小到大统一编秩。遇有相同数据且不同组时取平均秩次。(2)求秩和并确定统计量)求秩和并确定统计量T 2组秩次分别相加,其对应的秩和分别为183.5和167.5。若2组例数相等,则任取一组的秩和为统计量;若2组例数不等,以样本例数较小者为n1,其对应的秩和为统计量T。3确定确定P值,做出推断结论值,做出推断结论 以n1、(n2-n1)和检验统计量T 值查附表11T界值表确定P值:若若T 值在界值范围内,则值在界值范围内,则P 值大于相应的概率值大于相应的概率;若若T 值在界值值在界值范围外或等于界值,则范围外或等于界值,则P 值小于或等于相
11、应概率值小于或等于相应概率。本例本例成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验原始数据的两样本比较原始数据的两样本比较本讲稿第十七页,共三十八页17若若n1 或或n2-n1 超超出出了了附附表表11 T 界界值值表表的的范范围围,可用正态近似法:式中N=n1+n2,0.5为连续性校正数。若相同秩次较多(如超过若相同秩次较多(如超过25%)时应进行校正,)时应进行校正,其中 tj为第j个相同秩次的个数。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验原始数据的两样本比较原始数据的两样本比较正态近似法:正态近似法:本讲稿第十八页,共三十八页18 二、频数表资料二、频数表资料(
12、或等级资料或等级资料)的两样本比较的两样本比较 例7.4用某药治疗不同病型的老年慢性支气管炎病人,疗效见表7-4,试比较该药对2种病型的疗效?本讲稿第十九页,共三十八页191建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:两种病型的病人疗效总体分布相同 H1:两种病型的病人疗效总体分布不同=0.052计算检验统计量计算检验统计量(1)编秩编秩本例为等级资料,先计算各等级的合计人数,再确定各等级的秩次范围,并计算其平均秩次。(2)求秩和并计算检验统计量求秩和并计算检验统计量以各等级的平均秩次分别乘以两组相应等级的例数,再分别求秩和得到T1、T2。成组设计两样本比较的秩和检验成组设计两
13、样本比较的秩和检验频数表或等级资料的两样本比较频数表或等级资料的两样本比较本讲稿第二十页,共三十八页20本讲稿第二十一页,共三十八页21本例T1=8780.5,T2=12955.5,n1=82,n2=126,故检验统计量T=8780.5。因n1=82,需用u检验;又因该等级资料的相同秩次过多,需进行校正:3确定确定P值,做出推断结论值,做出推断结论 uc=0.54130.05,按=0.05检验水准,不拒绝H0,尚不能认为该药对两种病型支气管病人的疗效分布不同。成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验频数表或等级资料的两样本比较频数表或等级资料的两样本比较本讲稿第二十二页,共三十
14、八页22第三节第三节 成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验KruskalWallis检验。该法是由Kruskal和Wallis在Wilcoxon秩和检验的基础上扩展的方法,亦称为K-W检验或H检验。研究目的是推断各样本分别代表的推断各样本分别代表的总体分布有无差别总体分布有无差别。n原始数据的比较原始数据的比较n频数表资料的比较频数表资料的比较本讲稿第二十三页,共三十八页23一、原始数据的比较一、原始数据的比较例7.5某院外科用3种手术方法治疗肝癌患者15例,每组5例,每例术后生存月数如表7-5。试问3种不同手术方法治疗肝癌的效果有无不同?本讲稿第二十四页,共三十八页241
15、建立检验假设,确定检验水准建立检验假设,确定检验水准H0:3个总体的分布位置相同H1:3个总体的分布位置不同或不全相同0.052计算统计量计算统计量H值值(1)编秩编秩将各组数据统一由小到大编秩,如遇有相等数值且不在同组者取平均秩次。(2)求秩和并计算检验统计量求秩和并计算检验统计量分别将各组秩次相加,得出各组的秩和Ti;计算H值:Ti为各组的秩和,ni为各组例数,N=ni。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验原始数据的比较原始数据的比较本讲稿第二十五页,共三十八页25 3确定确定P 值,做出推断结论值,做出推断结论以N=15,n1n2n35查附表12.1H界值表,得P0.
16、05;按=0.05检验水准,不拒绝H0,尚不能认为妊娠妇女在不同阶段时胎盘过早剥离的出血量的差别有统计学意义。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验频数表资料的比较频数表资料的比较本讲稿第二十九页,共三十八页29三、多个样本间两两比较的秩和检验三、多个样本间两两比较的秩和检验当经多样本的H检验拒绝H0时,只能得出各组的总体分布位置不同或不全相同的结论,常需进一步作组间的多重比较,以推断哪两个总体分布不同。可用扩展了的t 检验,各组例数相等或不相等时均适用。式中,、和nA、nB分别为任2个对比组(A、B)的平均秩和与样本含量,k为处理组数,N为各处理组的总例数,H为秩和检验中算
17、得的统计量H值或Hc 值。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验本讲稿第三十页,共三十八页30例7.7对例7.5资料作两两比较。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验多个样本间两两比较多个样本间两两比较本讲稿第三十一页,共三十八页311建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:3个处理组中任两个总体的分布相同 H1:任2个总体的分布不同0.052计算统计量计算统计量 t 值值如1组与2组比较3确定确定P值,做出推断结论值,做出推断结论以Nk 和各对比组的t 值,查t 界值表得P 值。成组设计多样本比较的秩和检验成组设计多样本比较的秩和检验多
18、个样本间两两比较多个样本间两两比较本讲稿第三十二页,共三十八页32本讲稿第三十三页,共三十八页33第四节第四节 随机区组设计资料的秩和检验随机区组设计资料的秩和检验 Friedman检验,该法由M.Friedman在符号检验的基础上提出来的,也称M检验。用于配伍组设计资料的比较。n原始数据的比较n多个样本间两两比较的秩和检验。本讲稿第三十四页,共三十八页34一、原始数据的比较一、原始数据的比较例7.8不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)如下表,试比较4组雌性大白鼠子宫重量的差别有无统计学意义。本讲稿第三十五页,共三十八页351建立检验假设,确定检验水准建立检验假设,确定检验水准
19、 H0:3种剂量雌激素注射后子宫重量总体分布相同 H1:3个总体分布不同或不全相同=0.052计算统计量计算统计量M 值值(1)编秩编秩先将各配伍组内各配伍组内数据由小到大编秩,相同数值者取平均秩次。(2)求秩和并计算检验统计量求秩和并计算检验统计量计算各处理组的秩和Ti;,,k 为处理组数 本例,随机区组设计资料的秩和检验随机区组设计资料的秩和检验原始数据的比较原始数据的比较本讲稿第三十六页,共三十八页36 3确定确定P值,做出推断结论值,做出推断结论以处理组数处理组数 k 和配伍组数和配伍组数 b 查附表查附表12.2 M 界值表界值表,得出P值。本例,k=3,b=4,查M 界值表,M0.
20、05(3,4)=26,M=180.05,按=0.05检验水准不拒绝H0,尚不能认为当处理组数k 或配伍组数b 超出M 界值表的范围时,可采用近似x2分布法:式中,k为处理组数,b为配伍组数,Ti为第i个处理组的秩和。随机区组设计资料的秩和检验随机区组设计资料的秩和检验原始数据的比较原始数据的比较本讲稿第三十七页,共三十八页37二、多个样本间两两比较的秩和检验二、多个样本间两两比较的秩和检验 当随机区组设计资料的秩和检验拒绝H0,接受H1时,需进一步作组间的多重比较,其检验统计量为q 值,方法步骤与方差分析的q 检验基本相同:1将各处理组的秩和将各处理组的秩和Ti由小到大排序,并列出各对比组由小到大排序,并列出各对比组 及其包括的组数及其包括的组数a。2求统计量求统计量q:其中,k为处理组数,b为配伍组数,TA、TB分别为对比组的秩和,是其对应的标准误。3以以和和组组数数a查查附附表表5 q界界值值表表,得得P值值,按按所所取取检检验验水水准准做出推断结论。做出推断结论。本讲稿第三十八页,共三十八页38