《医学统计学李琳琳非参数检验.pptx》由会员分享,可在线阅读,更多相关《医学统计学李琳琳非参数检验.pptx(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、12023/4/14参数统计对总体参数进行统计推断,一般要求各样本来自正态分布总体,总体方差齐。如t检验、方差齐性检验,方差分析等。非参数统计仅对分布进行推断,不依赖于分布类型。其方法有很多,最常用的是秩和检验。第1页/共49页主要适用于以下资料主要适用于以下资料22023/4/141总体分布类型不清;2不满足正态或方差齐性的资料;3分布的一端或两端无确定数据的资料;4等级资料。用秩次(rank)来构造统计量是非参数检验的主要特点。第2页/共49页3 2023/4/14【教学内容】1 概论2 配对设计和单样本资料的符号秩和检验3 两独立样本的秩和检验第3页/共49页42023/4/14 【教学
2、要求教学要求】熟悉:熟悉:理解非参数检验的概念以及非参数检验和参数检验的不同。掌握:掌握:掌握不同设计类型的秩和检验的实施方法及其应用条件。第4页/共49页2023/4/1451 概论第5页/共49页62023/4/14 在实践中我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、实验鼠发癌后的生存日数、护理效果评分等,这类资料有如下特点:1.资料的总体分布类型未知;2.资料分布类型已知,但不符合正态分布;3.或某些变量可能无法精确测量:疼痛程度 无、轻度、中度、重度 疾病治疗结果 控制、显效、有效、无效第6页/共49页72023/4/14 此时需要应用一种不依赖于总体的分布类型
3、,可以不考虑被研究对象为何种分布以及分布是否已知的统计推断方法。此类方法通常不会涉及到研究对象的参数。这时统计推断是比较分布而不是比较参数,称为“非参数统计”(nonparametric statistics)。第7页/共49页82023/4/14 非参数统计可以不考虑被研究对象为何种分布以及分布是否已知,其统计推断的基础是比较分布而不是比较参数。在统计推断方法中,凡是以样本来自已知分布(如正态分布)的总体为假设基础,对总体参数(如总体均数)进行估计或检验的方法,称为参数统计,如前边介绍的t检验,方差齐性检验。第8页/共49页92023/4/14非参数统计的基本思想非参数统计的基本思想 在不知
4、总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。通过秩次来构造统计量是非参数检验的主要特点。第9页/共49页102023/4/14非参数统计方法的主要优点非参数统计方法的主要优点 适用范围广适用范围广。对变量的分布无特殊要求。对数据要求不严对数据要求不严。对某些指标不便准确测定,只能以严重程度,优劣等级,先后次序等作记录的资料也可应用。第10页/共49页112023/4/14非参数统计方法的主要缺点非参数统计方法的主要缺点 对于符合参数检验的资料如果用非参数检验,由于没有充分利用
5、资料提供的信息,故检验检验效能低于参数检验效能低于参数检验,若要使检验效能相同,往往需要更大的样本含量。第11页/共49页122023/4/14 因此,在实际工作中对符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;若不能满足参数检验条件的资料,应选用非参数检验。非参数统计方法很多,本章主要介绍其中应用最广的秩和检验。第12页/共49页2023/4/14132 2 配对设计和单样本资料的配对设计和单样本资料的符号秩和检验符号秩和检验第13页/共49页142023/4/14【例6-15】留取12名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如
6、下,问两种方法测得尿汞值平均含量有无差别?表6-29 两种方法测得的尿汞值含量(单位:mg/L)第14页/共49页152023/4/14【案例解析】本研究属于配对设计的定量资料,首先判断是否符合配对设计t检验的适用条件,即差值是否来自正态分布。通过对差值进行正态性检验(见后),发现差值不是来自正态总体,所以用配对资料的符号秩和检验进行统计分析。第15页/共49页配对资料的符号秩和检验的基本思想是:如果两种检测方法的平均效应相同,这些配对数值之差应服从于以0为中心的对称分布,也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和在理论上应相等,或比较接近;如果正秩和与负秩和差异
7、太大,超出了规定的范围,就拒绝H0,接受H1,认为差值的总体中位数不等于0。162023/4/14第16页/共49页172023/4/14配对符号秩和检验步骤 1 建立假设,确定检验水准H0:Md=0H1:Md0=0.052 计算检验统计量差值的中位数第17页/共49页182023/4/14求差值 见第(4)列编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为0,则舍去不计。求秩和 分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,取两者中较小的秩和为统计量T,本例取T=33。第18页/共49页表6-30 两种方
8、法测得的尿汞含量和编秩用表 123第19页/共49页202023/4/14第20页/共49页212023/4/14第21页/共49页222023/4/14正态近似法(n50)第22页/共49页232023/4/14校正公式:第23页/共49页242023/4/14【结果报告】表6-39 两种方法测得的尿汞值含量(mg/L)第24页/共49页252023/4/14【案例案例2 2】已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下:2.15,2.10,2.20,2.12,2.42,2.52,2.62,2.72,2.99,3.19
9、,3.37,4.57。问该厂工人的尿氟含量是否高于当地正常人?第25页/共49页262023/4/14 1建立检验假设,确定检验水准 H0:M 2.15 H1:M2.15 =0.05 2计算检验统计量 (1)求差值,见表4,与配对资料符号秩和检验不同的是,这里的差值是各观察值与已知总体中位数之差。第26页/共49页272023/4/14表4 12名工人尿氟含量测定结果 第27页/共49页282023/4/14 (2)编秩,方法同上。(3)求秩和T+=62.5,T-=3.5,取T=3.5。3确定P值,做出推断结论 本例n=11,T=3.5,查T界值表得P0.05,按=0.05检验水准,拒绝H0,
10、接受H1。可认为该厂工人尿氟含量高于当地正常人。第28页/共49页2023/4/14293 3 两独立样本的秩和检验两独立样本的秩和检验第29页/共49页302023/4/14【例6-16】将22例血友病病人随机分成2组,试验组12例,对照组10例。试验组采用A厂家生产的冻干人凝血酶原复合物,对照组采用B厂家生产的冻干人凝血酶原复合物,分别于给药前和给药1小时后测量他们的凝血因子IIII效价并计算差值(单位:%)%),比较不同厂家生产的冻干人凝血酶原复合物对血友病病人的凝血因子IIII效价增加量是否相同?第30页/共49页312023/4/14【案例解析】设计类型:两独立样本;资料类型:定量资
11、料资料处理流程:依据正态性和方差齐性检验结果资料处理流程:依据正态性和方差齐性检验结果资料处理流程:依据正态性和方差齐性检验结果资料处理流程:依据正态性和方差齐性检验结果决定采用何种方法。决定采用何种方法。决定采用何种方法。决定采用何种方法。对照组正态性检验:P=0.022,因此采用两独立样本秩和检验。第31页/共49页322023/4/14t检验两样本均来自正态分布总体;总体方差齐。校正t检验两样本均来自正态分布总体;总体方差不齐。两独立样本秩和检验有任何一组数据来自偏态分布总体两独立样本定量资料分析方法第32页/共49页332023/4/142.计算检验统计量(1)编秩:将两组数据合起来由
12、小到大秩;(2)求秩和:分别求出两组秩次之和,取两者中样本含量较小的那组所对应的秩和为统计量第33页/共49页342023/4/14第34页/共49页3.确定P值,作出结论(1)查表法:查P389中的两独立样本比较的秩和检验用界值表。判定标准:若T值位于界值范围内,其P值大于相应的概率;若T 值等于界值或在界值范围外,其P 值等于或小于相应的概率。352023/4/14第35页/共49页362023/4/1484-146第36页/共49页本例,双侧概率0.05对应的T界值为84146,检验统计量为103,在界值范围内,因此不拒绝H0,根据本研究可以认为两个厂家生产的冻干人凝血酶原复合物对血友病
13、病人的凝血因子II效价增加量相同。372023/4/14第37页/共49页382023/4/14第38页/共49页392023/4/14【结果报告】第39页/共49页402023/4/14【例6-17】比较城市和农村地区居民对卫生服务的满意程度有无差异。表6-28城市和农村地区居民对卫生服务的满意程度第40页/共49页412023/4/141.建立检验假设H0:城市和农村地区居民对卫生服务的满意程度相同H1:城市和农村地区居民对卫生服务的满意程度不同 =0.052.计算检验统计量相同的满意度取相同的秩次第41页/共49页422023/4/14第42页/共49页 小 结 1.1.非参数检验在假设
14、检验中不对参数作明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。当资料适用参数检验方法时,用非参常会损失部分信息,降低检验效能。2.2.秩和检验是通过对数据依小到大排列秩次,求秩和来进行假设检验的方法,可用于两独立样本比较、配对资料比较、多个独立样本比较、随机配伍组比较等。第43页/共49页 3.正确应用秩和检验方法 秩和检验既能分析定量变量资料,又能分析有序变量或等级变量资料,实际中要注意其应用条件。对于定量变量资料,如果符合参数检验方法的前提条件,要用参数统计方法,在不符合参数统计方法条件时,用秩和检验;对有序变量或等级变量资料,如果是疗效检验,用秩和检验,不用 检验。第44
15、页/共49页假设检验小结参数估计:参数估计:点估计、区间估计点估计、区间估计统计统计推断推断假设假设检验检验定量资料定量资料随机分组随机分组定性资料定性资料随机分组随机分组非参数检验非参数检验秩和检验秩和检验(偏态分布)(偏态分布)参数检验参数检验:t 检验检验(正态分布)(正态分布)完全随机设计完全随机设计配对设计配对设计2检验检验完全随机设计完全随机设计配对设计配对设计非参数检验非参数检验秩和检验秩和检验(等级资料)(等级资料)第45页/共49页练习题1.1.在统计检验中是否选用非参数统计方法,A.A.要根据研究目的和数据特征作决定 B.B.可在算出几个统计量和得出初步结论后 进行选择 C
16、.C.要看哪个统计结论符合专业理论 D.D.要看哪个值更小 E.E.只看研究目的第46页/共49页2.2.在作两样本均数比较时,已知n n1 1、n n2 2均小于3030,总体方差不齐且呈极度偏峰的资料宜用 。A.tA.t 检验 B.t B.t 检验 C.u C.u 检验 D.D.秩和检验 E.tE.t检验与秩和检验均可3.3.两样本秩和检验的H H0 0是 。A.A.两样本秩和相等 B.B.两总体分布相同 C.C.两样本分布相同 D.D.两总体秩和相等 E.E.两总体分布无关第47页/共49页482023/4/14THE END第48页/共49页492023/4/14感谢您的观看。第49页/共49页