《常用统计分析方法介绍与实例解析讲稿.ppt》由会员分享,可在线阅读,更多相关《常用统计分析方法介绍与实例解析讲稿.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、常用统计分析方法介绍与实例解析第一页,讲稿共五十二页哦基本概念基本概念变量类型变量类型常用推断性统计分析常用推断性统计分析1.两组之间比较定性资料2.两组之间比较等级资料3.两组之间比较定量资料4.两组以上资料(无序多分类)的比较定性资料5.两组以上资料(无序多分类)的比较等级资料6.两组以上资料(无序多分类)的比较定量资料7.两等级变量关系的分析8.等级变量与定量变量之间的关系分析9.两定量变量关系的分析10.多选题分析11.Logisitic回归分析目 录第二页,讲稿共五十二页哦基本概念基本概念变量类型变量类型1 1、定性变量:、定性变量:p最常见的是分类变量或名义变量;如职业:工人、农民
2、、民工、商人、学生等,此为多分类变量;最简单和最常用的分类变量是二分类变量,如性别:男、女,某种疾病:有、无,某种结局:出现、未出现等。第三页,讲稿共五十二页哦p有序变量或等级变量 与分类变量不同,各种可能的“取值”中自然地存在着次序,如问卷调查中对某件事情的满意程度:非常不满意、有点满意、满意、很满意、非常满意;临床体检或实验室检验常用、来表示测量结果;再如护理与康复,2004,3(1):54-55,临床教学中培养护生观察能力的方法探讨,作者选用了讲座、教学查房和案例教学三种方法,提高护生观察能力的作用变量为:很有帮助、有帮助、一般。第四页,讲稿共五十二页哦2 2、定量变量:分两种、定量变量
3、:分两种离散型和连续型离散型和连续型p离散型:只能取整数值,如一年中的手术病人数,一年里的新生儿数,细菌菌落数等;p连续型:可以取实数中的任何数值,如血压、身高、体重等,可以在实数的一定范围内连续取值;有一些测量值,如红细胞计数,虽然以“个”为单位时只能取连续值,但其数值很大,当以“千”或“万”为单位时,却可取小数值,故通常把这类变量也作为连续型变量处理。第五页,讲稿共五十二页哦p 有时为了数据分析的方便,可以将一种类型的变量转化有时为了数据分析的方便,可以将一种类型的变量转化为另一种类型。但只能由高级向低级转化,即连续型为另一种类型。但只能由高级向低级转化,即连续型有序有序分类分类二分类。二
4、分类。实例:实例:如如护理与康复护理与康复20042004,3 3(1 1):):3-43-4,全子宫切除术后最佳下床活动时间与,全子宫切除术后最佳下床活动时间与肛门排气时间关系的探讨,作者把肛门排气时间分为三个等级(肛门排气时间关系的探讨,作者把肛门排气时间分为三个等级(30h30h),然后再进行分析。),然后再进行分析。第六页,讲稿共五十二页哦常用推断性统计分析方法常用推断性统计分析方法第七页,讲稿共五十二页哦p 两组之间比较两组之间比较定性资料定性资料 (1 1)二分类资料)二分类资料 I I 成组设计:所用统计方法为成组设计:所用统计方法为四格表四格表2 2 检验。第八页,讲稿共五十二
5、页哦 第九页,讲稿共五十二页哦 第十页,讲稿共五十二页哦 II II 配对设计:配对设计:对一组样品同时用两种检测方法对其进行检测,每种检测方法检测结果都分为阳性和阴性,数出两种检测方法同时判定为阳性、阴性的样品数以及它们检测结果不一致的样品数,将结果表示成配对四格表的资料格式。所用统计方法为配对四格表2 检验。实例1中,两种检测方法不知何者为优,任何一种方法检测的结果都有假阳性和假阴性,比较它们检测结果不一致的两个频数,无论差别有无统计学意义,都不能说明两种检测方法何者为优,缺乏“金标准”,因而没有必要做统计分析。第十一页,讲稿共五十二页哦 实例2属于隐含金标准的配对四格表资料,若甲培养基培
6、养出阳性结果,而乙却培养出阴性结果,表明甲优于乙,这种阳性结果为真阳性,此时值得做统计分析。实例3则可以明确地判定试验检测方法的优劣。配对四格表的2 检验可用McNemar 2 检验,以检测结果不一致部分差别是否具有统计学意义。当然也可用Kappa检验法检验两种检测方法的检测结果是否具有一致性。估计值估计值P值值卡方34.0000 5.51121E-09校正卡方32.0294 1.51856E-08估计值估计值P值值卡方0.14290.705457校正卡方0.0000 1.000000结果结果第十二页,讲稿共五十二页哦 第十三页,讲稿共五十二页哦(2 2)无序多分类资料:所用方法为)无序多分类
7、资料:所用方法为2 2CC表的表的 2 2检验。检验。SPSS数据格式第十四页,讲稿共五十二页哦可以采用两组有序变量资料的可以采用两组有序变量资料的WilcoxonWilcoxon秩和检验秩和检验 两组之间比较两组之间比较等级资料等级资料干预过去三个月您抽烟吗U ValueP Value从不很少有时经常前4648461345291-2.88510.0039后3163297181164合计7811758526455第十五页,讲稿共五十二页哦 第十六页,讲稿共五十二页哦 第十七页,讲稿共五十二页哦可以选用的方法有成组设计的t检验、u检验、单样本t检验(与总体作比较,实际上此时因素也为二分类)、配对
8、t检验、非参数Wilcoxon检验、符号检验、符号秩和检验等。参数检验与非参数检验的区别?通常参数检验的检验效能要高于非参数检验,但当参数检验的条件(正态性、方差齐性)得不到满足、开口资料、等级资料或资料的总体分布未知时,可以使用非参数检验的方法进行分析。成组设计和配对设计的区别?配对设计是按照一些非实验因素将受试对象配成对子,给予每对中的个体以不同的处理,配对的条件一般为年龄、性别、体重。其优点是在同一对的试验对象间取得均衡,从而提高试验的效率。通常分为自身配对设计(某中措施作用于同一个体或两种措施作用于同一个体)和非自身配对设计两种。两组之间比较两组之间比较定量资料定量资料第十八页,讲稿共
9、五十二页哦 (1 1)成组设计的)成组设计的t t检验,设计类型为成组设计,且因素变量为二分类变量,分检验,设计类型为成组设计,且因素变量为二分类变量,分析前需要先对资料的正态性和方差齐性进行检验(这是很多参数检验的前提条析前需要先对资料的正态性和方差齐性进行检验(这是很多参数检验的前提条件)。件)。例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量(克),问两周后记录各鼠体重增加量(克),问两组动物的增重是否有差别?(此处正态性和方差齐性检验略)。组动物的增重是否有差别?(此处正态性和方差齐性检验略)。利用SPSS进行分析,数据文件及
10、格式见“成组设计t检验.sav”,SPSS菜单操作为:分析比较均值独立样本T检验 结果见下页结果见下页第十九页,讲稿共五十二页哦 Independent Samples Test.015.9051.89117.0761.91113.082.078Equal variances assumedEqual variances not assumed体 重 增 加 量FSig.Levenes Test forEquality ofVariancestdfSig.(2-tailed)t-test for Equality of Means 方差齐性检验的分析结果,P值(Sig)0.9050.05,表明
11、方差齐性 t检验分析结果,P值(Sig)0.0760.05,表明两组动物增加的重量无差异(无统计学意义)。当方差齐性时,看第一行的结果(t1.891,P0.076),当方差不齐时,看第二行的结果(t1.911,P0.078)第二十页,讲稿共五十二页哦 (2 2)成组设计的)成组设计的u u检验,当样本量较大时,两组之间均数的比较可以用检验,当样本量较大时,两组之间均数的比较可以用u u检检验,其在验,其在SPSSSPSS中的实现过程同中的实现过程同t t检验,此处略。检验,此处略。(3 3)单样本)单样本t t检验;检验;例:通过以往大规模调查,已知某地婴儿出生体重均数为例:通过以往大规模调查
12、,已知某地婴儿出生体重均数为3.30kg,今测得某地一组婴儿,今测得某地一组婴儿的出生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同?的出生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同?利用SPSS进行分析,数据文件及格式见“单样本t检验.sav”,SPSS菜单操作为:分析比较均值单样本T检验 One-Sample Test-1.23211.244婴 儿 体 重tdfSig.(2-tailed)Test Value=3.30第二十一页,讲稿共五十二页哦 (4 4)配对)配对t t检验检验 例:用某药治疗例:用某药治疗10例高血压病人,测得治疗前后各病人的舒张压,问该药是否有降例高血压
13、病人,测得治疗前后各病人的舒张压,问该药是否有降低舒张压的作用?低舒张压的作用?利用SPSS进行分析,数据文件及格式见“配对t检验.sav”,SPSS菜单操作为:分析比较均值配对样本T检验结果见下页结果见下页第二十二页,讲稿共五十二页哦 Paired Samples Test9.70012.3472.4849.035治 疗 前 -治 疗 后Pair 1MeanStd.DeviationPaired DifferencestdfSig.(2-tailed)第二十三页,讲稿共五十二页哦 (5 5)非参数)非参数WilcoxonWilcoxon秩和检验秩和检验,适用于成组设计资料。,适用于成组设计资
14、料。例:测得某病的健康人例:测得某病的健康人12人和患者人和患者10人的某指标值,问两组之人的某指标值,问两组之间该指标值是否有差异?间该指标值是否有差异?第二十四页,讲稿共五十二页哦 第二十五页,讲稿共五十二页哦(1 1)二分类)二分类:所用方法为所用方法为R R2 2表的表的 2 2检验。检验。如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的比较等等。比较等等。两组以上资料(无序多分类)的比较两组以上资料(无序多分类)的比较定性资料定性资料 第二十六页,讲稿共五十二页哦第二十七页,讲稿共五十二页哦(2 2)多分类)多分
15、类:所用方法为所用方法为R RCC表的表的 2 2检验。检验。第二十八页,讲稿共五十二页哦 实例2中小于5的理论频数的格子数超过了总格子数的1/5,若选用一般的2检验公式计算,将增大犯假阳性错误的概率,故此处应选用Fishers精确检验法。第二十九页,讲稿共五十二页哦第三十页,讲稿共五十二页哦第三十一页,讲稿共五十二页哦此时资料属于单向有序的此时资料属于单向有序的R RCC表资料,可以使用秩和检验、表资料,可以使用秩和检验、RiditRidit分分析和析和LogisticLogistic回归的方法分析。回归的方法分析。两组以上资料(无序多分类)的比较两组以上资料(无序多分类)的比较等级资料等级
16、资料 第三十二页,讲稿共五十二页哦 Kruskal-Wallis Test:使用SPSS分析实例2资料,数据格式见右侧截图。菜单操作为:分析非参数检验旧对话框 K 个独立样本注意:例数必须先进行加权操作Test Statisticsa,b61.1462.000Chi-SquaredfAsymp.Sig.疗效Kruskal Wallis Testa.Grouping Variable:药物b.第三十三页,讲稿共五十二页哦当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设计的方差分析(属两因素方差分析,其与二分类的配对计的方差分析(
17、属两因素方差分析,其与二分类的配对t t检验相对应检验相对应)、非参数)、非参数Kruskal-WallisKruskal-Wallis检验及非参数检验及非参数FriedmanFriedman检验等。检验等。(1 1)单因素方差分析)单因素方差分析 例:某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,将糖新药高剂量组21人、低剂量组19人、对照组20人。对照组用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?(此处正态性和方差齐
18、性检验略)。利用SPSS进行分析,数据文件及格式见“单因素方差分析.sav”,SPSS菜单操作为:分析比较均值单因素Anova 两组以上资料(无序多分类)的比较两组以上资料(无序多分类)的比较定量资料定量资料 第三十四页,讲稿共五十二页哦 截图二:两两比较对话框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法。截图一:方差同质性检验第三十五页,讲稿共五十二页哦 Test of Homogeneity of Variances血糖下降值.177257.838Levene Statisticdf1df2Sig.ANOVA血 糖 下 降 值176.765288.3
19、825.537.006909.8725715.9631086.63759Between GroupsWithin GroupsTotalSum of SquaresdfMean SquareFSig.方差齐性检验结果:方差齐性检验结果:P0.05,P0.05,方差齐方差齐方差分析结果,F=5.537,P=0.006=三组,定量 Wilcoxon:两组,等级、定量 Kruskal-wallis:=三组,等级、定量 相关分析:等级(kendall),非正态、定量(spearman)正态、定量:pearson相关分析第四十六页,讲稿共五十二页哦 多选题的两种形式:多选题的两种形式:多选题分析多选题分
20、析 第一种形式:您认为健康的生活方式包括哪些内容:a.戒烟、限酒 b.平衡膳食 c.心胸开阔 d.多吃保健品、营养品 e.控制体重 f.多吃多睡 g.经常运动 h.不知道第二种形式:对公众进行流感或人禽流感预防和控制等方面最主要的宣传形式(限选三种)_a.报纸 b.杂志 c.电视 d.广播 e.网络 f.发放宣传材料 g.社区宣传栏/墙报/街头标语 h.社区咨询第四十七页,讲稿共五十二页哦 第四十八页,讲稿共五十二页哦 第四十九页,讲稿共五十二页哦Logistic回归分析p Logistic回归是适用于反应变量(即因变量)为分类变量的回归分析,近年来在许多研究领域得到了广泛的应用。p Logistic归按照反应变量的类型可分为:u两分类反应变量的Logistic回归;u多分类有序反应变量的Logistic回归;u多分类无序反应变量的Logistic回归。p Logistic回归按照研究设计的类型可分为:u非条件Logistic回归,即研究对象未经匹配;u1:1的条件Logistic回归,即研究对象按1:1进行匹配;u1:m或m:n的条件Logistic回归,即研究对象按1:m或m:n进行匹配。第五十页,讲稿共五十二页哦单因素第五十一页,讲稿共五十二页哦多因素第五十二页,讲稿共五十二页哦