常用统计分析方法及其软件实现讲稿.ppt

上传人:石*** 文档编号:48375353 上传时间:2022-10-06 格式:PPT 页数:53 大小:2.13MB
返回 下载 相关 举报
常用统计分析方法及其软件实现讲稿.ppt_第1页
第1页 / 共53页
常用统计分析方法及其软件实现讲稿.ppt_第2页
第2页 / 共53页
点击查看更多>>
资源描述

《常用统计分析方法及其软件实现讲稿.ppt》由会员分享,可在线阅读,更多相关《常用统计分析方法及其软件实现讲稿.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于常用统计分析方法及其软件实现第一页,讲稿共五十三页哦2基本概念基本概念变量类型变量类型定性变量定性变量二分类变量如性别:男、女,某种疾病:有、无,某种结局:出现、未出现等。无序多分类如职业:工人、农民、民工、商人、学生等有序变量有序变量(等级变量等级变量)如问卷调查中对某件事情的满意程度:非常不满意、有点满意、满意、很满意、非常满意;临床体检或实验室检验常用、来表示测量结果第二页,讲稿共五十三页哦3定量变量定量变量离散型:只能取整数值,如一年中的手术病人数,一年里的新生儿数,细菌菌落数等;连续型:可以取实数中的任何数值,如血压、身高、体重等,可以在实数的一定范围内连续取值第三页,讲稿共五十

2、三页哦4例:某县例:某县乳腺癌相乳腺癌相关高危因关高危因素调查问素调查问卷卷(部分部分)练习:判断变量类型练习:判断变量类型第四页,讲稿共五十三页哦5数据的简单描述数据的简单描述 定量资料集中趋势:算术均数、中位数、几何均数、众数离散趋势:标准差、四分位数间距、方差、极差、变异系数注意:分析时,根据资料正态性特征,用算术均数与标准差,或中位数与四分位数间距描述资料的集中趋势和离散趋势有序或分类资料频数分析第五页,讲稿共五十三页哦6例:以例:以“数据数据1.sav1.sav”为例,计算年龄的集中趋为例,计算年龄的集中趋势和离散趋势指标。势和离散趋势指标。菜单:分析菜单:分析描述统计描述统计描述描

3、述第六页,讲稿共五十三页哦7菜单:分析菜单:分析描述统计描述统计频率频率第七页,讲稿共五十三页哦8现场调查资料常用推断性统计分析方法现场调查资料常用推断性统计分析方法 单因素分析单因素分析两组之间比较定量资料比较t检验、U检验;Wilcoxon秩和检验分类资料比较(二分类、无序多分类)卡方检验有序资料比较Wilcoxon秩和检验两组及以上之间比较定量资料比较单因素方差分析;Kruskal-wallis秩和检验分类资料比较(二分类、无序多分类)卡方检验有序资料比较Kruskal-wallis秩和检验双变量相关分析:有序资料(kendall),非正态、定量(spearman);正态、定量(pear

4、son相关分析)回归分析:线性回归、单因素Logistic回归第八页,讲稿共五十三页哦9现场调查资料常用推断性统计分析方法现场调查资料常用推断性统计分析方法多因素分析多因素分析多重线性回归多因素Logistic回归(因变量二分类、有序、无序多分类)成组个体匹配:条件Logistic回归群组匹配:考虑群内聚集性,将群组设为层变量第九页,讲稿共五十三页哦10可以选用的方法有成组设计的t检验、u检验、单样本t检验(与总体作比较,实际上此时因素也为二分类)、配对t检验、非参数Wilcoxon检验、符号检验、符号秩和检验等。参数检验与非参数检验的区别?通常参数检验的检验效能要高于非参数检验,但当参数检验

5、的条件(正态性、方差齐性)得不到满足、开口资料、等级资料或资料的总体分布未知时,可以使用非参数检验的方法进行分析。成组设计和配对设计的区别?配对设计是按照一些非实验因素将受试对象配成对子,给予每对中的个体以不同的处理,配对的条件一般为年龄、性别、体重。其优点是在同一对的试验对象间取得均衡,从而提高试验的效率。通常分为自身配对设计(某中措施作用于同一个体或两种措施作用于同一个体)和非自身配对设计两种。两组之间定量资料的比较两组之间定量资料的比较第十页,讲稿共五十三页哦11 (1 1)成组设计的)成组设计的t t检验,设计类型为成组设计,且因素变量为二分检验,设计类型为成组设计,且因素变量为二分类

6、变量,分析前需要先对资料的正态性和方差齐性进行检验(这是类变量,分析前需要先对资料的正态性和方差齐性进行检验(这是很多参数检验的前提条件)。很多参数检验的前提条件)。例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量周后记录各鼠体重增加量(克),问两组动物的增重是否有差别?(此处正态性和方差齐性检验略)。(克),问两组动物的增重是否有差别?(此处正态性和方差齐性检验略)。利用SPSS进行分析,数据文件及格式见“成组设计t检验.sav”,SPSS菜单操作为:分析比较均值独立样本T检验 结果见下页结果见下页第十一页,讲稿共五十三页哦12 方

7、差齐性检验的分析结果,P值(Sig)0.9050.05,表明方差齐性 t检验分析结果,P值(Sig)0.0760.05,表明两组动物增加的重量无差异(无统计学意义)。当方差齐性时,看第一行的结果(t1.891,P0.076),当方差不齐时,看第二行的结果(t1.911,P0.078)第十二页,讲稿共五十三页哦13 (2 2)成组设计的)成组设计的u u检验,当样本量较大时,两组之间均数的比较可以用检验,当样本量较大时,两组之间均数的比较可以用u u检检验,其在验,其在SPSSSPSS中的实现过程同中的实现过程同t t检验,此处略。检验,此处略。(3 3)单样本)单样本t t检验;检验;例:通过

8、以往大规模调查,已知某地婴儿出生体重均数为例:通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg,今测得某地一组婴儿的出,今测得某地一组婴儿的出生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同?生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同?利用SPSS进行分析,数据文件及格式见“单样本t检验.sav”,SPSS菜单操作为:分析比较均值单样本T检验 第十三页,讲稿共五十三页哦14 (4 4)配对)配对t t检验检验 例:用某药治疗例:用某药治疗10例高血压病人,测得治疗前后各病人的舒张压,问该例高血压病人,测得治疗前后各病人的舒张压,问该药是否有降低舒张压的作用?药是否有降低

9、舒张压的作用?利用SPSS进行分析,数据文件及格式见“配对t检验.sav”,SPSS菜单操作为:分析比较均值配对样本T检验结果见下页结果见下页第十四页,讲稿共五十三页哦15 第十五页,讲稿共五十三页哦16 (5 5)非参数)非参数WilcoxonWilcoxon秩和检验秩和检验,适用于成组设计资料。,适用于成组设计资料。例:测得某病的健康人例:测得某病的健康人12人和患者人和患者10人的某指标值,问两组之人的某指标值,问两组之间该指标值是否有差异?间该指标值是否有差异?第十六页,讲稿共五十三页哦17 第十七页,讲稿共五十三页哦18两组之间分类资料比较两组之间分类资料比较 (1 1)二分类资料)

10、二分类资料 I I 成组设计:所用统计方法为成组设计:所用统计方法为四格表四格表2 2 检验。第十八页,讲稿共五十三页哦19 第十九页,讲稿共五十三页哦20 第二十页,讲稿共五十三页哦21 II II 配对设计:配对设计:对一组样品同时用两种检测方法对其进行检测,每种检测方法检测结果都分为阳性和阴性,数出两种检测方法同时判定为阳性、阴性的样品数以及它们检测结果不一致的样品数,将结果表示成配对四格表的资料格式。所用统计方法为配对四格表2 检验。实例1中,两种检测方法不知何者为优,任何一种方法检测的结果都有假阳性和假阴性,比较它们检测结果不一致的两个频数,无论差别有无统计学意义,都不能说明两种检测

11、方法何者为优,缺乏“金标准”,因而没有必要做统计分析。第二十一页,讲稿共五十三页哦22 实例2属于隐含金标准的配对四格表资料,若甲培养基培养出阳性结果,而乙却培养出阴性结果,表明甲优于乙,这种阳性结果为真阳性,此时值得做统计分析。实例3则可以明确地判定试验检测方法的优劣。配对四格表的2 检验可用McNemar 2 检验,以检测结果不一致部分差别是否具有统计学意义。当然也可用Kappa检验法检验两种检测方法的检测结果是否具有一致性。估计值估计值P值值卡方34.0000 5.51121E-09校正卡方32.0294 1.51856E-08估计值估计值P值值卡方0.14290.705457校正卡方0

12、.0000 1.000000结果结果第二十二页,讲稿共五十三页哦23 第二十三页,讲稿共五十三页哦24(2 2)无序多分类资料:所用方法为)无序多分类资料:所用方法为2C2C表的表的 2 2检验。检验。SPSS数据格式第二十四页,讲稿共五十三页哦25可以采用两组有序变量资料的可以采用两组有序变量资料的WilcoxonWilcoxon秩和检验秩和检验 两组之间有序资料比较两组之间有序资料比较干预过去三个月您抽烟吗U ValueP Value从不很少有时经常前4648461345291-2.88510.0039后3163297181164合计7811758526455第二十五页,讲稿共五十三页哦2

13、6 第二十六页,讲稿共五十三页哦27 第二十七页,讲稿共五十三页哦28当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设计的方当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设计的方差分析(属两因素方差分析,其与二分类的配对差分析(属两因素方差分析,其与二分类的配对t t检验相对应)、非参数检验相对应)、非参数Kruskal-WallisKruskal-Wallis检验及非参数检验及非参数FriedmanFriedman检验等。检验等。(1 1)单因素方差分析)单因素方差分析 例:某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随

14、机设计方案将患者分为三组进行双盲临床试验。其中,将糖新药高剂量组21人、低剂量组19人、对照组20人。对照组用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?(此处正态性和方差齐性检验略)。利用SPSS进行分析,数据文件及格式见“单因素方差分析.sav”,SPSS菜单操作为:分析比较均值单因素Anova 两组及以上定量资料的比较两组及以上定量资料的比较 第二十八页,讲稿共五十三页哦29 截图二:两两比较对话框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法。截图一:方差同质性检验第二十九页

15、,讲稿共五十三页哦30 方差齐性检验结果:方差齐性检验结果:P0.05,P0.05,方差齐方差齐方差分析结果,F=5.537,P=0.0060.05,说明三组之间总体平均水平不同。因而进一步用Dunnett法作多个试验组与一个对照组间的比较(见下页)。第三十页,讲稿共五十三页哦31 第三十一页,讲稿共五十三页哦32 (2 2)非参数)非参数Kruskal-WallisKruskal-Wallis检验检验 例:仍以上述资料为例,假设此时资料不符合正态性或方差齐性的例:仍以上述资料为例,假设此时资料不符合正态性或方差齐性的要求,我们使用非参数要求,我们使用非参数Kruskal-WallisKrus

16、kal-Wallis检验进行分析。检验进行分析。SPSS菜单操作为:分析非参数检验旧对话框 K 个独立样本第三十二页,讲稿共五十三页哦33(1 1)二分类)二分类:所用方法为所用方法为R2R2表的表的 2 2检验。检验。如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的比较如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的比较等等。等等。两组及以上分类资料的比较两组及以上分类资料的比较 第三十三页,讲稿共五十三页哦34第三十四页,讲稿共五十三页哦35(2 2)多分类)多分类:所用方法为所用方法为RCRC表的表的 2 2检验。检验。第三十五页,讲稿共五十三页哦36 实例2中小

17、于5的理论频数的格子数超过了总格子数的1/5,若选用一般的2检验公式计算,将增大犯假阳性错误的概率,故此处应选用Fishers精确检验法。第三十六页,讲稿共五十三页哦37第三十七页,讲稿共五十三页哦38第三十八页,讲稿共五十三页哦39此时资料属于单向有序的此时资料属于单向有序的RCRC表资料,可以使用秩和检验方法分析。表资料,可以使用秩和检验方法分析。两组及以上有序资料的比较两组及以上有序资料的比较 第三十九页,讲稿共五十三页哦40 Kruskal-Wallis Test:使用SPSS分析实例2资料,数据格式见右侧截图。菜单操作为:分析非参数检验旧对话框 K 个独立样本注意:例数必须先进行加权

18、操作第四十页,讲稿共五十三页哦41 双变量相关分析双变量相关分析 菜单:分析菜单:分析相关相关双变量双变量数据数据格式格式分析结果分析结果相关分相关分析对话析对话框框第四十一页,讲稿共五十三页哦例:淡菜食用个数与临床症状严重程度的关系第四十二页,讲稿共五十三页哦43 线性回归线性回归 菜单:分析菜单:分析回归回归线性线性 例:淡菜食用个数与腹泻次数的回归分析例:淡菜食用个数与腹泻次数的回归分析第四十三页,讲稿共五十三页哦线性回归分析结果(淡菜食用个数与腹泻次数的回归分析)Regression coefficientStd.errortP95%CIlowerupperconstant5.6461

19、.7072.2219.071number of mussels consumed0.4040.4040.1203.3800.0010.1640.644第四十四页,讲稿共五十三页哦45Logistic回归分析 Logistic回归是适用于反应变量(即因变量)为分类变量的回归分析,近年来在许多研究领域得到了广泛的应用。Logistic归按照反应变量的类型可分为:两分类反应变量的两分类反应变量的LogisticLogistic回归回归;多分类有序反应变量的Logistic回归(本课件不介绍)多分类无序反应变量的Logistic回归(本课件不介绍)Logistic回归按照研究设计的类型可分为:成组设计

20、:成组设计:非条件非条件LogisticLogistic回归,即研究对象未经匹配回归,即研究对象未经匹配;配对设计:条件配对设计:条件LogisticLogistic回归,回归,1:11:1、1:1:mm、m:nm:n群组匹配:(本课件不介绍)第四十五页,讲稿共五十三页哦46非条件Logistic回归分析单因素 (1)因素为定量变量(如结婚年龄)-菜单:分析回归二元Logistic 以以”农村妇女乳腺癌危险因素的病例对照研究农村妇女乳腺癌危险因素的病例对照研究”为例为例(数据数据1.sav)1.sav)第四十六页,讲稿共五十三页哦47非条件Logistic回归分析单因素 (2)因素为分类变量(

21、如结婚年龄)-菜单:分析回归二元Logistic第四十七页,讲稿共五十三页哦48设置哑变量第四十八页,讲稿共五十三页哦49第四十九页,讲稿共五十三页哦50非条件Logistic回归分析多因素 指定变量指定变量筛选方法筛选方法第五十页,讲稿共五十三页哦51条件条件LogisticLogistic回归分析(回归分析(n:mn:m的个体匹配设计)的个体匹配设计)菜单:分析生存函数Cox回归 例:某市恙虫病发病危险因素病例对照研究例:某市恙虫病发病危险因素病例对照研究第五十一页,讲稿共五十三页哦52条件条件LogisticLogistic回归分析(回归分析(n:mn:m的个体匹配设计)的个体匹配设计)菜单:分析生存函数Cox回归 危险因素人数%OR95%CI病例 对照病例对照收玉米81427251.30.31-5.6收黄豆161352233.63.61.4-9.61.4-9.6种麦234782830.890.17-4.7某市恙虫病发病危险因素病例对照研究结果某市恙虫病发病危险因素病例对照研究结果第五十二页,讲稿共五十三页哦感谢大家观看第五十三页,讲稿共五十三页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁