《卫生统计学总复习资料.课件.ppt》由会员分享,可在线阅读,更多相关《卫生统计学总复习资料.课件.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、首都医科大学公共卫生学院流行病与卫生统计学系杨兴华2016.1.5 形式:笔试、上机(按照平时情况) 笔试时间:1月月2121日(周四)上午日(周四)上午9 9:00-11:0000-11:00 考试地点:见通知 考试要求:须携带学生证或身份证参加考试,听从考试要求:须携带学生证或身份证参加考试,听从监考老师安排;可带计算器。监考老师安排;可带计算器。比例:1.上机操作+平时,30%2.试卷70% 题型:填空题 选择题 计算分析题 答疑时间:2016.1.19下午3:00-4:30地点:阶平楼230、234、235医学统计学总复习研究设计与资料分析中统计方法选择研究设计与资料分析中统计方法选择
2、统计方法选择的思路统计方法选择的思路统计方法的流程图统计方法的流程图几个容易混淆的基本概念几个容易混淆的基本概念教学中各类统计方法的应用条件教学中各类统计方法的应用条件2022-4-214 不同资料类型基本统计分析方法小结不同资料类型基本统计分析方法小结 计量资料计量资料 单变量单变量 统计描述统计描述 集中趋势集中趋势 离散趋势离散趋势 正态分布及应用正态分布及应用 统计推断统计推断 可信区间可信区间 假设检验假设检验 正态方差齐正态方差齐 两组两组 多组多组 非正态或方差不齐非正态或方差不齐 变量变换变量变换 秩和检验秩和检验 多变量多变量 直线相关直线相关 直线回归直线回归 多重线性回归
3、多重线性回归 计数资料计数资料 统计描述统计描述 相对数相对数 标准化法标准化法 统计推断统计推断 近似近似u检验检验 卡方检验卡方检验 Fisher精确概率法精确概率法 等级资料等级资料 秩和检验秩和检验 spearman等级相关等级相关 统计假设检验方法选择流程图2022-4-216资料类型计量资料计数资料等级资料两(单)组比较多组比较研究设计适用条件单样本t检验配对t检验成组t检验单因素方差分析随机区组方差分析析因设计方差分析卡方检验秩和检验相关回归相关分析回归分析四格表卡方检验行列表卡方检验两样本秩和配对秩和多样本秩和实际工作数据分析步骤统计设计 收集资料 整理资料原始数据 建立数据库
4、 录入数据 清理数据 分类汇总 资料类型资料类型研究设计研究设计 适用条件适用条件 计算分析计算分析 判断判断 结论结论-研究报告、论文研究报告、论文2022-4-217统计方法选择的思路统计方法选择的四级思维统计方法选择的四级思维 资料类型资料类型 分布类型分布类型 设计类型设计类型 具体条件具体条件统计分析的两个方面统计分析的两个方面 统计描述(统计指标与图表)统计描述(统计指标与图表) 统计推断统计推断2022-4-218几个容易混淆的基本概念样本与总体样本与总体资料(变量)类型资料(变量)类型相对数指标:构成比、率、相对比相对数指标:构成比、率、相对比统计图类型统计图类型统计图的适用条
5、件统计图的适用条件统计表统计表2022-4-219几个容易混淆的基本概念1 1、抽样误差与标准误、抽样误差与标准误抽样研究才有抽样误差抽样研究才有抽样误差抽样误差的概念抽样误差的概念标准误是衡量抽样误差大小的指标标准误是衡量抽样误差大小的指标2 2、标准差与标准误关系、标准差与标准误关系联系:离散度指标,计算上的联系联系:离散度指标,计算上的联系区别:描述对象不同,意义与应用不同区别:描述对象不同,意义与应用不同 与与n n的关系不同的关系不同2022-4-2110几个容易混淆的基本概念3 3、参考值范围与可信区间关系、参考值范围与可信区间关系联系:均为一个数值范围联系:均为一个数值范围区别:
6、意义不同,区别:意义不同, 与与 同一资料两范围的不同同一资料两范围的不同4 4、假设检验的意义、假设检验的意义 是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同(不能推断差别大小)。2022-4-2111SuXXStX,几个容易混淆的基本概念5 5、检验假设与检验结论、检验假设与检验结论无效假设与备择假设(单双侧);无效假设与备择假设(单双侧);是对总体所作,是对总体所作,H H0 0假设总体相同或两者假设总体相同或两者无关,检验方法建立于此;无关,检验方法建立于此;对检验方法的对检验方法的H H0 0与与H H1 1作总结;作总结;检验
7、结论有统计结论与专业结论;检验结论有统计结论与专业结论;是针对检验假设(总体)而作的;是针对检验假设(总体)而作的;2022-4-2112几个容易混淆的基本概念6 6、检验水准、检验水准 与与P P值值q 是预先确定的,是预先确定的,表示在拒绝表示在拒绝H H0 0时时可能犯错误的最可能犯错误的最大概率,属于第一类错误;大概率,属于第一类错误;qP P值是指由值是指由H H0 0规定的总体中进行随机抽样,所观察规定的总体中进行随机抽样,所观察到的等于及大于(或等于及小于)现有样本统计量到的等于及大于(或等于及小于)现有样本统计量(如(如u u值)的概率,也可表示为在拒绝值)的概率,也可表示为在
8、拒绝H H0 0时可能犯时可能犯错误的实际概率大小;错误的实际概率大小;q 与与P P值间的关系:值间的关系:P P , ,接受接受H H0 0,差异无统计学意,差异无统计学意义;义;P P ,拒绝,拒绝H H0 0,接受,接受H H1 1,差异有统计学意义,差异有统计学意义2022-4-2113几个容易混淆的基本概念7 7、自由度确定、自由度确定能够自由选择其数值的变量个数;能够自由选择其数值的变量个数;总结各类统计方法的自由度计算;总结各类统计方法的自由度计算;8 8、单侧与双侧、单侧与双侧正常值范围估计中单双侧的选取;正常值范围估计中单双侧的选取;组间比较的假设检验中单双侧选取;组间比较
9、的假设检验中单双侧选取;2022-4-2114几个容易混淆的基本概念9 9、多组比较问题、多组比较问题方差分析、卡方检验与秩和检验中有多方差分析、卡方检验与秩和检验中有多组比较问题组比较问题检验思路是先作总的比较,再作两两组检验思路是先作总的比较,再作两两组间比较;注意间比较;注意H H1 1。2022-4-2115几个容易混淆的基本概念1010、线性相关与线性相关系数、线性相关与线性相关系数前提是散点图有线性趋势;前提是散点图有线性趋势;两变量线性关系密切程度和变化方向;两变量线性关系密切程度和变化方向;检验的意义与检验的意义与 r r值的意义;值的意义;2022-4-2116几个容易混淆的
10、基本概念11 11、线性回归与线性回归系数、线性回归与线性回归系数前提是散点图有线性趋势;前提是散点图有线性趋势;配线求直线回归方程;配线求直线回归方程;线性回归系数线性回归系数b b意义;意义;2022-4-2117几个容易混淆的基本概念12、率、构成比与相对比(相对数)率与比不能相混淆总率与平均率的概念率的标准化法13、方差分析中变异的分拆SS总=SS组间+SS组内 总= 组间+ 组内SS总=SS处理+SS区组+SS误差 总= 处理+ 区组+ 误差2022-4-2118几个容易混淆的基本概念1414、完全随机设计与配对设计、完全随机设计与配对设计完全随机设计是将研究对象随机分为两完全随机设
11、计是将研究对象随机分为两组或多组;组或多组;配对设计是将研究对象按一定条件配成配对设计是将研究对象按一定条件配成对子,再随机分到两组,随机区组设计对子,再随机分到两组,随机区组设计为多组;为多组;组间均衡性与统计方法不同;组间均衡性与统计方法不同;应用上不同;应用上不同;2022-4-2119统计方法应用条件和适用资料集中趋势与离散趋势的统计指标集中趋势与离散趋势的统计指标t t检验与检验与u u检验检验方差分析方差分析相对数相对数 2 2检验检验非参数检验非参数检验线性相关与回归线性相关与回归2022-4-2121主要内容集中趋势与离散趋势统计指标 集中趋势集中趋势 离散趋势离散趋势正态分布
12、正态分布 均数均数 方差、标准差方差、标准差对数正态对数正态 几何均数几何均数 几何标准差几何标准差偏态等偏态等 中位数中位数 四分位数间距四分位数间距变异系数:在两组或多组资料变异度比较变异系数:在两组或多组资料变异度比较组间单位不同组间单位不同组间均数相差较大组间均数相差较大2022-4-2122思 考 题完全随机设计资料如何选择检验方法完全随机设计资料如何选择检验方法? ?配对试验设计资料如何选择检验方法配对试验设计资料如何选择检验方法? ?两独立样本t检验或方差分析配对设计的t检验2022-4-2123t检验与u检验的应用条件两组数值变量资料比较;两组数值变量资料比较;小样本时用小样本
13、时用t t检验,要求资料为随机样本检验,要求资料为随机样本并服从正态分布;并服从正态分布;大样本时用大样本时用u u检验,仍要求资料为随机样检验,仍要求资料为随机样本,但正态性条件可以放宽;本,但正态性条件可以放宽;在两样本均数比较的在两样本均数比较的t t和和u u检验中,要求两检验中,要求两组总体方差相等,即方差齐性;组总体方差相等,即方差齐性;组间要求具有均衡可比性。组间要求具有均衡可比性。2022-4-2124方差分析的应用条件多组定量资料的比较多组定量资料的比较观察值为独立随机样本,并服从正态分观察值为独立随机样本,并服从正态分布;布;样本较大时正态性条件可以放宽;样本较大时正态性条
14、件可以放宽;方差齐性方差齐性组间可比性组间可比性2022-4-21252检验的适用资料两组样本率的比较;两组样本率的比较;多组样本率的比较;多组样本率的比较;两组或多组构成比的比较;两组或多组构成比的比较;配对设计下两分类资料检验。配对设计下两分类资料检验。2022-4-2126非参数检验的适用资料有序多分类资料(双向有序,且分类属有序多分类资料(双向有序,且分类属性相同);性相同);极度偏态分布;极度偏态分布;分布不规则和未知分布资料;分布不规则和未知分布资料;数据变异较大,方差不齐数据变异较大,方差不齐2022-4-2127线性相关与回归的应用条件散点图有线性趋势;专业上要求分析两变量间关
15、系密切程度 和变化方向,通过一个变量预测或控制另一变量;两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。2022-4-2128非参数检验的概念(1 1)参数检验()参数检验(Parametric test)Parametric test) 基于总体为某一特定分布的前提下,对参数进行基于总体为某一特定分布的前提下,对参数进行的检验。的检验。 如:如:t t检验、检验、F F检验等。检验等。(2 2)非参数检验()非参数检验(Nonparametric test)Nonparametric test) 不依赖于总体分布类型,也不对总体参数进行统不依赖于总体分布类型,也不对总体参数进行
16、统计推断的假设检验。计推断的假设检验。 如:秩和检验、如:秩和检验、RiditRidit等。等。统计表与统计图(statistical table and statistical graph) (1 1)统计表)统计表组合表简单表(2 2)统计图)统计图条图圆图线图直方图散点图.3020公式掌握的基本公式均数、标准差、标准误均数、标准差、标准误正常值范围、可信区间正常值范围、可信区间四格表专用、校正公式四格表专用、校正公式单样本单样本t t检验、配对检验、配对t t检验检验记住的界值:记住的界值:1.961.96、2.582.58、3.843.84其它公式: 理解和识别 研究生存时间的分布特点
17、,估计生存率,研究生存时间的分布特点,估计生存率,绘生存曲线;绘生存曲线; 对两组或多组生存率进行比较;对两组或多组生存率进行比较; 了解影响生存过程的主要因素为改善预后了解影响生存过程的主要因素为改善预后提供指导提供指导。 设在实际研究问题中,含有p+1个指标变量x1, x2,xp;y1及n个观察对象。其数据结构概括为:多元统计分析的资料与方法多元统计分析的资料与方法选择选择 33(一)各种多元统计分析方法的数据结构 表1 数据形式(P1) 观察对象 X1 X2 Xp Y 1 a11 a12 a1p y1 2 a21 a22 a2p y2 n an1 an2 anp yn含有因变量时: y
18、y是定量资料,多元线性回归分析;是定量资料,多元线性回归分析; y y是是0 0及及1 1定性资料,定性资料,LogisticLogistic回归分析;回归分析; y=ty=t是生存资料,作是生存资料,作COXCOX回归分析;回归分析; 3422各种多元统计分析方法的目的 1.1.多元线性回归分析多元线性回归分析 (1) (1) 建立回归模型:建立回归模型: Y0+1X1+2X2+pXp ;并对回归方程及系数进行假设检验 (2) (2) 预测预报预测预报 若已知x1, x2 xm数值大小时, 通过模型可以预测y的值以及估计y的变化范围; (3) (3) 因素分析因素分析 找出对因变量y有统计学
19、意义的因素。 2.logistic回归分析回归分析(1) 建立建立logistic回归模型:回归模型: logit(p)0+1X1+2X2+pXp ;并对回归方程及系数进行假设检验(2) 预测预报:预测预报: 若已知x1, x2 xm数值大小时, 通过模型可以预测发病、死亡、阳性等的概率;(3) 因素分析:因素分析: 寻找对发病、死亡、阳性等影响有统计学意义的因素。363.Cox回归模型(1)建立回归模型:建立回归模型: ln(h(t)/ h0(t))=1x1+2x2+pxp;并对回归方程及系数进行假设检验(2)可以计算各因素的相对危险度可以计算各因素的相对危险度(relative risk,
20、RR)(3)分析影响因素分析影响因素(4)用用1x1+2x2+pxp( (预后指数)估计疾病的预后。预后指数)估计疾病的预后。37(三)SPSS实现方法Analyze Regression Linear y选选入入Dependent x1-Xp选入选入Independent Stepwise options ok1.SPSS1.SPSS实现多重线性回实现多重线性回归方法归方法Analyze Regression Binary Logistic y选入选入Dependent框框 x1-Xp选入选入Covariates框框 method Fkward options ok 2.SPSS2.SPSS实现非条件实现非条件Logistic回归方法回归方法nAnalyze SurvivalCox regression Time(dat)Status Define event single value(0) Continue x1-Xp选入选入Covariatesmethod Fkward options ok 3.SPSS3.SPSS实现实现COXCOX回归方法回归方法祝大家取得好成绩!47