《统计学基本概念及应用.ppt》由会员分享,可在线阅读,更多相关《统计学基本概念及应用.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、卫生统计学基本概念及应用卫生统计学基本概念及应用中国中医研究院 胡镜清2002/03/201Y=36-1.28eY=36-1.28e2x2x3.16,.0.13,36.78.,36.8,0.32,0.28,.2 总体总体统计描述和推断统计描述和推断样本样本抽抽样样3一、卫生统计学基本模块统计的步骤设计(design)资料收集(collection of data)资料整理(sorting data)统计分析(analysis of data)4卫生统计学基本模块统计研究研究设计统计资料的收集、整理、表达与描述定量和定性资料的统计分析相关与回归分析生存分析其他多元统计分析5二、统计学基本概念样本
2、与总体总体(population)是指性质相同的研究对象中所有观察单位某种变量值的集合从总体中随机抽取部分观察单位,某变量的实测值构成样本(sample)6变量(variable)及其分类数值性变量:又称连续性变量、计量资料如身高:158.2cm 165cm 178.0cm.体重:54.0kg 62kg 75.2kg.7分类变量:计数资料无序分类二项分类阴性/阳性;存活/死亡多项分类8 年龄 39岁 治疗组5 24 56 2 对照组6 13 54 119有序分类又称等级资料如:-、+、+、+;无效、有效、显效、痊愈10参数(parameter)和统计量(statistic)总体参数 希腊字母表
3、示样本统计量 拉丁字母表示11抽样误差(sampling error)由于个体间的差异,随机抽样后,样本所测得的指标(统计量)往往与总体指标(参数)之间存在差异,这种由于随机抽样所造成的样本统计量和总体参数的差异,即为抽样误差。12表1 疗效比较组别 例数 有效 无效 合计 有效率 X2 P 甲试验 (%)对照组 15 5 20 75 治疗组 19 1 20 95 1.765 0.05乙试验 对照组 30 10 40 75 治疗组 38 2 40 95 6.275 0.05丙试验 对照组 45 15 60 75 治疗组 57 3 60 95 9.412 0.0113型错误(type error
4、)和型错误(type error)的水平型错误:统计推断拒绝了实际上成立的无效假设(H0),即假阳性。I型错误的概率用表示,故又称错误。14型错误:统计推断不拒绝实际上是不成立的无效假设(H0),即假阴性。II型错误的概率用表示,故又称错误。15概率(probability)事件发生的可能性大小。用p表示,取值范围在0-1之间。0为不可能发生,1为必然发生。习惯将P0.05的事件称为小概率事件,可以认为在一次抽样中不会发生16三、统计分析的基本作用1、统计描述(descriptive statistics)对资料的数量特征及其分布规律进行测定和描述。统计学指标统计表统计图数学模型17182、统
5、计推断(inferential statistics)如何抽样,以及如何由样本信息推断总体特征问题参数估计(parameter estimation)假设检验(hypothesis test)先确定无效假设(H0),如果能拒绝,再接受备择假设(H1)19 -2.58-1.96 +1.96+2.58 0.5%2.5%20三、计量资料的统计描述集中趋势的统计描述均数(average)算术均数几何均数加权均数中位数(median)和百分位数(percentile)21离散程度的统计描述全距(range,极差)四分位数间距(quartile)22例如:2,6,7,10,36Range=34Q=QU-Q
6、L=423方差离均差:每一观察值与总体均数的差值 (X-)为离均差,由于(X-)=0,故不能反映数据的变异。例如,2,6,7,10,36 均数=12.2离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2)=24离均差平方和:(X-)2 则能反映数据变异的大小离均差平方的和=(2-12.2)2+(6-12.2)2+(7-12.2)2 +(10-12.2)2+(36-12.2)2 =740.825离均差平方的均数,总体方差(2)(X-)2 n样本方差(S2)(X X)2 n-126标准差(standard deviation):将方差开方后即得总
7、体标准差()和样本标准差(s)(X-)2=n27 (X-X)2s=n-1标准差越大,反映数据的离散程度越大。即数据离平均数越远2829变异系数(coefficient of variation,CV)可用于度量不同单位资料之间的变异度 sCV=100%X例如,某地20岁男子100人,身高平均166.06cm,标准差为4.95cm,体重均数为53.7kg,标准差为4.96kg,问身高和体重的变异度相似吗?30四、计量资料的假设检验t 检验又称student t 检验其基本思路是均值之差与抽样误差之比31 32样本均数与总体均数比较的 t 检验配对差值比较的 t 检验成组设计比较的 t 检验33u
8、 检验成组设计的大样本均数比较n虽小而总体标准差已知的均数比较34t 检验和u 检验的应用条件样本的总体正态分布两样本的总体方差相等35方差分析(F 检验)又称变异分析,其指标为均方MS(mean square),由组间离均差平方的和SS除以自由度 v 而得36基本思想先求出组间均方(MS组间)与组内均方(MS组内)组间均方(MS组间)与组内均方(MS组内)之比作为统计量(F值),与临界值比较所有数据的变异分解为组间变异和组内变异两部分,当几种治疗方案作用相同时,F值约为1;作用不同时,F值大于1 MS组间F=MS组内37例如:例题见倪宗瓒编医学统计学第82-83页21例儿童接受三种不同的疗法
9、,1月后观察其血红蛋白的总量,问三组的治疗效果有无差异。38计算结果SS总=2271.81SS组间=1523.81SS组内=SS总-SS组间=748.00组间=-1=3-1=2,组内=n-=21-3=18MS组间=SS组间/组间=1523.81/2=761.91MS组内=SS组内/组内=748/18=41.56F=MS组间/SS组内=761.91/41.56=18.3339表2 方差分析表来源 SS v MS F P组间 1526.81 2 761.91 18.33 0.05组内 748.00 18 41.56 总 2271.81 20 40多样本均数的两两比较q 检验(Student-New
10、man-Keuls multiple range test,SNK)用于几个样本均数的两两比较Dunnett t 检验几个处理组的样本均数与一个对照组的样本均数的比较41五、计数资料的统计描述常用相对数比(ratio)是两个指标的相对比,说明A为B的若干倍或百分之几构成比(proportion)说明一事物内部各组成部分所占的比重或分布,常以百分数表示42率又称频率指标,它说明某现象发生的频率或强度。常以百分率(%)、千分率()等表示 发生某现象的观察单位数率=100%可能发生某现象的观察单位总数43应用相对数时注意事项计算相对数的分母不宜过小分析时不能以构成比代替率对观察单位数不等的几个率,不
11、能直接相加求其平均率资料的对比应注意可比性对样本率(或构成比)的比较应遵循随机抽样,要进行假设检验44例如,某工厂医务室1979年门诊病人的统计汇总表心血管疾病 326 7.8%呼吸系统疾病 2580 61.9%消化道疾病 417 10.0%其他 845 20.3%合计 4168 100%45结论:本厂呼吸系统疾病患病率较高。他们的结论对吗?为什么?他们的结论对吗?为什么?4647六、计数资料的假设检验2 检验秩和检验482 检验基本原理假设样本组间的率没有差别,计算其理论频数实际频数(A)与理论频数(T)吻合的程度用2 值表示2 值越大,P值越小,当P(检验水准),拒绝假设49四格表资料的2
12、 检验(两样本率的比较)校正2 检验:1T 40确切概率计算法:T 0 or n 4 0行列表资料的2 检验(多个样本率或构成比的比较)不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于150秩和检验配对组间的符号秩和检验(Wilcoxon配对法)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)成组设计多个样本比较的秩和检验(Kruskal-Wallis法)多个样本两两比较的秩和检验(Nemenyi法)51七、直线回归与相关直线回归建立两变量间依存关系的直线回归方程由直线回归方差通过已知变量估计未知变量如:52直线相关了解两变量是否有相关关系存在,密切程度如何,是正相关,还是负相关。相关系数r及其显著性检验53八、多元统计分析多元回归与相关分析因子分析54聚类分析判别分析55谢谢!谢谢!56