医学统计的基本概念.ppt

上传人:石*** 文档编号:38702400 上传时间:2022-09-04 格式:PPT 页数:42 大小:4.67MB
返回 下载 相关 举报
医学统计的基本概念.ppt_第1页
第1页 / 共42页
医学统计的基本概念.ppt_第2页
第2页 / 共42页
点击查看更多>>
资源描述

《医学统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《医学统计的基本概念.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、医学统计的基本概念现在学习的是第1页,共42页n什么是统计?n什么是统计学?现在学习的是第2页,共42页统计的含义n古代:数字总计n现代: 统计资料 统计工作 统计科学(统计学)现在学习的是第3页,共42页统计学:statisticsn统计学的英文词统计学的英文词 statistics 源出于拉丁文,源出于拉丁文,是由是由 status(状态、国家)和(状态、国家)和statista(政(政治家)衍化而来的治家)衍化而来的,可见起源很早并和国家事可见起源很早并和国家事务的管理需求有关务的管理需求有关n科技的迅速发展,科技信息的大量产生。数数据据作为信息的主要载体广泛存在。作为信息的主要载体广泛

2、存在。n面对纷乱复杂的数据世界我们该如何去认识?借助统计学这个工具去发现规律。n统计学就是研究数据及其存在规律的科学。统计学就是研究数据及其存在规律的科学。现在学习的是第4页,共42页nStatistics:“a science dealing with the collection, analysis, interpretation and presentation of masses of numerical data”n -Webster 国际大辞典国际大辞典n统计学统计学是是收集收集、分析分析、解释解释与与表达表达数据资数据资料的一门科学。料的一门科学。n医学统计学医学统计学用统计学原

3、理和方法研究用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断生物医学资料的搜集、整理、分析和推断的一门学科。的一门学科。现在学习的是第5页,共42页n医学生为什么要学统计?现在学习的是第6页,共42页医学科研工作中常见的统计学问题医学科研工作中常见的统计学问题n治疗2例病人结果都有效,能否说有效率100%?(样本含量的问题)n用乌贝散治疗胃溃疡出血100例,94人有效,是否可认为该药有效率就是94%?(置信区间)n如何判断某新药是否比传统药物效果更好?(假设检验)n子女身高与父母身高有无联系?其关联强度有多大?(相关与回归)现在学习的是第7页,共42页n医学科研中如何进行统计工作?现

4、在学习的是第8页,共42页统计工作的基本步骤现在学习的是第9页,共42页n第一步第一步 设计设计:制定计划,对整个过程进行安排。n 调查设计调查设计 实验设计实验设计 专业设计:选题(提出问题或假设),专业设计:选题(提出问题或假设), 确定研究对象(处确定研究对象(处 理因素),理因素), 研究观察指标(评价指标),研究观察指标(评价指标), 确定诊断标准(疗效标准),确定诊断标准(疗效标准), 确定技术路线(研究方法)确定技术路线(研究方法) 统计设计:确定对照形式统计设计:确定对照形式 研究样本含量,研究样本含量, 随机抽样或分组方法,随机抽样或分组方法, 盲法,盲法, 误差来源与控制误

5、差来源与控制 统计分析方法,统计分析方法,现在学习的是第10页,共42页统计工作的基本步骤统计工作的基本步骤n第二步第二步 收集资料:收集资料:根据计划取得可靠、完整的资料。收集资料的来源有三种: 统计报表:统计报表: 日常性工作记录:日常性工作记录:医院病例 专题调查(实验)专题调查(实验):n注重资料的准确、完整、及时。n方式:直接观察、采访、填表和通信等现在学习的是第11页,共42页统计工作的基本步骤统计工作的基本步骤n第三步整理资料:原始资料的清理、核实、查对、整理 ,使其条理化、系统化便于计算和分析。 可借助于计算机(常用软件:EPIDATA、SPSS、SAS)。 分组整理:按质量分

6、组 按数量分组现在学习的是第12页,共42页n第四步分析资料(统计分析):运用统计学的基本原理和方法,分析计算有关的指标和数据,阐明事物的规律性。 包括:包括:统计描述统计描述 参数估计参数估计 统计推断统计推断 假设检验假设检验现在学习的是第13页,共42页二、医学统计学中的几个基本概念二、医学统计学中的几个基本概念n1 1、同质和变异、同质和变异n同质(同质(homogeneity)homogeneity):性质相同:性质相同 除了实验因素外,影响被研究指标的非实验因素除了实验因素外,影响被研究指标的非实验因素( (背景条背景条件件) )相同。相同。 举例举例: : 同质是相对的:不同研究

7、中或同一研究中不同观察指标对观察对象的同质性要求不同。现在学习的是第14页,共42页1、同质和变异n变异(variation):同质基础上被观察对象个体之间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。 是统计学存在的基础,从本质上说,统计学就是研究变异的科学。 统计学的目的是揭示同质的总体间的变异,揭示不同总体间的异质性现在学习的是第15页,共42页n2 2、总体、总体(population)(population)与样本与样本(sample)(sample)n总体总体是是同质的个体所构成的全体。同质的个体所构成的全体。n研究总体研究总体是根据研究目的确定的、同质的全部研究对象。

8、是根据研究目的确定的、同质的全部研究对象。n更确切地说,总体是性质相同的全部观察单位某种变量值的集合。更确切地说,总体是性质相同的全部观察单位某种变量值的集合。n总体可分为有限总体(finite population)和无限总体(infinite population)n样本样本是从总体中按一定程序是从总体中按一定程序(随机随机)抽出的部分观察单位)抽出的部分观察单位组成的集合。(组成的集合。(随机随机样本)样本) 现在学习的是第16页,共42页n为了了解某地为了了解某地20292029岁健康女性血红蛋白的正常值范围,岁健康女性血红蛋白的正常值范围,现随机调查了该地现随机调查了该地200020

9、00名名20292029岁的健康女性,并对其岁的健康女性,并对其血红蛋白进行测量,请问本次研究的总体是(血红蛋白进行测量,请问本次研究的总体是( ) A A该地所有该地所有20292029的健康女性的健康女性 B B该地所有该地所有20292029的健康女性的血红蛋白测量值的健康女性的血红蛋白测量值 C C抽取的这抽取的这20002000名名20292029岁女性岁女性 D D抽取的这抽取的这20002000名名20292029岁女性的血红蛋白测量值岁女性的血红蛋白测量值现在学习的是第17页,共42页3、抽样 samplingn一个样本要能较好地反映总体,应具有 代表性:保证来自同一总体 随机

10、性:总体中每个个体有相同概率被抽到随机抽样方法:单纯随机抽样、系统抽样(机械抽样)、分层抽样、整群抽样 可靠性:样本含量要足够多n两个或多个样本间比较应具有 可比性:对比各组在各种影响因素的构成应相同现在学习的是第18页,共42页、几种实验设计(统计方法选择的一个参考)n完全随机设计(成组设计) 将受试对象随机分配到两个或多个处理组中,或分别从不同总体中随机抽样研究n配对设计 将受试对象按一定条件配成对,随机分到两个不同处理组中。可增加各处理组的齐同对比性。n随机区组设计(配伍组设计) 配对设计的扩展现在学习的是第19页,共42页完全随机设计(一)完全随机设计(一)1. 将同质受试对象随机地分

11、配到各处理组,将同质受试对象随机地分配到各处理组,再观察其效应。再观察其效应。2. 是单因素两水平或多水平的实验设计方法。是单因素两水平或多水平的实验设计方法。3. 纳入标准纳入标准 随机化随机化 排除标准排除标准 研究总体研究总体 受试对象受试对象实验组实验组对照组对照组现在学习的是第20页,共42页配对设计(一)配对设计(一) 1. 将受试对象按一定条件配成对子,再将每对中的两受试对将受试对象按一定条件配成对子,再将每对中的两受试对象随机分配到不同处理组。象随机分配到不同处理组。2. 配对因素为可能影响实验结果的主要混杂因素。配对因素为可能影响实验结果的主要混杂因素。 动物实验:窝别、性别

12、、体重等动物实验:窝别、性别、体重等 临床试验:病情轻重、性别、年龄、职业等临床试验:病情轻重、性别、年龄、职业等3. 狭义配对狭义配对:将两个条件相同或相近的受试对象配:将两个条件相同或相近的受试对象配 成对子。成对子。 广义配对广义配对:同一受试对象分别接受两种不同的:同一受试对象分别接受两种不同的 处理;处理; 标本检测、身体的对照部位标本检测、身体的对照部位 实验前后配对实验前后配对现在学习的是第21页,共42页配对设计(二)配对设计(二)4.优点优点:与完全随机设计相比,能提高组:与完全随机设计相比,能提高组 间均衡性和检验功效;间均衡性和检验功效; 样本含量较小样本含量较小5.缺点

13、缺点:配对失败或配对欠佳时,反而会降:配对失败或配对欠佳时,反而会降 低效率。低效率。现在学习的是第22页,共42页现在学习的是第23页,共42页随机区组设计随机区组设计1. 将受试对象按性质相同或相近者(主要影将受试对象按性质相同或相近者(主要影 响因素)组成响因素)组成b b个区组,每个区组中将个区组,每个区组中将k k个个受试对象随机分配到受试对象随机分配到k k个处理组中去,其区个处理组中去,其区组因素可以是第二处理因素,也可以是一组因素可以是第二处理因素,也可以是一种非处理因素。种非处理因素。2. 优点优点:组间均衡性较好,减少了误差,提:组间均衡性较好,减少了误差,提 高了实验效率

14、;高了实验效率;3.缺点缺点:要求区间内受试对象与处理数相等,:要求区间内受试对象与处理数相等,实验结果中若有数据缺失,统计分析较麻实验结果中若有数据缺失,统计分析较麻烦。烦。现在学习的是第24页,共42页按配伍条件g个水平.实验单位区组1区组2区组3区组n随机分组随机分组g个水平随机分组g个水平随机分组g个水平现在学习的是第25页,共42页现在学习的是第26页,共42页、参数和统计量n参数(参数(parameter):描述总体的统计指标):描述总体的统计指标 一般用希腊字母表示(一般用希腊字母表示(、)n统计量(统计量(statistic):描述样本的统计指标):描述样本的统计指标 一般用拉

15、丁字母表示(一般用拉丁字母表示( 、s、p)x现在学习的是第27页,共42页、误差(error)误差:误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机系统误差和随机误差(随机测量误差误差(随机测量误差,抽样误差)。另:过失误差抽样误差)。另:过失误差(1)系统误差系统误差(systematic error):指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。流行病学称之为流行病学称之为偏倚偏倚(bias)。)。 (2)随机误差随机误差(random error):由于一些非人为的偶然

16、因素使得结果或大或小,是不确定、不可预知的。现在学习的是第28页,共42页随机测量误差n在原始资料收集过程中,由于各种偶然因素影响造成的同一对象多次测量结果间不一致。n特点:没有固定倾向n处理:应采取措施控制在一定允许范围内现在学习的是第29页,共42页随机误差随机误差(random error):抽样误差(抽样误差(sampling errorsampling error)由于抽样不同)由于抽样不同引起的样本指标(统计量)与总体指标引起的样本指标(统计量)与总体指标(参数)之间的差别。(参数)之间的差别。特点:有抽样,抽样误差就不可避免。处理:可通过统计方法估计现在学习的是第30页,共42页

17、、频率(frequency)与概率(probability)n频率:在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。常用f表示。n 投掷硬币试验试验者投掷次数(n) 出现正面次数(m)频率(m/n)Demorgen204610610.5186Buffon404020480.5096Pearson1200060190.5016Pearson24000120120.5005现在学习的是第31页,共42页n频率的稳定性:设在相同条件下,进行大频率的稳定性:设在相同条件下,进行大量重复试验,若事件量重复试验,若事件A的频率稳定地在某一的频率稳定地在某一确定值确定值p的

18、附近摆动,则的附近摆动,则p为事件为事件A的概率。的概率。n概率:描述某一事件发生的可能性大小的概率:描述某一事件发生的可能性大小的数值,常用数值,常用P来表示。来表示。nP的大小在0和1之间。现在学习的是第32页,共42页小概率事件及小概率原理统计学中的许多结论是带有概率性质的。通常一个事件的发生P0.05或P0.01 ,就叫小概率事件小概率事件。小概率原理:小概率原理:小概率事件在一次试验中不会小概率事件在一次试验中不会发生。是统计推断的一条重要原理。发生。是统计推断的一条重要原理。现在学习的是第33页,共42页、变量及变量值n变量(变量(variable):观察对象的特征或指标称为变量。

19、):观察对象的特征或指标称为变量。n对变量进行测量或观察的结果称变量值。对变量进行测量或观察的结果称变量值。如:身高:172cm 体重:65Kg 性别:男 年龄:30岁 职业:教师、(警察) 血型:A 尿蛋白:+ 现在学习的是第34页,共42页三、 统计资料的类型n1、根据变量类型划分:n数值变量:numerical variable 构成:计量资料 measurement datan分类变量:categorical variable 无序分类变量:计数资料 enumeration data 有序分类变量:等级资料 rank data现在学习的是第35页,共42页n(1)计量资料)计量资料(m

20、easurement data) 用仪器、工具等测量方法获得的资料,即用仪器、工具等测量方法获得的资料,即为为计量资料计量资料。也叫。也叫数值变量资料数值变量资料或或定量资定量资料料。 特点:特点:有计量单位有计量单位,如患者的身高(,如患者的身高(cm)、)、体重(体重(kg)、血压()、血压(mmHg)、脉搏(次)、脉搏(次/分)、红细胞计数(分)、红细胞计数(10/L)现在学习的是第36页,共42页n(2)计数资料)计数资料(enumeration data)(enumeration data)n定义:定义:按某种属性分类(分类间无大小、高按某种属性分类(分类间无大小、高低),然后清点每

21、类的数据,称计数资料低),然后清点每类的数据,称计数资料 或无序分类资料。属定性资料。或无序分类资料。属定性资料。n特点特点:无固有计量单位,如肤色(黑、白)、血型无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)、职业(工农兵)、性别(男女) 多为间断性资料多为间断性资料 (通过枚举或记数得来)(通过枚举或记数得来) 现在学习的是第37页,共42页n(3)等级资料()等级资料(rank data)定义:定义:半定性或半定量的观察结果。半定性或半定量的观察结果。按某种属性分类,分类间按某种属性分类,分类间有大小顺序,有大小顺序,所以也叫所以也叫有序分类资料有序分类资

22、料(ordinal category dataordinal category data)。)。 癌症分期:早、中、晚。癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。 尿蛋白:尿蛋白: , , , , ,+,+,+,+及以上及以上特点:特点: 每一个观察单位没有确切值每一个观察单位没有确切值分类各组之间有性质上的差别或程度上的不同。分类各组之间有性质上的差别或程度上的不同。现在学习的是第38页,共42页2、根据测量的整数间有无小数划分n连续性资料:身高、体重等数据n非连续性(离散)资料:龋齿个数,病人数 离散型定量变量的频数分布 例 1998年某山

23、区96名孕妇产前检查次数资料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,4,7。现在学习的是第39页,共42页这是什么类型变这是什么类型变量?量?这是什么类型这是什么类型变量?变量?这是什么类型变这是什么类型变量?量?现在学习的是第40页,共42页3. 三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料现在学习的是第41页,共42页小结:n1 1、重点掌握几个统计学中的基本概念:、重点掌握几个统计学中的基本概念: 总体、样本、随机抽样误差、总体、样本、随机抽样误差、 概率、变量概率、变量n2 2、掌握根据是否定量划分统计资料类型:、掌握根据是否定量划分统计资料类型: 计量计量 计数计数 等级等级现在学习的是第42页,共42页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁