《医学统计学概论课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学概论课件.ppt(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学统计学医学统计学Postgraduate books recommended by Degree Management and Postgraduate Education Bureau,Ministry of Education生活中的统计问题生活中的统计问题彩票中奖的几率?彩票中奖的几率?(概率论概率论)药物疗效的判断?药物疗效的判断?(假设检验假设检验)子女身高与父母身高的关系?子女身高与父母身高的关系?(相关与回归相关与回归)同龄孩子为什么有胖有瘦同龄孩子为什么有胖有瘦(医学参考值医学参考值)人口普查资料人口普查资料(抽样抽样)统计学是对令人困惑费解的数字问题做出设想的艺术。统计学
2、是对令人困惑费解的数字问题做出设想的艺术。3 医学论文中的统计学问题医学论文中的统计学问题New Science 杂志杂志调查调查 74%有不正当修改数据的情况有不正当修改数据的情况 17%拼凑实验结果拼凑实验结果 7%凭空捏造数据凭空捏造数据 2%故意曲解结果故意曲解结果今日科学2015-10-14重庆医科大学副校长论文涉嫌捏造评审过程被撤销据外媒报道,被撤销的9篇论文均来自中国,这些论文作者捏造评议人邮件,捏造评审意见并提交给期刊助论文发表。中国学术圈一次性被大量撤稿已在国际学术圈引起负面影响。今年3月,英国现代生物出版集团宣布撤销银镜发表的43篇论文,其中有41篇来自中国大陆,撤稿理由是
3、发现有第三方机构有组织地为这些论文提供虚假的同行评审。随后,斯普林格出版集团也宣布撤回旗下10个学术期刊已经发表的64篇论文,这些文章全部出自中国作者。5Statistics Statistics-A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”(Webster,s international Dictionary)The science and art of dealing with variation in data thro
4、ugh collection,classification and analysis in such a way as to obtain reliable results.(A Dictionary of Epidemiology)什么是医学统计学什么是医学统计学医学统计学:是一门运用统计学原理和方法,研究医学科研中有关数据的收集、整理、分析的科学。第一章第一章 绪绪 论论Definition:the science that study the collection,sorting and analysis of medical data.7 四四四四.Variable and date第
5、一节第一节 统计学的几个基本概念统计学的几个基本概念 一一一一.homogeneity and variable 三三三三.population and sample 二二二二.parameter and statistic 五五五五.error 六六六六.relative frequenty and probability同质:影响被研究指标较同质:影响被研究指标较大,可以控制主要因素尽大,可以控制主要因素尽可能相同或一致。可能相同或一致。变异:在同质基础上各观变异:在同质基础上各观察单位之间的变异。察单位之间的变异。Homogeneity:common characteristics fo
6、r the given individuals variation:difference existing among the variable values of homogeneity individuals 1.同质与变异同质与变异(Homogeneity and Variation)参数:根据总体分布参数:根据总体分布特征而计算的总体指特征而计算的总体指标,一般用希腊字母标,一般用希腊字母表示。如表示。如。统计量:由总体中随机抽统计量:由总体中随机抽取样本而计算样本指标,取样本而计算样本指标,一般用拉丁字母表示。一般用拉丁字母表示。统统计量是参数附近波动的随计量是参数附近波动的随机变量
7、机变量。2.参数与统计量参数与统计量(parameter and statistic)3.3.总体与样本总体与样本 (population and sample)根据研究目的根据研究目的而确定的同质而确定的同质观察单位全体,观察单位全体,分为有限总体分为有限总体和无限总体。和无限总体。The whole homogeneity individuals determined by specific purpose.Finite population:the space,time and population for a specific population have been limited.
8、Infinite population:no time and space limits for the population.Suchpopulations only exist in imagination,so it is called infinite population3.3.总体与样本总体与样本 (population and sample)样本:从总体中随机样本:从总体中随机抽取的部分观察单位。抽取的部分观察单位。Sampling study The set of variable values of some individuals sampled from the popu
9、lation at random.12减少抽样误差方法减少抽样误差方法(1)改进抽样方法(误差从大到小)改进抽样方法(误差从大到小)整群抽样整群抽样 单纯随机抽样单纯随机抽样 系统抽样系统抽样 分层抽样分层抽样(2)增加样本量增加样本量(3)选择变异程度较小的研究指标。)选择变异程度较小的研究指标。抽样方法抽样方法12345分层分层抽样抽样系统系统抽样抽样单纯单纯随机随机抽样抽样整群整群抽样抽样多级多级抽样抽样单纯随机抽样单纯随机抽样最简单、最基本抽样方法最简单、最基本抽样方法从总体从总体N个对象中,利用个对象中,利用抽签或其他随机方法抽取抽签或其他随机方法抽取n个个总体中每个对象被抽到概总体
10、中每个对象被抽到概率相等率相等 Simple random samplingSimplest and basic methodTo select number n subjects by drawing lot or by using a table of random number from population with N units Equal chance for each subject in the target population 系统抽样系统抽样(机械抽样机械抽样)将总体各个个体单位按某种标将总体各个个体单位按某种标志排列、连续编号志排列、连续编号 根据总体数根据总体数N和
11、确定样本数和确定样本数n,计算抽样距离计算抽样距离(N/nN/n)用单纯随机方法在第一组中确用单纯随机方法在第一组中确定一个起始号,从起点开始,定一个起始号,从起点开始,每隔每隔K(K=N/nK=N/n)个单位抽取一)个单位抽取一个作为研究对象个作为研究对象 Systemic sampling1.Rank every units by a character construct and number them2.Define the size of the sample and calculate sampling interval (k=N/n)3.Draw a random number(
12、k)for starting 4.Draw every k units from first unit Example:Systematic sampling整群抽样整群抽样 Cluster samplingThe entire population of The entire population of interest is divided into interest is divided into groups,or clusters,and a groups,or clusters,and a random sample of these random sample of these
13、clusters is selected.clusters is selected.单纯整群抽样(单纯整群抽样(Simple cluster samplingSimple cluster sampling)二阶段抽样二阶段抽样 (Two stages samplingTwo stages sampling)将总体分成若干群组,将总体分成若干群组,抽取其中部分群组作为抽取其中部分群组作为观察单位组成样本观察单位组成样本Section 4Section 5Section 3Section 2Section 1Example:Cluster samplingExample:Cluster sampl
14、ing分层抽样分层抽样 Stratified samplingFirst,stratify the population into several strata by character of areas,ages,etc.then select objects using random sampling in each strata.将总体单位按某种特征分将总体单位按某种特征分为若干次级(层),然后为若干次级(层),然后从每一层内单纯随机抽样从每一层内单纯随机抽样组成一个样本。组成一个样本。分层随机分组分层随机分组(stratified randomization)(stratified r
15、andomization)总总体体层层层层层层可按年龄、性可按年龄、性别、种族、教别、种族、教育水平等分层育水平等分层在各层内再在各层内再进行简单随进行简单随机分组机分组多级抽样多级抽样 Multistage sampling 将将抽抽样样过过程程分分阶阶段段进进行行,每每个个阶阶段段使使用用的的抽抽样样方方法法往往往往不不同同,即即将将以以上上抽抽样样方方法法结结合合使使用用,在大型流行病学调查中常用。在大型流行病学调查中常用。Multi-stage sampling is a kind of complex sample design in which two or more levels
16、 of units are imbedded one in the other.4.变量与资料变量与资料(variable and datavariable and data)变量:研究总体确定后,研究者要对每个观察单位的某项特征进行测量和观测,这种特征称为变量。资料:变量的测得值或观察值称为变量值,由变量值构成资料。资料分类:计量资料、计数资料、等级资料计量资料计量资料Measurement data 计量资料又称定量资料计量资料又称定量资料计量资料又称定量资料计量资料又称定量资料或数值变量资料。为观或数值变量资料。为观或数值变量资料。为观或数值变量资料。为观测每个观察单位某项指测每个观察单
17、位某项指测每个观察单位某项指测每个观察单位某项指标的大小而获得资料,标的大小而获得资料,标的大小而获得资料,标的大小而获得资料,一般有度量衡单位。一般有度量衡单位。一般有度量衡单位。一般有度量衡单位。Measurement data:it is also called as quantitative or numerical data.Its value is quantitative.Measurement data always has measurement units.计数资料计数资料(enumeration data)将观察单位按照某种属性或类别分组计数而得到的资料。分类:二分类、多
18、分类Enumeration data:qualitative or count data.For such data,it needs to classify the observation units before and count them.Binomial:gender,live or death,yes or no.Multiple blood type,A、B、O、AB.等级资料等级资料 ranked data 等级资料等级资料(半定量资料、有序分类资料)半定量资料、有序分类资料)将观察单位按着某种属性不将观察单位按着某种属性不同程度分成等级后分组计数。同程度分成等级后分组计数。R
19、anked data:ordinal or semi-quantitative data.It need to classify observatory units into different classes according the extent before calculate the frequencies of each groups.There exists obvious differences among different classes.特点特点 半定量性质,每一个观察单位没有确切值。半定量性质,每一个观察单位没有确切值。各组之间有性质上的差别或程度上的不同。各组之间有性
20、质上的差别或程度上的不同。各类资料可以转化,由高级向低级。各类资料可以转化,由高级向低级。27病例号病例号年龄年龄(岁岁)性别性别身高身高(cm)血型血型心电图心电图尿尿WBC职业职业RBC1012/L135女女1.65A正常正常教师教师4.67244男男1.74B正常正常工人工人5.21326男男1.80O正常正常职员职员4.10425女女1.61AB正常正常农民农民3.92541男男1.71A异常异常+工人工人3.49645女女1.58B正常正常+工人工人5.48750女女1.60O异常异常+干部干部6.78828男男1.76AB正常正常+干部干部7.10931女女1.62O正常正常军人军
21、人5.24资料分类资料分类28变量转化变量转化 原则:变量只能由高级向低级转化原则:变量只能由高级向低级转化 离散型变量常常通过适当的变换或连续离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的性校正后借用连续型变量或有序变量的方法来分析。方法来分析。连续型连续型有序有序多分类多分类二分类二分类5.误差误差(Error)误差:泛指实测值与真值真值之差。Error:the difference between measurement value and true value.分类;随机误差(random error)非随机误差(nonrandom error)系统误差(syst
22、ematic error)非系统误差(nonsystematic error)问题:哪类误差用统计学方法可以控制?问题:哪类误差用统计学方法可以控制?为什么为什么 随机误差随机误差(Random error)unstable and changing at random errors that caused by uncontrolled factors.Commonly,rand errors are referred to those errors appearing during repeated measurements and sampling.是一类不恒定的、随机是一类不恒定的、随
23、机变化的误差,由多种尚变化的误差,由多种尚无法控制因素引起。无法控制因素引起。特点:呈正态分布,随机误特点:呈正态分布,随机误差可通过统计学方法分析。差可通过统计学方法分析。随机误差是不可避免的。随机误差是不可避免的。系统误差:实验过程中产生的误差,系统误差:实验过程中产生的误差,它的值或恒定不变,或遵循一定的变它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是可知的化规律,其产生的原因往往是可知的或可能掌握的。或可能掌握的。Systematic error:it is produced inexperiment and keeps constant or changes accord
24、ing certain rules.Usually,its reasons are known and controllable.非系统误差(过失误差)非系统误差(过失误差)在实验过程中由研究者偶在实验过程中由研究者偶然失误而造成的误差。然失误而造成的误差。Nonsystematic error(gross error):it is always caused by obvious grosses.非随机误差非随机误差(nonrandom error)频率:在相同条件下,独立重频率:在相同条件下,独立重复复n次实验,事件次实验,事件A出现出现m次,次,则比值则比值m/n称为随机事件称为随机事件
25、A在在n次实验中出现频率。次实验中出现频率。frequency:Given the same condition,repeat a trial for n times independently.Among n trials,A appears for m times,so the ratio of m/n is called the frequency of random event A among n trials.概率:描述随机事件概率:描述随机事件发生可能性大小的度发生可能性大小的度量,用量,用P来表示。来表示。probability:the likelihood of random
26、events.6、频率与概率、频率与概率(frequency and probability)频率与概率关系频率与概率关系必然事件必然事件 P=1 不可能事件不可能事件 P=0 随机事件随机事件 0P1 P 0.05或或P 0.01称为小概率事件,统计称为小概率事件,统计学上认为不大可能发生。学上认为不大可能发生。第二节第二节 医学统计工作的基本步骤医学统计工作的基本步骤设设 计计 (design)整理整理 资料资料(sorting data)分析分析 资料资料(analysis of data)收集收集 资料资料(collection of data)Section 2 the steps
27、for statistical work35设计设计实验设计实验设计调查设计调查设计专业设计专业设计统计设计统计设计专业设计专业设计统计设计统计设计一、设计一、设计(design)实验设计的基本要素实验设计的基本要素effectobjecttreatment处理因素处理因素 受试对象受试对象实验效应实验效应37 医学设计基本原则医学设计基本原则 Principles of research design对照对照(control)随机随机(randomization)重复重复(replication)均衡(均衡(balance)对照的作用对照的作用对照的形式对照的形式随机化的作用随机化的作用随机
28、的方法随机的方法重复的作用重复的作用重复的情形重复的情形 盲法盲法38某杂志中一篇文章报道某杂志中一篇文章报道:用某中草药治疗玫瑰糠疹,用某中草药治疗玫瑰糠疹,有效率有效率80%,平均疗效三周。你认同此说法?,平均疗效三周。你认同此说法?有人研究两种不同中草药对慢性支气管炎的疗效,有人研究两种不同中草药对慢性支气管炎的疗效,用两种病人做比较,第一组病人选农民,治疗时间用两种病人做比较,第一组病人选农民,治疗时间为为12-2月间;第二组病人选自工厂工人,治疗时间月间;第二组病人选自工厂工人,治疗时间为为3-5月间,结果月间,结果 认为第二组疗效显著高于第一组认为第二组疗效显著高于第一组疗效,这个
29、结论是否可靠?疗效,这个结论是否可靠?39随机化原则随机化原则(random)随机随机(random)机会均等机会均等随机抽样随机抽样(random sampling)有相同的机会被抽到有相同的机会被抽到随机分组随机分组(random allocation)有相同的机会被分到不同的组中有相同的机会被分到不同的组中实验顺序随机实验顺序随机 先后接受处理的机会相同先后接受处理的机会相同 40(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)简单随机分组示意简单随机分组示意1364 5860 3970 21 61 55 8213 6458 6039 70 21 61 55 82ABBBA
30、BAAAB(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)A A组组B B组组41重复重复(repeated)原则原则整个实验的重复。整个实验的重复。多个受试对象重复多个受试对象重复(sample size)。同一受试对象重复。同一受试对象重复。42 均衡(均衡(balance)原则原则单盲单盲(single blind method)双盲双盲(double blind method)三盲三盲(triple blind method)单盲单盲 (single blind)双盲双盲 (double blind)三盲三盲(triple blind)二、收集资料二、收集资料(colle
31、ction of data)统计报表统计报表工作记录工作记录专门调查或实验研究专门调查或实验研究统计年鉴和统计数据专辑统计年鉴和统计数据专辑statistical reporting routine records purposive surveys or experiments statistical yearbook and special data book数据净化数据净化条理化条理化系统化系统化整理资料整理资料 三、整理资料三、整理资料(sorting data)四、分析资料四、分析资料(analysis of data)分分析析资资料料统计描述统计描述 统计量统计量 统计图表统计图表
32、统计推断统计推断参数估计参数估计假设检验假设检验如何学习医学统计学如何学习医学统计学学习统计学思维方法和基本概念学习统计学思维方法和基本概念抽样研究抽样研究抽样误差抽样误差结论具有概率性结论具有概率性理解概念、选对统计方法和正确解读结果是根本理解概念、选对统计方法和正确解读结果是根本案例讨论:反面教材吸取教训案例讨论:反面教材吸取教训医学统计学研究的是医学统计学研究的是群体的数量特征群体的数量特征VSHOW?确定方案医学专家统计学家不背公式、不问推导,只求了解基本思想、用途及应用条件不背公式、不问推导,只求了解基本思想、用途及应用条件52第三节 统计学发展简史欧美三个阶段:古典统计学、近代统计
33、学、欧美三个阶段:古典统计学、近代统计学、现代现代统计学统计学Karl pearson是现代统计学之父是现代统计学之父,1894年他开设了第年他开设了第一门统计理论课程一门统计理论课程,使得伦敦大学成为现代统计学使得伦敦大学成为现代统计学教育的唯一场所教育的唯一场所.1948年年,郭祖超郭祖超教授(教授(19121999)编著的)编著的医学与医学与生物统计方法生物统计方法,是我国第一部医学统计方法的教,是我国第一部医学统计方法的教科书。科书。计计算算机机和和统统计计软软件件如如SASSAS、SPSSSPSS的的出出现现,使使统统计计学学得到了突飞猛进的发展。得到了突飞猛进的发展。如果有人认为手
34、机辐射可能导致如果有人认为手机辐射可能导致脑癌,你作为医学研究者如何提供脑癌,你作为医学研究者如何提供证据?证据?根据英国发表的评价链霉素治疗根据英国发表的评价链霉素治疗肺结核疗效的随机对照的临床试验肺结核疗效的随机对照的临床试验报告,试验组的生存率为报告,试验组的生存率为93%,对,对照组的生存率为照组的生存率为73%,这只是,这只是55例例患者的试验结果,根据什么说患者的试验结果,根据什么说“链链霉素对所有活动性肺结核患者有效霉素对所有活动性肺结核患者有效”?1.相对而言,抽样误差最大的抽样方法是A.单纯随机抽样B.系统抽样C.分层抽样D.整群抽样2.临床研究中经常采用的盲法是A.单盲 B.双盲 C.三盲 D.全盲3.研究新药“胃灵丹”治疗胃溃疡疗效,选择40例胃溃疡患者,随机分为实验组和对照组,实验组用胃灵丹,对照组用公认有效的胃苏冲剂。这种实验设计为A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照4.实验设计原则A.对照 B.盲法C.配对D.随机5.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组用无药物作用的糖丸,这属于A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照