《医学统计中的基本概念讲稿.ppt》由会员分享,可在线阅读,更多相关《医学统计中的基本概念讲稿.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学统计中的基本概念1第一页,讲稿共四十四页哦2第二页,讲稿共四十四页哦 统计学是统计学是研究数据的搜集、整研究数据的搜集、整理与分析的科学,面对不确定性数理与分析的科学,面对不确定性数据作出科学推断据作出科学推断。第一节第一节 绪论绪论3第三页,讲稿共四十四页哦二、医学统计学二、医学统计学 医学统计学是研究数据的搜集、整理、分析与推医学统计学是研究数据的搜集、整理、分析与推断的科学。是把统计理论方法应用于居民健康状况研断的科学。是把统计理论方法应用于居民健康状况研究、医疗卫生实践和医学科研的一门应用性学科。究、医疗卫生实践和医学科研的一门应用性学科。医学统计学广泛地应用于基础医学、临床医学医
2、学统计学广泛地应用于基础医学、临床医学、预防医学和卫生事业管理等领域。、预防医学和卫生事业管理等领域。4第四页,讲稿共四十四页哦5第五页,讲稿共四十四页哦举例:举例:比较两种不同的治疗方法(如西药与中药)对比较两种不同的治疗方法(如西药与中药)对高血压的控制情况。高血压的控制情况。药物是实验因素,药物是实验因素,性别、年龄等为非试验因素性别、年龄等为非试验因素,血压是观测指标。血压是观测指标。一、一、同质和变异同质和变异(homogeneity and variation)6第六页,讲稿共四十四页哦观察单位观察单位(observation unit):亦称个体亦称个体(individual)是
3、统计研究中最基本的单位,它可以是一个是统计研究中最基本的单位,它可以是一个人、一个家庭、一个地区、一个样品等。人、一个家庭、一个地区、一个样品等。严格地讲,除了实验因素外,严格地讲,除了实验因素外,影响被研究指标的非影响被研究指标的非实验因素实验因素(容易控制的容易控制的)相同被称为相同被称为同质同质。在同质的基础上被观察在同质的基础上被观察个体(或单位)之间的差个体(或单位)之间的差异被异被称作称作变异变异(variation),亦称为个体差异亦称为个体差异。变异是由众多的、偶然的、次要的因素造成的。变异是由众多的、偶然的、次要的因素造成的。7第七页,讲稿共四十四页哦变量变量:被观察对象的特
4、征或指标称为变量。被观察对象的特征或指标称为变量。(习惯上称指标)(习惯上称指标)变量值变量值:也称观察值也称观察值(observed value,measurements)是变量的观察结果是变量的观察结果 可以是定量的如:身高、体重血压等;可以是定量的如:身高、体重血压等;亦可以是定性的如性别、血型、疗效等亦可以是定性的如性别、血型、疗效等)变量及变量值变量及变量值(variable and value of variable)被观察对象的被观察对象的年龄、体重、血压年龄、体重、血压性别、种族性别、种族文化程度等文化程度等8第八页,讲稿共四十四页哦1、总体、总体(Population)是指根
5、据研究目的所确定的同质研究对象的全体。是指根据研究目的所确定的同质研究对象的全体。更确切地说是同质的所有观察单位某种观察值更确切地说是同质的所有观察单位某种观察值(变量值变量值)的集合。分有限总体与无限总体。的集合。分有限总体与无限总体。二、总体与样本二、总体与样本有限总体有限总体(finite population):研究对象的个体数目是有限的总体。研究对象的个体数目是有限的总体。无限总体无限总体(infinite population):研究对象的个体数目不确定或无限多。研究对象的个体数目不确定或无限多。9第九页,讲稿共四十四页哦2、样本、样本(Sample)是指从总体中随机抽取的一部分观
6、察单位。是指从总体中随机抽取的一部分观察单位。样本含量样本含量(Sample size)医学上称为样本例数医学上称为样本例数 是指样本包含的个体的数目,用是指样本包含的个体的数目,用“n n”表示。表示。而总体中包含的个体的数目,用而总体中包含的个体的数目,用“N N”表示。表示。10第十页,讲稿共四十四页哦三、抽样三、抽样(Sampling)从总体中抽取部分个体的过程,即为从总体中抽取部分个体的过程,即为抽样抽样。随机抽样随机抽样(random sampling)是指在抽样的过程中,遵循随机化原则。是指在抽样的过程中,遵循随机化原则。随机化原则:随机化原则:要求总体中每一个个体都有相等的被选
7、机会进入样本。要求总体中每一个个体都有相等的被选机会进入样本。随机抽样的优点:随机抽样的优点:避免抽样过程中人为因素(如:主观意愿或客观无意识)的影响,避免抽样过程中人为因素(如:主观意愿或客观无意识)的影响,保证样本的代表性。保证样本的代表性。11第十一页,讲稿共四十四页哦 样本的特性样本的特性1.1.随机性随机性(randomization):遵循随机化原则。遵循随机化原则。(随机随机随意随意随便随便)2.2.代表性代表性(representative):样本中的每个个体来自同一总体。样本中的每个个体来自同一总体。3.3.可靠性可靠性(reliability):所作的结论可信度较高,样本含
8、量所作的结论可信度较高,样本含量“足够足够”。4.4.可比性可比性(comparable):遵循齐同对比的原则。遵循齐同对比的原则。12第十二页,讲稿共四十四页哦各各种种抽抽样样方方法法的的特特点点简单随机抽样简单随机抽样(simple random sampling):最基本的抽样方法。最基本的抽样方法。系统抽样系统抽样(systematic sampling):又称等距抽样。又称等距抽样。分层抽样分层抽样(stratified sampling):层层(strata)间差异大,层内差异小。间差异大,层内差异小。整群抽样整群抽样(cluster sampling):群间差异小,群内差异大。群
9、间差异小,群内差异大。抽样误差的大小抽样误差的大小:分层抽样分层抽样系统抽样系统抽样简单随机抽样简单随机抽样整群抽样整群抽样13第十三页,讲稿共四十四页哦四、实验设计四、实验设计1.1.完全随机设计完全随机设计(completely random design):是将受试对象随机分配到各个处理组或对照组中。可以是两样本是将受试对象随机分配到各个处理组或对照组中。可以是两样本比较,也可以是多样本比较;各样本含量可以相等,也可以不比较,也可以是多样本比较;各样本含量可以相等,也可以不等,但不宜差别太大。等,但不宜差别太大。2.2.配对设计配对设计(matching design):是将受试对象按一
10、定条件配成对子,将他们随机分到两个组中,是将受试对象按一定条件配成对子,将他们随机分到两个组中,分别给予不同的处理。配对条件是指有可能影响实验效应的非分别给予不同的处理。配对条件是指有可能影响实验效应的非主要因素。主要因素。3.3.随机区组设计随机区组设计(random blockdesign):亦称为配伍组设计,它是配对设计的扩展。每个配伍组包含多个受亦称为配伍组设计,它是配对设计的扩展。每个配伍组包含多个受试对象,将它们分别随机分到各处理组。试对象,将它们分别随机分到各处理组。14第十四页,讲稿共四十四页哦五、误差五、误差(error)统计上所说的统计上所说的误差误差泛泛指实测值与真值指实
11、测值与真值之差之差,以及样本指标与总体指标之差。以及样本指标与总体指标之差。抽样误差抽样误差是指由抽样引起的某指标的是指由抽样引起的某指标的样本统计量样本统计量(如样本均数)与该指标的(如样本均数)与该指标的总总体参数体参数(如总体均数)的差异。(如总体均数)的差异。15第十五页,讲稿共四十四页哦(1 1)系统误差)系统误差(system error)是由于仪器初始状态未调整到零、标准试剂未经校正、是由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因使测量结果呈倾向性医生掌握疗效标准偏高或偏低等原因使测量结果呈倾向性偏大或偏小。偏大或偏小。特点:特点:有倾向性有倾向
12、性 可避免可避免(2 2)随机测量误差)随机测量误差(random measurement error)由于偶然因素(如操作技术不稳由于偶然因素(如操作技术不稳定、不同操作员之间的操作差异、电定、不同操作员之间的操作差异、电压不稳、环境温度差异等)的影响所压不稳、环境温度差异等)的影响所致的误差。致的误差。特点:特点:无倾向性无倾向性 不可避免不可避免(3 3)抽样误差)抽样误差(sampling error)由于抽样所致的由于抽样所致的样本统计量与总体样本统计量与总体参数的差异。参数的差异。原因:原因:总体中的个体之间存在变异总体中的个体之间存在变异(个体差异)。(个体差异)。特点:特点:无
13、倾向性无倾向性 不可避免不可避免16第十六页,讲稿共四十四页哦六、概率与频率六、概率与频率 频数频数(frequency):是指在试验中某事件发生的次数。是指在试验中某事件发生的次数。事件实际发生次数事件实际发生次数()频率频率 =可能发生可能发生(试验试验)总次数总次数(N N)1、频率、频率17第十七页,讲稿共四十四页哦2、概率、概率(probability):是指是指某事件发生的可能性大小。用某事件发生的可能性大小。用“P P”表示。表示。P P的取值范围:的取值范围:00P P11 P P=0=0 不可能事件不可能事件(事件必不发生)(事件必不发生)P P=1=1 必然事件必然事件(事
14、件必发生)(事件必发生)小概率事件:小概率事件:P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为)称为小概率事件小概率事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生。随着实验次数增至足够大随着实验次数增至足够大,频率逐渐稳定于某一常数附近,频率逐渐稳定于某一常数附近,则该常数称之为概率。则该常数称之为概率。18第十八页,讲稿共四十四页哦19第十九页,讲稿共四十四页哦一、资料的类型一、资料的类型(变量类别变量类别)1 1、计量资料、计量资料 (数值变量(数值变量 numerical variable)2 2、计数资料、计数资料(无序分类变
15、量(无序分类变量 unordered categories variable)3 3、等级资料、等级资料(有序分类变量(有序分类变量 ordinal categories variable)20第二十页,讲稿共四十四页哦1 1、计量资料、计量资料(measurement data)定义:定义:通过度量衡的方法,测量每一个观察单位的某项研究指标通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。的量的大小,得到的一系列数据资料。特点:特点:取值是定量的取值是定量的 表现为数值大小表现为数值大小 有度量衡单位有度量衡单位(计量单位计量单位)变量值是连续的变量值是连续
16、的如:如:身高、红细胞计数、血压等身高、红细胞计数、血压等21第二十一页,讲稿共四十四页哦2 2、计数资料、计数资料(enumeration data)定义:定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。观察单位的个数。特点:特点:取值是定性的取值是定性的(无度量衡单位计量单位无度量衡单位计量单位)多为间断性资料多为间断性资料 数据分类互相排斥数据分类互相排斥(互不相容互不相容)数据分类无逻辑顺序数据分类无逻辑顺序 可分二项分类和多项分类可分二项分类和多项分类 如:如:性别、血型等性别、血型等22第二十二页
17、,讲稿共四十四页哦3 3、等级资料、等级资料(ordinal data)定义定义:是介于计量资料和计数资料之间的一种资料,通是介于计量资料和计数资料之间的一种资料,通 过半定量方法测量得到。过半定量方法测量得到。特点特点:取值是定性的取值是定性的(无度量衡单位计量单位无度量衡单位计量单位)数据分类互相排斥数据分类互相排斥 分类等级有定量含义分类等级有定量含义 (又称为又称为半定量资料半定量资料)数据分类数据分类有程度上的差别有程度上的差别 (等级顺序关系)(等级顺序关系)多为间断性资料多为间断性资料 如:如:疗效(痊愈、好转、无效、死亡)疗效(痊愈、好转、无效、死亡)尿蛋白(尿蛋白(-、+、+
18、、+、+)等等23第二十三页,讲稿共四十四页哦 资料间的转化资料间的转化 在实际应用中,根据分析的需要,各类变量间可在实际应用中,根据分析的需要,各类变量间可以互相转化。例如以互相转化。例如:血红蛋白血红蛋白 正常正常 重度贫血重度贫血 (6.0g%)(16.0g%)(16.0g%)计量资料计量资料计数资料计数资料等级资料等级资料 24第二十四页,讲稿共四十四页哦25第二十五页,讲稿共四十四页哦1 1、统计设计统计设计 设计设计 (design)(design)是根据研究的目的,对研是根据研究的目的,对研究工作的全过程作一个全面的规划,制定总的究工作的全过程作一个全面的规划,制定总的研究方案,
19、是统计工作中最关键的一步。研究方案,是统计工作中最关键的一步。设设计计实验设计实验设计调查设计调查设计26第二十六页,讲稿共四十四页哦2 2、收集资料、收集资料(collection data):是根据研究目的及实验设计的要求,收集准确的、是根据研究目的及实验设计的要求,收集准确的、完整的、充满信息的原始资料完整的、充满信息的原始资料(raw data)。收集资料是统计工作的前题和基础。收集资料是统计工作的前题和基础。任务:任务:取得准确可靠的原始数据取得准确可靠的原始数据27第二十七页,讲稿共四十四页哦 医疗卫生医疗卫生工作记录和报告工作记录和报告 专题调查专题调查或试验研究或试验研究 统计
20、报表统计报表(报告卡报告卡)经常性资料经常性资料一时性资料一时性资料(1 1)资料的来源)资料的来源28第二十八页,讲稿共四十四页哦(2 2)资料的要求)资料的要求 必须完整、及时、正确必须完整、及时、正确 要有足够的数量要有足够的数量 注意资料的注意资料的代表性和可比性代表性和可比性29第二十九页,讲稿共四十四页哦3 3、整理资料、整理资料(sorting data):把搜集到的原始资料有目的地进行科学加工把搜集到的原始资料有目的地进行科学加工,使资料条理化、系统化,便于进一步的统计分析。使资料条理化、系统化,便于进一步的统计分析。首要工作首要工作:进行数据审核(资料清理进行数据审核(资料清
21、理data cleaning)完整性检查完整性检查:要求无缺项和漏项。:要求无缺项和漏项。准确性检查准确性检查:要求无逻辑错误,:要求无逻辑错误,无区间错误。无区间错误。30第三十页,讲稿共四十四页哦整理资料的步骤整理资料的步骤(1)(1)检查核对资料检查核对资料(2)(2)设设 计计 分分 组组(3)(3)资料列表划记归组资料列表划记归组按质分组按质分组(用于计数资料和等级资料用于计数资料和等级资料)按量分组按量分组 (用于计量资料用于计量资料 )31第三十一页,讲稿共四十四页哦4 4、分析资料、分析资料(analysis data):把经过统计整理的资料作一系列的描述性分析和推断把经过统计
22、整理的资料作一系列的描述性分析和推断性分析,从而阐明事物的规律性。性分析,从而阐明事物的规律性。不同类型的资料使用的统计分析的方法不一样。不同类型的资料使用的统计分析的方法不一样。分析的关键:分析的关键:依据资料的类型和特征依据资料的类型和特征,正确选择统计分析方法。正确选择统计分析方法。32第三十二页,讲稿共四十四页哦统计描述统计描述descriptive statistics统计推断统计推断inferential statistics分析资料分析资料analysis of data统计描述:统计描述:是指用一些统计指标、统计图表等是指用一些统计指标、统计图表等方法描述数据的分布特征和变化趋
23、势。方法描述数据的分布特征和变化趋势。统计推断:统计推断:是指用调查、实验取得的样本信息是指用调查、实验取得的样本信息估计总体特征。估计总体特征。33第三十三页,讲稿共四十四页哦34第三十四页,讲稿共四十四页哦1 1、计量资料、计数资料和等级资料的关系是:、计量资料、计数资料和等级资料的关系是:A A、计量资料兼有计数资料和等级资料的一些性质。、计量资料兼有计数资料和等级资料的一些性质。B B、计数资料兼有计量资料和等级资料的一些性质。、计数资料兼有计量资料和等级资料的一些性质。C C、等级资料兼有计量资料和计数资料的一些性质。、等级资料兼有计量资料和计数资料的一些性质。D D、计数资料兼有计
24、量资料的一些性质。、计数资料兼有计量资料的一些性质。E E、三者差别不大。、三者差别不大。A型题型题35第三十五页,讲稿共四十四页哦2 2、统计学中的系统误差、随机测量误差和抽样误差、统计学中的系统误差、随机测量误差和抽样误差,在实际工作中是:,在实际工作中是:A A、三种误差都不可避免、三种误差都不可避免 B B、系统误差和测量误差不可避免、系统误差和测量误差不可避免 C C、系统误差和抽样误差不可避免、系统误差和抽样误差不可避免 D D、随机测量误差和抽样误差不可避免、随机测量误差和抽样误差不可避免 E E、三种误差都可避免、三种误差都可避免A型题型题36第三十六页,讲稿共四十四页哦3 3
25、、抽样误差是指:、抽样误差是指:A A、个体值和总体参数之差、个体值和总体参数之差 B B、个体值和样本统计量之差、个体值和样本统计量之差 C C、样本统计量和总体参数之差、样本统计量和总体参数之差 D D、样本统计量和总体测量值之差、样本统计量和总体测量值之差 E E、总体测量值和总体参数之差、总体测量值和总体参数之差A型题型题37第三十七页,讲稿共四十四页哦4 4、在统计工作中,整理资料时首要工作是:、在统计工作中,整理资料时首要工作是:A A、设计分组、设计分组 B B、拟整理表、拟整理表 C C、检查资料、检查资料 D D、资料归组、资料归组 E E、计算全距、计算全距A型题型题38第
26、三十八页,讲稿共四十四页哦5 5、搞好统计工作,达到预期目的,最重要的是:、搞好统计工作,达到预期目的,最重要的是:A A、原始资料要多、原始资料要多B B、原始资料要正确、原始资料要正确C C、整理资料要详细、整理资料要详细D D、分析资料要先进、分析资料要先进E E、统计计算精度要高、统计计算精度要高A型题型题39第三十九页,讲稿共四十四页哦6 6、关于随机抽样,下列说法哪一项是正确的:、关于随机抽样,下列说法哪一项是正确的:A A、随机抽样即随意抽取个体、随机抽样即随意抽取个体B B、研究者在抽样时应精心挑选个体,以使样本更能代表总体、研究者在抽样时应精心挑选个体,以使样本更能代表总体C
27、 C、抽样时应使得总体中的所有个体有同等机会被抽取到、抽样时应使得总体中的所有个体有同等机会被抽取到D D、为确保样本具有更好的代表性,样本量应越大越好、为确保样本具有更好的代表性,样本量应越大越好E E、随机抽样即随便抽样、随机抽样即随便抽样A型题型题40第四十页,讲稿共四十四页哦7 7、统计学中所说的总体是指:、统计学中所说的总体是指:A A、根据目的划分的研究对象的全体、根据目的划分的研究对象的全体B B、根据地区划分的研究对象的全体、根据地区划分的研究对象的全体C C、根据人群划分的研究对象的全体、根据人群划分的研究对象的全体D D、根据研究目的确定的同质研究对象的全体、根据研究目的确
28、定的同质研究对象的全体E E、随意想象的研究对象的全体、随意想象的研究对象的全体A型题型题41第四十一页,讲稿共四十四页哦8 8、统计学中所说的样本是指:、统计学中所说的样本是指:A A、随意抽取总体中任意部分、随意抽取总体中任意部分B B、按照随机原则抽取总体中有代表性的一部分、按照随机原则抽取总体中有代表性的一部分C C、有意识的选择总体中典型部分、有意识的选择总体中典型部分D D、依照研究者要求,选取总体中有意义的一部分、依照研究者要求,选取总体中有意义的一部分E E、随便抽取总体中任意部分、随便抽取总体中任意部分A型题型题42第四十二页,讲稿共四十四页哦9 9、搜集资料的具体要求是:、搜集资料的具体要求是:A A、完整、完整B B、及时、及时C C、正确、正确D D、条理化、条理化E E、系统化、系统化X 型题型题43第四十三页,讲稿共四十四页哦1010、整理资料的目的是、整理资料的目的是:A A、检查核对资料、检查核对资料B B、使资料条理化、使资料条理化C C、为了分组、为了分组D D、便于统计分析、便于统计分析E E、使资料系统化、使资料系统化X 型题型题44第四十四页,讲稿共四十四页哦