《第五章、流行病学和医学统计学基本知识.docx》由会员分享,可在线阅读,更多相关《第五章、流行病学和医学统计学基本知识.docx(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章、流行病学和医学统计学基本知识第五章、 流行病学和医学统计学基本学问 第一节、 流行病学的基本学问 一、 基本概念 1)流行病学的定义 1 .是探讨疾病、健康状态和事务在人群中的分布、影响和确定因素,用于预防和限制疾病,促进健康的学科。 2.基本内涵有四点: 它的探讨对象是人群,是探讨所关注的具有某种特征的人群; 它不仅探讨各种疾病,而且探讨健康状态和事务; 它的重点是探讨疾病、健康状态和事务的分布、影响和确定因素; 最重要的是,它的落脚点是为预防和限制疾病,促进健康供应科学的决策依据。 2) 流行病学的任务 第一阶段:“揭示现象”,即揭示流行(主要是传染病)或分布(其他疾病、损害与健康
2、)的现象。健康信息收集 其次阶段:“找出缘由、影响或确定因素”,即从现象入手找出流行与分布的规律、缘由或影响因素。健康风险评估 第三阶段:“供应措施”,即合理利用前两阶段的结果,找出预防或干预的策略与措施。健康指导和健康危急因素干预 3) 流行病学探讨的方法 二、 常用指标 1) 率和比 比例(proportion) 率(rate) 表示同一事物局部与总体之间数量上的比值,分子和分母的单位相同,而且分子包含于分母之中。 表示在肯定的条件下某现象实际发生的例数与可能发生该现象的总例数之比,来说明单位时间内某现象发生的频率或强度。常用 P=a/(ab) 率=(某现象实际发生的例数/可能发生该现象的
3、总人数)/k,k=101%、1010%、1010/万、101000/10万 构成比例:反映事物静止状态内部构成成分占全体的比重,是可以反映某种概率的数值。率包括:受累人群数量(可以是某病的临床症状、死亡、残疾、试验室异样等) 被视察到的受累人群所处的总体数量 规定的时间 发生频率比例:它与动态的发生改变概率亲密相关,反映肯定时间内,发生某种改变者占全体的比例。 2) 发病指标 1.发病率 定义 是指肯定时期内特定人群中某病新病例出现的频率。 公式 发病率=(肯定时期某人群中某病新病例数/同期暴露人口数)k,式中,k=101% 、1010%、10100/万或 101000/10 万。 一般多以年
4、为时间单位,常用 10 万分率来表示。暴露人口 发病率的分子为新发病例数,有时一个人在视察期间可能多次发生同种疾病,可分别计算为几个新病例。暴露人口也称危急人口,是指视察期间内视察地区的人群中有可能发生所要视察疾病的人,才能作为分母;对于不行能患该病的人,不应包括在分母中。暴露人口数不易获得,一般运用年平均人口数。用途 对于传染病以及死亡率极低或不致死的疾病尤为重要,反映患该病的风险。常用来描述疾病的分布,探讨发病因素,提出病因假设和评价防治措施的效果。留意事项 发病率精确性受许多因素影响,如报告制度不健全、漏报、诊断水平不高等,比较不同地区的发病率,应考虑年龄、性别构成不同,即进行发病率的标
5、化。 2.患病率 定义 亦称现患率、流行率。患病率是指在特定时间点肯定人群中某病新病例和旧病例的人数总共所占的比例。 公式 患病率=(特定时间点某人群中某病新旧病例数/同期视察人口数)k,式中,k=101%、1010U0000/万或 101000/10 万。影响因素 主要受发病率和病程的影响,当某地某病的发病率和病程在相当长的实间内保持稳定,则患病率(P)、发病率(I)和病程(D)三者之间存在下述关系: 患病率=发病率病程 P=ID 因而可以依据患病率和发病率计算出平均病程 用途 患病率对于病程短的疾病价值不大,而对于病程长的一些慢性病的流行状况能供应有价值的信息,可反映某地区人群疾病的分布以
6、及某疾病的疾病负担程度。可依据患病率来合理地安排卫生设施、人力物力及卫生资源 的须要,探讨疾病流行因素,监测慢性病的限制效果 3. 患病率与发病率的区分 患病率的分子为特定时间点所调查人群中某病新旧病例数,而不管这些病例的发病时间;发病率的分子为肯定时期暴露人群中新发生的病例数; 患病率是由横断面调查获得的疾病频率,衡量疾病的存在或流行状况,是一种静态指标,其本质上是一种比例,不是一种真正的率;发病率是由发病报告或队列探讨获得的单位时间内的疾病频率和强度,为动态指标,是一种真正的率 3) 死亡指标 死亡率 病死率 生存率 是指某人群在单位时间内死于全部缘由的人数在该人群中所占的比例。死亡率是测
7、量人群死亡危急最常用的指标。 表示肯定时期内患某病的全部患者中因该病而死亡的比例。病死率与死亡率不同,病死率并非真正的率,只是一个比值。 又称存活率,是指患某种病的人(或接受某种治疗措施的患者)经n年的随访,到随访结束时仍存活的病例数占视察病例的比例。 死亡率=(某人群某年总死亡人数/该人群同年平均人口数)k;式中,k=1010或 101000/10万。常以年为单位时间。 病死率=(肯定时期内因某病死亡人数/ 同期确诊的某病病例数)101% 假如某病的死亡专率与发病专率处于比较稳定的状态,病死率也可由死亡专率与发病专率推算而得。某病病死率=(该病死亡率/该病发病率 101% n 年生存率=(随
8、访满n年的某病存活病例数/随访满n年的该病病例数) 101% ) 粗死亡率:死于全部缘由的死亡率,是一种未经调整的死亡率。 病死率通常用于病程短的急性病,如各种急性传染病、脑卒中、心肌梗死及肿瘤等,以衡量疾病对人生命威逼的程度。 生存率常用于评价某些慢性病如恶性肿瘤、心血管病等病程长、病情较重、致死性强的疾病的远期疗效。死亡专率:按疾病种类、年龄、性别、职业、种族等分类计算的死亡率 病死率受疾病严峻程度和医疗水平的影响,同时也与能否早期诊断、诊断水平及病原体的毒力有关。- 4) 相对危急度 相对危急度(RR) 比值比(OR) 定义 是指暴露组发病率(Ie)与非暴露组发病率 (Io)之比。反应暴
9、露与疾病的关联强度。又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值,除以比照组中暴露人数与非暴露人数的比值。计算公式 RR=Ie /Io - 意义 说明暴露组的发病危急是非暴露组的多少 倍。与 RR 相同,OR 反映暴露者患某种疾病的危急性较无暴露者高的程度。RR无单位,比值范围在0。RR=1,表明暴露与疾病无联系;RR<1,表明存在负联系(提示暴露是爱护因子);RR>1,表明两者存在正联系(提示暴露是危急因子)。比值越大,联系越强 若能满意以下两个条件,则OR值接近甚至等于RR值: 所探讨疾病的发病率(死亡率)很低 所选择的探讨对象代表性好 5) 归因危急度(人群公
10、共卫生意义) 归因危急度(AR) 归因危急度一百零一分比(AR%) 人群归因危急一百零一分比(PAR%) 定义 是指暴露组发病率与非暴露组发病率之差,它是反映发病归因于暴露因素的程度。 是指暴露人群中由暴露因素引起的发病在全部发病中所占的一百零一分比。 表示全人群中由暴露引起的发病在全部发病中的比例。 公式 AR=Ie-Io=Io(RR-l) AR%=(Ie-Io)/Ie101% PAR%=(It-Io)/Itl00%,式中,It 为全人群发病率。 或 PAR%=Po(RR-1)/Po(RR-1)+1l00%,式中,P0 为某因素在人群中的暴露率。 意义 表示暴露者中完全由某暴露因素所致的发病
11、率或死亡率。 - PAR%不仅考虑了暴露因素的RR,而且与某因素在人群中的暴露率(Po)有关。其公共卫生学意义是:完全限制该暴露因素后人群中某病发病(或死亡)率可能下降的程度。 三、 常用的探讨方法 1)现况调查 描述性探讨:指利用已有的资料或特别调查的资料(包括试验检查结果),描述疾病或健康状况在不同时间、地点和人群中的分布特征,进一步开展分析流行病学探讨供应病因或流行因素的线索。 包括:爆发调查、病例及病例组分析、筛查、生态学探讨、现况调查 1.概念: 现况调查:指在某一人群中,应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾
12、病的关联。 横断面探讨:从时间上说,现况调查是在特定时间点进行的,即在某一时点或短时间内完成,又称横断面探讨。 2.现况调查的目的 描述疾病或健康状况的分布 发觉病因线索 适用于疾病的二级预防 评价疾病的防治效果 疾病监测 其他:用于衡量国家或地区卫生水平和健康状况、卫生服务需求的探讨、社区卫生规划的制定与评估、检验标准的制定、为卫生行政部门的科学决策供应依据。3.方法及种类 普查:即全面调查,是指特定时间点或时期、特定范围内的全部人群(总体)均为探讨对象的调查。 优点:无抽样误差 缺点:不适用于患病率低且无简便易行诊断手段的疾病。 抽样调查:是通过抽样的方法,对特定时点、特定范围内的人群的一
13、个代表性样本进行调查,以样本的统计量来估计总体参数所在范围。 优点:节约时间、人力物力 缺点:设计实施困难,不适用变异较大的探讨对象或须要普查普治的疾病 非随机抽样:典型调查、偶遇抽样 随机抽样:样本必需遵循随机化的原则 常见的随机抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样。 4. 优缺点 优点: 常用的是抽样调查,故其探讨结果有较强的推广意义,以样本估计总体的可信度高。将样本是否患病或是否暴露来分组比较,即有来自同一群体的自然形成的同期比照组,结果有可比性 采纳问卷调查或采样监测等手段,一次调查科同时视察多种因素,是疾病病因探究过程中不行缺少的基础性工作之一 局限性:
14、调查时疾病与暴露因素一般同时存在,难以确定先因后果的时相关系 调查得到的是某一时点是否患病状况,故不能获得发病率资料,除非在一个稳定的群体中,连续进行同样的现况调查。 探讨对象中一些人若正处在所探讨疾病的潜藏期或者临床前期,则极有可能会被误认为是正常人,是探讨结果发生偏倚,低估该探讨群体的患病水平 2) 队列探讨 属于分析性探讨,分析性流行病学方法则更常用于验证病因假设,其最常见的两大类:队列探讨和病例比照探讨。 1. 概念:也称群组探讨。是将特定的人群是否暴露于某因素或按不同暴露水平分为n个群组或队列,追踪视察肯定时间,比较各组发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度
15、大小的一种视察性探讨方法。可用于检验病因假设、评价预防效果和探讨疾病自然史 2. 方法 3. 类型 前瞻性队列探讨:探讨对象的确定与分组由探讨起先时是否暴露来确定,探讨结局需随访一段时间才能得到。 历史性队列探讨:探讨工作现在起先,而探讨对象是过去某个时间进入队列的。特点是追溯到过去某时期确定人群对某因素的暴露史,然后追踪至现在的发病或死亡状况。 双向性队列探讨:以上两个方法的结合。依据历史档案确定暴露与否,随访至将来的某个时间确定结局,又称混合性队列探讨 4. 特点 在时序上是由前向后的,在疾病发生前起先进行,故属于前瞻性探讨。 属于视察性对比探讨 探讨对象依据暴露与否分组 是从“因”到“果
16、”的探讨 追踪视察的是两组间的发病率或死亡率差异。 5. 优缺点 优点: 资料完整,无回忆偏倚 计算暴露组和非暴露组发病率,能测量两组间特异危急度和相对危急度 一次调查可视察多种结果,并能了解疾病自然史 能干脆估计暴露因素与发病的联系强度,且先因后果,时间关系明确,所得联系比较的确牢靠。 暴露因素的作用可分等级,便于计算剂量-效应关系 样本量大,结果稳定 在有完整资料记录的条件下,可作回顾性历史队列探讨。 局限性: 视察时间长、费人力、花费高,不能在较短时间内得到结果 打算工作,设计的科学性要求高,实施难度大 暴露人年计算工作量较为繁重 探讨罕见病须要大量探讨对象,不易收集到完整牢靠的资料,故
17、不适用于罕见的探讨。 3) 病例比照探讨 队列探讨:结果牢靠,科学性强,然而耗时和花费较大 病例比照探讨:省时、省力,故应用更为广泛。1. 概念: 病例比照探讨为选择一组患所探讨疾病的患者与一组无此病的比照组,调查其发病前对某个(些)因素的暴露状况,比较两组中暴露率和暴露水平的差异,以探讨该疾病与这个(些)因素的关系。2. 方法: 3. 特点: 在疾病发生后进行,探讨起先时已有一批可供选择的病例 探讨对象按发病与否分成病例组与比照组 被探讨因素的暴露状况是通过回顾获得的 若按因果关系分析,结果已发生,是由果及因的推理依次 经两组暴露率或暴露水平的比较,分析暴露与疾病的联系 4. 优缺点: 优点
18、: 所需样本量小,病例易获得,工作量相对小,所需物力、人力较少,易于进行,出结果快 可以同时对一种疾病的多种病因进行探讨 适合于对病因困难、发病率低、潜藏期长的疾病进行探讨 在某些状况下,还可以对治疗措施的疗效与副作用作初步评价。 缺点: 由于受回忆偏倚的影响,选择合理的比照又较困难,因此结果的牢靠性不如队列探讨 不能计算暴露与无暴露人群的发病率及相对危急度(RR),只能计算比值比(OR) 4)试验性探讨 1. 概念:其基本性质探讨者在肯定程度上驾驭着试验的条件,主动赐予探讨对象某种干预措施。又称干预探讨。 2. 基本特点: 属于前瞻性探讨:干预在前,效应在后 随机分组 设立比照组 有干预措施
19、 3. 临床试验:是在临床上评价新药、新疗法疗效的一种试验,是临床治疗措施在正式应有之前的最终人体应有试验。其目的是视察和论证某个或某些探讨因素对探讨对象产生的效应或影响。4. 社区试验:也称生活方式干预试验,是以尚未患所探讨疾病的人群作为整体进行试验视察,常用于对某种预防措施或方法进行考核或评价。5)诊断试验的评价探讨 定义 诊断试验是对疾病进行诊断的试验方法。它包括各种试验室检查、病史体检所获得的临床资料、X 线、超声诊断等各种公认的诊断标准,并且利用这些资料和技术标准对疾病和健康状况得出准确的结论。 诊断指标 客观指标,即能用客观仪器测定的指标,很少依靠诊断者的主观推断和被诊断者的主诉。
20、主观指标,即完全依据被诊断者的主诉来确定。 半客观指标,即依据诊断者的主观感知推断 诊断标准 由于在一个人群中有病与无病的数值有重叠状况,所以诊断指标确定之后,就应当确定一个诊断标准(诊断界值)用以区分正常与异样。确定诊断标准的方法有生物统计学方法、临床推断法和 ROC 曲线法。 在选择诊断标准时一般要遵循以下原则: 对于一些严峻疾病,如能早期诊断则可获得较好的治疗效果,而漏掉一个可能的病例则其后果严峻,此时应尽可能保证全部的患者都被诊断出来,即选择敏感度较高的指标; 对于治疗效果不志向的疾病,且确诊及治疗费用又较昂贵时,或者误诊一个非患者为患者时后果严峻,造成严峻的精神负担, 则可选择特异度
21、较高的诊断标准; 当假阳性和假阴性的重要性相等时,一般以正确指数最大时所对应的临界点为最佳诊断界值。 诊断试验的评价指标 1.真实性 灵敏度:也称真阳性率,即实际有病且按该诊断试验被正确地判为有病的概率。 特异度:也称真阴性率,即实际无病且按该诊断试验被正确地判为无病的概率。假阴性率:也称漏诊率 假阳性率:也称误诊率 正确诊断指数 2.牢靠性 变异系数(CV):所测平均数的标准差与测定的均数之比,比值越小,牢靠性越好。符合率:又称精确度 诊断试验的一样性分析 3.收益 阳性预料值(+PV):指试验阳性结果中真正患病的比例。阴性预料值(-PV):指试验阴性结果中真正未患病的比例。诊断试验 的评价
22、标 准 1.同金标准诊断方法进行同步盲法比较:在对一项新的诊断试验进行探讨和评价时,只有以金标准为基础进行考核,才能获得精确的结果。2.探讨对象的代表性:为保障试验结果的代表性和可推论性,所选择的病例组和非病例组最好是目标人群的一个随机样本。3.要有足够的样本量。4.诊断界值的确定要合理:既要考虑该试验检验的目的(筛检或确诊),也要兼顾灵敏度和特异度。5.不仅评价真实性,也评价牢靠性。6.试验的方法和步骤要详细,有可操作性。 提高诊断质量的方法 1.联合试验 平行(并联)试验:即几个试验中只要有一个试验呈现阳性即诊断为阳性。其优点是灵敏度增高,漏诊率降低;但同时特异度降低,误诊率增高。 系列(
23、串联)试验:即几个试验中有一个阴性即诊断为阴性全部阳性才能判为阳性。其优点是特异度增高,误诊率降低;缺点为灵敏度降低,漏诊率增高。2.选择患病高的人群 一方面可使新发觉的病例数增加;另一方面可使阳性预料值上升,试验成本下降,其结果使试验的效率提高。 6) 筛检试验的评价探讨 1.概念 筛检试验通过快速的检验、检查或其他措施,将可能有病但表面上健康的人同那些可能无病的人区分开来。 2.筛检的主要用途 筛检最初用于早期发觉那些处于临床前期或临床初期的可疑患者,以进行早诊断和早治疗,提高治愈率或延缓疾病的发展,改善预后。 近年来,筛检试验越来越多地应用于发觉某些疾病的高危个体,以预防疾病的发生。开展
24、流行病学监测,了解疾病的患病率及其趋势,为公共卫生决策供应科学依据。了解疾病的自然史。3.筛检试验的评价指标 灵敏度和特异度 4.筛检试验的类型和方法 筛检的类型 按筛检对象的范围分类,可分为群体筛检和选择性筛检。筛检的方法 单项筛检:即用一种筛检试验检査某一种疾病。多项筛检:多种筛检方法联合运用。5.筛检的应用原则 合适的疾病 筛检的疾病应具有可识别的潜藏期或早期症状期。对疾病的自然史,包括从潜藏期发展到临床期、疾病结局的过程应有足够的了解 对被筛检和诊断出来的病例应有有效而易被群众接受的治疗方法。合适的筛检试验 筛检试验的方法必需快速、简洁、经济有效,且乐于被群众所接受 合适的筛检安排 1
25、) 筛检安排应是一个连续的过程,应对可疑病例供应诊断、治疗的便利。对筛检试验阴性者,还应进行定期检查。2) 要考虑筛检、诊断和治疗整个过程的成本与效益问题。 其次节、 医学统计学的基本学问 一、基本概念 1)医学统计学的定义和探讨对象 1.定义:统计学通常被定义为“关于数据收集、表达和分析的普遍原理和方法”。 医学统计学:则可定义为“依据统计学的原理和方法,探讨医学数据收集、表达和分析的一门应用学科”。 2.探讨对象:是具有不确定性的医学数据,其基本的探讨方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发觉蕴含其中的统计学规律。2)医学统计学的主要内容 1.统计设计 包括调查设计和试
26、验设计。统计设计是保证统计描述和推断正确的基础 2.统计描述 对原始数据进行归纳整理,用相应的统计指标,如率、均数等,表示出研 究对象最显明的数量特征,必要时选择统计表或统计图。3.统计推断 在统计描述的基础上,对统计指标的差别和关联性进行分析和推断。 3)医学统计资料的类型 1.计量资料 亦称数值变量,为定量测量的结果,通常用专用仪器测量,并有计量单 位,如身高(cm)、体重(kg)等。计量资料有连续性的特点 2.计数资料 计数资料是定性视察的结果。 3.等级资料 介于定量测量和定性视察之间的半定性视察结果,通常有两个以上等级 如阴性、阳性、强阳性,治愈、好转、有效、无效等。等级资料与计数资
27、料又可统称为分类变量 4)医学统计工作的基本步骤 探讨设计、收集资料、整理资料和分析资料是统计工作的 4 个基本步骤。 1.探讨设计 按探讨者是否对视察对象施加干预(即处理因素),可以分为调查设计和试验设计两大类。 调查设计(不加干预):主要是了解客观实际状况的现场工作。 试验设计(加干预):依据探讨对象不同分为动物试验和临床试验(或现场试验)。 无论是调查设计,还是试验设计均包括专业设计和统计学设计两个方面。 2.收集资料 任务 取得精确牢靠的原始数据 统计资料的来源 常常性资料。 一时性资料。统计资料的要求 资料必需完整、正确和刚好; 要有足够的数量; 留意资料的代表性和可比性 3.整理资
28、料 任务 整理原始数据,使其系统化、条理化,以便进一步计算指标和分析。原始数据的检查与核对 (应在现场调查完成) 统计数据的常规检查。 数据的取值范围检错。 数据间的逻辑关系检错 数据的分组设计和归纳汇总(按资料的性质和数量特征分组) 质量分组:按事物的性质或类型分组,这种方法多适用于分类变量资料或等级资料。 数量分组:按视察值的大小进行分组,这种方法多适用于数值变量的资料 4.分析资料 任务 按探讨设计的要求,结合资料的类型计算有关指标,阐明事物的内在联系和规律。包括 用一些统计指标、统计图、统计表等方式表达和描述资料的数量特征和分布规律(不涉及由样本推论总体的问题)。对样本统计指标作参数估
29、计和假设检验,并结合专业学问说明分析结果,目的是用样本信息推断总体特征。 4) 统计学的几个重要概念 1.同质与变异:探讨对象具有相同的背景、条件、属性称为同质; 同一性质的事物,其个体视察值(变量值)之间的差异,在统计学上称为变异。 统计学所探讨的对象是以同质为基础,并具有变异的事物或现象。2.总体与样本:总体是依据探讨目的确定的同质视察单位的全体,更准确地说,是同质的全部视察单位某种变量值的集合。 样本:从总体中随机抽取有代表性的一部分视察单位,其测量值(或视察值)的集合称为样本。 3.参数与统计量:参数:指总体指标,如总体均数、总体率、总体标准差等。 统计量:指样本指标,如样本均数、样本
30、率、样本标准差等 4.误差:医学科学探讨中的误差通常指测量值与真实值之差,其中包括系统误差和随机测量误差;以及样本指标与总体指标之差,即抽样误差。 5.概率与频率:概率是对总体而言,频率是对样本而言。 概率:指某随机事务发生的可能性大小的数值,用P表示,0P1。 P越接近于1,表明某事务发生的可能性越大;P越接近于0,表明某事务发生的可能性越小 频率:指一次试验结果计算得到的样本率。 P0.05或P0.01称为小概率事务。 二、 统计描述 1) 数值变量资料的统计描述 1.频数表 将全部视察结果的频数按肯定顺当排列在一起便是频数表 编制频数表的主要目的,一是简化数据,二是便于考察视察结果的分布
31、特征。 定量测量结果通常不列出各测量值的频数。此时,应将全部测量值中最小值与最大值之间的范围划分成若干等长度的组段,以各个组段内的变量个数作为频数。2.频数分布图 以评分组段为底,相应频数为高作一系列的矩形。频数分布图又称直方图,它能直观地反映连续变量各种取值出现的机会 3.描述集中趋势的指标 算术均数:当资料听从对称分布时,统计中常采纳算术均数描述其平均水平(或集中趋势) 中位数:指一组由小到大依次排列的观测值中位次居中的那个观测值。全部观测值中大于和小于中位数的观测值的个数相等,各占总例数的 50% 几何均数:是描述偏态分布资料集中趋势的另一种重要指标。尤适用于描述以下两类资料的集中趋势:
32、 等比资料 对数正态分布资料(有些正偏态分布的资料,原始数据经过对数转换后听从正态 分布) 4.描述离散趋势的指标 方差与标准差 极差 一百零一分位数 变异系数 2)分类资料的统计描述 1.频数表:分类资料的变量值是定性的,表现为互不相容的属性或类别。在一个样本中,相怜悯形出现的次数称为频数,将互不相容的各种情形的频数用统计表的形式列出来就是频数表。 2.相对数:包括比例和率 三、 统计表和统计图 1)统计表 统计表是以表格的形式,表达被探讨对象的特征、内部构成及探讨项目分组之间的数量关系。 1.统计表的结构包括标题、标目、线条、数字等部分,有些统计表还有备注。2.制表原则和要求 制表原则:重
33、点突出,简洁明白 制表的基本要求: 标题:概括说明表的内容,位于表的上方,内容简洁扼要。标目:用以指明表内数字含义,横标目为主语,表示被探讨事物;纵标目为谓语,表示被探讨事物的各项统计指标。线条:除必需的顶线、底线、标目线以外,应尽量削减其他不必要的线条,不运用竖线、斜线。数字:一律运用阿拉伯数字,应精确无误;同一指标的数字的小数位应一样,位次对齐。 2)统计图 统计图是通过点的位置、线段的升降、直条的长短和面积的大小来表现事物的数量关系。其特点是直观、形象、利于对比等。 1.制图的基本要求 依据资料的性质和分析目的,选择合适的图形。统计图要有标题,位于图体下方的中心位置。绘制有坐标轴的图形,
34、纵、横轴要有标目,标注原点、尺度、单位等,纵横轴的比例以 5:7 为宜。同一张图内比较不同事物时,须用不同颜色或样式的线条区分表示,并附图例说明。2.常用统计图的类型 版权全部领考网校 直方图:直方图主要用于表示连续变量的频数分布状况,图中直条连续排布,各直条宽度代表各组段组距,直条高度代表相应组段频数或频率。通过下图 5-5 可直观地了解 折线图:折线图用于描述一个变量随另一个变量的改变而改变的趋势和幅度,通常是变量随时间的改变状况。由下图 5-6 可知 误差条图:常用于比较多组连续变量的均值和标准差(或可信区间),直条的高度表示均值,直条顶端用“T”型图标或“工”型图标表示标准差(或可信区
35、间),图标中竖线长度表示标准差的大小(或可信区间范围)。 箱式图:当连续变量为偏态分布时,用误差条图展示多组间比较不够恰当,可运用箱式图比较多组间的平均水平和变异程度。由图 5-8 可见 直条图:常用于比较统计指标数值的大小和对比关系,各等宽直条间隔排布,直条高度表示统计指标的数值大小 圆图:圆图用于表示构成比,圆的总面积为 101%,圆内各扇形区域表示各部分所占比例 一百零一分条图:当要同时比较多组构成比时,采纳一百零一分条图比圆图更为直观便捷。一百零一分条图中直条的全长代表 101%,其中每段的长度对应当部分在全体中的占比。如下图 5-12 四、 统计推断 统计推断是用样本信息推断总体特征
36、,包括总体参数的估计和假设检验,它是统计学的核心内容。 1)假设裣验的基本原理 假设检验,亦称为显著性检验,是统计推断的核心,也是实际应用最广的内容。通常把须要推断的总体特征叫做“统计假设”,简称假设,利用样本信息推断假设是否成立的统计方法称为假设检验。2)假设检验的基本步骤 1.建立检验假设,确定检验水准。依据统计推断目的提出对总体特征的假设,检验假设有两种: 无效假设,又称零假设,用 Ho 表示。一般将欲否定的假设设为 Ho,它是计算检验统计量的基础。备择假设,用 H1 表示。H1 是与 Ho相互对立的假设,当 Ho被拒绝时,则接受H1。确定检验水准:检验水准,也称为显著性水准,符号为 ,
37、是事先确定的允许犯 I 类错误的概率,也是是否拒绝 Ho的界值。2.选定检验方法,计算检验统计量 要依据统计推断的目的、探讨设计的类型和样本量的大小等条件,选用不同的检验方法和计算相应的统计量。3.确定 P 值,做出推断结论 P 值的含义是指从 Ho所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有样本的检验统计量值的概率。3)假设检验的留意事项 1.检验方法的正确选择 每种检验方法有其适用的条件,应依据探讨目的、设计方案、探讨变量的类型、资料的分布、样本大小等进行选择。定量资料符合参数检验条件,应选用参数检验,其中两个独立样本均数比较可用检验,多个独立样本均数比较可用方差分析;配对设计资料可用配对设计 t 检验,随机区组资料可用随机区组设计的方差分析等。2.结果的说明 正确说明“差别有统计学意义”的含义。一般状况,假设检验中 P 0.05,称为差别有统计学意义;P 0.01,称为差别有高度统计学意义。 第27页 共27页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页第 27 页 共 27 页