《2022年《卫生统计学》考试重点复习资料.docx》由会员分享,可在线阅读,更多相关《2022年《卫生统计学》考试重点复习资料.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -卫生统计学复习资料第一章 绪论名词说明统计学: 是一门通过收集、整理和分析数据来熟悉社会和自然现象数量特点的方法论科学;其目的是通过讨论随机大事的局部外在数量特点和数量关系 律性,而随机性的数量化,是通过概率表现出来;总体: 总体是依据讨论目的确定的同质的观看单位的全体, 从而探究大事的总体内在规更准确的说, 是同质的全部观看单位某种观看值 (变量值)的集合;总体可分为有限总体和无限总体;总体中的全部单位都能够标识者为有限总体,反之为无限总体;样本: 从总体中随机抽取部分观看单位,其测量结果的集合称为样本(s
2、ample);样本应具有代表性;所谓有代表性的样本,是指用随机抽样方法获得的样本;抽样: 从讨论总体中抽取少量有代表性的个体,称为抽样;概率: 概率 probability 又称几率,是度量某一随机大事A 发生可能性大小的一个数值,记为 P(A),P( A)越大,说明 A 大事发生的可能性越大;0 P(A) 1;频率: 在相同的条件下,独立重复做 n 次试验,大事 A 显现了 m 次,就比值 m/n 称为随机大事 A 在 n 次试验中显现的频率 freqency ;当试验重复很多次时 P(A) = m/n;变量: 表现出个体变异性的任何特点或属性;随机变量: 随机变量( random vari
3、able )是指取指不能事先确定的观看结果;随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲, 每个变量的取值听从特定的概率分布;系统误差: 系统误差 systematic error 是指由于仪器未校正、测量者感官的某种偏差、医生把握疗效标准偏高或偏低等缘由,使观看值不是分散在真值的两侧,而是有方向性、 系统性或周期性地偏离真值;系统误差可以通过试验设计和完善技术措施来排除或使之削减;随机误差: 随机误差( random error )又称偶然误差,是指排除了系统误差后尚存的误差;它受多种因素的影响,使观看值不按方向性和系统性而随机的变化;误差变量一般听
4、从正态分布;随机误差可以通过统计处理来估量;变异: 在自然状态下,个体间测量结果的差异称为变异(variation );变异是生物医学讨论领域普遍存在的现象;严格的说,在自然状态下,任何两个患者或讨论群体间都存在差异,其表现为各种生理测量值的参差不齐;抽样误差:(排除了系统误差,并将随机测量误差掌握在答应范畴内)由于个体变异的存在,在抽样过程中产生的样本统计量与总体参数之间的差异;分布:随机现象的规律性通过概率来刻画,布;而随机大事的全部结局及对应概率的排列称为分其次章 定量资料的统计描述名词说明算术均数: 描述一组数据在数量上的平均水平;总体均数用 表示,样本均数用 X 表示;几何均数: 用
5、以描述对数正态分布或数据呈倍数变化资料的水平;记为 G;中位数: 将一组观看值由小到大排列,居中的两个变量的平均值;n 为奇数时取位次居中的变量值;为偶数时,取位次众数: 众数原指总体中显现机会最高的数值;样本众数就是在样本中显现次数最多的数值;细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 1 页,共 8 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -极差:亦称全距, 即最大值与最小值之差,用于资料的粗略分析,其运算简便但稳固性较差;四分位数间距: 是由第 3 四分位数
6、和第1 四分位数相减运算而得,常与中位数一起使用,描述偏态分布资料的分布特点,较极差稳固;方差: 方差表示一组数据的平均离散情形,由离均差的平方和除以样本个数得到;标准差: 是方差的正平方根,本、小样本均可,最为常用;使用的量纲与原量纲相同,适用于近似正态分布的资料,大样变异系数: 用于观看指标单位不同或均数相差较大时两组资料变异程度的比较,用 CV表示;问答题 常见的描述集中趋势的指标有哪些,概念分别是什么?答:常见的描述集中趋势的指标有算数均数、几何均数、中位数和众数;概念见名解;常见的描述离散趋势的指标有哪些,概念分别是什么?答:常见的描述离散趋势的指标有极差、四分位数间距、方差、标准差
7、和变异系数;概念见 名解;第三章 定性资料的统计描述名词说明 相对数: 是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等;标准化法: 是常用于内部构成不同的两个或多个率比较的一种方法;标准化法的基本思想就 是指定一个统一“ 标准”(标准人口构成比或标准人口数),按指定“ 标准” 运算调整率,使 之具备可比性以后再比较,以排除由于内部构成不同对总率比较带来的影响;问答题 常用的相对数指标有哪些?它们的意义和运算上有何不同?答:常用的相对数指标有:率、构成比和相对比;意义和运算公式如下:率发生某现象的观看单位数100%可能发生某现象的观看单位总数率又称频率指标,
8、说明某现象发生的频率或强度,常以100%、 1000等表示;构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布;常以百分数表示;某一组成部分的观看单 位数 构成比 100 % 同一事物各组成部分的 观看单位总数 比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表 示,其公式为:相对比 =甲指标 / 乙指标(或 100%)甲乙两个指标可以是肯定数、相对数或平均数等;应用相对数时应留意哪些问题?答:应用相对数时应留意的问题有: 运算相对数的分母一般不宜过小; 分析时不能以构成比代替率; 不能用构成比的动态分析代替率的动态分析; 对观看单位数不等的几个率,
9、不能直接相加求其总率; 在比较相对数时应留意可比性; 对样本率(或构成比)的比较应随机抽样,并做假设检验;应用标准化法的留意事项有哪些?答:应用标准化法时应留意的问题有:1标准化法的应用范畴很广,其主要目的就是排除混杂因素的影响; 第 2 页,共 8 页 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -2标准化后的标准化率,已经不再反反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平;3 报告比较结果时必需说明所选用的“ 标
10、准” 和理由;4 两样本标准化率是样本值,存在抽样误差;当样本含量较小时,仍应作假设检验;第四章 统计表和统计图名词说明统计表: 将统计资料及其指标以表格形式列出,称为统计表(表只表示统计指标;统计图: 统计图 statistical graph 是将统计指标用几何图形表达,直条的长短或面积的大小等形式直观的表示事物间的数量关系;问答题 常用统计图的定义和制图要求;statistical table );狭义的统计 即以点的位置、 线段的升降、名称定义制 图 要 求条图用等宽直条的长短来表示相互独立的起点为 0 的等宽直条,条间距相等,按高低次序一般线图各统计指标的数值大小排列;适用于连续性资
11、料;用线段的升降来纵横两轴均为算术尺度,相邻两点应以折线相半对数线图表示一事物随另一事物变化的趋势;连;图内线条不宜超过3 条;用线段的升降来表示一事物随另一事横轴为算术尺度,纵轴为对数尺度;余同一般线圆图物变化的速度;图;以圆面积表示事物的全部,用扇形面以圆面积为100%,将各构成比分别乘以3.6 度积表示各部分的比重得圆心角度数后再绘扇形面积;通常以12 点为始边依次绘图;直方图用矩形的面积来表示某个连续型变量常以横轴表示连续型变量的组段(要求等距),的频数分布纵轴表示频数或频率,其尺度从“0” 开头,各直条间不留间隙;散点图以点的密集程度和趋势表示两种事物绘制方法同线图,只是点与点之间不
12、连接;间的相关关系第五章常用概率分布名词说明正态分布:如指标 X 的频率曲线对应于数学上的正态曲线,就称该指标听从正态分布2(normal distribution);通常用记号 N , 表示均数为,标准差为 的正态分布;标准正态分布 : 均数为 0、标准差为 1 的正态分布被称为标准正态分布(standard normal distribution),通常记为 N 0,1 2;问答题正态概率密度曲线的位置与外形具有哪些特点?答:正态概率密度曲线的位置与外形具有以下特点:1关于 x= 对称;x= 处有拐点; 第 3 页,共 8 页 2在 x= 处取得该概率密度函数的最大值,在细心整理归纳 精选
13、学习资料 - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -3曲线下面积为1;4 打算曲线在横轴上的位置, 增大,曲线沿横轴向右移;反之, 减小,曲线沿横轴向左移;5 打算曲线的外形,当 恒定时, 越大,数据越分散,曲线越“ 矮胖”; 越小,数据越集中,曲线越“ 瘦高”;第六章 参数估量基础名词说明抽样误差: 由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差;标准误及 X:通常将样本统计量的标准差称为标准误;很多样本均数的标准差 X称为均数的标
14、准误, 它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小;点估量: 是直接利用样本统计量的一个数值来估量总体参数;区间统计: 用统计量X 和S 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数;可信区间: 按预先给定的概率确定的包含未知总体参数的可能范畴;该范畴称为总体参数的可信区间;它的准确含义是:可信区间包含总体参数的可能性是 在该范畴的可能性为 1- ;第七章 假设检验基础名词说明 I 型和 II 型错误: I 型错误( type I error ),指拒绝了实际上成立的1- ,而不是总体参数落H0,这类“ 弃真” 的错误称为 I 型错
15、误,其概率大小用 表示; II 型错误( type II error ),指接受了实际上不成立的H0,这类“ 存伪” 的误称为 II 型错误,其概率大小用 表示;检验效能: 1- 称为检验效能(准 所能发觉该差异的才能;问答题power of test ),它是指当两总体确有差别,按规定的检验水假设检验的基本步骤是什么?答:建立假设、选用单侧或双侧检验、确定检验水准;选用适当检验方法,运算统计量;确定 P 值并作出推断结论;假设检验与区间估量的关系式什么?答:置信区间具有假设检验的主要功能置信区间课供应假设检验没有供应的信息;时,仍可以提示差别是否具有实际意义;置信区间在回答差别有无统计学意义
16、的同假设检验比置信区间多供应的信息:假设检验可以报告准确的 P 值;应用假设检验需要留意的问题有哪些?答:应用检验方法必需符合其适用条件;权衡两类错误的危害以确定 的大小; 第 4 页,共 8 页 正确懂得P 值的意义,假如P ,宜说差异“ 有统计学意义”第八章方差分析细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -名词说明总变异: 样本中全部试验单位差异称为总变异;其大小可以用全部观看值的均方(方差) 表示;组间变异: 各处理组样本
17、均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示;组内变异:各处理组内部观看值大小不等,这种变异称为组内变异,可用组内均方表示;随机区组设计: 事先将全部受试对象按自然属性分为如干区组,原就是各区组内的受试对象 的特点相同或相近,且受试对象数与处理因素的水平数相等;然后再将每个区组内的观看对 象随机地安排到各处理组,这种设计叫做随机区组设计;第九章 x2检验问答题R C列表2 检验的留意事项5, 也不答应有理论值小于1;假如发生上述情1、行 列表中不宜有1/5 以上的理论值小于况,一般有两种处理方法: 增大样本含量,从而期望增大理论值; 将理论值小于5 的行和列与
18、性质相近的邻近行或列中的实际频数合并, 期望重新计算的理论值增大;2、当多个样本率或构成比 比较的2 检验结论有统计学意义,并不能判定任意两组之间的差异有统计学意义,必需用行 列的分割的方法进一步作两两比较;3、对于有序的分类变量,采纳卡方检验,不能考虑数据的有序性质;第十章 基于秩次的非参数检验名词说明参数检验: 凡是以特定的总体分布为前提,对未知的总体参数做推断的假设方法;非参数检验: 不以特定的总体分布为前提,也不针对打算总体分布的几个参数做推断,故又称任意分布检验;第十一章 两变量关联性分析名词说明 线性相关系数: 又称 Pearson 积矩相关系数,是定量描述两个变量间线性关系亲密程
19、度和相 关方向的统计指标,其定义为公式:样本相关系数:细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 5 页,共 8 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -问答题相关分析应用中的应留意的问题:1、 散点图能够使我们直观地看出两变量间有无线性关系,散点图,当散点有线性趋势时,才进行相关分析;所以在进行相关分析前应先绘出2、 线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料;3、 显现离群值时慎用相关;4、 相关关系不肯定是因果关系;5、 分层资料盲
20、目合并易出假象;第十二章 简洁回来分析名词说明回来分析: 讨论结果变量如何随自变量变化的常用方法;回来直线的置信带:将置信区间的上下限分别连起来形成的两条弧线间的区域;最小二乘原就:每个观看点距离回来线的纵向距离的平方和最小,即残差平方和最小;(1- )置信带的意义:在满意线性回来的假设条件下,可以认为真实的回来直线落在两条 弧线曲线所形成的区带内,其置信度为 1- ;问答题线性回来模型的适用条件:(1)因变量 Y与自变量 X 呈线性关系;Y都听从正态分布(2)每个个体观看值之间相互独立(3)在肯定范畴内,任意给定X 值,对应的随机变量(4)在肯定范畴内,不同的X 值所对应的随机变量Y的方差相
21、等;公式回来方程:=a+bX b=a=b(一)方差分析=b(二)t 检验 是否为 0 的假设检验, 方差分析和t 检验是等价的, 并且有留意: 对同一资料作总体系数细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 6 页,共 8 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -的关系;(三)总体回来系数 的置信区间(四)打算系数 回来平方和与总离均差平方和之比,记为第十四章 试验设计试验设计的基本要素:受试对象、处理因素、试验效应;(小题)试验设计的基本原就:对比、随机化、重
22、复;(小题)常用的试验设计方案:完全随机设计、配对设计、随机区组设计、拉丁方设计、交叉设计、析因设计、嵌套设计、正交设计名词说明处理因素 被试因素 :依据讨论目确定的欲施加或欲观看的、并能引起受试对象直接或间接效应的因素,简称处理或因素factor ;是依据讨论目的确定的主要因素,处理因素在整个试验中应始终要保持不变;非处理因素: 与处理因素可能同时存在的能使受试对象产生效应的非讨论因素;非处理因素 经常会干扰讨论因素的观看与分析,因此又称为干扰因素或混杂因素 confounder ;问答题 受试对象应满意三个基本条件:一是对处理因素敏锐;二是特异性,即不受非处理因素干扰;三是反应必需稳固;影
23、响样本含量估量的因素 越小所需样本含量愈多;1.第一类错误 的大小:2.检验效能 1 或其次类错误 的大小:检验效能愈大,其次类错误的概率愈小,所需样本 含量愈多;3.容许误差 :容许误差愈大,所需样本含量愈小;4.总体标准差 或总体概率:反映资料的变异度;愈大,所需样本含量自然愈多;总体 概率 越近于 0.50,就所需样本含量愈多;试验设计的基本原就 一、对比原就 目的:掌握混杂因素和偏倚;显露处理因素的效应;判定不良反应;对比的方式: 1劝慰剂对比 2空白对比3试验对比4自身对比5标准对比二、随机化原就 随机化是使每个受试对象都有同等的机会被抽取或分到不同的试验组和对比组;随机化形式: 1
24、抽样的随机 三、重复原就2分组的随机 3试验次序的随机细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 7 页,共 8 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -重复是指在相同试验条件下进行多次讨论或多次观看;重复最主要的作用是估量试验误差;重复的形式:(1)整个试验的重复; (2)用多个受试对象进行重复:有足够的样本含量; ( 3)同一受试对象的重复观看;细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 8 页,共 8 页 - - - - - - - - -