2022年卫生统计学名词解释.docx

上传人:Q****o 文档编号:37618516 上传时间:2022-09-01 格式:DOCX 页数:15 大小:70.02KB
返回 下载 相关 举报
2022年卫生统计学名词解释.docx_第1页
第1页 / 共15页
2022年卫生统计学名词解释.docx_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《2022年卫生统计学名词解释.docx》由会员分享,可在线阅读,更多相关《2022年卫生统计学名词解释.docx(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之.2、标准误:将样本统计量的标准差称为标准误.3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM ),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明白均数抽样误差的大小.4、u 分布: 如某一随机变量X 听从总体均数为 、总体标准差为 的正态分布N( ,2),就通过 u 变换( X-u )可将一般正态分布转化为标准正态分布N( 0,1 2 ),即 u 分布. 5、t 分布:

2、在实际工作中,由于 -X 未知,用 S-X 代替,就 -X- S-X 不再听从标准正态 分布,而听从t 分布.6、可信区间:是依据预先给定的概率(1- )所确定的包含总体均数的区间估量范畴.其准确含义为:假如能够进行重复抽样试验,平均有1- (如 95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间.7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)动身 间接判定要解决的问题(H1 )是否成立.然后在Ho 成立的条件下运算检验统计量,最终获 得 P 值来判定.8、型错误:拒绝了实际上成立的Ho ,这类“弃真”的错误称之. 型错误:“接受”了实际上不成立的H

3、o ,这样的“取伪”的错误称之.9、检验效能:1- ,即把握度,指当两总体确有差异,按规定检验水准 所能发觉该差异的才能.10、变量转换:是指原始数据作某种函数转换,如转换为对数值等.1、方差分析:又称变异数分析或F 检验,适用于对多个平均值进行总体的假设检验,以检验试验所得的多个平均值是否来自相同总体.2、单向方差分析 ( one way analysis of variance )是指处理因素只有一个.这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体.3 均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方( mean sq

4、uare, MS )4、LSD-t 检验: 即最小显著性差异t 检验, 适用于一对或几对在专业上有特殊意义的样本均数间的比较.5、SNK (student-Newman-Keuls )法:又称q 检验,是依据q 值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较.6、Tukey 法:又称为真正显著差(honestly significant difference,HSD )的单一值作为判定标准.7、Dunnett-t 检验:适用于g-1 个试验组与一个对比组均数差别的多重比较.8、完全随机设计:是采纳完全随机化的分组方法,将全部试验对象安排到g 个处理组(水平组),各组分布接受不同

5、的处理,试验终止后比较各组均数之间的差别有无统计学意义,推论处理因素的效应.9、析因设计( factorial design )试验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的试验,统称为析因设计(factorial design )试验.10、随机区组设计( randomized block design)是事先将全部受试对象按某种可能与试验因素有关的特点分为如干个区组( block ),使每一区组内的受试对象例数与处理因素的分组数相等,使每个试验组从每一区组得到一例受试对象.1、二项分布 :是指只会产生两种可能结果如“阳性” 或“阴性” 之一的 n 次独立重复试验中

6、,当每次试验的“阳性”概率 保持不变时,显现阳性次数X=0,1,2,3的一种概率分布.可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 1 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载2、Poisson分布:作为二项分布的一种极限情形,已进展为描述小概率大事发生规律的一种重要分布.21、分布:是一种连续型分布,可用于检验资料的实际频数和按检验假设运算的理论频数是否相符等问题.2、拟合优度

7、检验:是判定样本实际频数分布与拟合的理论频数分布是否符合,或者说判定此样本是否来自某种分布.3、Cochran Armitage趋势检验:当某因素是按自然次序的等级分层或者在连续性资料等级化后再分层的情形下,可采纳Cochran Armitage 趋势检验( Cochan Armitage trend test )以分析率是否随分层等级而变化的趋势.4、四格表的费歇尔精确概率(Fisheresxactprobabilitiesin2 2 table)检验:也称四格表概率的直接运算法,是一种直接运算概率的假设检验.它适用于四格表中有理论频数小于 1 或 n 小于 40 的情形,特殊是用其它检验方

8、法所得的概率接近检验水准时.1、回来( regression)与相关( correlation )是讨论两个或多个随机变量之间相互关系的一种重要的统计分析方法,应用较广. 回来是讨论随机变量之间的数量依存关系,相关是讨论随机变量间相互联系的亲密程度和方向.2、回来系数(regression coefficient ):又称斜率(slope),是当 X 每转变一个观测单位时所引起的 Y 的平均转变的估量量,它是回来分析中最重要的统计量.3、SS 总: 称为总离均差平方和( total sum of squares),说明未考虑X 与 Y 的回来关系时Y的变异.SS 回:称为回来离均差平方和.它反

9、映在 Y 的总变异中由于X 与 Y 的直线关系而使Y 变异减小的部分,也就是在Y 的总平方和中可以用X 说明的部分. SS 回越大,说明回来成效越好.SS 残:称为残差平方和或剩余平方和,它反映 X 对 Y 的线性影响之外的一切因素对Y的变异的作用,也就是在总平方和中无法用X 说明的部份.1、logistic 回来分类:是讨论二分类观看结果与一些影响因素之间关系的一种多变量分析方法.0、完全数据:某个观看对象具有明确的结局时,该观看对象所供应的关于生存时间的信息是完整的.我们把达到了明确结局的观看对象的生存时间数据称为完全数据(CompleteData).1、截尾数据:临床试验讨论中有一部分病

10、人,或中途失访,或到观看终止时仍存活,对这部分病人无法知道精确的生存时间,只知道其生存时间比观看到的时间要长,它供应不完全的信息,称为不完全数据,亦称截尾数据.2、生存分析:是将大事发生的结果和随访时间两因素结合在一起进行分析的一种统计分析方法,它能充分利用所得的讨论信息,更加精确的评判和比较随访资料.3、生存时间:是任何两个有联系大事之间的时间间隔.4、截尾值:指在随访过程中,由于某种缘由未能观看到病人的明确结局(即终止大事),所以不知道该病人的准确生存时间,它供应的生存时间的信息是不完全的.5、生存函数:又称为累积生存率,简称生存率.表示具有协变量X 的观看对象其生存时间T 大于时间t 的

11、概率,常用S( t, X ) =P( Tt , X )表示.可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 2 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载6、风险函数:表示据有协变量 X 已生存到时间 t 的观看对象,从生存时间 t 到 t +t 这一特别小的区间内死亡的概率极限, 即生存时间已达到 t 的一群观看对象在时刻 t 的瞬时死亡率.7、死亡概率:表示一个观看对象从开头观看

12、时间到时间t 为止的死亡概率,是一个时间上升函数.8、Kaplan-Meier法(记为 KM法):此法直接用概率乘法原理估量生存率,故又称乘积极限法( Product-limit method),它由 Kaplan Meier 于 1958 年提出,故又称Kaplan-Meier法(记为KM法).这是一种非参数法,主要用于小样本资料的生存率估量.1、判别分析:依据一批分类明确的样本的如干指标的观看值,建立一个关于指标的判别函数和判别准就,然后依据这个判别函数和判别准就对新的样本进行分类,并且依据回代判别的精确率评估它的有用性.2、先验概率:如在所讨论的总体中任取一个样品,该样本属于Yi 的概率

13、为P( Yi ),就为类别 Yi 的先验概率.3、事后概率:如已知某样品的各指标Xi 的观看值为Si,在此条件下,属于Yi 的类别概率 P( Y i S1、S2、Sp)为后验概率. 4、交叉核实:为了判定观测i 的判定正确与否,用删除第i 个观看的训练数据算出判别函 数,然后用此判别函数来判别第i 观测,对每一观测都进行这样的判别.1、聚类分析:是指在不知道应分多少类合适的情形下,试图借助数理统计的方法用已收集到的资料找出讨论对象的合适归类方法.2、R 型聚类:又称指标聚类,是指将m 个指标归类的方法,其目的是将指标降维从而挑选有代表性的指标. 3、Q型聚类:又称样品聚类,是指将n 个样品归类

14、的方法,其目的是找出样品间的共性.1、潜在变量 latentvariable:不能或不易直接观测得到的变量.这种变量往往是依据某种理论假设的.如:交感神经等. 2、公因子:可以说明多个原始变量的抽象变量.3、特殊因子:只能说明一个原始变量的抽象变量.4、主成分分析:查找反映多个变量的独立的综合指标.主成分个数等于变量个数,但是一般去前几个. 5、因子分析:查找说明多个变量的独立的公因子.公因子个数肯定小于原始变量个数.6、主成分分析principalcomponent analysis:主成分分析是一种简化数据的统计方法,把同一个观看单位的多个(m个)彼此相关的数量指标(Xi )化为少数几个(

15、j 个, jm) 互不相关的综合指标Zj (称为第1、2j 个主成分)以便尽可能简洁的说明观看对象,而又不缺失原指标供应的有价值的信息,且每个主成分的实际意义又符合专业说明.1总体:总体(population )是依据讨论目的确定的同质的观看单位的全体,更准确的说,是同质的全部观看单位某种观看值(变量值) 的集合. 总体可分为有限总体和无限总体.总体中的全部单位都能够标识者为有限总体,反之为无限总体.样本:从总体中随机抽取部分观看单位,其测量结果的集合称为样本(sample).样本应 具有代表性.所谓有代表性的样本,是指用随机抽样方法获得的样本.可编辑资料 - - - 欢迎下载精品_精品资料_

16、学习资料 名师精选 - - - - - - - - - -第 3 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载2随机抽样:随机抽样(random sampling)是指依据随机化的原就(总体中每一个观 察单位都有同等的机会被选入到样本中),从总体中抽取部分观看单位的过程.随机抽样是样本具有代表性的保证.3变异:在自然状态下,个体间测量结果的差异称为变异(variation ).变异是生物医 学讨论领域普遍存在的现象.严格的说, 在自然状态下, 任

17、何两个患者或讨论群体间都存在差异,其表现为各种生理测量值的参差不齐.4( 1)计量资料:对每个观看单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料( measurement data).计量资料亦称定量资料、测量资料.其变量值是定量的,表 现为数值大小, 一般有度量衡单位. 如某一患者的身高 ( cm)、体重 kg 、红细胞计数 1012/L 、脉搏(次 /分)、血压( KPa)等.(2)计数资料:将观看单位按某种属性或类别分组,所得的观看单位数称为计数资料(count data).计数资料亦称定性资料或分类资料.其观看值是定性的,表现为互不相容的类别或属性.如调查某的某时的男、女

18、性人口数.治疗一批患者,其治疗成效为有效、无效的人数.调查一批少数民族居民的A 、B、 AB 、O 四种血型的人数等.(3)等级资料:将观看单位按测量结果的某种属性的不同程度分组,所得各组的观看单位数,称为等级资料(ordinaldata).等级资料又称有序变量.如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有次序和等级差别,但这种差别却不能精确测量.一批肾病患者尿蛋白含量的测定结果分为+、 + 、+ 等.等级资料与计数资料不同:属性分组有程度差别,各组按大小次序排列.等级资料与计量资料不同:每个观看单位未准确定量,故亦称为半计量资料.5概率:概率probabil

19、ity 又称几率,是度量某一随机大事A 发生可能性大小的一个数值,记为 P( A ), P( A )越大,说明A 大事发生的可能性越大.0P( A) 1.频率:在相同的条件下,独立重复做n 次试验,大事A 显现了 m 次,就比值m/n 称为随机大事 A 在 n 次试验中显现的频率freqency .当试验重复很多次时P( A) = m/n.6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差. 它受多种因素的影响,使观看值不按方向性和系统性而随机的变化.误差变量一般听从正态分布.随机误差可以通过统计处理来估量.抽样误差( sampling error

20、)是指样本统计量与总体参数的差别.在总体确定的情形下,总体参数是固定的常数,统计量是在总体参数邻近波动的随机变量.7系统误差:系统误差systematic error 是指由于仪器未校正、测量者感官的某种偏差、可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 4 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载医生把握疗效标准偏高或偏低等缘由,使观看值不是分散在真值的两侧,而是有方向性、 系

21、统性或周期性的偏离真值.系统误差可以通过试验设计和完善技术措施来排除或使之削减.8随机变量:随机变量(random variable )是指取指不能事先确定的观看结果.随机变量的详细内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且, 理论上讲,每个变量的取值听从特定的概率分布.9参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等.总体参数是固定的常数. 多数情形下, 总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估量未知的总体参数.10统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等.样本统计量可用来

22、估量总体参数.总体参数是固定的常数,统计量是在总体参数邻近波动的随机变量.1.频数表( frequency table )用来表示一批数据各观看值或在不同取值区间的显现的频繁程度(频数).对于离散数据,每一个观看值即对应一个频数,如某医院某年度一日内死亡0, 1, 2. 0 个病人的天数.对于散布区间很大的离散数据和连续型数据,数据散布区间由如干组段组成,每个组段对应一个频数.2.算术均数( arithmetic mean )描述一组数据在数量上的平均水平.总体均数用 表示,样本均数用X表示.3.几何均数( geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平.记为G.

23、4.中位数( median) Md 将一组观看值由小到大排列,n 为奇数时取位次居中的变量值.为偶数时,取位次居中的两个变量的平均值.反映一批观看值在位次上的平均水平.5.极差( range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其运算简便但稳固性较差.6.百分位数( percentile)是将 n 个观看值从小到大依次排列,再把它们的位次依次转化为百分位.百分位数的另一个重要用途是确定医学参考值范畴.7.四分位数间距(inter-quartile range )是由第3 四分位数和第1 四分位数相减运算而得,常与中位数一起使用,描述偏态分布资料的分布特点,较极差稳固.8.方差(

24、 variance):方差表示一组数据的平均离散情形,由离均差的平方和除可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 5 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载以样本个数得到.9.标准差( standard deviation)是方差的正平方根,使用的量纲与原量纲相同, 适用于近似正态分布的资料,大样本、小样本均可,最为常用.10.变异系数( coefficient of va

25、riation )用于观看指标单位不同或均数相差较大时两组资料变异程度的比较.用CV表示.运算:标准差/ 均数 *100%1 统计推断:通过样本指标来说明总体特点,这种从样本猎取有关总体信息的过程称为统计推断( statistical inference ).2 抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差( sampling error ).3 标准误及 X s:通常将样本统计量的标准差称为标准误.很多样本均数的标准差X s称为均数的标准误(standard error of mean, SEM),它反映了样本均数间的离散程度,也 反映了样本均数与总体均数的

26、差异,说明均数抽样误差的大小.4 可信区间:按预先给定的概率确定的包含未知总体参数的可能范畴.该范畴称为总体参数的可信区间(confidence interval , CI).它的准确含义是:可信区间包含总体参数的可能性是 1- ,而不是总体参数落在该范畴的可能性为1- .5 参数估量:指用样本指标值(统计量)估量总体指标值(参数).参数估量有两种方法:点估量和区间估量.6 假设检验中P 的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率.7 I 型 和 II型错误: I 型错误( type I error),指拒绝了实际上成立的H0,这类 “弃真 ”

27、的错误称为I 型错误,其概率大小用表示. II型错误( type II error ),指接受了实际上不成立的 H0,这类 “存伪 ”的误称为II型错误,其概率大小用表示.8 检验效能: 1- 称为检验效能(power of test ),它是指当两总体确有差别,按规定的检验水准a 所能发觉该差异的才能.9 检验水准:是预先规定的,当假设检验结果拒绝H0,接受 H1 ,下 “有差别 ”的结论时犯错误的概率称为检验水准(level of a test ),记为 .1.率( rate)又称频率指标,说明肯定时期内某现象发生的频率或强度.运算公式为:发生某现象的观看单位数/可能发生某现象的观看单位总

28、数*100% ,表示方式有:百分率(%)、千分率( )等.可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 6 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载2.构成比( proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布.运算公式为:某一组成部分的观看单位数/同一事物各组成部分的观看单位总数*100% ,表示方式有:百分数等.3.比( ratio )又称相对

29、比,是A 、B 两个有关指标之比,说明A 是 B 的如干倍或百分之几.运算公式为:A/B,表示方式有:倍数或分数等.1. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依靠总体分布的详细形式的统计分析方法.由于这类方法不受总体参数的限制,故称非参数统计法( non-parametric statistics ),或称为不拘分布(distribution-free statistics )的统计分析方法,又称为无分布型式假定(assumption free statistics )的统计分

30、析方法.2. 参数统计:通常要求样原来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估量和检验,称为参数统计parametric statistics3. 秩次:变量值依据从小到大次序所编的秩序号称为秩次(rank).4. 秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量.5 直线回来( linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小.直线回来是回来分析中最基本、最简洁的一种,故又称简洁回来(simple regression ) .6 回来系数( re

31、gression coefficient)即直线的斜率slope,在直线回来方程中用b 表示,b 的统计意义为X 每增(减)一个单位时,Y 平均转变b 个单位.7.相关系数r:用以描述两个随机变量之间线性相关关系的亲密程度与相关方向的统计指标.0、标准正态分布(u 分布)与t 分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t 分布的特例(自由度是无限大时)不同点: t 分布是一簇分布曲线,t 分布的曲线的外形是随自由度的变化而变化,标准正态分布的曲线的外形不变,是固定不变的,由于它的外形参数为1.1、 标准差与标准误有何区分和联系?.区分: 1.含义不同 : s

32、 描述个体变量值(x)之间的变异度大小,s 越大,变量值(x )越分散.反之变量值越集中,均数的代表性越强.标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大.反之,样本均数越接近总体均数,抽样误差越小.2.与 n 的关系不同:n 增大时, s(恒定). 标准误削减并趋于0(不存在抽样误差).3.用途不同 : s:表示 x 的变异度大小,运算cv,估量正常值范畴,运算标准误等 : 参数估量和假设检验.联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比.2、 应用相对数时的留意事项有哪些?P39可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 7 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 8 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁