《医学统计学简答题(10页).doc》由会员分享,可在线阅读,更多相关《医学统计学简答题(10页).doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-医学统计学简答题-第 10 页医学统计学简答题1. 简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误.估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2) 与n的关系不同: n增大时,S趋于(恒定),标准误减少并趋于0(不存在抽样误差)。(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估
2、计总体均数可信区间和假设检验。联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。2. 简述假设检验的基本步骤。1. 建立假设,确定检验水准。2. 选择适当的假设检验方法,计算相应的检验统计量。3.确定P值,下结论3. 正态分布的特点和应用:特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;2、 对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数和标准差,可记作N(,):均数决定正态曲线的中心位置;标准差决定正态曲线的
3、陡峭或扁平程度。越小,曲线越陡峭;越大,曲线越扁平;5、u变换:为了便于描述和应用,常将正态变量作数据转换;应用4. 简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。1.从意义来看95参考值范围是指同质总体内包括95个体值的估计范围,而总体均数95可信区间是指95可信度估计的总体均数的所在范围2.从计算公式看若指标服从正态分布,95参考值范围的公式是:1.96s。总体均数95可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用为0.05,自由度为v的t界值。5. 频数表的用途和基本步骤。用途:(1)揭示资料的分布特征和分布类型;(2)
4、便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。基本步骤:(1)求出极差;(2)确定组段,一般设815个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。6. 非参数统计检验的适用条件。(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能7. 线性回归的主要用途。1.研究因素间的依存关系,自变量和应变量之间是否存在线性关系,即研究一个或多个自变量对
5、应变量的作用,或者应变量依赖自变量变化而变化的规律。2.利用直线回归方程可进行预测估计。3.用容易测量的指标估计不易测量的指标。4.获得精确度更高的医学参考值范围。8. 简述检验假设与可信区间的联系与区别。(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。前者估计总体参数的大小,后者推断总体参数有无质的不同。(2)可信区间也可回答假设检验的问题。但可信区间不能提供确切的P值范围,只能给出在水准上有无统计意义。(3)可信区间还可提示差别有无实际意义。9. 简述直线回归与直线相关的区别与联系。区别:(1)资料要求不同:直线回归中应变量y是来自正态总体的随机变量,而x既可以
6、是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量; 相关分析则要求x,y是来自双变量正态分布总体的随机变量。(2)回归反映的是两个变量的依存关系,取值范围是(-,)。相关反应两个变量的相互关系,取值范围是(-1,1);(3)回归有单位,相关无单位。联系:统一资料r与b符号相同,即方向一致性,r与b假设检验结果等价,r与b可互相换算,有相关不一定有回归,有回归一定有相关(回归可用来解释相关)10. 标准差的实际应用。1表示数据分布的离散程度2常用“xs”作为计量资料的数字特征描述的专用符号3计算临床上的各种生化、生理指标的参考范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重要
7、依据之一5可用来计算均数的抽样误差大小。相对数的注意事项 p33医学统计学名词解释*总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。*样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。变量:观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。统计量:由样本所算出的统计指标或特征值。*抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值
8、变异程度的指标,为方差的算术平方根。标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。*类错误:拒绝了实际上成立的HO,这类弃真的错误称为类错误。*类错误:指接受了实际上不成立的HO,这类存伪的错误称为类错误。参数:反应总体统计学特征的数字。*计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。*医学参考值范围:绝大多数正常人(正常人的90%,95,99%,尤其最常用95%)的某一指标都在一定的范围内,则这个范围
9、为医学参考值范围。参考值:临床上应用的参考值是指包括绝大部分正常人的人体形态、机能和代谢产物等各种生理及生化指标。*计量资料:用定量的方法测量某项指标的大小所得的资料。(用仪器、工具或其他定量方法准确获得的定量结果,一般带有计量单位)*概率:描述随机事件发生的可能性大小的数值。P值:在Ho规定的总体中进行随机抽样,得到的等于及大于或等于及小于现有样本统计率,或说是比现有实验结果更极端的样本统计量出现的概率,P值越小越不利于接受Ho。线性相关的情况:正相关、负相关、零相关、非线性相关正态分布:又称高斯分布,是一种概率分布。标准正态分布:当0,2 1时,称为标准正态分布,记为N(0,1)。维随机向
10、量具有类似的概率规律时,称此随机向量遵从多维正态分布。(线性)相关系数r:用以描述两个随机变量之间相关关系的密切程度与相关方向的统计指标。回归:分析两个变量或多个变量之间某种数量依存关系的一类统计方法直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法称为直线回归*回归系数b:即回归直线的斜率,统计学意义是自变量X改变一个单位时,应变量Y平均改变b个单位。离散系数(变异系数):标准差与均叔之比。统计量:用样本观察值确定的,反应总体统计学特征且不依赖于未知参数的数字。假设检验:用样本统计量对总体参数或分布的特征假设进行检验,进而对该假设是否成立作出判断。假设检验的步骤:1、建立假设确
11、定检验水平(显著性水平)2、选择适当的假设检验的方法,记录相应的检验统计量3、确定p值下结论。*检验效能:即1-,指两总体确有差异,按规定的检验水平所能发现该差异的能力。*中位数(median):将一组观察值按大小顺序排列后,位次居中的观察值。直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法成为直线回归。方差分析:是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型自变量是否有显著影响。区间估计:总体的区间估计是利用样本信息给出一个区间并同时给出重复试验时该区间包含总体均数的概率。可信区间(CI):按一定概率100(1-a)%(即可信
12、度)估计总体均数的所在范围,得到的范围是可信区间。统计表:统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。统计图:用点的位置、线段的升降、直条的长短及面积的大小等几何图形表达事物的统计指标大小、对比关系及变化趋势。非参数检验最小二乘法相关系数(r)决定系数(r2)医学统计学填空题:标题 标目 线条 数字 备注*2.统计图结构:标题 图域 标目 尺度 图例*3.统计工作的基本步骤:设计 收集资料 整理资料 分析资料9.影响检验效能的四个因素:1. 总体参数的差异越大,检验效能越大 2. 个体差异越小,检 验效能越大 3. 样本量越大,检验效能越大 4. 检验水
13、准a定的越宽,检验效能越大10.编秩号注意:1. 方差为0的数据忽略 2. 余下的n个差数按绝对值由小到大排秩号 3求秩和即将正负秩号分别相加4. 检验统计量R取较小一个秩11.正态分布的特点:1. 集中性,正态分布曲线的高峰位于正中央,即均数所在位置 2. 对称性,以x=u为中心,左右对称,x轴为渐近线 3均匀变动性,正态分布曲线由均数所在处开始分别向左右两侧逐渐均匀下降 4. 两个参数:均数u和标准差6,记作N(u, 6),均数u决定正态曲线的中心位置,标准差6决定正态曲线的陡峭或扁平程度。6越大,曲线越扁平,6越小曲线越陡峭 5. u变换*12.正态分布应用:1. 估计医学参考值范围 2
14、. 质量控制 3. 正态分布是许多统计学方法的理论基础*13.离散趋势指标:极差 方差 标准差 四分位数间距 变异系数 集中趋势指标:14.标准差应用:1. 表示数据分布的离散程度 2常用xs作为计量资料的数字特征描述的专用符号 3. 计算临床上的各种生化、生理指标的参考范围 4. 在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一 5. 可用来计算均数的抽样误差大小。15.检验水准与两类误差:型误差:当H0为真时,假设检验结论拒绝H0接受H1,型错误,当真实情况H0不成立H1成立时。:1分析两个因素(处理因素和区组因素)2两个因素相互独立无交换作用3分析效率高节约样本4设计要求严格
15、。原则:1区组划分2受试单位数量恒定3完全随机化的分组17.医学测量结果按其数源类型分为。18卡方检验的基本思想:检验实际频数和理论频数分布的符合程度,若原假设成立,卡方值不会太大,反之若A与T的差值大,卡方值也越大,当卡方值超出一定范围时,就有理由认为原假设不成立。19方差分析又称变异数分析,完全随机设计的方差可比较一个因素的两个或多个水平的效应。方差分析的应用条件来自正态总体.各组方程差相等.各组样本为相互独立的随机样本。方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型自变量是否有显著影响。方差分析的基本思想:根据研究目的和设计类型,将总体变异分解为若干部分,每个部分都由特定因素相联系。将某因素与随机因素的均方比构成统计量F,通过与F界值的比较做出统计推断方差分析的应用条件:1各组样本是互相独立的随机样本且来自正态总体2各组总体方差相等,即方差齐性。