《(大三下)139202医学统计学(1)重点知识总结.docx》由会员分享,可在线阅读,更多相关《(大三下)139202医学统计学(1)重点知识总结.docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学统计学统计学:是研究数据的搜集、整理与分析的科学,面对不确定数据做出科学的推断和预测,直至为采取一定的决策 和行动提出依据和建议。统计分析:就是使数据变成信息,使信息变成知识,从而推动科学进步的一个过程。医学统计学:是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科变异:宇宙中的事物千差万别,各不相同,即使是同质事物,就某一观察指标来看,各观察单位之间也有差别,这 种同质事物之间的差别,称为变异。总体:是根据研究目的所确定的同质观察单位的全体。个体是构成总体的最基本的观察单位。样本:是从总体中随机抽取的部分个体,进行观察和测量这些个体的测量值构成的集合称为样本含量。随
2、机:即机会均等。是实验设计中必须遵循的基本原则之一,在实验对象的抽样、分组、实施过程中均应遵循随机 化原则。随机变量:统计分析最基本的是变量,即观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异, 观察结果在测量前不能准确预测,故称为随机变量。统计量:由样本所算出的统计指标或特征值称为统计量。是已知的,且随着试验的不同而不同,但统计量的分布是 有规律的,这种规律是统计推断的理论基础。总体参数:是事物本身固有的、不变的,但往往是未知的。抽样误差(SE):样本的统计指标与总体的统计指标的差别,称为抽样误差。概率(P):频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性
3、,因而是可以被认识和度量 的。这个常数P就称为事件A出现的概率,记作P (A)或P。这一定义称为概率的统计定义。小概率事件:若某件事件的发生概率很小,则称该事件为小概率事件。不同研究问题对小概率的要求不同,医学研 究中将概率小于等于0.05或0.01者称为小概率事件。小概率原理:这种小概率事件虽不是不可能事件,但一般认为小概率事件在一次试验中是不会发生的,这就是小概 率原理。是统计推断的一条重要原理。参考值范围:也称为正常值范围,医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。这里的绝 大多数可以是90%、95%、99%等,最常用的是95%。的可信区间(CI):区间估计是按一定的
4、概率或可信度(l-a)用一个区间估计总体参数所在范围,这个范围称作 可信度为(1-a)的可信区间,又称置信区间。第一类错误:拒绝了实际上成立的Ho,这类弃真的错误称为I型错误或第一类错误。第二类错误:不拒绝实际上是不成立的Ho,这类存伪的错误,称为II型错误或第二类错误。把握度:也称检验效能,即两总体确有差别,按a水准能发现他们有差别的能力。抽样误差的表现形式,以及产生的原因?由于生物体的变异总是客观存在的,因而抽样误差是不可避免的,但抽样误差的规律是可以被认识的,因而是 可以控制的。统计推断就是运用抽样误差的规律性对总体的某些特征进行估计和推断。一般来说,样本含量越大,抽样误差就越小,用样本
5、推断总体的精确度就越高。当样本无限接近总体时,抽样误差 就会逐渐消失。描述集中位置的指标有哪些?适用范围的异同?在统计学中用来描述集中位置的指标体系是平均数,包括算术均数、几何均数、中位数等。算数均数,简称均数,山反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描 述。几何均数,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。中位数,M,既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口资料, 是指数据的一端或者两端有不确定值。描述离散趋势的指标有哪些?适用范围的异同?极差、四分位数间距、方差和标准差
6、、变异系数。极差,又称全距,R,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。优点:简单明了。缺点:不灵 敏:仅利用了最大值和最小值,因此不能反映组内其他数据的变异程度;不稳定:尤其在样本例数较多时,得到较大和较小的观察 值的可能性越大,极差就有可能越大,故在样本例数相差悬殊时,不宜比较其极差。四分位数,即P25和P75,对P25来说,有25%的观察值小于它,称下四分位数,QL;对P75来说,有25%的观察值大于它, 称为上四分位数,QU。用四分位数间距反应变异程度的大小,虽然比极差稳定,但仍未考虑全部观察值的变异程度。方差和标准差,对于一个总体而言,可以用数据集中各个观察值
7、与均数之差(离均差)来反映数据集中每个个体的离散程度,然 而并不能将所有的离均差加在一起来反映整个数据集的离散程度一一因为结果将为0。标准差直接地、总结地、平均地描述了变量值的 离散程度。在同质的前提下,标准差越大,说明一组资料的变异程度越大。变异系数,CV,离散系数,标准差与均数之比,变异系数没有度量衡单位,常用于比较度量单位不同和均数相差悬殊的两组或多 组资料的离散程度。区分率和比、率和构成比:比:又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,他是对比的最简单形式,A/B构成比:又称构成指标,它说明一种事物内部各组成部分所占的比重或分部常以百分数表示,=某一组成部分
8、的观察单位数/同一事物内各组成部分的观察单位总数X100%率:又称频率指标,用以说明某现象发生的频率或强度。=实际发生某现象的观察单位数/可能发生某现象的 观察单位总数x比例基数(K)正态分布的特征(高斯分布)?是统计学中一个重要的概率分布,其原因是:医学研究中的某些观察指标服从或近似服从正态分布;很 多统计方法建立在正态分布的基础之上;很多其他分布的极限为正态分布。特征:正态分布是一单峰分布高峰位置在均数X=四处,这一点由f (X)的定义即知。总体中位数亦为小 正态分布以均数为中心,左右完全对称。这是因为f (X)的公式中(x 日)是平方项,故(x 日)值无论正负, 只要绝对值相等,则纵高f
9、(X)相等。正态分布取决于两个参数,即均数H和标准差。口为位置参数,口大, 则曲线沿横轴向右移动,口小,曲线沿横轴向左移动。为形态参数,表示数据的离散程度,若。小,变异小,则 曲线形态瘦高,。大,变异大,则曲线形态矮胖。有些指标不服从正态分布,但通过适当的变换后服从正态分布。 正态分布曲线下的面积分布是有规律的。(计算)掌握:正态曲线下面积的分布规律(正态分布与标准正态分布下的计算问题)t分布的特征:t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度v有关,自由度越 小,t分布的峰值越低,而两侧尾部翘的越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷 大时,t分布就是标准正态分布。掌握:完整的假设检验写法假设检验的注意事项:要有严密的研究设计。选用的假设检验方法应符合其应用条件。正确理解(X水平和 P值的意义单侧检验和双侧检验。结论不能绝对化。校正(选择)校正的/未校正的多组率的比较(看例题)秩和检验的配对,编制,排序(会编号排序填表)书P116表8.5(问答)非参数检验(秩和检验)的优缺点?