《医学统计学公式整理(共3页).doc》由会员分享,可在线阅读,更多相关《医学统计学公式整理(共3页).doc(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) 几何均数: 或频数表资料:中位数:(1) (2) 百分位数其中:L为欲求的百分位数所在组段的下限 , i为该组段的组距 , n为总频数 , 为该组段的的频数 , 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2)(1) (2)标准差: 或 频数表资料计算标准差的公式为 变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 2.间接法标准化 正态分布:密度函数:分布函数: 小于X值的概
2、率,即该点正态曲线下左侧面积 特征:(1)关于x=对称。(2)在x=处取得该概率密度函数的最大值,在处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)决定曲线在横轴上的位置,决定曲线的形状 。(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 ,u服从总体均数为0、总体标准差为1的正态分布。u值左侧标准正态曲线下面积为标准正态分布函数,记作 医学参考值的确定方法:(1)百分位法:双侧(P25,P975),单侧P95以下或P5以上,该法适用于任何分布型的资料。(2)正态分布法:若X服从正态分布,双侧医学参考值范围为样本均数标准误的估计值为t分布的概
3、念:小样本总体标准差未知时,服从自由度为n-1的t分布 总体均数可信区间的计算:大样本或总体标准差已知:式(1); 小样本:式(2)(1) (2)单样本t检验:检验统计量:式(1);样本例数估计:式(2) (1)自由度为 n-1;(2)配对样本t检验:检验统计量: 样本量计算同前两样本t检验:检验统计量: (错)随机分组方法: 样本例数估计方差不齐的近似t检验检验统计量:式(1) ;校正自由度为:式(2)(1) (2)方差齐性检验:H0:两总体方差齐,H1:两总体方差不齐,=0.1检验统计量:分子自由度为n1-1,分母自由度为n2-1方差分析的基本思想:1、总变异:总离均差平方和:2. 组间变
4、异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 =3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 组间均方与组内均方比值一般地服从分子自由度为1,分母自由度为2的F 分布 多个样本间的多重比较Dunnett 检验:用于各实验组与对照组比 查dunnett界值表,确定P,自由度等于方差分析中误差SNK-q检验:用于各组间全面的两两比较Q= 查q界值表确定相应的概率P,自由度等于方差分析中误差,表中a为按均值大小排序,两对比组所包含的组数。 二项分布的概率函数P(X):;二项分布的均数和标准差 :进行n次独立重
5、复试验,出现X次阳性结果X的总体均数为 总体方差为总体标准差为如果将阳性结果用频率表示 率的总体均数 标准差又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k次的概率为 出现阳性的次数至少为k次的概率 率的可信区间的估计正态近似法:当均大于等于5时样本率与总体率的比较:检验假设H0:=0,H1:01 . 满足正态近似时,计算检验统计量 或 2. 不满足正态近似时用直接概率计算法两样本率的比较:H0:1=2,H1:12, 检验统计量: Poisson分布的概率函数为POISSON分布的应用:单侧累计概率计算:稀有事件发生次数至多为k次的概率为 发生次数至少为k次的
6、概率为总体均数的区间估计:正态近似法95%总体均数的可信区间为样本率和总体率的比较正态近似法: 当满足正态近似条件时, 对检验假设 H0:=0,H1:0, 检验统计量为两组独立样本资料的Z检验 :当两总体均数都大于20时, 对检验假设H0:1=2, H1:12,当两样本观测单位数相等时,检验统计量为:式(1);当两样本观测单位数不等时,检验统计量为:式(2)(1) (2)四格表c2检验的步骤: 1检验假设, H0:两总体率相等,H1:两总体率不等。=0.05 。2统计量3. 确定p值。4. 结论。n40,且T5,n=(行数-1)(列数-1) ,当n40,如果有某个格子出现1T5,校正公式 注意
7、如果出现n40或一个T1则不能用c2检验多样本率和构成比的2检验:假设H0:各总体率相等,H1:各总体率不等或不全等,=0.05,自由度 n=(行数-1)(列数-1)。统计量为 或构成比的比较:假设H0:构成比相同,H1:构成比不同配对四格表的2检验:配对设计列表:假设H0:B=C两阳性率相等; H1:BC两阳性率不等 检验统计量:式(1) 若 b+c40:式(2)(1) (2)两分类变量的关联性检验:假设:H0:两分类变量无关 (满足概率独立性) ,H1:两分类变量有关 配对设计资料的符号秩和检验:正态近似法:计算u统计量,如果数据超出表的范围可计算统计量。下式中tj为第j(j=1,2)次相
8、持所含相同秩次的个数 两独立样本比较的秩和检验:确定P值和作出推断结论。如果n1或n2-n1超出了成组设计T界值的范围,可用正态近似检验。 完全随机化设计多组独立样本的秩和检验:统计量 确定P值并做出推断结论:如取相同秩次个数较多时需校正 随机化区组设计资料的秩和检验:计算统计量M值 ,确定P值并做出推断结论:2分布近似法:当处理数k或区组数b超出M界值表的范围时,采用近似 2 分布法 或自由度为(k-1) 。当各区组间出现相同秩次时,需进行校正 ,校正公式为(其中b为区组个数,k为处理组个数) 直线相关:Pearson积差相关系数:描述线性相关程度,式中Lxx,Lyy,Lxy分别表示X的离均
9、差平方和、Y的离均差平方和、X与Y的离均差乘积和。相关系数的统计推断:检验假设为H0 :0,H1 :0 自由度为n-2的t分布 直线回归:反应变量(Y)依赖于另一自变量(X)简单线性回归模型表述为,Yi 为第 i 个个体的反应变量值,Xi为其自变量值,为回归直线的截距参数,为回归直线的斜率参数, i为误差。线性表达式称为回归方程:,a与b分别为模型参数与的估计;是与X相对应的Y的平均值 回归参数估计的最小二乘原则 : 残差为,用一定的数学方法确定a和b的适宜值,使所有n个数据点的残差平方和达到最小值,则称这一对a和b为和的最小二乘估计 回归截距a :回归系数的统计推断:H0: =0, H1:0
10、(1)t检验(自由度为n-2) ,(2)方差分析法:总变异SS总,回归平方和SS回,残差平方和SS残, SS总=SS回+SS残; MS是均方,即SS与自由度之商。MS回与MS残之比值就是F值。 /n,回归方程的应用:(1)Y的总体均数的(1-)置信区间 ,(2)个体Y预测值的区间估计 样本含量的估计:单样本均数检验(1)两样本均数比较(2)单样本率检验(3)两样本率比较检验(4)多元线性回归的数学模型为 其中,Yi为第i样品反应变量的实际观测值;0为常数项,i第i样品的误差项,要求服从N(0,2)分布样本估计回归方程 Logistic回归模型: Logistic回归与多元回归的不同之处Logistic回归的参数估计:似然函数:通常用最大似然估计法求解模型中参数的估计值。参数的意义与比数比:等式左边为比数比。logistic回归系数的意义是:在其他自变量固定不变的情况下,自变量的暴露水平每改变一个观测单位时所引起的比数比的自然对数改变量 连续型变量总体均数的估计:总体均数的置信区间 : 样本均数的标准误 :0-1变量总体概率的估计:样本率的标准误 :,总体率的置信区间 连续型变量总体均数估计的样本:样本例数估计主要依据为总体指标可信区间规定容许误差为: 则有:专心-专注-专业