《统计学常用公式.pdf》由会员分享,可在线阅读,更多相关《统计学常用公式.pdf(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 统计学常用公式 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】公式一 1.众数【MODE】(1)未分组数据或单变量值分组数据众数的计算 未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。(2)组距分组数据众数的计算 对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。下限公式:1012M=L+i 式中:0M表示众数;L表示众数的下线;1表示众数组次数与上一组次数之差;2表示众数组次数与下一组次数之差;i表示众数组的组距。上限公式:2012M=U-+i 式中:U表示众数组的上限。2中位
2、数【MEDIAN】(1)未分组数据中中位数的计算 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12NXXX,中位数eM,为则有:eN+M=X1()2 当 N为奇数 eNN+1221M=X+X2 当 N为偶数(2)分组数据中位数的计算 分组数据中位数的计算时,要先根据公式 N/2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:式中:eM表示中位数;L表示中位数所在组的下限;m-1S表示中位数所在组以下各组的累计次数;mf表示中位数所在组的次数;d表示中位数所在组的组距。3均值的计算【AVERAGE】(1)未经分
3、组均值的计算 未经分组数据均值的计算公式为:112n+=niixxxxxnn(2)分组数据均值计算 分组数据均值的计算公式为:1 1221121+=+kiikkikkiix fx fx fx fxffff+4几何平均数【GEOMEAN】几何平均数是 N个变量值乘积的 N次方根,计算公式为:式中:G表示几何平均数;表示连乘符号。5调和平均数【HARMEAN】调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。简单调和平均数:211H=111+nininnxxxx1 加权调和平均数:21211211mm+m+mH=mmmm+ninininni
4、ixxxx 式中:H表示调和平均数。6极差【Range】极差也称全距,是一组数据的最大值与最小值之差,即 式中:R 表示极差;maxix和 minix分别表示一组数据的最大值与最小值。7平均差【Mean Deviation】平均差是各标志值与其平均数的绝对离差的算术平均。(1)根据未分组资料的计算公式:1-AD=inix xn(2)根据分组资料的计算公式:11-AD=iniiniix x ff 式中:AD表示平均差 8方差【Variance】和标准差【Standard Deviation】方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。未分组数据方差的计算公式为:221
5、nixxn 分组数据方差的计算公式为:2211iniiniixxff 式中:2表示方差。方差的平方根即为标准差,其相应的计算公式为:未分组数据:21nixxn 分组数据:211iniiniixxff 式中:表示标准差。9离散系数 离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。其计算公式为:Vx 式中:V表示离散系数。10偏态【SKEW】偏态是对分布偏斜方向及程度的测度。利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。EXCEL中偏态
6、系数的计算公式为:31-1-2inix xnnns 11峰值【KURT】EXCEL中峰值系数的计算公式为:式中:s 表示样本标准差。公式二 1 均值估计(1)样本均值的标准差 样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。样本均值的抽样平均误差计算公式为:重复抽样方式:2xnn 不重复抽样方式:21NnxnN 通常情况下,当 N很大时,(N-1)几乎等于 N,样本均值的抽样平均误差的计算公式也可简化为:在公式中,是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样
7、本的情况下,通常用样本标准差 S 代替。(2)大样本均值的极限误差 2xZx (3)大样本下总体均值的区间估计 总体均值的置信度为(1)的置信区间:22xzxxzx 即22xzxznn(4)总体方差未知,小样本正态总体均值的区间估计 总体均值的置信度为(1)的置信区间:即 22ssxtxtnn 2比例估计(1)样本比例的抽样平均误差 样本比例的抽样平均误差为:重复抽样下:1pppn 上式中,p应为总体比例,实际计算时通常用样本比例 p代替。不重复抽样下:1111ppppNnnpnNnN(2)样本比例的抽样极限误差(3)总体比率的区间估计 总体比例 P 的置信度为(1)的置信区间为:即 22pZ
8、pppZp 3 总体均值检验(1)单一总体均值检验 正态总体(总体方差已知)或大样本均值检验 检验统计量 Z为:0 xZn 正态总体(总体方差未知)小样本均值检验 检验统计量 t 为:(2)两个总体的均值检验 两个正态总体均值检验两个总体方差已知或大样本 Z检验统计量为:大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。两个正态总体均值检验(小样本)两个总体方差未知但相等 T检验统计量为:其中:122111111inisxxn;222221211inisxxn 4 总体比例检验(1)单一总体的比例检验 Z检验统计量:0001ppZ
9、ppn(2)两个总体比例的检验 检验的统计量为:121211ppZppppnn 其中:112212n pn ppnn,p为当12pp时1p和2p的联合估计值。5 总体方差假设检验(1)单一正态总体方差的假设检验 检验统计量为:22201ns 其中:2211inixxsn为2的估计量。(2)两个正态总体的方差假设检验 检验统计量为:2212Fss 其中:1221111inixxsn;2221221inixxsn。公式三 1.单因素方差分析 设总体共分为 k种处理进行观察,第 j 种处理试验了容量为jn的样本。(1)计算各项离差平方和 在单因素方差分析中,需要计算的离差平方和有 3 个,它们分别是
10、总离差平方和,误差项离差平方和以及水平项离差平方和。总离差平方和,用 SST(Sum of Squares for Total)代表:式中:x表示全部样本观测值的总均值。其计算公式为:误差离差平方和,用 SSE(Sum of Squares for Error)代表:式中:jx表示第 j 种水平的样本均值,1jnijijjxxn 水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为 A。于是水平项离差平方和可以用 SSA(Sum of Squares for Factor A)表示。SSA 的计算公式为:211jnkjijSSAxx(2)计算平均平方 用离差平方和除以自由度即可
11、得到平均平方和(Mean Square)。对 SST 来说,其自由度为(n-1);对 SSA来说,其自由度为(r-1),这里 r表示水平的个数;对 SSE来说,其 自由度为(n-r)。与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下的关系:n-1=(r-1)+(n-r)对于 SSA,其平均平方 MSA(组间均方差)为:1SSAMSAr 对于 SSE,其平均平方 MSE(组内均方差)为:SSEMSEnr(3)检验统计量 F MSAFMSE 2两因素方差分析 设两个因素 A、B分别有 k 个水平和 n 个水平,共进行 nk次试验。(1)计算各项离差平方和 在两因素方差分析中,需要计
12、算的离差平方和有4 个,它们分别是总离差平方和,误差项离差平方和以及水平 A、B项离差平方和。总离差平方和,用 SST(Sum of Squares for Total)代表:2ijSSTxx 式中:x表示全部样本观察值的总均值,其计算公式为:111nkijijxxnk 水平项离差平方和可以分别用 SSA(Sum of Squares for Factor A)和 SSB(Sum of Squares for Factor B)表示。SSA 的计算公式为:211nkjijSSAxx 式中:11njijixxn SSB 的计算公式为:211nkiijSSBxx 式中:11kiijjxxk 误差离
13、差平方和,用 SSE(Sum of Squares for Error)代表:(2)计算平均平方 用离差平方和除以自由度即可得到平均平方和(Mean Square)。对 SST 来说,其自由度为(nk-1);对 SSA来说,其自由度为(k-1),这里 k表示水平 A的个数;对 SSB来说,其自由度为(n-1),这里 n 表示水平 B的个数;对 SSE来说,其自由度为(n-1)(k-1)。这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:(3)检验统计量 F 公式四 1拟合优度的检验统计量:式中:if表示类别 i 的观察频数;ef表示假设0H为真时,类别 i 的期望频数;k表示类别总数。注意:当所有种类的期望频数均大于或等于 5 时,检验统计量服从自由度为(k-1)的2分布。