《统计学之计量资料的统计描述.pptx》由会员分享,可在线阅读,更多相关《统计学之计量资料的统计描述.pptx(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、例1 求极差(range):即最大值与最小值之差,本例极差: R=5.883.79=2.09(1012/L)(2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一, 再略加调整。 本例i= R /10=2.09/10=0.2090.2。(3) 列出组段:第一组段的列出组段:第一组段的下限略下限略小于最小值小于最小值,最后一个组段,最后一个组段上限必须上限必须包含最大值包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4) 划记计数划记计数:用划记法将所有数:用划记法将所有数据归纳到各组段,得到各组段的频数据归纳
2、到各组段,得到各组段的频数。集中趋势(central tendency):变量值集中位置。本例在组段“4.7”。平均水平指标离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。变异水平指标 计量资料(定量资料、数值变量资料)计量资料(定量资料、数值变量资料)总体:总体:有限或无限个(定量)变量值 样本:样本:从总体随机抽取的n个变量值: X1, X2, X3, Xn n为样本例数(样本大小、样本含量)符号:总体 样本适用条件:资料呈对称分布,尤其是正态或近似正态。计算:(1)直接法(2)频数表法nXnXX
3、XXn21112233123kkikif Xf Xf Xf XfXXfffff为求和符号,读成sigma;f :“权数”XnXXnXXXXnXXXXXGnGnnGlglglg)lglg(lg1lg12121为正值,为底的反对数表示以为底的对数;表示以010lg10lg1X适用条件适用条件:呈倍数关系的等比资料或对数正态分:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料布(正偏态)资料;如抗体滴度资料 例例 血清的抗体效价滴度的倒数倒数分别为:10、100、1000、10000、100000,求几何均数。1000510lg10lg10lg10lg10lglg543211G此例的
4、算术均数为此例的算术均数为22222,显然不能代表滴度的,显然不能代表滴度的平均水平。同一资料,平均水平。同一资料,几何均数几何均数中位数中位数负偏态分布时:均数均数中位数中位数 例:设甲、乙、丙三人,采每人的耳垂血,然后红细例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数胞计数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3)甲乙丙minmaxXXR 1204020符号:R意义:反映全部变量值的变动范围。 优点:简便,如说明传染病、食物中毒的最长、最短潜伏期等。 缺点:1. 只利用了两个 极端值 2.n大,R也会大 3.不稳定适用范围:任何计量资料;是参考变异指
5、标百分位数百分位数 :数据从:数据从小到大小到大 排列排列;在百分在百分尺度下,所占百分比尺度下,所占百分比对应的值。记为对应的值。记为Px。 四分位间距四分位间距:QP75 P25 P100(max)P75P50(中位数中位数)P25P0(min)Px确定医学确定医学参考值范围参考值范围 (reference range):): 如如95参考值范围参考值范围P97.5P2.5; 表示有表示有95正常正常个体个体的测量值在此范围。的测量值在此范围。22()XN 总 体 方 差数理统计证明,n代替N后,计算出的样本方差对总体方差的估计偏小。对于样本资料,对离均差平方和取平均时分母用n-1代替n。
6、分母为n-1,称为自由度(能自由取值的变量的个数)。2222()11XXnXXSnn 样本方差222()11XXnXXSnn样本标准差 标准差标准差 (standard deviation)即方差的正平)即方差的正平方根;其单位与原变量方根;其单位与原变量X的单位相同。的单位相同。122fffXfXS频数表样本标准差2()XXN总体标准差99.50155/250012604001222甲的标准差nnXXS%100XSCV符号符号:CV适用条件适用条件:观察指标单位不同,如身高、体重:观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊 意义:意义:挑选指标时变异系数越小,指标越好。 1极差较粗,适合于任何分布极差较粗,适合于任何分布2标准差标准差与均数的单位相同,最常用,适合于近似正态分布与均数的单位相同,最常用,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征,平均指标和变异指标分别反映资料的不同特征, 常配套使用常配套使用 如如 正态分布正态分布:均数、标准差;:均数、标准差; 偏态分布偏态分布:中位数、四分位半间距:中位数、四分位半间距