《统计学平均数和标准差市公开课一等奖百校联赛获奖课件.pptx》由会员分享,可在线阅读,更多相关《统计学平均数和标准差市公开课一等奖百校联赛获奖课件.pptx(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 平均数与标准差第1页第一节 算术均数和几何均数数值变量资料统计描述:集中趋势数值变量资料统计描述:集中趋势central central tendency tendency 和离散趋势和离散趋势tendency of dispersiontendency of dispersion平均数平均数averageaverage:说明一组观察值:说明一组观察值(变量值变量值)集中趋集中趋势、中心位置或平均水平。势、中心位置或平均水平。(a measure of location,a measure of location,a measure of central tendency,a mean
2、 or an averagea measure of central tendency,a mean or an average)平均数种类:算术均数平均数种类:算术均数arithmetic meanarithmetic mean、几何均、几何均数数geometric meangeometric mean、中位数、中位数medianmedian、众数、众数modemode、调和均数调和均数harmonic mean,Hharmonic mean,H第2页一、算术均数,简称均数一、算术均数,简称均数meanmean。统计表示:总体参数用统计表示:总体参数用希腊字母希腊字母表示,样本统计表示,样本
3、统计量用量用拉丁字母拉丁字母表示表示用用表示总体均数,用表示总体均数,用 表示样本均数表示样本均数(一一)不分组资料均数计算法不分组资料均数计算法:直接计算直接计算为防止过于复杂,在求和范围可看清时对为防止过于复杂,在求和范围可看清时对sigmasigma不不记上下标记上下标(dummy suffix)(dummy suffix),对,对x x也不加下标也不加下标The mean is the sum of the observations The mean is the sum of the observations divided by the number of observations
4、.divided by the number of observations.第3页(二)分组资料均数计算法:频数表法P20例3-2,步骤:1、分组和编制频数分布表frequency distribution table1)1)找出观察值中找出观察值中最大值最大值、最小值最小值和和极差极差rangerange2)2)按极差大小决定组段数、组段和组距按极差大小决定组段数、组段和组距class class intervalinterval:8 81515组,惯用极差组,惯用极差1/101/10取整作组距,取整作组距,组段下限和上限组段下限和上限low limit and upper limitlo
5、w limit and upper limit应界限应界限分明,无交叉,从下限开始不包含上限,第一分明,无交叉,从下限开始不包含上限,第一组段包含最小,最终组段包含最大观察值组段包含最小,最终组段包含最大观察值 3)3)列表划记列表划记tallyingtallying:见:见P20P20表表3-23-2。频数表可绘。频数表可绘成直方图成直方图histogramhistogram第4页2 2、加权法、加权法weighting methodweighting methodx x为组中值为组中值class mid-value(midpoint)=class mid-value(midpoint)=本
6、组下本组下限与相邻较大组段下限相加除以限与相邻较大组段下限相加除以2 2k k 为组数为组数f f 为各组频数,又称权数为各组频数,又称权数weightweightf f 各组频数之总和各组频数之总和fx fx 为各组组中值与频数乘积之和为各组组中值与频数乘积之和计算实例见计算实例见P21P21第5页3 3、简捷法、简捷法short-cut methodshort-cut method1)1)在频数表基础上,以与最大频数相对应组中值为在频数表基础上,以与最大频数相对应组中值为假定均数假定均数x x0 0,assumed origin,assumed origin2)2)列出简捷法计算均数用表,
7、列出简捷法计算均数用表,d d为各组组中值减去假定均数后除以组距为各组组中值减去假定均数后除以组距i i,假定均数对,假定均数对应应d d为为0 0,向上依次为,向上依次为-1-1,-2-2,向下依次为向下依次为1 1,2 2,3)3)将各行将各行f f值与值与d d值值 相乘得相乘得dfdf,再求,再求dfdf4)4)求均数求均数*:*:能够任何一组组中值为假定均数,结果一致,能够任何一组组中值为假定均数,结果一致,但设在频数最大组或其附近时,计算较简便。计算但设在频数最大组或其附近时,计算较简便。计算机更方便机更方便第6页二、几何均数二、几何均数geometric meangeometri
8、c mean,简记为,简记为GG1)1)资料偏态分布,少数数据过分偏大,资料偏态分布,少数数据过分偏大,(各观察值各观察值间呈等比关系间呈等比关系),原始数据进行对数变换后为对称,原始数据进行对数变换后为对称分布,如平均潜伏期、平均抗体滴度等资料分布,如平均潜伏期、平均抗体滴度等资料2)2)公式公式P22P22例例3-33-3,计算抗体滴度几何均数;该方法计算,计算抗体滴度几何均数;该方法计算出出GG通常偏小,可在计算反对数前通常偏小,可在计算反对数前+(+(lgdlgd)/2)/2第7页3)几何均数应用几何均数惯用于等比资料几何均数惯用于等比资料观察值不能有观察值不能有0 0观察值不能同时有
9、正值和负值,若全为负先把观察值不能同时有正值和负值,若全为负先把负号除掉,最终结果前加负号负号除掉,最终结果前加负号第8页第二节 中位数和百分位数一、一、median median 用用MM表示表示:把变量值按大小次序排列,把变量值按大小次序排列,居于中间位置那个数值就是居于中间位置那个数值就是MM适合用于:偏态或分布不明资料适合用于:偏态或分布不明资料 对称分布时靠近均数,偏态分布时更合理对称分布时靠近均数,偏态分布时更合理(一一)未分组资料未分组资料:P23:P23例例3-43-4,例,例3-53-5第9页(二二)分组资料:按频数表计算分组资料:按频数表计算MM公式:公式:L L中位数所在
10、组下限中位数所在组下限WW中位数所在组宽度中位数所在组宽度f f中位数所在组频数中位数所在组频数(例数例数)n n总频数总频数C C中位数所在组前一组累计频数中位数所在组前一组累计频数cumulative cumulative frequencyfrequency第10页用累计频数百分数法寻找中位数所在组段:累计频数刚大于n/2组段用内插法linear interpolation求中位数将W等分为f份,从C至n/2数值长为(W/f)*(n/2 C)L值累计频数Cn/2第11页二、百分位数percentile:指将n个观察值从小到大依次排列,再把它分成100等份,对应于r%位数值即为第r百分位数
11、。通惯用Pr 表示。中位数即第50百分位数(一)不分组资料计算方法Pr=x r%(n+1)当n为150时计算第5百分位数5%(150+1)=7.55个变量值,如第7个变量为15,第8个变量为17,用内插法求x7.55=15+0.55(17-15)=16.1,P5为16.1第12页(二二)分组资料计算方法分组资料计算方法percentile is estimated by linear interpolation aspercentile is estimated by linear interpolation as(三三)要计算多个百分位数时亦用图解法:要计算多个百分位数时亦用图解法:y ax
12、is is y axis is cumulative relative frequency,x axis is cumulative relative frequency,x axis is observation(incubation period).see Figure 3-2,observation(incubation period).see Figure 3-2,P25P25第13页中位数和百分位数应用1)1)中位数惯用于描述偏态分布资料集中位置,中位数惯用于描述偏态分布资料集中位置,反应位次居中观察值水平,只受居中变量值波反应位次居中观察值水平,只受居中变量值波动影响,对称分布时与
13、均数相同动影响,对称分布时与均数相同2)2)百分位数用于描述观察值在某百分位位置时百分位数用于描述观察值在某百分位位置时水平,多个百分位数结合应用可更全方面描述水平,多个百分位数结合应用可更全方面描述分布特征分布特征3)3)百分位数惯用于确定医学参考值范围百分位数惯用于确定医学参考值范围(reference ranges,(reference ranges,正常值范围正常值范围)4)4)分布中部百分位数相当稳定,含有很好代表分布中部百分位数相当稳定,含有很好代表性,但靠近两端百分位数只有在样本数足够大性,但靠近两端百分位数只有在样本数足够大时才较稳定。时才较稳定。第14页 第三节 标准差sta
14、ndard deviation一、标准差意义:SD是表示一套变量值离散程度指标,均数与标准差结合,能全方面反应一套变量值分布情况。SD is a measure of variation,scatter,spread or dispersion.离散程度 离均差x-x 考虑正负值变为离均差平方 考虑观察值个数则除以n,为方差variance,考虑到V是观察单位平方,故开方得SD第15页第16页由公式可见,当各变量值愈靠近均数时,标准差由公式可见,当各变量值愈靠近均数时,标准差越小,当各观察值远离均数时,标准差越大,所越小,当各观察值远离均数时,标准差越大,所以标准差能说明变量值离散程度。以标准
15、差能说明变量值离散程度。二、不分组资料标准差计算二、不分组资料标准差计算用代数方法将上述公式简化为用代数方法将上述公式简化为P27P27表表3-83-8计算实例计算实例第17页三、离均差平方和简化计算三、离均差平方和简化计算离均差平方和离均差平方和sum of squares about the mean sum of squares about the mean 简简记为记为l lxxxx,即,即离均差平方和或离均差积和离均差平方和或离均差积和sum of productssum of products计算计算时,当原始数据比较大时,计算能够减一个数可时,当原始数据比较大时,计算能够减一个数
16、可除一个数,进行简化。除一个数,进行简化。第18页三条规则:1、原始数据减一个数或加一个数时,离均差平方和或积和数值不变2、原始数据除以一个数a,则简化值算出离均差平方和要乘上一个a2才是原有离均差平方和3、离均差积和在计算时如将两变量之一(如x),除以一个数a时,则求得之离均差积和要乘以一个a,才是原始数据离均差积和;如y也同时除以一个数字b,则求得离均差积和要同时乘以ab第19页四、分组资料标准差计算四、分组资料标准差计算公式:公式:计算实例见计算实例见P29P29表表3-113-11五、标准差应用五、标准差应用 1 1、表示变量值离散程度、表示变量值离散程度 2 2、概括地预计变量值频数
17、分布、概括地预计变量值频数分布 3 3、应用于求正常值范围、应用于求正常值范围normal rangenormal range 4 4、计算标准误、计算标准误 5 5、质量控制、质量控制第20页1 1、表示变量值离散程度、表示变量值离散程度均数相近,单位相同时,标准差大表示变量值分均数相近,单位相同时,标准差大表示变量值分布较分散,反之亦然。布较分散,反之亦然。比较度量衡单位不一样或均数相差悬殊多组资料比较度量衡单位不一样或均数相差悬殊多组资料变异度时,需改用变异系数变异度时,需改用变异系数coefficient of coefficient of variationvariation,CVC
18、V表示标准差与均数之比表示标准差与均数之比P29-30P29-30例例3-73-7,8 8第21页2、正态分布normal(Gaussian)distribution 直方图histogram:横轴表示变量值大小,以各长方块面积代表频数,P30图3-3,当观察例数逐步增多,组距细分时变一条光滑曲线,形状近似正态曲线 正态曲线:呈对称钟型,在均数处最高,两侧逐步低下,两端在无穷远处与底线相靠正态分布两个参数:正态总体均数和标准差(和)。通惯用N(,)表示第22页正态曲线函数式正态曲线函数式density functiondensity function:正态曲线下面积分布规律:正态曲线下面积分布
19、规律:占全部曲线下面积:占全部曲线下面积68.27%68.27%1.64:1.64:占全部曲线下面积占全部曲线下面积90.90%90.90%1.96:1.96:占全部曲线下面积占全部曲线下面积95.00%95.00%2.58:2.58:占全部曲线下面积占全部曲线下面积99.00%99.00%第23页3、正常值(参考值reference value)范围:医学上常把绝大多数(90%,95%,99%)正常人某指标值范围称为该指标正常值范围。资料近似正态或经变量变换后符合正态分布时可用上述面积规律来预计95正常值范围,偏态资料可用百分位数法。正常人并非完全健康人,而是指排除了影响所研究指标疾病和相关
20、原因同质人群。按实际需要确定上下限或仅上限或仅下限。双侧:1.64,1.96,2.58;单侧:1.28,1.64,2.33第24页4 4、质量控制:为了控制试验中检测误差,常以均、质量控制:为了控制试验中检测误差,常以均数加减数加减2 2个标准差作为上、下警戒值,以均数加减个标准差作为上、下警戒值,以均数加减3 3个标准差作为上、下控制值。个标准差作为上、下控制值。5 5、标准正态分布、标准正态分布标准化变换:标准化变换:若若x x服从正态分布服从正态分布N(N(,),),由则,由则u u服从均数为服从均数为0 0,标,标准差为准差为1 1正态分布,称为标准正态分布。正态分布,称为标准正态分布。u(u(外文资外文资料用料用z z表示表示)称为标准正态离差称为标准正态离差the standardized the standardized deviate(or z-value)deviate(or z-value)能够借助标准正态表预计任意能够借助标准正态表预计任意(x1,x2)(x1,x2)范围内频数范围内频数百分比百分比(附表附表3 31 1,标准正态分布表,标准正态分布表)第25页