《第3章平均数标准差与变异系数.ppt》由会员分享,可在线阅读,更多相关《第3章平均数标准差与变异系数.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3章 平均数标准差与变异系数现在学习的是第1页,共30页本章内容n第一节第一节 平均数平均数n第二节第二节 标准差标准差n第三节第三节 变异系数变异系数现在学习的是第2页,共30页 平均数是统计学中最常用的统计量,用来平均数是统计学中最常用的统计量,用来表明资料中各表明资料中各观测值相对集中的中心位置观测值相对集中的中心位置。平均数包括:。平均数包括:算术平均数(算术平均数(arithmetic mean)中位数(中位数(median)众数(众数(mode)几何平均数(几何平均数(geometric mean)调和平均数(调和平均数(harmonic mean)第一节第一节 平均数平均数现在
2、学习的是第3页,共30页 算术平均数算术平均数q指指资料中各观测值的总和除以观测值个数所得的商资料中各观测值的总和除以观测值个数所得的商,简,简称平均数或均数。称平均数或均数。现在学习的是第4页,共30页 设某一资料包含设某一资料包含n个观测值:个观测值:x1、x2、xn,则样本则样本平均数可通过下式计算:平均数可通过下式计算:其中,其中,为总和符号;为总和符号;表示从第一个观测值表示从第一个观测值x1累加到第累加到第n个观测值个观测值xn。当在意义上已明确时,可简。当在意义上已明确时,可简写为写为x,上式可改写为:,上式可改写为:现在学习的是第5页,共30页342.1340.7348.434
3、6.0343.4342.7346.0341.1344.0348.0344.2342.5350.0343.5346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0341.1345.6345.0348.6343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2341.0346.8344.3347.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2343.3350.2346.2339.8344.0353.3340.2336.3348.9340.2356.134
4、6.0345.6346.2342.3339.9338.0344.4346.6339.7342.3352.8342.6350.3348.5344.0350.0335.1339.5346.6341.1347.2340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7343.0339.9347.3341.0341.1347.1100100头牛胴体净重(头牛胴体净重(kgkg)【例例】已知已知100头牛胴体净重,求其平均数。头牛胴体净重,求其平均数。现在学习的是第6页,共30页 现在学习的是第7页,共30页关于平均数的统计分析n平行平行n同一个处理测定多次,
5、且测试对象来自于同一个个体,称之为平同一个处理测定多次,且测试对象来自于同一个个体,称之为平行(行(一瓶矿泉水中矿物质含量测定三次的结果一瓶矿泉水中矿物质含量测定三次的结果)n重复重复n同一个处理测定多次,但测试对象来自不同个体,称之为重同一个处理测定多次,但测试对象来自不同个体,称之为重复(复(五瓶矿泉水中矿物质含量测定的结果五瓶矿泉水中矿物质含量测定的结果)n统计意义上的平均数只能来自重复,而不是平行。统计意义上的平均数只能来自重复,而不是平行。现在学习的是第8页,共30页平均数的基本性质平均数的基本性质1、样本各观测值与平均数之差的和为零,即离均差之、样本各观测值与平均数之差的和为零,即
6、离均差之和等于零。和等于零。或简写成或简写成现在学习的是第9页,共30页 2、样本各观测值与平均数之差的平方和为最小,即、样本各观测值与平均数之差的平方和为最小,即离离均差平方和为最小均差平方和为最小。(xi-)2 (xi-a)2 (常数(常数a )或简写为:或简写为:对于总体而言,通常用对于总体而言,通常用表示总体平均数,有限总体表示总体平均数,有限总体的平均数为:的平均数为:式中,式中,N表示总体所包含的个体数。表示总体所包含的个体数。现在学习的是第10页,共30页 当一个统计量的数学期望等于所估计的总体参数当一个统计量的数学期望等于所估计的总体参数时,时,则称此统计量为该总体参数的则称此
7、统计量为该总体参数的无偏估计量无偏估计量。统计学中常用样本平均数(统计学中常用样本平均数()作为总体平均数()作为总体平均数()的估计量,并已证明样本平均数是总体平均数)的估计量,并已证明样本平均数是总体平均数的无偏估的无偏估计量。计量。现在学习的是第11页,共30页第二节第二节 标准差标准差 一、标准差的意义一、标准差的意义Standard Deviation(SD)用平均数作为样本的代表,其代表性的强弱受样本资料用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个
8、表示资的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。料中观测值变异程度大小的统计量。现在学习的是第12页,共30页 全距(极差)全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。各观测值的变异程度,比较粗略。离均差离均差:各个观测值与平均数的离差(各个观测值与平均数的离差()。)。离均差能表示一个观测值偏离平均数的性质和程度,但因为离离均差能表示一个观测值偏
9、离平均数的性质和程度,但因为离均差有正、有负均差有正、有负,离均差之和为零,即,离均差之和为零,即()=0,因而不,因而不能用离均差之和能用离均差之和()来表示资料中所有观测值的总偏离程度。)来表示资料中所有观测值的总偏离程度。现在学习的是第13页,共30页 我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。和为零的问题。先将各个离均差平方,即先将各个离均差平方,即()2,再求,再求 离均差平方和离均差平方和,即即 ,简称,简称平方和平方和,记为,记为SS;由于离差平方和常随样由于离差平方和常随样 本大
10、小而改变本大小而改变,为,为了消除样本大小的影响,用平方和除以样本了消除样本大小的影响,用平方和除以样本 大小,即大小,即 ,求出求出离均差平方和的平均数离均差平方和的平均数。现在学习的是第14页,共30页 用观测值的个数除离均差平方和得到的平均平方和,简称为用观测值的个数除离均差平方和得到的平均平方和,简称为均均方(方(mean square,MS)或方差)或方差。相应的总体参数叫相应的总体参数叫 总体方差总体方差,记为,记为2。对于有限总体而言,。对于有限总体而言,2的计算公式为:的计算公式为:现在学习的是第15页,共30页 为了使所得的统计量是相应总体参数的无偏估计量,统计学证为了使所得
11、的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量明,在求离均差平方和的平均数时,分母不用样本含量n,而用自,而用自由度由度 n-1,于是,我们于是,我们 采采 用统计量用统计量 表示资料的变异程表示资料的变异程度。度。统计量统计量 称称 为为 均均 方方(mean square缩写为缩写为MS),又称又称样本方差样本方差,记为,记为S2,即,即 S2=现在学习的是第16页,共30页 由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使
12、用,这时观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S2 的平方根叫做的平方根叫做样本标准差样本标准差,记为,记为S,即:,即:现在学习的是第17页,共30页 相应的总体参数叫相应的总体参数叫总体标准差总体标准差,记为,记为。对于有限总体而言,。对于有限总体而言,的的计算公式为:计算公式为:在统计学中,常用样本标准差在统计学中,常用样本标准差S估计总体标准差估计总体标准差。现在学习的是第18页,共30页 二二、标准差的特性、标准差的特性 n标准差的大小,
13、受资料中每个观测值的影响,如观测值间变标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。异大,求得的标准差也大,反之则小。n在计算标准差时,在各观测值加上或减去一个常数,其数值在计算标准差时,在各观测值加上或减去一个常数,其数值不变。不变。n当每个观测值乘以或除以一个常数当每个观测值乘以或除以一个常数a a,则所得的标准差是原来标准差,则所得的标准差是原来标准差的的a a倍或倍或1 1/a/a倍。倍。现在学习的是第19页,共30页q在资料服从正态分布的条件下,资料中约有在资料服从正态分布的条件下,资料中约有68.26%68.26%的观测值在平均的观测值在平均
14、数左右一倍标准差(数左右一倍标准差(SS)范围内;约有)范围内;约有95.43%95.43%的观测值在平均的观测值在平均数左右两倍标准差(数左右两倍标准差(2S2S)范围内;约有)范围内;约有99.73%99.73%的观测值在平均的观测值在平均数左右三倍标准差(数左右三倍标准差(3S3S)范围内。也就是说全距近似地等于范围内。也就是说全距近似地等于6 6倍标准差,可用(全距倍标准差,可用(全距/6/6)来粗略估计标准差)来粗略估计标准差 现在学习的是第20页,共30页总体(,)样本1(1)样本2(2)样本3(3)1,2,34,.新总体新总体误差如何去误差如何去估计?估计?现在学习的是第21页,
15、共30页三、标准误(三、标准误(standard error,SE,SEM)标准误标准误(平均数抽样总体的标准差平均数抽样总体的标准差)的大小反映样本平的大小反映样本平均数均数 的抽样误差的大小,即精确性的高低的抽样误差的大小,即精确性的高低。标准误大,说明各样本平标准误大,说明各样本平均数均数 间差异程度大,样本平均数的精确性低。反之,间差异程度大,样本平均数的精确性低。反之,小,说明小,说明 间的间的差异程度小差异程度小,样本平均数的精确性高。样本平均数的精确性高。的大小与原总体的标准差的大小与原总体的标准差成正成正比,与样本含量比,与样本含量n的平方根成反比。从某特定总体抽样的平方根成反
16、比。从某特定总体抽样,因为,因为是一常是一常数数,所以只有增大样本含量才能降低样本平均数,所以只有增大样本含量才能降低样本平均数 的抽样误差。的抽样误差。现在学习的是第22页,共30页 在实际工作中,总体标准差在实际工作中,总体标准差往往是未知的,因而无法求得往往是未知的,因而无法求得 。此时,可用样本标准差。此时,可用样本标准差S估计估计。于是,以。于是,以 估计估计 。记。记 为为 ,称作,称作样本标准误或均数标准误样本标准误或均数标准误。样本标准误。样本标准误 是平均数抽是平均数抽样误差的估计值样误差的估计值。若样本中各观测值为。若样本中各观测值为 ,则,则 现在学习的是第23页,共30
17、页 样本标准差与样本标准误是既有联系又有区别的两个统计量,二者样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的区别在于:的区别在于:样样 本本 标标 准准 差差 S 是是 反反 映映 样样 本中各本中各 观测值观测值 ,变变 异异 程程 度大小的一个指标,度大小的一个指标,它的大小说明了它的大小说明了 对该样本代表性的强弱对该样本代表性的强弱。样本标准误是样本平均数样本标准误是样本平均数 的标准差,它是抽样误差的估计的标准差,它是抽样误差的估计值,值,其大小说明了样本间变异程度的大小及精确性的高低。其大小说明了样本间变异程度的大小及精确性的高低。现在学习的是第24页,共30页 对于
18、大样本资料,常将样本标准差对于大样本资料,常将样本标准差S与样本平均数与样本平均数 配合使用配合使用,记,记为为 S,用以说明所考察性状或指标的优良性与稳定性。,用以说明所考察性状或指标的优良性与稳定性。对于小样本资料,常将样本标准误对于小样本资料,常将样本标准误 与样本平均数与样本平均数 配合使配合使用,用,记为记为 ,用用 以表示以表示 所考察性状或指标的优良性与所考察性状或指标的优良性与 抽样误差抽样误差的大小。的大小。现在学习的是第25页,共30页论文写作过程中论文写作过程中SD和和SE(M)的用法的用法ABCDV1a1SD11b1SD21c1SD31d1SD41V2a2SD12b2S
19、D22c2SD32d2SD42V3a3SD13b3SD23c3SD33d3SD43.ABCDSEV1a1b1c1d1se1V2a2b2c2d2se2V3a3b3c3d3se3.现在学习的是第26页,共30页3.5,3.6,3.4,4.2,3.0,3.8,3.7,3.0,3.3,4.14.5,5.3,4.4,4.2,5.0,5.8,4.7,4.0,5.3,5.15.4,5.7,4.8,4.7,5.3,5.6,5.7,6.0,6.3,6.1标准差和标准误标准差和标准误平均数:平均数:3.55标准差:标准差:0.41平均数:平均数:4.83标准差:标准差:0.57平均数:平均数:5.56标准差:标准
20、差:0.53标准误:标准误:0.18现在学习的是第27页,共30页剪切力(kg)3.550.414.830.575.560.53.SE剪切力(kg)3.554.835.560.18.现在学习的是第28页,共30页第三节第三节 变异系数变异系数 变异系数是衡量资料中各观测值变异程度的另一个统计量变异系数是衡量资料中各观测值变异程度的另一个统计量。标准差与平均数的比值称为标准差与平均数的比值称为 变异系数变异系数,记为,记为CV。变异系数可以消除单位和(或)平均数不同对两个或变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。多个资料变异程度比较的影响。变异系数的计算公式为:变异系数的计算公式为:(315)现在学习的是第29页,共30页q变异系数的大小,同时受平均数和标准差两个统计量的影响,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出和标准差也列出。现在学习的是第30页,共30页