平均数标准差和变异系数PPT讲稿.ppt

上传人:石*** 文档编号:88379562 上传时间:2023-04-25 格式:PPT 页数:41 大小:2.03MB
返回 下载 相关 举报
平均数标准差和变异系数PPT讲稿.ppt_第1页
第1页 / 共41页
平均数标准差和变异系数PPT讲稿.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《平均数标准差和变异系数PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《平均数标准差和变异系数PPT讲稿.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、平均数标准差和变异平均数标准差和变异系数系数第1页,共41页,编辑于2022年,星期六第三章第三章 平均数、标准平均数、标准差和变异系数差和变异系数平均数(平均数(meanmean)用于反映资料的集中性,即观测值以)用于反映资料的集中性,即观测值以某一数值为中心而分布的性质。某一数值为中心而分布的性质。标准差(标准差(standard deviationstandard deviation)与变异系数()与变异系数(variation variation coefficientcoefficient)反映资料的离散性,即观测值分散变)反映资料的离散性,即观测值分散变异的性质。异的性质。第2页,

2、共41页,编辑于2022年,星期六第一节第一节 平均数平均数一、平均数的意义和种类二、算术平均数的计算方法三、算术平均数的重要特性四、算术平均数的作用五、总体平均数第3页,共41页,编辑于2022年,星期六一、平均数的意义和种类一、平均数的意义和种类 平均数平均数(average)(average)是数据的代表值,表示资料中观察值是数据的代表值,表示资料中观察值的中心位置,并且可作为资料的代表而与另一组资料相的中心位置,并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差的情况。比较,借以明确二者之间相差的情况。平均数是统计学中最常用的统计量,用来表明资料平均数是统计学中最常用的统计

3、量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括中各观测值相对集中较多的中心位置。平均数主要包括有:有:1.1.算术平均数(arithmetic meanarithmetic mean)2.2.中位数(中位数(medianmedian)3.3.众数(modemode)4.4.几何平均数(geometric mean)5.5.调和平均数(调和平均数(harmonic meanharmonic mean)第4页,共41页,编辑于2022年,星期六 算术平均数:一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数(arithmetic mean),记作 。因其应用广

4、泛,常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。0 1 2 3 4 5 6 7 8 9 10平均数平均数=5平均数平均数=6 1 2 3 4 5 6 7 141、算术平均数、算术平均数第5页,共41页,编辑于2022年,星期六2、中位数、中位数 中位数中位数:将资料内所有观察值从大到小排序,居中间位置的观察值称为中数将资料内所有观察值从大到小排序,居中间位置的观察值称为中数(median),计作,计作Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于

5、算术平均数。位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将各观测值由小到大依次排列,找到中间的各观测值由小到大依次排列,找到中间的1个数(个数(n为奇数)或为奇数)或2个数(个数(n为偶为偶数),之后求平均即可。数),之后求平均即可。0 1 2 3 4 5 6 7 8 9 10 12 14 0 1 2 3 4 5 6 7 8 9 10中位数中位数=5中位数中位数=5第6页,共41页,编辑于2022年,星期六众数众数:资料中最常见的一数,或次数最多一组

6、的中点值,称为众数资料中最常见的一数,或次数最多一组的中点值,称为众数(mode),记为,记为M0。如棉花纤维检验时所用的主体长度即为众数。如棉花纤维检验时所用的主体长度即为众数。3、众数、众数众数可能不存在众数可能不存在可能有多个众数可能有多个众数多用于属性数据多用于属性数据0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数=9没有众数没有众数第7页,共41页,编辑于2022年,星期六几何平均数几何平均数:如有如有n个观察值,其相乘积开个观察值,其相乘积开n次方,即次方,即为几何平均数为几何平均数(geometric mean),用,用G代表。代表。其计算其计算公

7、式如下:公式如下:4、几何平均数、几何平均数第8页,共41页,编辑于2022年,星期六 为了计算方便,可将各观测值取对数后相加除以为了计算方便,可将各观测值取对数后相加除以n,得,得lgG,再求,再求lgG的反对数,即得的反对数,即得G值,即:值,即:第9页,共41页,编辑于2022年,星期六 调和平均数调和平均数:(harmonic mean)各观测值)各观测值倒数的倒数的 算术平均数算术平均数 的倒数,称为调和平均数,的倒数,称为调和平均数,记为记为H。即。即 (4.6)5、调和平均数、调和平均数第10页,共41页,编辑于2022年,星期六对于同一资料:对于同一资料:算术平均数算术平均数几

8、何平均数几何平均数调和平均数调和平均数 上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。第11页,共41页,编辑于2022年,星期六 算术平均数可根据样本大小及分组情况而采算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。用直接法或加权法计算。(一一)直接法直接法主要用于未经分组资料平均数的计算。主要用于未经分组资料平均数的计算。二、算术平均数的计算方法二、算术平均数的计算方法第12页,共41页,编辑于2022年,星期六 设某一资料包含设某一资料包含n个观测值:个观测值:x1、x2、xn,则样本平均数可通过下式计算:则样本平均数可通过下式计算:(4.1)简

9、写:简写:第13页,共41页,编辑于2022年,星期六【例【例1】某植保站测得某植保站测得10只某类害虫的体重分别为只某类害虫的体重分别为500、520、535、560、585、600、480、510、505、490(mg),),求其平均数。求其平均数。由于由于 x=500+520+535+560+585 +600+480+510+505+490 =5285,n=10得:得:即即 10只害虫的平均体重为只害虫的平均体重为528.5 mg。第14页,共41页,编辑于2022年,星期六(二)加权法(二)加权法(4.2)式中式中:xi-第第i 组的组中值组的组中值;fi-第第i组的次数组的次数;k-

10、分组数分组数 第第i组的次数组的次数 fi 是权衡第是权衡第i组组中值组组中值 xi 在资料中所占比重在资料中所占比重大小的数量,因此将大小的数量,因此将 fi 称为是称为是 xi 的的“权权”,加权法也由此而,加权法也由此而得名。得名。对于样本含量对于样本含量 n30 以上且已分组的资料,可以在次数以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:分布表的基础上采用加权法计算平均数,计算公式为:第15页,共41页,编辑于2022年,星期六【例【例2】从从A、B两小区分别抽取两小区分别抽取4个和个和5个小麦麦穗,测得其个小麦麦穗,测得其样本如下,用两种方法计算其平均

11、值,并比较计算结果。样本如下,用两种方法计算其平均值,并比较计算结果。第16页,共41页,编辑于2022年,星期六【例【例3】140行水稻产量(行水稻产量(P38),用两种方法求其平),用两种方法求其平均数,并比较计算结果。均数,并比较计算结果。(1)直接法:)直接法:第17页,共41页,编辑于2022年,星期六(2 2)加权法:)加权法:)加权法:)加权法:第18页,共41页,编辑于2022年,星期六 1、算术平均数的计算与每一个数(值)都有关。、算术平均数的计算与每一个数(值)都有关。2、如果、如果 是是n1个值的平均数个值的平均数,是是n2个值的平个值的平均数,那么全部均数,那么全部n1

12、n2个值的算术平均数是个值的算术平均数是 (加(加权权平均数)平均数)三、算术平均数的重要特性三、算术平均数的重要特性第19页,共41页,编辑于2022年,星期六 3、样本各观测值与平均数之差的和为零,即离样本各观测值与平均数之差的和为零,即离均差之和等于零。均差之和等于零。或简写成或简写成第20页,共41页,编辑于2022年,星期六 4、样本各观测值与平均数之差的平方和为最小,即离均差、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。平方和为最小。(常数(常数 )或简写为:或简写为:第21页,共41页,编辑于2022年,星期六5、若、若A为任意常数,为任意常数,第22页,共41

13、页,编辑于2022年,星期六6、平均数是有单位的数值,与原资料单位相同。、平均数是有单位的数值,与原资料单位相同。注意:注意:必须性状同质时,必须性状同质时,才有代表性才有代表性。第23页,共41页,编辑于2022年,星期六第24页,共41页,编辑于2022年,星期六 算术算术算术算术平均数是描述观测资料的重要特征数,它的作平均数是描述观测资料的重要特征数,它的作用主要有以下两点:用主要有以下两点:1.指出数据资料的中心位置,标志着资料所代表性指出数据资料的中心位置,标志着资料所代表性状的数量水平和质量水平。状的数量水平和质量水平。2.可以作为样本或资料的代表数据与其他资料进可以作为样本或资料

14、的代表数据与其他资料进行比较。行比较。四、算术平均数的作用四、算术平均数的作用第25页,共41页,编辑于2022年,星期六 对于总体而言,通常用对于总体而言,通常用表示总体平均数,有限总体的平均数表示总体平均数,有限总体的平均数为:为:(4.3)式中,N 表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。总体参数的无偏估计量。统计学中常用样本平均数(统计学中常用样本平均数()作为总体平均数()作为总体平均数()的估计量,并)的估计量,并已证明样本平均数是总体平均数已证明样本平

15、均数是总体平均数的无偏估计量。的无偏估计量。五、总体平均数五、总体平均数第26页,共41页,编辑于2022年,星期六第二节第二节 变异数变异数 平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。每个样本有一批观察值,除以平均数作为样本的集中性表现外,还应该考虑样本内各个观察值的变异情况,才能通过样本的观察数据更好地描述样本,乃至描述样本所代表的总体,为此必须有度量变异的统计数。常用的描述变异程度指标有:1 1、极差(rangerange)2 2、方差(、方差(variance)3 3、标准差(、标准差(standard deviation)4、变异系数(variation

16、 coefficient)第27页,共41页,编辑于2022年,星期六一、极差一、极差n n极差(range),又称全距,记作R,是资料中最大观察值与最小观察值的差数。n n极差虽可以对资料的变异有所说明,但它只是两个极端数据决定的,没有充分利用资料的全部信息,而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。第28页,共41页,编辑于2022年,星期六二、方差二、方差n n为了正确反映资料的变异度,较合理的方法是根据样本全部观察值来度量资料的变异度。这时要选定一个数值作为共同比较的标准。平均数既作为样本的代表值,则以平均数作为比较的标准较为合理,但同时应该考虑

17、各样本观察值偏离平均数的情况,为此这里给出一个各观察值偏离平均数的度量方法。第29页,共41页,编辑于2022年,星期六 为为 了了 准准 确确 地地 表示样本内各个观测值的变异程度表示样本内各个观测值的变异程度,人,人们们 首首 先会考虑到以平均数为标准,求出各个观测值与平先会考虑到以平均数为标准,求出各个观测值与平均数的离差,均数的离差,(),称为离均差。,称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负但因为离均差有正、有负,离均差之和,离均差之和 为零,即为零,即()=0,因,因 而而 不不 能能 用

18、离均差之和用离均差之和()来来 表表 示示 资料中所有观测资料中所有观测值的总偏离程度。值的总偏离程度。为了解决离均差有正为了解决离均差有正、有负,离均差之和为零的问、有负,离均差之和为零的问 题,题,可先求可先求 离离 均均 差的绝差的绝 对对 值值 并并 将将 各各 离离 均均 差差 绝对绝对 值值 之之 和和 除以除以 观观 测测 值值 个个 数数n 求求 得得 平平 均均 绝绝 对对 离差,即离差,即|x x|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号但由于平均绝对离差包含绝对值符号,使用很不

19、方便,在,使用很不方便,在统计学中未被采用。统计学中未被采用。第30页,共41页,编辑于2022年,星期六 我们还可以采用将离均差平方的办法来解决离均我们还可以采用将离均差平方的办法来解决离均差有正、有负,且离均差之和为零的问题。差有正、有负,且离均差之和为零的问题。先将各先将各 个离个离 均差平方,即均差平方,即()2,再求,再求 离均离均差平方和差平方和,即即 ,简称平方和,记为,简称平方和,记为SS;由由 于于 离差平方和离差平方和 常常 随随 样样 本本 大大 小小 而而 改改 变变,为,为 了了 消消 除除 样样 本大小本大小 的的 影影 响响,用平方和用平方和 除除 以以 样样 本

20、本 大大 小,小,即即 ,求出离均差平方和的平均数,求出离均差平方和的平均数;第31页,共41页,编辑于2022年,星期六 为了使所得的统计量是相应总体参数的无为了使所得的统计量是相应总体参数的无 偏偏估计量,统计学证明,在求离均差平方和的平均数估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量时,分母不用样本含量n,而用自由度,而用自由度 n-1,于是,于是,我们我们 采采 用统计量用统计量 表示资料的变异程度。表示资料的变异程度。统计量统计量 称为均方(称为均方(mean square,缩缩写为写为MS),又称又称样本方差样本方差,记为,记为S2,即,即 S2=(4.7)第3

21、2页,共41页,编辑于2022年,星期六 相应的总体参数叫相应的总体参数叫 总体方差总体方差,记为,记为2。对于有限总体而言,。对于有限总体而言,2的计算公式的计算公式为:为:(4.8)第33页,共41页,编辑于2022年,星期六n n标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。从样本资料计算标准差的公式为:同样,样本标准差是总体标准差的估计值。总体标准差用表示:第34页,共41页,编辑于2022年,星期六 由于由于 样本方差样本方差 带有原观测单位的带有原观测单位的 平方单位,在仅表示一个资料平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常

22、需要与平均数配合使中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这用,这 时应时应 将平方单位还原,即应求出样本方差的平方根。统计将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差学上把样本方差 S2 的平方根叫做样本标准差,记为的平方根叫做样本标准差,记为S,即:,即:三、标准差三、标准差第35页,共41页,编辑于2022年,星期六由于由于所以(所以(4.9)式可改写为:)式可改写为:(4.10)第36页,共41页,编辑于2022年,星期六 相应的总体参数叫总体标准差,记为相应的总体参数叫总体标准差,记为。对。对于有限总体而言,于有限总体而言,的计算公式为:的计算公

23、式为:(4.11)在统计学中,常用样本标准差在统计学中,常用样本标准差S估计总体标准估计总体标准差差。第37页,共41页,编辑于2022年,星期六四、变异系数四、变异系数 标准差和观察值的单位相同,表示一个样本的变异度。若标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数分数,称为变异系数(coefficient of variation)(coefficient of

24、variation)。变异系数是无量纲的量,可以用于不同单位、不同尺变异系数是无量纲的量,可以用于不同单位、不同尺度下各样本变异程度的比较。度下各样本变异程度的比较。第38页,共41页,编辑于2022年,星期六【例【例7】已知某甲品种猪平均体重为已知某甲品种猪平均体重为 190kg,标准差为标准差为10.5kg,而乙品种猪平均体重为,而乙品种猪平均体重为196kg,标,标准差为准差为8.5kg,试问两个品种的猪,那一个体重变异程,试问两个品种的猪,那一个体重变异程度大。度大。第39页,共41页,编辑于2022年,星期六由于,甲品种猪体重的变异系数:由于,甲品种猪体重的变异系数:乙品种猪体重的变异系数:乙品种猪体重的变异系数:所以,甲品种猪体重的变异程度大于乙品种所以,甲品种猪体重的变异程度大于乙品种猪猪。第40页,共41页,编辑于2022年,星期六注意:变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。课后作业,教材23页:习题2.2;习题2.3;习题2.4;习题2.9第41页,共41页,编辑于2022年,星期六

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁