《平均数二数值平均数课件.pptx》由会员分享,可在线阅读,更多相关《平均数二数值平均数课件.pptx(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 设某一资料包含n个观测值:x1、x2、xn,则样本平均数可通过下式计算:其中,为总和符号;表示从第一个观测值x1累加到第n个观测值xn。当 在意义上已明确时,可简写为x,(3-1)式可改写为:第1页/共45页 【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。由于 x=500+520+535+560+58 +600+480+510+505+49 =5285,n=10 第2页/共45页 得:即10头种公牛平均体重为528.5 kg。(二)加权法 对于样本含量 n30 以上且已分组的资料,可以在
2、次数分布表的基础上采用加权法计算平均数,计算公式为:第3页/共45页 式中:第i组的组中值;第i组的次数;分组数 第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得名。【例3.2】将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。第4页/共45页要点解释权数(Weighted),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。权数例(1)(2)(3)X456合计频数 频率(%)10201025.050.025.040100.0X45
3、6合计频数 频率(%)20402025.050.025.080100.0X456合计频数 频率(%)20101050.025.025.080100.0=5 =5 =4.75 第5页/共45页 表31 100头长白母猪仔猪一月窝重次数分布表第6页/共45页 利用(32)式得:即这100头长白母猪仔猪一月龄平均窝重为45.2kg。计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。第7页/共45页 【例3.3】某牛群有黑白花奶牛 1500头,其平均体重为750 kg,而另一牛群有黑白花奶牛1200头,平均体重为725 kg,如果将这两个牛群混合在一起,其混合后平均体
4、重为多少?此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即 第8页/共45页 即两个牛群混合后平均体重为738.89 kg。(三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零。或简写成第9页/共45页 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(xi-)2 (xi-a)2 (常数a )或简写为:对于总体而言,通常用表示总体平均数,有限总体的平均数为:第10页/共45页 式中,N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总
5、体参数的无偏估计量。统计学中常用样本平均数()作为总体平均数()的估计量,并已证明样本平均数是总体平均数的无偏估计量。第11页/共45页常用的几种数值平均数:概 念 计算 公 式 特 点优点:容易理解,便于计算;灵敏度高;稳定性好;、和 。缺点:易受极值影响;在偏斜分布和U形分布中,不具有代 表性。1.算术平均数()标志总量与总体单位总数的比值简单:加权:第12页/共45页常用的几种平均数:概 念 计算 公 式 特 点优点:灵敏度高;在某种不能计 算的条件下,可以代替算术 平均数。缺点:不易理解;易受极值影响;有“0”值时不能 计算。2.调和平均数()标志值倒数平均数的倒数简单:加权:第13页
6、/共45页调和平均数与算术平均数的区别频率分布变了,均值也变。因此,严格地说,权数应指频率。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标分子:标志总量分母:总体单位总数几何平均等于对数的算术平均 组距数列求中位数是用插值法对中位数组分割的结果。第14页/共45页价格(元)3.32.52.0合计销售量(斤)34512算术平均求某种商品三种零售价格的平均价格调和平均价格(元)3.32.52.0合计销售额(元)9.9101029.9例第15页/共45页三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为G。它主要应用
7、于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的 增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下:第16页/共45页 为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即 【例3.7】某波尔山羊群19972000年各年度的存栏数见表33,试求其年平均增长率。第17页/共45页 表33 某波尔山羊群各年度存栏数与增长率第18页/共45页 利用(37)式求年平均增长率 G=lg-1(-0.368-0.3980.602)=lg-1(-0.456)=0.3501 即年平
8、均增长率为0.3501或35.01%。第19页/共45页例 求95%、93%、90%的几何平均数(计算误差:0.0007)第20页/共45页常用的几种平均数:概 念 计算 公 式 特 点优点:灵敏度高;受极值影响小于 和 适宜于各比率之积 为总比率的变量求 平均。缺点:有“0”或负值时 不能计算;偶数项数列只能 用正根。3.几何平均数()几个变量值连乘积的几次根简单:加权:第21页/共45页位置平均数与算术平均数的关系XfXfXf(对称分布)正偏态分布(右)负偏态分布(左)在偏斜不大时1212(对称分布)正偏态分布(右)负偏态分布(左)(对称分布)正偏态分布(右)(对称分布)正偏态分布(右)负
9、偏态分布(左)(对称分布)正偏态分布(右)第22页/共45页应用平均指标的原则 1必须是同质的量方可平均;2总平均数与组平均数结合分析;3根据具体条件选择平均方法;4平均数与典型值和分配数列结合分析;5集中趋势与离散趋势结合分析。第23页/共45页第二节 标准差 一、标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。第24页/共45页 全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测
10、值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。第25页/共45页 为 了 准 确 地 表示样本内各个观测值的变异程度,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(),称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和 为零,即()=0,因 而 不 能 用离均差之和()来 表 示 资料中所有观测值的总偏离程度。第26页/共45页 为了解决离均差有正、有负,离均差之和为零的问 题 ,可先求 离 均 差的绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数
11、 n 求 得 平 均 绝 对 离差,即|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。第27页/共45页 我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先将各 个离 均差平方,即()2,再求 离均差平方和,即 ,简称平方和,记为SS;由 于 离差平方和 常 随 样 本 大 小 而 改 变,为 了 消 除 样 本大小 的 影 响,用平方和 除 以 样 本 大 小,即 ,求出离均差平方和的平均数;第28页/共45页 为了使所得的统计量是相应总体参数的无 偏估计量,统计学证明,在求离均差平方
12、和的平均数时,分母不用样本含量n,而用自由度 n-1,于是,我们 采 用统计量 表示资料的变异程度。统计量 称 为 均 方(mean square缩写为MS),又称样本方差,记为S2,即 S2=第29页/共45页 相应的总体参数叫 总体方差,记为2。对于有限总体而言,2的计算公式为:第30页/共45页 由于 样本方差 带有原观测单位的 平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时 ,常需要与平均数配合使用,这 时应 将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差 S2 的平方根叫做样本标准 差,记为S,即:第31页/共45页 由于 所以上式可改写为:第32页/共
13、45页 相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为:在统计学中,常用样本标准差S估计总体标准差。第33页/共45页二、标准差的计算方法 (一)直接法 对于未分组或小样本资料,可直接利用(311)或(3-12)式来计算标准差。第34页/共45页 【例3.9】计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,600,600,650(g)的标准差。此例n=10,经计算得:x=5400,x2=2955000,代入(312)式得:即10只辽宁绒山羊产绒量的 标准差 为65.828g。第35页/共45页 (二)加权法 对于已制成次数分布表的大
14、样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为:式中,f为各组次数;x为各组的组中值;f=n为总次数。第36页/共45页 【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。将表3-4中的f、fx、代入(314)式得:即某 纯 系 蛋 鸡200枚 蛋 重的标准差为3.5524g。第37页/共45页 表34 某纯系蛋鸡200枚蛋重资料次数分布 及标准差计算表第38页/共45页 三、标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。(三
15、)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。第39页/共45页 (四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(S)范围内;约有95.43%的观测值在平均数左右两倍标准差(2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(3S)范 围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。第40页/共45页第三节 变异系数 变异系数是衡量资料中各观测值变异 程度的另一个统计量。标 准差与平均数的比值称为 变异系数,记为CV。变异系数可以消除单位 和(或)平 均数不同对两个或多个资料变异程度比较的影响。第41页/共45页 变异系数的计算公式为:【例3.11】已知某良种猪场长白成年母猪平均体重为 190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。第42页/共45页 由于,长白成年母猪体重的变异系数:大约克成年母猪体重的变异系数:所以,长白成年母猪体重的变异程度大于大约克成年母猪。第43页/共45页 注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。第44页/共45页感谢您的观看。第45页/共45页