《统计数据的描述》PPT课件.ppt

上传人:wuy****n92 文档编号:70506420 上传时间:2023-01-21 格式:PPT 页数:91 大小:322.50KB
返回 下载 相关 举报
《统计数据的描述》PPT课件.ppt_第1页
第1页 / 共91页
《统计数据的描述》PPT课件.ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述

《《统计数据的描述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计数据的描述》PPT课件.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章 统计数据的描述n第一节第一节 统计分布的集中趋势统计分布的集中趋势n第二节第二节 统计分布的离散趋势统计分布的离散趋势n第三节第三节 统计分布的形态统计分布的形态1n1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法n2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合n3.离散程度各测度值的计算方法离散程度各测度值的计算方法n4.离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合n5.偏态与峰态的测度方法偏态与峰态的测度方法n6.用用Excel计算描述统计量并进行分析计算描述统计量并进行分析2第一节 统计分布的集中趋势n集中趋势集中趋势是指一组数据

2、向某一中心值靠是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。据一般水平的代表值或中心值。n理解集中趋势的理解集中趋势的三个特点三个特点:n 同质性同质性n 代表性代表性n 抽象性抽象性34一、算术平均数一、算术平均数n基本公式:n计算方法:简单算术平均和加权算术平均5平均数(mean)1.集中趋势的最常用测度值集中趋势的最常用测度值2.一组数据的均衡点所在一组数据的均衡点所在3.体现了数据的必然性特征体现了数据的必然性特征4.易受极端值的影响易受极端值的影响5.用于数值型数据,不能用于分类数据和用于数值型数据,不能用于

3、分类数据和顺序数据顺序数据61.简单算术平均(Simple mean)72.加权算术平均(Weighted mean)n根据单项变量数列计根据单项变量数列计算算n根据组距变量数列计根据组距变量数列计算,首先计算组中值算,首先计算组中值以代表该组的平均水以代表该组的平均水平。平。n在计算组距资料的平在计算组距资料的平均数时,均数时,x用组中值用组中值代替。代替。8权数的作用:n可见,加权算术平均数不但受各组标志值可见,加权算术平均数不但受各组标志值x的的影响,而且也受各组次数影响,而且也受各组次数f的影响。次数越多的影响。次数越多对标志总量的影响越大,次数越少对标志总对标志总量的影响越大,次数越

4、少对标志总量的影响越小。各组标志次数的多少在平均量的影响越小。各组标志次数的多少在平均数的计算中具有权衡轻重的作用,因此,在数的计算中具有权衡轻重的作用,因此,在统计上又称为权数。统计上又称为权数。9比重权数是权数的实质n权数有两种形式:一种是以绝对数表示,权数有两种形式:一种是以绝对数表示,称次数或频数;另一种是以比重表示,称次数或频数;另一种是以比重表示,称频率。同一总体资料,用这两种权数称频率。同一总体资料,用这两种权数所计算的加权算术平均数完全相同。所计算的加权算术平均数完全相同。n当各个标志值的权数都完全相等时,权当各个标志值的权数都完全相等时,权数就失去了权衡轻重的作用,这时候,数

5、就失去了权衡轻重的作用,这时候,加权算术平均数就成为简单算术平均数。加权算术平均数就成为简单算术平均数。10用比重权数计算算术平均数11算术平均数的计算案例算术平均数的计算案例P6365n算术平均数的算术平均数的数学性质数学性质n1.各单位标志值与算术平均数离差之和等于零各单位标志值与算术平均数离差之和等于零。n2.各单位标志值与算术平均数离差平方之和为最各单位标志值与算术平均数离差平方之和为最小。小。12二、交替标志平均数二、交替标志平均数n交替标志的概念交替标志的概念:交替标志又称是非标志,针:交替标志又称是非标志,针对品质标志来说,一种现象具有两种属性,总对品质标志来说,一种现象具有两种

6、属性,总体中某些单位具有某种属性,另外一些单位不体中某些单位具有某种属性,另外一些单位不具有某种属性,这种将总体单位划分为具有某种属性,这种将总体单位划分为“是是”或或“否否”、“有有”或或“无无”两类的标志叫交替两类的标志叫交替标志。标志。n用用1 表示具有某种属性的单位标志值,其单位表示具有某种属性的单位标志值,其单位数用数用N1表示;表示;n用用0 表示不具有某种属性的单位标志值,其单表示不具有某种属性的单位标志值,其单位数用位数用N0;全部总体单位数为;全部总体单位数为N13n则:n具有某种属性的单位数所具有某种属性的单位数所占比重(成数)占比重(成数)n不具有某种属性的单位数不具有某

7、种属性的单位数所占比重所占比重 14交替标志平均数公式:1PP(1-P)2Q2P0Q0(0-P)2P2Q合计合计1P_PQ(Q+P)15公式粘贴板16三、调和平均数三、调和平均数n概念概念:指各个变量值:指各个变量值倒数的算术平均数的倒数的算术平均数的倒数。用倒数。用H表示表示n计算方法:计算方法:n1.简单调和平均数简单调和平均数n2.加权调和平均数加权调和平均数17在例1中,用简单算术平均数n例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1斤,求平均价格。18例2是用简单调和平均数的公式。n例2:某种蔬菜价格早上为0.5元/斤、中午为0.4

8、元/斤、晚上为0.25元/斤。现早、中、晚各买1元,求平均价格。19例3用加权调和平均数公式 n例3:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买2元、3元、4元,求平均价格。20注意问题n调和平均数是各个算术平均调和平均数是各个算术平均数倒数的算术平均数的倒数,数倒数的算术平均数的倒数,是在资料受到限制的条件下是在资料受到限制的条件下算术平均数的一种变形。算术平均数的一种变形。n那么,如何判断在什么情况那么,如何判断在什么情况下可以采用算术平均数或调下可以采用算术平均数或调和平均数呢?关键在于以算和平均数呢?关键在于以算术平均数的基本公式为依据术

9、平均数的基本公式为依据nn如果缺分子资料,可如果缺分子资料,可用简单或加权算术平用简单或加权算术平均数形式计算,如缺均数形式计算,如缺分母资料,可用简单分母资料,可用简单或加权调和平均数计或加权调和平均数计算。总之,根据所掌算。总之,根据所掌握产资料条件来决定。握产资料条件来决定。21四、几何平均数(geometric mean)n概念:几何平均数是n项变量值连乘积的n次方根。适用于变量值之间存在环比连乘关系的事物。用G表示n计算方法n1.简单几何平均数222.加权几何平均数23几何平均数案例n例例1:1994-1998年我国工业品的产量年我国工业品的产量分别是上年的分别是上年的107.6%、

10、102.5%、100.6%、102.7%、102.2%,计算,计算这这5年的平均发展速度。(即年的平均发展速度。(即103.1%)n例例2:某投资银行:某投资银行25年的年利率分别是:年的年利率分别是:1年年3%,4年年5%,8年年8%,10年年10%,2年年15%,求平均年利率。,求平均年利率。(即(即1.0861,8.6)24五、众数(mode)1.一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.适合于数据量较多时使用适合于数据量较多时使用3.不受极端值的影响不受极端值的影响4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺

11、序数据主要用于分类数据,也可用于顺序数据和数值型数据和数值型数据25众数(不惟一性)n无众数无众数n原始数据原始数据:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:6 6 5 5 9 8 9 8 5 55 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据:25 25 28 2828 28 36 36 42 4242 4226n由众数的定义可看出众数存在的由众数的定义可看出众数存在的条件条件:就是:就是总总体的单位数较多体的单位数较多,各标志值的次数分配又有明,各标志值的次数分配又有明显的显的集中趋势集中趋势时才存在

12、众数;如果总体单位数时才存在众数;如果总体单位数很少,尽管次数分配较集中,那么计算出来的很少,尽管次数分配较集中,那么计算出来的众数意义就不大;如果总体单位数较多,但次众数意义就不大;如果总体单位数较多,但次数分配不集中,即各单位的标志值在总体分布数分配不集中,即各单位的标志值在总体分布中出现的比重较均匀,那么也无所谓众数。中出现的比重较均匀,那么也无所谓众数。n众数是由标志值出现次数多少决定的,不受资众数是由标志值出现次数多少决定的,不受资料中极端数值的影响,这样增强了众数对总体料中极端数值的影响,这样增强了众数对总体一般水平的代表性。一般水平的代表性。27根据变量数列的不同种类,确根据变量

13、数列的不同种类,确定众数可采用不同的方法。定众数可采用不同的方法。n单项数列单项数列确定众数确定众数观察次数,出现次观察次数,出现次数最多的标志值就是众数。这种方法比数最多的标志值就是众数。这种方法比较简单。较简单。n组距数列组距数列确定众数确定众数观察次数,首先由观察次数,首先由最多次数来确定众数所在组,然后再用最多次数来确定众数所在组,然后再用比例插值法推算众数的近似值。其计算比例插值法推算众数的近似值。其计算公式为:公式为:2829某班学生统计学考试成绩情况表某班学生统计学考试成绩情况表众数众数74.706学生成绩x学生人数f学生人数比重(%)50以下506060707080809090

14、以上 241446104 2.55.017.557.512.55.0 合计 8010030 31分类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计50110032n n解:解:这里的变量为这里的变量为“饮料品牌饮料品牌”,这是,这是个分类变量,不同类型的饮料就是变量个分类变量,不同类型的饮料就是变量值值n n 所调查的所调查的50人中,购买可口可乐的人人

15、中,购买可口可乐的人数最多,为数最多,为15人,占总被调查人数的人,占总被调查人数的30%,因此众数为,因此众数为“可口可乐可口可乐”这一品这一品牌,即牌,即 n n Mo可口可乐可口可乐33顺序数据的众数(例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.034n n解:解:这里的数据为顺序数据。变量为这里的数据为顺序数据。变量为“回答类别回答类别”n n

16、甲城市中对住房表示不满意的户数最甲城市中对住房表示不满意的户数最多,为多,为108户,因此众数为户,因此众数为“不满意不满意”这一类别,即这一类别,即n n Mo不满意不满意35众数的特点特点n从众数的计算可看到众数的特点:n众数是一个位置平均数,它只考虑总体分布众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而中最频繁出现的变量值,而不受极端值和开口不受极端值和开口组数列的影响组数列的影响,从而增强了对变量数列一般水,从而增强了对变量数列一般水平的代表性。平的代表性。n众数是一个众数是一个不容易确定的平均指标,不容易确定的平均指标,当分布当分布没有明显的集中趋势而趋于均匀分布时,

17、则无没有明显的集中趋势而趋于均匀分布时,则无众数可言;当变量数列是不等距分组时,众数众数可言;当变量数列是不等距分组时,众数的位置也不好确定。的位置也不好确定。U、J型分布有没有众数型分布有没有众数?(无)(无)36http:/Jim Simons,Renaissance Technologies nRenaissance Technologies is a global hedge fund management firm with a long record of producing superior returns for our clients by adhering to mathe

18、matical and statistical methods in the design and execution of our investment programs.We currently have more than 300 employees,and manage approximately$20 billion.37n发现发现Chern-Simons的几何定律的几何定律:数学大师数学大师Simons在华尔街大在华尔街大显神通显神通n原始出处:原始出处:华尔街日报华尔街日报 n西蒙斯既是世界级的数学大师,又是西蒙斯既是世界级的数学大师,又是Renaissance Technolo

19、gies Corp.的老板。眼下,他准备设立一只规模可能的老板。眼下,他准备设立一只规模可能高达高达1,000亿美元的基金的消息在业内闹得沸沸扬扬,要知道,亿美元的基金的消息在业内闹得沸沸扬扬,要知道,这可是整个对冲基金行业资产管理总额的十分之一左右。从早这可是整个对冲基金行业资产管理总额的十分之一左右。从早期的推广资料来看,这只基金的最低投资额为期的推广资料来看,这只基金的最低投资额为2,000万美元,万美元,面向机构投资者发售。面向机构投资者发售。n据估计,西蒙斯目前的资产净值约为据估计,西蒙斯目前的资产净值约为25亿美元。亿美元。Renaissance旗下的核心业务旗下的核心业务规模为规

20、模为50亿美元的亿美元的Medallion对冲基金自对冲基金自1988年成立以来,年均回报率高达年成立以来,年均回报率高达34%,堪称在此期间表现,堪称在此期间表现最佳的对冲基金最佳的对冲基金38六、中位数(median)n中位数中位数是将各单位标志值按大小顺序排列,居是将各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。于中间位置的那个标志值就是中位数。n中位数也是一种中位数也是一种代表值代表值,当标志变异程度较大,当标志变异程度较大,而次数而次数f很多的情况下,用中位数代替现象的很多的情况下,用中位数代替现象的一般水平。一般水平。n中位数中位数不受极端值的影响不受极端值的影响

21、n n主要用于顺序数据,也可用数值型数据,但不主要用于顺序数据,也可用数值型数据,但不能用于分类数据能用于分类数据39n排序后处于中间位置上的值排序后处于中间位置上的值n中位数将全部数据分成相等的两部分,中位数将全部数据分成相等的两部分,一半数据比中位数大,一半数据比中位一半数据比中位数大,一半数据比中位数小,居于中间位置的值就是中位数。数小,居于中间位置的值就是中位数。MMe e50%50%40中位数的计算:未分组资料:n数值型数据的中位数n奇数项:先将数据按从小到大顺序排列,如项数为奇数奇数,居于中间的哪个单位标志值。n n(9个数据的算例)41n【例】【例】9个家庭的人均月收入数据个家庭

22、的人均月收入数据n原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630n排排 序序:750 780 850 960 1080 1250 1500 1630 2000n位位 置置:1 2 3 4 5 6 7 8 9n n n 中位数中位数中位数中位数 1080 108042n先将数据按从小到大顺序排列,如项数为偶数偶数,中位数为居于中间的那2个单位标志值的平均值。43(10个数据的算例)n【例】:【例】:10个家庭的人均月收入数据个家庭的人均月收入数据n排排 序序:660 750 780 850 960 1080 1250 1500 1630 200

23、0n位位 置置:1 2 3 4 5 6 7 8 9 10 n n 44未分组数值型数据的中位数未分组数值型数据的中位数 中点位置中点位置n当当N为为奇数奇数n当当N为为偶数偶数45顺序数据的中位数(例题分析)n n解:解:中位数的位置为 n n 300/2150 从累计频数看,中位数在“一般”这一组别中n n中位数:Me=一般一般回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数非常不满意非常不满意2424不满意不满意108132一般一般93225满意满意45270非常满意非常满意30300合计300甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住

24、房状况评价的频数分布甲城市家庭对住房状况评价的频数分布462.分组数据计算中位数分组数据计算中位数n单项式分组资料单项式分组资料 n要将要将次数进行累计次数进行累计,中位数为居于中间位置所对应的,中位数为居于中间位置所对应的标志值。标志值。n中位数的位次:中位数的位次:n由分组资料确定中位数与由未分组确定不同,这是因由分组资料确定中位数与由未分组确定不同,这是因为由分组资料确定中位数,一般要通过累计次数计算,为由分组资料确定中位数,一般要通过累计次数计算,而累计次数有两种表示方法:向上累计和向下累计。而累计次数有两种表示方法:向上累计和向下累计。n看哪一个累计次数最先涵盖中点位次,该组的变量值

25、看哪一个累计次数最先涵盖中点位次,该组的变量值就是中位数就是中位数47例:某厂工人日产零件中位数计算表例:某厂工人日产零件中位数计算表按日产零件分按日产零件分组(件)组(件)工人数(人)工人数(人)向上累计次数向上累计次数 263331101332142734275436187241880合计合计8048解:n中位数位置=80/2=40n按向上累计次数,到34所在组为54,到32所在组为27,故中位数应在34所在组,即中位数=34。49组距资料计算中位数n1.计算中点位置:计算中点位置:n2.计算累计次数,计算累计次数,确定中位数所在的确定中位数所在的组组n3.计算中位数的近计算中位数的近似值

26、似值50下限公式要看向上累计的次数上限公式要看向下累计的次数n下限公式下限公式:n上限公式:上限公式:51n式中:、式中:、分别表示中位数所在组的下限、分别表示中位数所在组的下限、上限;上限;n 中位数所在组的次数;中位数所在组的次数;n 中位数所在组以前各组的累计次数;中位数所在组以前各组的累计次数;n 中位数所在组以后各组的累计次数;中位数所在组以后各组的累计次数;n 总次数;总次数;nd中位数所在组的组距。中位数所在组的组距。例题P72 表4752四分位数(quartile)1.排序后处于排序后处于25%和和75%位置上的值位置上的值2.不受极端值的影响不受极端值的影响3.主主要要用用于

27、于顺顺序序数数据据,也也可可用用于于数数值值型型数数据,但不能用于分类数据据,但不能用于分类数据QQL LQQMMQQU U25%25%25%25%53四分位数(位置的确定)n n原始数据原始数据原始数据原始数据:n n顺序数据:顺序数据:顺序数据:顺序数据:54顺序数据的四分位数(例题分析)表:甲城市家庭对住房状况评价的频数分布表:甲城市家庭对住房状况评价的频数分布n n QL位置位置=(300)/4=75n n QU位置位置=(3300)/4=225n n 从累计频数看,从累计频数看,QL在在“不满意不满意”这一组别中;这一组别中;n n QU在在“一般一般”这一组别中这一组别中n n 四

28、分位数为:四分位数为:QL =不满意不满意n n QU =一般一般55数值型数据的四分位数数值型数据的四分位数(9个数据的算例个数据的算例)10个家庭的人均月收入数据个家庭的人均月收入数据 P73-4.1156数值型数据的四分位数(10个数据的算例57算术平均数()、众数(M0)中位数(Me)三者的关系n总体次数分配为对称的总体次数分配为对称的钟形分布时,三个平均数钟形分布时,三个平均数相等相等n当总体分布呈右偏时,当总体分布呈右偏时,则:则:n当总体分布呈左偏时,当总体分布呈左偏时,则:则:58n英国统计学家卡尔英国统计学家卡尔皮尔逊认为,当分皮尔逊认为,当分布只是适当偏态时,三者之间的数量

29、关布只是适当偏态时,三者之间的数量关系是:中位数系是:中位数Me与算术平均数的距离是与算术平均数的距离是众数众数M0与算术平均数距离的三分之一,与算术平均数距离的三分之一,即关系式为:。即关系式为:。59由此,可以推算出:在轻微偏态的次数分由此,可以推算出:在轻微偏态的次数分布中,一旦三者之中两者为已知时,就可布中,一旦三者之中两者为已知时,就可以近似估计出第三者。以左偏为例:以近似估计出第三者。以左偏为例:60第二节 统计分布的离散趋势 离中趋势n n数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征n n反映各变量值远离其中心值的程度(离散程度

30、)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)n n从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度n n不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值61标志变动度标志变动度n标志变动度标志变动度是描述总体各单位标志值差是描述总体各单位标志值差别大小程度的指标,又称离散程度或离别大小程度的指标,又

31、称离散程度或离中程度。中程度。n数据的离散程度越大,集中趋势的测度数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程值对该组数据的代表性就越差,离散程度越小,其代表性就越好。而离中趋势度越小,其代表性就越好。而离中趋势的各测度值就是对数据离散程度所作的的各测度值就是对数据离散程度所作的描述。描述。62标志变动度的作用n标志变动度是评价标志变动度是评价平均数代表性的依平均数代表性的依据。据。n标志变动度反映社会经济活动过程的标志变动度反映社会经济活动过程的均衡性均衡性或协调性,以及产品质量的或协调性,以及产品质量的稳定稳定性性,优良品种的,优良品种的推广性推广性。n3标志变异指

32、标是标志变异指标是计算抽样误差的根据计算抽样误差的根据。63描述数据离散程度的测度值主要有:描述数据离散程度的测度值主要有:n方差、标准差方差、标准差n四分位差四分位差n离散系数离散系数64一、方差和标准差(variance and standard deviation)1.数据离散程度的最常用测度值数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差或根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样标准差;根据样本数据计算的,称为样本方差或标准差。本方差或标准差。4 6 8 10 124 6 8 1

33、0 12 x x=8.38.365方差、标准差的计算公式方差、标准差的计算公式(针对总体的)针对总体的)n未分组数据:n n分组数据:分组数据:666768理解记忆:n标准差标准差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。的平方根。n又称:均方根差又称:均方根差n举例:举例:P75 表表4869某企业工人日产量的标准差计算表某企业工人日产量的标准差计算表日产量KG工人数f组中值x60以下105560701965708050758090368590100279510011014105110以上8115合计16470交替标志的标准差 PPT1571离散系数(coefficient

34、of variation)n1.标准差与其相应的均值之比标准差与其相应的均值之比n2.对数据相对离散程度的测度对数据相对离散程度的测度n3.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响n4.用于对不同组别数据离散程度的比较用于对不同组别数据离散程度的比较73 离散系数的计算公式为离散系数的计算公式为n标志变动度的数值大小,不标志变动度的数值大小,不仅受离散程度影响,而且还仅受离散程度影响,而且还受平均水平高低的影响,因受平均水平高低的影响,因此,在平均数不相等时,不此,在平均数不相等时,不能简单根据标准差大小来比能简单根据标准差大小来比较离散程度。较离散程度。n当我们比

35、较两组数据的离散当我们比较两组数据的离散程度时,如两组平均数相等,程度时,如两组平均数相等,可以直接比较标准差;如两可以直接比较标准差;如两组平均数不等,则需比较两组平均数不等,则需比较两组的离散系数。组的离散系数。74即乙组的离散程度大于甲组。n例:有两组工人日产量例:有两组工人日产量n甲组:甲组:60、65、70、75、80n乙组:乙组:2、5、7、9、12n不能简单断言甲组离散程度大于乙组离散程度不能简单断言甲组离散程度大于乙组离散程度n 可以计算离散系数可以计算离散系数75四分位差(quartile deviation)1.对顺序数据离散程度的测度对顺序数据离散程度的测度2.也称为内距

36、或四分间距也称为内距或四分间距3.上四分位数与下四分位数之差上四分位数与下四分位数之差n Qd=QU QL4.反映了中间反映了中间50%数据的离散程度数据的离散程度5.不受极端值的影响不受极端值的影响6.用于衡量中位数的代表性用于衡量中位数的代表性7.案例:案例:P78 例例4.1676总方差、组间方差、平均组内方差总方差、组间方差、平均组内方差n总体标准差是总体各单位标志值与其算总体标准差是总体各单位标志值与其算术平均数之间的平均离差,它反映总体术平均数之间的平均离差,它反映总体各单位之间的差异程度。但在分组数列各单位之间的差异程度。但在分组数列中,各组内部存在差异,各组之间也存中,各组内部

37、存在差异,各组之间也存在差异,这两部分差异都对总体内部的在差异,这两部分差异都对总体内部的差异产生影响。差异产生影响。n三者的关系:三者的关系:总方差组间方差平均组内方差总方差组间方差平均组内方差7778案例:P79 例4.1779第三节 统计分布的形态n一、分布的矩(动差)一、分布的矩(动差)n矩是物理学中的术语。它矩是物理学中的术语。它是指力与力臂对重心(平是指力与力臂对重心(平衡点)的关系。这与统计衡点)的关系。这与统计学中的权数和变量对平均学中的权数和变量对平均数的关系很相似。数的关系很相似。n矩的基本公式:矩的基本公式:80原点矩81中心矩82二、偏度n总体次数分布的偏斜方向和程度的

38、测度总体次数分布的偏斜方向和程度的测度n统计分析中多用中心矩来测定次数分布统计分析中多用中心矩来测定次数分布的偏斜程度的偏斜程度n由于一阶中心矩为由于一阶中心矩为0,任何离差经过偶次,任何离差经过偶次方后,皆为正值,汇总后不再互相抵消,方后,皆为正值,汇总后不再互相抵消,无法说明左偏或右偏。因此,通常用三无法说明左偏或右偏。因此,通常用三阶中心矩作为测定偏态的依据。阶中心矩作为测定偏态的依据。83偏态系数8485三、峰度n描述分布图形的尖峭程度n峰度系数用4阶中心矩计算n通常与正态分布比较86峰度系数8788日产量fx50以下11506013607070708012080905090100301001105110以上1合计30089n偏度系数0.032,轻微右偏n峰度系数3.47大于3,尖顶峰分布n平均数75,标准差12.27n三阶中心矩60n四阶中心矩78666.6790本章小节与作业nP85练习题1、2、3、4、591

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁