第五章离散趋势测量法.doc

上传人:豆**** 文档编号:17680630 上传时间:2022-05-25 格式:DOC 页数:6 大小:167.50KB
返回 下载 相关 举报
第五章离散趋势测量法.doc_第1页
第1页 / 共6页
第五章离散趋势测量法.doc_第2页
第2页 / 共6页
点击查看更多>>
资源描述

《第五章离散趋势测量法.doc》由会员分享,可在线阅读,更多相关《第五章离散趋势测量法.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流第五章离散趋势测量法.精品文档.第五章 离散趋势测量法第二节、全距与四分位差 一、全距 1、未分组资料计算公式 全距又称极差,是一组数据的最大值与最小值之差,用表示。计算公式为: 式中, 、 分别表示为一组数据的最大值与最小值。由于全距是根据一组数据的两个极值表示的,所以全距表明了一组数据数值的变动范围。越大,表明数值变动的范围越大,即数列中各变量值差异大,反之,越小,表明数值变动的范围越小,即数列中各变量值差异小。2、分组资料计算公式R=最高组上限 - 最低组下限 R=最高组组中组-最低组组中值 R=最高组组中组-最低组下限 R=最高组上限

2、-最低组组中值 如果资料经过整理,并形成组距分配数列,全距可近似表示为: R最高组上限值最低组下限值3、优缺点:优点:计算简单,易于理解。缺点: (1)受极端值影响大,遇含开口组的资料时无法计算; (2)数据利用率低,信息丧失严重; (3)受抽样变动影响大(一般大样本的全距会比小样本的全距大)。二、四分位差(inter-quartile range)上四分位数与下四分位数之差的平均数,称为四分位差,亦称为内距或四分间距。四分位差的计算方法:QD=(Q3-Q1) /2四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。此外,由于中位数处于数据

3、的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。优缺点:主要是避免了全距受极端值影响的缺点,其他优缺点同全距:数据利用率低,信息丧失严重;受抽样变动影响大。第三节、平均差 平均差是各变量值与其算术平均数离差绝对值的平均数,用A.D表示。根据掌握资料的不同,平均差有以下两种计算方法: 1. 简单平均法 对于未分组资料,采用简单平均法。其计算公式为:2. 加权平均法在资料分组的情况下,应采用加权平均式第四节、方差和标准差 一、概念要点 方差和标准差同平均差一样,也是根

4、据全部数据计算的,反映每个数据与其算术平均数相比平均相差的数值,因此它能准确地反映出数据的差异程度。但与平均差不同之处是在计算时的处理方法不同,平均差是取离差的绝对值消除正负号,而方差、标准差是取离差的平方消除正负号,这更便于数学上的处理。因此,方差、标准差是实际中应用最广泛的离中程度度量值。由于总体的方差、标准差与样本的方差、标准差在计算上有所区别 1、方差是个变量值与其均值离差平方的平均数,标准差是方差的开方。 2、离散程度的测度值之一。 3、最常用的测度值。 4、反映了数据的分布。 5、反映了各变量值与均值的平均差异。 6、根据总体数据计算的,称为总体方差或标准差。根据样本数据计算的,称

5、为样本方差或标准差二、总体的方差和标准差设总体的方差为,标准差为,对于未分组整理的原始资料,方差和标准差的计算公式分别为(二)样本的方差和标准差样本的方差、标准差与总体的方差、标准差在计算上有所差别。总体的方差和标准差在对各个离差平方平均时是除以数据个数或总频数,而样本的方差和标准差在对各个离差平方平均时是用样本数据个数或总频数减1去除总离差平方和。4. 方差的数学性质第五节、标准分相对位置的度量:标准分数有了均值和标准差之后,我们可以计算一组数据中各个数值的标准分数,以测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群值。1、定义。变量值与其平均数的离差除以标准差后的值,

6、称为标准分数,也称标准化值或值标准分数也给出了一组数据中各数值的相对位置。比如,如果某个数值的标准分数为-2,我们就知道该数值低于均值2倍的标准差。 (.4.21) 式也就是我们常用的统计标准化公式,在对多个具有不同量纲的变量进行处理时,常常需要对各变量数值进行标准化处理。实际上,z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0、标准差为1 经验法则表明:当一组数据对称分布时 约有68.27%的数据在平均数加减1个标准差的范围内 约有95.45%的数据在平均数加减2个标准差的范围内 约有99.73%的数据在平均

7、数加减3个标准差的范围内。 由此可见,一组数据中低于或高于平均数3个标准差以上的数据很少。因此,在统计上,往往将平均数3个标准差以外的数据称为异常值或离群值 2、标准分的特性 (1)对于给定资料,由于算术平均数和标准差都是确定值,所以z是和X一一对应的变量。 (2)它没有单位,是一个不受原资料单位影响的相对数,因而也适用于不同单位资料的比较。 (3)均值和方差不同的正态分布经Z分数标准化后,可以转化为标准正态分布,所以Z又称标准正态变量。 (4)Z分数的数学特性: Z分数之和等于0; Z分数的算术平均数等于0; Z分数的标准差和方差均为1。3、标准分的主要作用: 标准分数的作用主要在两个方面,

8、一是可以表明原始数据在总体分布中的相对位置,二是可以对不同分布的各原始数据进行比较。第六节 离散系数相对离散程度:离散系数用离差的绝对指标除以平均指标来求离差的相对指标,就可以在计量单位不同或平均水平不一的对象间进行直接比较。这种由绝对离差与其算术平均数的比值,叫变异系数。 1、全距系数:全距与算术平均数之比。 2、平均差系数:平均差与算术平均数之比。 3、标准差系数(最重要和最常用的变异系数) (1)标准差与其相应的均值之比 (2)消除了数据水平高低和计量单位的影响 (3)测度了数据的相对离散程度 (4)用于对不同组别数据离散程度的比较离散系数是反映一组数据相对差异程度的指标,是各变异指标与

9、其算术平均数的比值。离散系数是一个无名数,可以用于比较不同数列的变异程度。离散系数通常用表示,常用的离散系数有平均差系数和标准差系数,其计算公式分别为:例3.19 甲乙两组工人的平均工资分别为138.14元、176元,标准差分别为21.32元、24.67元。两组工人工资水平离散系数计算如下:【例】某管理局抽查了所属的8家企业,其产品销售数据如表,试比较产品销售额与销售利润的离散程度企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0X1=536.25(万元) X2=32.5215(万元)S1=309.19(万元) S2=23.09(万元 ) V1=S1/X1=0.577 V2=S2/X2=0.710结论: 计算结果表明,V13,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁