《2022年第五章离散趋势测量.docx》由会员分享,可在线阅读,更多相关《2022年第五章离散趋势测量.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 第五章 离散趋势测量一、基本概念1、离散趋势反映一组数据中各数值与中心值偏离的程度;中心趋势的各种测量值是对数据水平的一个概括性度量, 但是假如数据离散程度大,集中趋势测量值对数据的代表性就差,这时候需要离散趋势测量值对数据的离散程度进行测量;2、质性差异指数(IQV )质性差异指数是实际观看到的变异量和依数据可能有的最大变异量之间的比值,其数值是介于 0 与 1 中间,用 IQV 表示;3、极差极差是一组数据中最大值与最小值的差值,也称为全距;通常用 R 表示极差;极差是一组数据中最大值和最小值的差值,因而, 极差只适用于数值型数据,但是不适
2、合定类数据和定序数据离散趋势的测量;极差越大说明数据的离散程度越大;4、四分位差四分位差是上四分位数和下四分位数之差,也称为内距或者四分间距;四分位差反映了中间 50%数据的离散程度,假如数值越小,说明离散程度越小,中间 50%数据集中性越好;相反,假如四分位差越大,就说明离散程度越大,中间数据的集中性越差;5、平均差平均差就是一组数据中每一个数据与这组数据均值之差的肯定值之和的平均,也称为平均离差,通常用 Md 表示; 平均差也只适用于数值型数据离散趋势的测量,而不适用于定类数据和定序数据;6、方差方差是各数值与均值离差平方的平均数,它是数值型数据离散趋势最主要的测量值;与平均差不同的是,
3、方差采纳平方的方式防止防止正、负抵消带来的问题,但是采纳平方的方式给方差的说明带来肯定的困难;7、标准差标准差是方差的平方根,用于测量数值型数据离散趋势;标准差克服了方差面临的夸大离散程度、不简洁说明的问题;与方差相比,标准差是有量纲的,它与变量值的单位相同,简洁说明;在实际中,标准差使用更为普遍;8、离散系数离散系数是一组数据的标准差与该组数据均值之比,也称为变异系数; 离散系数是测量数据离散程度的相对指标,通常用 V s适用于数值型数据离散程度的测量;二、基本方法1、质性差异指数的运算名师归纳总结 IQV 的运算公式为:IQV=KN2Kf2第 1 页,共 5 页N21- - - - - -
4、 -精选学习资料 - - - - - - - - - 其中,k 为分类数据的类别数或者组数,N 是样本容量,f2是各组频数平方的总和;IQV 0 时,数据之同构型最高或变化最小,肯定是全部个案都集中在一个类别中;而 IQV 1 时,是全部个案平均的安排在各类别时;2、极差与四分位差的运算假如用 Xmax 和 Xmin 分别表示一组数据的最大值和最小值,表示: R=XmaxXmin那么极差可以用下面公式用 QL 表示下四分位数, QU 表示上四分位数,Qd 表示四分位差, 那么四分位差可以用下面公式表示:Q d Q U Q L从某个班级随机抽取 11 位同学,调查期末考试英语成果,11 位同学成
5、果分别为:98,87, 90,89,87, 95,83,72,91,93,85;运算 11 位同学英语成果的极差和四分位差;(1)第一,我们找出最大值和最小值,分别为R=XmaxXmin=9872=26(分)98 和 72,然后依据公式运算极差:(2)第一排序: 72, 83,85, 87, 87, 89, 90, 91, 93, 95, 98 ,运算上四分位数和下四分位数:上四分位数的位置 =3* (n+1) /4=3* (11+1)/4=9,即 Q =93 下四分位数的位置 =( n+1)/4=(11+1)/4=3,即 Q =85 然后运算四分位差 Q d Q U Q L =93-85=8
6、 3、平均差的运算(1)未分组数据平均差的运算第一运算均值,然后在运算平均差时可以依据定义进行运算,公式为:M dXXX ;然后运算每个数据X 与均值X之差的肯定值,n详细步骤:第一运算全部数据的均值并进行加总;最终求各离差肯定值X X 加总之和的平均值,即除以数据个数;以前面例子为例,运算 11 位同学期末英语成果的的平均差;第一运算均值:X =X1X2N.XN=(98+87+90+89+87+95+83+72+91+93+85 ) 11 89(分)名师归纳总结 - - - - - - -第 2 页,共 5 页精选学习资料 - - - - - - - - - 然后运算各离差肯定值的加总和:X
7、X= 9889 + 8789 + 9089 + 8989 + 8789 + 95 89+ 8389 + 7289 + 9189 + 9389 + 8589=53(分)最终求离差肯定值的平均:M d=53 114.8(分)即 11 位同学期末英语考试成果的平均差为 4.8 分;(2)分组数据平均差的运算与运算均值类似,利用各组组中值和频数来运算平均差,公式为:MdXiX*fiXiX 与均值 X 之差的n详细步骤:第一运算全部数据的均值X ;然后运算各小组组中值肯定值;再求各组组中值与均值离差肯定值与小组频数if的乘积X *if;最终求各小组XiX *if加总之和的平均值;4、方差和标准差的运算(
8、1)未分组数据方差和标准差的运算第一运算均值,然后在运算方差时可以依据定义进行运算,公式为:2in1x ix2n详细步骤: 第一运算全部数据的均值X ;然后运算各数值X 与均值X之差的平方, 并进行加总;最终求各离差平方和的平均值,即除以数据个数;运算出方差之后,对其开方即可得到标准差,公式为:xix2n假如某修理部门连续8 周修理电脑的台数分别为5 台、 18 台、 17 台、 8 台、 10 台、 4台、 20 台和 6 台,运算每周修理电脑数量的方差和标准差;第一运算每周修理电脑数量的均值:X =X1X2N.XN=(5+18+17+8+10+4+20+6 ) 8 名师归纳总结 - - -
9、 - - - -第 3 页,共 5 页精选学习资料 - - - - - - - - - =11(台)然后依据公式运算方差:2inxix2=35.751n最终运算标准差:xix211 台,其标准差为5.98 台;n=5.98(台)即该修理部门平均每周修电脑(2)分组数据方差和标准差的运算与运算均值类似,利用各组组中值和频数来运算方差,公式为:2ik1Mix2fin详细步骤:第一运算全部数据的均值X ;然后运算各小组组中值X 与均值 X 之差的平方;再求各组组中值与均值离差平方与小组频数 并求平均值即可;if的乘积;最终对上一步结果进行加总在求出方差后将其开便利得到标准差,公式为:Mifx2fii
10、5、离散系数的运算标准差离散系数的定义中已经说明,它是标准差与均值的比值,其公式为:V s= 均值离散系数越大, 说明数据的离散程度也就越大,相反,离散系数越小,数据的离散程度 就越小;假设有甲、乙两人同时打靶,各大 10 靶,甲平均每靶为 8 环,标准差为 2;乙平均每 3,那么甲、乙两人打靶的稳固性水平的更好呢?靶 9 环,标准差为 甲: V s=8 2=4 乙: V s=9 3=3 由此可见,乙的离散系数小于甲,所以说乙打靶的稳固性更好;三、其他重点难点1、质性差异指数的特点 质性差异指数的作用是求出各个类别之间在理论上最多的可能差异中实际上显现了多 少差异;它利用全部类别频数信息,因而
11、代表性较强;名师归纳总结 - - - - - - -第 4 页,共 5 页精选学习资料 - - - - - - - - - 2、极差与四分位差的特点极差运算简洁, 所需信息少,易于懂得;但是简洁受极端值影响,极差只利用了最大值和最小值两个数值,不能精确的反映出中间数据的特点;四分位差运算简洁、易于懂得, 不受极端值的影响,这是四分位差的优点之一;对于数 值型数据,运算了中间 50%数据的极差,不仅反应了全部数据的离散程度,同时反映出中 间 50%数据的离散程度和集中程度;3、平均差的特点平均差意义比较明确、易懂, 利用了全部数据的信息,能比较全面精确的反映一组数据的离散状况;平均差越大,说明数
12、据的离散程度越大;相反,平均差越小,数据的离散程度 越小;平均差在运算时采纳了各数值与均值之差的肯定值,离差之和为 0 的问题,但这也给运算带来不便;4、方差和标准差的特点防止了各差值正、 负抵消导致最终(1)方差和标准差包括了全部数据的信息,反应灵敏,每个数据取值的变化,方差或 标准差都随之变化;(2)方差和标准差简洁运算,而且运算严密确定,但是当数据许多时,运算量很大,因而多使用运算工具或者软件进行;(3)方差和标准差适合代数运算,而且由于标准差是量纲的,因而更便于不同群体之 间离散趋势的比较;除上述之外,方差仍具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性如组间、 组内等 并可进一步说明每种变异对总结果的影响, 是以后统计推论部分常用的统计特点数;这在以后章节中会有所涉及;5、离散系数的特点离散系数的运算是以标准差和均值为基础,因而离散系数包括全部数据信息,因而其代表性较好, 但是只要其中一个数据变化,离散系数就跟随变化;离散系数排除了变量值水平高低和计量单位不同对离散程度的影响,度,在实际中应用广泛;它的主要作用是比较不同总体或样本数据的离散程名师归纳总结 - - - - - - -第 5 页,共 5 页