《第四章统计描述课件.ppt》由会员分享,可在线阅读,更多相关《第四章统计描述课件.ppt(144页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、章统计描述章统计描述节总量指标节总量指标节相对指标节相对指标节平均指标节平均指标节变异指标节变异指标n教学目的教学目的n 理解总量指标、相对指标、平均指标、理解总量指标、相对指标、平均指标、变异指标的概念、作用和种类,掌握各种指标变异指标的概念、作用和种类,掌握各种指标的计算和应用。能够运用本章所述的统计指标的计算和应用。能够运用本章所述的统计指标对客观现象的规模、水平和各种数量关系进行对客观现象的规模、水平和各种数量关系进行科学描述。科学描述。n重点难点重点难点n 总量指标、相对指标、平均指标和变异总量指标、相对指标、平均指标和变异指标的计算和应用,标准差和特殊情况下加权指标的计算和应用,标
2、准差和特殊情况下加权算术平均数权数的选择。算术平均数权数的选择。用统计指标去概括和分析现象总体的数量特征和数量关系的方法,称为综合指标法,简称综合指标。综合指标从它的作用和方法特点的角度可概括为三类:总量指标总量指标相对指标相对指标平均指标平均指标第一节第一节 总量指标总量指标 一、总量指标的概念和作用一、总量指标的概念和作用 总量指标是反映社会经济现象一定时间、地点、条件下的总规模、总水平或工作总量的统计指标。总量指标表现形式是绝对数,不是抽象的绝对数,计量单位是有名数。总量指标也可表现为总量之间的绝对差数,如增加量、减少量等。例如:年我国财政收入亿元。例如:年我国国内生产总值比上年增加亿元
3、。总量指标在社会经济统计中的作用总量指标在社会经济统计中的作用:总量指标能反映一个国家的基本国情和国力,反映某部门或单位等人、财、物的基本数据。总量指标是制定政策、编制计划、实行社会经济管理的重要依据。总量指标是计算相对指标和平均指标的基础。(一)按其反映现象总体内容的不同分为:(一)按其反映现象总体内容的不同分为:二、二、总量指标的种类总量指标的种类 总体单位总量指标说明总体的单位总数。例:企业数、学校数、职工人数、学生人数。总体标志总量指标说明总体中某种标志值总和。例:总产量、总产值、工资总额、税金总额。(二)按其反映的时间状况不同分为:(二)按其反映的时间状况不同分为:时期指标 反映现象
4、总体在某一时期内发展过程的总数量,即流量。(可连续计数,与时间长短有关,是累计结果)时点指标 反映现象总体在某一时刻(瞬间)上的规模或水平,即存量。(间断计数,与时间间隔无关,不能累计)实物指标是根据事物的自然属性或物理性能,采用自然单位或度量衡单位计算的总量指标。自然单位:辆、双、头、根、个 度量衡单位:吨、米、克、立方米 双重单位:公里小时、人平方公里复合单位:吨公里、千瓦小时 标准实物单位:按统一标准折算 对有些性质相同但规格或含量不同的产品总量的计算,要按折合标准实物量的方法计算。例如,能源统计以标准燃料每千克发热量为标准单位。(三)按其计量单位不同分为:(三)按其计量单位不同分为:货
5、币单位使不能直接相加的产品产量过渡到能够加总,用于综合说明具有不同使用价值的产品生产总量或商品销售量等的总规模、总水平。价值指标是以货币为单位计算的总量指标。劳动量指标是以劳动时间为单位计算的总量指标。工时 工人数和劳动时数的乘积工日 工人数和劳动日数的乘积台时 设备台数和开动时数的乘积 由于具体条件不同,不同企业的劳动量指标不具有可比性,因此,劳动量指标只限于企业内部使用。三、三、总量指标的计算原则总量指标的计算原则 (一)科学性 以科学的理论确定总量指标的含义、范围和计算方法。(二)可比性 注意历史条件变化对指标内容和范围的影响。(三)统一性 指标的计算口径,即计算的范围、计算方法、计量单
6、位要统一。第二节第二节 相对指标相对指标 又称相对数,是两个有联系的指标数值之比,用以反映现象的发展速度、强度、结构或数量联系程度。2005年我国对外贸易进口总额增长率为16.1%,出口总额增长率为25.7%。例例一、相对指标的概念和作用一、相对指标的概念和作用 相对指标的主要作用相对指标的主要作用:相对指标能具体表明社会经济现象之间的比例关系。相对指标能使一些不能直接对比的事物找出共同比较的基础。相对指标便于记忆、易于保密。企业 月份劳动生产率(万元)月份劳动生产率(万元)月比月发展速度()甲元乙元 从上表中看来,好象甲厂比乙厂劳动生产率高();而将其换算成相对指标,实际发展速度是乙厂大于甲
7、厂。由此可看出相对指标可以弥补总量指标的不足。例例 人口密度:人平方公里 平均每人分摊的粮食产量:千克人-系数或倍数:是将比的基数抽象化为;-成数:是将比的基数抽象化为;-百分数:是将比的基数抽象化为;-千分数:是将比的基数抽象化为。相对指标的数值有两种表现形式:相对指标的数值有两种表现形式:无名数无名数(抽象化的数),分以下几种(抽象化的数),分以下几种:有名数有名数(一一)计划完成程度相对指标计划完成程度相对指标 用来检查、监督计划执行情况的相对指标,通常以表示。二、相对指标的种类及其计算二、相对指标的种类及其计算计划完成相对数的作用计划完成相对数的作用u 说明各计划指标的完成程度u 反映
8、计划执行进度u 反映经济计划执行中的薄弱环节()()根据总量指标计算计划完成相对数根据总量指标计算计划完成相对数 计算结果表明该厂超额完成总产值计划。计划完成程度相对指标的计算计划完成程度相对指标的计算 设某工厂某年计划工业总产值为万元,实际完成万元,则:例例()()根据平均指标来计算计划完成程度相对数根据平均指标来计算计划完成程度相对数例例 某企业某月生产某产品,计划每人每日平均产量件,实际每人每日平均产量为件,则:计算结果表明该企业实际劳动生产率超过完成了计划任务。()()根据相对指标计算计划完成程度相对数根据相对指标计算计划完成程度相对数 某企业生产某产品,上年度实际成本为元吨,本年度计
9、划单位成本降低,实际降低,则:比计划多完成例例本题也可换算成绝对数计算:本题也可换算成绝对数计算:计划 元吨 ()实际 元吨 ()某企业计划规定劳动生产率比上年提高,实际比上年提高,则:该企业劳动生产率超额完成计划任务。例例 按降低率规定计划任务,其计划完成相对数为:按提高率规定计划任务,其计划完成相对数为:计划执行进度的考核计划执行进度的考核 逐日、逐月、逐季地检查计划执行的进度情况,采用计划期中某一段时期的累计实际完成数与全期计划任务数之比来表示。计划执行进度:时间进度:例例 某企业某年工业总产值年度计划为万元,一、二、三月份实际完成量分别为万元、万元、万元,则计划执行进度如何?计划执行进
10、度:时间进度:长期计划的检查长期计划的检查 ()累计法计划任务数是规定在整个计划期间应完成的累计数()水平法计划任务数是规定末期应达到的水平 某煤矿计划在“十五”期间,为国家生产万吨原煤,或达到年产量万吨原煤。实际统计资料如下:年产量万吨,年产量万吨,年产量万吨,年产量万吨。计算该矿“十五”期间原煤产量计划完成情况。例例月份合计 水平法。从年月年月共完成万吨,提前个月零天。解:累计法。期末共完成万吨,超额完成任务,解:累计法。期末共完成万吨,超额完成任务,超出万吨,提前个月零天。超出万吨,提前个月零天。(二二)结构相对指标结构相对指标 结构相对指标是在总体分组的基础上,将总体的某部分数值与总体
11、全部数值对比而得出的比重或比率,它可以反映总体的构成情况。例例上海上海“十五十五”期间构成()期间构成()年年年年年第一产业第一产业第二产业第二产业第三产业第三产业结构相对指标的作用:结构相对指标的作用:(三三)比例相对指标比例相对指标 比例相对指标是同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。2.2.首先将总体全部数值抽象化为首先将总体全部数值抽象化为100100,求得各部,求得各部分数值在总体中所占百分数,然后将各部分的百分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。分数连比得比例相对数。1.1.将作为比较基础的数值抽象化为将作为比较基础的数值
12、抽象化为1 1、1010、100100或或10001000,看被比较的数值是多少。,看被比较的数值是多少。我国2000年第五次人口普查结果,男女性别比例为106.74:100,这说明以女性为100,男性人口是女性人口数的1.0674倍,简称性别比106.74。例例 2002年我国GDP抽象化为100,第一产业、第二产业、第三产业的比例为:14.551.833.7。例例常用的比例形式有两种:常用的比例形式有两种:(四四)比较相对指标比较相对指标(类比相对指标类比相对指标)比较相对指标是反映同类现象在不同空间条件下数量对比关系的综合指标,用以说明某一种现象同一时间在不同地区(或单位)发展的差异程度
13、。某年有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为 元,乙企业劳动生产率为 元。说明甲企业劳动生产率比乙企业低。例例 计算比较相对数时,作为比较基数的分母可取不同的对象,一般有两种情况:比较标准是一般对象比较标准是一般对象这时,分子与分母的位置可以互换。比较标准比较标准(基数基数)典型化典型化 把企业的各项技术经济指标都和国家规定的质量水平比较,和同类企业的先进水平比较,和国外先进水平比较等,这时,分子与分母的位置不能互换。(五五)强度相对指标强度相对指标 强度相对指标是两个性质不同但有联系的总量指标之比,用来表明某一现象在另一现象中发展的强度、密度或普遍程度。用百分数表示
14、说明平均每百元销售额负担多少流通费。产值利润率、资金利润率一般用千分数表示。例例强度相对数的数值表示有两种方法:强度相对数的数值表示有两种方法:一般用复名单位表示 也有少数用百分数或千分数表示 某城市人口万人,有零售商业机构个,则:有些强度相对数有正、逆两种计算方法:有些强度相对数有正、逆两种计算方法:强度相对指标可以颠倒分子分母计算,故有正逆指标之分。区分正逆指标时,主要看其数值大小与反映事物的强度大小是否一致,一致者为正指标,不一致者为逆指标。例例 正指标的数值愈大,表示零售商业网密度愈大,它是从正正指标的数值愈大,表示零售商业网密度愈大,它是从正方向说明现象的密度;逆指标的数值愈大,表示
15、零售商业网密方向说明现象的密度;逆指标的数值愈大,表示零售商业网密度愈小,它是从相反方向说明现象的密度。度愈小,它是从相反方向说明现象的密度。n 某年某地区平均人口数为万人,医院病床数为张。则:n n上述计算结果张千人,说明每千人拥有的医院病床张,数值越大,表示每千人拥有的床位数越多,说明医疗保障程度越高,它从正面说明所研究现象的强度或密度,故称正指标;人张说明平均每张病床要供人使用,指标数值越小,说明医疗保证程度越高,所以是逆指标。例例u 说明一个国家、地区、部门的经济实力或为社会服务的能力u 反映和考核社会经济效益u 为编制计划和长远规划提供参考依据强度相对数的作用:强度相对数的作用:(六
16、六)动态相对指标动态相对指标基期基期 作为对比标准的时间作为对比标准的时间报告期报告期同基期比较的时期,也称计算期同基期比较的时期,也称计算期 动态相对指标是现象报告期水平与基期水平之比,用来反映现象在时间上的发展变化情况,又称为动态相对数或发展速度。某地区国内生产总值年为亿元,年为亿元,其动态相对指标或发展速度为:计算表明该地区国内生产总值动态相对数或发展速度为,它表明该地区年国内生产总值比上年增长了。例例六种相对指标的比较六种相对指标的比较同一时期比较不同时期比较同类现象比较不同现象比较动态相对数同一总体比较不同总体比较强度相对数计划完成程度相对数结构相对数比例相对数比较相对数2.2.相对
17、指标要和总量指标结合起来运用。相对指标要和总量指标结合起来运用。1.1.注意二个对比指标的可比性。注意二个对比指标的可比性。三、正确运用相对指标的原则三、正确运用相对指标的原则3.3.多种相对数结合运用多种相对数结合运用4.4.在比较二个相对数时,是否适宜相除再求一个在比较二个相对数时,是否适宜相除再求一个相对数,应视情况而定。若除出来有实际意义,相对数,应视情况而定。若除出来有实际意义,则除;若不宜相除,只宜相减求差数,用百分点则除;若不宜相除,只宜相减求差数,用百分点表示之。表示之。(百分点百分点 即百分比中相当于百分之一的单位即百分比中相当于百分之一的单位)第三节第三节 平均指标平均指标
18、 (集中趋势)(集中趋势)数量抽象性 只能就同类现象计算集中趋势代表性一、平均指标的概念和作用一、平均指标的概念和作用 平均指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。平均指标的特点:平均指标的特点:平均指标的作用:平均指标的作用:.反映现象集中趋势.比较现象时空差异.分析现象依存关系.提供估计推断基础平平均均数数数值平均数数值平均数位置平均数位置平均数众数众数中位数中位数算术平均数算术平均数几何平均数几何平均数调和平均数调和平均数平均指标按计算方法不同可分为:平均指标按计算方法不同可分为:根据总体所有标志值计算根据标志值所处的位置来确定 二、算术
19、平均数()二、算术平均数()(一)算术平均数的基本公式(一)算术平均数的基本公式例例 注意区分算术平均数与强度相对数注意区分算术平均数与强度相对数 标志值和单位之间存在一一对应关系式中:算术平均数 各单位的标志值 总体单位数 总和符号(二)简单算术平均数(二)简单算术平均数适用于未分组资料例例 某生产小组有名工人,生产某种零件,日产量(件)分别为、,则平均每个工人日产零件数为多少?解:平均每个工人日产零件数为:解:平均每个工人日产零件数为:式中:算术平均数 各组数值 各组数值出现的次数(即权数)(三)加权算术平均数(三)加权算术平均数适用于总体资料经过分组整理形成变量数列的情况按月销售量分按月
20、销售量分组(件)组(件)营业员人数营业员人数(人)(人)总销售量(件)总销售量(件)合计合计这名服装营业员的平均月销售量为:这名服装营业员的平均月销售量为:某商场名服装营业员某月销售量分组资料某商场名服装营业员某月销售量分组资料例例表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为比重、频率;即公式表现为比重、频率;即公式中的中的指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度权数权数绝对数绝对数相对数相对数起到权衡轻重的作用决定平均数的变动范围 算术平均数的计算取决于变量值和权数的共同算术平均数的计算取决于变量值和权数的共
21、同作用:作用:变量值决定平均数的范围;变量值决定平均数的范围;权数则决定平均数的位置权数则决定平均数的位置在掌握比重权数的情况下,可以直接利用权数在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:系数来求加权算术平均数,其公式为:若资料为组距数列,则应取各组的若资料为组距数列,则应取各组的组中值组中值作为该组的代表值用于计算;此时求得的作为该组的代表值用于计算;此时求得的算术平均数只是其真值的算术平均数只是其真值的近似值近似值。说说明明按日产量分组(千克)组中值(千克)工人数(人)以下 以上 合 计 例例 设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。按日
22、产量分组(千克)组中值(千克)工人数(人)以下 以上 合 计 权数的选择权数的选择根据指标的含义,选择适当的权数。某公司所属个企业资金利润率分组资料如下表,计算该公司个企业的平均利润率。例例资本金利润率()企业数(个)资本金总额(万元)利润总额(万元)合 计 加权算术平均数受两因素的影响:变量值大小的影响。次数多少的影响。而简单算术平均数只反映变量值大小这一因素的影响。加权算术平均数与简单算术平均数不同在于:加权算术平均数与简单算术平均数不同在于:各个变量值与算术平均数离差之和等于零各个变量值与算术平均数离差之和等于零(四)算术平均数的数学性质(四)算术平均数的数学性质简单平均数:简单平均数:
23、加权平均数:加权平均数:各个变量值与算术平均数离差平方之和等于各个变量值与算术平均数离差平方之和等于最小值最小值 算术平均数的两点不足算术平均数的两点不足易受极端变量值的影响,使 的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中值不易确定,使 的代表性也不很可靠。)简单调和平均数适用于总体资料未经分组整理、尚为原始资料的情况式中:为调和平均数;为变量值 的个数;为第 个变量值。调和平均数()是各个变量值倒数的算术平均数的倒数。三、调和平均数三、调和平均数(又称又称“倒数平均数倒数平均数”)”)例例 某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25
24、元/斤。现早、中、晚各买1斤,求平均价格。例例 某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1元,求平均价格。)加权调和平均数适用于总体资料经过分组整理形成变量数列的情况式中:为第 组的变量值;为第 组的标志总量。例例 某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买2元、3元、4元,求平均价格。当己知各组变量值和标志总量时,作为算术平均数的变形使用。因为:因为:调和平均数的应用是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。某厂工人工资资料如表所示,求该厂工人的平均工资。技术级别月工资(元
25、)工资总额(元)工人人数(人)合计 例例(一)由平均数计算平均数时调和平均数法的应用:(一)由平均数计算平均数时调和平均数法的应用:市场平均价格(元)销售额(元)销售量甲 乙 丙 合计 例例 已知某商品在三个集市贸易市场上的平均价格及销售额资料如下表所示,求该商品的总平均价格。(二)由相对数计算平均数时调和平均数法的应用:(二)由相对数计算平均数时调和平均数法的应用:例例 已知某公司各企业产值计划完成程度及实际完成数如表所示,求全公司计划完成程度(即各企业平均计划完成程度)。计划完成程度()组中值()企业数实际完成数(万元)计划任务数(万元)合 计工厂 计划完成程度()实际产值(万)实际产值计
26、划完成程度()(即计划产值)(万元)甲乙 丙 合计 例例 某公司有个工厂,已知其计划完成程度()及实际产值资料如下,求平均完成计划程度。调和平均数的特点调和平均数的特点如果数列中有一标志值等于零,则无法计算 ;它作为一种数值平均数,受所有标志值的影响;但较之算术平均数,受极端值的影响要小。四、几何平均数四、几何平均数()()几何平均数又称“对数平均数”,是若干项变量值连乘积开其项数次方的算术根。应用:应用:用于计算现象的平均比率或平均速度q各个比率或速度的连乘积等于总比率或总速度;q相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条件:)简单几何平均数适用于总体资料未经分组整理尚为
27、原始资料的情况式中:为几何平均数;为标志值的项数;为第 个标志值。几何平均数的计算方法几何平均数的计算方法 某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为、,求整个流水生产线产品的平均合格率。分析:分析:设最初投产个单位,则第一道工序的合格品为;第二道工序的合格品为();第五道工序的合格品为();例例 因该流水线的最终合格品即为第五道工序的合格因该流水线的最终合格品即为第五道工序的合格品,品,故该流水线总的合格品应为故该流水线总的合格品应为 则该流水线产品总的合格率为:则该流水线产品总的合格率为:即该流水线总的合格率等于各工序合格率的即该流水线总的合格率等于各工序合格率的连乘积
28、,符合几何平均数的适用条件,故需采用连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。几何平均法计算。解:解:思考思考 若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为件,求该企业的平均合格率。因各车间彼此独立作业,所以有 第一车间的合格品为:;第二车间的合格品为:;第五车间的合格品为:。则该企业全部合格品应为各车间合格品的总和,即总合格品分析:分析:不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为应采用加权算术平均数公式计算,即例例解:解:这说明该厂车间产品平均合格率为 某机械厂有铸造车间
29、、机加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为、,求平均车间产品合格率。)加权几何平均数)加权几何平均数适用于总体资料经过分组整理形成变量数列的情况式中:为几何平均数;为第 组的次数;为组数;为第 组的标志值或组中值。几何平均数的计算方法几何平均数的计算方法 某金融机构以复利计息。近年来的年利率有年为,年为,年为,年为,年为。求平均年利率。设本金为,则至各年末的本利和应为:设本金为,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:分析:第第2年的年的计息基础计息基础第
30、第12年的年的计息基础计息基础例例则该笔本金年总的本利率为:则该笔本金年总的本利率为:即年总本利率等于各年本利率的连乘积,符合几何即年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几平均数的适用条件,故计算平均年本利率应采用几何平均法。何平均法。解:解:思考 若上题中不是按复利而是按单利计息,且各年的利率与上相同,求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:,则各年末应得利息为:则该笔本金年应得的利息总和为:()这里的
31、利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为假定本假定本金为金为 所以,应采用加权算术平均数公式计算平均年利息率,即:解:解:(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为)受极端值的影响较 和 小 几何平均数的特点几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算 是否为比率是否为比率或速度或速度各个比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解调和平均数的方法求
32、解调和平均数的方法数值平均数计算数值平均数计算数值平均数计算数值平均数计算公式的选用顺序公式的选用顺序公式的选用顺序公式的选用顺序指标指标由定义可看出众数存在的条件:由定义可看出众数存在的条件:五、众数(五、众数(ModeMode)众数是在总体中出现次数最多的那个标志值。只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。M M0 0M M0 0M M0 0若有两个次数相等的众数,则称双众数。M M0 0M M0 0下三图无众数:在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。价格(元)销售数量(千克)合计 某种商品的价格情况某种商品的价格情况众数(元)例例出现次数最
33、多的标志值就是众数。根据单项数列确定众数:根据单项数列确定众数:2.利用比例插值法推算众数的近似值。1.确定众数所在组;下限公式:上限公式:根据组距数列确定众数:根据组距数列确定众数:其中:按日产量分组(千克)工人人数(人)以下 以上 例例表中,即众数所在组。表中,即众数所在组。由下限公式,日产量众数由下限公式,日产量众数由上限公式,日产量众数由上限公式,日产量众数 众数的特点众数的特点 众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。众数是一个不容易确定的平均指标,当分布数列没有明显的集
34、中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。六、中位数六、中位数 (MedianMedian)将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。中位数把标志值数列分为两个部分,一部分标志值小于或等于它,另一部分标志值大于或等于它。中位数的作用:中位数的作用:不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。主要用于测度顺序数据的集中趋势,表示现象的一般水平。、将标志值按大小顺序排列。、确定中点位置。、确定中位数。当是奇数时,则处于中间位置的标志值就是中位数;当是偶数时,则处于中间位置的两个标志值的算术平均数就是中位数。根
35、据未分组资料确定中位数:根据未分组资料确定中位数:n为奇数时等于第()个数。n为偶数时等于第和个数的平均值,中位数中位数,中位数()中位数()、计算各组的向上(或向下)累计频数、确定中位数所在组 单项数列该组的标志值即为所求中位数 组距数列、按公式计算中位数 下限公式 上限公式 根据分组资料确定中位数:根据分组资料确定中位数:例例子女数合计家庭户累计家庭户 某村居民户按子女数分组资料如表所示,求家庭子女数的中位数。单项数列单项数列某企业按日产零件分组如下:某企业按日产零件分组如下:按日产零件分组(件)工人数(人)向上累计向下累计 合计例例组距数列组距数列例例 根据下表资料计算农户年均纯收入中位
36、数。农户年均纯收入(元)户数(户)向上累计向下累计以下以上合计下限公式:上限公式:中位数是一种位置平均数,不受极端值及开口组的影响,具有稳健性。各单位标志值与中位数离差的绝对值之和是个最小值。对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。中位数的特点中位数的特点(一)(一)三者的关系三者的关系七、各种平均数之间的相互关系七、各种平均数之间的相互关系 用同一资料计算的结果,几何平均数大于调和平均数而小于算术平均数,只有当所有变量值都相等时,这三种平均数才相等。f(二)二)三者的关系三者的关系.当总体分布呈对称状态时,三者合而为一当总体分布呈对称状态时,三者合而为一(算术平均
37、数 众数 中位数)f fX X2.2.当总体分布呈非对称状态时当总体分布呈非对称状态时fX所以所以如果,则说明分布右偏(或正偏)如果,则说明分布左偏(或负偏)如果,则说明分布对称当分布只是适当偏态时,三者之间的数量关系是:例例根据卡尔皮尔逊经验公式,还可以推算出:一组工人的月收入众数为元,月收入的算术平均数为元,则月收入的中位数近似值是:(一)平均指标只能适用于同质总体八、平均指标的运用原则八、平均指标的运用原则(二)用组平均数补充说明总平均数(三)用分配数列补充说明平均数第四节第四节 变异指标变异指标 (离散程度)(离散程度).可以衡量平均数代表性的大小 一、变异指标的含义和作用一、变异指标
38、的含义和作用 各变量值远离其中心值的程度,称离中趋势。描述离中趋势用离散指标,也称变异指标,就是综合反映总体各单位标志值差异程度的指标。变异指标的作用:变异指标的作用:离散指标愈大,平均数代表性愈小;离散指标愈小,平均数代表性愈大。甲、乙两学生某次考试成绩列表甲、乙两学生某次考试成绩列表语文语文 数学数学 物理物理 化学化学 政治政治 英语英语甲甲 乙乙例例 甲、乙两学生的平均成绩为分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。供货计划完成百分比()季度总供货计划执行结果
39、一月二月三月企业甲乙例例甲、乙两钢铁企业某年第一季度供货计划完成程度统计表甲、乙两钢铁企业某年第一季度供货计划完成程度统计表 两企业供货计划虽然都完成了,但计划执行的均衡性不同,甲企业按月均衡地完成了规定的季度供货计划,而乙企业则前紧后松,缺乏均衡性。.可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。.确定抽样数目和计算抽样误差的必要依据 常用的离散指标主要有:常用的离散指标主要有:全距、平均差、标准差、方差、变异系数等。全距、平均差、标准差、方差、变异系数等。在抽样推断中,计算抽样平均误差和必要抽样数目的时,都需要方差或标准差。(一)全距()的概念与计算:(
40、一)全距()的概念与计算:二、全距二、全距 R R 全距是总体各单位标志值最大值和最小值之差,用以说明总体中标志值变动范围的大小。最大变量值,或最最大变量值,或最高组上限,或开口高组上限,或开口组假定上限组假定上限最小变量值,或最最小变量值,或最低组下限,或开口低组下限,或开口组假定下限组假定下限 全距数值愈小,反映变量值愈集中,标志变动度愈小;全距数值愈大,反映变量值愈分散,标志变动度愈大。(二)(二)全距的特点全距的特点 优点:计算方便,易于理解。缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。语文数学物理化学政治英语甲 乙例例往往
41、应用于生产过程的质量控制中。往往应用于生产过程的质量控制中。三、平均差三、平均差.(一)平均差(一)平均差()的概念和计算)的概念和计算 平均差是数列中各单位标志值与平均数之间绝对离差的平均数。平均差能够综合反映总体中各单位标志值变动的影响。平均差愈大,表示标志变异度愈大,则平均数代表性愈小;反之,平均差愈小,表示标志变异度愈小,则平均数代表性愈大。平均差的计算:平均差的计算:.未分组资料.分组资料以某车间个工人按日产量编成变量数列的资料:工人按日产量分组(千克)工人数(人)组中值 合 计例例 平均差是根据全部标志值与平均数离差而计算 出的变异指标,能全面反映标志值的差异程度;平均差计算有绝对
42、值符号,不适合代数方法的 演算使其应用受到限制。(二)平均差的特点(二)平均差的特点四、标准差四、标准差 S.D.()S.D.()和方差和方差(一)标准差(一)标准差()概念和计算:)概念和计算:标准差是离差平方平均数的平方根,是方差的平方根,又称“均方差”。其意义与平均差基本相同。.未分组资料.分组资料标准差的计算:标准差的计算:计算计算的一般步骤:的一般步骤:算出每个变量值对平均数的离差;将每个离差平方;计算这些平方数值的算术平均数;把得到的数值开平方,即得到。工人按日产量分组(千克)工人数(人)组中值 以上 合 计例例标准差的简捷法公式标准差的简捷法公式未分组资料未分组资料分组资料分组资
43、料 对同一资料,所求的平均差一般比标准差要小,即.(二)标准差(二)标准差与平均差与平均差.的关系的关系(三)标准差的应用(三)标准差的应用.测度分布偏度.计算标准分.在抽样推断时计算抽样误差。交替标志的标准差n交替标志又叫是非标志。总体中的所有单位,如按某一标志分组,其中一部分具有某种特征,而另一部分不具有该种特征,它们在总体中会交替出现,则称此标志为交替标志。n例如,将全部产品分为合格品与非合格品两组;将全部人口分为男性和女性两组等。n交替标志不是数量标志,而是品质标志,它的表现只有两种:“是”与“非”,或“有”与“无”等。要测定其平均数和标准差,须将标志表现性质上的差异转化为数量表现的差
44、异。n通常以表示总体中具有某种性质的单位的标志值;以表示总体中不具有该种性质的单位的标志值。n例如,将“合格品”用标志值表示,则“不合格品”的标志值为;将“男”的标志值定为,则“女”的标志值就为。通过这种转化,即可计算交替标志的平均数和标准差。设总体单位数为 ,具有某种特征的单位数为 ,不具有某种特征的单位数为 。假设具有某种特征的单位数占总体单位总数的比重为 ,不具有某种特征的单位数占总体单位总数的比重为 。交替标志平均数和标准差计算表交替标志平均数和标准差计算表交替标志值 总体单位比重合计交替标志的算数平均数为:交替标志的标准差为:某工厂生产件产品,其中不合格品件,试求该批产品的平均合格率
45、及其标准差。解:该批产品的平均合格率解:该批产品的平均合格率例例该批产品的标准差五、变异系数五、变异系数 变异系数,也称离散系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。标准差系数计算公式为:标准差系数计算公式为:离散系数值越小,说明平均数代表性就越好;离散系数值越大,说明平均数代表性就越差。例例 而断言甲组离散程度大于乙组,或乙组的平均数代表性高于甲组,都是不妥的。因为这两组的水平相差悬殊,应计算离散系数来比较:分布形状的描述分布形状的描述 集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据是否对称、偏斜的程
46、度以及分布的扁平程度等,也就是数据的分布形状。分布形状的描述用偏度和峰度。一、分布形状及其描述指标一、分布形状及其描述指标 (一)根据未分组的资料计算偏度系数 其计算公式为:其中,是标准差的三次方。偏度是对分布偏斜方向和程度的测度。测度偏斜的程度需计算偏度系数。偏度系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏度系数等于零;如果偏度系数不等于零,表明分布是非对称的。二、偏度系数二、偏度系数 (二)根据分组资料计算偏度系数 根据已分组的资料计算偏度系数,可采用下面的公式:当分布对称时,离差三次方后正负离差可以相互抵消,因而的分子等于零,则;当分布不对称时,正负离差不能抵消,就
47、形成了正或负的偏度系数。当为正值时,表示正偏离差值较大,可以判断为正偏或右偏;反之,当为负值时,表示负偏离差值较大,可以判断为负偏或左偏。在计算时,将离差三次方的平均数除以 是将偏度系数转化为相对数。的数值越大,表示偏斜的程度越大。峰度是分布集中趋势高峰的形状。它通常是与标准正态分布相比较而言的。若分布的形状比标准正态分布更瘦更高,则称为尖峰分布。若比标准正态分布更矮更平则称为平峰分布。对数据分布峰度的度量值,称为峰度系数。(一)根据未分组资料计算峰度系数 在根据未分组数据计算峰度系数时,其计算公式如下:三、峰度系数三、峰度系数(二)根据分组资料计算峰度系数 根据分组数据计算峰度系数是用离差四次方的平均数再除以标准差的四次方,其计算公式如下:公式中将离差的四次方除以 是为了将峰度系数转化为相对数。用峰度系数说明分布的尖峰和扁平程度,是通过与标准正态分布的峰度系数进行比较而言的。标准正态分布的峰度系数为,当时为尖峰分布,当时为扁平分布。某班名女生身高测量数据如下表所示,试求其偏度和峰度。按身高分组()各组人数(人)以下以上合计例例解:、作计算表如下:按身高分组()组中值()人数(人)以下以上合计、计算有关指标:算术平均数标准差偏度系数峰度系数谢谢观赏谢谢观赏!