《第四章数据分布趋势的测定精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章数据分布趋势的测定精选PPT.ppt(114页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章数据分布趋势的测定第1页,此课件共114页哦 一一名名统统计计学学家家遇遇到到一一位位数数学学家家,统统计计学学家家调调侃侃数数学学家家说说道道:“你你们们不不是是说说若若且且,则则吗吗!那那么么想想必必你你若若是是喜喜欢欢一一个个女女孩孩,那那么么那个女孩喜欢的男孩你也会喜欢喽!?那个女孩喜欢的男孩你也会喜欢喽!?”数数学学家家想想了了一一下下反反问问道道:“那那么么你你把把左左手手放放到到一一锅锅一一百百度度的的开开水水中中,右右手手放放到到一一锅锅零零度度的的冰冰水水里里想想来来也也没没事事吧吧!因因为为它它们们平平均均的的温温度度不不过过是是五五十度而已!十度而已!”统计学家与数
2、学家统计学家与数学家 第2页,此课件共114页哦 如果你的腳已經踩在爐子上,如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統計學家會而頭卻在冰箱裡,統計學家會告訴你告訴你,平均而言平均而言,你相當舒你相當舒服。服。调侃统计学家 第3页,此课件共114页哦4.1 4.1 集中趋势的测定集中趋势的测定一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法第4页,此课件共114页哦83名女生的身高名女生的身高分布的集中趋势、分布的集中趋势、中心数值中心数值第四章第四章 数据分布特征的描述数据分布特征的描述算术平均数算术平均数第5页,此课件共114页哦指总体中各单位
3、的次数分布从两边向指总体中各单位的次数分布从两边向中间集中的趋势,中间集中的趋势,用用平均指标平均指标来反映。来反映。集中趋势集中趋势q可以反映现象总体的客观规定性;可以反映现象总体的客观规定性;q可以对比同类现象在不同的时间、地可以对比同类现象在不同的时间、地点和条件下的一般水平;点和条件下的一般水平;q可以分析现象之间的依存关系。可以分析现象之间的依存关系。测定集中趋势的意义:测定集中趋势的意义:指同质总体中各单位某一数指同质总体中各单位某一数量标志的一般水平,是对总量标志的一般水平,是对总体单位间数量差异的抽象化体单位间数量差异的抽象化第四章第四章 数据分布特征的描述数据分布特征的描述第
4、6页,此课件共114页哦4.1 4.1 集中趋势的测定集中趋势的测定一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法第7页,此课件共114页哦二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第8页,此课件共114页哦基本形式:基本形式:例:例:直直接接承承担担者者 注意区分算术平均数与强度相对数注意区分算术平均数与强度相对数算术平均数算术平均数第四章第四章 数据分布特征的描述数据分布特征的描述第9页,此课件共11
5、4页哦A.简单算术平均数简单算术平均数适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为算术平均数为算术平均数;为总体单位总数;为总体单位总数;为第为第 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第10页,此课件共114页哦平均每人日销售额为:平均每人日销售额为:算术平均数的计算方法算术平均数的计算方法某售货小组某售货小组5 5个人,某天的销售额个人,某天的销售额分别为分别为520520元、元、600600元、元、480480元、元、750750元、元、440
6、440元,则元,则【例例】第四章第四章 数据分布特征的描述数据分布特征的描述第11页,此课件共114页哦B.加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过分组整理形成变量数列的分组整理形成变量数列的情况情况式中:式中:为算术平均数为算术平均数;为第为第 组的次数;组的次数;为组为组数;数;为第为第 组的标志值或组中值。组的标志值或组中值。算术平均数的计算方法算术平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第12页,此课件共114页哦【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)
7、101112131470100380150100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第13页,此课件共114页哦解:解:算术平均数的计算方法算术平均数的计算方法若上述资料为组距数列,则应取各组的组若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算;此时求中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。得的算术平均数只是其真值的近似值。说说明明第四章第四章 数据分布特征的描述数据分布特征的描述第14页,此课件共114页哦分
8、析:分析:成绩(分)成绩(分)人数(人)人数(人)甲班甲班乙班乙班丙班丙班603915010013950平均成绩(分)平均成绩(分)619980起到权衡轻重起到权衡轻重起到权衡轻重起到权衡轻重的作用的作用的作用的作用算术平均数的计算方法算术平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述决定平均数的决定平均数的决定平均数的决定平均数的变动范围变动范围变动范围变动范围第15页,此课件共114页哦表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为频率、比重;即公式表现为频率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指变量数列中各组
9、标志值出现的次指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各数,是变量值的承担者,反映了各组的标志值对平均数的影响程度组的标志值对平均数的影响程度权数权数绝对权数绝对权数相对权数相对权数第四章第四章 数据分布特征的描述数据分布特征的描述第16页,此课件共114页哦邱东教授对权数的定义:邱东教授对权数的定义:第四章第四章 数据分布特征的描述数据分布特征的描述第一,权数的数量形式可以是多种多样的,可以是绝对数,也第一,权数的数量形式可以是多种多样的,可以是绝对数,也可以是相对数;可以是结构相对数,也可以是比例相对数;可可以是相对数;可以是结构相对数,也可以是比例相对数;可以取正数,甚
10、至有时也可以取负数。以取正数,甚至有时也可以取负数。第二,权数尽管可以以绝对数或比例相对数的形式出现,但权数的第二,权数尽管可以以绝对数或比例相对数的形式出现,但权数的实质是结构相对数。实质是结构相对数。第三,权数是用来衡量诸内部因素在总体中重要程度的,由于人们是从第三,权数是用来衡量诸内部因素在总体中重要程度的,由于人们是从不同方面来把握重要程度的,因而这个定义就不是把权数仅仅限于频率不同方面来把握重要程度的,因而这个定义就不是把权数仅仅限于频率和同度量因素这一狭窄的范围内。和同度量因素这一狭窄的范围内。权数是以某种数量形式对比、权衡被评价事物总体权数是以某种数量形式对比、权衡被评价事物总体
11、中诸因素相对重要程度的量值。中诸因素相对重要程度的量值。第17页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述曾宪报在其博士学位论文曾宪报在其博士学位论文统计权数论统计权数论中提出了他认为中提出了他认为“简洁性好、概括性强简洁性好、概括性强”、“关于权数的最新认识关于权数的最新认识”的定义:的定义:权数是衡量系统内诸要素相对重要程权数是衡量系统内诸要素相对重要程度的一组数值。度的一组数值。第18页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述权数与加权权数与加权234567819第19页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布
12、特征的描述权数与加权权数与加权234567819第20页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述权数与加权权数与加权234567819第21页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述权数与加权权数与加权234567819 算术平均数的计算取决算术平均数的计算取决于变量值和权数的共同作用:于变量值和权数的共同作用:变量值决定平均数的范围;变量值决定平均数的范围;权数则决定平均数的位置权数则决定平均数的位置.第22页,此课件共114页哦变量值与其算术平均数的离差之变量值与其算术平均数的离差之和衡等于零,即:和衡等于零,即:变量值与其算术平
13、均数的离差平变量值与其算术平均数的离差平方和为最小,即:方和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质第四章第四章 数据分布特征的描述数据分布特征的描述第23页,此课件共114页哦离差的概念离差的概念12345678-1-1-213第四章第四章 数据分布特征的描述数据分布特征的描述第24页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述思考题思考题 比特啤酒公司雇用了比特啤酒公司雇用了468468名员工,其中有名员工,其中有5656名管理人员,名管理人员,130130名行政和技术人员,名行政和技术人员,其余其余282282人是工人。这三组人的周平均工人是
14、工人。这三组人的周平均工资分别是资分别是500500英镑、英镑、300300英镑和英镑和200200英镑。英镑。财务主管希望计算全体员工的平均工资。财务主管希望计算全体员工的平均工资。第25页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述正确的计算方法正确的计算方法第26页,此课件共114页哦二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第27页,此课件共114页哦【例例】设设X=(2,4,6,8),则其调和平均数),则其调和平均数
15、可由定义计算如下:可由定义计算如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值的倒数:,再求倒数:再求倒数:是总体各单位标志值倒数的算术平均是总体各单位标志值倒数的算术平均数的倒数,又叫数的倒数,又叫倒数平均数倒数平均数调和平均数调和平均数harmean(harmonic mean)第四章第四章 数据分布特征的描述数据分布特征的描述第28页,此课件共114页哦A.简单调和平均数简单调和平均数适用于总体资料未经分组适用于总体资料未经分组整理、尚为原始资料的情况整理、尚为原始资料的情况式中:式中:为调和平均数为调和平均数;为变量值为变量值 的个数;的个数;为第为第 个变量值。个变量
16、值。调和平均数的计算方法调和平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第29页,此课件共114页哦B.加权调和平均数加权调和平均数适用于总体资料经过分组适用于总体资料经过分组整理形成变量数列的情况整理形成变量数列的情况式中:式中:为第为第 组的变量值;组的变量值;为第为第 组的标志总量。组的标志总量。调和平均数的计算方法调和平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第30页,此课件共114页哦当已知各组变量值和标志总量时,作当已知各组变量值和标志总量时,作为算术平均数的变形使用。为算术平均数的变形使用。因为:因为:调和平均数的应用调和平均数的应用
17、第四章第四章 数据分布特征的描述数据分布特征的描述第31页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述调和平均数的用途:调和平均数的用途:作为独立意义上的平均数使用作为独立意义上的平均数使用基本上没有用途。基本上没有用途。作为算术平均数的变形使用是其作为算术平均数的变形使用是其常见的用法。但此时已经不能称为调常见的用法。但此时已经不能称为调和平均数,只能称其为和平均数,只能称其为调和平均方调和平均方法法。第32页,此课件共114页哦日产量(件)日产量(件)日产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)1
18、010111112121313141470070011001100456045601950195014001400合计合计合计合计97109710【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和平均数的应用第四章第四章 数据分布特征的描述数据分布特征的描述第33页,此课件共114页哦即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解:解:第四章第四章 数据分布特征的描述数据分布特征的描述第34页,此课件共1
19、14页哦求解比值的平均数的方法求解比值的平均数的方法由于比值(由于比值(平均数或相对数平均数或相对数)不能直接相加,)不能直接相加,求解比值的平均数时,需将其还原为构成求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比比值的分子、分母原值总计进行对比设比值设比值 分子变量分子变量分母变量分母变量则有:则有:第四章第四章 数据分布特征的描述数据分布特征的描述第35页,此课件共114页哦求解比值的平均数的方法求解比值的平均数的方法己知己知 ,采用基本,采用基本平均数公式平均数公式己知己知 ,采用加权算,采用加权算术平均数公式术平均数公式己知己知 ,采用加权调,采用加权调和平均数公
20、式和平均数公式比值比值第四章第四章 数据分布特征的描述数据分布特征的描述第36页,此课件共114页哦【例例A】某季度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下:划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)9090以下以下以下以下9090100100100100110110110110以上以上以上以上858595951051051151152 23 310103 3800800250025001720
21、01720044004400合计合计合计合计18182490024900计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法第四章第四章 数据分布特征的描述数据分布特征的描述第37页,此课件共114页哦【例例A】某季度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下:划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)9090以下以下以下以下9090
22、100100100100110110110110以上以上以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计合计合计18182490024900计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法分析:分析:应采用加权算术平均数公式计算应采用加权算术平均数公式计算第四章第四章 数据分布特征的描述数据分布特征的描述第38页,此课件共114页哦【例例B】某季度某工业公司某季度某工业公司18个工业企业产值计划个工业企业产值计划完成情况如下(按计
23、划完成程度分组):完成情况如下(按计划完成程度分组):组别组别组别组别企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)实际产值实际产值实际产值实际产值(万元)(万元)(万元)(万元)1 12 23 34 42 23 310103 38008002500250017200172004400440068068023752375180601806050605060合计合计合计合计181824900249002617526175计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的
24、方法第四章第四章 数据分布特征的描述数据分布特征的描述第39页,此课件共114页哦【例例B】某季度某工业公司某季度某工业公司18个工业企业产值计划完个工业企业产值计划完成情况如下(按计划完成程度分组):成情况如下(按计划完成程度分组):组别组别组别组别企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)实际产值实际产值实际产值实际产值(万元)(万元)(万元)(万元)1 12 23 34 42 23 310103 38008002500250017200172004400440068068023752375180601806050605
25、060合计合计合计合计181824900249002617526175计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法分析:分析:应采用平均数的基本公式计算应采用平均数的基本公式计算第四章第四章 数据分布特征的描述数据分布特征的描述第40页,此课件共114页哦二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第41页,此课件共114页哦是是N N项变量值连乘积的开项变量值连乘积的开N N次次方
26、根方根几何平均数几何平均数Geomean(geomatric mean)用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度q各个比率或速度的连乘积等于总比率或总各个比率或速度的连乘积等于总比率或总速度;速度;q相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条件:第四章第四章 数据分布特征的描述数据分布特征的描述第42页,此课件共114页哦A.简单几何平均数简单几何平均数适用于总体资料未经分组整适用于总体资料未经分组整理尚为原始资料的情况理尚为原始资料的情况式中:式中:为几何平均数为几何平均数;为变量值的为变量值的个数;个数;为第为第
27、 个变量值。个变量值。几何平均数的计算方法几何平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第43页,此课件共114页哦【例例】某流水生产线有前后衔接的五道工序。某某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为日各工序产品的合格率分别为9595、9292、9090、8585、8080,求整个流水生产线产品的平均合格率。,求整个流水生产线产品的平均合格率。分析:分析:设最初投产设最初投产100A个单位个单位,则,则第一道工序的合格品为第一道工序的合格品为100A0.95;第二道工序的合;第二道工序的合格品为格品为(100A0.95)0.92;第五道工序的合第五
28、道工序的合格品为格品为(100A0.950.920.900.85)0.80;第四章第四章 数据分布特征的描述数据分布特征的描述第44页,此课件共114页哦因该流水线的最终合格品即为第五道工序的因该流水线的最终合格品即为第五道工序的合格品,合格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的连乘该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何积,符合几何平均数的适用条件,故需采用几何平均法计算平均法计算。第四章第
29、四章 数据分布特征的描述数据分布特征的描述第45页,此课件共114页哦因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。解解第四章第四章 数据分布特征的描述数据分布特征的描述第46页,此课件共114页哦思考思考若
30、上题中不是由五道连续作业的工序组成若上题中不是由五道连续作业的工序组成的流水生产线,而是五个的流水生产线,而是五个独立作业的车间独立作业的车间,且各车间的合格率同前,又假定各车间且各车间的合格率同前,又假定各车间的产量相等均为的产量相等均为100100件,求该企业的平件,求该企业的平均合格率。均合格率。几何平均数的计算方法几何平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第47页,此课件共114页哦 因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为:1000.95;第二车间的合格品为:第二车间的合格品为:1000.92;第五车
31、间的合格品为:第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总则该企业全部合格品应为各车间合格品的总和,即和,即总合格品总合格品=1000.95+1000.80几何平均数的计算方法几何平均数的计算方法分析:分析:第四章第四章 数据分布特征的描述数据分布特征的描述第48页,此课件共114页哦不再符合几何平均数的适用条件,需按照求解比不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为值的平均数的方法计算。又因为应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即 第四章第四章 数据分布特征的描述数据分布特征的描述第49页,此课件共114页哦
32、B.加权几何平均数加权几何平均数适用于总体资料经过分组整理适用于总体资料经过分组整理形成变量数列的情况形成变量数列的情况式中:式中:为几何平均数为几何平均数;为第为第 组的次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。几何平均数的计算方法几何平均数的计算方法第四章第四章 数据分布特征的描述数据分布特征的描述第50页,此课件共114页哦【例例】某金融机构以复利计息。近某金融机构以复利计息。近12年来的年利率年来的年利率有有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年为年为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和
33、应为:,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:分析:第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础第四章第四章 数据分布特征的描述数据分布特征的描述第51页,此课件共114页哦则该笔本金则该笔本金12年总的本利率为:年总的本利率为:即即即即1212年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合几何平,符合几何平,符合几何平,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均数的
34、适用条件,故计算平均年本利率应采用几何平均数的适用条件,故计算平均年本利率应采用几何平均数的适用条件,故计算平均年本利率应采用几何平均法。均法。均法。均法。解解第四章第四章 数据分布特征的描述数据分布特征的描述第52页,此课件共114页哦几何平均数的计算方法几何平均数的计算方法思思考考若上题中不是按复利而是按若上题中不是按复利而是按单利单利计息计息,且各年的利率与上相同,且各年的利率与上相同,求平均年利率。求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:,则
35、各年末应得利息为:第四章第四章 数据分布特征的描述数据分布特征的描述第53页,此课件共114页哦则该笔本金则该笔本金12年应得的利息总和为:年应得的利息总和为:=V(0.034+0.052+0.151)这里的利息率或本利率不再符合几何平均这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方数的适用条件,需按照求解比值的平均数的方法计算。因为法计算。因为假定本假定本金为金为V 第四章第四章 数据分布特征的描述数据分布特征的描述第54页,此课件共114页哦所以,应采用加权算术平均数公式计算平均年利所以,应采用加权算术平均数公式计算平均年利息率,即:息率,即:解:解:第四章第
36、四章 数据分布特征的描述数据分布特征的描述(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为6.85)第55页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述就同一资料计算时,有:就同一资料计算时,有:第56页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述设设 x 取值为:取值为:、10算术平均与几何平均更为常用一些,算术平均与几何平均更为常用一些,其中几何平均数对小的极端值敏感,其中几何平均数对小的极端值敏感,算术平均数对大的极端值敏感。算术平均数对大的极端值敏感。第57页,此课件共114页哦是否为比率是否为比率或速度或速度各个
37、比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解比值的平均数的方法求解比值的平均数的方法数值平均数计算公数值平均数计算公数值平均数计算公数值平均数计算公式的选用顺序式的选用顺序式的选用顺序式的选用顺序指标指标第四章第四章 数据分布特征的描述数据分布特征的描述第58页,此课件共114页哦二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数
38、数值平均数位置平均数位置平均数第59页,此课件共114页哦将总体各单位标志值按大小顺将总体各单位标志值按大小顺序排列后,指处于数列中间位序排列后,指处于数列中间位置的标志值,用置的标志值,用 表示表示中位数中位数(Median)Median)不受极端数值的影响,在总体标志值差异不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。很大时,具有较强的代表性。中位数的作用:中位数的作用:二、平均指标的种类及计算方法二、平均指标的种类及计算方法第60页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述 如果统计资料中含有如果统计资料中含有异常的或极端的数异常的或极端的数据
39、,就有可能得到据,就有可能得到非典型的甚至可能非典型的甚至可能产生误导的平均数,产生误导的平均数,这时使用中位数来这时使用中位数来度量集中趋势比较度量集中趋势比较合适。合适。比如有比如有5 5笔付款:笔付款:9 9元,元,1010元,元,1010元,元,1111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。很明显,这并不很明显,这并不是一个好的代表是一个好的代表值,而中位数值,而中位数1010元是一个更好的元是一个更好的代表值。代表值。第61页,此课件共114页哦中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例
40、A A】某售货小组某售货小组5 5个人,某天的销售额按从个人,某天的销售额按从小到大的顺序排列为小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)第四章第四章 数据分布特征的描述数据分布特征的描述第62页,此课件共114页哦中位数的位次为:中位数的位次为:中位数应为第中位数应为第3和第和第4个单位标志值的算术平均数,个单位标志值的算术平均数,即即【例例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排
41、列为440440元、元、480480元、元、520520元、元、600600元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)第四章第四章 数据分布特征的描述数据分布特征的描述第63页,此课件共114页哦【例例C C】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位
42、次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)第四章第四章 数据分布特征的描述数据分布特征的描述第64页,此课件共114页哦中位数的确定中位数的确定(组距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。第四章第四章 数据分布特征的描述数据分布特征的描述第65页,此课件共114页哦中位数的确定
43、中位数的确定(组距数列)(组距数列)共共 个单位个单位共共 个单位个单位共共 个单位个单位共共 个单位个单位LU中位数组中位数组中位数组中位数组组距为组距为d共共 个单位个单位假定该组内的单位假定该组内的单位假定该组内的单位假定该组内的单位呈均匀分布呈均匀分布呈均匀分布呈均匀分布共有单位数共有单位数 中位数下限公式为中位数下限公式为 该段长度应为该段长度应为 第四章第四章 数据分布特征的描述数据分布特征的描述第66页,此课件共114页哦二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值
44、平均数位置平均数位置平均数第67页,此课件共114页哦指总体中出现次数最多的变量指总体中出现次数最多的变量值,用值,用 表示表示,它不受极端数它不受极端数值的影响,用来说明总体中大值的影响,用来说明总体中大多数单位所达到的一般水平。多数单位所达到的一般水平。众数众数(Mode)(Mode)二、平均指标的种类及计算方法二、平均指标的种类及计算方法第68页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和零比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感售商在做有关生产或存货的决策时,更感兴趣
45、的是最普遍的尺寸而不是平均尺寸。兴趣的是最普遍的尺寸而不是平均尺寸。第69页,此课件共114页哦日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800【例例A A】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。第四章第四章 数据分布特征的描述数据分布特征的描述第70页,此课件共114页哦众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产
46、量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。第71页,此课件共114页哦众数的原理及应用众数的原理及应用83名女生身高原始数据名女生身高原始数据83名女生身高组距数列名女生身高组距数列第四章第四章 数据分布特征的描述数据分布特征的描述第72页,此课件共114页哦q当数据分布存在明显的集中趋势,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;且有显著的极端值时,适合使用众数;q当数
47、据分布的集中趋势不明显或存当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使在两个以上分布中心时,不适合使用众数(用众数(前者无众数,后者为双众数前者无众数,后者为双众数或多众数,等于没有众数或多众数,等于没有众数)。)。众数的原理及应用众数的原理及应用第四章第四章 数据分布特征的描述数据分布特征的描述第73页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200413名学生出生时间分布直方图名学生出生时间分布直方图众数的原理及应用众数的原
48、理及应用没有突出地集没有突出地集中在某个年份中在某个年份第74页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100众数的原理及应用众数的原理及应用413名学生的身高分布直方图名学生的身高分布直方图出现了两个明显出现了两个明显的分布中心的分布中心第75页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述形
49、状形状 Shape表明数据是如何表明数据是如何分布分布的的偏态偏态Skew Skew 与与 对称对称SymmetrySymmetry左偏左偏:均值均值 中位数中位数对称对称(零偏度零偏度):均值:均值 =中位数中位数右偏的右偏的左偏的左偏的对称的对称的均值均值=中位数中位数=众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值第76页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述 位置测度的一种常用方法:位置测度的一种常用方法:百分位数百分位数(Percentile)概念:概念:第第p p个百分位数是这样的数值:至少有个百分位数是这样的数值:至少有p
50、%p%个个数值跟它一样大或比它小;至少有数值跟它一样大或比它小;至少有(100(100p)%p)%个数个数值跟它一样大或比它大。值跟它一样大或比它大。例如,一个考生入学考试的口语成绩是例如,一个考生入学考试的口语成绩是5454分,对应分,对应第第7070个百分位数,我们就可以知道大约有个百分位数,我们就可以知道大约有70%70%的考生的考生成绩比他低,或者说大约有成绩比他低,或者说大约有30%30%的考生成绩比他高。的考生成绩比他高。第77页,此课件共114页哦第四章第四章 数据分布特征的描述数据分布特征的描述 位置测度的另一种常用方法:位置测度的另一种常用方法:四分位数四分位数(Quarti