《统计学第五章变量数列分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第五章变量数列分析幻灯片.ppt(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第五章变量数列分析第1页,共110页,编辑于2022年,星期二 该项活动中,每月都有数据统计及分析以用来进行该项活动的调整与实施。如:有一组关于病人进入如:有一组关于病人进入“救助救助”活动的时间长度的数活动的时间长度的数据据:67个样本:时间长度从1天到185天。为了改善频临死亡的病人及其家庭的生活质量救助活动“服务队”:医生家庭健康保健员社会工作者受训志愿者给予病人及家庭一些指导帮助减轻由于疾病、分离等而引起的精神紧张 例例:美国一家具有福利院性质的医院(Barnes Hospital)。第2页,共110页,编辑于2022年,星期二 均值均值(mean):35.7天;中位数中位数(m
2、edian):17天;众数众数(Mode):1天Interpretation:(1)the average time a patient stays in the Program is 35.7 days,or slightly over a month;(2)half of the patients are in the Program 17 days or less and half are in the Program 17 days or more;(3)many patients have a short day in the Program.除了对该组数据进行频数方面的描述和分析外
3、,下面的统计方法在描述数据分布特征及分析方面也很重要:第3页,共110页,编辑于2022年,星期二 第五章第五章 变量数列分析变量数列分析5.1 5.1 集中趋势的测定集中趋势的测定5.2 5.2 离中趋势的测定离中趋势的测定5.3 5.3 分布偏态与峰度分布偏态与峰度第4页,共110页,编辑于2022年,星期二5.1 5.1 集中趋势的测定集中趋势的测定一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法第5页,共110页,编辑于2022年,星期二83名女生的身高名女生的身高分布的集中趋势、分布的集中趋势、中心数值中心数值统计学统计学第五章第五章 变
4、量数列分析变量数列分析算术平均数算术平均数第6页,共110页,编辑于2022年,星期二指总体中各单位的次数分布从两边向指总体中各单位的次数分布从两边向中间集中的趋势,中间集中的趋势,用用平均指标平均指标来反映。来反映。集中趋势集中趋势指同质总体中各单位某一数指同质总体中各单位某一数量标志的一般水平,是对总量标志的一般水平,是对总体单位间数量差异的抽象化体单位间数量差异的抽象化统计学统计学第五章第五章 变量数列分析变量数列分析集中趋势集中趋势是一组数据向某一中心值靠拢的倾向是一组数据向某一中心值靠拢的倾向,测度集中趋势就是寻找数据一般水平的代表值或中心值。不同类型的数据用不同的集中趋势测度值。(
5、定类数据:众数、定序数据:中位数和分位数、定距和定比数据:均值)第7页,共110页,编辑于2022年,星期二5.1 5.1 集中趋势的测定集中趋势的测定一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法第8页,共110页,编辑于2022年,星期二二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第9页,共110页,编辑于2022年,星期二基本形式:基本形式:例:例:直直接接承承担担者者算术平均数(均值)算术平均数(均
6、值)统计学统计学第五章第五章 变量数列分析变量数列分析第10页,共110页,编辑于2022年,星期二A.简单算术平均数简单算术平均数 适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为算术平均数为算术平均数;为总体单位总数;为总体单位总数;为第为第 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第11页,共110页,编辑于2022年,星期二平均每人日销售额为:平均每人日销售额为:算术平均数的计算方法算术平均数的计算方法某售货小组某售货小组5 5个人,某天的销售额个
7、人,某天的销售额分别为分别为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则元,则【例例】统计学统计学第五章第五章 变量数列分析变量数列分析第12页,共110页,编辑于2022年,星期二B.加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过分组整理形成变量数列的分组整理形成变量数列的情况情况式中:式中:为算术平均数为算术平均数;为第为第 组的次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。算术平均数的计算方法算术平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第13页,共110页
8、,编辑于2022年,星期二【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第14页,共110页,编辑于2022年,星期二解:解:算术平均数的计算方法算术平均数的计算方法若上述资料为组距数列,则应取各组的组若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算;此时求中值作为该组的代表值用于
9、计算;此时求得的算术平均数只是其真值的近似值。得的算术平均数只是其真值的近似值。说说明明统计学统计学第五章第五章 变量数列分析变量数列分析第15页,共110页,编辑于2022年,星期二统计学统计学第五章第五章 变量数列分析变量数列分析思考题思考题 比特啤酒公司雇用了比特啤酒公司雇用了468468名员工,其中有名员工,其中有5656名管理人员,名管理人员,130130名行政和技术人员,名行政和技术人员,其余其余282282人是工人。这三组人的周平均工人是工人。这三组人的周平均工资分别是资分别是500500英镑、英镑、300300英镑和英镑和200200英镑。英镑。财务主管希望计算全体员工的平均工
10、资。财务主管希望计算全体员工的平均工资。第16页,共110页,编辑于2022年,星期二统计学统计学第五章第五章 变量数列分析变量数列分析正确的计算方法正确的计算方法第17页,共110页,编辑于2022年,星期二分析:分析:成绩(分)成绩(分)人数(人)人数(人)甲班甲班乙班乙班丙班丙班603915010013950平均成绩(分)平均成绩(分)619980起到权衡轻起到权衡轻起到权衡轻起到权衡轻重的作用重的作用重的作用重的作用算术平均数的计算方法算术平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析决定平均数的决定平均数的决定平均数的决定平均数的变动范围变动范围变动范围变动范围第
11、18页,共110页,编辑于2022年,星期二表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为频率、比重;即公式表现为频率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指变量数列中各组标志值出现的次指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各数,是变量值的承担者,反映了各组的标志值对平均数的影响程度组的标志值对平均数的影响程度权数权数绝对权数绝对权数相对权数相对权数统计学统计学第五章第五章 变量数列分析变量数列分析第19页,共110页,编辑于2022年,星期二变量值与其算术平均数的离差之变量值与其算术平均数的离差之和衡等于零,即:和
12、衡等于零,即:变量值与其算术平均数的离差平变量值与其算术平均数的离差平方和为最小,即:方和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质统计学统计学第五章第五章 变量数列分析变量数列分析第20页,共110页,编辑于2022年,星期二离差的概念离差的概念12345678-1-1-213统计学统计学第五章第五章 变量数列分析变量数列分析第21页,共110页,编辑于2022年,星期二注意:注意:均值容易受到统计数据中个别极端数据的影响,均值容易受到统计数据中个别极端数据的影响,从而使均值代表某组统计数据的从而使均值代表某组统计数据的“平均水平平均水平”时失时失去意义,这时往往用去意义,
13、这时往往用“剔除极端值剔除极端值”的方法加以修的方法加以修正。正。第22页,共110页,编辑于2022年,星期二二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第23页,共110页,编辑于2022年,星期二【例例】设设X=(2,4,6,8),则其调和平均数),则其调和平均数可由定义计算如下:可由定义计算如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值的倒数:,再求倒数:再求倒数:是总体各单位标志值倒数的算术平是总体各单位标志值倒数的算术平均数
14、的倒数,又叫均数的倒数,又叫倒数平均数倒数平均数调和平均数调和平均数统计学统计学第五章第五章 变量数列分析变量数列分析第24页,共110页,编辑于2022年,星期二A.简单调和平均数简单调和平均数适用于总体资料未经分适用于总体资料未经分组整理、尚为原始资料的情组整理、尚为原始资料的情况况式中:式中:为调和平均数为调和平均数;为变量值为变量值 的个数;的个数;为第为第 个变量值。个变量值。调和平均数的计算方法调和平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第25页,共110页,编辑于2022年,星期二B.加权调和平均数加权调和平均数适用于总体资料经过分组适用于总体资料经过分
15、组整理形成变量数列的情况整理形成变量数列的情况式中:式中:为第为第 组的变量值;组的变量值;为第为第 组的标志总量。组的标志总量。调和平均数的计算方法调和平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第26页,共110页,编辑于2022年,星期二当己知各组变量值和标志总量时,作当己知各组变量值和标志总量时,作为算术平均数的变形使用。为算术平均数的变形使用。因为:因为:调和平均数的应用调和平均数的应用统计学统计学第五章第五章 变量数列分析变量数列分析第27页,共110页,编辑于2022年,星期二日产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)1010111
16、112121313141470070011001100456045601950195014001400合计合计97109710【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和平均数的应用统计学统计学第五章第五章 变量数列分析变量数列分析第28页,共110页,编辑于2022年,星期二即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解:解:统计学统计学第五章第五章 变量数列分析变量数列分析第29页,共110页,
17、编辑于2022年,星期二二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第30页,共110页,编辑于2022年,星期二是是N N项变量值连乘积的开项变量值连乘积的开N N次次方根方根几何平均数几何平均数用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度应用:应用:q各个比率或速度的连乘积等于总比率或各个比率或速度的连乘积等于总比率或总速度;总速度;q相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条
18、件:统计学统计学第五章第五章 变量数列分析变量数列分析第31页,共110页,编辑于2022年,星期二A.简单几何平均数简单几何平均数适用于总体资料未经分组整适用于总体资料未经分组整理尚为原始资料的情况理尚为原始资料的情况式中:式中:为几何平均数为几何平均数;为变量值的为变量值的个数;个数;为第为第 个变量值。个变量值。几何平均数的计算方法几何平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第32页,共110页,编辑于2022年,星期二【例例】某流水生产线有前后衔接的五道工序。某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为某日各工序产品的合格率分别为9595、9
19、292、9090、8585、8080,求整个流水生产线产品的平,求整个流水生产线产品的平均合格率。均合格率。分析:分析:设最初投产设最初投产100A个单位个单位,则,则第一道工序的合格品为第一道工序的合格品为100A0.95;第二道工序的合格品为第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为第五道工序的合格品为(100A0.950.920.900.85)0.80;统计学统计学第五章第五章 变量数列分析变量数列分析第33页,共110页,编辑于2022年,星期二因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应
20、为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的连乘该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何积,符合几何平均数的适用条件,故需采用几何平均法计算平均法计算。统计学统计学第五章第五章 变量数列分析变量数列分析第34页,共110页,编辑于2022年,星期二因该流水线的最终合格品即为第五道工序的因该流水线的最终合格品即为第五道工序的合格品,合格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.8
21、50.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的连乘该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何积,符合几何平均数的适用条件,故需采用几何平均法计算平均法计算。解:解:统计学统计学第五章第五章 变量数列分析变量数列分析第35页,共110页,编辑于2022年,星期二思考思考若上题中不是由五道连续作业的工序组若上题中不是由五道连续作业的工序组成的流水生产线,而是五个成的流水生产线,而是五个独立作业的独立作业的车间车间,且各车间的合格率同前,又假定,且各车间的合格率同前,又假定各车间的产量相等均为各车间
22、的产量相等均为100100件,求该企件,求该企业的平均合格率。业的平均合格率。几何平均数的计算方法几何平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第36页,共110页,编辑于2022年,星期二 因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为:1000.95;第二车间的合格品为:第二车间的合格品为:1000.92;第五车间的合格品为:第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总则该企业全部合格品应为各车间合格品的总和,即和,即总合格品总合格品=1000.95+1000.80几何平均数的计算方法几
23、何平均数的计算方法分析:分析:统计学统计学第五章第五章 变量数列分析变量数列分析第37页,共110页,编辑于2022年,星期二不再符合几何平均数的适用条件,需按照求解不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为比值的平均数的方法计算。又因为应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即 统计学统计学第五章第五章 变量数列分析变量数列分析第38页,共110页,编辑于2022年,星期二B.加权几何平均数加权几何平均数适用于总体资料经过分组整理适用于总体资料经过分组整理形成变量数列的情况形成变量数列的情况式中:式中:为几何平均数为几何平均数;为第为第 组的
24、次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。几何平均数的计算方法几何平均数的计算方法统计学统计学第五章第五章 变量数列分析变量数列分析第39页,共110页,编辑于2022年,星期二【例例】某金融机构以复利计息。近某金融机构以复利计息。近12年来的年利率年来的年利率有有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年年为为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和应为:,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:
25、分析:第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础统计学统计学第五章第五章 变量数列分析变量数列分析第40页,共110页,编辑于2022年,星期二则该笔本金则该笔本金12年总的本利率为:年总的本利率为:即即即即1212年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合几何,符合几何,符合几何,符合几何平均数的适用条件,故计算平均年本利率应采用几何平平均数的适用条件,故计算平均年本利率应采用几何平平均数的适用条件,故计算平均年本利率应采用几何平平均数的适用条件,故计算平均年本利率应采用几何平均法。均法。均法。均法。解:解:统计学统计学第五章第五章 变量数列分
26、析变量数列分析第41页,共110页,编辑于2022年,星期二几何平均数的计算方法几何平均数的计算方法思思考考若上题中不是按复利而是按若上题中不是按复利而是按单利单利计息计息,且各年的利率与上相同,且各年的利率与上相同,求平均年利率。求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:,则各年末应得利息为:统计学统计学第五章第五章 变量数列分析变量数列分析第42页,共110页,编辑于2022年,星期二则该笔本金则该笔本金12年应得的利息总和为:年应得的利息总和为:
27、=V(0.034+0.052+0.151)这里的利息率或本利率不再符合几何平均数这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计的适用条件,需按照求解比值的平均数的方法计算。因为算。因为假定本假定本金为金为V 统计学统计学第五章第五章 变量数列分析变量数列分析第43页,共110页,编辑于2022年,星期二所以,应采用加权算术平均数公式计算平均年所以,应采用加权算术平均数公式计算平均年利息率,即:利息率,即:解:解:统计学统计学第五章第五章 变量数列分析变量数列分析(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为6.85)第44页,共110页,
28、编辑于2022年,星期二注:可看作是均值的一种变形注:可看作是均值的一种变形几何平均几何平均等于对数的算术平均等于对数的算术平均调和平均数与算术平均数的区别调和平均数与算术平均数的区别:凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标平均指标分子:标志总量分子:标志总量分母:总体单位总数分母:总体单位总数第45页,共110页,编辑于2022年,星期二价格(元)价格(元)3.32.52.0合计合计销售量(斤)销售量(斤)34512算术平均算术平均求某种商
29、品三种零售价格的平均价格求某种商品三种零售价格的平均价格调和平均调和平均价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)10101030第46页,共110页,编辑于2022年,星期二例例 求求95%、93%、90%的几何平均数的几何平均数(计算误差:(计算误差:0.0007)第47页,共110页,编辑于2022年,星期二是否为比率是否为比率或速度或速度各个比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解比值的平均数的
30、方法求解比值的平均数的方法数值平均数计算公数值平均数计算公数值平均数计算公数值平均数计算公式的选用顺序式的选用顺序式的选用顺序式的选用顺序指标指标统计学统计学第五章第五章 变量数列分析变量数列分析第48页,共110页,编辑于2022年,星期二二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第49页,共110页,编辑于2022年,星期二统计学统计学第五章第五章 变量数列分析变量数列分析 如果统计资料中含如果统计资料中含有异常的或极端的有异常的或极端的数据,就有
31、可能得数据,就有可能得到非典型的甚至可到非典型的甚至可能产生误导的平均能产生误导的平均数,这时使用中位数,这时使用中位数来度量集中趋势数来度量集中趋势比较合适。比较合适。比如有比如有5 5笔付款:笔付款:9 9元,元,1010元,元,1010元,元,1111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。很明显,这并不很明显,这并不是一个好的代表值,是一个好的代表值,而中位数而中位数1010元是元是一个更好的代表一个更好的代表值。值。第50页,共110页,编辑于2022年,星期二将总体各单位标志值按大小顺将总体各单位标志值按大小顺序排列后,指处于数列中间位序排
32、列后,指处于数列中间位置的标志值,用置的标志值,用 表示表示中位数中位数不受极端数值的影响,在总体标志值差异很大时,具有不受极端数值的影响,在总体标志值差异很大时,具有不受极端数值的影响,在总体标志值差异很大时,具有不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。较强的代表性。较强的代表性。较强的代表性。由于均值容易受到统计数据中个别极端由于均值容易受到统计数据中个别极端数据的影响,从而使均值代表某组统计数据的数据的影响,从而使均值代表某组统计数据的“平均水平均水平平”时失去意义,这时用中位数代替均值则更有意义。时失去意义,这时用中位数代替均值则更有意义。中位数的作用:中位数的作
33、用:二、平均指标的种类及计算方法二、平均指标的种类及计算方法第51页,共110页,编辑于2022年,星期二中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例A A】某售货小组某售货小组5 5个人,某天的销售额按个人,某天的销售额按从小到大的顺序排列为从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)统计学统计学第五章第五章 变量数列分析变量数列分析第52页,共110页,编辑于2022年,星期二中位数的位次为:中位数的位次为:
34、中位数应为第中位数应为第3和第和第4个单位标志值的算术平均数,个单位标志值的算术平均数,即即【例例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)统计学统计学第五章第五章 变量数列分析变量数列分析第53页,共110页,编辑于2022年,星期二【例例C C】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工
35、人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)统计学统计学第五章第五章 变量数列分析变量数列分析第54页,共110页,编辑于2022年,星期二中位数的确定中位数的确定(组距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累
36、计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。统计学统计学第五章第五章 变量数列分析变量数列分析第55页,共110页,编辑于2022年,星期二二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数第56页,共110页,编辑于2022年,星期二统计学统计学第五章第五章 变量数列分析变量数列分析有时众数是一个合适的代表值 比如在服装行业中,生产商、批
37、发商和零售比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。的是最普遍的尺寸而不是平均尺寸。第57页,共110页,编辑于2022年,星期二指总体中出现次数最多的变量指总体中出现次数最多的变量值,用值,用 表示表示,它不受极端数它不受极端数值的影响,用来说明总体中大值的影响,用来说明总体中大多数单位所达到的一般水平。多数单位所达到的一般水平。众数众数二、平均指标的种类及计算方法二、平均指标的种类及计算方法第58页,共110页,编辑于2022年,星期二购买五类不同品牌计算机的统计中,得到如表所示的频数分
38、布表。显然,众数,即个人购买最多的计算机品牌是Apple。在这类数据中,在这类数据中,“均值均值”与与“中位数中位数”是没有任何意是没有任何意义的。义的。“众数众数”提供了频数最高的个人电脑购买品牌。提供了频数最高的个人电脑购买品牌。Company Frequency Apple 13 Compaq 12Gateway2000 5 IBM 9Packard Bell 11 第59页,共110页,编辑于2022年,星期二日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800【例例A A】已知已知某企业某日工人的日产量资料如下某企业某日工
39、人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。统计学统计学第五章第五章 变量数列分析变量数列分析第60页,共110页,编辑于2022年,星期二众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。概约众数概
40、约众数:众数所在组的:众数所在组的组中值,在本例为组中值,在本例为500件件第61页,共110页,编辑于2022年,星期二众数的原理及应用众数的原理及应用83名女生身高原始数据名女生身高原始数据83名女生身高组距数列名女生身高组距数列统计学统计学第五章第五章 变量数列分析变量数列分析第62页,共110页,编辑于2022年,星期二q当数据分布存在明显的集中趋势,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;且有显著的极端值时,适合使用众数;q当数据分布的集中趋势不明显或存在当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数两个以上分布中心时,不适合使用众数(前者
41、无众数,后者为双众数或多众前者无众数,后者为双众数或多众数,也等于没有众数数,也等于没有众数)。)。众数的原理及应用众数的原理及应用统计学统计学第五章第五章 变量数列分析变量数列分析第63页,共110页,编辑于2022年,星期二 众数、中位数和均值都是对数据集中趋势的测度,众数、中位数和均值都是对数据集中趋势的测度,1、均值均值由全部数据计算,包含了全部数据的信息,具有良好的数学性质,当数据接近对称分布时,具有较好的代表性;但对于偏态分布,其代表性较差。2、中位数中位数是一组数据中间位置上的代表值,不受数据极端值的影响,对于偏态分布的数据,其代表性要比均值好。3、众数众数是一组数据分布的峰值,
42、是一种位置的代表,当数据的分布具有明显的集中趋势时,尤其对于偏态分布,众数的代表性比均值好。4、对接近正态的分布数据,常用均值均值描述数据的集中趋势;对偏态分布,常用众数众数或中位数中位数描述数据的集中趋势。5、均值均值只适用于定距或定比尺度的数据;定序尺度数据可用中位中位数数或众数众数进行描述,而对定类尺度数据,只能用众数众数进行描述。众数、中位数和均值的应用场合众数、中位数和均值的应用场合第64页,共110页,编辑于2022年,星期二众数、中位数和均值的关系对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数
43、众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值第65页,共110页,编辑于2022年,星期二 第五章第五章 变量数列分析变量数列分析5.1 5.1 集中趋势的测定集中趋势的测定5.2 5.2 离中趋势的测定离中趋势的测定第66页,共110页,编辑于2022年,星期二 课程课程学生学生语文语文 数学数学英语英语总成绩总成绩平均成绩平均成绩甲甲乙乙丙丙6065556565
44、65706575195195195656565单位:分单位:分某班三名同学三门课程的成绩如下:某班三名同学三门课程的成绩如下:请比较三名同学学习成绩的差异。请比较三名同学学习成绩的差异。统计学统计学第五章第五章 变量数列分析变量数列分析第67页,共110页,编辑于2022年,星期二集中趋势弱、集中趋势弱、离中趋势强离中趋势强集中趋势强、集中趋势强、离中趋势弱离中趋势弱统计学统计学第五章第五章 变量数列分析变量数列分析第68页,共110页,编辑于2022年,星期二5.2 5.2 离中趋势的测定离中趋势的测定一、离中趋势的涵义一、离中趋势的涵义 二、标志变异指标的种类及计算二、标志变异指标的种类及
45、计算三、是非标志的标准差及方差三、是非标志的标准差及方差第69页,共110页,编辑于2022年,星期二指总体中各单位标志值背离指总体中各单位标志值背离分布中心的规模或程度,分布中心的规模或程度,用用标志变异指标标志变异指标来反映。来反映。离中趋势离中趋势反映统计数据差异程度的综反映统计数据差异程度的综合指标,也称为合指标,也称为标志变动度标志变动度变异指标值越大,平均指标的代表性越变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大小;反之,平均指标的代表性越大统计学统计学第五章第五章 变量数列分析变量数列分析第70页,共110页,编辑于2022年,星期二例例:如果你是一家制造业公
46、司的供应部门经理,与两家原材料供应商联系供货,两家供应商均表示能在大约两家供应商均表示能在大约10个工作日内供齐所需原材料个工作日内供齐所需原材料。几个月的运转之后,你发现尽管两家供货商供货的平均时间都是大约10天,但他们供货所需天数的分他们供货所需天数的分布情况却是不同的布情况却是不同的(图)。问问:两家供货商按时供货的可信度相同吗?考虑它们直方图的差异,你更两家供货商按时供货的可信度相同吗?考虑它们直方图的差异,你更愿意选择哪家供货商供货呢?愿意选择哪家供货商供货呢?第71页,共110页,编辑于2022年,星期二测定离中趋势的意义测定离中趋势的意义q用来衡量和比较平均数代表性的大小;用来衡
47、量和比较平均数代表性的大小;q用来反映社会经济活动过程的均衡性和用来反映社会经济活动过程的均衡性和节奏性;节奏性;q用来测定变量数列次数分布较正态分布用来测定变量数列次数分布较正态分布的偏离程度。的偏离程度。统计学统计学第五章第五章 变量数列分析变量数列分析第72页,共110页,编辑于2022年,星期二5.2 5.2 离中趋势的测定离中趋势的测定一、离中趋势的涵义一、离中趋势的涵义 二、标志变异指标的种类及计算二、标志变异指标的种类及计算三、是非标志的标准差及方差三、是非标志的标准差及方差第73页,共110页,编辑于2022年,星期二测定标志变异度的绝对量指标测定标志变异度的绝对量指标(与原变
48、量值名数相同与原变量值名数相同)测定标志变异度的相对量指标测定标志变异度的相对量指标(表现为无名数表现为无名数)标志变异指标的种类标志变异指标的种类统计学统计学第五章第五章 变量数列分析变量数列分析全距全距标准差标准差异众比率异众比率四分位差四分位差标准差系数标准差系数第74页,共110页,编辑于2022年,星期二指所研究的数据中,最大值与指所研究的数据中,最大值与最小值之差,又称最小值之差,又称极差极差。全距全距最大变量值或最最大变量值或最高组上限或开口高组上限或开口组假定上限组假定上限最小变量值或最最小变量值或最低组下限或开口低组下限或开口组假定下限组假定下限【例例A A】某售货小组某售货
49、小组5 5人某天的销售额分别为人某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则统计学统计学第五章第五章 变量数列分析变量数列分析第75页,共110页,编辑于2022年,星期二【例例B B】某季度某工业公司某季度某工业公司1818个工业企个工业企业产值计划完成情况如下:业产值计划完成情况如下:计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)90以下以下90100100110110以上以上8595105115231038002500172004400合计合计1824900
50、计算该公司该季度计划完成程度的全距。计算该公司该季度计划完成程度的全距。统计学统计学第五章第五章 变量数列分析变量数列分析第76页,共110页,编辑于2022年,星期二q优点优点:计算方法简单、易懂;计算方法简单、易懂;q缺点缺点:易受极端数值的影响,由于极易受极端数值的影响,由于极差只利用了数据两端的信息,没有差只利用了数据两端的信息,没有反映中间数据的分散状况,因而不反映中间数据的分散状况,因而不能准确描述数据的分散程度。能准确描述数据的分散程度。往往应用于生产过程的质量控制中往往应用于生产过程的质量控制中全距的特点全距的特点统计学统计学第五章第五章 变量数列分析变量数列分析第77页,共1