《统计数据特征值的度量幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计数据特征值的度量幻灯片.ppt(97页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计数据特征值的度量第1页,共97页,编辑于2022年,星期二基本形式:基本形式:例:例:直直接接承承担担者者 注意区分算术平均数与强度相对数注意区分算术平均数与强度相对数算术平均数算术平均数第2页,共97页,编辑于2022年,星期二STATSTAT算术平均数算术平均数83名女生的身高名女生的身高变量一般变量一般水平、代水平、代表性数值表性数值分布的集分布的集中趋势、中趋势、中心数值中心数值算术平均数算术平均数第3页,共97页,编辑于2022年,星期二算术平均数的计算算术平均数的计算算术平均数算术平均数=总体标志总量总体标志总量总体单位总数总体单位总数数据集数据集数据个数数据个数 N简单算术平
2、均数简单算术平均数第4页,共97页,编辑于2022年,星期二A.简单算术平均数简单算术平均数 适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为算术平均数为算术平均数;为总体单位总数;为总体单位总数;为第为第i i 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法第5页,共97页,编辑于2022年,星期二平均每人日销售额为:平均每人日销售额为:算术平均数的计算方法算术平均数的计算方法某售货小组某售货小组5 5个人,某天的销售额个人,某天的销售额分别为分别为520520元、元、600600元、元、480480元、元、
3、750750元、元、440440元,则元,则【例】【例】第6页,共97页,编辑于2022年,星期二B.加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过分组整理形成变量数列的分组整理形成变量数列的情况情况式中:式中:为算术平均数为算术平均数;为第为第 组的次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。算术平均数的计算方法算术平均数的计算方法第7页,共97页,编辑于2022年,星期二【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)1011121314701003801
4、50100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法第8页,共97页,编辑于2022年,星期二解:解:算术平均数的计算方法算术平均数的计算方法若上述资料为组距数列,则应取各组的若上述资料为组距数列,则应取各组的组组中值中值作为该组的代表值用于计算;此时求作为该组的代表值用于计算;此时求得的算术平均数只是其真值的得的算术平均数只是其真值的近似值近似值。说说明明第9页,共97页,编辑于2022年,星期二分析:分析:成绩(分)成绩(分)人数(人)人数(人)甲班甲班乙班乙班丙班丙班603915010013950平均成绩
5、(分)平均成绩(分)619980起到权衡轻重起到权衡轻重起到权衡轻重起到权衡轻重的作用的作用的作用的作用算术平均数的计算方法算术平均数的计算方法决定平均数的决定平均数的变动范围变动范围第10页,共97页,编辑于2022年,星期二表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为频率、比重;即公式表现为频率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指变量数列中各组标志值出现的次指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各数,是变量值的承担者,反映了各组的标志值对平均数的影响程度组的标志值对平均数的影响程度权数权数绝对权数绝对权数相
6、对权数相对权数第11页,共97页,编辑于2022年,星期二234567819权数与加权权数与加权234567819第12页,共97页,编辑于2022年,星期二权数与加权权数与加权234567819第13页,共97页,编辑于2022年,星期二权数与加权权数与加权234567819第14页,共97页,编辑于2022年,星期二权数与加权权数与加权234567819第15页,共97页,编辑于2022年,星期二权数与加权权数与加权234567819算术平均数的计算取决于变量算术平均数的计算取决于变量值和权数的共同作用:值和权数的共同作用:变量值决定平均数的范围;变量值决定平均数的范围;权数则决定平均数的
7、位置权数则决定平均数的位置第16页,共97页,编辑于2022年,星期二变量值与其算术平均数的离差之和变量值与其算术平均数的离差之和衡等于零,即:衡等于零,即:变量值与其算术平均数的离差平方变量值与其算术平均数的离差平方和为最小,即:和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质第17页,共97页,编辑于2022年,星期二离差的概念离差的概念12345678-1-1-213第18页,共97页,编辑于2022年,星期二【例】【例】设设X=(2,4,6,8),则其调和平均数可),则其调和平均数可由定义计算如下:由定义计算如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值
8、的倒数:,再求倒数:再求倒数:是总体各单位标志值倒数的算术平均是总体各单位标志值倒数的算术平均数的倒数,又叫数的倒数,又叫倒数平均数倒数平均数调和平均数调和平均数第19页,共97页,编辑于2022年,星期二A.简单调和平均数简单调和平均数适用于总体资料未经分适用于总体资料未经分组整理、尚为原始资料的情组整理、尚为原始资料的情况况式中:式中:为调和平均数为调和平均数;为变量值为变量值 的个数;的个数;为第为第 个变量值。个变量值。调和平均数的计算方法调和平均数的计算方法第20页,共97页,编辑于2022年,星期二B.加权调和平均数加权调和平均数适用于总体资料经过分适用于总体资料经过分组整理形成变
9、量数列的情组整理形成变量数列的情况况式中:式中:为第为第 组的变量值;组的变量值;为第为第 组的标志总量。组的标志总量。调和平均数的计算方法调和平均数的计算方法第21页,共97页,编辑于2022年,星期二当己知各组变量值和标志总量时,作当己知各组变量值和标志总量时,作为算术平均数的变形使用。为算术平均数的变形使用。因为:因为:调和平均数的应用调和平均数的应用第22页,共97页,编辑于2022年,星期二x、f 为已知为已知若只知若只知 x 和和xf,而,而f 未未知,则不能使用加权知,则不能使用加权算术平均方式,只能使用其变形即加权调和算术平均方式,只能使用其变形即加权调和平均方式平均方式。苹果
10、苹果 单价单价 购买量购买量 总金额总金额 品种品种 (元)(公斤)(元)(公斤)(元)(元)红富士红富士 2 3 6青香蕉青香蕉 1.8 5 9 第23页,共97页,编辑于2022年,星期二日产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)1010111112121313141470070011001100456045601950195014001400合计合计97109710【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和平均数的应用第24页,共97页,
11、编辑于2022年,星期二即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解解第25页,共97页,编辑于2022年,星期二比值比值的平均数的计算方法的平均数的计算方法由于比值(由于比值(平均数或相对数平均数或相对数)不能直接相加,)不能直接相加,求解比值的平均数时,需将其还原为构成求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比比值的分子、分母原值总计进行对比设比值设比值 分子变量分子变量分母变量分母变量则有:则有:第26页,共97页,编辑于2022年,星期二己知己知 ,采用基本平均采用基本平均数公式数
12、公式己知己知己知己知 ,采,采,采,采用加权算术平均数用加权算术平均数用加权算术平均数用加权算术平均数公式公式公式公式己知己知己知己知 ,采,采,采,采用加权调和平均数用加权调和平均数用加权调和平均数用加权调和平均数公式公式公式公式比值比值比值比值的平均数的计算方法的平均数的计算方法第27页,共97页,编辑于2022年,星期二【例【例A】某季度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下:划完成情况如下:计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)90以下以下90100100110110以上以上859510
13、5115231038002500172004400合计合计1824900计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。比值比值的平均数的计算方法的平均数的计算方法第28页,共97页,编辑于2022年,星期二【例【例A】某季度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下:划完成情况如下:计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)90以下以下90100100110110以上以上8595105115231038002500172004400合计合计1824900计算该公司该季度的平均计
14、划完成程度。计算该公司该季度的平均计划完成程度。分析:分析:应采用加权算术平均数公式计算应采用加权算术平均数公式计算比值比值的平均数的计算方法的平均数的计算方法第29页,共97页,编辑于2022年,星期二【例【例B】某季度某工业公司某季度某工业公司18个工业企业产值计划个工业企业产值计划完成情况如下(按计划完成程度分组):完成情况如下(按计划完成程度分组):组别组别企业数企业数(个)(个)计划产值计划产值(万元)(万元)实际产值实际产值(万元)(万元)12342310380025001720044006802375180605060合计合计182490026175计算该公司该季度的平均计划完成
15、程度。计算该公司该季度的平均计划完成程度。比值比值的平均数的计算方法的平均数的计算方法第30页,共97页,编辑于2022年,星期二【例【例B】某季度某工业公司某季度某工业公司18个工业企业产值计划个工业企业产值计划完成情况如下(按计划完成程度分组):完成情况如下(按计划完成程度分组):组别组别企业数企业数(个)(个)计划产值计划产值(万元)(万元)实际产值实际产值(万元)(万元)12342310380025001720044006802375180605060合计合计182490026175计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的
16、平均数的方法分析:分析:应采用平均数的基本公式计算应采用平均数的基本公式计算第31页,共97页,编辑于2022年,星期二是是N项变量值连乘积的开项变量值连乘积的开N次方根。次方根。几何平均数几何平均数用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度应用:应用:q各个比率或速度的连乘积等于总比率各个比率或速度的连乘积等于总比率或总速度;或总速度;q相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条件:第32页,共97页,编辑于2022年,星期二A.简单几何平均数简单几何平均数适用于总体资料未经分组整适用于总体资料未经分组整理尚为原始资
17、料的情况理尚为原始资料的情况式中:式中:为几何平均数为几何平均数;为变量值的为变量值的个数;个数;为第为第 个变量值。个变量值。几何平均数的计算方法几何平均数的计算方法第33页,共97页,编辑于2022年,星期二【例】【例】某流水生产线有前后衔接的五道工序。某某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为日各工序产品的合格率分别为9595、9292、9090、8585、8080,求整个流水生产线产品的平均合格,求整个流水生产线产品的平均合格率。率。分析:分析:设最初投产设最初投产100A个单位个单位,则,则第一道工序的合格品为第一道工序的合格品为100A0.95;第二道工序的合
18、格品为第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为第五道工序的合格品为(100A0.950.920.900.85)0.80;第34页,共97页,编辑于2022年,星期二因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的连该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用乘积,符合几何平均数的适用条件,故需采
19、用几何平均法计算几何平均法计算。第35页,共97页,编辑于2022年,星期二因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。解:解:第36页,共97页,编辑于2022年,星期二思考思考若上题中不是由五道连续作业
20、的工序组若上题中不是由五道连续作业的工序组成的流水生产线,而是五个成的流水生产线,而是五个独立作业的独立作业的车间车间,且各车间的合格率同前,又假定各,且各车间的合格率同前,又假定各车间的产量相等均为车间的产量相等均为100100件,求该企业的平件,求该企业的平均合格率。均合格率。几何平均数的计算方法几何平均数的计算方法第37页,共97页,编辑于2022年,星期二 因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为:1000.95;第二车间的合格品为:第二车间的合格品为:1000.92;第五车间的合格品为:第五车间的合格品为:1000.80。则该企
21、业全部合格品应为各车间合格品的总则该企业全部合格品应为各车间合格品的总和,即和,即总合格品总合格品=1000.95+1000.80几何平均数的计算方法几何平均数的计算方法分析:分析:第38页,共97页,编辑于2022年,星期二不再符合几何平均数的适用条件,需按照求解不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为比值的平均数的方法计算。又因为应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即第39页,共97页,编辑于2022年,星期二B.加权几何平均数加权几何平均数适用于总体资料经过分组整理适用于总体资料经过分组整理形成变量数列的情况形成变量数列的情况式中:
22、式中:为几何平均数为几何平均数;为第为第 组的次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。几何平均数的计算方法几何平均数的计算方法第40页,共97页,编辑于2022年,星期二【例】【例】某金融机构以复利计息。近某金融机构以复利计息。近12年来的年利率有年来的年利率有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年为年为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和应为:,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:分
23、析:第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础第41页,共97页,编辑于2022年,星期二则该笔本金则该笔本金12年总的本利率为:年总的本利率为:即即1212年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合几何平,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均均数的适用条件,故计算平均年本利率应采用几何平均法。法。解:解:第42页,共97页,编辑于2022年,星期二几何平均数的计算方法几何平均数的计算方法思思考考若上题中不是按复利而是按若上题中不是按复利而是按单利单利计息计息,
24、且各年的利率与上相同,且各年的利率与上相同,求平均年利率。求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:,则各年末应得利息为:第43页,共97页,编辑于2022年,星期二则该笔本金则该笔本金12年应得的利息总和为:年应得的利息总和为:=V(0.034+0.052+0.151)这里的利息率或本利率不再符合几何平均数这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计的适用条件,需按照求解比值的平均数的方法计算。因为算。因为假定本假
25、定本金为金为V 第44页,共97页,编辑于2022年,星期二所以,应采用加权算术平均数公式计算平均年所以,应采用加权算术平均数公式计算平均年利息率,即:利息率,即:解:解:(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为6.85)第45页,共97页,编辑于2022年,星期二是否为比率是否为比率或速度或速度各个比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解比值的平均数的方法求解比值的平均数的方法数值平均数计算公数值平均
26、数计算公数值平均数计算公数值平均数计算公式的选用顺序式的选用顺序式的选用顺序式的选用顺序指标指标第46页,共97页,编辑于2022年,星期二将总体各单位标志值按大小顺序排列后,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用指处于数列中间位置的标志值,用 表表示示中位数中位数不受极端数值的影响不受极端数值的影响,在总体标志值差异很大时,在总体标志值差异很大时,具有较强的代表性。具有较强的代表性。中位数的作用:中位数的作用:位置平均数位置平均数中位数把标志值数列分为两个部分中位数把标志值数列分为两个部分,一部分标志一部分标志值小于或等于它值小于或等于它,另一部分标志值大于或等于
27、它另一部分标志值大于或等于它.第47页,共97页,编辑于2022年,星期二中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例【例A A】某售货小组某售货小组5 5个人,某天的销售额按从个人,某天的销售额按从小到大的顺序排列为小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)第48页,共97页,编辑于2022年,星期二中位数的位次为中位数的位次为中位数应为第中位数应为第3和第和第4个单位标志值的算术平均个单位标志值的算术平均数,即
28、数,即【例【例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)第49页,共97页,编辑于2022年,星期二【例【例C C】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)101112131470100380150100701705507008
29、00合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)第50页,共97页,编辑于2022年,星期二中位数的确定中位数的确定(组距数列)(组距数列)【例【例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。第51页,共97页
30、,编辑于2022年,星期二中位数的确定中位数的确定(组距数列)(组距数列)共共 个单位个单位共共 个单位个单位共共 个单位个单位共共 个单位个单位LU中位数组中位数组中位数组中位数组组距为组距为d共共 个单位个单位假定该组内的单假定该组内的单位呈均匀分布位呈均匀分布共有单位数共有单位数 中位数下限公式为中位数下限公式为 该段长度应为该段长度应为 第52页,共97页,编辑于2022年,星期二中位数一定存在;中位数一定存在;中位数与算术平均数相近;中位数与算术平均数相近;中位数不受极端值影响;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。变量值与中位数离差绝对值之和最小。中位数的作用及用
31、法中位数的作用及用法第53页,共97页,编辑于2022年,星期二中位数一定存在;中位数一定存在;中位数与算术平均数相近;中位数与算术平均数相近;中位数不受极端值影响;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。变量值与中位数离差绝对值之和最小。中位数的作用及用法中位数的作用及用法 变量值变量值34556910中位数中位数 5平均值平均值 6与中位数离差与中位数离差 -2 -1 0 0 1 4 5与平均数离差与平均数离差 -3 -2 -1 -1 0 3 4绝对绝对数值数值之和之和 13 14第54页,共97页,编辑于2022年,星期二指总体中出现次数最多的变量值,用指总体中出现次数最
32、多的变量值,用 表示表示,它不受极端数值的影响,用来说它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。明总体中大多数单位所达到的一般水平。众数众数位置平均数位置平均数第55页,共97页,编辑于2022年,星期二众数(众数(mode):出现次数最多即):出现次数最多即出现频率最高的变量值。出现频率最高的变量值。身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 16
33、9 1 170 5 171 2 172 3 174 1总计总计 83 152 154 154 155 155 156 156 156 156 157 158 158 159 159 160 160 160 160 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 1
34、68 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172 174第56页,共97页,编辑于2022年,星期二众数的确定方法众数的确定方法某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 第57
35、页,共97页,编辑于2022年,星期二 身高身高 人数人数 比重比重 (CM)(人)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100某年级某年级83名女生身高资料名女生身高资料众数的确定方法众数的确定方法概约众数:众数所在概约众数:众数所在组的组中值,在本例组的组中值,在本例为为162.5cm第58页,共97页,编辑于2022年,星期二日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计8
36、00【例【例A A】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。第59页,共97页,编辑于2022年,星期二众数的确定众数的确定(组距数列)(组距数列)【例【例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产
37、量的众数。概约众数概约众数:众数所在组的:众数所在组的组中值,在本例为组中值,在本例为500件件第60页,共97页,编辑于2022年,星期二众数的原理及应用众数的原理及应用83名女生身高原始数据名女生身高原始数据83名女生身高组距数列名女生身高组距数列第61页,共97页,编辑于2022年,星期二q当数据分布存在明显的集中趋势,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;且有显著的极端值时,适合使用众数;q当数据分布的集中趋势不明显或存在当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众前者无众
38、数,后者为双众数或多众数,也等于没有众数数,也等于没有众数)众数的原理及应用众数的原理及应用第62页,共97页,编辑于2022年,星期二出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200没有突出地集没有突出地集中在某个年份中在某个年份413名学生出生时间分布直方图名学生出生时间分布直方图众数的原理及应用众数的原理及应用(无众数)(无众数)第63页,共97页,编辑于2022年,星期二192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166
39、.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100413名学生的身高分布直方图名学生的身高分布直方图(双众数)(双众数)当数据分布呈现出双众数或多众数时,可当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。以断定这些数据来源于不同的总体。出现了两个明出现了两个明显的分布中心显的分布中心第64页,共97页,编辑于2022年,星期二集中趋势弱、集中趋势弱、离散趋势强离散趋势强集中趋势强、集中趋势强、离散趋势弱离散趋势弱第65页,共97页,编辑于2022年,星期二 标志变异指标标志变异指标统计上用来反映总体各单位
40、标志值之统计上用来反映总体各单位标志值之间差异程度大小的综合指标,也称做间差异程度大小的综合指标,也称做标志变动度标志变动度。平均指标是一个代表性数值,它反映总体各单位某一数量标平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。但总体志的一般水平,而把总体各单位之间的差异抽象化了。但总体各单位之间的差异是客观存在的,这种差异也是统计总体的重各单位之间的差异是客观存在的,这种差异也是统计总体的重要特征之一。因此,要全面反映一个总体的特征,还必须测定要特征之一。因此,要全面反映一个总体的特征,还必须测定总体各单位之间总体各单位之间差异程度差异程度。
41、作用作用1、衡量平均指标、衡量平均指标代表性代表性的大小的大小2、反映社会经济活动过程的、反映社会经济活动过程的均衡性均衡性和和稳定性稳定性第66页,共97页,编辑于2022年,星期二测定标志变异度的绝对量指标测定标志变异度的绝对量指标(与原变量值名数相同与原变量值名数相同)测定标志变异度的相对量指标测定标志变异度的相对量指标(表现为无名数表现为无名数)全距全距平均差平均差标准差标准差全距全距系数系数平均差平均差系数系数标准差标准差系数系数标志变异指标的种类标志变异指标的种类第67页,共97页,编辑于2022年,星期二指所研究的数据中,最大值与指所研究的数据中,最大值与最小值之差,又称最小值之
42、差,又称极差极差。全距全距最大变量值或最最大变量值或最高组上限或开口高组上限或开口组假定上限组假定上限最小变量值或最最小变量值或最低组下限或开口低组下限或开口组假定下限组假定下限【例【例A A】某售货小组某售货小组5 5人某天的销售额分别为人某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则标志变异指标的种类标志变异指标的种类第68页,共97页,编辑于2022年,星期二【例【例B B】某季度某工业公司某季度某工业公司1818个工业企个工业企业产值计划完成情况如下:业产值计划完成情况如下:计划完成程度计划完成程度()组中值组
43、中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)90以下以下90100100110110以上以上8595105115231038002500172004400合计合计1824900计算该公司该季度计划完成程度的全距。计算该公司该季度计划完成程度的全距。标志变异指标的种类标志变异指标的种类第69页,共97页,编辑于2022年,星期二q优点优点:计算计算方法简单、易懂;方法简单、易懂;q缺点缺点:易受极端数值的影响,不能全易受极端数值的影响,不能全面反映所有标志值差异大小及分布状面反映所有标志值差异大小及分布状况,准确程度差况,准确程度差往往应用于生产过程的质量控制中往往应用于生产
44、过程的质量控制中全距的特点全距的特点标志变异指标的种类标志变异指标的种类第70页,共97页,编辑于2022年,星期二 简单平均差简单平均差适用于未分组资料适用于未分组资料是各个数据与其算术平均数的离差绝对是各个数据与其算术平均数的离差绝对值的算术平均数,用值的算术平均数,用A.D 表示表示平均差平均差计算公式:计算公式:总体算术总体算术平均数平均数总体单总体单位总数位总数第第 个单位个单位的变量值的变量值标志变异指标的种类标志变异指标的种类第71页,共97页,编辑于2022年,星期二【例【例A】某售货小组某售货小组5个人,某天的销售额分别个人,某天的销售额分别为为440元、元、480元、元、5
45、20元、元、600元、元、750元,求元,求该售货小组销售额的平均差。该售货小组销售额的平均差。解:解:即该售货小组即该售货小组5个人销售额的平均差为个人销售额的平均差为93.6元元标志变异指标的种类标志变异指标的种类第72页,共97页,编辑于2022年,星期二 加权平均差加权平均差适用于分组资料适用于分组资料平均差的计算公式平均差的计算公式总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值第73页,共97页,编辑于2022年,星期二【例【例B】计算下表中某公司职工月工资的平均差计算下表中某公司职工月工资的平均差月工资(元)月工资(
46、元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000第74页,共97页,编辑于2022年,星期二解:解:即该公司职工月工资的平均差为即该公司职工月工资的平均差为138.95元元第75页,共97页,编辑于2022年,星期二q优点优点:不易受极端数值的影响,能综合反映不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;全部单位标志值的实际差异程度;q缺点缺点:用绝对值的形式消除各
47、标志值与算用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。学处理和参与统计分析运算。平均差的特点平均差的特点一般情况下都是通过计算另一种标志一般情况下都是通过计算另一种标志变异指标变异指标标准差,来反映总体内标准差,来反映总体内部各单位标志值的差异状况部各单位标志值的差异状况第76页,共97页,编辑于2022年,星期二 简单标准差简单标准差适用于未分组资料适用于未分组资料是各个数据与其算术平均数的是各个数据与其算术平均数的离差平方的算术平均数的开平离差平方的算术平均数的开平方根,用方根,用 来表示;标准差的来表示;
48、标准差的平方又叫作方差,用平方又叫作方差,用 来表示。来表示。标准差标准差计算公式:计算公式:总体单总体单位总数位总数第第 个单位个单位的变量值的变量值总体算术平总体算术平均数均数第77页,共97页,编辑于2022年,星期二【例【例A】某售货小组某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为440元、元、480元、元、520元、元、600元、元、750元,求该售货元,求该售货小组销售额的标准差。小组销售额的标准差。解:解:(比较:其销售额的平均差为(比较:其销售额的平均差为93.6元)元)即该售货小组销售额的标准差为即该售货小组销售额的标准差为109.62元。元。第78页,共97
49、页,编辑于2022年,星期二 加权标准差加权标准差适用于分组资料适用于分组资料标准差的计算公式标准差的计算公式总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值第79页,共97页,编辑于2022年,星期二【例【例B】计算下表中某公司职工月工资的标准差。计算下表中某公司职工月工资的标准差。月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563
50、052377820合计合计2000第80页,共97页,编辑于2022年,星期二解:解:(比较:其工资的平均差为(比较:其工资的平均差为138.95元)元)即该公司职工月工资的标准差为即该公司职工月工资的标准差为167.9元。元。第81页,共97页,编辑于2022年,星期二由同一资料计算的标准差的结果一般要略大于平均差。由同一资料计算的标准差的结果一般要略大于平均差。证明:当证明:当a,b,c0时,有时,有 标准差的特点标准差的特点q不易受极端数值的影响,能综合反映全部不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;单位标志值的实际差异程度;q用平方的方法消除各标志值与算术平均用平