第四章与第五章精选文档.ppt

上传人:石*** 文档编号:70748581 上传时间:2023-01-27 格式:PPT 页数:41 大小:2.21MB
返回 下载 相关 举报
第四章与第五章精选文档.ppt_第1页
第1页 / 共41页
第四章与第五章精选文档.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《第四章与第五章精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章与第五章精选文档.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章与第五章课件本讲稿第一页,共四十一页第一节 统计平均数的意义和种类 一、统计平均数的意义一、统计平均数的意义 (一)统计平均数的概念(一)统计平均数的概念 将总体各单位之间的数量差异抽象化;是一个代表值,代表总体各单位数量特征一般水平 (二)(二)作作 用用平均指标可以反映总体的一般水平 可以对不同时间和空间的平均指标进行比较 算术平均数可以反映总体分布的集中趋势。本讲稿第二页,共四十一页 二、统计平均数的种类二、统计平均数的种类从计算方法上看,平均指标有两大类:数值平均数:算术平均数、调和平均数、几何平位置平均数:中位数、众数从考核内容上看,有静态平均数和动态平均数本讲稿第三页,共四十

2、一页第二节第二节 统计平均数的计算和分析统计平均数的计算和分析 一、算术平均数一、算术平均数 1、算术平均数的基本公式算术平均数的基本公式算术平均数=总体标志总量总体单位总量从这个基本公式可以看到:分子与分母是同一总体的两个总量指标,分子中的每个标志值须由分母的每一个总体单位来承担。总体标志总量的标志是数量标志。本讲稿第四页,共四十一页2、简单算术平均数、简单算术平均数 3、加权算术平均数、加权算术平均数 例1:有6名学生的英语考试成绩分别为:81、82、85、89、92、93分,则平均考试成绩为:(81+82+85+89+92+93)6=87(分)以公式表示:对于变量数列x1x2x3xn有本

3、讲稿第五页,共四十一页例2:某厂金工车间20名工人加工某种零件的产量资料如下:20名工人零件生产数量分组资料产量(件)人数(人)总产量(件)14151617182485128601288518合计20319以公式表示:对于变量数列x1x2x3xn有本讲稿第六页,共四十一页如果掌握的资料是组距式数列,应先计算各组的组中值以代表该组内各单位的一般水平,而后按上述方法计算其平均数 例3:某贸易公司60名员工月工资分组资料如下:工资(元)组中值x人数(人)f工资总额(元)xf800以下800100010001200120015001500以上700900110013501650614261044200

4、1260028600135006600合计6065500本讲稿第七页,共四十一页 注意注意:权数对算术平均数数值的影响并不取决于各组次数本身绝对数值的大小,而是取决于各组次数占总次数的比重大小(权重)。若标志值小的一方权重大,计算结果就将偏向于小的一方;若标志值大的一方权重大,计算结果就将偏向于大的一方。各组标志值不变,各组次数扩大或缩小相同的倍数,其平均数值不变。如果各组次数相等,加权算术平均数就等于简单算术平均数。在许多情况下,我们可以直接用各组次数占总次数的比重来求加权算术平均数本讲稿第八页,共四十一页例4:某贸易公司60名员工月工资分组资料工资(元)组中值(元)X人数比重(%)/工资比

5、重800以下800100010001200120015001500以上70090011001350165010.023.343.316.76.770.00209.70476.30225.45110.55合计100.01092加权算术平均数不仅受各组标志值x大小的影响,而且受各组次数f多少的影响,它对平均数的影响有权衡轻重的作用,所以又称为权数。本讲稿第九页,共四十一页4、算术平均数的数学性质各个变量值与平均数离差之和等于零证明加权算术平均数简单算术平均数证明本讲稿第十页,共四十一页各个变量值与平均数离差平方之和为最小值证明:设x0为不等于平均数的任意值,则:代入以x0为中心的离差平方和,得本讲

6、稿第十一页,共四十一页平均数的这一性质说明:以任意不为平均数的数值为中心计算的离差平方和总大于以平均数为中心计算的离差平方和,因此,算术平均数是误差最小的总体代表值。本讲稿第十二页,共四十一页 二、调和平均数二、调和平均数根据所掌握的资料不同,调和平均数有简单和加权两种。1、简单调和平均数例5:有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元钱的蔬菜,则当天所买的蔬菜平均价格是多少?以公式表示本讲稿第十三页,共四十一页2、加权调和平均数简单调和平均数是在各标志总量对平均数起同等作用的条件下应用的,但在许多条件下,各标志总量对平均数的作用是不同的 例6 前

7、进化工厂2004年11月购进三批A原料,每批的价格及金额如下:批次价格(元/公斤)x金额(元)m购进数量(公斤)m/x第一批第二批第三批505560110002750018000220500300合计565001020A原料的购入价格和金额资料本讲稿第十四页,共四十一页 3、由相对数或平均数计算平均数由相对数或平均数计算平均数一般原则一般原则:根据算术平均数的基本公式,如果掌握了基本公式的分母资料,缺少分子资料,应以分母资料作权数,采用加权算术平均法;如果掌握了基本公式的分子资料,缺少分母资料,应以分子资料作权数,采用加权调和平均法。本讲稿第十五页,共四十一页 三、几何平均数三、几何平均数它是

8、计算平均比率或平均速度最适用的一种方法。因为几何平均数的数学性质与社会经济现象发展的平均比率和平均速度形成的客观过程是一致的。凡是变量值的连乘积等于总比率或总速度的场合都适宜用几何平均法计算平均比率或平均速度。几何平均数也分简单几何平均数和加权几何平均数两种本讲稿第十六页,共四十一页1 1、简单几何平均数简单几何平均数简单几何平均数是N个变量值(比率)连乘积的N次方根,计算公式为:例8 希望机械厂生产的机床要经过四个连续作业车间才能完成。2003年一季度第一车间铸造产品的合格率为95%,第二车间粗加工产品的合格率为93%,第三车间精加工产品的合格率为90%,第四车间组装的合格率为86%,则该企

9、业的产品合格率为多少?2、加权几何平均数加权几何平均数当计算几何平均数的每个变量值(比率)的次数不相同时,则应用加权几何平均法,其计算公式为:本讲稿第十七页,共四十一页 四、四、位置平均数位置平均数中位数和众数中位数和众数1、中位数中位数由未分组资料确定中位数总体单位数为奇数时:中位数是处在第(n+1)/2项位置的标志值 例10一个科室有9人,年龄分别为24、25、25、26、26、27、28、29、55岁,则中位数为26岁总体单位数为偶数时:中位数是第n/2项和第(n+2)/2项两个标志值的平均数如例10去掉24,则中位数是第4项和第5项标志值26和27的平均数(26+27)2=26.5岁本

10、讲稿第十八页,共四十一页由已分组资料确定中位数单项数列:首先确定中位数位次,f/2;然后确定中位数组,该组的变量值就是中位数组距数列:首先确定中位数位次,f/2;然后按照公式计算中位数下限公式上限公式本讲稿第十九页,共四十一页例112004年某地大学生消费支出调查资料月消费额组中值(元)调查人数(人)累计人数(人)300以下300400400500500600600700700以上250350450550650750801804302207020802606909109801000合计1000 中位数的位置为1000/2=500,可知月消费金额位居第500位的学生在月消费额400500元这个组

11、,中位数为:本讲稿第二十页,共四十一页 2、众数众数(1)根据单项数列确定众数根据单项数列确定众数出现次数最多的变量值即为众数例12:佳美超市2004年3月各种包装的味精销售情况:按包装分组(克)销售量(袋)102550751005001000305235714643172众数为50克本讲稿第二十一页,共四十一页 (2 2)由组距数列计算众数由组距数列计算众数先根据各组次数确定众数所在的组,这时应注意各组组距是否相等,如不等则要考虑组距对次数的影响,然后利用下列公式计算众数。下限公式L:众数组的下限1:众数组次数与下一组次数之差2:众数组次数与上一组次数之差I:众数组的组距上限公式本讲稿第二十

12、二页,共四十一页根据例11资料计算 五、各种平均数之间的关系五、各种平均数之间的关系1、算术平均数和几何平均数、调和平均数的关系 如果根据同一资料计算,则调和平均数最小,几何平均数居中,算术平均数最大,即:算术平均数几何平均数调和平均数例13:有1、3、6、7、9五个数,计算:本讲稿第二十三页,共四十一页2算术平均数和中位数、众数的关系六、计算和应用平均指标应注意的问题六、计算和应用平均指标应注意的问题1、同质性2、总平均数与组平均数结合3、总平均数与分布数列结合4、平均数与典型事例结合5、平均数与变异分析相结合本讲稿第二十四页,共四十一页 第五章第五章 样本数据变异程度测量样本数据变异程度测

13、量一、标志变异指标的概念和作用一、标志变异指标的概念和作用1、概念2、作用(1)标志变异指标是衡量平均数代表性大小的尺度(2)标志变异指标可以反映社会经济活动过程的节奏性和均衡性 二、标志变异测定指标1、极差:总体各单位变量值中最大值与最小值之差极差=最大变量值最小变量值例 14某生产班组26名工人的日产量资料日产量(件)工人数(人)12 14 16 18 20 222 4 8 7 3 2合计26本讲稿第二十五页,共四十一页极差为2212=10(件)对于组距数列:极差=最高一组的上限值最低一组的下限值特点:是描述数据离散程度最简单的测度值,计算简单,易于理解。在实际工作中适用于度量变化比较稳定

14、的现象的离中趋势,常用于检查工业产品质量。只反映两个极端变量值的差距,未考虑中间数据的变异情况。对于开口组则无法计算,不能准确描述数据的离散程度。2、平均差:总体各单位的标志值与其算术平均数离差绝对值的算术平均数。根据掌握的资料不同,计算可分为简单和加权两种。简单平均式在资料未分组或变量数列的次数完全相等时采用本讲稿第二十六页,共四十一页 加权平均式当掌握的资料是经过加工整理的分布数列,应采用加权平均式。如果是组距数列,计算平均差的方法与上述相同,只是先计算组中值,以组中值代表各组变量值。例15 根据例11某地大学生2002年消费情况计算人月消费额的平均差(算术平均数458元)月消费额(元)组

15、中值x人数f300以下300400400500500600600700700以上2503504505506507508018043022070202081088921922921664019440344020420134405840合计100079040本讲稿第二十七页,共四十一页 3、方差和标准差(均方差)方差是总体中各单位标志值与其算术平均数的离差平方的算术平均数。通常以2表示 根据掌握的资料不同,方差的计算分为简单和加权两种简单平均式加权平均式本讲稿第二十八页,共四十一页方差的平方根就是标准差,一般用表示,其计算公式为:简单平均式加权平均式本讲稿第二十九页,共四十一页 例16 根据例11

16、某地大学生2002年消费情况计算人月消费额的方差和标准差(平均458元)月消费额(元)组中值x人数f300以下300400400500500600600700700以上250350450550650750801804302207020-208-108-892192292432641166464846436864852643461120209952027520186208025804801705280合计100011736000本讲稿第三十页,共四十一页计算结果表明,每个大学生的月消费额与平均数相比,平均相差108.33元。方差与标准差用于测度数据的离散程度作用是一致的,但标准差的计量单位与变量

17、值的计量单位相同,其实际意义比方差清楚,所以通常在对社会经济现象进行分析时,更多使用标准差来测度统计数据的差异程度。4、是非标志的标准差在社会经济活动中,常常存在这样的总体,其全部单位由具有某一标志的单位和不具有某一标志的单位两部分组成。这种将总体划分为“有”与“无”或者“是”与“非”的标志被称为是非标志(交替标志)。1表示具有所研究的变量值0表示不具有所研究的变量值N总体单位数N1具有所研究变量值的单位数N0不具有所研究变量值的单位数本讲稿第三十一页,共四十一页这两部分单位数占全部单位数的成数(比重)可表示为:P=N1/N总体中具有所研究变量值的单位数所占的成数;Q=N0/N总体中不具有所研

18、究变量值的单位数所占的成数两个成数之和等于1,即:本讲稿第三十二页,共四十一页现说明用是非标志计算平均数与标准差的方法如下:是非标志x总体单位数(成数)f变量总体单位数xf离差离差平方离差平方加权10PqP01p0-p合计1p是非标志的算术平均数为:本讲稿第三十三页,共四十一页是非标志的标准差为:例17某机械厂铸造车间本月生产6000吨铸件,其中合格品5400吨,不合格品600吨。其是非标志的平均数、标准差、方差计算如下:本讲稿第三十四页,共四十一页5、标志变异系数(离散系数)为了消除变量值平均水平和计量单位不同对离散程度的测度值的影响,需要计算离散系数离散系数通常是就标准差来计算的离散系数离

19、散系数大,说明数据的离散程度大,其平均数的代表性就差;离散系数小,说明数据的离散程度小,其平均数的代表性就大 例18:某公司下属67家连锁超市2002年平均销售额为727.09万元,销售额标准差为65.44万元;同期销售利润平均为87.28万元,销售利润额标准差为12.64万元。比较商品销售额与销售利润的离散程度。本讲稿第三十五页,共四十一页销售额标准差系数利润额标准差系数6、偏态和峰度 (1)偏 态 用以测定一个数列次数分布的非对称程度的统计指标。变量数列的单峰钟形分布有对称分布和非对称分布。相对于频数分布的对称分布,偏度有右偏(正偏)和左偏(负偏)测 定:利用算术平均数与位置平均数的关系

20、绝对偏态 偏态=算术平均数 众数若算术平均数等于众数,则偏态系数等于零,表明这组频数分布是对称的若算术平均数大于众数,则偏态系数等于正值,表明这组频数分布是右偏若算术平均数小于众数,则偏态系数等于负值,表明这组频数分布是左偏本讲稿第三十六页,共四十一页根据例11资料计算可以判断该地大学生消费支出呈右偏分布 算术平均数与位置平均数之差大小受该组变量值水平高低的影响;不同研究总体,若性质、计量单位不同,或性质、计量单位相同但变量值水平不同,其偏态的绝对数也是不可比的 相对偏态 偏态系数:绝对偏态与数列原有的标志值的标准差之比计算公式本讲稿第三十七页,共四十一页例24:根据例11某地大学生消费支出资

21、料计算偏态系数已知平均数为458元,众数454.35元,标准差108.3元,则:表明该地大学生月消费支出的频数分布属于正偏分布,众数对算术平均数的偏斜程度为3.37%,即存在轻微程度的偏态分布在计算偏态系数时,如果公式中的众数不易计算,可用中位数代替已知偏态系数实际上是以标准差为单位的算术平均数与众数的离差,因而其数值的变动范围,一般应在0与+3及0与-3之间;偏态系数为0表示对称分布,+3表示极右偏,-3表示极左偏。本讲稿第三十八页,共四十一页(2)峰度及其测定峰度是用以反映数列分布与正态分布相比尖峭程度的统计指标。峰度有三种形态:正态峰度,尖顶峰度和平顶峰度当频数分布中的频数比较集中于众数

22、的位置,使频数分布曲线较正态分布曲线更为隆起,称为尖顶峰度当频数分布中的频数,对众数来说比较分散,使频数分布曲线较正态分布曲线更为平滑,称为平顶峰度 峰度的测定方法,是以四阶中心距为基础。将四阶中心距除以4,化为相对数,即为峰度的测定值。本讲稿第三十九页,共四十一页思考与练习1.对统计数据的分布特征,应从哪几个方面进行测定?2.什么是权数?权数有哪几种表现形式?哪种权数体现出权数的实质?3.平均差和标准差有什么不同的特点?你认为哪一种指标用于测度数据的变异程度更为合理?4.位置代表值有哪些?这些代表值如何确定?有什么特点?5.峰度系数的计算公式是什么?如何根据峰度系数的值判断频数分布曲线是哪种

23、分布?6.已知某企业职工月工资数据的第一个四分位数725元,第三个四分位数980元,中位数800元。该企业职工月工资额频数分布的偏态系数为多少?是何偏态?本讲稿第四十页,共四十一页7.某企业生产一种产品需顺次经过四个车间,这四个车间3月的废品率分别为1.5%、2.0%、2.5%和1%,该企业该月平均废品率是多少?8.甲、乙两厂生产同种电子元件,抽查其耐用时间的分组资料如下:耐用时间(小时)抽查元件数(只)甲厂乙厂1000以下10001200120014001400以上430115311315合计5050(1)计算并比较哪个厂电子元件平均耐用时间长?(2)计算并比较哪个厂电子元件平均耐用时间差异较大?(3)分别计算两个厂电子元件平均耐用时间的众数和中位数,并判断两个厂电子元件耐用时间分布属于何种分布?本讲稿第四十一页,共四十一页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁