《统计数据特征的描述.ppt》由会员分享,可在线阅读,更多相关《统计数据特征的描述.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 统计数据特征的描述统计数据特征的描述工商管理学院工商管理学院 康波康波 20082008年年0202月月平平均均值值计算平均数计算平均数位置平均数位置平均数算数平均数算数平均数调和平均数调和平均数几何平均数几何平均数中位数中位数 众众数数 第一节、数据分布集中趋势的描述第一节、数据分布集中趋势的描述 工商管理学院工商管理学院 康波康波 20082008年年0202月月一、算术平均数一、算术平均数(一一)简单算术平均数简单算术平均数 工商管理学院工商管理学院 康波康波 20082008年年0202月月例例1 1、某小组、某小组8 8个学生的统计学考试成绩分别个学生的统计学考试成绩分
2、别为为8080、7272、8484、8888、7575、7373、9090、7878分。则分。则该小组成绩的均值为:该小组成绩的均值为:工商管理学院工商管理学院 康波康波 20082008年年0202月月(二二)加权算术平均数加权算术平均数工商管理学院工商管理学院 康波康波 20082008年年0202月月某地大学生消费支出调查资料某地大学生消费支出调查资料月消费额月消费额(元元)组中值组中值(元元)调查人数调查人数(人人)向上累计人数向上累计人数(人人)300300以下以下300300400400400400500500500500600600600600700700700700以上以上 2
3、50250350350450450550550650650750 750 8080180180430430220220707020 20 80802602606906909109109809801000 1000 合合 计计 1000 1000 例例2 2、假设某地大学生消费支出调查资料如下表,根、假设某地大学生消费支出调查资料如下表,根据表的数据,计算据表的数据,计算10001000个大学生每人每月消费额均个大学生每人每月消费额均值。值。工商管理学院工商管理学院 康波康波 20082008年年0202月月根据公式:根据公式:工商管理学院工商管理学院 康波康波 20082008年年0202月月
4、或或工商管理学院工商管理学院 康波康波 20082008年年0202月月算术平均值的数学性质:算术平均值的数学性质:1 1、各数值与其均值的离差和为零,即、各数值与其均值的离差和为零,即2 2、各数值与其均值的离差平方和最小,即、各数值与其均值的离差平方和最小,即工商管理学院工商管理学院 康波康波 20082008年年0202月月案例:某私人公司老板雇佣了案例:某私人公司老板雇佣了8 8个雇员,每个雇员,每人每周挣人每周挣300300元到元到350350元之间。公司老板每元之间。公司老板每周付给自己周付给自己12501250元。他报告政府劳动部门元。他报告政府劳动部门说他的公司付给雇员的平均工
5、资是每周说他的公司付给雇员的平均工资是每周430430元。元。结论结论 算术平均值受极大值算术平均值受极大值的影响要大过受极小值的影响。的影响要大过受极小值的影响。工商管理学院工商管理学院 康波康波 20082008年年0202月月二、调和平均数二、调和平均数调和平均数也称为倒数平均数。调和平均数也称为倒数平均数。(一一)简单调和平均数简单调和平均数工商管理学院工商管理学院 康波康波 20082008年年0202月月例例3 3、某农产品收购资料如下表所示,求平均、某农产品收购资料如下表所示,求平均收购单价。收购单价。收购单价收购单价(元(元/公斤)公斤)组中值(元)组中值(元)(X X)收购天
6、数收购天数(天)(天)收购额(元)收购额(元)(M M)1818202019195 576000076000020 20 222221213 31470000147000022 22 242423232 218400001840000工商管理学院工商管理学院 康波康波 20082008年年0202月月 本例缺少分母资料,可用加权调和平均法计本例缺少分母资料,可用加权调和平均法计算平均收购单价,故:算平均收购单价,故:解:解:工商管理学院工商管理学院 康波康波 20082008年年0202月月(二二)加权调和平均数加权调和平均数工商管理学院工商管理学院 康波康波 20082008年年0202月月
7、例例5 5、根据下表的数据计算、根据下表的数据计算1818个连锁商店平均个连锁商店平均销售额计划完成程度。销售额计划完成程度。某年度某公司某年度某公司1818个连销商店销售额计划完成程度分组资料个连销商店销售额计划完成程度分组资料销售额计划销售额计划完成程度完成程度()组中值组中值()企业数企业数(个个)实际销售额实际销售额(万元万元)计划销售额计划销售额(万元万元)808090 90 9090100 100 100100110 110 110110120 120 85 85 95 95 105 105 115 115 7 73 310103 3680 680 2375 2375 18060
8、18060 5060 5060 800 800 2500 2500 17200 17200 4400 4400 合合 计计 181826175 26175 24900 24900 工商管理学院工商管理学院 康波康波 20082008年年0202月月(1)(1)已知各个连销商店的计划销售额和实际销售额。已知各个连销商店的计划销售额和实际销售额。则:则:工商管理学院工商管理学院 康波康波 20082008年年0202月月(2)(2)已知各个商店的计划销售额和计划完成百分已知各个商店的计划销售额和计划完成百分数,而假设未知实际销售额。则:数,而假设未知实际销售额。则:工商管理学院工商管理学院 康波康
9、波 20082008年年0202月月(3)(3)已知各个商店的实际销售额和计划完成已知各个商店的实际销售额和计划完成百分数,而假设未知计划销售额。则:百分数,而假设未知计划销售额。则:工商管理学院工商管理学院 康波康波 20082008年年0202月月三、几何平均数三、几何平均数(一一)简单几何平均数简单几何平均数例例6 6、某机械厂有、某机械厂有4 4个连续作业的车间:个连续作业的车间:毛坯车间(一车间)、粗加工车间(二毛坯车间(一车间)、粗加工车间(二车间)、精加工车间(三车间)和装配车间)、精加工车间(三车间)和装配车间(四车间)。本月份,各个车间的车间(四车间)。本月份,各个车间的产品
10、合格率分别为:一车间产品合格率分别为:一车间95%95%,二车间,二车间90%90%,三车间,三车间92%92%,四车间,四车间85%85%。求。求4 4个车个车间的平均合格率。间的平均合格率。工商管理学院工商管理学院 康波康波 20082008年年0202月月解:总合格率解:总合格率=95%=95%90%90%92%92%85%=66.86%85%=66.86%。若用算术平均法计算,则有:若用算术平均法计算,则有:但但正确方法是:正确方法是:工商管理学院工商管理学院 康波康波 20082008年年0202月月(二二)加权几何平均数加权几何平均数工商管理学院工商管理学院 康波康波 200820
11、08年年0202月月四、中位数四、中位数(Median)(Median)(一一)由未分组资料确定中位数由未分组资料确定中位数中位数中位数 =n n为奇数为奇数n n为偶数为偶数工商管理学院工商管理学院 康波康波 20082008年年0202月月例例7 7、19901990年我国饮料制造行业按利税总额排序,前年我国饮料制造行业按利税总额排序,前1010名企业的名企业的利税总额资料如下:利税总额资料如下:序号序号 企业名称企业名称 利税总额(百万元)利税总额(百万元)1 1 山西杏花村汾酒厂山西杏花村汾酒厂 200200 2 2 四川宜宾五粮液酒厂四川宜宾五粮液酒厂 8181 3 3 贵州茅台酒长
12、贵州茅台酒长 8080 4 4 上海中美饮料食品有限公司上海中美饮料食品有限公司 7777 5 5 沈阳啤酒厂沈阳啤酒厂 6666 6 6 青岛啤酒厂青岛啤酒厂 6565 7 7 陕西省西风酒厂陕西省西风酒厂 6161 8 8 广东山水健力宝饮料厂广东山水健力宝饮料厂 5454 9 9 安徽毫州市古井酒厂安徽毫州市古井酒厂 515110 10 四川泸州老窖酒厂四川泸州老窖酒厂 4949 根据上述资料,确定这根据上述资料,确定这1010名企业利税总额的中位数。名企业利税总额的中位数。工商管理学院工商管理学院 康波康波 20082008年年0202月月因为当因为当n=n=偶数,所以偶数,所以工商管
13、理学院工商管理学院 康波康波 20082008年年0202月月(二二)由组距数列确定中位数由组距数列确定中位数组别组别组限组限次数次数累计次数累计次数1 12 2i-1i-1i ii+1i+1k k其中累计次数为向上累计。其中累计次数为向上累计。工商管理学院工商管理学院 康波康波 20082008年年0202月月(下限公式)(下限公式)(上限公式)(上限公式)设设n/2n/2位置上的数在第位置上的数在第i i组,则计算中位数组,则计算中位数的近似公式为:的近似公式为:工商管理学院工商管理学院 康波康波 20082008年年0202月月人均月收入(元)人均月收入(元)家庭数(户)家庭数(户)组距
14、组距次数密度次数密度累计次数(户)累计次数(户)300300以下以下300300400400400 400 600600600 600 100010001000 1000 1500150015001500以上以上2722726646643002300234723472194519456456451001001001002002004004005005005005002.722.726.646.6415.0115.018.688.683.893.891.291.292722729369363938393874107410935593551000010000合计合计1000010000-例例8 8
15、、某地区职工家庭人均月收入资料如下表,求、某地区职工家庭人均月收入资料如下表,求职工家庭人均月收入的中位数。职工家庭人均月收入的中位数。职工家庭人均月收入表职工家庭人均月收入表工商管理学院工商管理学院 康波康波 20082008年年0202月月解:中点位置解:中点位置=所以中位数组在所以中位数组在60060010001000元组。元组。用上限公式计算:用上限公式计算:工商管理学院工商管理学院 康波康波 20082008年年0202月月看管机器台数(台)看管机器台数(台)工人数(人)工人数(人)累计次数(人)累计次数(人)4 45 56 67 78 85 58 87 76 61 15 51313
16、202026262727合计合计27272727例例9 9、某车间工人看管机器台数资料如下表,求工、某车间工人看管机器台数资料如下表,求工人看管机器台数的中位数。人看管机器台数的中位数。某车间工人看管机器台数表某车间工人看管机器台数表工商管理学院工商管理学院 康波康波 20082008年年0202月月解:因为解:因为所以所以工商管理学院工商管理学院 康波康波 20082008年年0202月月 中位数具有的数学性质:各数据与中中位数具有的数学性质:各数据与中位数之差的绝对值之和最小,即:位数之差的绝对值之和最小,即:或或工商管理学院工商管理学院 康波康波 20082008年年0202月月五、众数
17、五、众数(Mode)(Mode)众数用众数用表示。表示。对于组距分组数据,众数的近似计算对于组距分组数据,众数的近似计算公式为:公式为:下限公式:下限公式:上限公式:上限公式:工商管理学院工商管理学院 康波康波 20082008年年0202月月人均月收入(元)人均月收入(元)家庭数(户)家庭数(户)组距组距次数密度次数密度累计次数(户)累计次数(户)300300以下以下300300400400400 400 600600600 600 100010001000 1000 1500150015001500以上以上272272664664300230023472347219451945645645
18、1001001001002002004004005005005005002.722.726.646.6415.0115.018.688.683.893.891.291.292722729369363938393874107410935593551000010000合计合计1000010000例例1010、某地区职工家庭人均月收入资料如下、某地区职工家庭人均月收入资料如下表,求职工家庭人均月收入的众数。表,求职工家庭人均月收入的众数。职工家庭人均月收入表职工家庭人均月收入表工商管理学院工商管理学院 康波康波 20082008年年0202月月 解:解:400400600600元这一组次数密度最大,
19、元这一组次数密度最大,故众数组为故众数组为400400600600元这一组。用下限公式元这一组。用下限公式求众数。求众数。工商管理学院工商管理学院 康波康波 20082008年年0202月月六、分位数六、分位数第一四分位数:第一四分位数:第二四分位数:第二四分位数:第三四分位数:第三四分位数:25%25%25%25%25%25%25%25%maxmaxminmin排序数据,按递增次序排序数据,按递增次序工商管理学院工商管理学院 康波康波 20082008年年0202月月 3 3、若若 为为整整数数,则则所所求求四四分分位位数数为为该该位位置置上上的的数数值值;若若 不不是是整整数数,就就取取第
20、第 与与第第 +1+1位位置置上上的的两两个个数数值值的的平平均均数数为为所所求求分分位位数数(这这里里 表表示不大于的最大整数,如示不大于的最大整数,如3.25=33.25=3)。)。(一)计算未分组数据的四分位数(假设(一)计算未分组数据的四分位数(假设有有N N个数据)个数据)其步骤如下:其步骤如下:1 1、将数据按大小顺序排列;、将数据按大小顺序排列;2 2、计算第、计算第i i个四分位数的位置个四分位数的位置;工商管理学院工商管理学院 康波康波 20082008年年0202月月(二)计算分组数据的四分位数(二)计算分组数据的四分位数 对于分组数据,四分位数的对于分组数据,四分位数的近
21、似计算公式为:近似计算公式为:工商管理学院工商管理学院 康波康波 20082008年年0202月月七、算术平均数、中位数、众数的特点七、算术平均数、中位数、众数的特点及三者之间的关系及三者之间的关系(一一)众数、中位数和均值的关系众数、中位数和均值的关系工商管理学院工商管理学院 康波康波 20082008年年0202月月 在数据分布呈轻微偏态的情况下,三在数据分布呈轻微偏态的情况下,三者在数轴上的三个点构成一定的数量关系:者在数轴上的三个点构成一定的数量关系:均值与众数的距离约为均值与中位数的距均值与众数的距离约为均值与中位数的距离的三倍,即离的三倍,即 。工商管理学院工商管理学院 康波康波
22、20082008年年0202月月 (二二)众数、中位数和均值的特点和应用众数、中位数和均值的特点和应用场合场合 1 1、众数是一组数据分布的峰值,是一种位置代、众数是一组数据分布的峰值,是一种位置代表值,不受极端数值的影响。当数据的分布具有明显表值,不受极端数值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性的集中趋势时,尤其是对于偏态分布,众数的代表性比均值好。其缺点是不具有唯一性,一组数据可能有比均值好。其缺点是不具有唯一性,一组数据可能有一个众数,也可能没有众数,也可能有多个众数。一个众数,也可能没有众数,也可能有多个众数。2 2、中位数是一组数据中间位置上的代
23、表值,其、中位数是一组数据中间位置上的代表值,其特点是不受数据极端值的影响,对于具有偏态分布的特点是不受数据极端值的影响,对于具有偏态分布的数据,中位数的代表性比均值好。其缺点是不宜作进数据,中位数的代表性比均值好。其缺点是不宜作进一步的数学计算。一步的数学计算。工商管理学院工商管理学院 康波康波 20082008年年0202月月 3 3、均值是根据全部数据计算的,它具有优良的均值是根据全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据中极端值的影响,对于偏态其主要缺点是易受数据中极端值的影响,对于偏态分
24、布的数据,均值的代表性较差分布的数据,均值的代表性较差工商管理学院工商管理学院 康波康波 20082008年年0202月月第二节、离中趋势的描述第二节、离中趋势的描述一、极差一、极差极差(全距)以极差(全距)以R R表示:表示:对于组距分组数据,极差的近似值为:对于组距分组数据,极差的近似值为:R=R=最高组上限最低组下限最高组上限最低组下限工商管理学院工商管理学院 康波康波 20082008年年0202月月二、方差和标准差二、方差和标准差方差:方差:工商管理学院工商管理学院 康波康波 20082008年年0202月月标准差:标准差:工商管理学院工商管理学院 康波康波 20082008年年02
25、02月月月消费额月消费额(元元)组中值组中值(元元)调查人数调查人数(人人)向上累计人数向上累计人数(人人)300300以下以下300300400400400400500500500500600600600600700700700700以上以上 250250350350450450550550650650750 750 8080180180430430220220707020 20 80802602606906909109109809801000 1000 合合 计计 1000 1000 例例1111、根据下表资料,计算每个大学生每月消费额、根据下表资料,计算每个大学生每月消费额的标准差。计算
26、过程见后表。的标准差。计算过程见后表。某地大学生消费支出调查资料某地大学生消费支出调查资料工商管理学院工商管理学院 康波康波 20082008年年0202月月月消费额月消费额(元元)组中值组中值(元元)人数人数(人人)300300以下以下 2502508080208 208 43264 43264 300300400 400 350350180180108 108 11664 11664 400400500 500 4504504304308 8 64 64 500500600 600 55055022022092 92 8464 8464 600600700 700 650650707019
27、219236864 36864 700 700 以上以上 750750202029229285264 85264 合合 计计 1000 1000 某地大学生每人月消费额标准差计算表某地大学生每人月消费额标准差计算表工商管理学院工商管理学院 康波康波 20082008年年0202月月由上表可得:由上表可得:工商管理学院工商管理学院 康波康波 20082008年年0202月月总体单位总体单位的标志值的标志值=1=1,具有某种性质,具有某种性质=0=0,不具有某种性质,不具有某种性质三、是非标志的平均数和标准差三、是非标志的平均数和标准差是非标志的平均数是非标志的平均数成数:成数:全部总体单位数全部
28、总体单位数=N=N,成数成数P P为:为:工商管理学院工商管理学院 康波康波 20082008年年0202月月是非标志的标准差为:是非标志的标准差为:工商管理学院工商管理学院 康波康波 20082008年年0202月月四、相对离中系数四、相对离中系数(一一)极差系数极差系数(二二)标准差系数标准差系数工商管理学院工商管理学院 康波康波 20082008年年0202月月例例1212、某公司下属、某公司下属1818个连锁商店某年度平均销售额为个连锁商店某年度平均销售额为727.09727.09万元,销售额标准差为万元,销售额标准差为65.4465.44万元;同年度销售万元;同年度销售利润额平均为利
29、润额平均为87.2887.28万元,销售利润额标准差为万元,销售利润额标准差为12.6412.64万万元。试比较商品销售额与销售利润的离散程度。元。试比较商品销售额与销售利润的离散程度。销售额标准差系数为:销售额标准差系数为:利润额标准差系数为:利润额标准差系数为:工商管理学院工商管理学院 康波康波 20082008年年0202月月第二节、偏斜度与峰度第二节、偏斜度与峰度一、偏态系数一、偏态系数工商管理学院工商管理学院 康波康波 20082008年年0202月月偏态系数偏态系数SKSK:或或工商管理学院工商管理学院 康波康波 20082008年年0202月月偏斜度的取值:偏斜度的取值:333 3。判断标准为:判断标准为:为对称分布;为对称分布;为极右偏态;为极右偏态;为极左偏态。为极左偏态。工商管理学院工商管理学院 康波康波 20082008年年0202月月二、峰度系数二、峰度系数工商管理学院工商管理学院 康波康波 20082008年年0202月月峰度系数峰度系数K K为:为:工商管理学院工商管理学院 康波康波 20082008年年0202月月判断标准:判断标准:为正态曲线;为正态曲线;为尖顶曲线;为尖顶曲线;为平顶曲线;为平顶曲线;为水平曲线;为水平曲线;为为U U型分布曲线。型分布曲线。工商管理学院工商管理学院 康波康波 20082008年年0202月月