《(92)--第二章:数据的分布属性(一).ppt》由会员分享,可在线阅读,更多相关《(92)--第二章:数据的分布属性(一).ppt(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、经济管理中的计算机应用经济管理中的计算机应用第二章数据分类与汇总分析Contents123数据与数据可视化数据的分布属性数据分类汇总二、数据的分布属性1.1.数据集中和分散的度量数据集中和分散的度量(1 1)反映数据集中趋势的指标:均值、中位数、众数)反映数据集中趋势的指标:均值、中位数、众数学生编号(学生编号(N)123456789101112131415身高(cm)155156157158158159159160160160161161162163163学生编号(N)161718192021222324252627282930身高(cm)16416416516516516516616616
2、7167168169171173174均值是反映数据中心波动的常用指标,均值计算公式为:均值是反映数据中心波动的常用指标,均值计算公式为:(2 2)反映数据分散程度的指标:极差、方差、标准差和均值的标准误)反映数据分散程度的指标:极差、方差、标准差和均值的标准误二、数据的分布属性1.1.数据集中和分散的度量数据集中和分散的度量将一组数据按照大小顺序排列,最靠近中间的数值称为中位数将一组数据按照大小顺序排列,最靠近中间的数值称为中位数 注意,如果数据的个数为偶数,则中位数是最靠近中间的两个数。上表中的中位数是注意,如果数据的个数为偶数,则中位数是最靠近中间的两个数。上表中的中位数是163163厘
3、米和厘米和164164厘厘米。在米。在ExcelExcel中中MEDIANMEDIAN()函数对于数据是偶数的情况,则取中间两个数据的平均数称为中位数,上表中如()函数对于数据是偶数的情况,则取中间两个数据的平均数称为中位数,上表中如用公式计算中位数为用公式计算中位数为163.5163.5厘米。厘米。表中数据的极差为表中数据的极差为174174厘米厘米-155-155厘米厘米=19=19厘米厘米一组数据中出现次数最多的数称为众数一组数据中出现次数最多的数称为众数 上表中出现次数最多的是上表中出现次数最多的是165165厘米。如果数据中出现次数最多的数值为两个,这样的数据就是双众数。厘米。如果数
4、据中出现次数最多的数值为两个,这样的数据就是双众数。在在ExcelExcel中中MODEMODE()函数对于双众数,只取其中一个。()函数对于双众数,只取其中一个。数据的极差是数据中最大值与最小值之差数据的极差是数据中最大值与最小值之差二、数据的分布属性1.1.数据集中和分散的度量数据集中和分散的度量数据的方差的计算公式数据的方差的计算公式数据标准差计算公式数据标准差计算公式二、数据的分布属性2.2.频数与频数统计频数与频数统计数据分布的频数是数据分布的基本属性之一数据分布的频数是数据分布的基本属性之一用用Frequency()Frequency()函数可生成数据频数图函数可生成数据频数图 频
5、数图是概率与统计的一个基础频数图是概率与统计的一个基础性工具,概率与统计的许多重要概念性工具,概率与统计的许多重要概念都是从频数发展起来的。在商业实际都是从频数发展起来的。在商业实际问题研究和分析中,数据的频数也是问题研究和分析中,数据的频数也是分析和研究相关问题的基础。分析和研究相关问题的基础。二、数据的分布属性3.3.数据频数的分布形态数据频数的分布形态(1 1)峰度系数)峰度系数 是描述数据分布陡峭或平坦的指标。与相同均值和标准差的正态分布相比,数据频率图的形状是描述数据分布陡峭或平坦的指标。与相同均值和标准差的正态分布相比,数据频率图的形状和正态分布接近的,峰度系数为零。形状比正态分布
6、更平坦的,峰度系数为负值,图形越平坦,峰和正态分布接近的,峰度系数为零。形状比正态分布更平坦的,峰度系数为负值,图形越平坦,峰度绝对值越大。形状比正态分布更尖更窄的,峰度系数为正值,图形越尖越窄,数值越大。度绝对值越大。形状比正态分布更尖更窄的,峰度系数为正值,图形越尖越窄,数值越大。测量数据频数分布的指标:测量数据频数分布的指标:二、数据的分布属性3.3.数据频数的分布形态数据频数的分布形态(2 2)偏度系数)偏度系数 是描述数据分布对称性的指标。与相同均值和标准差的正态分布相比,数据频率图的形状和正是描述数据分布对称性的指标。与相同均值和标准差的正态分布相比,数据频率图的形状和正态分布类似,左右对称,偏度系数等于零。数据频数的峰向右偏斜(即拖尾在左边),偏度系数为态分布类似,左右对称,偏度系数等于零。数据频数的峰向右偏斜(即拖尾在左边),偏度系数为负值。峰向左偏斜(即拖尾在右边),偏度系数为正值。偏斜程度越大,偏度系数的绝对值越大。负值。峰向左偏斜(即拖尾在右边),偏度系数为正值。偏斜程度越大,偏度系数的绝对值越大。测量数据频数分布的指标:测量数据频数分布的指标: