数据分布特征的测度37563.pptx

上传人:muj****520 文档编号:87275609 上传时间:2023-04-16 格式:PPTX 页数:33 大小:473.66KB
返回 下载 相关 举报
数据分布特征的测度37563.pptx_第1页
第1页 / 共33页
数据分布特征的测度37563.pptx_第2页
第2页 / 共33页
点击查看更多>>
资源描述

《数据分布特征的测度37563.pptx》由会员分享,可在线阅读,更多相关《数据分布特征的测度37563.pptx(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、管理统计学第四章 数据分布特征的测度Summarizing&Describing Numerical Data 学习目标 Learning Objectivesn1.解释数值数据的特征nExplain Numerical Data Propertiesn2.综合度量描述Describe Summary Measuresn 集中趋势 Central Tendencyn 变异程度 Variationn 分布形状 Shapen3.数值数据的综合度量分析数值数据的特征和度量 Properties&Measures数值数据的数值数据的特征特征均值均值中位数中位数众数众数值域中点值域中点 中轴数中轴数集中

2、趋势集中趋势全距全距四分位间距四分位间距方差方差标准差标准差变异系数变异系数变异程度变异程度偏态偏态分布形状分布形状均 值(平均数)Meann1.用于度量数据的集中趋势(Central Tendency)n2.是最常见的集中趋势的度量n3.如同平衡点(Balance Point)n4.易受极端数值(Extreme Values)影响 n5.公式(样本均值)(Sample Mean)XXnXXXniinn112.中位数 Mediann1.用于度量数据的集中趋势(Central Tendency)n2.为排序序列的中间值(In Ordered Sequence)n如果 n 是奇数,即为序列的中间值

3、n如果 n 是偶数,则为两个中间值的均值n3.中位数在序列中的位置 n4.不受极值的影响定位点 n12众 数Moden1.用于度量数据的集中趋势Central Tendencyn2.为出现次数最多的数值nValue That occurs Most Oftenn3.不受极值的影响n4.可能会出现没有众数或多个众数的情形n5.对数值数据和类型数据均适用值域中点Midrangen1.用于度量数据的集中趋势(Central Tendency)n2.是最小和最大观测值的中点n3.易受极值影响nAffected by Extreme Values值域中点 XX最小值最大值2四分位数Quartilesn1

4、.用于度量数据的非集中趋势nMeasure of Noncentral Tendencyn2.把排序数据等分为四个区间Quartersn3.第i个四分位数的位置25%25%25%25%Q1Q2Q3定位点 Qi(ni1)4中 轴 数 Midhingen1.用于度量数据的集中趋势(Central Tendency)n2.是第一和第三四分位数的中点n3.不受极值的影响nNot Affected by Extreme Values中轴数 QQ132思考题n你是 Prudential-Bache 证券公司的金融分析员。你已经收集了新发行股票的下列收盘价:n17,16,21,18,13,16,12,11.

5、n试描述股票价格的集中趋势数值数据的特征和度量数值数据数值数据的特征的特征均值均值中位数中位数众数众数值域中点值域中点 中轴数中轴数集中趋势集中趋势全距全距四分位间距四分位间距方差方差标准差标准差变异系数变异系数变异程度变异程度偏态偏态分布形状分布形状全 距(极差)Rangen1.度量数据的离散程度Measure of Dispersionn2.最大和最小观测值之差n3.不考虑数据是如何分布的全距XX最小值最大值7 8 9 107 8 9 10四分位间距 Interquartile Rangen1.度量数据的离散程度Measure of Dispersionn2.也称为伸展中心Midsprea

6、dn3.为第三和第一四分位数之差n4.此间距包括中间50%的数据n5.不受极值影响四分位间距 QQ31方差和标准差 Variance&Standard Deviationn1.度量数据的离散程度Measures of Dispersionn2.是最为常见的度量n3.考虑数据是如何分布的n4.表现了相对于均值(或者)的变异46810 12 X=8.3样本方差公式 Sample Variance Formula分母是(n-1)!(如果是总体方差就用N)S(XX)n(XX)(XX)(XX)niinn2211222211.样本标准差公式 Sample Standard DeviationSS(XX)n

7、(XX)(XX)(XX)niinn2211222211.变异系数 Coefficient of Variationn1.度量相对离散程度相对离散程度n(Measure of Relative Dispersion)n2.总是一个百分比n3.表现了相对于均值的变异n4.用来比较两组或更多组数据n5.公式(样本)思考题 Thinking Challengen你是Prudential-Bache 证券公司的金融分析员.你已经收集了新发行股票的下列收盘价:n17,16,21,18,13,16,12,11.n描述股票价格的不稳定不稳定性性(volatility).数值数据的特征和度量 Propertie

8、s&Measures数值数据数值数据的特征的特征均值均值中位数中位数众数众数值域中点值域中点 中轴数中轴数集中趋势集中趋势全距全距四分位间距四分位间距方差方差标准差标准差变异系数变异系数变异程度变异程度偏态偏态分布形状分布形状形状 Shapen1.表明数据是如何分布的nHow Data Are Distributed?n2.形状的度量Measures of Shapen偏态 与 对称 Skew vs.Symmetry右偏的右偏的左偏的左偏的对称的对称的均值均值 =中位数中位数 =众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值探测性数据分析 Exploratory Da

9、ta Analysis筛选原始数据的技术:Techniques to Screen Raw Data 1.检查关于形状的假设Assumptions 2.确定数据中的极端值的位置 Locate Outliers in the Data 使用盒须图Box-and-Whisker Plot 盒须图 Box-and-Whisker Plotn用5个度量值概括表述数据特征Graphical Display of Data Using 5-Number Summary中位数4681012Q3Q1X最大值X最小值数据形状(Shape)与盒须图 Right-Skewed右偏的右偏的Left-Skewed左偏的左偏的Symmetric对称的对称的Q1 中位数中位数 Q3Q1 中位数中位数 Q3Q1 中位数中位数 Q3演讲完毕,谢谢观看!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 考试试题 > 一级建造

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁