第四章:数据类型与描述统计.ppt

上传人:s****8 文档编号:67639365 上传时间:2022-12-26 格式:PPT 页数:27 大小:131.50KB
返回 下载 相关 举报
第四章:数据类型与描述统计.ppt_第1页
第1页 / 共27页
第四章:数据类型与描述统计.ppt_第2页
第2页 / 共27页
点击查看更多>>
资源描述

《第四章:数据类型与描述统计.ppt》由会员分享,可在线阅读,更多相关《第四章:数据类型与描述统计.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章:数据类型与描述统计第四章:数据类型与描述统计第一节:数据的类型数据的计量尺度:1、定类尺度 2、定序尺度 3、定距尺度 4、定比尺度定类尺度n(类别尺度、列名尺度)是最粗略、计量层次最低的尺度;n只能区别事物是同类或不同类;n必须符合穷尽和互斥的要求。例:0表示女性,1表示男性定序尺度n(顺序尺度),是对事物之间等级差或顺序差别的一种测度;n不仅有类别,这些类别之间是可以比较的;n不能进行加减乘除运算。例:一等品、二等品、三等品 小学、初中、高中、大学及以上 非常不同意、不同意、中立、同意、非常同意定距尺度n(间隔尺度),不仅区分类型和排序,而且可以准确地指出类别之间的差距是多少;n通

2、常可以使用自然或度量衡单位作为计量尺度;n定距尺度的计量结果表现为数值;n可以进行加减运算。例:考试成绩相差10分 今天武汉的温度比广州的温度低6摄氏度定比尺度n(比率尺度),与定距尺度属于同一层次,一般可不作区分,计量结果也表现为数值;n要求有一个绝对固定的“零点”;n可以进行加减乘除运算。例:甲月薪3000,乙月薪1000,甲为乙的三倍数据的类型(一)n定性数据(品质数据):包括定类数据和定序数据。不能用数值表示,其结果表现为类别。n定量数据(数量数据):包括定距数据和定比数据。能够用数值来表现,反映数量特征。数据的类型(二)n截面数据(cross-sectional data):在相同或

3、近似的时间点上收集的数据,如2006年我国各地区的GDP数据;n时间序列数据(time series data):在不同时间上收集的数据,如1990年到2005年湖北省的GDP数据;n面板数据(Panel data):综合了截面数据和时间序列数据。变量的类型n定类变量n定序变量n数字变量(离散变量、连续变量)多数情况下,变量指的是数字变量。第二节:指标和指数统计指标 包括总量指标、相对指标、平均指标n总量指标:反映总体规模,如人口总数、GDP。n相对指标:经济增长率、股价指数。n平均指标:人均消费水平、某股票的10日均价统计指数n广义:凡是能够说明现象变动的相对数都是指数;如计划完成相对数n狭

4、义:用来表明不能直接相加和不能直接对比的现象在不同时期的变动程度。如价格指数统计指数的分类n反映对象范围的不同:个体指数、总指数;n按性质不同:数量指标指数(产量指数)、质量指标指数(劳动生产率指数)n按所采用基期的不同:定基指数、环比指数n按研究的目的不同:动态指数、静态指数。统计图表n统计表:总标题、行标题、列标题、数字资料。(例)n统计图:条形图、饼图、线图、直方图、雷达图。(例)第三节第三节:描述统计描述统计Topicsn集中趋势的度量nMean(均值均值),median(中位数中位数),mode(众数众数)n离散的度量nRange(变动幅度变动幅度),variance and sta

5、ndard deviation(标准差标准差),coefficient of variation(离散系数系数)n形状n对称与不对称描述统计 集中趋势集中趋势均值均值中位数中位数众数众数几何平均数几何平均数 描述统计描述统计 离散程度离散程度 方差方差 标准差标准差离散系数离散系数均值(算术平均)n数据的算术均值n样本均值n总体均值样本规模总体规模n度量集中趋势的最常用变量n受到异常值的影响 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 均值均值=5均值均值=6(continued)中位数n主要用于测度定序数据的集中趋势n不受异常值的影响

6、 n在一个排好序的数列中,中位数就是这个序列中间的数值:n若N为奇数,中位数就是中间那个数的数值n若N为偶数,中位数就是中间那两个数的平均值0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 中位数中位数=5中位数中位数=5众数n众数的值就是出现次数最多的数值n不受异常数据的影响n可用于数字型和定类型数据n可能没有众数n也可能有多个众数0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数=90 1 2 3 4 5 6无众数无众数n是离散程度的最重要的度量指标n反映的是对均值的离散程度n样本方差:n总体方差:方差标准差n

7、是最重要的分散程度度量指标是最重要的分散程度度量指标n表示对均值的分散程度表示对均值的分散程度n与与原始数据是同一量纲原始数据是同一量纲n样本标准差:总体标准差:标准差比较标准差比较均值均值=15.5 s =3.338 11 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData A均值均值=15.5 s=.925811 12 13 14 15 16 17 18 19 20 21均值均值=15.5 s=4.57Data CCoefficient of Variation(变异系数)n考察现对离散程度n一般用百分比表示(%)n表示相对于均值的离散情况n比较不同度量单位多组数据的离散程度n 离散系数比较n股票 A:n去年的均价=$50n标准差=$5n股票 B:n去年的均价=$100n标准差=$5n离散系数:n股票 A:n股票 B:分布的形状n描述数据是如何分布的n对形状的度量n对称还是不对称Mean=Median=Mode Mean Median Mode Mode Median Mean右偏右偏左偏左偏对称对称n数据分析是客观的n对数据的解释是主观的,应该公正、中立、明确

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁