《《统计资料整理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计资料整理》PPT课件.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章统计资料整理l l3.1 统计资料整理的一般问题l l3.2 统计分组l l3.3 频数分布3.1统计资料整理的一般问题l本节内容概要:本节内容概要:统计资料的概念统计资料整理统计资料的审核一、统计资料:某种现象在一定时间、空间、条件下的数量表现。二、统计资料的三个特征:1、反映客观现象的总体特征2、反映客观现象的数量特征 3、反映已发生客观现象的信息特征 三、统计资料的种类1、按获取的方式分为:一次统计资料一次统计资料 二二 次统计资料次统计资料 三次统计资料三次统计资料2、按表现形式不同分为:统计数字统计数字 统计表统计表 统计图统计图 如下例:如下例:性别 是否锻炼出生日期身高体重
2、男 非常喜欢 08/12/7717065女 喜欢 03/21/78 17560女 一般 09/30/80165 61男 不太喜欢 02/12/8117970男 很讨厌06/21/7715345男 喜欢 08/20/7618065女 一般 10/11/7917255女 非常喜欢02/12/8316752 统计数字:4人非常喜欢,6人喜欢,l统计表统计表:是否锻炼是否锻炼人数(频数)人数(频数)相对频数相对频数 百分比百分比 累计百分比累计百分比非常喜欢 4 0.2 20.00%20.00%喜欢 6 0.3 30.00%50.00%一般 5 0.25 25.00%75.00%不太喜欢 1 0.5
3、5.00%80.00%讨厌 2 0.1 10.00%90.00%很讨厌 2 0.1 10.00%100.00%求和求和2020100.00%100.00%1.0 100%1.0 100%l统计图统计图:四、统计资料的作用四、统计资料的作用1、制定计划、方针政策的基础和依据 2、监督、检查计划和方针政策执行情况的信息源 3、经济实证分析的科学材料 一个数据文件l例:下面是通过调查获得的某市50家百货商店某月的销售资料(单位:万元)如下:l l15712.814.819.34713.48.5513.215.519.48.34.52115.715.511.913.616.3205.89.51613.
4、916.72561217.13.5296.810.52312.614.218.226.42617.314.718.21012.417.514520l对这一个数据文件,可以提什么统计问题对这一个数据文件,可以提什么统计问题?五、统计资料整理:五、统计资料整理:根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化,系统化的工作过程,就是统计整理。六、统计资料整理方案设计六、统计资料整理方案设计1 1、对总体资料的处理方法、对总体资料的处理方法2 2、确定用哪些具体的统计指标来说明总体、确定用哪些具体的统计指标来说明总体七、统计资料汇总的组织形式七、统计资料汇总的组织形式1、逐
5、级汇总2、超级汇总两种八、统计资料汇总技术八、统计资料汇总技术1、手工汇总划记法 记录法 折叠法 卡片法2、电子计算机汇总九、统计资料的审核九、统计资料的审核九、统计资料的审核九、统计资料的审核 的内容:的内容:的内容:的内容:1 1、统计资料的完备性、统计资料的完备性 2 2、统计资料的及时性、统计资料的及时性 3 3、统计资料的准确性、统计资料的准确性 十、统计资料审查十、统计资料审查十、统计资料审查十、统计资料审查 方式:方式:方式:方式:1 1、逻辑检查、逻辑检查 2 2、计算检查、计算检查 3.2 统计分组一、统计分组的定义:一、统计分组的定义:根据统计研究任务的根据统计研究任务的要
6、求和现象总体的内在特点,把统计总体按照要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个某一标志划分为若干性质不同又有联系的几个部分,称为统计分组。部分,称为统计分组。统计分组应达到的效果:11、组间差异性、组间差异性22、组内同质性、组内同质性二、统计分组的作用二、统计分组的作用1、划分现象类型,并反应各类型组的数量特征2、研究总体的结构例:我国1987-1997年从业人员分布情况3、探讨现象之间的依存关系三、分组标志三、分组标志:将总体区分为不同组别的标准或根据.分组标志分:1、品质标志2、数量标志(一)按品质标志分组(一)按品质标志分组:按事物的品质特征进行
7、分组。例:人口按性别分组、爱好、文化程度、政治面貌有些社会经济现象按品质标志分组理论上容易区分,但在实际社会经济生活中确难以辨别。例如:城乡分类、行业分类,往往存在着交叉过渡。(二)按数量标志进行分组:(二)按数量标志进行分组:按事物的数量特征进行分组1、强调:、强调:按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区别各组的不同类型和性质。l例如:按身高分组1.3M以下,1.3M-1.5M;1.5M-1.6M;1.6M-1.7M;1.7M以上.按体重分组;企业按产值、利润等2、数量标志分组的三个要点:、数量标志分组的三个要点:通过数量的变化来区分各组质的差别正确
8、选择决定事物性质差别的数量界限。采用适当的分组形式 单项式 组距式 等距 不等距 单项式分组:离散型变量如果变量值变动幅度比较离散型变量如果变量值变动幅度比较小,可依次将每一个变量值作为一组,这种分组称小,可依次将每一个变量值作为一组,这种分组称为单项式分组。为单项式分组。例如:对居民家庭按家庭人口数进行分组:家庭人口例如:对居民家庭按家庭人口数进行分组:家庭人口数为:数为:1 1人,人,2 2人,人,3 3人,人,4 4人,人,5 5人及以上人及以上 l l组距式分组:组距式分组:把整个变量值依次划分为几个区间,把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间。各个变量值
9、则按其大小确定所归并的区间。l l适用范围:适用范围:连续变量或离散型变量值较多的情况连续变量或离散型变量值较多的情况 。l l例如:企业的工人按其日产零用件进行分组:例如:企业的工人按其日产零用件进行分组:50605060,60706070,70807080,80908090,9090以及以上。以及以上。l l组距:组距:区间的距离区间的距离l l等距分组:等距分组:即标志值在各组保持相等的组距。适即标志值在各组保持相等的组距。适用于标志值变动均匀的情况。用于标志值变动均匀的情况。l l不等距分组:不等距分组:即标志值在各组的组距不等。适用即标志值在各组的组距不等。适用于标志值变动很不均匀的
10、情况。于标志值变动很不均匀的情况。l l组距式分组注意事项:组距式分组注意事项:组距式分组注意事项:组距式分组注意事项:l l第一,组限确定第一,组限确定第一,组限确定第一,组限确定组限:组距两端的数值,其中每组的起点数值称为下限,每组的终点数值称为上限。连续变量只能进行组距式分组其相邻组限可重叠(连续式组距)也可不重叠(间断式组距)如:学生成绩分组:09;1029;3039;4059;6069;7089;90100也可以:010;1060;6075;7585;8595;95以上。上限不在内:上限不在内:某单位的变量值刚好等于相邻两组的界限值时,例行规定是将这个单位归入作为下限的组内。组距大小
11、和组数多少的确定组距大小和组数多少的确定一般情况下,组数必须是整数,而组距应当是或10的整数倍.组中值:组中值:上下限之间的中点数值,对于开口组,其组中值可参照相邻的组距来决定。(假定组内分布均匀)计算组距的通用分式:计算组距的通用分式:组距本组上限前组上限本组下限前组下限连续式组距的计算公式为:组距本组上限本组下限第三,如何安排上下限第三,如何安排上下限 第四,开口组和开放式组距第四,开口组和开放式组距上限或下限不确定的组称为开口组。上限或下限不确定的组称为开口组。开口组组中值计算公式:开口组组中值计算公式:缺下限开口组的组中值上限相邻组组距缺上限开口组的组中值下限邻组组组距 第五,等距分组
12、与异距分组第五,等距分组与异距分组等距分组等距分组适用范围等距分组优点异组分组异组分组适用范围具体做法四、统计分组体系l统计分组体系:统计分组体系:在统计分组时,分组标志可以是一个,也可以是几个。有时为了从不同侧面反应总体的特征,就必须运用几个标志对总体进行分组,以形成一个完整的体系,这就是统计分组体系。l(一)平行分组体系(一)平行分组体系简单分组:简单分组:总体按一个标志进行分组。平行分组体系:平行分组体系:同一总体的几个简单分组按某一规定排列起来,就构成一个平行分组体系。例子:例子:人口按性别、年龄、民族等标志进行分组,这些简单分组排列起来,就是一个平行分组体系。汉族组男藏族组按性别分组
13、按民族分组回族组女维吾尔族组.06岁组按年龄分组717岁组1859岁组60岁以上l(二二)复合分组体系复合分组体系l复合分组复合分组:总体同时按两个或两个以上的标志进行层叠分组。l例:高等学校学生分组:男生组本科组女生组理科学生组男生组专科组女生组高等学校学生总体男生组本科组女生组文科学生组男生组专科组女生组第三节第三节 频频 数数 分分 布的概念布的概念l一、统计分布的定义:一、统计分布的定义:在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为统计分布。l频数分布的实质:频数分布的实质:把总体的全部单位按某标志所分的组进行分配所形成的数列,又称频数分布或分布
14、数列,也称次数分布。l频数分布包括两个要素:1 总体按某标志所分的组;2 各组所占有的单位数次数。注:频数注:频数-分布在各组个体单位数(次数)分布在各组个体单位数(次数)频率频率-各组次数与总次数之比各组次数与总次数之比二、分配数列的种类:二、分配数列的种类:根据分组标志的不同分为品质分布数列和变量分配数列;变量分布数列又有单项式数列和组距式数列。任何一个分布都必须满足:1 各组的频率大于0;2 各组的频率和等于1(或者说100%)。l例:品质分布数列:例:品质分布数列:注:品质分布数列主要用于反映社会经济现象的结构、比例关系和分布规律。变量分布数列:变量分布数列:变量数列直观地反映出各组间
15、在数量上的差异,说明总体内部的数量结构及变化,同时也能反映出总体内部各组的不同性质。三、频数分布表的编制1)整理原始资料:确定最大值和最小值,并计算全距。例某班50名学生的统计学考试成绩如下:2)798878507071905472583)728091959181726173824)978374616263747499845)846475657566758567686)69758659768869778751l把上面数据从小到大排列:505154585961616263646566676869697071727272737474747575757576777879808182838484858
16、6878888909191959799最小值=50最大值=99全距=最大值最小值=49分2)确定变量数列的形式确定变量数列的形式3)考虑:离散变量4)连续变量5)此问题编制组距式数列3)3)确定组距、组限等确定组距、组限等4)对学习成绩的分析主要是从不及格、及格、中、良好及优秀方面来考虑,于是考虑分组为5组。4)4)频数分布的具体编制频数分布的具体编制四、频数分布表示方法1、列表法、列表法 用统计表来表示频数分布,并可以列出累计频数。如下例:2、图示法常用的有:直方图、折线图和曲线图(1)直方图横轴表示各组组限,纵轴表示频数(一般标在左方)和频率(一般标在右方)。3、折线图、折线图 在直方图的
17、基础上,将直方图中的每一个长方形的顶点用折线连点而成。4、曲线图、曲线图 当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线,这是一条理论曲线。频数分布的曲线图主要类型正态分布特征是两头小,中间大偏态分布偏态分布U型分布型分布:特征是两头大,中间小;AJ型分布:型分布:特征是次数随着变量值的增大而增多,或次数随着变量值的增大而减小;l洛伦茨分布:洛伦茨分布:专门用以检定社会收入分配平均程度的一种曲线。绝对平均线五、统计表l定义:定义:把汇总结果的资料按一定的规则在表格上表现出来,这种表格就叫统计表,广义上说,任何用以反映统计资料的表格都是统计表。l结构:结构:从它的外表
18、形式看由标题、横行和纵栏、数字等部分构成。总标题:总标题:表的名称,放在表的上端横行标题:横行标题:也称为横标目,写在表的左方纵栏标题:纵栏标题:也称纵栏标目,写在表的上方。横行标题和纵栏标题分别说明横行或纵栏所填列数字资料的内容。例:l从表的内容看,包括主词和宾词两个部分。l主词主词:就是统计表所要说明是总体、总体的各个组或各个单位的名称。通常列在表的左方。l宾词:宾词:是用来说明主词的各种指标。通常列于横行,在表的上方,即列于纵栏。l例:宾词栏主词栏六、统计表的种类一、种类:按主词是否分组和分组的程度分为简单表,分组表和复合表。1、简单表:主词未经任何分组的统计表。2、分组表:主词按某一标
19、志进行分组的统计表。3、复合表:主词按两个或两个以上标志进行复合分组的统计表。七、统计表的设计要求l 统计表的各种标题,应简明,确切,概括地反映出表的内容;l 表中的主词各行和宾词各栏应先列各个项目,后列总计;l 如果统计表的栏数较多,通常要加以编号;l 如:主词栏部分编以“甲”、“乙”、,宾词栏部分编以“1”、“2”、“3”等等。各栏存在相互关系的,也可用代码标出。例如:(5)(4)(3)表明第五栏是由第四栏除以第3栏求得,等等。l l 表中数字应填写整齐,对准位数,不要求填写或无数字的空格用短横线“”表示,缺数字的空格用“”表示。相同数字应如数写出,不可用“同上”或“同左”字眼;l 统计表中必须注明数字资料的计量单位;l 开口式问题。统计表的上下两端应以粗线绘制,表内纵横线条以细线绘制,表格的左右两端一般不划线,即采用“开口”式。l 必要时统计表应加注明或注释。