《统计学课件第二章【统计整理.pptx》由会员分享,可在线阅读,更多相关《统计学课件第二章【统计整理.pptx(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计学课件第二章统计学课件第二章【统计整理统计整理第一节第一节 统计整理概述统计整理概述一、统计整理的概念一、统计整理的概念一、统计整理的概念一、统计整理的概念二、统计整理的内容二、统计整理的内容二、统计整理的内容二、统计整理的内容第1页/共34页统计整理概念 将统计调查得到的数据进行加将统计调查得到的数据进行加将统计调查得到的数据进行加将统计调查得到的数据进行加工整理,使其系统化、条理化,工整理,使其系统化、条理化,工整理,使其系统化、条理化,工整理,使其系统化、条理化,符合分析的需要。符合分析的需要。符合分析的需要。符合分析的需要。是统计调查的继续,统计分析的前是统计调查的继续,统
2、计分析的前是统计调查的继续,统计分析的前是统计调查的继续,统计分析的前提和基础提和基础提和基础提和基础必要性必要性必要性必要性第2页/共34页统计整理的内容 (一)对原始数据资料进行审核检查和整(一)对原始数据资料进行审核检查和整(一)对原始数据资料进行审核检查和整(一)对原始数据资料进行审核检查和整理理理理1 1、完整性审核、完整性审核、完整性审核、完整性审核 2 2、准确性审核、准确性审核、准确性审核、准确性审核(二)对次级资料的检查与整理(二)对次级资料的检查与整理(二)对次级资料的检查与整理(二)对次级资料的检查与整理1 1、对现有资料的甄别、对现有资料的甄别、对现有资料的甄别、对现有
3、资料的甄别2 2、对甄别后的资料作出评价、对甄别后的资料作出评价、对甄别后的资料作出评价、对甄别后的资料作出评价3 3、选用适当的再加工方法、选用适当的再加工方法、选用适当的再加工方法、选用适当的再加工方法 第3页/共34页将总体中所有单位按一定的标志划分为将总体中所有单位按一定的标志划分为将总体中所有单位按一定的标志划分为将总体中所有单位按一定的标志划分为若干个不同性质的组。若干个不同性质的组。若干个不同性质的组。若干个不同性质的组。一、统计分组一、统计分组一、统计分组一、统计分组统计分组的作用统计分组的作用统计分组的作用统计分组的作用:qq可发现总体的特点与规律,分析总体中各可发现总体的特
4、点与规律,分析总体中各可发现总体的特点与规律,分析总体中各可发现总体的特点与规律,分析总体中各个组成部分的结构情况个组成部分的结构情况个组成部分的结构情况个组成部分的结构情况qq分析现象之间的依存关系分析现象之间的依存关系分析现象之间的依存关系分析现象之间的依存关系 p33-34 p33-34 表表表表2-7 2-7 2-82-8第二节第二节 统计分组统计分组第4页/共34页二、统计分组的方法二、统计分组的方法二、统计分组的方法二、统计分组的方法n n关键问题关键问题选择分组标志和划分各组得界限选择分组标志和划分各组得界限(一)分组标志确定的原则(一)分组标志确定的原则1 1、根据研究的目的与
5、任务选择分组标志、根据研究的目的与任务选择分组标志2 2、要选择能够反映事物本质或主要特征的标志、要选择能够反映事物本质或主要特征的标志3 3、要根据现象的历史条件及经济条件来选择分组标志、要根据现象的历史条件及经济条件来选择分组标志第5页/共34页二、统计分组的方法二、统计分组的方法二、统计分组的方法二、统计分组的方法(二)统计分组方法的分类(二)统计分组方法的分类1 1、根据分组标志反映事物特征不同、根据分组标志反映事物特征不同 分为分为 按品质标志分组(事物属性差异)和按数量标志分组按品质标志分组(事物属性差异)和按数量标志分组(事物数量差异)(事物数量差异)例例 性别性别 学历学历 工
6、资工资 年龄年龄2 2、根据标志的多少不同、根据标志的多少不同分为分为 简单分组(一个分组标志)简单分组(一个分组标志)和和 复合分组(两个或两复合分组(两个或两个以上)个以上)第6页/共34页三、编制次数分布数列三、编制次数分布数列三、编制次数分布数列三、编制次数分布数列n n在确定分组标志和分组方法后编制次数分布数列相关概念:n n次数分布数列:将总体按某一标志分组,按一定顺序排列并列出每个组的总体单位数,这种数列称为次数分布数列,又称分配数列n n次数(频数):分布在每一组的总体单位数分布数列的种类:n n品质数列n n变量数列第7页/共34页按品质标志分组的数列。如不同品牌饮料市场占有
7、率如不同品牌饮料市场占有率(一)品质数列(一)品质数列(一)品质数列(一)品质数列饮料品牌饮料品牌人数人数百分比百分比(%)(%)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐汇源果汁汇源果汁露露露露15151111 9 9 6 6 9 930302222181812121818合计合计5050100100第8页/共34页按数量标志分组的数列按数量标志分组的数列。含义含义:以一个变量值作为一组。:以一个变量值作为一组。根据每一组变量值的多少,可以进行单项式数根据每一组变量值的多少,可以进行单项式数列、组距式数列。列、组距式数列。适用范围适用范围:离散性变量且变量值数目不多的:离散性变量且
8、变量值数目不多的情况。情况。单项式数列单项式数列(二)变量数列(二)变量数列(二)变量数列(二)变量数列第9页/共34页单项式数列单项式数列 某社区家庭户拥有孩子数情况表某社区家庭户拥有孩子数情况表 孩子数(个)孩子数(个)户数户数百分比(百分比(%)0 01 12 23 315015020020010010050503030404020201010合计合计500500100100第10页/共34页组距式数列组距式数列 含义含义:以变量值的一定变动范围为一组:以变量值的一定变动范围为一组适用适用范围范围:连续变量和离散变量变量值很多:连续变量和离散变量变量值很多的情况。的情况。等距数列等距数列
9、等距数列等距数列异距数列异距数列异距数列异距数列变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等第11页/共34页等距数列等距数列 某工厂工人完成生产定额情况表某工厂工人完成生产定额情况表 工人完成生产定额工人完成生产定额(%)工人数(个)工人数(个)百分比(百分比(%)9090以下以下9090100100100100110110110110120120120120以上以上3030404060603030202016.716.7
10、22.222.233.333.316.716.711.111.1合计合计180180100100第12页/共34页异距数列异距数列 某地区人口年龄分布情况某地区人口年龄分布情况 人口年龄分组人口年龄分组 人口数(万人)人口数(万人)百分比(百分比(%)2 2岁以下(婴儿组)岁以下(婴儿组)2 27 7岁(幼儿组)岁(幼儿组)7 71818岁(学龄儿童组)岁(学龄儿童组)18186060岁(劳动力人口组)岁(劳动力人口组)6060岁以上(老年组)岁以上(老年组)1 1 6 6 12 12 24.6 24.6 8.1 8.1 1.9 1.9 11.6 11.6 23.2 23.2 47.6 47.
11、6 15.7 15.7 合计合计51.751.7100100第13页/共34页相关概念相关概念相关概念相关概念指每组两端的变量值,各组的最小值指每组两端的变量值,各组的最小值为下限,最大值为上限。为下限,最大值为上限。组限组限组限组限每组变量值变动区间的长度,为每组变量值变动区间的长度,为上下限之差上下限之差组距组距组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值组中值组中值第14页/共34页开口式组距数列组中值的计算:开口式组距数列组中值的计算:开口式组距数列组中值的计算:开口式组距数列组中值的计算:组中值上限相邻组组距组中值上限相邻组组距组中值上限相邻组组距组中值
12、上限相邻组组距/2/2/2/2 组中值下限组中值下限组中值下限组中值下限+相邻组组距相邻组组距相邻组组距相邻组组距/2/2/2/2 缺下限:缺下限:缺上限:缺上限:第15页/共34页某地区某地区某地区某地区100100个百货商店个百货商店个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况月销售额与流通费用情况月销售额与流通费用情况销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U
13、下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)第16页/共34页编制等距数列实例编制等距数列实例编制等距数列实例编制等距数列实例己知己知己知己知5050个同学的英语考试成绩如下:个同学的英语考试成绩如下:个同学的英语考试成绩如下:个同学的英语考试成绩如下:要求编制组距数列。要求编制组距数列。要求编制组距数列。要求编制组距数列。78788989929266668080525277779696636382828080757548487474636371718888909067677
14、171888856566060727255557575848477776666909073737878848466665959636380809090747466668181707066667474828275758080818166667878第17页/共34页编制步骤:编制步骤:编制步骤:编制步骤:求全距求全距求全距求全距确定组距及组数确定组距及组数确定组距及组数确定组距及组数组距组距=全距全距组数组数组距和组数成反比的关系,组数的确定一般原组距和组数成反比的关系,组数的确定一般原则则 (1)正确的反映总体各部分质的差异)正确的反映总体各部分质的差异 (2)能够准确清晰的反映总体单位的分布
15、特征)能够准确清晰的反映总体单位的分布特征编制等距数列编制等距数列编制等距数列编制等距数列全距全距=最大值最大值-最小值最小值第18页/共34页确定组限确定组限确定组限确定组限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠;重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不在内上组限不在内”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法组限的表示方法组限的表示方法编制等距数列编制等距数列编制等距数列编制等距数列第19页/共34页 按照习惯,成绩
16、一般分为不及格、及格、中等、良好、优秀即即 组限组限 组中值组中值 6060分以下分以下 6070 65 6070 65 7080 75 7080 75 8090 85 8090 85 90 90分以上分以上上组限不在内上组限不在内第20页/共34页频数=每组单位数 频率=每组频数/总单位数组限组限频数频数比重比重%60以下以下51060701122708016328090132690分以上分以上510确定频数和频率确定频数和频率确定频数和频率确定频数和频率第21页/共34页四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)四、统计分类
17、标准化与常用的分组(类)(一)统计分类标准化统计分类标准化n n是统计标准化的一种(指标体系是统计标准化的一种(指标体系 分类标准分类标准 基本术语基本术语 编码)编码)按其适用的范围不同分为按其适用的范围不同分为:n n国家标准国家标准n n行业标准行业标准n n地方标准地方标准n n企业标准企业标准第22页/共34页四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)(二)国民经济中常用的几种分组标准1、经济类型分类(所有制结构)公有经济 国有经济 集体经济 非公有经济(私有经济 港澳台经济 外商经
18、济)2、三次产业分类(国民经济各部门分为三大类型)第一产业 第二产业 第三产业3、行业分类(三大产业的分类)第23页/共34页(二)国民经济中常用(二)国民经济中常用的几种分组标准的几种分组标准4、基本单位分类 机构单位(住户 法人单位)产业活动单位(基层单位是指位于一个地点、主要从事一种经济活动的单位。它与机构单位具有隶属关系,一个机构单位可能包含一个或多个基层单位,而一个基层单位仅属于一个机构单位)5、机构部门分类(四类)具有相同特征的机构单位合并在一起构成部门第24页/共34页第三节第三节 统计表统计表一、统计表的结构一、统计表的结构二、统计表的设计二、统计表的设计第25页/共34页统计
19、表的常用结构:统计表的常用结构:统计表的常用结构:统计表的常用结构:统计表的结构统计表的结构统计表的结构统计表的结构按照一定结构和顺序设计的表格按照一定结构和顺序设计的表格总总 标标 题题列标题(宾词)列标题(宾词)列标题(宾词)列标题(宾词)行标题(主词)行标题(主词)行标题(主词)行标题(主词)数据资料数据资料数据资料数据资料第26页/共34页列标题列标题行标题行标题数字资料数字资料总标题总标题20082008年浙江省各地市年浙江省各地市年浙江省各地市年浙江省各地市GDPGDP 单位:亿元单位:亿元单位:亿元单位:亿元地市地市GDP第一产业第一产业第二产业第二产业第三产业第三产业杭州杭州4
20、781.164781.16178.64178.642389.382389.382213.142213.14宁波宁波3964.053964.05167.36167.362196.682196.681600.011600.01温州温州2424.292424.2976.6876.681286.761286.761060.851060.85嘉兴嘉兴1815.31815.3105.52105.521085.291085.29624.49624.49湖州湖州1034.891034.8982.6382.63593.56593.56358.7358.7绍兴绍兴2222.952222.95116.65116.6
21、51329.121329.12777.18777.18金华金华1681.851681.8589.6189.61903.07903.07689.17689.17义乌义乌493.33493.3315.2815.28223.46223.46254.59254.59衢州衢州580.05580.0561.7161.71317.85317.85200.49200.49舟山舟山490.25490.2549.1849.18226.44226.44214.63214.63台州台州1965.271965.27133.54133.541037.471037.47794.26794.26丽水丽水505.68505.6
22、855.2655.26245.85245.85204.57204.57全省合计全省合计21486.9221486.921095.431095.4311580.3311580.338811.168811.16第27页/共34页二、统计表的设计二、统计表的设计二、统计表的设计二、统计表的设计q根据任务设计的统计表要主次分明,简明根据任务设计的统计表要主次分明,简明醒目,科学合理醒目,科学合理q统计表的形式应长宽比例适中,一般长方统计表的形式应长宽比例适中,一般长方形形q表的上、下端用粗线或双线封口,左右两表的上、下端用粗线或双线封口,左右两端一般不封口端一般不封口q表的纵栏较多时,可以按栏的顺序编
23、号表的纵栏较多时,可以按栏的顺序编号q统计表的总标题要简明扼要,在标题内或统计表的总标题要简明扼要,在标题内或标题下说明资料所属时间和空间标题下说明资料所属时间和空间第28页/共34页二、统计表的设计二、统计表的设计二、统计表的设计二、统计表的设计n n计量单位一致时应放在表右上角;计量单位一致时应放在表右上角;n n如果同栏单位相同各栏之间不同可在各栏标题中注明单位,如果同栏单位相同各栏之间不同可在各栏标题中注明单位,n n如果同行的单位相同各行之间不同可在各栏的前面增加一如果同行的单位相同各行之间不同可在各栏的前面增加一栏单位栏单位n n各栏数字的位数要一致各栏数字的位数要一致第29页/共
24、34页二、统计表的设计二、统计表的设计二、统计表的设计二、统计表的设计n n数据栏不能有空白,不应有数字用数据栏不能有空白,不应有数字用_ _表示表示;数字太小达不到数字太小达不到要求用要求用如果规定不报用如果规定不报用 n n主次或宾词的排序应遵循时间的先后、数量的大小、空间主次或宾词的排序应遵循时间的先后、数量的大小、空间位置等自然顺序排列。一般从小到大,从过去到现在位置等自然顺序排列。一般从小到大,从过去到现在 从低从低到高到高n n可在标下进行注释可在标下进行注释第30页/共34页练习题练习题n n5.5.统计分配数列(统计分配数列(统计分配数列(统计分配数列()n n都是变量数列都是
25、变量数列都是变量数列都是变量数列 都是品质数列都是品质数列都是品质数列都是品质数列 是变量数列或品质数列是变量数列或品质数列是变量数列或品质数列是变量数列或品质数列 是统计分组。是统计分组。是统计分组。是统计分组。n n7.7.将将将将2525个企业按产值分组而编制的变量数列中,变量值是(个企业按产值分组而编制的变量数列中,变量值是(个企业按产值分组而编制的变量数列中,变量值是(个企业按产值分组而编制的变量数列中,变量值是()n n产值产值产值产值 企业数企业数企业数企业数 各组的产值数各组的产值数各组的产值数各组的产值数 各组的企业数。各组的企业数。各组的企业数。各组的企业数。n n11.1
26、1.划分连续变量的组限和划分离散变量的组限时,相邻组的组划分连续变量的组限和划分离散变量的组限时,相邻组的组划分连续变量的组限和划分离散变量的组限时,相邻组的组划分连续变量的组限和划分离散变量的组限时,相邻组的组限(限(限(限()n n必须重叠必须重叠必须重叠必须重叠 前者必须重叠,后者可以间断前者必须重叠,后者可以间断前者必须重叠,后者可以间断前者必须重叠,后者可以间断n n必须间断必须间断必须间断必须间断 前者必须间断,后者必须重叠。前者必须间断,后者必须重叠。前者必须间断,后者必须重叠。前者必须间断,后者必须重叠。一、单项选择一、单项选择第31页/共34页n n12.12.在分组时,凡是
27、遇到某单位的标志值刚好等于相邻两组下上在分组时,凡是遇到某单位的标志值刚好等于相邻两组下上在分组时,凡是遇到某单位的标志值刚好等于相邻两组下上在分组时,凡是遇到某单位的标志值刚好等于相邻两组下上限数值时,一般是(限数值时,一般是(限数值时,一般是(限数值时,一般是()n n将此数值归入上限所在组将此数值归入上限所在组将此数值归入上限所在组将此数值归入上限所在组 将此值归入下限所在的组将此值归入下限所在的组将此值归入下限所在的组将此值归入下限所在的组n n将此值归入上限所在组或下限所在组均可将此值归入上限所在组或下限所在组均可将此值归入上限所在组或下限所在组均可将此值归入上限所在组或下限所在组均
28、可 另立一组。另立一组。另立一组。另立一组。第32页/共34页二、多项选择二、多项选择5.分布数列的两个组成要素为分布数列的两个组成要素为()品质标志品质标志 数量标志数量标志 分组分组 次数次数 分组标志。分组标志。在组距数列中,组中值在组距数列中,组中值()是上限和下限的中点数是上限和下限的中点数 是用来代表各组标志值的平均水平是用来代表各组标志值的平均水平在开口式分组中无法确定在开口式分组中无法确定在开口式分组中,可以参照邻组的组距在开口式分组中,可以参照邻组的组距来确定来确定就是组平均数。就是组平均数。现将某班级现将某班级40名学生按成绩分别列入不及格(名学生按成绩分别列入不及格(59分以下),及格分以下),及格(6069分),中等(分),中等(7079分),良好(分),良好(8089分),优秀分),优秀(90分以上)分以上)5个组中去,这种分组个组中去,这种分组()形成变量数列形成变量数列 形成组距数列形成组距数列形成品质分布数列形成品质分布数列 形成开口式分组形成开口式分组是按品质标志分组。是按品质标志分组。第33页/共34页