《统计学教材教学课件(全).ppt》由会员分享,可在线阅读,更多相关《统计学教材教学课件(全).ppt(353页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本章主要讲述统计学中的一些基本原理、基本理论和基本概念,从而使学生对统计学有一个大致的认识。 重点:了解统计的科学涵义及历史沿革,明确统计学的 学科性质及基本研究方法,牢固掌握统计学的基 本概念。 难点:统计学中的几个基本概念。 共分为三节: 第一节 统计的历史沿革及统计学的学科性质 第二节 统计数据处理的步骤 第三节 统计学中常用的基本概念 笫一节 统计的历史沿革及统计学的学科性质 一、统计的含义 含义包括:统计数据处理过程(统计工作或统计活动)、统计数据(统计资料)和统计学。统计是统计数据处理过程、统计数据、统计学的统一体。 统计数据处理过程是指对社会现象、经济现象、自然现象的数据资料进行
2、搜集、整理、分析研究的过程。 统计数据是统计工作过程中所取得的各项数字资料和其他与之相联系的资料的总称。 统计学是阐明如何搜集、整理和分析统计资料的理论与方法的科学。统计学是对统计实践活动的经验总结和理论概括。 统计三个方面的含义之间存在下列关系:统计数据是统计数据处理过程的成果,统计学是对统计数据处理过程的经验总结和理论概括,反过来又指导统计数据处理,使统计数据准确可靠。 二、统计的历史沿革 统计是适应人类社会实践活动的需要而产生和发展起来的。 原-文字产生之前 -“结绳记事”-统计计数活动-文字产生之后-古巴比伦的原始算版-古埃及的纸草记录-古印度的贝多罗叶记录-古代中国的甲骨文记录-统计
3、计数活动日益深入人类社会实践-统计计数活动-统计最初的萌芽。 奴-形成-统计也初步形成 公元前2000多年的夏禹-有了人口、土地等记载 尚书-有对居民生活条件的调查记录-“数量和分组的初步概念已经形成” 封-我国的统计已略具规模 商君书-强国知十三数,即“境内仓、口(府)之数,壮男、壮女之数,老弱之数,宦士之数,以言谈取食者之数,利民之数,马、牛、刍、藁之数” 封-各个朝代都进行过人口、土地、财产等方面的统计调查-并建立了一定的统计调查制度。 古希腊公元前600年-人口普查 古罗马公元前-建立了出生、死亡登记制度。 近代统计的发展是与资本主义的产生发展同步的 17世纪至18世纪-随-资本主义的
4、成长-人口、工业、农业的统计登记逐渐形成制度 “商业、工业、农业、海关、外贸、物价等方面的统计得到了很大的发展”。 随着统计实践的发展,欧洲出现了一些统计理论著作 在统计学的初创时期,政治算术学派和国势学派(记述学派)的理论占据了统治地位。1政治算术学派的创始人是英国人威廉配弟(W. Petty,1623-1687)和约翰格兰特(J. Graunt,1620-1674)。 威谦配弟的代表作是政治算术,该书运用大量实际统计资料,对英国、法国、荷兰三国的国情国力,作了系统的数量对比分析。他的利用实际资料,用数量、重量和尺度来说话的方法,为统计的创立奠定了方法论的基础。 约翰格兰特的代表作是对死亡率
5、公报的自然观察和政治观察,该书对伦敦人口的出生率、死亡率、性别比例作了分类计算和并编制了死亡率表,以死亡率表为依据进行了人口的统计推算预测。 2国势学派(记述学派)的创始人是德国人海康令(H. Conring,16061682)和高阿亨华尔(GArhenlwall,1719-1772) 阿亨华尔把拉丁语Status和意大利语Stato引伸为德语Statistika(国势学、统计学),意思是主要用文字来记述国家应注意的事项的学问。 3 1850年德国人克尼斯(KGAKnies,1821-1897)在作为独立科学的统计学一书中,将国势学正式命名为国家学,将英国人威廉配弟和约翰格郎特创立的政治算术正
6、式命名为Statistika(统计学) 4 1787年英国人齐麦曼(EAZimmeman)把德语Statistika译成英语Statistics(统计学)。 5 19世纪中叶,随着统计理论和实践的发展,又产生了数理统计学派。 数理统计学派的创始人是比利时人阿道夫.凯特勒(A.Quetelet,1796-1874)。其代表作有社会物理学。凯特勒把概率论引入统计学,使统计方法在准确性方面有了质的跃进 20世纪初以英国人费希尔(R.A.Fisher,1890-1962)为代表,将数理统计发展成用随机样本推断有关总体的推断统计。数理统计学派认为统计学是一门独立的方法论科学。 6 19世纪下半叶,德国人
7、克尼斯(KGAKnies,1821-1897)和梅尔(G.V.Mayr,1841-1925)在继承政治算术学派和在凯特勒的影响下创立了社会统计学派,社会统计学派的代表人物还有恩格尔(C.L.E.Engel,1821-1896) 社统计学派认为统计学是一门实质性的社会科学 6 20世纪上半叶,在前苏联及社会主义国家建立了社会经济统计学,社会经济统计学深受德国社会统计学的影响。前苏联统计学家认为统计学是一门独立的社会科学,排斥数理统计学,认为数理统计学是数学的一个分支 我们认为-社会经济统计学认为是经济领域的统计学-社会经济统计学、数理统计学和自然科学各领域的统计学确定为统计学的分支 认为社会经济
8、统计学是一门方法论的科学,社会经济统计学不排斥数理统计方法的运用,数理统计方法应是社会经济统计学的重要内容 本书着重研究社会经济统计学。 三、统计学的学科性质 1 研究对象 (1) 社会经济统计的研究对象是大量社会经济现象总体的数量方面,即研究社会经济现象总体的数量特征和数量关系 (2)社会经济统计学的研究对象也是大量社会经济现象总体的数量方面,和社会经济统计相比,它是对社会经济现象总体数量方面的间接研究,它的研究对象是社会经济统计这种调查研究活动的规律和方法 它研究如何搜集、整理和分析大量社会经济现象总体数量方面的规律和方法 社会经济统计学从其性质来讲,研究的是方法论,它是一门研究方法论的社
9、会科学2 社会经济统计具有如下特点: (一)数量性 由于社会经济统计的研究对象是大量社会经济现象的数量方面,因此,数量性就成为社会经济统计的基本特点。数量性特点具体包含三个方面的内容。 1数量的多少。即研究现象的规模、大小、水平等。 2现象间的数量关系。即研究现象的内部结构、比例关系、相关关系等。 3质与量间的关系。即研究现象质与量互变的界限、研究质与量的统一功行赏 (二)总体性 由于社会经济统计的研究对象是社会经济现象的总体的数量方面,因此总体性就成为社会经济统计的重要特点。 (三)具体性 社会经济统计的研究对象是具体事物的数量方面,不是抽象的量,因此,社会经济统计具有具体性特点。 (四)社
10、会性 社会经济统计以社会经济现象作为研究对象,有明显的社会性的特点;社会经济统计本身也是一种社会实践活动,更具备社会性的特征。 四、统计的认识过程 统计作为一种认识活动,其认识过程可以从两个方面来理解。 一方面,从质与量的关系看,统计的认识过程是从质开始到量,再到质与量的结合 另一方面,从个体与总体的关系看,统计的认识过程是从对个体数量的认识开始,再到对总体数量特征的认识五、统计研究的具体方法主要有大量观察法、统计分组法、综合指标法和统计推断法。 (一)大量观察法 大量观察法是指统计在研究社会经济现象及其发展变化过程中要从总体上加以观察,对现象总体的全部或足够多数的个体进行调查研究并综合分析,
11、从而反映现象总体的数量特征。(二)统计分组法 统计分组法是根据统计研究的需要和现象内在的特点,按一定标志,把总体划分为若干个不同部分或组的一种统计方法。 (三)综合指标法 将大量观察所得的资料进行加工、汇总,就可以得到反映现象总体一般数量特征的综合指标,运用各种综合指标对现象总体的数量方面进行分析,这种分析方法叫综合指标法。 (四)统计推断法 统计推断法是根据局部样本资料,按一定的置信标准,用样本数据来判断总体数量特征的统计分析方法笫二节 统计数据处理的步骤六统计数据处理的步骤统计数据处理的步骤有:统计设计、统计调查、统计整理和统计分析。 七、统计的基本职能 统计的基本职能是指统计本身所固有的
12、内在功能。统计具有信息、咨询、监督三大职能。 (一)统计信息职能 统计信息职能是指统计具有信息服务的功能,也就是统计通过系统地搜集、整理、分析得到统计资料,在统计资料的基础上再经过反复提炼筛选,提供大量有价值的、以数量描述为基本特征的统计信息,为社会服务。 (二)统计咨询职能 统计咨询职能是指统计具有提供咨询意见和对策建议的服务功能,也就是指统计部门利用所掌握的大量的统计信息资源,经过进一步地分析、综合、判断,为宏观、微观决策,为科学管理提供咨询意见和对策建议。统计咨询分为有偿咨询和无偿咨询两种。统计咨询应更多地走向市场。 (三)统计监督职能 统计监督职能是指统计具有揭示社会经济运行中的偏差,
13、促使社会经济运行不偏离正常轨道的功能,也就是统计部门以定量检查、经济监测、预警指标体系等手段,揭示社会经济决策和执行中的偏差,使社会经济决策及其运行按客观规律的要求进行。 (四)统计决策职能 统计决策职能是指为了达到某种既定的目标,在统计分析和统计预测的基础上提出各种行动方案,从中选择最优方案,执行并反馈的工作过程。 第三节 统计学中常用的基本概念八、统计总体和总体单位1统计总体统计总体是客观存在的,具有某种共同性质的个体所组成的整体。 例如,研究全国私营企业的情况,全国的私营企业就构成一个总体。例如,研究某省的零售企业状况,全省的零售企业就形成一个总体研究某市的零售企业状况,全市的零售企业就
14、构成一个总体再如,研究某市工伤事故情况,该市工伤事故就构成一个总体。 2构成总体的每个个体就是总体单位例如,全国的私营企业是一个总体,则每个私营企业就是一个总体单位。 总体按包含个体的多少可以分为有限总体和无限总体有限总体无限总体例如,生产线上大量连续不断生产出的某种小件产品,由于时间不断延续,该种小件产品就构成一个无限总体 统计总体具有三个基本特征:大量性、同质性和差异性。 (一)大量性 大量性特征是指总体应包含足够多的单位数 (二)同质性 同质性是指构成统计总体的每个个体必须至少在某一方面具有共同性质,就是这个共同性使这些个体结合成一个整体,同质性是构成总体的基础。 (三)差异性 差异性是
15、指构成总体的个体除了至少在某一方面具有共同性质外,在其他方面存在差异例如,全国的私营企业总体,除了都是中国的私营企业这一共同点外,在注册资本、投资规模、净利润、职工人数等等方面存在差异。 统计总体和总体单位的概念不是固定不变的,随着研究目的的改变,原来的总体有可能变为总体单位,原来的总体单位有可能变为总体。例如,研究全国的钢铁企业生产情况,宝钢就是其中的一个总体单位,而当研究宝钢的经济效益状况时,它又成为统计总体了。九、标志、指标和指标体系标志是说明总体单位属性或特征的名称全国人口总体,每个人是总体单位,其中某人是一个总体单位,他是男性,这个特征的名称叫性别,性别就是一个标志另外,年龄、民族、
16、文化程度、身高等也是标志 标志的具体表现是指在标志名称之后所列示的属性或数值在全国人口总体中,性别是个标志,性别分为男、女,“男”就是性别这个标志的具体表现,同样“女”也是性别这个标志的具体表现在全国人口总体中,身高也是个标志,各总体单位身高不完全相同,身高可以有1.75m、1.76m等等,“1.75m”就是身高这个标志的具体表现。 按标志的性质不同可以分为品质标志和数量标志品质标志是表明事物属性特征,只能用文字说明,不能用数值来表示的标志。性别只能用“男”、“女”两个文字来表示又如,所有制只能用“国有”、“集体”、“私营”、“合资”来表示数量标志是表明事物量的特征,用数值来表示的标志身高用“
17、1.75m”等数值来表示,身高是数量标志年龄、工资、产值、利润、成本等都用数值来表示,且说明总体单位,均为数量标志数量标志的具体表现也称做标志值 标志按变异情况可分为不变标志和可变标志 在一个总体中,对于一个标志来说,如果总体各单位具有相同的标志具体表现,则该标志叫不变标志。例如全国私营企业总体,所有制是不变标志 在一个总体中,对于一个标志来说,如果总体各单位具有不同的标志具体表现,则该标志叫可变标志。同样是全国私营企业总体,产值是可变标志 指标是说明总体的 对于指标有两种不同的理解,一种:认为指标是反映总体数量特征的概念或范畴。例如,国内生产总值是指标,国民收入、工业总产值、工业增加值、劳动
18、生产率等也是指标。这种理解包涵三要素:指标的含义、指标计算范围、指标计算方法及计量单位。这种理解是正确的,这种理解用于统计理论和统计设计 另一种认为指标是反映总体数量特征的概念加具体数值。例如1990年我国耕地面积95.7(43509.4万亩)是指标。这种理解不仅包涵上述三要素,而且包涵下列要素:指标所属时间、指标所属空间、指标数值。这种理解也是正确的,这种理解具体用于统计调查、统计整理、统计分析 指标按性质的不同分为数量指标和质量指标 数量指标是反映现象总规模、总水平或总数量的统计指标,又称总量指标。数量指标用绝对数表示 例如人口总数、国民生产总值、工业总产值、工资总额、职工总数等均是数量指
19、标 质量指标是反映现象本身质量或反映现象强度、密度、工作质量和经济效果的统计指标,质量指标表明现象的对比关系,质量指标用相对数或平均数表示 例如,平均工资、人均收入、人口密度、出勤率、设备利用系数、利润率等均是质量指标。 标志和指标既有区别又有联系。它们的区别是: 1)标志说明总体单位的特征,指标说明总体的特征。 2)有的标志可用数值来表示,如数量标志。有的标志不能用数值表示,如品质标志。而所有的指标都可用数值表示。 标志和指标间的联系是: 1)数量指标的数值是根据数量标志的标志值汇总而来的。例如某企业全部职工总体,每个职工是总体单位,工资是数量标志,工资总额是数量指标,工资总额是根据每个职工
20、的工资汇总得到的。 2)指标与标志间存在变换关系。随着研究目的的改变,原来的总体变为总体单位,原来的指标相应地变为数量标志;随着研究目的的改变,原来的总体单位变为总体,原来的数量标志相应地变为指标。 单个指标只能反映现象总体的一个侧面或一个方面,不可能反映总体的全面情况,为了揭示总体的全貌,必须把一系列相互联系、相互补充的指标结合起来应用。若干个相互联系、相互补充的指标结合在一起形成一个整体叫指标体系。 指标体系可分为两大类:基本统计指标体系和专题统计指标体系。 基本统计指标体系是指反映国民经济和社会发展及其各个组成部分基本情况的指标体系。具体又分三个层次:最高层次是反映国民经济和社会发展的统
21、计指标体系,从经济上讲主要是国民经济综合平衡指标体系,还应建立社会指标体系和科技指标体系;中间层次是各地区各部门统计指标体系,这个层次也应该建立中观经济综合平衡指标体系、中观社会指标体系和中观科技指标体系;第三是基层统计指标体系,它是指微观企业、事业单位的统计指标体系。 专题统计指标体系是指针对某项社会或经济问题而制定的专门统计指标体系。例如,就环保问题应建立环保指标体系;就能源问题建立能源统计指标体系,就社会保障问题应建立社会保障指标体系。十、变异和变量 变异是指标志的具体表现在总体各单位间的差异。例如在人口总体中,性别是个标志,男、女是标志的具体表现,在这个总体中,性别这个标志的具体表现在
22、总体各单位间是有差异的,这就是变异。同样在人口总体中,年龄是个标志,年龄在总体各单位间表现是不同的,有0岁、1岁、2岁、,这就是变异。变异分为品质变异和数量变异。人口总体中,性别分为男、女是品质变异 年龄表现为0岁、1岁、2岁、,是数量变异全国企业总体中,所有制分为国有、集体、私营和合资是品质变异 职工人数具体表现为10人、20人、是数量变异。 可变的数量标志和所有的统计指标称作变量,变量的具体取值叫变量值。例如在全国人口总体中,年龄是变量,年龄的具体取值0岁、1岁、2岁、是变量值又例如在某企业职工总体中,工资是变量,工资的具体取值600元、700元、是变量值。 变量可以按不同的标准进行分类
23、按变量值是否连续分为离散变量和连续变量 离散变量的各个变量值都是按整数位断开的 如职工人数、企业个数、设备台数 连续变量的各个变量值是连续不断的,相邻两值间可作无限分割 如身高、体重、面积、体积等。 变量按性质的不同分为确定性变量和随机变量 确定性变量是指变量值受确定因素影响,其变动方向明确呈上升或下降趋势 随机变量是指变量值受不确定因素的影响,其变动方向呈现偶然性。 本章思考与练习 1.简述统计的含义? 2.简述标志和指标,它们有何区别与联系? 3.简述统计学的学科性质? 4.简述统计研究的具体方法? 5.举例说明总体、总体单位、标志、指标、指标体系、变异、变量。第二章 数据收集学习目的:通
24、过本章的学习,使学生掌握数据收集的分类、数据收集的组织以及几种常用数据收集方式的特点和适用范围,并能用所学知识从事具体的数据收集工作,为后续的数据处理打下基础。 第一节 数据收集的分类 第二节 数据收集方案集的设计 第三节 数据收集的组织 第四节 数据收集问卷的设计。第一节 数据收集的分类一、统计数据的来源 1、直接来源:调查和科学实验 第一手资料 2、间接来源:公开出版物:公开出版物: 中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告。网络1、数据收集,又称统计调查,是指按照
25、预定的数据收集的要求、目的和任务,根据研究对象的特点,采取科学的调查方法,有组织、有计划地向调查对象搜集有关数据资料及了解具体情况的过程。它与一般社会调查有一些区别,数据收集主要着眼于数字资料的搜集,不是搜集个别单位的资料,而是搜集大量单位的资料,并能够据以汇总、计算、整理,形成说明总体的综合数据。 二、数据收集的概念2、 数据收集的基本要求: 精度:精度:最低的抽样误差或随机误差 及时性:及时性:在最短的时间里取得并公布数据 关联性:关联性:满足用户决策、管理和研究的需要 一致性:一致性:保持时间序列的可比性 最低成本:最低成本:以最经济的方式取得数据1、按数据收集的组织形式不同可分为: 统
26、计报表:又可分为: 全面统计报表 非全面统计报表 专门调查:如:普查、抽样调查、重点调查、典型调查等2、按数据收集研究的总体范围不同可分为: 全面调查: 普查、 全面统计报表 非全面调查:如抽样调查、重点调查、典型调查等三、数据收集的分类3、按登记资料的时间是否连续可分为: 经常性调查 一次性调查4、按搜集资料的方式不同可分为: 直接观察法:如盘点 报告法 : 如统计报表 采访法 :又可细分为: 询问法:个别深度访问 调查会 自填法:首先要设计好调查问卷或调查表 此外,通讯法也越来越得到广泛应用,如网上调查 四、数据收集(统计调查)方案由以下几部分构成: 一、确定调查目的 回答“为什么调查?”
27、,调查要达到的具体目标。 调查之前必须明确二、确定调查对象和调查单位(回答“向谁调查?”) 1、调查对象:即调查研究的对象,即总体 2、调查单位:需要对之进行调查的单位。可以是调 查对象的全部单位(全面调查),也可以是调查 的一部分单位(非全面调查)。三、确定调查项目和设计调查表(调查内容) 1、调查项目:即统计标志 调查项目数目的确定应贯彻少而精的原则2、调查表: 单一表 一览表四、方案设计中的其他问题 1、明确调查所采用的方法 2、确定调查时间:包括两个方面 (1)资料所属的时间 (2)调查工作时间:调查工作的起止时间,称为调查期限。 例:会计报表,上市公司年报制度等 3、确定调查地点:通
28、常就是调查单位所在的地点 4、调查的组织与实施细则 做好各项准备工作:如调查组织机构设置、调查人员配备、 经费、资料等 五、统计报表1、概念:统计报表是定期取得统计资料的主要方法,是按照国家调查文件的统一规定,以一定的表式、报送程序、报送时间自上而下统一布置、自下而上逐级提供统计资料的一种调查方式,也是一种定期的统计报告制度。 是一种具有法律性质的报表制度 2、分类:3、优点:信息量大 缺点:灵活性差,资料具有相对的可靠性4、资料来源:原始记录、统计台帐、企业内部 报表等1、要点:为特定目的专门组织的非经常性全面调查(1) 通常是一次性或周期性的(2) 一般需要规定统一的标准调查时间(3) 数
29、据的规范化程度较高(4) 应用范围比较狭窄2、组织形式: (1)设立专门的普查机构。 如人口普查 (2)不设立专门的普查机构和配备专门的人员。 如盘点3、注意事项:(1)选择合适的普查时期(调查期限) (2)确定标准时点(调查时间) (3)普查项目的一致性1、概念:是从总体中随机随机抽取一定数量的单位(样本)进行观察,根据对这一部分单位观察的结果(样本指标)来推算推算总体数量特征(总体指标)的一种非全面调查方式。2、特点: (1)随机原则:机会均等原则 (2)数量上的推算:样本指标 总体指标 (统计量) (参数) (3)误差可事先计算 (4)1、概念:是在总体中选择一部分重点单位进行调查, 借
30、以了解总体基本情况的一种非全面调查。2、重点单位:是指单位的数目在全部总体单位数目中只占较少的比重,但其标志总量在总体的标志总量中却占较大的比重的总体单位,即所谓的“重要的少数”。 例:要了解我国钢铁企业生产情况,只要对少数的几个大型的钢铁企业(如鞍钢、宝钢、首钢等)进行调查,就可了解全国钢产量的基本情况。1、概念:是在对所研究对象进行初步的全面分析的基础上,从中选择具有代表性的典型单位,作周密系统的调查,借以认识事物的本质及其发展变化规律性的一种非全面调查方式。2、特点: (1)首先对总体进行全面分析 (2)带有一定的主观性3、 十概念 数据收集问卷又称调查表或询问表,它是社会调查的一种重要
31、工具,它是由一连串题目组成的调查载体,是系统的记载调查内容和调查项目的表式,目的在于收集数据和材料,反映调查单位的具体内容,了解人们对某些问题的看法,为研究特定对象而服务。统计调查问卷是进行统计研究的前提和基础,是研究报告的支撑材料和重要组成部分,是通过调查研究、分析得出的结论与观点的来源和依据。 十一基本结构 一般而言,数据收集问卷的基本结构主要包括四个部分:开头部分、甄别部分、主体部分和背景部分。 本章思考与练习 1.什么是数据收集?数据收集的种类有哪些? 2.一份完整的数据收集方案,应包括哪些内容? 3.统计报表与普查有何异同? 4.调查问卷的基本结构是什么? 5.对你感兴趣的某个问题进
32、行调查 (1)你认为采用哪种调查方法比较合适? (2)设计一份统计调查方案。 (3)设计一份调查问卷。 学习目的:通过本章的学习,使学生掌握统计数据整理 的程序、统计分组的方法以及分布数列的编制、统计汇总的组织形式和技术方法,以及设计和编制统计表。 分以下几节来讲: 第一节 数据整理程序 第二节 统计分组 第三节 分布数列 第四节 统计汇总 第五节 统计表 一、数据整理的概念 数据整理又称统计整理,就是根据统计研究的目的和任务,将收集取得的大量原始资料进行科学的分类(或分组)、汇总,为数据分析提供条理化、系统化的综合数据资料的工作过程。有时,为了特定的目的,对已经整理过的数据资料(即次级资料)
33、进行加工,以满足统计分析的要求,也属于数据整理工作的范围。 (一)资料审核:1、对原始资料的审核 完整性审核:检查应调查的单位或个体是否有遗漏; 所有的调查项目或指标是否填写齐全。 准确性审核:逻辑检查:检查数据是否真实反映客观实际情 况,内容是否符合实际。 计算检查:检查数据是否有错误,计算是否正 确等。2、对第二手资料的审核:(二)统计分组:分类(三)统计汇总:加总,求合计数(四)编制统计表三、概念 1、概念:总体 各组2、分组原则: (1)周延性:即一个不漏(又称穷举原则) (2)互斥性:即不能重复(又称互斥原则) 即:要求保持组内资料同质性和组间资料的差异性1、区分社会经济现象的类型2
34、、研究总体的内部结构3、研究现象之间的依存关系1、概念:即分组的依据2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件(一)按分组标志的性质不同分 1、按品质标志分组 如:学生按性别分组,企业按所有制性质分组等 2、按数量标志分组 如:学生按年龄分组,企业按产值分组等(二)按分组标志的多少不同分 1、简单分组:对总体只按一个标志分组。 例:对企业这个总体按所有制性质、规模大小分别分组。 (1) (2) 国有 大型 企业 民营 企业 中型 其他 小型 若干个相互联系的简单分组构成平行分组体系2、复合分组:对同一总体按照两个或两个以上的标志层叠起
35、来进行分组 例: 大型 国有企业 中型 小型 大型 企业 民营企业 中型 小型 大型 其他经济类型 中型 小型 在复合分组方法下形成复合分组体系(一)按品质标志分组 1、选择品质标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现) 3、把各单位归入相应的组汇总出各组的单位数(次数) 有的很简单,如人口按性别分组。 有的很复杂(如人口按职业分组),可查相应的专业分类目录。 (二)按数量标志分组 1、选择数量标志作为分组标志 2、确定组数、划定各组的界限(较复杂) 3、把各单位归入相应的组汇总得出各组的单位数(称 为次数或频数;也可用相对数表示,称为频率) 分组后的结果通常用如下形
36、式来表示: 这种形式称为分布数列(或次数分布或频率分布)九、分布数列1、概念:在统计分组的基础上,将总体的各单 位按组归类整理,形成总体单位在各 组间的分布。这种表明总体单位数在 各组分配情况的资料称为次数(频率) 分布,又称分布数列。 例:我国第五次人口普查我国大陆人口年龄分布:2、构成: 由两部分构成:(1)各组 (2)各组次数(或频率) 3、种类:根据分组标志的不同可分为: 品质分布数列:P68 数量分布数列:简称为变量数列P69按各组表示方式不同可分为: 1、单项变量数列:每组用一个数表示。 适合于离散变量,且变量值较少的情况。 这种类似于品质数列的编制,相对比较简单。P70 2、组距
37、数列: 适合于连续变量和变量值较多的离散型变量1、组限:有:上限() 下限( L ) A、组限的表示方法有: (1)重叠组限: 如:10 20 20 30 (2)不重叠组限: 如:10 20 (只适用于离散变量) 21 30 B、组的表示方法: (1)闭口组:上、下限都有 (2)开口组:上、下限有一缺一2、组距计算公式:组距(i) = 上限 下限种类: 根据各组组距是否相等,组距数列可分为:等距数列 异距数列表示方法: 一般用5、10、20、50、100等类似数字表示。 另一相似的概念: 全距(R)= 最大变量值 最小变量值3、组中值 概念:每组中点的数值 计算公式: 对于开口组,需先假定其所
38、缺的上限或下限(假设开口组的组距与其相邻组的组距相等)。 如:2下限上限组中值4、组数(K) 组数、组距、全距之间存在如下关系: 可用经验公式来确定: K = 1 + 3.322lgn 但最佳决定还是依据常识和数列使用的目的而定。但最佳决定还是依据常识和数列使用的目的而定。)组数()全距()组距(KRi 1、排序: 排序后 :(1)求出全距 R (2)确定变量数列的种类 (等距数列或不等距数列) 2、确定组距和组数3、划定各组的界限4、汇总得出各组单位数(次数)例:P72-P75做: 某工厂同工种的50名工人完成生产定额百分数(%)资料如下: 83 88 123 110 118 158 121
39、 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 根据上述资料编制变量数列十三分布数列的表示方法(一)表示法计算累计次数方法:1、向上累计:由变量值小的组向大的组累计,累计次数表示该组上限以下(比该组上限小)的组的次数的总和,所以又称为较小制累计。2、向下累计:由变量值大的组向小的组累计,累计次数表示该组下限以
40、上(比该组下限大)的组的次数的总和,所以又称为较大制累计。常用图形有: 次数分布直方图 次数分布折线图 次数分布曲线图 累计次数折线图 饼状图(圆形图)A、直方图B、折线图折线图又称频数多边形图。折线图又称频数多边形图。 对于组距数列,把直方图中各顶边的中点对于组距数列,把直方图中各顶边的中点用直线连接起来(用直线连接起来( 注意与横轴的交点)。注意与横轴的交点)。 对于单项变量数列也可以画次数折线图。对于单项变量数列也可以画次数折线图。C、累计次数折线图累计次数折线图 累计次数折线图有两种形状:或持续增累计次数折线图有两种形状:或持续增长的或持续减少的。这分别取决于向上累计长的或持续减少的。
41、这分别取决于向上累计或向下累计。或向下累计。D、曲线图: 当变量数列中的组数愈加增多,变量值也非常多时,当变量数列中的组数愈加增多,变量值也非常多时,折线图会逐步过渡到平滑曲线。折线图会逐步过渡到平滑曲线。频数分布曲线图频数分布曲线图实质上实质上是对应于连续变量的频数分布的是对应于连续变量的频数分布的函数关系图函数关系图。曲线图常见的类型有:钟型分布、J型分布、U型分布应用:洛仑兹曲线和基尼系数应用:洛仑兹曲线和基尼系数 洛仑兹(洛仑兹(Lorenz)曲线是反映社会收入分配平均程度曲线是反映社会收入分配平均程度的一种累计百分数曲线,其特点是在纵轴和横轴上都进的一种累计百分数曲线,其特点是在纵轴
42、和横轴上都进行累计。(下凹程度愈大,表明收入分配愈不公平)行累计。(下凹程度愈大,表明收入分配愈不公平)基尼系数基尼系数 意大利经济学家基尼意大利经济学家基尼(Gini)根据洛仑兹曲线提出了根据洛仑兹曲线提出了判断收入分配平均程度的量化指标。判断收入分配平均程度的量化指标。 BBAG1、条形图人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 某城市居民关注不同类型广告的人数分布图某城市居民关注不同类型广告的人数分布图2、圆形图(饼形图) 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告
43、4.5% 服务广告25.5% 招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成十四、概念 在分组的基础上,将总体各单位分别归入各组,计算各组及总体的单位数,各组及总体的标志总量,使原始统计资料转化为综合统计资料的工作过程。即加总合计的过程。十五、组织形式1、逐级汇总:自下而上逐级汇总 如:班组 车间 厂部2、集中汇总:集中起来,一次汇总 厂部 车间 班组3、综合汇总:以上两种方式结合使用十六、技术方法1、手工汇总:常用的有 划记法 过录法 折叠法 卡片法2、计算机汇总十七统计表的概念十七统计表的概念 统计表是表示统计资料的表格,在由横统计表是表示统计
44、资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。地组织和合理地安排大量数字资料。 十八、统计表的结构横行标题数字资料总标题纵栏标题主词宾词从内容来看,一张统计表由两部分构成:1、主词:即统计表所要说明的对象。即横行标题。2、宾词:即用来说明统计表所要说明的对象,包括用 来说明对象的有关标志或指标的名称(即纵栏 标题)及其具体数值(即数字资料)。根据主词是否经过分组及分组方法不同,可分为: 1、简单表:主词未分组 2、简单分组表:主词经过简单分组 3、复合分组表:主词经过复合分组 即主词的三种设计方法 简单分组表中国人
45、口年龄结构状况中国人口年龄结构状况 (单位:(单位:%) 复合分组表我国社会福利主要费用情况我国社会福利主要费用情况 ( 单位:亿元)单位:亿元)1、简单设计:宾词平行排列 如表3-11 P882、复合设计:宾词层叠排列 如表3-12 P891、要合理安排统计表的结构2、各项标题要简洁明确。总标题内容应满足3W要求。3、表内各行、列按合乎逻辑的顺序排列并编号。4、计量单位和数字填写。5、表中的上下两条横线一般用粗线,其他线用细线。6、通常情况下,统计表左右两边不封口,即开口式表格。7、必要时可在表的下方加上注释1、某工厂同工种的50名工人完成生产定额百分数(%)资料如下: 83 88 123
46、110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 要求:(1)根据上述资料编制变量数列 (2)根据(1)的结果绘制直方图、次数折线图 和累计次数折线图。学习目标:掌握反映集中趋势的综合指标的含义、核算方法,掌握反映离中趋势的综合指标,并能灵活运用综合指标分析研究现实问题。具体有以下
47、几种指标: 第一节 综合指标的分类 第二节 集中趋势指标 第三节 离中趋势指标 第四节 是非标志的平均数和标准差 第五节 形状指标 一综合指标 经过统计整理就可以得到反映社会经济现象总体数量特征的统计指标,这就是综合指标 统计上常用综合指标对社会经济现象的数量方面进行分析,这种分析方法叫综合指标法 综合指标分类 第一类是反映社会经济现象总规模、总水平的综合指标,即总量指标,其表现形式为绝对数。 第二类是反映社会经济现象之间数量联系和数量对比关系的综合指标,即相对指标,其表现形式为相对数。 第三类是反映社会经济现象某一数量标志一般水平的综合指标,即平均指标,其表现形式为平均数。 第四类是反映各个
48、标志值的变动范围或离散程度的变异指标,变异指标中的平均差、标准差、方差,从计算方式看,也可认为是特殊形式的平均指标。 第五类是通过与正态分布相比较来描述次数分布特征的的形状指标,形状指标中的偏度、峰度,从计算方式看,也可认作为特殊形式的相对指标。 前三者综合指标反映集中的趋势;变异指标反映离中的趋势;形状指标反映分布的对称程度和尖峭程度。反映集中趋势的指标包括:总量指标相对指标和平均指标.二、总量指标 是反映现象在一定条件下总体总量、总规模、总水平的综合指标。 特点: (1)只有有限总体才能计算总量指标 (2)数值随研究范围的大小而增加或减少 (3)最基本的指标,是计算其他指标的基础总量指标种
49、类 (一)按反映的内容不同分为 1、总体单位总量-总体单位数之和 2、总体标志总量-标志值之和 例:某企业有500名职工,某月工资总额为100 万元 总体单位总量总体标志总量(二)按反映的时间状况不同可分为: 1、时期指标反映现象在一段时期内活动过程总结果的总量指标-工总钢总量商零售总额 2、时点指标-现象在某一特定时间点上状况的总量指标-期末职工人数人口数牲畜存栏头数(三)按计量单位不同可分为 1实物指标:以实物单位计量的总量指标反映使用价值自然计量单位-台、人、辆度量衡单位-公斤、吨、米标准实物单位-将发热量不同的煤折算为标准煤 -将不同含量的化肥折算为含量100%的化肥 2、价值指标:用
50、货币单位计量的总量指标,如国内生产总值、商品销售总额、总成本等-高度综合能力,能把不同事物通过货币单位直接加总3、劳动指标:有工时、工日。一般仅在单位内部使用,如开展劳动竞赛三、相对指标 是采用对比的方法,反映现象之间数量对比关系和联系程度的综合指标。表现形式-是相对数,具体表现为:(1)无名数:无计量单位,用%、系数、倍数等表现(2)复名数:主要用于强度相对数,表明事特的强度、密度和普遍程度,如人口密度-人/平方公里、人均国民生产总值-元/人、人均粮食产量-公斤/人(一)计划完成相对指标 1、计算公式: 例:某企业去年实现工业增加值500万元,今年计划比去年增长10%,实际增长20%,问该企