《第一章 管理统计基础.doc》由会员分享,可在线阅读,更多相关《第一章 管理统计基础.doc(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 管理统计基础管理统计学是关于宏观经济和微观企业现象的数量表现、数量关系、资料的搜集、整理、描述、推断和分析的方法论学科。也就是说,其研究对象是运用于宏观经济和微观企业现象的数量方面的统计方法。统计是认识社会的有力武器,统计信息是社会经济信息的主体。人们要从事经济研究和各种社会经济管理活动,势必要对社会经济现象进行统计调查研究,以达到认识事物的特征及其规律性的目的,进而作出正确的决策。这是一项严密科学的工作。在完成每项统计任务时,一般需要经历三个不同而又密切相联的基本环节,即统计调查、统计整理和统计分析。这三个环节虽然各有其相对独立性,但又相互滲透,常常是交叉进行的。任何环节上出现偏差和
2、失误,都会影响整个统计工作的质量。因此学会运用统计工具,掌握基本的统计方法是非常必要的。本章将介绍资料的搜集、整理、描述和最基本的统计分析内容,统计推断和进一步分析的其他内容,将在以后的章节中阐述。第一节 数据资料的搜集与调查误差一 统计中的几个基本概念:1.统计总体与总体单位统计总体简称总体,是指客观存在的、具有某种共同性质的众多个别事物的集合。构成总体的这些个别事物称为总体单位。总体可以分为有限总体和无限总体。总体所包含的单位数是有限的,称为有限总体;总体所包含的单位数是无限的,称为无限总体。2 统计标志统计标志简称标志,是说明总体单位属性或特征的名称。从不同角度考察,每个总体单位可以有许
3、多特征。如每个职工可以有性别、年龄、民族、工种等特征。这些都是职工的标志。标志表现是标志特征在各单位的具体体现。职工的性别是“女”,年龄为32岁,民族为汉族等,这里“女”、“32岁”、“汉族”就是性别、年龄、民族的具体体现,即标志表现。标志按其性质可以分为品质标志和数量标志。品质标志表示事物的质的特性,是不能用数值表示的,如职工的性别、民族、工种等。数量标志表示事物的量的特性,是可以用数值表示的,如职工年龄、工资、工龄等。3 变量与变量值可变的数量标志称为变量。变量的具体表现,就是可变的数量标志的不同取值,称为变量值(亦即标志值)。例如,工资就是一个变量。某企业各个职工的工资分别为1000元、
4、1020元、1500元,等,都是工资这一变量的不同取值,即变量值。变量按照其取值是否连续,可分为连续变量和离散变量。如果变量的取值是连续不断的,即在任意两个不同数值之间可以取无限多个不同的数值,则称之为连续变量。例如,人体的身高、体重等都是连续变量。如果变量的所有可能的取值至多有可列无限个,则称之为离散变量。例如,职工人数、企业数、机器台数等都是离散变量。二 数据资料搜集的涵义、要求和途径数据资料搜集是根据统计任务的要求,运用科学的调查方法,有组织、有计划地取得统计分析所需的数据资料的活动过程。任何统计研究都是从对被研究现象和过程的一定资料的搜集开始,统计数据是统计分析和研究的基础,统计工作的
5、质量在很大程度上取决于统计调查的质量,如果调查工作组织的不好,搜集的数据资料不准确或残缺不全,就会影响人们正确认识客观事物的真相,有时甚至会将人们引入歧途。同时,在瞬息万变的信息社会里,能否及时获取所需信息,也是搜集统计数据资料时必须予以注重的问题。因此,统计数据的搜集必须准确、及时、全面和系统。管理统计学首先要研究获取既能符合研究分析需要,又能真实反映客观实际的统计数据的方法。获取统计数据资料有两种途径:一是通过统计调查获取原始资料,二是通过已经公开出版或发表的各类出版物搜集次级资料。原始资料是指通过统计调查,向被调查单位直接搜集的尚待汇总整理而保持原始状态的第一手资料,它是进行统计整理和统
6、计分析的基础。所谓次级资料是指已经加工整理、能在一定程度上说明总体现象特征的统计资料。次级资料主要是公开出版或公开报道的数据,当然也有些是尚未公开出版的数据。可以提供次级资料的出版物,大致可分为政府的、法人的和国际的三类。其中,政府的出版物是我们取得统计信息的主渠道。如中国统计出版社出版发行的中国统计年鉴、中国统计摘要、中国农村统计年鉴、中国工业经济统计年鉴、中国物价统计年鉴、中国劳动工资统计年鉴、中国城市统计年鉴、国民收入统计资料汇编、全国城镇居民家庭收支调查等。还有其它政府机构及研究所公开出版或发表的统计资料。法人组织的出版物,是指那些众多信息中心、咨询机构等编辑出版的统计数据,或通过各种
7、新闻媒体传播的统计信息。国际组织的出版物包括联合国等较有影响的五大国际组织每年出版发行的统计出版物,也有世界各国政府等组织出版的统计出版物。如联合国统计年鉴、世界发展报告、世界经济展望、美国统计摘要、日本统计月报等。显然,次级资料的搜集通常较为容易,而且任何次级资料都是在原始资料的基础上加工整理得到的,因此,统计调查的基本任务就是取得反映调查对象各个单位的原始数据资料。下面我们着重介绍原始数据资料的搜集方法。三 原始数据资料的搜集原始数据资料可以通过组织多种形式的统计调查来获取。为了准确及时地搜集原始数据资料,就应该根据不同的调查对象和调查目的,采取各种不同的调查方式和方法。(一)统计调查的方
8、式常用的统计调查方式有:定期统计报表制度、普查、抽样调查、重点调查和典型调查。下面我们简要介绍这几种方式。1 定期统计报表制度(statistical report forms)定期统计报表制度是一种按照国家有关法规规定的统一表式、统一指标内容、统一报送时间和程序,由调查范围内的所有调查单位自下而上逐级定期向国家各级领导部门提供统计资料的一种调查方式。例如,税务管理部门每月都要填报税收情况表,以便上级机关掌握税收情况,据此制定和调整税收政策。定期统计报表是我国统计调查的一种重要的组织形式。与其它统计调查方式相比,它具有如下优点:第一,按国家法规,在规定范围内的各单位必须按要求填报报表,保证了数
9、据资料的全面性和连续性;第二,由于从调查内容、表式到时间都是统一规定的,从而保证了资料的统一性和及时性;第三,根据规定,必须按原始记录填报报表,这有利于基层单位建立起原始记录,从而使数据资料的来源和准确性有可靠基础。但这种调查方式也有不足之处,其不足之处主要在于:第一,在经济利益多元化的条件下,有些单位为了本单位的利益可能瞒报、虚报某些数据,影响资料的质量;第二,如果上级机关向下布置的报表过多,会增加基层单位负担。定期统计报表按填报周期的不同,分为日报、周报、旬报、月报、季报、半年报和年报。填报周期的长短与报表内容的繁简、报送时间的快慢密切联系。一般而言,报告周期越短的报表,内容越简明,越强调
10、报送时间的迅速,报告周期长的报表,内容可以详尽一些,报送时间可以宽松一些。2 普查(census)普查是调查组织者为了详细了解某项重大问题的有关情况而专门组织的一次性全面调查。一般用于国情国力的调查。例如全国人口普查、工业普查、农业普查和第三产业普查等等,都是为了摸清和掌握上述各方面有关国情国力详细的基本情况,由国家组织的全面调查。普查的特点在于,它比任何其它调查方式所获得的资料更全面、更系统、更详尽,例如,1985年我国举行的第二次全国工业普查,包括工业生产的全部要素,投入产出的全过程。这次普查资料极为丰富,仅国家一级就出版了42册,2.3万页的资料,并建立了大型工业统计数据库。但其涉及的面
11、广,调查内容多,需动用大量人力、物力、财力和时间,准备和组织工作复杂繁重,所以不宜频繁地进行。在普查中,一般应注意以下几个问题:(1)规定统一的调查标准时点。确定资料所属的标准时点,是为了避免因调查时点不一致而发生资料的重复或遗漏现象。例如,我国1990年第四次人口普查的标准时间是该年的7月1日零时,全国各地区的人口数都是这一时点上的数字,合计全国总人口数为113 051万人。不论登记的时间是在规定的时点以前或者以后,都必须按标准时间的实际状态调整,以取得标准时间上的准确数字。标准时间一般定为调查对象比较集中、相对变动较小的时间上。(2)规定统一的普查登记的时期。普查时期的确定,应考虑普查任务
12、特点和实施的条件,一般选择在被调查现象变动最小或者最适宜进行普查工作的时期。普查范围内的调查登记工作应同时进行,尽可能在最短期限内完成,以期在方法上、步调上一致,保证普查资料的准确性和时效性。(3)统一规定普查项目。普查项目应简明,尽可能以少而精的普查指标取得必要的数据。同一类型的各次普查,其普查项目应相对稳定,以便于历史资料的对比研究。(4)规定统一的汇总程序和时间,规定严格的质量控制标准和检验方法。(5)普查尽可能按一定周期进行,以便对其所取得的资料进行动态分析和比较,从中发现某些变化规律和趋势。至于普查的间隔周期时间究竟要多长,则应根据普查的目的和调查的条件来确定。如一些国家规定每十年进
13、行一次普查,人口普查、工业普查、商业普查、农业普查等在一个年代中均匀分布。我国过去的普查工作是不定期的,但我国的统计制度已做了相应的规定,今后我国的普查将规范化、制度化,即每逢年份的末尾数字为“0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢“1”或“6”的年份进行全国基本单位的普查。 3抽样调查(sampling survey) 抽样调查是一种非全面调查方法,是统计制度规定中最基本的常规的统计方法。它既可以为国家宏观统计所使用,又可以运用于许多微观场合。抽样调查就是按照随机的原则从被研究现象总体中抽取少量的单位作为样本
14、,进行统计观察,并根据对样本调查所获得的数据资料推断总体数量特征的一种调查方法。抽样调查自19世纪末20世纪初以来,在世界各国的统计实践中得到了广泛的运用。与全面调查形式相比,抽样调查具有方便、灵活,节省人、财、物力,能及时提供调查结果资料等诸多优点。与其它非全面调查形式相比,抽样调查具有如下两个特点:一是排除主观因素的影响,按随机原则抽取样本单位,样本单位对总体具有代表性,样本数据资料可用于推算总体数量特征和数量表现。而其它非全面调查都需选择代表性单位,不具备推算总体数量特征的条件。二是抽样误差可以事先计算并加以控制。抽样调查的结果用于推断总体数量特征,不可避免地会产生误差。但抽样推断的理论
15、基础是概率论,它不仅可以估计出抽样推断误差的大小,而且可以通过一定方法控制这些误差,保证抽样推断结果达到预期的可靠程度。抽样调查的特点决定了它的适用范围,归纳起来有:(1)不可能进行全面调查的场合。例如,具有破坏性的产品质量检验,像显像管、电子管、灯泡、汽车轮胎里程检验等。(2)不必要或难以进行全面调查而又必须取得总体数据的现象。例如,个体工商业营业状况调查,城市居民家庭生活情况调查,江河湖海中生物种类和数目的调查,等等。(3)对普查资料进行修正、补充的场合。普查涉及面广,工作量大,容易产生登记性误差,即出现重复登记或遗漏现象。通常,可以在普查完毕之后,做一次小规模的抽样调查,将抽样调查的结果
16、同原来的普查资料进行核对,计算出差错比率,然后以其作为修正系数,对普查资料进行必要的修正。根据总体的不同特点,抽样调查又可采用简单随机抽样、分层随机抽样、系统随机抽样、整群随机抽样等不同的形式。这些内容我们将在第三章第五节中更详细地介绍。4 重点调查(focal point of survey)重点调查是调查组织者为了了解被研究现象的基本情况,在被调查总体中选出一部分重点单位进行调查的一种非全面调查方法。所谓重点单位,是指这一部分单位在全部单位中只占一小部分,但其在所调查的数量方面占有较大的比重。例如,对首钢、鞍钢、武钢、宝钢等几个大型钢铁企业进行调查,就足以对全国钢铁产品的品种、质量和产量等
17、情况作出基本分析。这些大型钢铁企业的集合,就是重点单位。重点调查的关键是正确选择重点单位。挑选重点单位应遵循以下两个原则:一是被选作重点单位的单位数占总体单位数的比重要较小;二是重点单位被调查的标志值之和占总体相应指标值的比重较大。重点调查的优点在于调查单位少,节省人力、物力和时间,调查项目可相对多一些、详细一些,且可进行较深入的研究。它的不足之处在于不能完整地反映或推算现象总量的全面数据,只能了解现象的基本情况。可见,当调查任务只要求掌握现象总体的基本情况,不要求掌握全面数据,而部分重点单位又能集中反映所研究项目和指标时,适合采用重点调查方法。5 典型调查(typical survey)典型
18、调查是从被调查总体中有意识地挑选个别或少数具有代表性的单位,进行深入细致的调查研究的一种非全面调查方法。典型调查中的首要问题是如何正确选择典型单位。所谓典型单位,是指客观存在的同一事物中在某个方面具有代表性,不仅能反映总体的外部特征,而且能深刻地反映出事物的本质、内在联系及其发展趋势的代表单位。一般来说,典型单位是根据调查目的和要求,在对被研究对象进行分析研究的基础上,有意识地挑选出来的。借助于典型调查,易于掌握个别单位的生动情况,具体了解现象发展变化的原因和规律,总结经验教训,在全面调查中发现的问题可通过典型调查作出深入说明,补充全面调查的不足。但典型调查中典型单位的确定带有主观性,同时用典
19、型资料不能对总体的数量特征作出精确的推断。 以上各种调查方式各有特点,应根据研究需要和实际条件灵活地结合应用各种调查方法。从宏观层面上看,我国现行的统计制度规定,宏观信息的取得将主要借助于普查和抽样调查。它规定以周期性的普查为基础,以经常性的抽样调查为主体,补充以定期统计报表、重点调查和典型调查等统计方法。(二)搜集资料的方法不论采取何种方式进行调查,在取得统计资料时,都有一些具体的搜集数据资料的方法。数据资料的搜集方法归纳起来可分为观察实验法、报告法、问卷调查法、访问法和卫星遥感法。1观察实验法观察法和实验法是调查者通过直接地调查或实验以获取数据资料的一种方法。观察法是指调查人员亲自到现场,
20、对调查对象进行实地观察、计数和测量,以取得资料的一种调查方法。如对商品库存的盘点、农作物产量的实割实测调查;对工业产品质量或设备性能的现场测定检验;对马路上车流量的观测等。这种方法的优点在于所搜集到的资料比较真实可靠;其缺点是需要花费大量的人力、物力和时间。同时,对于历史资料的搜集,无法直接进行观察和计量,因此,还要利用其它的方法获取所需数据资料。实验法是指在所设定的特殊实验场所、特殊状态下,对调查对象进行实验以取得所需数据资料的一种调查方法。例如,新产品的市场实验,企业对一种新产品,让消费者免费使用,以得到消费者对新产品看法的数据资料。2报告法报告法就是以各种原始记录和核算资料为基础,由调查
21、单位按照有关规定和隶属关系,逐级向上提供统计资料的方法。我国目前各企事业单位填报的统计报表就是采用这种方法逐级上报的。如果原始记录和核算工作健全,各个企业和单位能遵守统计制度和法规,采用这种方法可以保证取得可靠的资料。3. 问卷调查法问卷调查法就是以问卷形式提问,由被调查者自愿回答的一种搜集资料的方法。实施问卷调查的步骤为:(1)明确调查目的;(2)确定调查内容;(3)设计问卷调查表;(4)实施调查。问卷调查法的关键是问卷的设计。问卷必须精心设计,问题要提得简明、准确,否则会影响问卷的回收率和答案的质量。4. 访问法访问法就是调查者向被访者提问,根据被访者的答复以取得资料的一种调查方法。此种方
22、法根据不同情况又可进一步分为直接采访法和通讯采访法。例如,在市场调查中较为盛行的派访员(即调查者)与被访者通过面对面的交谈从而获得所需数据资料的方法就是直接采访法。有些情况下,为了获得比较可靠的调查结果,调查人员事先设计好标准化的问卷或表格,在实施调查时对被访者进行有顺序地依次提问,并由受访者作出回答。所以这实际上也是一种问卷调查。通讯采访法通常采用的是电话采访、邮寄问卷等形式。此外,访问法根据一次采访中同时被通讯访问的人数的多少,还可以分为个别询问、开调查会和自填法。个别询问法又称派员法,即在调查过程中,由调查人员对被调查者逐项询问,及时纠正资料的差错;同时对调查项目有统一的理解,因此可以保
23、证调查资料的准确性和一致性。这是人口普查中常用的方法,但需要花费大量的人力和时间。开调查会法就是邀请熟悉情况的人员座谈,调查者和被调查者共同商讨,相互核对,深入了解实际情况,取得较为可靠的资料。自填法就是调查机构把调查表分发给被调查者,要求填好后送还。这种方法可以节省人力和时间,但调查资料的质量,与被调查者的政治觉悟和文化水平有关,常因对调查的问题及其要求的理解不一致而受到影响。如果调查的问题不复杂,对调查结果并不要求过于精确,而被调查者为数不多,则在一定条件下,自填法可以作为一种辅助的调查方法。利用访问法搜集统计资料,最关键的是要有高素质的访员和设法争取被访者的配合。值得注意的是,有些情况下
24、访问法和问卷调查法之间没有明显的界限。5卫星遥感法卫星遥感法是一种利用卫星高度分辨辐射技术提供统计所需的各种空间资料的方法。目前此种方法在气象研究、环境监测、农业统计中已得到很好利用。随着科学的进一步发展,卫星遥感法的运用将会越来越广泛。四 调查误差统计调查的目的是取得能准确反映客观现象实际状况的统计资料。但是,不论采用什么途径或哪种调查方法,搜集到的数据资料总会由于种种原因而存在一定程度的误差。调查误差的产生可以归结为两类原因,由此形成两种调查误差,即登记性误差和代表性误差。登记性误差是由于调查过程中有关环节上的工作不准确而引起的,如计量错误、记录错误、计算错误、抄录错误、汇总错误等都可以导
25、致登记性误差。另外,调查者或被调查者有意识地弄虚作假,虚报瞒报所造成的误差也属于登记性误差。在任何统计调查中都有可能出现登记性误差。不过非全面调查一方面由于参加的人员少,调查员有条件接受比较严格的培训,另一方面涉及的调查对象也少,所以对于非全面调查而言登记性误差比全面调查相对要小,但非全面调查却存在全面调查所没有的代表性误差。代表性误差是指用总体中的一部分单位的数量特征来估算总体的数量特征时所必然产生的误差。例如,一地区有两万户居民,抽其中200户进行收入情况调查,求得人均收入为950元,把950元视为整个两万户居民的人均收入水平,就会产生代表性误差。显然,这种误差产生的原因在于所调查单位对总
26、体的代表性。代表性好,误差就会小;代表性差,误差就会大。主观上讲,统计调查误差为零是最理想的结果。然而实践中常常做不到这一点。一般是着眼于减少统计调查误差,使其缩小到最低限度或可以接受的限度。防止和减少登记性误差,需要做好下面两个方面的工作:首先,要正确制定统计调查方案,包括明确调查对象的范围,说明调查项目的具体含义和计算方法,选定合理的调查方法,以使调查人员或填报人员有一个统一的依据。其次,要抓好调查方案的实施工作。包括加强统计调查人员的业务培训,提高对统计调查工作重要性的认识;搞好统计基础工作,建立健全计量工作、原始记录、统计台帐和内部报表等,使统计调查具备稳定、可靠的资料来源;对调查资料
27、加强审核工作,发现问题及时纠正。为防止因弄虚作假所产生的登记性误差,应从建立健全统计法制入手,使上上下下都认识到,弄虚作假、虚报瞒报是一种犯法行为;同时教育统计人员敢于坚持原则,同一切弄虚作假的行为作斗争,维护统计数字的真实性。 关于代表性误差的防止,如是用重点调查、典型调查和非全面统计报表的结果估计总体,调查前要多加研究,使选出的调查单位具有较高的代表性;如果是抽样调查,则需要严格遵守随机原则,保证足够的样本容量,选择适当的抽样调查方式方法,以控制误差的范围。有关问题将在后面章节做详细介绍。第二节 数据的整理与描述统计一 数据整理的意义和内容统计调查取得的原始数据资料,仅仅说明各单位的具体情
28、况,是分散的、不系统的,是反映事物的表象、事物的某一侧面或外部联系的感性材料。要实现对现象总体的数量方面的规律性认识,就必须对这些数据资料进行加工整理,使之系统化、条理化,成为能够反映现象总体特征的数据。例如,对某班40名学生某次考试成绩按试卷登记得到如下资料:64 70 89 64 56 95 98 79 88 8878 89 60 78 68 79 79 95 68 6078 89 100 50 75 84 78 64 78 8585 79 70 84 68 75 89 75 78 75这些调查数据是对个体数量标志值的登记,必然呈现为分散的、凌乱的状态,因为对总体的调查是从个体入手,从而得
29、到原始资料的自然状态。我们必须从大量的、分散的原始数据中加工整理,得出能够反映总体特征的综合性数据,才能显示出该现象的特征和发展变化规律。数据资料的整理简称统计整理,就是根据统计研究的目的和任务,将调查取得的大量原始资料进行科学的分类(或分组)和汇总,为统计分析提供系统化和条理化的综合统计资料的工作过程。统计整理实现了由个别单位数量标志表现向总体数量特征的综合过渡,为统计分析提供了前提保证。统计整理工作的质量,直接影响对社会经济现象的准确的数量描述和数量分析。统计整理的内容主要有:(一) 统计分组统计研究的任务除了需要对总体进行整体分析外,还要对总体的各个不同组成部分进行分析,以便补充、丰富和
30、深化对总体的认识。因此,统计分组是统计整理的基础。 (二) 统计汇总统计汇总是在统计分组的基础上,选择适当的汇总组织形式和具体方法,按分组要求对原始资料分组汇总,计算各组单位数、合计数、各组指标值和综合指标值,使原始资料转化为综合统计资料的过程。其作用在于反映出研究对象的全貌及分布状况。统计汇总是统计整理的中心内容。统计汇总的组织形式有逐级汇总、集中汇总和综合汇总三种。统计汇总技术主要有手工汇总和电子计算机汇总两种。(三)编制统计表以简明扼要的表格形式表述统计分组和汇总的结果,反映社会经济现象在数量方面的具体表现和有关联系。统计表是统计整理的有效表现形式。(四)绘制统计图为了使数据次数分配的特
31、点更加一目了然,需要绘制次数分配图。次数分配图能够突出地显示出只靠阅读数据不易看出的重要特征和数量关系。常用的次数分配图有直方图和次数分配多边形图(也称折线图)。二 统计分组(一) 统计分组的意义和作用统计分组就是根据统计研究的目的和任务,将总体所有单位按一定的标准划分为若干部分或组,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。例如,社会产品按其经济用途分为第一部类和第二部类,即生产资料的生产和消费资料的生产;在工业部门内,根据年产量或投资额等将工业企业划分为大型、中型、小型企业三组;要研究人口的状况和问题,将人口按性别、民族、职业、文化等特征分成一个个的小组。通过统计分组,可以
32、区别现象在质的方面、在数量上以及在空间上多个方面的差别。对总体中所有单位在质量上、数量上、空间上存在的差异进行分析,进一步认识事物的本质特征及其发展规律。可见,统计分组不仅是统计整理的基础,也是使认识深化的重要手段,已成为统计研究中最基本的方法之一。统计分组的作用主要有以下四个方面:1将分散的、凌乱的统计资料系统化,显现出总体特征与实质。对一个统计总体的调查是从个体入手的,所以,通过统计调查所得到的统计资料,是个体的、分散的、凌乱的,例如前面的40名学生考试成绩的调查资料。这样一批数据有共性的一面,因为它们都是同一标志(考试成绩)的具体体现,即总体的同质性;同时又有个性的一面,因为它们在数值上
33、各不相同,即差异性。现将其分组整理如表1-1:表1-1 某班学生某次考试成绩分组表考试成绩(分)考生人数(人)人数比重(%)60以下607070808090901002816104520402510合计40100通过分组整理可以清楚地看到现象总体的特征:优秀的占10%,良好的占25%,中的占40%,及格的占20%,不及格的占5%。2区分社会经济现象的类型利用统计分组,就能根据统计研究的目的,将现象区分为各种性质不同的类型,来研究各类现象的数量差异和特征以及相互关系。例如,企业按所有制形式划分为国有企业、集体企业和其它经济类型企业,在此基础上,统计这三个类型组企业的有关指标数值,并加以比较分析,
34、就可以反映出不同类型企业的数量特征及相互关系,充分揭示出各类企业的本质及其发展规律性。3研究现象的内部结构利用统计分组,计算出各组占总体的比重,可以分析总体内部构成情况,表明部分与总体、部分与部分之间的发展变化关系。例如,表1-2不仅表明各个时期农轻重结构的特征,而且也表明了各个时期农轻重比例的变化,从而反映出我国工农业总产值中农轻重比例逐步趋向基本协调的发展过程和趋势。 表1-2 我国工农业总产值构成 单位:(%)1952年1957年1965年1970年1975年1980年1985年1990年1991年农 业轻工业重工业56.927.815.343.331.225.537.332.330.4
35、32.531.136.428.231.640.227.234.338.527.134.338.624.337.338.322.437.939.7 资料来源:中国统计年鉴1992年。4揭示现象之间的依存关系一切社会经济现象都不是孤立的,而是相互联系、相互依存、相互制约的。例如,施肥量与亩产量,商品销售量和商品价格,工业企业中劳动生产率与产量之间都存在一定的依存关系等。利用统计分组法研究社会经济现象的依存关系时,是将总体按某一个标志进行分组,观察其它标志与这个分组标志的联系情况。例如,研究商品销售额与商品流通费用率之间的依存关系,可将商店按商品销售额的多少分组,再计算出每个组的商品流通费用率,借以
36、说明二者之间的依存关系。见表1-3。表1-3 某地区1996年部分商店的销售额与商品流通费用率情况商店按商品销售额分组(万元)商店数(个)商品流通费用率(%)100以下100300300500500700700900900以上1210139859.78.67.56.55.75.4从表中可以看出,随着商品销售规模的扩大,其商品流通费用率相应降低,两者表现出负依存关系。以上统计分组的四个方面的作用往往是相互联系、相互补充的,在分析某个具体问题时,可以同时实现。(二) 统计分组的方法要充分发挥统计分组的作用,必须在正确的理论指导下,进行科学的分组,统计分组的关键是分组标志的选择、各组界限的划分及分组
37、体系的确定。1分组标志的选择分组标志是将统计总体划分为各不同性质的组的标准或依据。由于同一研究目的和任务并不是只有一个分组标志可供选择,因此就有一个选择分组标志的问题。正确选择分组标志是保证统计分组科学性的前提,关系到能否正确反映总体的数量特征及其变化规律,要在诸多可供选择的标志中选取能反映总体特征的标志,必须遵循以下原则:第一,必须紧紧扣住统计研究的目的,选择统计分组标志。同一个研究对象,由于研究目的不同,需要采用的分组标志也就不同。例如,在工业生产统计中,当研究的目的是为了分析不同规模的企业生产情况时,应该选择产量或生产能力(反映企业规模的指标)作为分组标志,具体分组我国规定根据大中小型工
38、业企业划分标准,依企业生产规模划分为特大型、大型、中型和小型四个类型。例如,钢铁企业划分标准为:特大型 大型中型小型 年产钢150万吨以上生产用固定资产原值10亿元以上年产钢60150万吨年产钢3060万吨年产钢30万吨以下当研究的目的为确定工业内部比例及平衡关系时,就要按部门分类,划分为重工业和轻工业或冶金、电力、化工、机械、轻工等工业部门。第二,在对被研究现象进行分析的基础上,抓住具有本质性区别及反映现象内在联系的标志作为分组标志。在总体的若干标志中,有的标志能够揭示总体的本质特征,是有决定性意义的重要标志;有的则是非本质的、无足轻重的标志。只有选择能够说明事物本质的重要标志作为分组标志,
39、才能得出触及问题实质的重要分组。例如,研究国民经济的现状、发展和平衡关系时,按所有制进行分组、按国民经济部门进行分组等,都是重要的分组。第三,结合研究对象所处的具体历史条件或社会经济发展的条件,选择分组标志。因为能够反映现象本质的重要标志,具有条件性、地区性和历史性,所以某一个标志在一定时间、地点、条件下,可以作为最重要的标志,但时过境迁,可能失去其重要意义。例如,为了研究工业企业规模与劳动生产率等因素之间的关系,需要按企业规模进行分组。而反映企业规模的标志有职工人数、生产能力、固定资产价值、产值等,究竟应选择其中哪种标志作为分组标志,须视具体条件而定。在技术不发达或劳动密集的条件下,适宜用职
40、工人数的多少来表示企业规模的大小;反之,在技术进步的历史时期或技术装备比较先进的条件下,就应考虑采用固定资产价值或生产能力等作为分组标志。同时还应注意,即使处于相同的历史条件下,在不同经济部门或生产部门中,由于它们的经济发展条件、生产性质、经营方式的不同,也应该分情况,选择不同的分组标志和组别。例如,在我国已进入四化建设的今天,有些农作物产区仍然处在粗放经营的条件下,可用耕地面积表示生产单位的规模;而具有集约生产特点的地区,则要选用产值的多少来反映生产单位规模的大小。可见,选择分组标志不能千篇一律,一成不变,而要依一定的时间、地点、条件为转移,考虑研究对象所处的历史条件,选择分组标志才有现实意
41、义。2分组方法分组标志确定以后,分组的方法取决于分组标志的性质(即是品质标志还是数量标志)。(1)按品质标志分组的方法品质标志是以事物的性质属性来表现的标志(如性别、民族、职业、所有制等)。按品质标志分组就是选择反映事物属性差异的品质标志为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成若干性质不同的组成部分。例如,人口按性别、民族、职业分组;工业企业按所有制、经济部门、管理系统分组等。按品质标志分组有些比较简单,其分组标志一经确定,组名称、组与组之间的性质界限和组数也就随之而定,不存在组与组之间的性质界限区分的困难。例如,人口按性别分为男和女两组、按民族分为56个组等。而有些情况
42、下,这类分组相当复杂,主要问题在于组与组之间的性质界限不易划分。例如,统计城乡商业零售额时,怎样划分城乡分界限是比较复杂的问题。这种情况下要根据研究任务的要求,经过事先分析研究,规定统一的划分标准或分类目录。在我国的统计工作实践中,对重要的品质标志分组,编有标准的分类目录,例如工业部门分类目录、工业产品目录、主要商品目录等,以统一全国的分类口径,便于各个部门掌握和使用。(2)按数量标志分组的方法数量标志就是以数量的多少来表现的标志(职工人数、工资额、产量、销售额等)。按数量标志分组就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分成若干性质不同的组成
43、部分。例如,企业按生产规模划分为特大型、大型、中型和小型四组;人口按年龄分组,学生按成绩分组等等。按数量标志分组常常用来分析某种指标的变动及其在各组的分布情况。按数量标志分组的结果,形成变量数列。在统计整理和统计分析中,广泛应用变量数列,借以观察某种指标的变动及其分布情况。变量数列的编制涉及变量值的多少、变化范围的大小、变量的类型等问题,以及相应地确定组数、组限和组距等方法,将在下一段中详细介绍。3分组体系在统计研究中,为了全面认识某一社会现象,常常运用多个分组标志对总体进行分组,形成一系列相互联系、相互补充的分组体系。进行统计分组时,由于采用分组标志数目的不同,就有简单分组与复合分组之分。(
44、1)简单分组简单分组就是总体按一个标志进行的分组。例如,某校学生按学科分为理科组和文科组;某校学生按性别分为男生组和女生组;某校学生按某科成绩分为60以下、6070、7080、8090、90100五个组等。对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系。例如,对某校学生分别按学科、性别、某科成绩进行简单分组,即形成平行分组体系。如表1-4所示。表1-4按学科分组按性别分组按某科成绩分组理科文科男生女生60以下60707080809090100(2)复合分组复合分组是对同一总体选择两个或两个以上标志层叠起来进行分组。复合分组形成的分组系列称为复合分组体系。例如,对某校学生
45、性别、某科成绩两个标志进行复合分组,可以得到如下复合分组体系,如表1-5所示。简单分组如果包含两个或两个以上标志,这些标志之间是平等关系,无主次之分。复合分组中的标志之间不是平等关系,建立复合分组体系时,应根据分析的要求,在选择分组标志的同时,确定它们的主次顺序。主要标志在先,辅助标志在后,分组结果表现为层叠式。复合分组标志不宜过多,一般最多不超过三个,以防组数过多,冲淡主题。表1-5按性别分组按某科成绩分组男生60以下60707080809090100女生60以下60707080809090100 三 次数分配数列 (一)次数分配数列的概念和种类 次数分配数列又简称分配数列或统计数列,是指在
46、统计分组和汇总的基础上所形成的反映总体单位数在各组的分布状况的数列。编制次数分配数列,可以反映总体单位数在各组的分布状况和特征,是进一步分析总体平均水平和变异程度的基础,是统计分析的重要内容。1根据分组标志类型的不同,分配数列分为品质数列和变量数列两种形式。(1)品质数列按品质标志分组编制的分配数列,称为品质数列。例如,某大学在校学生按性别分组,可编制成如下的品质数列,如表1-6所示。表1-6 品质数列示例按性别分组学生人数(人)学生数比重(%)男性女性2340189055.3244.68合计4230100.00编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差
47、异可以明显地表现出来,也就容易划分总体中各组的性质界限。因此,在通常情况下,品质数列能够较准确地反映总体单位的分布状态和特征。(2)变量数列按数量标志分组编制的分配数列,称为变量数列。例如,某班学生按某次考试成绩分组,可编制成如表1-1所示的变量数列。变量数列的编制方法比较复杂,将在下面作详细介绍。分配数列包含两个构成要素:一是各组名称或变量值,即用来分组的品质标志名称或按大小顺序排列的数量标志的具体数值;二是总体单位在各组中出现的次数。次数有两种表现形式:一是以绝对数形式表现的次数,又称为频数;二是以相对数形式表现的次数,即各组次数占全部次数的比重,称为比率或频率。2根据分组标志的时空差异,分配数列分为空间数列和时间数列两种形式。(1)空间数列空间数列是按与空间有关的标志进行统计分组和汇总所形成的分配数列。其特点是所描述的现