《统计学原理第五版李洁明著知识点总结.pdf》由会员分享,可在线阅读,更多相关《统计学原理第五版李洁明著知识点总结.pdf(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学知识点第一章绪论1、 统计包含三种涵义(1)统计工作:一种调查研究活动。资料搜集、整理和分析。统计资料:即统计信息,工作成果。包括统计数据和分析报告。统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。(2)统计资料:对现象的数量进行搜集、整理和分析的活动过程。统计资料:通过统计实践活动取得的说明对象某种数量特征的数据原始资料:直接从各调查单位搜集的用来反映个体特征的数据资料次级资料:由原始资料加工得到的在一定程度上能反映总体特征的数据资料(3)统计学:是研究总体一定条件下的数量特征及其规律性的方法论学科统计学的性质:统计学是通用的方法论科学;统计学使用大量观察和归纳推理的方法,得
2、出对事物总体的综合认识;统计学结合现象的“质”研究现象的“量”特点:数量性(统计研究过程是从质和量的辩证统一中研究现象的数量特征,从数量上认识事物的性质和规律)、总体性(统计所研究的是由同类事物构成的群体现象的数量特征)、具体性、社会性2、统计学的分类理论统计学:研究的内容是统计的一般理论和方法,包括描述统计学、推断统计学应用统计学:研究的内容是运用于某一特定领域的统计问题,国民经济统计学、社会统计学、人口统计学3、统计研究方法(1)方法论大数定律(2)统计研究的基本方法大量观察法:是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数
3、理依据是反映随机现象基本规律的大数定律。诸如,各种基本的、必要的统计报表、普查、重点调查和抽样调查等。统计描述法:指通过对客观实际的调查了解,并对搜集到的数据进行加工整理、综合分析,从而计算出各种能反映总体数量特征的综合指标,借以反映现象总体的总量规模、结构比例、速度快慢等实际状况。统计描述的内容包括统计分组法、综合指标法和统计模型法。统计推断法:是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断是现代统计学的基本方法。(3)统计活动过程统计设计:统计指标和指标体系的设计、统计分类分组的设计、统计表的设
4、计、统计资料搜集方法的设计、统计工作各个部门和各个阶段的协调与联系、统计力量的组织与安排,统计调查:就是搜集统计资料的工作阶段。统计整理:对调查阶段搜集的原始资料,按照一定标志进行科学的分组和汇总,使之条理化、系统化。统计分析:对经整理后的各项综合指标进行分析计算,揭示被研究现象的比例关系和发展过程,阐明现象的变化趋势和规律性,通过分析研究作出科学的结论。4:统计总体和总体单位统计 总体:由客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合具有客观性、大量性、同质性、变异性、相对性等特点。总体单位:指构成总体的个体即每一个单位。总体由总体单位构成,要认识总体必须从总体单位开始,总体
5、是统计认识的对象。总体或总体单位的区分不是固定的,在一定条件下可以相互转化。5、统计总体的种类有限总体和无限总体,大总体和小总体,可加总体和不可加总体6、标志:指总体单位所具有的属性和特征,标志的具体表现称为标志值品质标志:是表明事物“质”的特性的标志。如性别、民族数量标志:是表明事物“量”的特性的标志。如身高。其中,可变的数量标志又被叫作变量。统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。7、总体单位标志:不变标志(标志表现无差别),决定总体的同质性变异标志(标志表现有差别),决定总体的差异性,包括品质标志和数量标志8、变量的种类:确定性变量(由
6、确定性因素:明确的、可解释的、人为的或者受人控制的因素影响所形成,使变量按一定方向变动)、随机变量(由随机因素:不确定的、偶然的、非人为控制的、不可解释的因素所形成的变量);离散变量(只能取整数)、连续变量(可取小数)9、统计指标:反映社会经济现象总体数量特征的概念及其具体数值构成要素:时间限制、空间限制、计算方法、(指标名称、指标数值) 、计量单位性质:数量性(统计指标是数量范畴,“没有没有数量的指标” ) 、具体性(总体在具体时间、地点、条件下的数量特征, 即统计指标“质的规定性” ) 、综合性(对总体数量特征的综合说明,是由个体数量综合而来的。)10、标志与指标的联系与区别:联系:(1)
7、一些数量标志汇总可以得到指标的数值(2)数量标志与指标之间存在变换关系。区别:(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的;(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。11: 、统计指标的分类(1)按表现形式、内容特征分类:总量指标(单一计量单位,绝对数,数量指标,按计量单位分为实物指标、价值指标、劳动指标)相对指标(无计量单位,相对数,质量指标)平均指标(双重计量单位,质量指标)(2)按时间特征分类:时期指标(一段时期累计总量及据此计算的相对、平均指标)时点指标(瞬间的总量及据此计算的相对、平均指标)12、统计指标体系:具有某种内在联系的一系列统
8、计指标所构成的整体如、存在确定的数量关系: 产量价格产值;存在某种共同性: 产销比率、盈利水平、劳动效率、偿债能力指标体系的作用:全面、综合地对客观事物进行描述、分析。第二章统计调查与整理13、统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程。14、统计调查的基本要求:准确性、及时性。准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求15、统计调查的设计( 即统计调查方案 ) (1)确定调查的目的即为什么调查(2)确定调查对象和调查单位 即向谁做调查。调查对象就是我们需要进行研究的总体范围,即调查总
9、体。它是由性质相同的许多调查单位所组成的。作为调查单位乃是进行登记的标志表现的直接承担者。(3)拟订调查提纲和制定调查表 即用什么方法调查。拟订调查项目时要注意几个原则:- 调查项目要少而精;- 调查项目含义要明确;- 尽可能做到各个调查项目之间有一定的联系。调查表分为:一览表(把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;)单一表(将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。 )(4)确定调查时间 即在什么时间调查。要区别调查时间和调查期限的不同:- 调查时间是指调查资料所属的时间(时点或时
10、期);- 调查期限是指调查工作的起讫时间。(5)制定调查的组织实施计划16、统计调查的方法:直接观察法、报告法、采访法、网上调查法。另外,还有电话调查、座谈会、个别深度访谈等方法。17、统计调查的组织( 即调查的种类 ) 按调查的范围分,统计调查可以分为:全面调查和非全面调查;按登记事物的连续性分,统计调查可以分为:经常调查和一时调查;按组织形式分,统计调查可以分为:统计报表和专门调查。18、统计报表分为:基本统计报表,专门统计报表。按报送周期长短不同统计报表分为:定期报表(日报、旬报、月报、季报、半年报)、年报专门调查:分为普查、重点调查、抽样调查、典型调查。普查为全面调查,后三者为非全面调
11、查。普查:专门组织的一次性调查,用来调查属于一定时点的社会现象的总量。例:每5 年一次的经济普查重点调查:对重点单位进行调查。重点单位指的是这些单位数占总体的很少部分,而研究的标志总量占绝大部分(或绝大比重) 。抽样调查:按随机原则从总体中抽取一部分单位进行调查。典型调查:先对总体进行分析,然后选择有代表性的单位进行调查。例,选取部分企业进行调查,以了解企业股份制改革后的成果及问题。19、统计分组概念:把同质总体中的具有不同特点的单位分开,从而正确地认识事物的本质及其规律性。作用:类型分组揭露社会经济现象的类型,反映各类型的特点。结构分组说明社会经济现象的内部结构。分析分组研究经济现象之间的依
12、存关系。选择分组标志的原则:根据研究问题的目的来选择;要选择最能反映被研究现象本质特征的标志;要结合现象所处的具体历史条件或经济条件来选择。20、分组标志的种类(1)按分组标志的特征不同分为:品质标志分组 反映事物属性差异。简单分组,如人口按性别分组;- 复杂分组,亦称分类,如人口按职业分组。数量标志分组 反映事物数量差异。 - 单项式数量分组运用于变量变动幅度小、项目少的分组。- 组距式分组 运用于变量变动幅度大、项目多的分组。(2)按总体所选择标志的个数分:简单分组 按一个标志对总体进行分组复合分组 按两个或两个以上标志对同一总体进行分组对社会经济现象需要从各方面进行观察和分析研究,需要采
13、用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。21、分配数列概念:统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。种类:以分组标志特征不同分为品质数列、变量数列变量数列:(1)单项变量数列(单项数列)按每个变量值分别列组编制数列,适用于不连续变量或变量能以整数表示,其变动范围不大时。组距变量数列(组距数列)按组距分组编制数列。适用于连续变量或变量可用小数表示,其变动范围较大时。(2)连续变量数列可有小数,采取组距式。非连续变量数列 整数,采取单项式或组距式 (例:一个地区的企业按职工人
14、数分组) 。22、组距数列的编制组限:组距两端的数值。分为上限和下限。组距:某一组的上限和下限的距离,分等距和异距。组距=上限 - 下限,等距数列组距=全距 R/组数全距:分组数列中最大值的上限与最小值的下限之差。组中值:组的上限和下限的中间值。因数列两端组限形式不同分:开口式组距最低组与最高组不封口;闭口式组距。编制步骤:确定组距和组数;确定组限和组中值。23、关于组限问题对连续变量,组数也要连续。在登记次数时,习惯上遵守:上组限不在内适用于越大越好的变量,如产值;下组限不在内适用于越小越好的变量,如成本。对不连续变量,组与组间是间断的。关于组中值问题:闭口式分组的组中值求法:开口式分组的组
15、中值求法:24、次数分布的表示方法22下限上限下限或组的下限组的上限组中值邻组组距下限值缺上限的开口组的组中邻组组距上限值缺下限的开口组的组中2121表示法即用统计表来表示次数分布。以下累计次数( 上限) 即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少;以上累计次数( 下限 ) 即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。图示法:用统计图来表示次数分布直方图、折线图(在直方图的基础上连接各条形顶边的中点成折线图)、曲线图(组数趋向于无限多时折线图的极限描绘,是一种理论曲线)25、次数分布的主要类型一般次数分布呈正态分布曲线,或称正态曲线:对称
16、型;很多是偏态分布曲线,或称偏态曲线:右偏型(上偏型)、左偏型(下偏型);还有其他形态:U型分配曲线、 J 型分配曲线、双峰曲线26、统计表的结构和内容从形式上看 : 统计表由总标题、横行标题、纵栏标题、指标数值构成。从内容上看 : 统计表由主词(说明总体或总体的分组)和宾词(用哪些指标数值来说明总体或总体的分组)两部分构成。27、统计表的特点开口式;上下有基线;编号:主词一般按A、 B、 C,宾词按 1、 2、 3;有计量单位;表中不允许有空格:若不需要此资料则用 “- ”; 暂 缺某资料则用“”28、统计表的分类简单表:总体未分组分组表:总体按一个标志进行分组复合表:总体按二个或二个以上标
17、志进行复合分组29、统计表的编制原则. 总标题须简明扼要表达出全表的内容;. 各标题要确切反映表的内容,且表格安排合理;. 指标数值要位数对齐,合计或总计一般放在表的尾部;. 对指标内容作必要说明时,可加注在表的下方;. 表的上下边线(基线)用粗实线或双线,表的两边是开口式;. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。总原则:合理、科学、实用、简练、美观。第三章综合指标30、综合指标从它的作用和方法特点的角度可概括为三类:绝对指标、相对指标、平均指标31、总量指标 ( 绝对指标 ) 概念:总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。总量指标表现
18、形式是绝对数,也可表现为绝对差数。作用:总量指标能反映一个国家的基本国情和国力,反映某部门、单位等人、财、物的基本数据;总量指标是进行决策和科学管理的依据之一;总量指标是计算相对指标和平均指标的基础。32、 总量指标的分类按其反映的内容不同可分为:总体单位总量说明总体的单位数数量。标志总量说明总体中某个标志值总和的量。按其反映的时间状况不同可分为:时期指标反映现象在某一时期发展过程的总数量。( 可连续计数,与时间长短有关,是累计结果 ) 时点指标 反映现象在某一时刻的状况。 ( 间断计数,与时间间隔无关,不能累计) 33、总量指标的计算计算原则:现象的同类性;明确的统计含义;计量单位必须一致。
19、根据总量指标所反映的社会经济现象性质不同,计量单位分三种形式:(1) 实物单位: a. 自然单位:辆、双、头、根、个b. 度量衡单位:吨、米、克、立方米c. 双重单位:公里/ 小时、人 /平方公里d. 复合单位:吨公里、公斤米、千瓦小时对有些性质相同但规格或含量不同的产品总量的计算,要按折合标准实物量的方法计算。(2) 价值单位 ( 货币单位 ) :货币单位有现行价格和不变价格之分。价值单位使不能直接相加的产品产量过渡到能够加总,用于综合说明具有不同使用价值的产品生产总量或商品销售量等的总规模、总水平。(3) 劳动单位:工时工人数和劳动时数的乘积;台时 设备台数和开动时数的乘积。由于具体条件不
20、同,不同企业的劳动量指标不具有可比性,因此,劳动量指标只限于企业内部使用。34、相对指标概念:是两个有联系的绝对指标之比。相对指标的数值有两种表现形式:有名数(人口密度:人/ 平方公里;平均每人分摊的粮食产量:千克/ 人 )无名数(系数或倍数、成数、百分数、千分数)35、相对指标的种类及其计算( 一) 计划完成相对指标(1) 、计算公式:根据绝对数、平均数、相对数来计算计划完成相对数(2)长期计划的检查水平法:累计法:( 二) 结构相对指标计算公式为:( 三) 比例相对指标计算公式为:常用的比例形式有两种:将作为比较基础的数值抽象化为1、10、100 或 1000,看被比较的数值是多少;首先将
21、总体全部数值抽象化为 100,求得各部分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。( 四) 比较相对指标 ( 类比相对指标 ) 计算公式为:计算比较相对数时,作为比较基数的分母可取不同的对象,一般有两种情况:比较标准是一般对象,这时,分子与分母的位置可以互换。如:比较标准 ( 基数 ) 典型化,如:把企业的各项技术经济指标都和国家规定的质量水平比较,和同类企业的先进水平比较,和国外先进水平比较等,这时,分子与分母的位置不能互换。( 五) 强度相对指标计算公式为:强度相对数的数值表示有两种方法:一般用复名数表示;也有少数用百分数或千分数表示。有些强度相对数有正、逆两种计算方法
22、。( 六) 动态相对指标计算公式为:基期作为对比标准的时间;报告期同基期比较的时期,也称计算期36、正确运用相对指标的原则:注意二个对比指标的可比性;相对指标要和总量指标结合起来运用;多种相对数结合运用;在比较二个相对数时,是否适宜相除再求一个相对数,应视情况而定。若除出来有实际意义,则除;若不宜相除,只宜相减100%实际完成数计划完成相对数计划数100%五年计划末年实际达到的水平五年计划完成程度五年计划中规定的末年水平100%五年计划期间实际累计完成数五年计划完成程度五年计划规定的累计数100%总体某部分数值结构相对数总体全部数值总体中某部分数值比例相对数总体中另一部分数值100%某条件下的
23、某类指标数值比较相对数另一条件下的同类指标数值%100)()(同类现象的水平单位乙地区某一现象的水平单位甲地区比较相对数某一总量指标数值强度相对数另一性质不同但有一定联系的总量指标数值100%报告期水平动态相对数基期水平求差数,用百分点表示之。( 百分点即百分比中相当于百分之一的单位) 37、平均指标的意义和作用概念:平均指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。特点:数量抽象性集中趋势代表性作用:比较作用(a. 同类现象在不同空间的对比。b. 同一总体在不同时间上的比较);- 利用平均指标可以分析现象之间的依存关系 - 利用平均指标可以进行数量
24、上的推算,还可以作为论断事物的一种数量标准或参考种类:数值平均数(算术平均数;调和平均数hX;几何平均数GX)位置平均数(众数oM,中位数eM)38、算术平均数算术平均数的基本公式:简单算术平均数:式中: 算术平均数 X 各单位的标志值 n 总体单位数总和符号加权算术平均数 : 式中:算术平均数 X 各组数值 f 各组数值出现的次数( 即权数 ) 在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:加权算术平均数与简单算术平均数不同在于:加权算术平均数受变量值大小、次数多少的影响;而简单算术平均数只反映变量值大小这一因素的影响。39、算术平均数的数学性质 各个变量值与算术
25、平均数离差之和等于零简单平均数:0)(XX加权平均数:0fXX)(各个变量值与算术平均数离差平方之和等于最小值40、算术平均数的特点算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小; 受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。41、调和平均数 ( 又称“倒数平均数”) 调和平均数是各个变量值倒数的算术平均数的倒数。计算方法:在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:总体标志总量算术平均数总体单位总数XXnX fXffXfXXff22()()XXfXX简单平均数
26、:最小值加权平均数:最小值X1(1).先计算各个变量值的倒数,即X1(2).计算上述各个变量值倒数的算术平均数,即Xn(3).,1再计算这种算术平均数的的倒数,就是调和平均数即nX1hnXX1在加权的情况下:hfXfX1式中:,hXfXfmXXmfXfXXmmXffXm是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。42、调和平均数的特点如果数列中有一标志值等于零,则无法计算;较之算术平均数,受极端值的影响要小。43、几何平均数 ( 又称“对数平均数”) 简单几何平均数:计算时要进行对数变换,即:nXXGlglgGGXarcX加权几何平均数:44、几何平均数的特点如果数列中有一
27、个标志值等于零或负值,就无法计算;受极端值的影响较和小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。45、众数 M0概念:众数是在总体中出现次数最多的那个标志值众数存在的条件:只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。若有两个次数相等的众数,则称复众数。在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。46、众数的计算方法:根据单项数列确定众数;根据组距数列确定众数(由最多次数来确定众数所在组;利用比例插值法推算众数的近似值)计算众数的近似值:下限公式:上限公式:47、众数的特点众数是一个位置平均数,它只考虑总体分布中最频繁出现的变
28、量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。48、中位数 Me概念:将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。中位数的计算方法:由未分组资料确定中位数: n 为奇数时,则居于中间位置的那个标志值就是中位数。 n 为偶数时,则中间位置的两个标志值的算术平均数为中位数由单项数列确定中位数由组距数列确定中位数:下限公式(较小制累计时用):上限公式(较大制累计时用):hXhXnnn
29、GXXXXX?21式中:为各变量值的次数或权数将公式两边取对数,则为:121212112212lglglglglg(lg)LLLLnnGGGGffffffffnnnnXXXXXffXfXfXfXXffffXarcXGXXhXdXMLdXMU1()2中位数的位置为总体单位数nndfSfXMmmLedfSfXMmmUe49、中位数的特点 中位数不受极端值及开口组的影响,具有稳健性。 各单位标志值与中位数离差的绝对值之和是个最小值。对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。50、各种平均数之间的相互关系(一)hGXXX(二)当总体分布呈对称状态时,三者合而为一, 0即eXM
30、M当总体分布呈非对称状态时,所以:0)(oMX则说明分布右偏(或上偏)0)(oMX则说明分布左偏(或下偏)0)(oMX则说明分布对称根据卡尔皮尔逊经验公式,还可以推算出:51、平均指标的运用原则:平均指标只能适用于同质总体;用组平均数补充说明总平均数;用分配数列补充说明平均数。52、标志变动度概念:标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。作用:标志变动度是评价平均数代表性的依据。标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。种类:即测定标志变动度的方法, 主要有:全距、四分位差、平均差、标准差、离散系数等。全 距 R
31、 ;四分位差 Q.D. ;平 均 差A.D. ;标准 差S.D.( ) ;离散系数V53、全距全距是总体各单位标志值最大值和最小值之差, maxmin RX-X即:全距的特点:优点:计算方便,易于理解。缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。54、四分位差概念:将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数, ( 其中第二个四分位数Q2就是数列的中位数Me) 。四分位差 Q.D.=Q3-Q1计算:根据未分组资料求Q.D. 根据分组资料求Q.D. 2) 若单项
32、数列,则Q1与 Q3所在组的标志值就是Q1与 Q3的数值;若组距数列,确定了Q1与 Q3所在组后,还要用以下公式求近似值:四分位差的特点:四分位差不受两端各25% 数值的影响,能对开口组数列的差异程度进行测定;用四分位差可以衡量中minmin即:或eeXMXMf0(1). 如果分布右偏,则eXMM0(2). 如果分布左偏,则eXMMXMMeXMMoeoeMMX133(1)144()的位置,的位置为变量值的项数nnQQn13f3f1) Q, Q44的位置的位置131111133313344QQffSSQLdQLdff位数的代表性高低;四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一
33、半的离差,所以也是一个比较粗略的指标。55、平均差概念:平均差是数列中各单位标志值与平均数之间绝对离差的平均数。平均差的特点:平均差是根据全部标志值与平均数离差而计算出的变异指标,能全面反映标志值的差异程度;平均差计算有绝对值符号,不适合代数方法的56 演算使其应用受到限制。56、标准差概念:标准差是离差平方平均数的平方根,故又称“均方差”。其意义与平均差基本相同。在组距数列中,结合算术平均数的简捷公式,可得标准差的简捷法公式如上:57、交替标志的标准差在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。统计中,用“是”、“否”或“有”、“无”来表
34、示的标志,称为交替标志,也称是非标志。N: N1,NN1是具有某种标志的单位数N1=P ;N2是不具有这种标志的单位数N2=1-P;具有某种标志变量为1;不具有这种标志变量为 0 58、标准差与全距、平均差的关系 与 R的关系:经验表明,当分布数列接近于正态分布时,R和之间存在以下经验公式R 为 4 至 6 个 : ;当标志值项数较少时, R4;当标志值项数较多时,R6 与 A.D. 的关系:对同一资料,所求的平均差一般比标准差要小,即A.D. 59、离散系数 V离散系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。第四章动态数列60、动态数列X-X
35、(1) A.D.nX-X(2) A.D.其计算公式为:未分组资料:分组资料:ff22(x)nf(x)fxx22()式中:为数列中间组的组中值,为该组组距XAXAffdddffAd100%VX标准差系数计算公式为:概念 : 动态数列又称时间数列。它是将某种统计指标,或在不同时间上的不同数值,按时间先后顺序排列起来,以便于研究其发展变化的水平和速度,并以此来预测未来的一种统计方法。动态数列由两个基本要素构成:时间,即现象所属的时间;不同时间上的统计指标数值,即不同时间上该现象的发展水平。动态数列按照所列入指标数值的不同可分为: 绝对数动态数列(时期数列、时点数列)、相对数动态数列、平均数动态数列6
36、1:时期数列:在绝对动态数列中,如果各项指标都是反映某种现象在一段时期内发展过程的总量,这种绝对动态数列就称为时期数列。时期数列特点:数列中各个指标值是可加的;数列中每个指标值的大小随着时期的长短而变动;数列中每个指标值通常是通过连续不断的登记而取得。62、时点数列:在绝对动态数列中,如果各项指标都是反映现象在某一时间点(瞬间)上所处的数量水平,这种绝对动态数列就称为时点数列。时点数列特点:数列中各个指标值是不能相加的;数列中每个指标值的大小与时间间隔的长短没有直接关系;数列中每个指标值通常是按期登记一次取得的。63、动态数列的编制原则基本原则:是遵守其可比性。具体说有以下几点:注意时间的长短
37、应统一;总体范围应该一致;指标的经济内容应该相同;指标的计算方法和计量单位应该一致。64、动态数列的水平分析指标属于现象发展的水平分析指标有:发展水平、平均发展水平、增长量、平均增长量。发展水平:在动态数列中,每个绝对数指标数值叫做发展水平或动态数列水平。如果用a0,a1,a2,a3, an,代表数列中各个发展水平,则其中a0即最初水平, an即最末水平。平均发展水平:平均发展水平是对不同时期的发展水平求平均数,统计上又叫序时平均数。65、序时平均数与一般平均数的异同点:相同点:二者都是将现象的个别数量差异抽象化,概括地反映现象的一般水平。不同点:计算方法不同;差异抽象化不同;序时平均数还可解
38、决某些可比性问题。66、序时平均数的计算方法 绝对数动态数列的序时平均数时期数列的序时平均数时点数列的序时平均数(1) 如果资料是连续时点资料,可分为二种情况:对连续变动的连续时点数列( 即未分组资料 ) :aan对非连续变动的连续时点数列( 即分组资料 ) :afaf 如果资料是间断时点资料,也可分为二种情况:对间隔相等的间断时点资料: 对间隔不等的间断时点资料: 相对数动态数列的序时平均数由两个时期数列对比组成的相对数动态数列的序时平均数: 123123n, nnaaaaaannaa a aaLL式中:序时平均数各时期发展水平时期项数1221222132132211首末折半法这种计算方法称
39、为般公式:上面计算过程概括为一naaaaanaaaaaaannnn2311212111222nnnniiaaaaaafffafLbanbnabac一般公式为:由两个时点数列对比组成的相对数动态数列的序时平均数:若为间隔不等的二个间断时点数列对比组成的相对数动态数列的序时平均数为:若由二个连续时点数列对比组成的相对数动态数列的序时平均数:aacbb连续变动时点:用简单平均,即afacbfb非连续变动时点:用加权平均,即由一个时期数列和一个时点数列对比组成的相对数动态数列的序时平均数: 平均数动态数列的序时平均数由一般平均数组成的平均数动态数列的序时平均: bac由序时平均数组成的平均数动态数列的
40、序时平均数: 可见,当时期相等时,可直接用简单算术平均法计算。若时期或间隔不等时,应使用加权算术平均法计算。67、增长量概念:说明某种现象在一定时期内所增长的绝对数量。增长量 =报告期水平基期水平基期有两种:前一时期、某一固定时期。增长量:累计增长量0aai逐期增长量1iiaa011aaaanniii)(68、平均增长量概念:说明社会现象在一段时期内平均每期增加的绝对数量。69、动态数列的速度指标有:发展速度、增长速度、平均发展速度、平均增长速度发展速度:反映社会经济现象发展程度的动态相对指标。LLLLnnnnbbbbaaaanbbbbnaaaabac231121212311212122222
41、2nnnnnnaaaaaafffacbbbbbbbfffLL122bac321nbbbbnan一般公式为:)(25.20122433333392312317314万元全年平均每月产值以时间为权数:1逐期增长量之和累计增长量平均增长量逐期增长量个数动态数列项数报告期水平发展速度基期水平定基发展速度:可分为:环比发展速度:01100%iiiaaaa110iininaaaa推理:1i001iiiaaaaaa增长速度:反映社会经济现象增长程度的动态相对指标。70、平均发展速度和平均增长速度平均发展速度是各个环比发展速度的动态平均数( 序时平均数 ) ,说明某种现象在一个较长时期中逐年平均发展变化的程度
42、;平均增长速度是各个环比增长速度的动态平均数,说明某种现象在一个较长时期中逐年平均增长变化的程度。平均发展速度几何平均法,又称水平法:方程法,又称累计法:在实践中,如果长期计划按累计法制定,则要求用方程法计算平均发展速度。解这样的高次方程,用查表法。平均增长速度平均增长速度 =平均发展速度 -1 (100%) 平均发展速度大于“1”,平均增长速度就为正值,则称“平均递增速度”或“平均递增率”。平均发展速度小于“1”,平均增长速度就为负值,则称“平均递减速度”或“平均递减率”。71、长期趋势的测定与预测长期趋势就是指某一现象在一个相当长的时期内持续发展变化的趋势。( 向上或向下变化) 测定长期趋
43、势的目的主要有三个:把握现象的趋势变化;从数量方面研究现象发展的规律性,探求合适趋势线;为测定季节变动的需要。长期趋势的类型基本有二种:直线趋势;非直线趋势,即趋势曲线。测定长期趋势常用的主要方法有:间隔扩大法(通过扩大时间间隔,编制成新的动态数列);移动平均法(趋势值项数=原数列项数 - 移动平均项数 +1) ;最小平方法。73、移动平均法注 1:若采用奇数项移动平均( 如上例“三项” ) ,则平均值是对准在奇项的居中时间处。一次可得趋势值;若采用偶数项移动平均,则平均值也居中,因未对准原来的时间,还要再计算一次平均数,故一般都用奇数项移动平均。注 2:修匀后的数列,较原数列项数少。(在进行
44、统计分析时,若需要两端数据,则此法不宜使用) 注 3:取几项进行移动平均为好,一般若现象有周期变动,则以周期为长度。例,季度资料可四项移动平均;各年月资料,可十二项移动平均;五年一周期,可五项移动平均。移动平均法可消除周期变动。74、最小平方法即对原有动态数列配合一条适当的趋势线来进行修匀。这条趋势线可以是直线,也可以是曲线;这条趋势线必须满足最基本的要求。即:增长速度发展速度 - 定基增长速度无关系环比增长速度增长量前一时期水平增长的绝对值增长百分比基期水平或1 (100%)1%100100nXXnnaa0nRnnXXXX321nnnaaaaaaaa1231201niinaaaaa1321n
45、iinaXaXaXaXa1030200naXXXXniinn1212c()min y ycyy实际值,即原数列值趋势值或理论值直线方程当现象的发展,其逐期增长量大体上相等时。该方程的一般形式为:方程组可简化为:(二)抛物线方程当现象的发展,其二级增长量大体上相同时。指数曲线方程当现象的发展,环比增长速度大体上相等时。该方程的一般形式为:tcaby75、季节变动分析的意义测定季节变动的资料时间至少要有三个周期以上,如季节资料,至少要有12 季,月度资料至少要有36 个月等,以避免资料太少而产生偶然性。测定季节变动的方法有二种:按月平均法,不考虑长期趋势的影响( 假定不存在长期趋势) ,直接利用原
46、始动态数列来计算;移动平均趋势剔除法,即考虑长期趋势的存在,剔除其影响后再进行计算,故常用此法。76、按月平均法测定季节变动也称按季平均法。若为月度资料就按月平均;若为季度资料则按季平均。其步骤如下:列表,将各年同月( 季) 的数值列在同一栏内;将各年同月 ( 季) 数值加总,并求出月( 季) 平均数;将所有同月(季)数值加总,求出总的月( 季) 平均数;求季节比率( 或季节指数 ) 。77、时间序列预测法是将历史资料和数据,按照时间顺序排列成一系列,根据时间序列所反映的经济现象的发展过程、方向和趋势,将时间序列外推或延伸,以预测经济现象未来可能达到的水平。78、时间序列又称动态序列,它是将某
47、个经济变量的观测值,按时间先后顺序排列所形成的数列。时间可以是周、月、季度或年等。如商场计算销售额是按月排列数据,国家计算国民生产总值是按年度来排列数据的时间序列预测法是世界各国普遍采用的经济预测的基本方法。79、在时间序列中,数据的大小受到各种因素的影响,数据的变化趋势也就表现出各种性状,通常根据这些影响因素将数据的变化趋势分为四大类:长期趋势、季节变动、循环变动和不规则变动。对于前三种数据趋势预测问题,由于数据均呈现出某种规律性,因此我们能够将数据进行简化、分析,从而使预测成为可能;而不规则变动是指由某种偶然因素引起的突然变动,如战争的发生、政权的更迭、重大自然灾害的发生等,不规则变动没有
48、周期性。第五章指数80、统计指数cyabtNaytbty0)(222tnyntbnytbyattyttnyttynb)(导出:由联立方程也可直接推2c2233224yabtct (abc)yNabtcttyatbtctt yatbtct该方程的一般形式为:、 、 均为未定参数同样用求偏导数的方法,导出以下联立方程组:2lglglglg ,lg ,lg(,0)ccyatbYyAaBbYABtYNABttYAtBttt先对上述方程两边各取对数:设则:应用最小平方法求得的联立方程组为:同样设使概念:广义指数是指同类事物变动程度的相对数,包括动态相对数、比较相对数、计划完成相对数,即所有的动态比较指标
49、。狭义指数是综合反映多种不同事物在不同时间上的总变动的特殊的相对数。即专门用来综合说明那些不能直接相加和对比的复杂社会经济现象的变动情况。作用:综合反映多种不同事物的总的变动程度;测定复杂经济现象的总变动中,各个因素变化的影响;测定平均指标中各因素变动对平均指标变动的影响程度。81、受多种因素影响的现象叫做复杂现象。(1)现象的总量是各因素的总和;(2)现象的总量是若干因素的乘积。82、在分组条件下,加权算术平均数的大小受到两因素的影响:一是现象水平的影响,二是现象内部结构的影响。我们可运用指数来分析这两个因素的变动对平均指标总变动的影响情况。83、统计指数的种类(1) 个体指数和总指数按其所
50、反映现象的范围不同。个体指数是反映个别社会经济现象变动的相对数。两者联系:总指数是个体指数的平均数,是总体中各个个体指数的代表值。在个体指数和总指数之间,还存在一种类指数( 或称组指数 ) ,其实质与总指数相同,只是范围小些。(2) 环比指数和定基指数按其所采用的基期不同指数往往随着时间的推移而连续编制,从而形成指数数列。(3) 数量指标指数和质量指标指数按其所反映的现象性质的不同反映某一现象规模大小、数量多少,称数量指标,而表明这些指标变动程度的相对数是数量指数( 简称 ) ,如,产品产量指数、商品销售量指数、职工人数指数等。说明工作质量的好坏或事物质的属性,称质量指标,而表明这些指标变动程