《统计数据的描述(3).ppt》由会员分享,可在线阅读,更多相关《统计数据的描述(3).ppt(160页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第 2章章 统计数据的描述统计数据的描述学习目标学习目标1.了解数据的计量尺度了解数据的计量尺度2.了解统计数据的来源和数据的质量了解统计数据的来源和数据的质量要求要求3.掌握数值型数据的整理方法掌握数值型数据的整理方法4.掌握数据集中趋势和离散程度的测掌握数据集中趋势和离散程度的测度方法度方法5.掌握统计表和统计图的使用掌握统计表和统计图的使用2.1 数据的计量尺度数据的计量尺度 按照计量学的一般分类方法,把按照计量学的一般分类方法,把数据由低到高分为四种计量尺度:数据由低到高分为四种计量尺度:1、列名尺度、列名尺度、2、顺序尺度、顺序尺度、3、间隔尺度、间隔尺度、4、比例尺度。、比例尺度
2、。一一、列名尺度:、列名尺度:最粗略,仅能分类。最粗略,仅能分类。二、顺序尺度:二、顺序尺度:精确度稍高,可以表现次序,精确度稍高,可以表现次序,比较优劣,但不可运算。比较优劣,但不可运算。三、间隔尺度:三、间隔尺度:能精确进行加减计量,可计能精确进行加减计量,可计算差异,算差异,“0”有具体含义,不表示有具体含义,不表示“不存不存在在”。不可计算倍率。不可计算倍率。四、比例尺度:四、比例尺度:能精确进行四则运算,可计能精确进行四则运算,可计算差异及计算倍率,算差异及计算倍率,“0”表示表示“不存在不存在”。四种计量尺度的比较四种计量尺度的比较2.1.1 列名尺度列名尺度(P17)1.也称名义
3、尺度或分类尺度也称名义尺度或分类尺度2.计量层次最低计量层次最低3.对事物进行平行的分类对事物进行平行的分类4.各类别可以指定数字代码表示各类别可以指定数字代码表示5.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求6.数据表现为数据表现为“类别类别”,属于品质标志,属于品质标志7.具有具有=或或,是或否,是或否的数学特性的数学特性列名尺度数据举例列名尺度数据举例人口的民族人口的民族(汉、蒙、苗、白汉、蒙、苗、白)、人口的性别人口的性别(男、女男、女)、,、,企业所属行业企业所属行业(制造业、建筑业、金融业制造业、建筑业、金融业),某类产品的规格、型号等标志某类产品的规格、
4、型号等标志以上标志的计量尺度都属于列名尺度,它们都以上标志的计量尺度都属于列名尺度,它们都仅对事物起分类作用仅对事物起分类作用,仅仅是个便于相互区别,仅仅是个便于相互区别的符号,不能对各分类起排序、比较的作用,的符号,不能对各分类起排序、比较的作用,各类之间也都不能比较差异及进行运算。各类之间也都不能比较差异及进行运算。2.1.2 顺序尺度顺序尺度(P17)1.也称定序尺度也称定序尺度2.对事物分类的同时给出各类别的顺序对事物分类的同时给出各类别的顺序3.比列名尺度精确一些比列名尺度精确一些4.未测量出类别之间的准确差值未测量出类别之间的准确差值5.数据表现为有序的数据表现为有序的“类别类别”
5、,仍为品质标,仍为品质标志志6.具有具有或或的数学特性的数学特性顺序尺度数据举例顺序尺度数据举例产品的等级产品的等级(一等、二等、三等一等、二等、三等);等级成绩等级成绩(优、良、中优、良、中);文化程度文化程度(中学、大专、本科中学、大专、本科);对事物的态度对事物的态度(同意、中立、反对同意、中立、反对),上述标志的计量尺度都属于顺序尺度,它们上述标志的计量尺度都属于顺序尺度,它们除除了对事物起分类作用,还能对各分类起排序、了对事物起分类作用,还能对各分类起排序、比较的作用,比较的作用,可以比较各类之间的大小、优劣。可以比较各类之间的大小、优劣。但各类之间不能计算差异,不能进行运算。但各类
6、之间不能计算差异,不能进行运算。2.1.3 间隔尺度间隔尺度(P17)1.也称定距尺度也称定距尺度2.对事物的准确测度对事物的准确测度3.比定序尺度精确比定序尺度精确4.数据表现为数据表现为“数值数值”,为数量标志,为数量标志5.没有绝对零点,没有绝对零点,“0”有具体含义,表有具体含义,表示水平的界限,而不表示示水平的界限,而不表示“不存在不存在”。6.具有具有 或或 的数学特性的数学特性7.不可计算倍率(即乘除)不可计算倍率(即乘除)间隔尺度数据举例间隔尺度数据举例例:百分制成绩从数值大小可判断成绩优劣,从两个成绩例:百分制成绩从数值大小可判断成绩优劣,从两个成绩的差可以了解差距大小,的差
7、可以了解差距大小,0分不表示无成绩分不表示无成绩(缺考才是缺考才是无成绩无成绩),而表示成绩为最低。,而表示成绩为最低。例:温度从数值大小可判断温度高低,从两个温度的差可例:温度从数值大小可判断温度高低,从两个温度的差可以了解温差大小,以了解温差大小,0oC不表示无温度,而表示结冰临界。不表示无温度,而表示结冰临界。例:海拔的数值大小可判断事物相对于海平面的位置,从例:海拔的数值大小可判断事物相对于海平面的位置,从两个海拔的差可以了解垂直距离,但两个海拔的差可以了解垂直距离,但“0”海拔不表示无海拔不表示无海拔,而表示处于海平面上。海拔,而表示处于海平面上。例:电脑显示器屏幕尺寸例:电脑显示器
8、屏幕尺寸(12寸、寸、14寸、寸、17寸寸),从数,从数值大小可判断屏幕大小,从两个尺寸的差可以了解差距值大小可判断屏幕大小,从两个尺寸的差可以了解差距大小。大小。2.1.4 比例尺度比例尺度(P17)1.也称比率尺度也称比率尺度2.对事物的最准确的测度对事物的最准确的测度3.与定距尺度处于同一层次与定距尺度处于同一层次4.数据表现为数据表现为“数值数值”,属于数量标志,属于数量标志5.有绝对零点,有绝对零点,“0”表示事物不存在表示事物不存在6.具有具有、的数学特性,的数学特性,比例尺度数据举例比例尺度数据举例长度、重量、产量、利润等标志的计量尺度都长度、重量、产量、利润等标志的计量尺度都属
9、于比例尺度,它们可以对事物进行分类、排属于比例尺度,它们可以对事物进行分类、排序、比较,还能进行加、减、乘、除运算。在序、比较,还能进行加、减、乘、除运算。在比例尺度中,比例尺度中,“0”表示表示“没有没有”或或“无无”。例:由长度大小可判断距离长短,两个长度的差例:由长度大小可判断距离长短,两个长度的差表明差距大小,两个长度的比表明其倍率,表明差距大小,两个长度的比表明其倍率,0长度表示该种物体不存在。长度表示该种物体不存在。例:由产量大小可判断效率高低,两个产量的差例:由产量大小可判断效率高低,两个产量的差表明差距大小,两个产量的比表明其倍率,表明差距大小,两个产量的比表明其倍率,0产量表
10、示该种产品不存在。产量表示该种产品不存在。标志的数值特征标志的数值特征 根据是否可以运算这一特点,可以根据是否可以运算这一特点,可以将列名尺度和顺序尺度归为一个大类,将列名尺度和顺序尺度归为一个大类,它们具有非数值特征,属于它们具有非数值特征,属于品质标志品质标志;而间隔尺度和比例尺度归为另一个大类,而间隔尺度和比例尺度归为另一个大类,它们具有数值特征,属于它们具有数值特征,属于数量标志数量标志。四种计量尺度数学特性的比较四种计量尺度数学特性的比较四种计量尺度的比较四种计量尺度的比较列名尺度列名尺度 顺序尺度顺序尺度 间隔尺度间隔尺度 比例尺度比例尺度 分分类类(=,)排序排序()间间距距(+
11、,-)比比值值(,)计量尺度计量尺度数学特性数学特性“”表示表示该该尺度具有相尺度具有相应应的数学特性的数学特性2.2 统计数据的来源(P19)一、直接获取的数据:一、直接获取的数据:来源于直接组来源于直接组织的调查、观察和科学试验,称织的调查、观察和科学试验,称之为第一手资料。之为第一手资料。二、间接获取的数据二、间接获取的数据:来源于已有来源于已有的数据,称之为第二手资料或间的数据,称之为第二手资料或间接的数据。接的数据。2.2.1 间接获取的数据间接获取的数据(P18)InternetInternethttp/http/WWW.WWW.中国统计年中国统计年中国统计年中国统计年鉴鉴鉴鉴20
12、012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如各类统计年鉴如各类统计年鉴2.各各类类经经济济信信息息中中心心、信信息息咨咨询询机机构构、专专业调查机构等提供的数据业调查机构等提供的数据3.各各类类专专业业期期刊刊、报报纸纸、书书籍籍所所提提供供的的资资料料4.各各种种会会议议
13、,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性性、学学术术性性研研讨讨会会上上交交流流的的有有关关资料资料5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料 2.2.2 直接获取的数据直接获取的数据(P19)直接获取数据的手段主要有:直接获取数据的手段主要有:1.普查普查2.抽样调查抽样调查1.普查普查(P19)1.为特定目的专门组织的为特定目的专门组织的,非经常性的全非经常性的全面调查面调查2.通常是一次性或周期性的通常是一次性或周期性的3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间4.数据的规范化程度较高数据的规范化程度较高5.应用范围比较
14、狭窄应用范围比较狭窄总体总体2.抽样调查抽样调查(P19)1.从总体中随机抽取一部分单位作为样本从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体特征的数据收集方法 总体总体总体总体随机样本随机样本随机样本随机样本 2.具有经济性、时具有经济性、时 效性强、适应面广、效性强、适应面广、准确性高等特点准确性高等特点3.可以估计和控制误可以估计和控制误差的大小差的大小2.3 统计统计数据的质量数据的质量(P20)1.抽样误差抽样误差(P20下下)1、定义:、定义:所有样本可能的结果与总体真值之间所有样本可能的结果与总体真
15、值之间的平均性差异。的平均性差异。2、产生原因:、产生原因:由于抽样的随机性所带来的。由于抽样的随机性所带来的。3、影响抽样误差大小的因素:、影响抽样误差大小的因素:与样本容量的算术根成反比与样本容量的算术根成反比与总体方差成正比与总体方差成正比4、特点:、特点:是不可避免的,但可以预先计算并加以控制是不可避免的,但可以预先计算并加以控制 在坚持随机原则的条件下,平均来讲,抽样误在坚持随机原则的条件下,平均来讲,抽样误差与样本容量的算术根成反比差与样本容量的算术根成反比2.非抽样误差非抽样误差(P20上上)1.定义:定义:除抽样误差以外的,由于其他原因除抽样误差以外的,由于其他原因造成的,样本
16、观察结果与总体真值之间的造成的,样本观察结果与总体真值之间的差异差异2.产生原因:产生原因:工作失误或人为干扰工作失误或人为干扰3.特点:特点:存在于所有的调查之中存在于所有的调查之中 造成的结果往往是致命的,但又是可以避免造成的结果往往是致命的,但又是可以避免的的3.误差的控制误差的控制1.抽样误差的控制:抽样误差的控制:进行事先计算并调整相进行事先计算并调整相关的影响因素关的影响因素2.非抽样误差的控制:非抽样误差的控制:调查员的挑选调查员的挑选调查员的培训调查员的培训督导员的调查专业水平督导员的调查专业水平调查过程控制调查过程控制调查结果进行检验、评估调查结果进行检验、评估现场调查人员进
17、行奖惩的制度现场调查人员进行奖惩的制度2.4 统计数据的整理(P21)一、统计数据的分组一、统计数据的分组 二、次数分配二、次数分配 三、次数分配直方图三、次数分配直方图 四、洛伦茨曲线四、洛伦茨曲线统计数据的分类统计数据的分类(补充补充)所有的统计指标都可以称为综所有的统计指标都可以称为综合指标,它分为总量指标、相合指标,它分为总量指标、相对指标和平均指标三大类。对指标和平均指标三大类。总量指标的概念总量指标的概念(补充补充)总量指标是反映社会经济现象发展总量指标是反映社会经济现象发展的总规模,总水平的综合指标。的总规模,总水平的综合指标。总量指标是对统计调查得来的原始总量指标是对统计调查得
18、来的原始资料经过分组和汇总得到的各项总资料经过分组和汇总得到的各项总计数字是统计整理阶段的直接成果。计数字是统计整理阶段的直接成果。总量指标又称统计绝对数,它的数总量指标又称统计绝对数,它的数值随统计范围的大小而增加或减少。值随统计范围的大小而增加或减少。总量指标是计算相对指标和平均指总量指标是计算相对指标和平均指标的基础。标的基础。总量指标首先表现为总量:总量指标首先表现为总量:如:如:1995年我国国内生产总值年我国国内生产总值57733亿元,亿元,钢产量钢产量9400万吨,城镇职工工资总额万吨,城镇职工工资总额8100亿元。亿元。总量指标还可以表现为两个总量指标的总量指标还可以表现为两个
19、总量指标的差:差:如:某市如:某市2005年新增人口年新增人口12万人,某企万人,某企业今年总产值比上年增加业今年总产值比上年增加5000万元。万元。总量指标的分类总量指标的分类(补充补充)1.按反映现象总体内容的不同,总量指按反映现象总体内容的不同,总量指标分为总体单位总量和总体标志总量。标分为总体单位总量和总体标志总量。总体单位总量是指总体内所有单位的总和。总体单位总量是指总体内所有单位的总和。如:全国企业总数,广东省高校总数。如:全国企业总数,广东省高校总数。总体标志总量是指总体中各单位标志值的总和。总体标志总量是指总体中各单位标志值的总和。如:全国企业总产值,广东省高校总投资额。如:全
20、国企业总产值,广东省高校总投资额。2.按反映时间状态的不同,总量指标分为按反映时间状态的不同,总量指标分为时期指标和时点指标。时期指标和时点指标。时期指标是指反映一段时间连续变化结时期指标是指反映一段时间连续变化结果的总量指标。果的总量指标。如:社会生产总值,基本投资总额,人如:社会生产总值,基本投资总额,人口出生总数。口出生总数。时点指标是指反映某一时点时点指标是指反映某一时点(瞬间瞬间)上的上的总量指标。总量指标。如:人口数,库存额,银行存款余额。如:人口数,库存额,银行存款余额。总量指标的单位总量指标的单位(补充补充)总量指标是按实物单位、货币单位和劳总量指标是按实物单位、货币单位和劳动
21、量单位来计量的。动量单位来计量的。实物单位有:实物单位有:自然单位:个、辆、匹、头自然单位:个、辆、匹、头度量衡单位:公斤、吨、米、公里、平方度量衡单位:公斤、吨、米、公里、平方米、立方厘米米、立方厘米双重单位:台双重单位:台/千瓦、吨千瓦、吨/台台复合单位:吨公里、千瓦小时复合单位:吨公里、千瓦小时相对指标的概念相对指标的概念(补充补充)相对指标又称统计相对数,它是两相对指标又称统计相对数,它是两个有相互联系的现象数量的比率。个有相互联系的现象数量的比率。相对指标的作用:相对指标的作用:为人们深入认识事物发展的质量与为人们深入认识事物发展的质量与状况提供客观的依据;状况提供客观的依据;使不能
22、对比的现象找到可以对比的使不能对比的现象找到可以对比的基础,提供更为有效的分析。基础,提供更为有效的分析。相对指标的数值可有两种表现:有相对指标的数值可有两种表现:有名数与无名数。名数与无名数。有名数的计算单位是计算相对指标有名数的计算单位是计算相对指标时,因分子与分母的单位不同而构时,因分子与分母的单位不同而构成的新单位,称为双重单位。成的新单位,称为双重单位。无名数的计算单位是计算相对指标时,无名数的计算单位是计算相对指标时,分子与分母的单位相同而消除成为纯分子与分母的单位相同而消除成为纯数,多以倍数、成数、百分数或千分数,多以倍数、成数、百分数或千分数表示。数表示。倍数:比值大于倍数:比
23、值大于1很多时,将分母抽象很多时,将分母抽象化为化为1的比值;的比值;成数:将分母抽象化为成数:将分母抽象化为10的比值;的比值;百分数:将分母抽象化为百分数:将分母抽象化为100的比值,的比值,常将比值带上符号常将比值带上符号%;百分数的差值常;百分数的差值常称为百分点。称为百分点。千分数:将分母抽象化为千分数:将分母抽象化为1000的比值,的比值,常将比值带上符号常将比值带上符号。无名数的表示无名数的表示(补充补充)随着研究目的和任务的不同,对比基数也随着研究目的和任务的不同,对比基数也不同,从而产生不同的相对指标。不同,从而产生不同的相对指标。相对指标的种类相对指标的种类(补充补充)1、
24、结构相对指标,结构相对指标,2、比例相对指标,比例相对指标,3、比较相对指标,比较相对指标,4、强度相对指标,强度相对指标,5、动态相对指标,动态相对指标,6、计划完成任务相对指标。计划完成任务相对指标。结构相对指标:是在分组的基础上,以总结构相对指标:是在分组的基础上,以总体总量为比较标准,求出各组总量占总体体总量为比较标准,求出各组总量占总体总量的比重,以反映总体内部组成情况的总量的比重,以反映总体内部组成情况的综合指标。综合指标。1、结构相对指标、结构相对指标(补充补充)计算公式:计算公式:计算结果用百分数或成数表示。计算结果用百分数或成数表示。性质:各组比重总和等于性质:各组比重总和等
25、于100%或或1。例:某大学例:某大学2008年招收的新生共年招收的新生共1900人,其中男生人,其中男生1273人,女生人,女生627人,求人,求2008年该大学新招男、女生的比重年该大学新招男、女生的比重。解:解:2008年该大学新招男生比重为:年该大学新招男生比重为:12731900=67%2008年该大学新招女生比重为:年该大学新招女生比重为:167%=33%比例相对指标:是总体中不同部分数量对比例相对指标:是总体中不同部分数量对比的综合指标,用以分析总体范围内各部比的综合指标,用以分析总体范围内各部分之间的比例状况和协调平衡状况。分之间的比例状况和协调平衡状况。2、比例相对指标、比例
26、相对指标(补充补充)计算公式:计算公式:注意:注意:在描述比例时,前者对应分子而在描述比例时,前者对应分子而后者对应分母,如甲:乙后者对应分母,如甲:乙=甲数甲数/乙数。乙数。计算结果常用百分数表示,也有以比较基计算结果常用百分数表示,也有以比较基数抽象化为数抽象化为1、100、1000的表示方法。的表示方法。例:某大学例:某大学2008年招收的新生共年招收的新生共1375人,其中男生人,其中男生750人,女生人,女生625人,求人,求2008年该大学新招男、女生的比例年该大学新招男、女生的比例。解:解:2008年该大学新招男女生比例为:年该大学新招男女生比例为:750625=120%也可以说
27、,也可以说,2008年该大学新招男女年该大学新招男女生比例为:生比例为:1.2:1,还可以说是还可以说是120:100。结构相对数与比例相对数的对比结构相对数与比例相对数的对比(补充补充)相同之处:相同之处:都是同一总体中的数量对比,都是同一总体中的数量对比,比较中的分子分母两个指标值类型相同,比较中的分子分母两个指标值类型相同,所属时间相同。所属时间相同。不同之处:不同之处:结构相对指标的分子是分母中的一部份;结构相对指标的分子是分母中的一部份;比例相对指标的分子、分母都是同一总体比例相对指标的分子、分母都是同一总体中的不同部份。中的不同部份。比较相对指标:是不同单位的同类现象数比较相对指标
28、:是不同单位的同类现象数量对比的相对指标,用以说明某同类现象量对比的相对指标,用以说明某同类现象在同一时间内不同单位发展的不平衡。在同一时间内不同单位发展的不平衡。3、比较相对指标、比较相对指标(补充补充)计算公式:计算公式:注意:注意:在描述对比时,前者对应分子而后在描述对比时,前者对应分子而后者对应分母,如甲:乙者对应分母,如甲:乙=甲数甲数/乙数。乙数。计算结果常用百分数或倍数表示,也可以计算结果常用百分数或倍数表示,也可以比例形式表示。比例形式表示。例:某年北京市工业总产值例:某年北京市工业总产值708.97亿元,亿元,上海市工业总产值上海市工业总产值1515.35亿元,求上亿元,求上
29、海市与北京市的工业总产值比较。海市与北京市的工业总产值比较。解解:由于由于 1515.35708.97=2.14 可知,该年上海市工业总产值为北可知,该年上海市工业总产值为北京的京的2.14倍。倍。也可以说是也可以说是214%。强度相对指标:是两个性质不同而有联系强度相对指标:是两个性质不同而有联系的总量指标的对比,以表明某一现象在另的总量指标的对比,以表明某一现象在另一现象中发展的强度、密度和普遍程度。一现象中发展的强度、密度和普遍程度。4、强度相对指标、强度相对指标(补充补充)计算公式:计算公式:注意:注意:在计算强度相对指标时,应保留分子和在计算强度相对指标时,应保留分子和分母的单位,从
30、而构造指标的双重单位。分母的单位,从而构造指标的双重单位。强度相对指标有正逆指标之分。其值越强度相对指标有正逆指标之分。其值越大越好者为正指标,反之为逆指标。大越好者为正指标,反之为逆指标。例:服务的人数例:服务的人数零售商业机构个数零售商业机构个数=每千人拥有每千人拥有的零售商业机构个数,其数值越大反映人群获得的零售商业机构个数,其数值越大反映人群获得的服务越好,属于正指标。的服务越好,属于正指标。例:零售商业机构个数例:零售商业机构个数服务的人数服务的人数=每个商业机每个商业机构所服务的人数,其数值越大反映人群获得的服构所服务的人数,其数值越大反映人群获得的服务越差,属于逆指标。务越差,属
31、于逆指标。例:零售商业机构个数,与其所服务的人数相比例:零售商业机构个数,与其所服务的人数相比较,属于强度相对指标。较,属于强度相对指标。例:某地区去年的国民生产总值为例:某地区去年的国民生产总值为12.56亿元,该地区亿元,该地区去年人口总数为去年人口总数为20万人,求该地区去年万人,求该地区去年GDP。解:解:12.56亿元亿元20万人万人=0.628亿元亿元/万人万人=6280元元/人人 即即该地区去年该地区去年GDP为人均为人均6280元。元。动态相对指标:又称发展速度,它是两个发动态相对指标:又称发展速度,它是两个发生于不同时间的同类指标的对比,以表明事生于不同时间的同类指标的对比,
32、以表明事物在两个时间之间发展变化的程度。物在两个时间之间发展变化的程度。5、动态相对指标、动态相对指标(补充补充)计算公式:计算公式:注意:注意:分子为研究目标,其所属时期称为报分子为研究目标,其所属时期称为报告期、计算期或本期;分母为对比基数,其告期、计算期或本期;分母为对比基数,其所属时期称为基期。所属时期称为基期。例:某地区工业生产总值,例:某地区工业生产总值,2004年为年为8.56亿元,亿元,2009年为年为16.25亿元,求该地区工业生产总值五年亿元,求该地区工业生产总值五年来的发展速度和增长速度。来的发展速度和增长速度。解:该地区工业生产总值五年来的发展速度为解:该地区工业生产总
33、值五年来的发展速度为 16.25亿元亿元8.56亿元亿元=1.90%该地区工业生产总值五年来的增长速度为该地区工业生产总值五年来的增长速度为 1.90%1=0.90%比较相对数、强度相对数、动态相对数的对比比较相对数、强度相对数、动态相对数的对比(补充补充)时间时间空空间间指指标标比比较较相相对对数数相同相同不同不同相同相同强强度相度相对对数数相同相同相同相同不同不同动态动态相相对对数数不同不同相同相同相同相同计划完成任务相对指标:是现象在某一段时计划完成任务相对指标:是现象在某一段时间内的实际完成数与计划任务数对比,以观间内的实际完成数与计划任务数对比,以观察计划的完成程度。察计划的完成程度
34、。6、计划完成任务相对指标、计划完成任务相对指标(补充补充)基本公式:基本公式:注意:注意:分子与分母的指标涵义、计算口径、分子与分母的指标涵义、计算口径、计算方法、计量单位、时间长短及空间范围计算方法、计量单位、时间长短及空间范围必须一致。必须一致。实际完成数计划数实际完成数计划数=计划执行的绝对效果计划执行的绝对效果例:某企业例:某企业2008年产值计划达到年产值计划达到1500万元,实际万元,实际达到达到1872万元,求该计划的完成程度。万元,求该计划的完成程度。解:该计划的完成程度为解:该计划的完成程度为 1872万元万元1500万元万元=124.8%可知,该企业可知,该企业2008年
35、产值计划超额年产值计划超额24.8%完成。完成。例:某企业例:某企业2008年产值计划为去年的年产值计划为去年的120%,实际,实际超额完成了超额完成了32%,求该计划的完成程度。,求该计划的完成程度。解:该计划的完成程度为解:该计划的完成程度为 (1+32%)120%=110%可知,该企业可知,该企业2008年产值计划超额年产值计划超额10%完成。完成。2.4.1 统计数据的分组(P21)按数据的四种计量尺度,采用不同的分组方法:按数据的四种计量尺度,采用不同的分组方法:1.1.列名尺度和顺序尺度是按照事物的性质和属列名尺度和顺序尺度是按照事物的性质和属性划分的,按该两种尺度分组又称为按性划
36、分的,按该两种尺度分组又称为按品质标志品质标志分组。分组。2.2.间隔尺度和比例尺度是按照事物的数量标间隔尺度和比例尺度是按照事物的数量标准划分的,按该两种尺度分组又称为按准划分的,按该两种尺度分组又称为按数量标志数量标志分组。分组。1.按品质标志分组的方法按品质标志分组的方法基本方法:按各不同性质、属性划分类别基本方法:按各不同性质、属性划分类别 而分组。而分组。例例1 将学生按性别将学生按性别(列名尺度列名尺度)分为分为“男男”、“女女”两组。两组。例例2 将学生按等级成绩将学生按等级成绩(顺序尺度顺序尺度)分为分为“优优”、“良良”、“中中”、“及格及格”、“不及格不及格”五组。五组。并
37、在分组表中,按顺序排列各组名称。并在分组表中,按顺序排列各组名称。2.按数量标志分组的方法按数量标志分组的方法基本方法:基本方法:按数量标志的不同属性按数量标志的不同属性(连续变量、连续变量、离散变量离散变量)进行不同类型进行不同类型(单变量值分组、组距单变量值分组、组距分组分组)的分组。具体有四种不同方式:的分组。具体有四种不同方式:1离散变量离散变量变量只间断取值变量只间断取值 (1)取值范围小:以各变量值为组名称取值范围小:以各变量值为组名称单变量值分单变量值分组组(常用常用)(2)取值范围大:以两整数值代表两整数间距取值范围大:以两整数值代表两整数间距组距组距分组分组2连续变量连续变量
38、变量可连续取任意数值变量可连续取任意数值 (3)以一整数值代表相邻两整数间距以一整数值代表相邻两整数间距单变量值分组单变量值分组 (4)以两整数值代表两整数间距以两整数值代表两整数间距组距分组组距分组(常用常用)(1)单变量值分组的条件及方法单变量值分组的条件及方法 变变量量取取值值范范围围小小时时都都可可应应用用单单变变量量值值分分组组,但但连续变量与离散变量的分组定义不相同。连续变量与离散变量的分组定义不相同。1.在在变量只取整数且取值范围较小变量只取整数且取值范围较小时,可采用单时,可采用单变量值分组,即每一个变量值作为一组。这时,变量值分组,即每一个变量值作为一组。这时,各单变量值作为
39、组的名称,也是组的取值范围。各单变量值作为组的名称,也是组的取值范围。2.在在变量连续取值且常用整数代表两相邻整数间变量连续取值且常用整数代表两相邻整数间区间区间时,若取值范围较小,亦可采用单变量值分时,若取值范围较小,亦可采用单变量值分组。这时,各单变量值作为组的名称,两相邻整组。这时,各单变量值作为组的名称,两相邻整数间区间才是组的取值范围数间区间才是组的取值范围。单变量值分组的例单变量值分组的例 当变量取值范围较小时,常采取单变量分组当变量取值范围较小时,常采取单变量分组1.家庭人口数是离散变量,其取值范围小家庭人口数是离散变量,其取值范围小 中国家庭按人口数分组,可分为中国家庭按人口数
40、分组,可分为1人、人、2人、人、3人、人、8人等八个组。人等八个组。2.幼儿园小朋友年龄是连续变量,其取值范幼儿园小朋友年龄是连续变量,其取值范围小围小 幼儿园小朋友按年龄分为幼儿园小朋友按年龄分为3岁、岁、4岁、岁、5岁、岁、6岁四个组岁四个组(k岁组包含足岁组包含足k岁至岁至k+1岁以下岁以下)。(2)组距分组的条件及方法组距分组的条件及方法 对对取取值值范范围围大大的的离离散散变变量量及及连连续续变变量量都都可应用组距分组可应用组距分组将变量值的一个区间作为一个组将变量值的一个区间作为一个组更适合于连续变量更适合于连续变量适合于变量值较多的情况适合于变量值较多的情况注意遵循注意遵循“不重
41、不漏不重不漏”的原则的原则可采用等距分组,也可采用不等距分组可采用等距分组,也可采用不等距分组可采用闭口分组,也可采用开口分组可采用闭口分组,也可采用开口分组常常采采用用重重叠叠组组限限方方式式分分组组,这这时时常常规规定定“上限不在组内上限不在组内”的原则的原则也也可可以以采采用用不不重重叠叠组组限限方方式式分分组组,这这时时常常规规定定“实实际际上上限限为为上上组组的的下下限限”(上上组组即即为为较大组较大组-可由垂直向上的数轴确定方向可由垂直向上的数轴确定方向)10 2010 2020 3020 3030 4030 4040 5040 5050 6050 60组距分组的例组距分组的例当离
42、散变量取值范围较大时,常采用组距当离散变量取值范围较大时,常采用组距分组分组1.企业职工人数是离散变量,其取值范围大企业职工人数是离散变量,其取值范围大 企业按职工人数可分为企业按职工人数可分为19人、人、1099人、人、100999人、人、10009999人、人、1000099999人、人、100000999999人、人、1000000999999人等七人等七组。组。(不等距、闭口、不重叠组限不等距、闭口、不重叠组限)对连续变量必须采用组距分组对连续变量必须采用组距分组2.百分制成绩是连续变量,其取值范围大百分制成绩是连续变量,其取值范围大 将百分制考试成绩分为将百分制考试成绩分为60以下、
43、以下、6070、7080、8090、90以上等五组。以上等五组。(等距、开口、重等距、开口、重叠组限叠组限)作组距分组的一般步骤及方法作组距分组的一般步骤及方法1.确确定定组组数数:组组数数的的确确定定,应应以以能能够够显显示示数数据据的的分分布布特特征征和和规律为目的规律为目的 斯特格斯经验公式:斯特格斯经验公式:其中其中N为数据的个数为数据的个数,结果取整数,结果取整数 一般情况下,一般情况下,5K 152.确确定定组组距距:组组距距是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所所分分的的组组数数来来确确定定,为为便便于
44、于分分析析和统计,一般应使组限和组距为和统计,一般应使组限和组距为10的整数倍。的整数倍。全距全距=最大值最大值 最小值最小值 (可扩大为可扩大为10的整数倍的整数倍)相等组距全距相等组距全距 组数组数 (可扩大为可扩大为10的整数倍的整数倍)3.统统计计并并整整理理成成表表:统统计计出出各各组组的的频频数数(各各组组元元素素个个数数)并并整整理成频数分布表理成频数分布表 进行组距分组的一般技巧进行组距分组的一般技巧为便于统计和分析,组距及组限宜取为便于统计和分析,组距及组限宜取10 或或5的倍数,的倍数,组数宜在组数宜在515之间,之间,最小组的下限应低于最小变量值,最大组的上限应高于最小组
45、的下限应低于最小变量值,最大组的上限应高于最大变量值,最大变量值,对数据稀疏且极端值较远的最大组和最小组可采用开口对数据稀疏且极端值较远的最大组和最小组可采用开口式分组,式分组,对数据分布呈递增或递减状态的,可按其变化形式采用对数据分布呈递增或递减状态的,可按其变化形式采用不等距分组,不等距分组,组名称的顺序放置一般按习惯,从上往下一般为由小到组名称的顺序放置一般按习惯,从上往下一般为由小到大,也可以由大到小,大,也可以由大到小,使用重叠组限方式分组的,一般规定使用重叠组限方式分组的,一般规定“上限不在组内上限不在组内”,使用不重叠组限方式分组的,一般规定使用不重叠组限方式分组的,一般规定“实
46、际上限为上实际上限为上组的下限组的下限”。与组距分组相关的与组距分组相关的几个概念几个概念1.下限下限:一个组的最小值一个组的最小值2.上限:上限:一个组的最大值一个组的最大值3.全距:全距:全部数据中最大值与最小值之差全部数据中最大值与最小值之差4.组距:组距:上限与下限之差上限与下限之差5.组中值:组中值:下限与上限之间的中点值,或下限与上限之间的中点值,或称组平均数,常用作组的代表值称组平均数,常用作组的代表值组中值的计算方法组中值的计算方法1.闭口组:2.开口组:作不等组距分组的例题作不等组距分组的例题由于年龄分布具有年龄越小,人数越多,年龄越大,人数由于年龄分布具有年龄越小,人数越多
47、,年龄越大,人数越少的现象,因此对人口按年龄进行分组也可以作不等距越少的现象,因此对人口按年龄进行分组也可以作不等距分组。分组。P23表表2.9就是对我国人口按性别特征进行不等距的年龄阶就是对我国人口按性别特征进行不等距的年龄阶段分组的两个定义表段分组的两个定义表(男、女两种不同划分男、女两种不同划分)。表表2.9 2.9 我国人口年龄阶段的分组我国人口年龄阶段的分组按年龄阶段分组按年龄阶段分组男性男性女性女性婴幼儿婴幼儿0 06 6岁岁0 06 6岁岁少年儿童少年儿童7 71717岁岁7 71717岁岁中青年中青年18185959岁岁18185454岁岁老年老年6060岁及以上岁及以上555
48、5岁及以上岁及以上2.4.2 次数分配次数分配(P22)1.次数分配表的编制:次数分配表的编制:将数据进行分组,就是将数据按某标志进行分组,并纪将数据进行分组,就是将数据按某标志进行分组,并纪录样本观察值在各组内的单位数录样本观察值在各组内的单位数(亦称次数、频数亦称次数、频数),也可,也可纪录样本观察值在各组内的单位数比重纪录样本观察值在各组内的单位数比重(亦称频率亦称频率)。这就。这就是次数分配的形成。是次数分配的形成。次数分配形成的首要步骤在于按某标志进行分组。所以,次数分配形成的首要步骤在于按某标志进行分组。所以,必须掌握分组的方法。必须掌握分组的方法。次数分配的形成的第二步骤是纪录样
49、本观察值在各组内次数分配的形成的第二步骤是纪录样本观察值在各组内的单位数,并形成分配表。的单位数,并形成分配表。按品质标志(列名尺度)编分配表的例题按品质标志(列名尺度)编分配表的例题(1)例例1:下表是我国大陆人口按性别标志分组形成的频数:下表是我国大陆人口按性别标志分组形成的频数分布表。其中左边第一列就是分组情况。第二列为各分布表。其中左边第一列就是分组情况。第二列为各组人数的统计结果。第三列为按各组人数计算的比重。组人数的统计结果。第三列为按各组人数计算的比重。1998年我国大陆人口性别分布表年我国大陆人口性别分布表按品质标志(顺序尺度)编分配表的例题按品质标志(顺序尺度)编分配表的例题
50、(2)例例2:下面是对某班学生按等级成绩分组形成的频数分:下面是对某班学生按等级成绩分组形成的频数分布表。其中左边第一列就是各组名称,从上而下分别布表。其中左边第一列就是各组名称,从上而下分别由高到低分布。第二列为各组人数的统计结果。第三由高到低分布。第二列为各组人数的统计结果。第三列为按各组人数计算的比重。列为按各组人数计算的比重。某班学生按等级成绩分布表某班学生按等级成绩分布表对离散变量作单变量值分组编分配表的例对离散变量作单变量值分组编分配表的例(3)下表是对某城市家庭按家庭人口数分组的统计表。下表是对某城市家庭按家庭人口数分组的统计表。家庭人口数是离散变量,且家庭人口数分布范围较小,家