《统计学教程..ppt》由会员分享,可在线阅读,更多相关《统计学教程..ppt(230页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学教程统计学教程.二、统计学的研究对象和研究方法二、统计学的研究对象和研究方法(一)统计包含(一)统计包含三种涵义,两重关系三种涵义,两重关系1、统计工作:调查研究。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计学:研究如何搜集、整理、分析数据资料的一 门方法论方法论科学。统计工作统计工作统计资料统计资料统统 计计 学学工作与工作成果关系工作与工作成果关系实践与理实践与理论关系论关系统计学的性质:是一门适用于自然现象和社会现象的方法论学科。统计学的研究对象:大量现象的数量方面。包括数量 特征、数量关系、数量界限等。(二)统计学的研究对象(二)统计学的研究对象
2、(三)统计学的研究对象(三)统计学的研究对象1、大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是反映随机现象基本规律的大数定律。2、综合指标法是从数量方面对现象总体特征的概括说明。综合指标法,就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。3、统计推断法是在一定置信程度(即可靠程度)下,根据样本资料的特征对总体特征作出估计和预测的方法。统计推断是现代统计学的基本方法。一、统计学的产生与发展一、统计学的产生与发展产生产生原始社会后期:统计萌芽于计数活动;奴隶制国家产生:使统
3、计日显重要;封建社会时期:统计已具规模;资本主义的兴起:统计扩展到社会经济各方面。统统 计学应运而生,统计学作为一门系统计学应运而生,统计学作为一门系统的科学,距今只有的科学,距今只有300多年的历史。多年的历史。一、统计学的产生与发展一、统计学的产生与发展发展(三个时期)发展(三个时期)(一)统计学的萌芽期(一)统计学的萌芽期(17世纪中世纪中18世纪中)世纪中)1、德国的记述学派(国势学派、德国的记述学派(国势学派 康令康令 (16061681)阿痕瓦尔(阿痕瓦尔(17191772;1764年首创统计学一词)年首创统计学一词)他们在大学中开设他们在大学中开设“国势学国势学”采用记述性材料,
4、讲采用记述性材料,讲述国家述国家“显著事项显著事项”,籍以说明管理国家的方法,籍以说明管理国家的方法。特特点是点是偏重于事物质的解释而忽视量的分析偏重于事物质的解释而忽视量的分析。(二)统计学的近代期(二)统计学的近代期(18世纪末世纪末19世纪末)世纪末)1、数理统计学派、数理统计学派 代表人物:法国的拉普拉斯,比利时的凯特勒代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把拉普拉斯把古典概率论引进统计学古典概率论引进统计学,发展了概发展了概率论,推广了概率论在统计中的应用。率论,推广了概率论在统计中的应用。2、政治算术学派、政治算术学派代表人物:英国的威廉代表人物:英国的威廉配第、约翰配
5、第、约翰格朗特等。格朗特等。威廉威廉配第的代表著政治算术对当时的英、荷、配第的代表著政治算术对当时的英、荷、法等国的法等国的“国富和力量国富和力量”进行了数量的计算和比较;格进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作朗特写出了第一本关于人口统计的著作。他们开创了他们开创了从数量方面研究社会经济现象的先例从数量方面研究社会经济现象的先例。凯特勒把德国的国势学派、英国的政治算术学派和凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有统计学。他是数理统计学派
6、的奠定人,有“统计学之父统计学之父”之称。之称。2、社会统计学派、社会统计学派 代表人物:德国的克尼斯、恩格尔、梅尔等代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是他们强调统计学是研究社会现象的科学研究社会现象的科学,包括统包括统 计资料的搜集、整理和分析研究,目的是要揭示现象计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系内部的联系。(三)统计学的现代期(三)统计学的现代期(20世纪初至今)世纪初至今)统计学的主流从描述统计学统计学的主流从描述统计学转向转向推断统计学。推断统计学。20世纪世纪30年代年代R费希尔的推断统计理论标志着现代数理费希尔的推断统计理论标志着现代数理
7、统计学的确立。统计学的确立。60年代以后统计学发展有三个明显的趋势:年代以后统计学发展有三个明显的趋势:1统计学依赖和吸收数学更多;统计学依赖和吸收数学更多;2以统计学为基础的边缘学科不断形成;以统计学为基础的边缘学科不断形成;3与电子计算机技术相结合,应用范围更广,作用更大。与电子计算机技术相结合,应用范围更广,作用更大。三、统计学的要素和内容三、统计学的要素和内容1、统计总体和总体单位、统计总体和总体单位总体总体统计研究所确定的客观对象,是具统计研究所确定的客观对象,是具统计研究所确定的客观对象,是具统计研究所确定的客观对象,是具 有共同性质的许多单位组成的整体。有共同性质的许多单位组成的
8、整体。有共同性质的许多单位组成的整体。有共同性质的许多单位组成的整体。无限总体:含无限多个单位无限总体:含无限多个单位无限总体:含无限多个单位无限总体:含无限多个单位范围范围范围范围 有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。总体单位:组成总体的各个单位(或元素),是总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。各项统计数字的原始承担者。同质性:总体中各个单位具有某同质性:总体中各个单位具有某种共同的性质。种共同的性质。大量性:总体总是包含大量的单位。大量性:总体总是包含大量的单位。(一)统计学的要素(一)统计学的要素
9、特点特点2、标志、标志标志标志总体单位的属性、特征。总体单位的属性、特征。总体单位的属性、特征。总体单位的属性、特征。品质标志:用文字表示属性品质标志:用文字表示属性品质标志:用文字表示属性品质标志:用文字表示属性分类分类分类分类数量标志:用数字表示特征数量标志:用数字表示特征数量标志:用数字表示特征数量标志:用数字表示特征不变标志:各单位具体表现不变标志:各单位具体表现不变标志:各单位具体表现不变标志:各单位具体表现 相同相同相同相同可变标志:各单位具体表现可变标志:各单位具体表现可变标志:各单位具体表现可变标志:各单位具体表现 不同不同不同不同指标:综合反映总体数量特征的概念和数值。指标:
10、综合反映总体数量特征的概念和数值。构成:指标名指标数值构成:指标名指标数值构成:指标名指标数值构成:指标名指标数值特点:具体性;综合性特点:具体性;综合性特点:具体性;综合性特点:具体性;综合性3、指标和指标体系、指标和指标体系分类:数量指标;质量指标分类:数量指标;质量指标描述指标;评价指标;预警指标描述指标;评价指标;预警指标描述指标;评价指标;预警指标描述指标;评价指标;预警指标绝对数指标;相对数指标;平均数指标绝对数指标;相对数指标;平均数指标绝对数指标;相对数指标;平均数指标绝对数指标;相对数指标;平均数指标在推断统计中:说明总体的指标也称参数。在推断统计中:说明总体的指标也称参数。
11、在推断统计中:说明总体的指标也称参数。在推断统计中:说明总体的指标也称参数。说明样本的指标称统计量。说明样本的指标称统计量。说明样本的指标称统计量。说明样本的指标称统计量。指标体系:具有内在联系的一系指标构成的整体。指标体系:具有内在联系的一系指标构成的整体。指标体系:具有内在联系的一系指标构成的整体。指标体系:具有内在联系的一系指标构成的整体。标志与指标的联系与区别:标志与指标的联系与区别:联系(联系(1)一些数量标志汇总可以得到指标的数值)一些数量标志汇总可以得到指标的数值。区别(区别(1)标志是说明总体单位特征的,而指标是说统)标志是说明总体单位特征的,而指标是说统 统计总体数量特征的;
12、统计总体数量特征的;(2)数量标志与指标之间存在变换)数量标志与指标之间存在变换 关系。关系。(2)标志的具体表现,有的用数值有的用文字表示,)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。而指标都是用数值表示的。4、变量和变量值、变量和变量值变量变量可变的数量标志和统计指标。可变的数量标志和统计指标。可变的数量标志和统计指标。可变的数量标志和统计指标。确定性变量确定性变量确定性变量确定性变量分类分类分类分类随机性变量随机性变量随机性变量随机性变量离散性变量离散性变量离散性变量离散性变量连续性变量连续性变量连续性变量连续性变量变量值:即变量的具体数值,包括标志值和指标数值变
13、量值:即变量的具体数值,包括标志值和指标数值社会经济现象中许多变量,既受确定性因素影响,又社会经济现象中许多变量,既受确定性因素影响,又社会经济现象中许多变量,既受确定性因素影响,又社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。受随机性因素影响。要根据具体情况加以认定。受随机性因素影响。要根据具体情况加以认定。受随机性因素影响。要根据具体情况加以认定。5、样本、样本是从总体中随机抽取部分单位所构成的集合是从总体中随机抽取部分单位所构成的集合是从总体中随机抽取部分单位所构成的集合是从总体中随机抽取部分单位所构成的集合体。体。体。体。必须取自所要研究的总体
14、;必须取自所要研究的总体;特点特点特点特点从一个总体中可抽取许多个样本,这从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着些样本的数值是不同的,也即存在着随机的差异;随机的差异;样本必须具有代表性;样本必须具有代表性;样本必须具有客观性,也即排除主样本必须具有客观性,也即排除主观因素的影响观因素的影响6、推断:就是以样本信息为依据对总体的某些特、推断:就是以样本信息为依据对总体的某些特 征作出预测和估计。征作出预测和估计。7、推断的可靠性:根据随机抽取的样本对总体推、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称断所得出的结果的可靠程度,也称置信度置信度
15、。(二)统计学的内容(二)统计学的内容1、描述统计、描述统计指搜集、整理、分析并提供统计资指搜集、整理、分析并提供统计资料的理论和方法。料的理论和方法。主要任务:使反映客观事物的统计数据主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。可以说明现象的数量特征和数量关系。2、推断统计、推断统计是只依据样本资料推断总体特征的是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设技术和方法,包括参数估计和假设检验的方法。检验的方法。描述统计是推断统计的前提,描述统计是推断统计的前提,推断统计是描述统计的发展。
16、推断统计是描述统计的发展。四、统计测定的层次四、统计测定的层次 统计测定(统计测定(measurement)即对总体数量特征的量度,包括登记、分类、即对总体数量特征的量度,包括登记、分类、标示、计算等。标示、计算等。四个测定层次的比较四个测定层次的比较1234量量量量化化化化等等等等级级级级功功功功能能能能包包包包容容容容1234测定层次测定层次特征特征运算功能运算功能举例举例1、定名测定、定名测定2、序列测定、序列测定3、间距测定、间距测定4、比率测定、比率测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单
17、位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减加减乘除乘除产业分类产业分类企业等级企业等级产品质量产品质量差异差异商品销售商品销售额额第二章第二章 统计调查与整理统计调查与整理统计调查统计调查统计整理统计整理统计分析统计分析有组织、有组织、有计划地有计划地搜集资料。搜集资料。要求:准确、要求:准确、完整、及时完整、及时对调查资料对调查资料去伪存真、去伪存真、去粗取精、去粗取精、科学分类、科学分类、浓缩简化浓缩简化描述性分析描述性分析推断分析、推断分析、决策分析。决策分析。要求:定性要求:定性定量结合定量结合统计工作的三个中心阶段
18、统计工作的三个中心阶段统计调查统计调查一、调查组织方式一、调查组织方式统计调查统计调查二、调查方案设计二、调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织调专门组织调查查全全面面调调查查非非全全面面调调查查一、统计调查的组织方式一、统计调查的组织方式统计报表制度统计报表制度由政府部门组织,采用统一的表格,由政府部门组织,采用统一的表格,自自上而下上而下布置,布置,自下而上自下而上报告。报告。任务:任务:搜集搜集国民经济和社会发展基本情况国民经济和社会发展基本情况的资
19、的资料,为制订国民经济和社会发展计划和料,为制订国民经济和社会发展计划和检查计划执行情况服务。检查计划执行情况服务。优点:优点:精心周密设计、高度统一、规范。精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积回收率高,内容相对稳定,便于资料积累、对比。累、对比。层层上报、逐级汇总,可以满足各部门层层上报、逐级汇总,可以满足各部门需要。需要。特点:特点:普查普查特点:特点:工作量大工作量大,时间性强时间性强,需要大量人力和财力。,需要大量人力和财力。任务:任务:搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制
20、定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。利用基层单位原始记录和核算资料发表调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定调查的项目和指标。规定调查的项目和指标。重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分个别或部分重点单位重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:一次性调查;专门设计和备配人员现场调查。一次性调查;专门设计
21、和备配人员现场调查。重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用统计报表调查。调查。典型调查典型调查特点:特点:在全面分析的基础上,有在全面分析的基础上,有意识地意识地选择代表性的选择代表性的典型单位典型单位进行现场调查。进行现场调查。任务:任务:为研究某种特殊的社会经济问题,搜集详细为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的的第一手资料,借以认识事物的本质特征本质特征、因果关系因果关系、变化
22、趋势变化趋势。为理论和政策性问题。为理论和政策性问题研究提供依据。研究提供依据。作用:作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和适宜于分析事物的类型,它们之间的差别和关系。关系。方法:方法:“解剖麻雀解剖麻雀;划类选典划类选典;抓两头抓两头”。抽样调查抽样调查特点:特点:1按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数 或或检验总体的某种假设检验总体的某种假设;3抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。调
23、调调调查查查查误误误误差差差差登记性误差登记性误差代表性误差代表性误差编编 差差随机误差随机误差抽样平均误差抽样平均误差实际误差实际误差统计推断中的抽样误差就是统计推断中的抽样误差就是抽样平均误差抽样平均误差。它是处。它是处于调查所固有的,是对抽样推断精确度的量度。于调查所固有的,是对抽样推断精确度的量度。样本容量样本容量样本容量样本容量抽样方式抽样方式抽样方式抽样方式总总总总体体体体内内内内部部部部差差差差异异异异抽样调查的组织方式:抽样调查的组织方式:1简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或方法:将总体单位编成抽样框,而后用抽签或 随机
24、数表抽取样本单位。随机数表抽取样本单位。适用:总体规模不大;总体内部差异小适用:总体规模不大;总体内部差异小2类型抽样(分层抽样)类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型组,方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。后从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优3等距抽样(机械抽样)等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一定方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。的间隔抽取样本单位。排序依据的标志:(排序依据的标志:(1)无无关标志;(关标志;(2)
25、有有关标志关标志(总体单位按某一标志排序)(总体单位按某一标志排序)4整群抽样整群抽样方方法法:将将总总体体全全部部单单位位分分为为许许多多个个“群群”,然然后后随随机机抽抽取取若若干干“群群”,对对被被抽抽中中的的各各“群群”内内的的所所有有单单位登记调查。位登记调查。例:例:例:例:总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量例:例:ABCDEFGHIJKLMNOPLHPD例:例:在某省在某省100多万农户抽取多万农户抽取1000户调查农户生产户调查农户生产性投资情况。性投资情况。5多阶段抽样多阶段抽样第一阶段:从省内部县中抽取第一阶段:从省内部县中抽取5个县个县第二
26、阶段:从抽中的第二阶段:从抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从抽中的第三阶段:从抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从抽中的第四阶段:从抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)抽样方法抽样方法1放回抽样放回抽样:抽出样本单位登记后放回总:抽出样本单位登记后放回总体,再抽时总体不变体,再抽时总体不变2不放回抽样不放回抽样:抽出样本单位登记后不放回总:抽出样本单位登记后不放回总体,再抽时总体渐次减少体,再抽时总体渐次减少二、调查方案统计二、调查方案统计调查方案的主要内容调查方案的主要内容 1、确定调查、确定调查目的目的2、确定
27、调查、确定调查对象对象和和调查单位调查单位 3、拟订调查、拟订调查提纲提纲4、确定调查、确定调查时间时间 5、编制调查的、编制调查的组织计划组织计划调查表与问卷设计调查表与问卷设计调查表调查表单一表单一表一览表一览表例:工业企业统计报表例:工业企业统计报表 问卷结构:问卷结构:说明词说明词+主题词句主题词句+作业记录作业记录例:人口普查登记表例:人口普查登记表问卷问卷设计设计 基本要求:基本要求:主题明确,形式简明,主题明确,形式简明,文字通俗,容易理解,文字通俗,容易理解,便于回答。词句编排,便于回答。词句编排,层次分明,先易后难。层次分明,先易后难。问卷形式:问卷形式:开放式词句开放式词句
28、对选式词句对选式词句多项选择式词句多项选择式词句顺位式词句顺位式词句标度式词句标度式词句案例案例统计整理统计整理主要任务主要任务资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组频数分布频数分布统计表统计表统计图统计图分组分组分组前分组前分组前分组前分组后分组后分组后分组后2533421划分现象类型划分现象类型作用:作用:例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港联营经济;股份制经济;外商投资经济;港澳台投资
29、经济澳台投资经济 2研究总体结构研究总体结构例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.53研究现象之间的依存关系研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系
30、数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6 分组标志的选择与分组形式分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征关键:服从研究任务需要,反映总体本质特征形式形式按分组标志性质分按分组标志性质分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志个数分按分组标志个数分简单分组简单分组复合分组复合分组分组体系分组体系频数分布(分布数列)频数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的是一种重要的分组资料,反映总体单位在各组的分布状态。分布状态。基本形式:基本形式:分组分组单位数单位数频率频率合计合计100频数分布
31、频数分布频率分布频率分布分类分类品质数列品质数列变量数列变量数列单项数列单项数列组距数列组距数列等距数列等距数列异距数列异距数列例例例例例例例例例例例例例例例例变量数列的编制变量数列的编制1计算极差计算极差2确定形式确定形式单项数列:离散型且取值不多。单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。组距数列:离散型且取值多或连续型。3组距数列:组距;组数;组距数列:组距;组数;4计算各组频数,频率,累计频数,累计频率等。计算各组频数,频率,累计频数,累计频率等。5组中值的计算:闭口组;开口组组中值的计算:闭口组;开口组统计表统计表构成构成总表题总表题横行标题:统计研究的对象。也称
32、横行标题:统计研究的对象。也称主词主词。纵栏标题:说明主词的指标名。也称纵栏标题:说明主词的指标名。也称宾词宾词。数字资料数字资料分类分类主词主词简单表简单表分组表分组表复合表复合表宾词宾词平行形式平行形式交叉形式交叉形式编制规则:编制规则:统计图统计图直方图直方图等距数列:(变量,频数)等距数列:(变量,频数)异距数列:异距数列:(变量,频数密度变量,频数密度)折线图折线图曲线图曲线图等距数列:(组中值,频数)等距数列:(组中值,频数)异距数列:(组中值,频数密度)异距数列:(组中值,频数密度)单项数列:(变量,频数)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向上累计分布:
33、(变量上限,累计频数)向下累计分布:(变量下限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线变量的组数无限增多时,折线便趋于一条光滑的曲线。便趋于一条光滑的曲线。P55 P55 图图图图2 25 5图形图形图形图形某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)25311536868.7531.25100.00返回返回某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)(频数)比率()比率(
34、)(频率)(频率)7返回返回23456381055431202.915.241.320.512.18.0255100第三章第三章 综合指标综合指标一一、综合指标概述综合指标概述二、总量指标(绝对数指标)二、总量指标(绝对数指标)三、相对数指标(相对数)三、相对数指标(相对数)四、平均数指标(平均数)四、平均数指标(平均数)五、标志变异指标五、标志变异指标主主要要内内容容案例案例一、一、综合指标概述综合指标概述统计指标统计指标统计指标是综合反映统计总体数量特统计指标是综合反映统计总体数量特征的概念和数值。征的概念和数值。指标名称指标名称指标数值指标数值反映总体某一方面的质反映总体某一方面的质的规
35、定性的规定性,是对总体本质是对总体本质特征的一种概括。特征的一种概括。是总体量的规定性在一是总体量的规定性在一定时间、地点、条件下定时间、地点、条件下的具体表现。的具体表现。统计指标统计指标重要特点:具体性;重要特点:具体性;综合性综合性描述指标描述指标评价指标评价指标监测指标监测指标分类分类数量指标数量指标质量指标质量指标绝对数指标绝对数指标相对数指标相对数指标平均数指标平均数指标指标体系指标体系具具有有内内在在联联系系的的一一系系列列指指标标所所构构成成的的整整体,即称为指标体系。体,即称为指标体系。分类分类社会指标体系社会指标体系经济指标体系经济指标体系科技指标体系科技指标体系基本统计指
36、标体系基本统计指标体系是针对某项社是针对某项社会经济问题而会经济问题而制定的专项指制定的专项指标体系,如工标体系,如工业经济效益指业经济效益指标体系、价格标体系、价格指标体系等。指标体系等。专题统计指标体系专题统计指标体系二、总量指标(绝对数指标)二、总量指标(绝对数指标)概念概念 总量指标是反映社会经济现象总量指标是反映社会经济现象总规模总规模、总水平总水平的的 总和总和指标。指标。(1)反映国情、国力和企事业单位人、财、物)反映国情、国力和企事业单位人、财、物的状况;的状况;(3)是计算相对指标和平均指标的基础。)是计算相对指标和平均指标的基础。(2)是国民经济宏观管理和企业经济核算的基)
37、是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;础性指标,是实行目标管理的工具;作用作用分类分类 按反映总体的内容分按反映总体的内容分按反映的时间状态分按反映的时间状态分(1)社会总产品,)社会总产品,(2)增加值,)增加值,(3)国内生产总值()国内生产总值(GDP)按计量单位分按计量单位分国民经济统计中几个重要的生产总量指标国民经济统计中几个重要的生产总量指标标志总量标志总量总体单位总数总体单位总数时期总量时期总量时点总量时点总量实物量实物量劳动量劳动量价值量价值量三、相对指标(相对数)三、相对指标(相对数)概念概念相相对对指指标标是是两两个个有有联联系系的的指指标标对
38、对比比的的比比值值,反反映映事物的数量特征和数量关系。事物的数量特征和数量关系。(1)反映总体内在的结构特征)反映总体内在的结构特征(3)反映事物发展变化的过程和趋势。)反映事物发展变化的过程和趋势。(2)用于不同对象的比较评价;)用于不同对象的比较评价;作用作用种类种类计划完成相对数计划完成相对数结构相对数结构相对数比例相对数比例相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数不同时期不同时期比比 较较动动 态态相对数相对数强强 度度相对数相对数不同现象不同现象比较比较不同总体不同总体比较比较比比 较较相对数相对数同一总体中同一总体中部分与部分部分与部分比比 较较部分与总体
39、部分与总体比比 较较实际与计划实际与计划比比 较较比比 例例相对数相对数结结 构构相对数相对数计划完成计划完成相对数相对数同一时期比较同一时期比较同类现象比较同类现象比较应用原则应用原则(1)正确选择对比的基数;)正确选择对比的基数;(2)必须注意统计的可比性;)必须注意统计的可比性;(3)相对指标要与总量指标相结合。)相对指标要与总量指标相结合。四、平均指标(平均数)四、平均指标(平均数)概念概念平平均均指指标标反反映映同同类类现现象象的的一一般般水水平平,是是总总体体内内各各单单位位参参差差不不齐齐的的标标志志值值的的代代表表值值,也也是是对对变变量量分分布布集中趋势集中趋势的测定。的测定
40、。数据集中区数据集中区变量变量x常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点优点:优点:容易理,容易理,便于计算便于计算 灵敏度高灵敏度高 稳定性好稳定性好 和和 缺点:缺点:易受极值易受极值影响影响 在偏斜分布和在偏斜分布和U形分布中,形分布中,不具有代表性不具有代表性1.算术平均数算术平均数()标志总量标志总量与总体单与总体单位总数的位总数的比值比值简单:简单:加权:加权:常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点优点:优点:灵敏度高灵敏度高在某种不能计算在某种不能计算的条件下,可以代的条件下,可以代替替 缺点:缺点:不易理
41、解不易理解 易受极值影响易受极值影响 有有“0”值时不能值时不能计算计算 2.调和平均数调和平均数()标志值倒标志值倒数平均数数平均数的倒数的倒数简单:简单:加权:加权:常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点优点:灵敏度高优点:灵敏度高 受受极极值值影影响响小小于于 和和 适适宜宜于于各各比比率率之之积积为为总总比比率率的的变变量求平均量求平均缺点缺点:有有“0”或负或负值时不能计算值时不能计算 偶偶数数项项数数列列只只能用正根能用正根3.几何平均数几何平均数()几个变量几个变量值连乘积值连乘积的几次根的几次根简单:简单:加权:加权:常用的几种平均数常用的
42、几种平均数概概 念念 计算计算 公公 式式 特特 点点4.中位数中位数(Me)标志值由标志值由小到大顺小到大顺序排列中序排列中居中间位居中间位置的标志置的标志值位置平值位置平均数均数上限公式:上限公式:下限公式:下限公式:优点:优点:容易容易理解,理解,不受极值影不受极值影响响适宜于开口适宜于开口组资料和些不组资料和些不能用数字测定能用数字测定的事物的事物缺点:缺点:灵敏灵敏度和计算功能度和计算功能差差 间断数间断数Me常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点5.众数众数(Mo)分配数列分配数列中出现次中出现次数最多的数最多的标志值位标志值位置平均数置平均数
43、上限公式:上限公式:下限公式:下限公式:优优点点:容容易易理解,理解,不受极值影不受极值影响响 缺缺点点:灵灵敏敏度度和和计计算算功功能能差差 稳定性差稳定性差 具具有有不不唯唯一一性性要点解释要点解释权权数数(Weighted),是是分分布布数数列列中中的的频频数数或或频频率率。对对求求平平均均数数具具有有权权衡衡轻轻重重的的作作用用,是是影影响响平平均均数数变变动的两个因素之一(另一因素是变量值)。动的两个因素之一(另一因素是变量值)。权数权数例例(1)(2)(3)X456合计合计频数频数 频率频率(%)10201025.050.025.040100.0X456合计合计频数频数 频率频率(
44、%)20402025.050.025.080100.0X456合计合计频数频数 频率频率(%)20101050.025.025.080100.0=5 =5 =4.75 调和平均数与算术平均数的区别调和平均数与算术平均数的区别例例频率分布变了,均值也变。因此,严格地说,频率分布变了,均值也变。因此,严格地说,权数应指权数应指频率频率。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标平均指标分子:标志总量分子:标志总量分母:总体单位总数分母:总体单位总数几
45、何平均等于对数的算术平均几何平均等于对数的算术平均例例 组矩数列求中位数组矩数列求中位数是用插值法对中位数组分割的结果。是用插值法对中位数组分割的结果。例例组距数列求众数组距数列求众数是以频数之差计算的比例分割众数组组距的结果。是以频数之差计算的比例分割众数组组距的结果。例例价格(元)价格(元)3.32.52.0合计合计销售量(斤)销售量(斤)34512算术平均算术平均求某种商品三种零售价格的平均价格求某种商品三种零售价格的平均价格调和平均调和平均价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)10101030返回返回例例 求求95%、93%、90%的几何平均数的几何平均
46、数(计算误差:(计算误差:0.0007)返回返回例例(书上例(书上例11的资料)的资料)返回返回分组:分组:500 800 1100 1400 1700 2000频数:频数:4090110105705035 d1=20 d2=5 众数组众数组8001100求比例:求比例:d1/(d1+d2)=20/(20+5)=0.8分割众数组的组距:分割众数组的组距:0.8(1100-800)=240(元)(元)下限公式下限公式加下限,即加下限,即M0=800+240=1040(元)(元)下页下页返回返回500800 1100 1400 1700 200050100150f(人数)(人数)月收入:元月收入:
47、元1040上页上页 d1 d2例例(书上例(书上例11的资料)的资料)返回返回求比例:求比例:250-240/(345-240)=0.095分割中位数组的组距:分割中位数组的组距:1400-1100)0.095=28.5下限公式下限公式加下限,即加下限,即Me=1100+28.5=1128.5(元)(元)下页下页标志值由小到大标志值由小到大分组:分组:500 800 1100 1400 1700 20000SK0(对称分布对称分布)正偏态分布(右)正偏态分布(右)负偏态分布负偏态分布(左)左)2.偏度系数偏度系数 (m3三阶中心矩三阶中心矩)定义定义M=(X-A)k/n为变量为变量X关于关于A
48、的的k阶矩阶矩。当当A=0,即以原点为中心,上式称为即以原点为中心,上式称为“K阶原点矩阶原点矩”。K=1,2,3时,有:时,有:一阶原点矩一阶原点矩M1=(X-0)1/n=X/n二阶原点矩二阶原点矩M2=(X-0)2/n=X2/n三阶原点矩三阶原点矩M3=(X-0)3/n=X3/n 当当A=,即以即以 为中心,上式称为为中心,上式称为“K阶中心矩阶中心矩”。K=1,2,3时,有:时,有:一阶中心矩一阶中心矩一阶中心矩一阶中心矩二阶中心矩二阶中心矩二阶中心矩二阶中心矩三阶中心矩三阶中心矩三阶中心矩三阶中心矩 所以,所以,m3可以测定偏度。为消除量纲,转变为系数,可以测定偏度。为消除量纲,转变为
49、系数,再除以再除以3。0正偏态正偏态计算标准分计算标准分即即将将原原始始分分数数X经经过过线线性性变变换换转转变变为为标标准准分分Z。反反映映各各原始分的平均数为中心的相对位置。原始分的平均数为中心的相对位置。XO 任何原始分在总体中的位任何原始分在总体中的位置,用置,用Z倍的倍的来测定。来测定。计算抽样误差(以平均指标为例)计算抽样误差(以平均指标为例)设:设:抽样误差就是样本平均数分布数列的标准差。抽样误差就是样本平均数分布数列的标准差。抽样误差就是样本平均数分布数列的标准差。抽样误差就是样本平均数分布数列的标准差。第五章第五章 参数估计和假设检验参数估计和假设检验推断统计:推断统计:推断
50、统计:推断统计:利用样本统计量对总体某些性质或数量利用样本统计量对总体某些性质或数量特征进行推断。特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布抽样分布抽样分布简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质不放回不放回放放 回回放回放回不放不放 回回独独立立性性和和同同一一性性同一性同一性当当n/N5%时,有限总时,有限总体不放回抽体不放回抽样等同于放样等同于放回抽样回抽样统计量与抽样分布统计量与抽样分布统计量:即统计量:即样本指标样本指标。样本均值样本均值样本成数样本成数样本方差样本方差如: