统计学原理共章.pptx

上传人:莉*** 文档编号:77741539 上传时间:2023-03-16 格式:PPTX 页数:381 大小:2.48MB
返回 下载 相关 举报
统计学原理共章.pptx_第1页
第1页 / 共381页
统计学原理共章.pptx_第2页
第2页 / 共381页
点击查看更多>>
资源描述

《统计学原理共章.pptx》由会员分享,可在线阅读,更多相关《统计学原理共章.pptx(381页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、目录第一章导论第二章统计数据的调查与收集第三章统计数据的整理第四章数据分布特征的描述第五章时间序列分析第六章统计指数第七章抽样与抽样估计第八章假设检验与方差分析第九章相关与回归分析第十章常用国民经济核算指标分析第1页/共381页第一章导论第2页/共381页学习目的及重难点提示本章学习目的了解了解统计理论和实践活动的产生和发展。领会领会统计的三层含义、统计学的分科。理解和掌握理解和掌握统计学中的几个基本范畴。章节地位及重难点提示 本章介绍统计学及相关概念,勾勒了本课程的框架结构描述统计学和推断统计学。重点重点是统计的三层含义,总体、样本及指标等概念。第3页/共381页第一节统计学的产生和发展第4

2、页/共381页一、统计的三层含义及相互关系*(一)统计工作(统计的基本含义)(二)统计资料(三)统计学(四)三者关系 即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作活动的总称。是统计工作的成果,包括各种统计报表、统计图形及文字资料等。是一门收集、整理、描述、显示和分析统计数据的方法论的科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。第5页/共381页二、统计实践活动的产生与发展*(一)统计的起源1.起源于原始社会末期。2.人类社会早期的统计实践活动。(二)统计的发展1.资本主义社会里统计实践活动得到较快的发展。2.1853年在比利时首都布鲁塞尔召开了第

3、一届国际统计会议。3.1995年8月在北京召开了第50届国际统计年会。第6页/共381页三、统计科学的发展(一)古典统计学时期(17世纪中后期18世纪中后期)1.1.政治算术学派:政治算术学派:代表人物威廉威廉配第配第(政治经济学之父),首次运用数量对比分析法,又称“有名无实有名无实”的统计学。2.2.记述学派记述学派/国势学派:国势学派:“统计学是研究一国或多国的显著事项之学”,以文字描述为主,又称“有实无名有实无名”的统计学。3.3.图表学派:图表学派:用统计图和统计表表现和保存统计资料。第7页/共381页三、统计科学的发展(二)近代统计学时期(18世纪末19世纪末)1.1.数理统计学派:

4、数理统计学派:创始人阿道夫阿道夫凯特勒凯特勒,第一次将概率论引入社会经济现象的研究中,被誉为“近代统计学之父近代统计学之父”。2.2.社会统计学派:社会统计学派:代表人物恩格尔恩格尔,采用大量观察大量观察法法研究社会经济现象总体。社会经济现象总体。第8页/共381页三、统计科学的发展(三)现代统计学时期(20世纪初至今)1.1.主要成果主要成果:在随机抽样基础上建立了推断统计学。2.2.数理统计学的发展特点与趋势数理统计学的发展特点与趋势 (1)数学方法的广泛应用。(2)边缘统计学的形成。(3)借助计算机手段,统计学的应用日益广泛和深入。第9页/共381页第二节统计学的分科第10页/共381页

5、一、从统计方法的构成角度分*(一)描述统计学(descriptivestatistics)研究如何取得、整理和表现数据资料如何取得、整理和表现数据资料,进而通过综合、概括与分析反映客观现象的数量特征反映客观现象的数量特征。包括数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法等。(二)推断统计学(inferentialstatistics)研究如何根据样本数据去推断总体数量特征如何根据样本数据去推断总体数量特征的方法。包括抽样估计、假设检验、方差分析及相关和回归分析等。(三)描述统计学和推断统计学的关系描述统计学描述统计学是统计学的基础基础和统计研究工作的前前提提,推断统计学推断统

6、计学则是现代统计学的核心核心和统计工作的关键关键。第11页/共381页二、从统计方法的研究和应用角度分(一)理论统计学(theoreticalstatistics)利用数学原理研究统计学的一般理论和方法的统计学,如概率论与数理统计(二)应用统计学(appliedstatistics)*研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。第12页/共381页三、统计学与其他学科的关系(一)统计学与哲学的关系哲学为统计学提供世界观和方法论的指导。(二)统计学与数学的关系1 1.区别区别 (1)研究对象不同研究对象不同:

7、数学研究抽象的量,统计研究具体的量。(2)研究方法不同研究方法不同:数学是演绎,统计是归纳和演绎的结合。2.2.联系联系 数学为统计研究提供数学公式、模型和分析方法。第13页/共381页三、统计学与其他学科的关系(三)统计学与其他学科的关系统计几乎与所有学科都有联系,本书侧重介绍统计与管理学和经济学的关系。第14页/共381页本教材的篇章结构第一章第一章 导论导论第一篇统计基础篇第二章第二章 统计数据的统计数据的调查与收集调查与收集第二篇描述统计篇动态数据描述法动态数据描述法第七章第七章 抽样与抽样抽样与抽样估计估计第三篇推断统计篇第八章第八章 假设检验与方差分假设检验与方差分析析第九章第九章

8、 相关与回归相关与回归分析分析第四篇统计常识篇第十章第十章第三章 统计 数据的整理 第四章 数据分布特征的描述第五章 时间序列分析第六章 统计指数 表格与图形法静态数据描述法常用国民经济核算指标与分析第15页/共381页本章小结一、统计的三层含义:一、统计的三层含义:统计工作、统计资料和统计学。二、统计学的分科二、统计学的分科(一)从统计方法的构成看(一)从统计方法的构成看,分为描述统计学描述统计学和推断统计学推断统计学。(二)从统计方法的研究和应用看(二)从统计方法的研究和应用看,分为理论理论统计学统计学和应用统计学。应用统计学。四、统计学中的基本概念四、统计学中的基本概念 (一)总体、总体

9、单位和样本。(一)总体、总体单位和样本。(二)指标和指标体系。(二)指标和指标体系。第16页/共381页 END第17页/共381页第二章统计数据的调查与收集第18页/共381页学习目的及重难点提示本章学习目的了解了解统计调查的概念和分类。领会领会统计数据的计量尺度、数据和变量的类型。明确明确统计调查方案的设计内容。掌握掌握统计数据的来源、统计调查组织方式。本章重难点提示重点重点:数据的计量尺度、数据和变量的类型,普查、抽样调查等统计调查组织形式。难点难点:数据的计量尺度、数据和计量尺度之间的关系。第19页/共381页第一节数据的计量与类型第20页/共381页一、数据的计量尺度*(一)定类尺度

10、(nominalscale)1.概念:又称列名尺度或类别尺度,是按照研究对象的某种属性将其划分为若干组或类的一种测度。2.举例:人的性别、籍贯、民族、职称;企业的所有制性质、行业隶属。3.特征(1)只能区分事物的类别,无法比较优劣或大小。(2)对事物的区分必须遵循穷尽和互斥的原则。(3)对定类尺度计量分析的统计量主要是频数和频率。*应用:想一想生活中还有哪些常见的定类尺度?第21页/共381页一、数据的计量尺度(二)定序尺度(ordinalscale)1.概念:又称顺序尺度,它是对事物之间等级或顺序差别的一种测度。2.举例:教师的职称、学历,商品的质量等级等。3.特征(1)对事物可以分类、比较

11、优劣和大小。(2)对事物的分类要求穷尽和互斥。(3)对定序尺度计量分析的统计量除频数和频率外,还有累计频数和累计频率。*应用应用:想一想生活中还有哪些常见的定序尺度?第22页/共381页一、数据的计量尺度(三)定距尺度(intervalscale)1.概念:又称间隔尺度,是对事物类别或次序之间的间隔进行的一种测度。2.举例:学生的考试成绩、人的身高、温度等。3.特征(1)能分类、排序、比较大小,计量差距。(2)没有绝对零点,“0”表示“0”水平,不表示“没有”或“不存在”。*应用:应用:还有哪些常见的定距尺度?第23页/共381页一、数据的计量尺度(四)定比尺度(ratioscale)1.概念

12、:也称比率尺度,是对事物之间比值的一种测度。2.举例:人的收入支出、企业的产值利润、某地区的人口总数、失业人数等3.特征(1)分类、排序、比较大小、求出差异、计算两个数值之间的比率。(2)具有绝对零点,即数字“0”表示“没有”或“不存在”。*应用应用:举一现实生活中的例子说明定比尺度的两个特征。第24页/共381页表2-1四种计量尺度的比较数学特征数学特征定类定类尺度尺度定序定序尺度尺度定距定距尺度尺度定比定比尺度尺度分类(,分类(,)排序(,)排序(,)间距(间距(+,),)比值(比值(,)可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以可以第25页/共381页二

13、、数据的类型(一)数据的类型和表现形式1.定性数据(品质数据)(1)概念:说明事物的品质特征,不能以数值表示,只能以文字表述,由定类和定序尺度计量形成。(2)举例:高校教师职称有助教、讲师、教授等。2.定量数据(数量数据)(1)概念:说明现象的数量特征,以数值表示。由定距和定比尺度计量形成。(2)举例:考试成绩80分、95分、100分,身高1.73米、1.80米等。*应用应用:举例说明还有哪些常见的定性数据和定量数据。第26页/共381页(二)变量及其类型1.变量的含义 说明现象某种属性或数量特征的概念称为变量。统计数据就是变量的具体表现。2.变量的类型(1)品质变量:反映事物品质特征的名称,

14、表现为定性数据。如教师职称。(2)数值变量:反映事物数量特征的名称,表现为定量数据。如人的身高。3.数值变量的分类 (1)离散变量:只能间断计数的变量。如人口数、设备台数等。(2)连续变量:可以连续计数的变量。如产值、利润、收入、年龄等。第27页/共381页第二节数据的直接来源统计调查第28页/共381页一、统计调查的概念和分类(一)概念根据统计的目的和任务,运用科学的调查方法,有计划、有组织地向客观实际搜集和登记统计数据的过程。(二)分类1.按调查对象包括的范围不同(1)全面调查:对调查对象的全部个体一一调查登记,如普查。(2)非全面调查:对调查对象的部分个体调查登记,如抽样调查。第29页/

15、共381页统计调查的分类2.按照调查组织方式不同(1)统计报表:经常性制度化的调查,是搜集国民经济统计数据的主要方式。(2)专门调查:为研究一些特殊问题专门组织的统计调查。3.按照调查登记的时间是否连续(1)经常性调查/连续性调查:适用于时期现象的调查。(2)一次性调查/间断性调查:适用于时点现象的调查。第30页/共381页二、统计调查方法(一)直接观察法(二)报告法:如我国的统计报表制度。(三)采访法:具体分为个别口头询问、被调查者填表、开调查会等形式。(四)通讯法:通过邮寄调查问卷、被调查者填表获取信息。(五)电话访问(六)网上调查法第31页/共381页三、对统计调查数据的基本要求(一)准

16、确性(二)及时性(三)系统性(四)完整性(五)经济性总体要求:以准确为前提,准中求快,力争以较少的投入取得完整、系统的数据资料。第32页/共381页四、统计调查方案的设计*(一)确定调查的目的和任务(为什么调查)这是设计方案的首要问题。(二)确定调查对象和调查单位(向谁调查)1.1.调查对象:需要进行调查的某一社会经济现象的总体。对应于统计总体。2.2.调查单位:调查对象中需要调查的具体单位。对应于总体单位。第33页/共381页四、统计调查方案的设计(三)确定调查项目(调查什么)(四)设计调查表(调查问卷如何设计)(五)确定调查时间*调查数据资料所属的时间调查时限,调查工作的起讫时间(六)制定

17、调查组织实施计划两层含义第34页/共381页五、统计调查的组织方式(一)普查1.概念:是专门组织的、一次性的全面调查。2.意义及原则*相关链接相关链接我国的普查制度我国的普查制度 每逢末尾数字为“0”的年份进行人口普查。每逢末尾数字为“1”或“6”的年份进行基本统计单位普查。每逢末尾数字为“3”的年份进行第三产业普查。每逢末尾数字为“5”的年份进行工业普查。每逢末尾数字为“7”的年份进行农业普查。第35页/共381页五、统计调查的组织方式(二)统计报表1.概念:我国的统计报表制度是依照中华人民共和国统计法的规定,自上而下统一布置,自下而上逐级提供基本统计数据的一种调查方式。2.意义:是搜集国民

18、经济和社会发展状况统计数据的主要方式。3.局限性:第36页/共381页五、统计调查的组织方式(三)抽样调查*1.概念:是专门组织的非全面调查。它是按照随机原则从总体中抽取部分单位组成样本,以样本数据推断总体数量特征。2.意义:是相对最科学、应用最广的调查方式。3.特点:(1)经济性高。(2)时效性强。(3)适应面广。(4)准确度高。第37页/共381页五、统计调查的组织方式(三)抽样调查*4.4.抽样调查的作用(应用场合)(1)不可能或很难进行全面调查的现象,必须采取抽样调查方法。(2)没必要进行全面调查的社会现象,也可采用抽样调查。(3)其他作用:如对生产过程的质量控制及对全面调查结果的检验

19、修正。*思考题:思考题:对河水水质进行检测、推断种子的发芽率、推断食品的保质期应采用什么调查方式?为什么?第38页/共381页五、统计调查的组织方式(四)重点调查*1.概念:在调查对象中选择一部分重点单位所进行的非全面调查。2.重点单位:是指在总体中虽然个数不多,但它们的数据总量在总体数据总量中占绝大部分比重。*相关链接:我国银行业中的重点单位相关链接:我国银行业中的重点单位截至2004年底,工、农、中、建四家国有商业银行各项贷款近13万亿元,占我国银行业贷款总额的72,存款近25万亿元,占银行业存款总额的77。从统计学的角度,四大国有商业银行就是重点调查中的重点单位。第39页/共381页五、

20、统计调查的组织方式(五)典型调查*1.概念:在对调查对象全面分析的基础上,有意识地选择若干有典型意义或有代表性的单位进行深入、细致调查的一种非全面调查方式。2.特点(1)调查范围小,调查单位少,可对某些复杂的专门问题进行深入、细致的调查。(2)调查单位是有意识选择的有代表性和典型性的单位。3.典型调查的关键:选择典型单位。第40页/共381页第三节统计数据的间接来源第41页/共381页一、公开的统计出版物(一)我国官方的统计公开出版物如中国统计出版社出版:中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴等。(二)外文出版物世界

21、银行各年度的世界发展报告、联合国的联合国统计年鉴、联合国粮农组织生产年鉴、国际货币基金组织的国际金融统计月报、亚太经合组织的亚太统计数字等。第42页/共381页二、其他渠道各种报纸、杂志、图书、广播、电视传媒、网络等第43页/共381页本章小结第44页/共381页复习小结一、统计数据的计量尺度一、统计数据的计量尺度(一)(一)定类尺度(二)(二)定序尺度(三)(三)定距尺度(四)(四)定比尺度二、统计数据的类型二、统计数据的类型(一)定性数据:(一)定性数据:由定类和定序尺度计量而成,反映事物的品质特征。(二)定量数据(二)定量数据:由定距和定比尺度计量而成,反映事物的数量特征。第45页/共3

22、81页复习小结三、统计数据的来源三、统计数据的来源(一)直接来源(一)直接来源:统计调查和科学试验。(二)间接来源(二)间接来源:引用他人调查或试验的数据。四、统计调查(数据最主要的直接来源)四、统计调查(数据最主要的直接来源)(一)统计调查的种类和方法(一)统计调查的种类和方法 (二)统计调查方案的设计(二)统计调查方案的设计 (三)统计调查的组织方式:(三)统计调查的组织方式:有普查、统计报表、抽样调查等,其中重点调查是最常用的最科学的调查方法。五、统计数据的间接来源五、统计数据的间接来源 包括公开的统计出版物和其他渠道。第46页/共381页 END第47页/共381页第三章统计数据的整理

23、第48页/共381页学习目的及重难点提示本章学习目的了了解解数据整理在统计活动中的地位、数据整理的内容、数据审核与汇总的技术。领领会会统计分组的概念、关键、统计分组体系及次数分布的类型和特征。明明确确统计数据的表现形式统计表和统计图的基本内容。掌掌握握统计分组、分配数列和统计图表的编绘制方法。本章重难点提示本本章章重重点点:统计分组、变量数列的编制、统计数据的显示方法统计表和统计图。本章难点:本章难点:统计分组、变量数列的编制、次数分布图的绘制。第49页/共381页第一节 数据整理的一般问题第50页/共381页一、数据整理的概念和作用(一)概念 对统计调查所搜集到的数据进行分类和汇总,使其系统

24、化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。(二)作用 统计数据整理,是统计调查的继续,也是统计分析的前提,承前启后,在整个统计工作中具有重要的作用。第51页/共381页二、数据整理的程序数据整理方案的设计数据的审核与检查数据的排序数据分组数据的显示统计图表 数据的积累与保管第52页/共381页第二节数据分组第53页/共381页 一、数据分组的概念 根据统计研究目的和客观现象的内在特点,按按照选定的某个或几个标标志志,将将被研究的总体数据分成若干部分总体数据分成若干部分的科学分类。二、数据分组的作用 (1)区分现象的类型。(2)反映总体的内部结构。(3)揭示现象之间的依存关

25、系。(4)反映事物的数量特征和发展规律。第二节 数据分组第54页/共381页三、数据分组的关键*选择分组标志和分组划分各组界限(针对数值型变量)。四、选择分组标志的原则*1.根据研究任务和目的选择分组标志。2.选择能反映事物本质特征或重要特征的标志。3.结合现象所处的历史条件和社会经济条件选择分组标志。第二节 数据分组第55页/共381页 (一)根据分组变量(标志)的性质不同 按品质变量分组 按数值变量分组(二)根据采用的分组标志的个数多少 简单分组:只按一个标志分组 复合分组:按两个或以上的标志分组五、统计分组的种类第56页/共381页第 三 节 分配数列和次数分布第57页/共381页一、分

26、配数列 (一)概念 (二)分配数列的要素 组别 次数(频数):):分布在各组的总体单位数。各组的次数(频数)之和等于总体单位总数。频率(比重):):各组次数占总次数的比重。各组比重之和等于100%100%(或1 1)。将总体按分组标志分组后形成的总体单位在各组的分布,又称次数分布数列次数分布数列或频数分布数列频数分布数列。第58页/共381页分配数列实例 表3-1 我国土地状况分组表第59页/共381页(三)分配数列的种类 1.1.按分组标志的性质不同 品质变量数列:按品质变量分组形成 数值变量数列:按数值变量分组形成 2.2.数值变量数列又可分为:单项数列:每组只有一个变量值的变量数列 组距

27、数列:每组变量值是一段区间的变量数列 连续变量数列:按连续变量分组形成的数列 离散变量数列:按离散变量分组形成的数列第60页/共381页品质变量分配数列实例 表3-2 某高校在校生性别状况分组表第61页/共381页数值变量分配数列实例 表3-33-3 某市餐饮业按营业额分组 第62页/共381页单项式变量数列实例 表3-4 某市居民家庭按家庭人口数分组 第63页/共381页组距式变量数列实例 表3-5 3-5 某车间工人按月工资分组 第64页/共381页1.1.概念术语 (1)(1)全距(R R)数列中最大变量值最小变量值 (2)(2)组限:每一组的最大变量值与最小变量值 上限:每一组的最大变

28、量值 下限:每一组的最小变量值 (3)(3)组距(d d):每一组的最大变量值与最小变量值之差 组距=上限下限 (4)(4)组数:数列中的分组个数。(四)分配数列的编制第65页/共381页 定性关系:全距一定的情况下,组数和组距呈反方向变动。定量关系:式二为确定组距的经验公式,其中N代表组数。组数和组距的关系组数全距/组距=R/d组距=R/(13.322lgN)第66页/共381页(四)分配数列的编制 1.1.概念术语(5)(5)频数(次数)与频率(比重)(6)(6)品质数列与变量数列 (7)(7)等距数列与异距数列 (8)(8)次数密度:单位组距内分布的总体单位数。公式:次数密度各组次数/各

29、组组距第67页/共381页 开口组:缺上限或缺下限的组 闭口组:上下限齐全的组(1010)组中值及计算*闭口组 临近组组限重合时:组中值=(上限下限)/2 临近组组限间断时:组中值=(下限下组下限)/2 开口组 缺上限时:组中值=下限邻组组距/2 缺下限时:组中值=上限-邻组组距/2 1.概念术语(9)第68页/共381页(四)分配数列的编制 2.2.注意事项(1 1)组距最好为5 5或1010的倍数。(2 2)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。(3 3)离散型变量分组,相邻组的组限可以间断,也可以重叠;连续型变量分组,相邻组的组限必须重叠。(4 4)组限重叠时,临界

30、点的总体单位按“上限不在内”的原则归组。第69页/共381页(四)分配数列的编制 3.3.简单次数分布数列的编制步骤 数据排序并计算全距确定变量数列的形式(单项式或组距式)确定组数和组距 确定组限 计算各组次数和频率 绘制表格第70页/共381页简单次数分布数列的编制实例 例3-13-1数据资料某车间某车间4040名工人日产零件如下:名工人日产零件如下:65 72 66 57 90 86 83 68 75 84 66 59 67 70 79 51 81 54 78 86 94 64 77 74 76 96 62 98 85 71 79 84 65 72 89 75第71页/共381页简单次数分

31、布数列的编制实例 编制步骤之一编制步骤之一数据排序并确定全距数据排序并确定全距将数据从低到高排列,形成如下变量序列:51545759626465656666676870717272747575767677787879818384848485868688899093949698 计算全距=98-51=47 编制步骤之二编制步骤之二确定变量数列的形式确定变量数列的形式 因变量值较多、变动幅度较大,适宜采用组组距式数列。距式数列。第72页/共381页简单次数分布数列的编制实例编制步骤之三编制步骤之三确定组数和组距确定组数和组距分析全距为47,分为5组,组距为10。编制步骤之四编制步骤之四确定组限确定

32、组限分析离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠。编制步骤之五编制步骤之五计算各组的频数和频率计算各组的频数和频率分析根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用Excel统计软件进行。第73页/共381页简单次数分布数列的编制实例编制步骤之六编制步骤之六绘制表格绘制表格表3-6某车间工人日产零件分组表第74页/共381页4.4.累计次数分布表(图)的编制(1)(1)累计次数和累计频率反映总体单位分布特征的指标,用以说明总体中在某一变量值水平上下总共包含的总体单位次数和频率。(2)累计次数和频率的计算方法向上累计:是将各组的次数和频率,由变量值低的组向高的组

33、累计。说明各组上限以下包含的总体单位数和比率。向下累计:是将各组的次数和频率,由变量值高的组向低的组累计。说明各组下限以上包含的总体单位数和比率。第75页/共381页累计次数分布数列的编制实例 例例3-2 3-2 根据例3-1编制的累计次数分布表如下:表3-7 某车间工人日产零件累计分组表第76页/共381页二、次数分布社会经济现象的分布主要有以下三种类型:(一)钟形分布/丘形分布1.含义:特点是“两头小,中间大”,即越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山丘。正态分布:左右两侧对称分布 2.2.种类 左偏分布:存在极小变量值时曲线向左偏的 偏态分布 非对称

34、分布 右偏分布:存在极大变量值时曲线向右偏的 非对称分布 正态分布 左偏分布 右偏分布 第77页/共381页二、次数分布(二)U)U形分布:是指较大和较小的变量值出现的次数多,而中间变量值出现的次数少,特点是“两头大,中间小”。(三)J形分布:J形分布的特征是“一边大,一边小”。即次数随着变量值的变化大多数集中在某一端的分布。其曲线形如英文字母的“J”字,具体有正J形分布和反J形分布两种类型。U形分布正J形分布 反J形分布*思考题思考题:以下现象的次数分布符合哪种分布的特征?A 人群中身高、体重的分布 B 学生考试成绩的分布 C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布第78页/共38

35、1页第四节统计图表第79页/共381页(一)统计表的概念(二)统计表的结构1.从形式上看:分为总标题、横行标题、纵栏标题和统计数值。2.从内容上看:分为主词和宾词。(三)统计表的种类简单表:主词未做任何分组。简单分组表:主词按一个标志分组。复合分组表:主词按两个或以上的标志分组。(四)统计表的编制规则 一、统计表第80页/共381页(一)概念 条形图(二)种类直方图和折线图 圆形图 二、统计图第81页/共381页统计表示例某居民小区家庭按月收入简单分组表某居民小区家庭按月收入简单分组表第82页/共381页统计图示例条形图用长短或高矮来显示数值的大小第83页/共381页统计图示例折线图将直方图的

36、各条形中点用线连接起来而得到。第84页/共381页统计图示例圆形图/饼图:是以圆形的分割来表示总体的分组及结构。(某居民小区家庭按月收入分组情况)第85页/共381页本章小结一、统计数据整理一、统计数据整理 统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点。数据整理的前提是审核,分组汇总是核心。按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,即组数与组限。二、统计分组二、统计分组 统计分组必须遵循穷尽性和互斥性两个原则。数值变量分组有单项式和组距式两种。组距式分组又有离散型与连续型、等距与异距分组之分,对于组距式分组

37、要计算组距、组数、组中值。第86页/共381页本章小结三、分配数列三、分配数列/次数分布数列次数分布数列 由两个要素构成,一是组别,二是各组次数或频率。根据需要,可以编制简简单单次次数数分分布布表表和累累计计次数分布表。次数分布表。四、次数分布四、次数分布 主要有钟形钟形分布、U U形形分布和J J形形分布。五、统计表和统计图五、统计表和统计图 统计表和统计图是显示统计数据的两种重要形式。统计表的结构从形式看可分为总标题、横表目、纵标目和指标数值;从内容上看可分为主词和宾词两部分。统计图主要有条形图、直方图、圆形图等。第87页/共381页 END第88页/共381页第四章数据分布特征的描述第8

38、9页/共381页学习目的和学习目的和重难点提示重难点提示 本章学习目的本章学习目的领会领会数据分布的各种特征:集中趋势、离散趋势、偏斜程度和峰度。掌握掌握数据分布特征各测定值的计算方法、特点及其应用场合。本章重难点提示本章重难点提示 数据分布特征的描述方法,如何使用一些统计量来对数据进行概括性测定。数据分布特征各测定值的计算方法、特点及其应用场合。第90页/共381页第一节数据分布集中趋势的测定第91页/共381页一、均值(平均数、数值平均数,mean)(一)概念 均值是反映数据分布集中趋势十分重要的数据,代表总体单位某一标志值的一般水平。(二)特征 1.具有抽象性。2.具有代表性。3.反映总

39、体分布的集中趋势。(三)举例 1.某市中学生每周平均上网时间为2.8小时。2.某农贸市场2月份牛肉的平均价格为16元/千克。3.某地区“十五”期间经济平均增长率为9.6%。第92页/共381页(四)均值的种类及计算 1.1.算术平均数*(1)(1)概念 算术平均数又称平均值,是用一组数据中所有值之和除以该组数据的个数。(2)(2)基本公式第93页/共381页算术平均数的计算*简单算术平均数:总体平均数 样本平均数第94页/共381页算术平均数的计算*加权算术平均数 概念:是对每个数据都根据其在全组中的重要程度赋予一定权重后得到的算术平均数。计算公式:(1 1)未分组数据 其中,w表示各组的标志

40、总量,而不是各组变量值出现的次数,总体和样本加权算术平均数的公式是相同。第95页/共381页 例例4-14-1根据某公司根据某公司四个品牌数码相机的销售资料计算平均利润率。表4-1 四个品牌数码相机的利润率和销售额资料四个品牌数码相机的利润率和销售额资料第96页/共381页所以所以,四个品牌数码相机的平均销售利润率为:,四个品牌数码相机的平均销售利润率为:因为因为:第97页/共381页*加权算术平均数 分组的加权平均数:根据分组数据计算均值。样本均值的计算公式:总体均值的计算公式:表示各组的变量值(组距式数列的组中值);表示各组变量值出现的频数(即权数)。其中,第98页/共381页 例例4-2

41、4-2根据某电脑公司在各市场上销售根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。量的分组数据,计算电脑销售量的均值。按销售量分组(台)按销售量分组(台)组中值组中值(Mi)市场个数市场个数(fi)Mi fi 14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计合计fi 120Mi fi 22200第99页/共381页2.2.调和平均数(1 1

42、)概念:调和平均数又称倒数平均数,是各个变量值倒数的算术平均数的倒数。(2 2)计算简单调和平均数:针对未分组资料。计算公式为:第100页/共381页2.2.调和平均数 加权调和平均数:针对分组资料。计算公式为:其中:是一种特殊权数,它不是各组变量值出现的次数,表示各组标志总量。即第101页/共381页 例例4-34-3根据根据某商场职工月工资资料计算某商场职工月工资资料计算月平均工资。月平均工资。表表4-3某商场职工月工资资料某商场职工月工资资料第102页/共381页3.3.几何平均数(1)(1)概念:几何平均数(geometric mean)又称对称平均数,它是各变量值乘积的n次方根。(2

43、)(2)计算 基本公式:对数公式:在实际工作中,由于变量个数较多,通常要应用对数来进行计算。即 第103页/共381页(3)(3)几何平均数的应用及特点应用条件 a.a.变量值是相对数据,如比率或发展速度。b.b.变量值的连乘积等于总比率或总发展速度。特点 a.a.如果数列中有一个标志值等于零或负值,则无法计算。b.b.受极端值影响较小,故较稳健。第104页/共381页 例4-44-4 某电器销售公司2000200020052005年销售量的环比增长率分别为:7.6%7.6%、2.5%2.5%、0.60.6、2.7%2.7%和2.2%2.2%。求这期间销售量的平均增长速度。表4-4 销售量平均

44、发展速度计算表 几何平均数的计算示例第105页/共381页几何平均数的计算示例 1.1.采用基本公式计算的销售量平均发展速度为:2.2.采用对数公式计算的销售量平均发展速度为:所以,销售量的平均增长速度=103.1%-1=3.1%=103.1%-1=3.1%第106页/共381页二、位置平均数(一)中位数(median)1.1.概念 中位数是将一组数据项按照数值大小升序或者降序排列后位于中间位置的那个数据,符号为 。2.2.中位数的计算方法 (1)(1)未分组数据的中位数 将变量值按升序或降序排列,找中间位置的变量值。(2)(2)单项数列的中位数 计算各组的累计频数(向上累计或向下累计);根据

45、中位数位置确定中位数。第107页/共381页 例4-54-5 计算某公司销售人员月销售冰箱中位数表4-5 4-5 某公司销售人员月销售冰箱中位数计算按月销售冰箱分组按月销售冰箱分组 (台台)销售人员数销售人员数(人人)向上累计频数向上累计频数向下累计频数向下累计频数25303234363931014271883132754728080776753268合合 计计80中位数的位置 即中位数在累计频数为40的那一组内(向上累计或向下累计均可得出),则 。第108页/共381页2.2.中位数的计算方法(3 3)组距数列的中位数:由下列公式近似计算 下限公式其中:为总体单位总数;为中位数组的下限;为中

46、位数组以下的累计频数;为中位数组的频数;为中位数组的组距;第109页/共381页 例4-6 4-6 求以下组距数列的中位数。按家庭收入分组(元)按家庭收入分组(元)家庭数(户)家庭数(户)向上累计频率向上累计频率5 000以下5 00010 00010 00015 00015 00020 00020 000以上214514662166808692合合 计计9292中位数的近似值为:表4-6 某地区家庭收入分组中位数的位置在第46(92/2)位,应在第二组第110页/共381页中位数的特点 是一种位置平均数,不受极端值及开口组的影响。对于分配不对称的数据,中位数比平均值更适合当集中趋势的代表值。

47、对某些不具有数字特征或不能用数字测定的现象,可用中位数表示其一般水平。例如,对众多的消费者购买数码相机时,分别对价格、外观、品质的注重程度排序后,可以求出消费者在乎的中位数因素。第111页/共381页二、位置平均数(二)众数 1.1.概念众数(mode)是指在一组数中出现次数最多的那个数值,符号为 。2.2.数据数列的众数分布情况 无众数如数据数列:13791268一个众数如数据数列:659866多个众数如数据数列:223527352736第112页/共381页3.3.众数的计算方法*品质变量的众数观察次数,出现次数最多的变量值就是众数。例如:企业的所有制结构分布、人口的城乡分布。*数值变量的

48、众数 未分组资料观察次数,出现次数最多的数据就是众数。分组资料(1)单项式数列直接观察,次数最多的组的变量值即为众数。第113页/共381页 例4-74-7单项式变量数列确定众数实例 表4-7 某市居民家庭按家庭人口数分组 由上表可以看出,家庭人口数为3人的家庭数最多,因此本例中家庭人口数的众数为3人。第114页/共381页3.3.众数的计算方法 组距数列计算众数:由下列公式近似计算:其中 为众数组与前一组频数之差;为众数组的下限;为众数组与后一组频数之差;为众数组的组距。第115页/共381页 例4-8 4-8 组距式数列计算众数示例收入组别收入组别人均收入(元)人均收入(元)频数(人)频数

49、(人)1234562 000元以下2 0004 000元4 0006 000元6 0008 000元8 00010 000元10 000以上234368322410合合 计计200200其众数的近似值为:表4-8 4-8 某地区的人均月收入调查数据第116页/共381页三、均值、中位数和众数的比较(一)均值、中位数和众数的数量关系1.当数据呈对称分布时,三者合而为一。2.当数据呈左偏分布时,说明数据存在极小值,必然拉动均值向极小值一方靠,则从左至右依次是均值、中位数和众数。3.当数据呈右偏分布时,说明数据存在极大值,必然拉动均值向极大值一方靠,则从左至右依次是众数、中位数和均值。第117页/共

50、381页三、均值、中位数和众数的比较(二)均值、众数和中位数的特点及应用场合*均值是对数值型数据的计算,利用了全部数据信息,具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。*中位数是一组数据中间位置上的代表值,其特点是不受数据极端值的影响,主要适合于作为顺序数据的集中趋势测度值。*众数是一组数据分布的峰值,它也是一种位置代表值,不受极端值的影响,主要适合于作为分类数据的集中趋势测度值。第118页/共381页第三节数据分布离散程度的测定第119页/共381页一、极差(一)概念:又称全距,是数据中最大值和最小值之差。记为。(二)计算1.1.未分组数据的极差为:表示数据的最大值;表示数据的最

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁