统计数据的收集整理与显示.ppt

上传人:豆**** 文档编号:56696746 上传时间:2022-11-03 格式:PPT 页数:128 大小:3.23MB
返回 下载 相关 举报
统计数据的收集整理与显示.ppt_第1页
第1页 / 共128页
统计数据的收集整理与显示.ppt_第2页
第2页 / 共128页
点击查看更多>>
资源描述

《统计数据的收集整理与显示.ppt》由会员分享,可在线阅读,更多相关《统计数据的收集整理与显示.ppt(128页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计数据的收集整理统计数据的收集整理与显示与显示2.1 2.1 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计指直接从各调查指直接从各调查单位收集的用来单位收集的用来反映反映个体个体特征的特征的数据资料数据资料统计调查是整个统计认识活动的基础,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败决定着统计认识过程及其结果的成败 收集收集原始数据资料原始数据资料 的统计活动过程的统计活动过程统计调查统计调查要求:要求:准确、及时、准确、及时、全面、系统全面、系统按调查单位的范围大小分为按调查单位的范围大小

2、分为全面调查全面调查非全面调查非全面调查一次性调查一次性调查经常性调查经常性调查统计报表统计报表专门调查专门调查统计调查的种类统计调查的种类按调查时间是否连续分为按调查时间是否连续分为按调查的组织方式不同分为按调查的组织方式不同分为普查普查抽样调查抽样调查典型调查典型调查重点调查重点调查 指按照国家统一规定的各项要求,指按照国家统一规定的各项要求,自下而上自下而上地定期向国家和主管部门地定期向国家和主管部门报送基本统计资料的一种报告制度报送基本统计资料的一种报告制度优点优点局限局限能保证统计资料的全面性和连续性能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能保证统计资料的统一性和

3、及时性能满足各级部门对统计资料的需要能满足各级部门对统计资料的需要统计报表过多会增加基层负担统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资有可能由于虚报瞒报而影响统计资料质量料质量统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位报表制度报表制度可以全面调查,但可以全面调查,但通常是调查限定规通常是调查限定规模以上的总体单位模以上的总体单位统计调查的组织方式统计调查的组织方式指国家为详尽了解某项重要的国情指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查国力而专门组织的一次性全面调查作用作

4、用局限局限可以为抽样调查提供抽样框可以为抽样调查提供抽样框可以收集统计报表所不能提供的反可以收集统计报表所不能提供的反映重大国情国力的基本统计信息映重大国情国力的基本统计信息由于需要大量的人力、物力和财由于需要大量的人力、物力和财力,不宜经常进行力,不宜经常进行统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位普普 查查统计调查的组织方式统计调查的组织方式对全部单位对全部单位进行调查进行调查为了解总体基本情况,在调查对象为了解总体基本情况,在调查对象中只选择一部分中只选择一部分重点单位重点单位 进行调查进行调查的一种非全面调查组织方式的一种非全面调查组织方式作用作用局限局限能

5、以较少的投入和较快能以较少的投入和较快的速度取得总体基本情的速度取得总体基本情况及变动趋势的资料况及变动趋势的资料只适用于客观存在着只适用于客观存在着重点单位的情况重点单位的情况这些单位数目这些单位数目这些单位数目这些单位数目不多,但其标不多,但其标不多,但其标不多,但其标志值在总体标志值在总体标志值在总体标志值在总体标志总量中占有志总量中占有志总量中占有志总量中占有较大比重,能较大比重,能较大比重,能较大比重,能反映总体的基反映总体的基反映总体的基反映总体的基本情况本情况本情况本情况统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位重点调查重点调查只调查重点单位(单位只调查

6、重点单位(单位数不多但其标志量占标数不多但其标志量占标志总量比重较大的单位)志总量比重较大的单位)统计调查的组织方式统计调查的组织方式在对调查对象有一定了解的基础上,在对调查对象有一定了解的基础上,有意识地选择少数有意识地选择少数典型单位典型单位 进行进行调查的一种非全面调查组织方式调查的一种非全面调查组织方式一定条件下能估计总体指一定条件下能估计总体指标数值标数值可以补充全面调查的不足可以补充全面调查的不足可以用来研究新生事物可以用来研究新生事物不能确定推断的把握程度,不能确定推断的把握程度,无法计算和控制推断误差无法计算和控制推断误差作作用用指在数量表现指在数量表现指在数量表现指在数量表现

7、上具有普遍意上具有普遍意上具有普遍意上具有普遍意义和代表性的义和代表性的义和代表性的义和代表性的总体单位,可总体单位,可总体单位,可总体单位,可以用来推断总以用来推断总以用来推断总以用来推断总体的数量体的数量体的数量体的数量局局限限统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位典型调查典型调查对典型单位进行调对典型单位进行调查,典型单位的选查,典型单位的选择并不一定按规模择并不一定按规模统计调查的组织方式统计调查的组织方式 按照按照 随机原则随机原则 从调查对象中抽从调查对象中抽取一部分样本单位进行调查,再用取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征样本

8、资料推断把握总体的数量特征的一种非全面调查组织方式的一种非全面调查组织方式指样本单位的抽指样本单位的抽指样本单位的抽指样本单位的抽取不受主观因素取不受主观因素取不受主观因素取不受主观因素及其他系统性因及其他系统性因及其他系统性因及其他系统性因素的影响,每个素的影响,每个素的影响,每个素的影响,每个总体单位都有均总体单位都有均总体单位都有均总体单位都有均等的被抽中机会等的被抽中机会等的被抽中机会等的被抽中机会特特点点优优点点按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体

9、的数量特征抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间达到全面调查的目的达到全面调查的目的达到全面调查的目的达到全面调查的目的调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位抽样调查抽样调查按随机原则选择调按随机原则选择调查单位,各单位被查

10、单位,各单位被选中的机会相同。选中的机会相同。统计调查的组织方式统计调查的组织方式抽样调查研究抽样调查研究Sampling Study为什么要抽样?为什么要抽样?1.涉及破坏受试对象涉及破坏受试对象质量控制质量控制2.取得精确可靠的结果取得精确可靠的结果3.实际情况的约束实际情况的约束时间,成本等时间,成本等关于抽样方法 v抽样方法主要有两种:概率抽样和非概率抽样。(一)概率抽样v1简单随机抽样(Simple random sampling)。是最基本的抽样形式,它是完全随机地选择样本。此法要求有一个完美的抽样框,或者总体中有一个个体的详尽名单。v2分层抽样(Reduced sampling)

11、。分两个步骤:首先将总体分成不同的“层”,然后在每一层内进行抽样。分层抽样可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。v3整群抽样(Cluster sampling)。首先将全部总体分为若干部分,每一部分称为一个群,把每一群做为一个抽样单位,在群地进行抽样;然后,在被抽中的群中做全面调查。例如,在市场调查的入户调查中,可以对被选作抽样单位的某个大院的每家每户进行调查。v4等距抽样。又称系统抽样(Systematic sampling),是在样本框中每隔一定距离抽选一个被调查者。这一方法也比较常用,有时还可与整群抽样法和分层抽样法结合使用。例如,可采用系统抽样去抽取选择“群”或个体

12、,也可在某一“层”的范围内进行系统采样。(二)非概率抽样v不是完全按随机原则选取样本。非概率抽样有三种形式。v1主要是由调查人员自由选择被调查者的非随机选样。例如在购物中心采访100位妇女,这100位被调查者可以随机选择。v2通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下,由于研究对象可能仅限于一部分居民,因而有时采用这种方法能节省大量经费。v3大多数种类的研究产品测试、街访、座谈会,只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法。统计调查的主要技术方法统计调查的主要技术方法被调查者受被调查者受调查者的强调查者的强制与约束制与约束调查者与被调查者与被调查者平等调

13、查者平等合作合作观察记录法观察记录法调查者调查者强制、约束强制、约束报告法报告法访问调查访问调查调查者调查者被调查者被调查者 平等合作平等合作2.2 2.2 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计统计调查方案统计调查方案用来指导整个调查工作的纲用来指导整个调查工作的纲领性文件,是统计设计在统领性文件,是统计设计在统计调查阶段的具体化计调查阶段的具体化基本内容:基本内容:调查目的;调查目的;调查对象调查对象与与调查单位调查单位;调查项目与调查项目与调查表调查表;调查时间;调查时间;制定调查工作的组织实施计划。制

14、定调查工作的组织实施计划。(为什么调查)(为什么调查)(为什么调查)(为什么调查)(向谁调查)(向谁调查)(向谁调查)(向谁调查)(调查什么)(调查什么)(调查什么)(调查什么)2.2 2.2 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计问卷调查问卷调查主要指非政府性统计机构或个人所主要指非政府性统计机构或个人所从事的对人的主观意见的调查工作,从事的对人的主观意见的调查工作,也称作民意调查或民意测验也称作民意调查或民意测验调查问卷的基本格式:调查问卷的基本格式:表头表头表体表体表脚表脚说明词:说明词:解释调查意解释

15、调查意义、表达感激之情等义、表达感激之情等主题问句:主题问句:被调查者被调查者基本情况、调查项目基本情况、调查项目作业记录:作业记录:时间、操时间、操作者等作者等您认为吸烟有您认为吸烟有哪些害处?哪些害处?危害自身健康危害自身健康影响他人健康影响他人健康浪费钱财浪费钱财容易引起火灾容易引起火灾破坏家庭团结破坏家庭团结封闭式问题封闭式问题您认为吸烟有您认为吸烟有哪些害处?哪些害处?开放式问题开放式问题容易控制,容易控制,但不易全面但不易全面调查问卷的问题类型:调查问卷的问题类型:容易滋生腐败容易滋生腐败不易控制,不易控制,但内容丰富但内容丰富您认为吸烟有您认为吸烟有哪些害处?哪些害处?危害自身健

16、康危害自身健康影响他人健康影响他人健康浪费钱财浪费钱财容易引起火灾容易引起火灾破坏家庭团结破坏家庭团结其他其他 。问卷设计的基本要求:问卷设计的基本要求:问题的提出要紧扣主题问题的提出要紧扣主题问句和标准答案要易于理问句和标准答案要易于理解和回答解和回答先易后难、先封闭后开放、先易后难、先封闭后开放、先基本问题后派生问题先基本问题后派生问题以不超过以不超过20分钟为宜分钟为宜主题明确主题明确提问科学提问科学逻辑性强逻辑性强容量适度容量适度问卷设计问卷设计 Questionnaire Design问卷的长度问卷的长度(Questionnaire Length)尽可能简短,只保留调查所必须的关键问

17、题尽可能简短,只保留调查所必须的关键问题调查方式调查方式(Mode of Response)面谈面谈回答率较高,费用较高回答率较高,费用较高电话访问电话访问居中居中信函调查信函调查回答率较低,费用较低回答率较低,费用较低问题设计问题设计(Formulating Questions)语言简明易懂,避免含糊其词语言简明易懂,避免含糊其词考虑完备而避免重复考虑完备而避免重复您是否吸烟(如果选您是否吸烟(如果选,则跳过,则跳过2、3题)题)吸烟吸烟不吸不吸您每天大约吸多少支烟您每天大约吸多少支烟5支以下支以下5-10支支 10-15支支 15-20 20-25支支 25支以上支以上您的吸烟历史大约有多

18、长您的吸烟历史大约有多长 1年以下年以下1-5年年5-10年年10年以上年以上您是否认为吸烟有害健康(请写出理由)您是否认为吸烟有害健康(请写出理由)调查单位中吸调查单位中吸烟人所占比例烟人所占比例吸烟人群日吸吸烟人群日吸烟数量情况烟数量情况吸烟人群吸烟吸烟人群吸烟历史情况历史情况调查对象对吸调查对象对吸烟的看法烟的看法2.3 2.3 次级资料的收集次级资料的收集次级资料次级资料指已经被收集、加工整理成型的指已经被收集、加工整理成型的数据信息数据信息次级资料的主要收集渠道:次级资料的主要收集渠道:查阅公开出版物;查阅公开出版物;向政府统计机构咨询;向政府统计机构咨询;向其他机构咨询;向其他机构

19、咨询;网上查询。网上查询。传统的二手信息数据 v传统的外部的次级信息数据来源非常广泛,有各级政府、非营利机构、贸易组织和行业机构、商业性出版物等等。其中政府机构所编辑出版的统计资料是宏观、微观信息数据的主要来源。v国家统计局出版的统计资料汇编刊物主要有:中国统计年鉴、国民收入统计资料汇编、中国物价统计年鉴、全国城镇居民家庭收支调查、中国农村统计年鉴、中国劳动工资统计年鉴、中国证券期货统计摘要、世界经济年鉴、中国金融年鉴、中国证券期货统计年鉴、中国经济年鉴等等。v除了国内出版的刊物外,也可以利用国际和外国组织机构公开发表的资料汇编,如:联合国统计年鉴、世界发展报告、世界经济展望、美国统计摘要、日

20、本统计月报等。二手信息数据的新纪元在线信息数据库及其各个机构等网站v联网的和不联网的信息数据库都可以进一步分成参考文献、统计数字、全文、名录和其他信息数据库。参考文献信息数据库由刊物、杂志、报纸、市场研究、技术报告、政府文件等方面的引文组成,还常常可以提供资料的摘要或小结。统计数字信息数据库包括各种数字的统计资料。全文信息数据库包括一些文献的全文,如报纸的全文搜索服务。名录信息数据库提供关于个人、机构和服务单位的名单、地址和联系电话等等,如著名的Yahoo。常用的统计数据来源v美国经济分析局美国经济分析局http:/www.bea.doc.govv美国人口普查局美国人口普查局http:/www

21、.census.govv美国劳工统计局美国劳工统计局http:/stats.bls.govv美联储经济数据库美联储经济数据库http:/www.stls.frb.org/fredv美国联邦统计美国联邦统计http:/www.fedstats.govv世界银行世界银行http:/www.worldbank.orgv国际货币基金组织国际货币基金组织http:/www.imf.orgvOECD http:/www.oecd.org2.4 2.4 统计整理与统计分组统计整理与统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组统计整理

22、统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分组和汇总形成综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位统计数据的处理:统计数据的处理:统计资料的分组、汇总及制表统计资料的分组、汇总及制表统计数据的管理:统计数据的管理:数据的传输、贮存、更新及输出数据的传输、贮存、更新及输出内内容容制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤2.4 2.4 统计整理与统计分组

23、统计整理与统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组将总体中所有单位按一定的标志分将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分为性质不同但又有联系的若干部分的过程的过程统计分组统计分组统计分组的作用统计分组的作用:总体经过分组,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。qq划分社会经济现象的类型划分社会经济现象的类型qq反映社会经济现象的内部结构和

24、比例关系反映社会经济现象的内部结构和比例关系qq揭示社会经济现象之间的相互依存关系揭示社会经济现象之间的相互依存关系选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性科学性:组间差异组间差异大,组内大,组内差异小。差异小。完备性和互斥完备性和互斥性性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。统计分组的程序与原则统计分组的程序与原则对大学生月生活对大学生月生活费支出情况进行费支出情况进行分组研究:分组研究:按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按性别分组;按性别分组;按年龄分组。按年龄分组。?统计分组的程序与原则统计分

25、组的程序与原则对父母亲下岗情对父母亲下岗情况进行分组研究:况进行分组研究:单亲下岗;单亲下岗;双亲下岗;双双亲下岗;双亲在岗。亲在岗。不符合不符合科学性科学性不符合不符合完备性和互斥性完备性和互斥性城乡区别城乡区别离退休离退休是否健在是否健在?统计分组的程序与原则统计分组的程序与原则分组体系分组体系指同时使用两个以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组标志并列使用各分组标志并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分组体系交叉分组体系交叉分组体系平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性

26、男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2交叉分组体系交叉分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类2.5 2.5 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率变量数列变量数列品质数列品质数列将总体各单位按某个标志分成若干将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组组,列出各

27、组的总体单位数或各组在总体中所占的比重而形成的数列在总体中所占的比重而形成的数列分布数列分布数列分分类类分组标志的具体表现分组标志的具体表现各组的次数或频率各组的次数或频率构成要素构成要素异距数列异距数列等距数列等距数列组距数列组距数列单值数列单值数列单值数列单值数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量数列的编制变量数列的编制变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例例例例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分

28、别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量数列的编制变量数列的编制变量是连续变量

29、;变量是连续变量;或:或:总体单位数较多,变量不同总体单位数较多,变量不同取值个数也较多的离散变量。取值个数也较多的离散变量。编制条件编制条件:变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列相关概念相关概念指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为各组的最小值为下限下限,最大值为,最大值为上限上限组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值组中值=某地区

30、某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额销售额(万元)(万元)商店数商店数(个)(个)每百元商品销每百元商品销售额中支付的售额中支付的流通费(元)流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况实

31、例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12

32、.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数

33、列。要求编制组距数列。编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及组数确定组距的原则:确定组距的原则:q要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)编制等距数列编制等距数列计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)确定组限确定组限q对于

34、离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法编制等距数列编制等距数列计算次数计算次数编制等距数列编制等距数列编制编制结果:结果:销售额销售额(百万元)(百万元)组中值组中值 商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50分组划记法分组划记法茎叶图

35、法茎叶图法(5+(5-5))/2=2.5(25+(25+5))/2=27.5茎叶表示茎叶表示 Stem-and-Leaf Display将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别垂直线右边的数字“叶”,确定频数(计数)Xi开口式组距数列组中值的计算:开口式组距数列组中值的计算:首组假定下限首组上限相邻组组距首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距末组假定上限末组下限相邻组组距先计算开口组的假定上、下限:先计算开口组的假定上、下限:因此有:因此有:首组首组组中值组中值末组末组组中值组中值频率频率各组单位数占总体单位总数的比重各组单位数占总

36、体单位总数的比重累计次数(频率)累计次数(频率)从变量值从变量值低低的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值高高的组累计,的组累计,说明某一组说明某一组上限以下各组的累计次数上限以下各组的累计次数(频率)(频率)。向向上上累累计计向向下下累累计计 从变量值从变量值高高的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值低低的组累计,的组累计,说明某一组说明某一组下限以上各组的累计次数下限以上各组的累计次数(频率)(频率)。频数表频数表(用(用SPSS制作)制作)有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约

37、约2/3的人身高不超过的人身高不超过165cm 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累

38、计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下51010151520202525以上以上410161343820322686414304347505046362073828608694100100927240146合计合计501002.6 2.6 统计图表统计图表一、统计图一、统计图二、统计表二、统计表次数分配和统计图(次数分配和统计图(1)一一.分类数据的整理与显分类数据的整理与显示示二二.顺序数据的整理与显顺序数据的整理与显示示数据的整理与显示(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对分类数

39、据和顺序数据主要是做分类整理3.对数值型数据则主要是做分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据分类数据的整理与图示分类数据的整理(基本过程)v1.列出各类别 2.2.计算各类别的频数3.制作频数分布表4.用图形显示数据分类分类频数频数比例比例百分比百分比比率比率ABCDE分类数据的整理(可计算的统计量)1.频数频数(frequency):落在各类别中的数据个数2.比例比例(proportion):某一类别数据占全部数据的比值3.百分比百分比(percentage):将对比的基数作为100而计算的比值4.比率比率(

40、ratio):不同类别数值的比值分类数据整理频数分布表(例题分析)【例例例例】一一家家市市场场调调查查公公司司为为研研究究不不同同品品牌牌饮饮料料的的市市场场占占有有率率,对对随随机机抽抽取取的的一一家家超超市市进进行行了了调调查查。调调查查员员在在某某天天对对5050名名顾顾客客购购买买饮饮料料的的品品牌牌进进行行了了记记录录,如如果果一一个个顾顾客客购购买买某某一一品品牌牌的的饮饮料料,就就将将这这一一饮饮料料的的品品牌牌名名字字记记录录一一次次 。右右边边就是就是记录记录的原始数据的原始数据用用Excel制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品分类数据

41、的图示条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图分类数据的图示条形图(例题分析)分类数据的图示饼图(pie Chart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的分类数据的图示饼图(例题分析)顺

42、序数据的整理与图示顺序数据的整理(可计算的指标)v1.累累积积频频数数(cumulative frequencies):各类别频数的逐级累加v2.累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加 顺序数据的频数分布表(例题分析)【例例例例】在在一一项项城城市市住住房房问问题题的的研研究究中中,研研究究人人员员在在甲甲乙乙两两个个城城市市各各抽抽样样调调查查300300户户,其其中中的的一一个个问问题题是是:“您您对对您您家家庭庭目目前前的的住住房房状状况是否满意?况是否满意?1 1 非非 常常 不不满满意意;2 2不不满满意意;3 3一一般般;4

43、 4满满意;意;5 5非常满意。非常满意。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0顺序数据的频数分布表(例题分析)乙城市家庭对住房状况评价的频数分布乙

44、城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计合计300100.0顺序数据的图示累计频数分布图(例题分析)243001322252700100200300400 非常不满意 不

45、满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布环形图(annular chart)1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用

46、于结构比较研究 4.环形图主要用于展示分类和顺序数据环形图(例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价次数分配和次数分配和统计图(2)一一.数据分组数据分组二二.数值型数据的图示数值型数据的图示频数分布表的编制(例题分析)【例例例例】某某电电脑脑公公司司20022002年年前前四四个个月月各各天天的的销销售售量量数数据据(单单位位:台台)。试试对对数据进行分组。数据进行分组。频数分布表的编制(步骤)1.确定组数:根据 Sturges 提出的经验公式得组数K为:2.确定各

47、组的组距:组距组距(237-141)10=9.6 103.用用Excel制作频数分布表制作频数分布表 等距分组表(上下组限重叠)等距分组表(上下组限间断)等距分组表(使用开口组)组距分组与不等距分组(在表现频数分布上的差异)1.等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征2.不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况数值型数据的图示Excel分组数据分组数据直方图和折线图直方图和折线图分组数据直方图(histogram)1.用矩形的宽度和高度来表示频数分布

48、的图形,实际上是用矩形的面面积积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.直方图下的总面积等于1分组数据的图示(直方图的绘制)140140 150150210210直方图下的面直方图下的面积之和等于积之和等于11某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间间的的天天数数最最多多!190190 200200180180160160 170170频频频频频频数数数数数

49、数(天天天天天天)25252020151510105 53030220220 230230 240240分组数据直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据分组数据折线图(frequency polygon)1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来

50、,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的分组数据的图示(折线图的绘制)折线图与直方图折线图与直方图下的面积相等!下的面积相等!140140 150150210210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190190 200200180180160160 170170220220 230230240240频频频频频频数数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 企业培训

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁