《(本科)第二章--数据搜集-ppt课件.ppt》由会员分享,可在线阅读,更多相关《(本科)第二章--数据搜集-ppt课件.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 统计数据的收集整理统计数据的收集整理一、一、统计数据的收集统计数据的收集二、统计分组二、统计分组三、次数分布及其显示三、次数分布及其显示(本科)第二章 数据搜集 ppt课件第三章第三章 统计数据的收集整理统计数据的收集整理学习目的:学习目的:了了了了解解解解统统统统计计计计工工工工作作作作的的的的两两两两个个个个重重重重要要要要步步步步骤骤骤骤,即即即即数数数数据据据据收收收收集集集集和和和和整整整整理理理理的的的的基基基基本本本本思思思思想想想想和和和和方法方法方法方法。重难点:重难点:统统统统计计计计调调调调查查查查的的的的种种种种类类类类;普普普普查查查查、重重重重点点点点
2、调调调调查查查查、典典典典型型型型调调调调查查查查的的的的方方方方法法法法;调调调调查查查查方方方方案案案案和和和和问问问问卷卷卷卷。统统统统计计计计分分分分组组组组方方方方法法法法;分分分分布布布布数数数数列列列列的的的的相相相相关关关关概概概概念念念念和和和和编编编编制制制制方方方方法法法法;统统统统计计计计图图图图的的的的绘制绘制绘制绘制 。(本科)第二章 数据搜集 ppt课件第一节第一节 统计数据的收集统计数据的收集一、一、统计调查统计调查二、数据的搜集方法二、数据的搜集方法三、调查方案设计三、调查方案设计四、调查问卷设计四、调查问卷设计五、次级资料的收集五、次级资料的收集(本科)第二
3、章 数据搜集 ppt课件指直接从各调查指直接从各调查单位收集的用来单位收集的用来反映个体特征的反映个体特征的数据资料数据资料统计调查是整个统计认识活动的基础,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败决定着统计认识过程及其结果的成败 收集收集原始数据资料原始数据资料 的统计活动过程的统计活动过程统计调查统计调查要求:要求:准确、及时、准确、及时、全面、效益全面、效益一、一、统计调查统计调查(本科)第二章 数据搜集 ppt课件按调查单位的范围大小分为按调查单位的范围大小分为全面调查全面调查非全面调查非全面调查一次性调查一次性调查经常性调查经常性调查统计报表统计报表专门调查
4、专门调查统计调查的种类统计调查的种类按调查时间是否连续分为按调查时间是否连续分为按调查的组织方式不同分为按调查的组织方式不同分为普查普查抽样调查抽样调查典型调查典型调查重点调查重点调查(本科)第二章 数据搜集 ppt课件指国家为详尽了解某项重要的国情指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查国力而专门组织的一次性全面调查特点特点(1)普查是一次性全面调查。)普查是一次性全面调查。(2)普普查查的的对对象象多多为为时时点点现现象象,即即某某一一时时点点上上总总数数量量及及其其构构成成情情况况。(如:人口普查)(如:人口普查)(3)普查有标准时点(瞬间)。)普查有标准时点(瞬间)
5、。统计调查的组织方式统计调查的组织方式(本科)第二章 数据搜集 ppt课件作用作用局限局限可以为抽样调查提供抽样框可以为抽样调查提供抽样框可以收集统计报表所不能提供的反可以收集统计报表所不能提供的反映重大国情国力的基本统计信息映重大国情国力的基本统计信息由于需要大量的人力、物力和财由于需要大量的人力、物力和财力,不宜经常进行力,不宜经常进行(本科)第二章 数据搜集 ppt课件为了解总体基本情况,在调查对象为了解总体基本情况,在调查对象中只选择一部分中只选择一部分重点单位重点单位 进行调查进行调查的一种非全面调查组织方式的一种非全面调查组织方式作用作用局限局限能以较少的投入和较快能以较少的投入和
6、较快的速度取得总体基本情的速度取得总体基本情况及变动趋势的资料况及变动趋势的资料只适用于客观存在着只适用于客观存在着重点单位的情况重点单位的情况不能推断不能推断这些单位数目这些单位数目这些单位数目这些单位数目不多,但其标不多,但其标不多,但其标不多,但其标志值在总体标志值在总体标志值在总体标志值在总体标志总量中占有志总量中占有志总量中占有志总量中占有较大比重,能较大比重,能较大比重,能较大比重,能反映总体的基反映总体的基反映总体的基反映总体的基本情况本情况本情况本情况统计调查的组织方式统计调查的组织方式(本科)第二章 数据搜集 ppt课件在对调查对象有一定了解的基础上,在对调查对象有一定了解的
7、基础上,有意识地选择少数有意识地选择少数典型单位典型单位 进行进行调查的一种非全面调查组织方式调查的一种非全面调查组织方式一定条件下能估计总体指一定条件下能估计总体指标数值标数值可以补充全面调查的不足可以补充全面调查的不足可以用来研究新生事物可以用来研究新生事物不能确定推断的把握程度,不能确定推断的把握程度,无法计算和控制推断误差无法计算和控制推断误差作作用用指在数量表现指在数量表现指在数量表现指在数量表现上具有普遍意上具有普遍意上具有普遍意上具有普遍意义和代表性的义和代表性的义和代表性的义和代表性的总体单位,可总体单位,可总体单位,可总体单位,可以用来推断总以用来推断总以用来推断总以用来推断
8、总体的数量体的数量体的数量体的数量局局限限统计调查的组织方式统计调查的组织方式(本科)第二章 数据搜集 ppt课件 按照按照 随机原则随机原则 从调查对象中抽从调查对象中抽取一部分样本单位进行调查,再用取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征样本资料推断把握总体的数量特征的一种非全面调查组织方式的一种非全面调查组织方式指样本单位的抽指样本单位的抽指样本单位的抽指样本单位的抽取不受主观因素取不受主观因素取不受主观因素取不受主观因素及其他系统性因及其他系统性因及其他系统性因及其他系统性因素的影响,每个素的影响,每个素的影响,每个素的影响,每个总体单位都有均总体单位都有均总体单位
9、都有均总体单位都有均等的被抽中机会等的被抽中机会等的被抽中机会等的被抽中机会特特点点优优点点按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体的数量特征抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间达到全面调查的目的达到全面调查的目的达到全面调查的目的达到全面调查的目的调查资料的准确性较高、受人调查资料的准确性较
10、高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小统计调查的组织方式统计调查的组织方式(本科)第二章 数据搜集 ppt课件抽样调查研究抽样调查研究Sampling Study为什么要抽样?为什么要抽样?1.涉及破坏受试对象涉及破坏受试对象质量控制质量控制2.取得精确可靠的结果取得精确可靠的结果3.实际情况的约束实际情况的约束时间,成本等时间,成本等(本科)第二章 数据搜集 ppt课件 指按照国家统一规定的各项要求,指按照国家统一规定的各项要求,自下而上自下而上地定期向国家和主管部门地定期向国家和主管部门报送基本统
11、计资料的一种报告制度报送基本统计资料的一种报告制度优点优点局限局限能保证统计资料的全面性和连续性能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要能满足各级部门对统计资料的需要统计报表过多会增加基层负担统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资有可能由于虚报瞒报而影响统计资料质量料质量统计调查的组织方式统计调查的组织方式(本科)第二章 数据搜集 ppt课件二、数据的搜集方法二、数据的搜集方法数据的搜集方法数据的搜集方法P39-40采采采采访访访访调调调调查查查查报告报告问问问问卷卷卷卷调调调调查查查查网网网网上
12、上上上调调调调查查查查询问询问直接观察直接观察(本科)第二章 数据搜集 ppt课件三、调查方案设计三、调查方案设计(本科)第二章 数据搜集 ppt课件调查目的调查目的1.调查要达到的具体目标调查要达到的具体目标2.回答回答“为什么调查?为什么调查?”3.调查之前必须明确调查之前必须明确(本科)第二章 数据搜集 ppt课件调查对象和调查单位调查对象和调查单位1.调查对象:调查研究的总体或调查范围调查对象:调查研究的总体或调查范围2.调查单位:需要对之进行调查的单位。可以是调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象的全部单位(全面调查),也可以是调查对
13、象中的一部分单位(非全面调查)调查对象中的一部分单位(非全面调查)3.回答回答“向谁调查?向谁调查?”调查对象调查对象调查对象调查对象调查单位?调查单位?调查单位?调查单位?(本科)第二章 数据搜集 ppt课件调查项目和调查表调查项目和调查表1.调查项目:调查的具体内容(即标志)调查项目:调查的具体内容(即标志)2.调查表:表现调查项目的表格或问卷调查表:表现调查项目的表格或问卷3.回答回答“调查什么?调查什么?”Q Q1 1 Q Q2 2 Q Q3 3 Q Q4 4 (本科)第二章 数据搜集 ppt课件调查时间和工作期限调查时间和工作期限1.调查时间:调查时间:调查资料所属的时间调查资料所属
14、的时间2.工作期限:工作期限:调查工作的起止时间调查工作的起止时间时期现象:资料与时期相对应时期现象:资料与时期相对应时点现象:根据调查对象的特征确定标准时点时点现象:根据调查对象的特征确定标准时点(本科)第二章 数据搜集 ppt课件方案设计中的其他问题方案设计中的其他问题1.明确调查所采用的方法明确调查所采用的方法2.调查的组织与实施细则调查的组织与实施细则见见P33(本科)第二章 数据搜集 ppt课件见见P4146自学要点:自学要点:问卷类型问卷类型问卷格式问卷格式问题及答案设计问题及答案设计问卷编排设计问卷编排设计四、调查问卷设计四、调查问卷设计(本科)第二章 数据搜集 ppt课件五、次
15、级资料的收集五、次级资料的收集次级资料次级资料指已经被收集、加工整理成型的指已经被收集、加工整理成型的数据信息数据信息次级资料的主要收集渠道:次级资料的主要收集渠道:查阅公开出版物;查阅公开出版物;向政府统计机构咨询;向政府统计机构咨询;向其他机构咨询;向其他机构咨询;网上查询。网上查询。(本科)第二章 数据搜集 ppt课件常用的统计数据来源中国统计年鉴中国统计年鉴中国统计摘要中国统计摘要中国统计信息网(国家统计局网站)中国统计信息网(国家统计局网站)http:/(本科)第二章 数据搜集 ppt课件常用的统计数据来源美国经济分析局美国经济分析局http:/www.bea.doc.gov美国人口
16、普查局美国人口普查局http:/www.census.gov美国劳工统计局美国劳工统计局http:/stats.bls.gov美联储经济数据库美联储经济数据库http:/www.stls.frb.org/fred美国联邦统计美国联邦统计http:/www.fedstats.gov世界银行世界银行http:/www.worldbank.org国际货币基金组织国际货币基金组织http:/www.imf.orgOECD http:/www.oecd.org(本科)第二章 数据搜集 ppt课件(本科)第二章 数据搜集 ppt课件(本科)第二章 数据搜集 ppt课件(本科)第二章 数据搜集 ppt课件第
17、二节第二节 统计分组统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤 二、统计分组的方法二、统计分组的方法(本科)第二章 数据搜集 ppt课件统计整理统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分组和汇总形成综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位统计数据的处理:统计数据的处理:统计资料的分组、汇总及制表统计资料的分组、汇总及制表统计数据的管理:统计数据的管理:数据的传输、贮存、更新及输出数据的传输、贮存、更新及输出内内容容(本科)第二章 数据搜集 p
18、pt课件制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理(分组和汇总分组和汇总)制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤(本科)第二章 数据搜集 ppt课件将总体中所有单位按一定的标志分将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分为性质不同但又有联系的若干部分的过程的过程统计分组统计分组统计分组统计分组(classification)统计分组的作用统计分组的作用:总体经过分组,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变
19、得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。qq划分社会经济现象的类型划分社会经济现象的类型qq反映社会经济现象的内部结构和比例关系反映社会经济现象的内部结构和比例关系qq揭示社会经济现象之间的相互依存关系揭示社会经济现象之间的相互依存关系(本科)第二章 数据搜集 ppt课件选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性:科学性:组间差异组间差异大,组内大,组内差异小。差异小。穷尽性和互斥性:穷尽性和互斥性:每个单位均能且每个单位均能且只能归到某个组只能归到某个组中。中。统计分组的程序与原则统计分组的程序与原则(本科)第二章 数据搜集 ppt课件
20、对大学生月生活对大学生月生活费支出情况进行费支出情况进行分组研究:分组研究:按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按性别分组;按性别分组;按年龄分组。按年龄分组。?对父母亲下岗情对父母亲下岗情况进行分组研究:况进行分组研究:单亲下岗;单亲下岗;双亲下岗;双亲下岗;双亲在岗。双亲在岗。不符合不符合科学性科学性不符合不符合穷尽性和互斥性穷尽性和互斥性城乡区别城乡区别离退休离退休是否健在是否健在?(本科)第二章 数据搜集 ppt课件分组体系分组体系指同时使用两个以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组标志并列使用各分组标志
21、并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分组体系复合(交叉)分组体系复合(交叉)分组体系(本科)第二章 数据搜集 ppt课件 平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2(本科)第二章 数据搜集 ppt课件 复合分组体系复合分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类(本科)第二章 数据搜集 ppt课件第三
22、节第三节 次数分布及其显示次数分布及其显示一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率四、统计图和统计表四、统计图和统计表(本科)第二章 数据搜集 ppt课件变量数列变量数列品质数列品质数列将总体各单位按某个标志分成若干将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列在总体中所占的比重而形成的数列分布数列分布数列分分类类分组标志的具体表现分组标志的具体表现各组的次数或频率各组的次数或频率构成要素构成要素异距数列异距数列等距数列等距数列组距数
23、列组距数列单项数列单项数列(本科)第二章 数据搜集 ppt课件品质标志的频数分布品质标志的频数分布受教育程度受教育程度人口数(万人)人口数(万人)大学(指大专以上)大学(指大专以上)45714571高中(含中专)教育高中(含中专)教育1410914109初中教育初中教育4298942989小学教育小学教育4519145191未接受教育未接受教育1972319723合计合计126583126583表表3.1 中国人口受教育程度中国人口受教育程度(本科)第二章 数据搜集 ppt课件练习练习 中国名人榜中国名人榜100100强强表表3.2 中国名人中国名人30强职业强职业运动员运动员演员演员运动员运
24、动员演员演员歌手歌手导演导演演员演员歌手歌手演员演员演员演员演员演员演员演员歌手歌手演员演员演员演员运动员运动员运动员运动员导演导演演员演员演员演员演员演员组合组合组合组合演员演员歌手歌手歌手歌手演员演员演员演员歌手歌手导演导演表表3.2 中国名人中国名人30强职业强职业职业运动员演员歌手导演组合合计划记频数41563230(本科)第二章 数据搜集 ppt课件单项数列单项数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量数列的编制变量数列的编制变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编
25、制条件:【例】【例】【例】【例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。(本科)第二章 数据搜集 ppt课件日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下
26、:编制结果如下:(本科)第二章 数据搜集 ppt课件组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量是连续变量;变量是连续变量;或:或:总体单位数较多,变量不同总体单位数较多,变量不同取值个数也较多的离散变量。取值个数也较多的离散变量。编制条件编制条件:变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列(本科)第二章 数据搜集 ppt课件 相关概念相关概念指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限
27、各组的最小值为下限,最大值为上限组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值组中值=(本科)第二章 数据搜集 ppt课件某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距
28、d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)(本科)第二章 数据搜集 ppt课件编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况实例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15
29、.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9
30、.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。要求编制组距数列。(本科)第二章 数据搜集 ppt课件编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及组数确定组距的原则:确定组距的原则:q要能要能区分各组的性质差异区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数
31、倍的整数倍R组距组距(d)组数(组数(m)编制等距数列编制等距数列(本科)第二章 数据搜集 ppt课件计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)(本科)第二章 数据搜集 ppt课件确定组限确定组限q对于离散变量,相邻组组限可以间断,也对于离散变量,相邻组组限可以间断,也可重叠;可重叠;q对于连续变量,相邻组组限必须重叠;对于连续变量,相邻组组限必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可
32、使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法(本科)第二章 数据搜集 ppt课件计算次数计算次数编编制制结结果:果:销售额(百销售额(百万元)万元)组中值组中值商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50分组划记法分组划记法茎叶图法茎叶图法(5+(5-5))/2=2.5(25+(25+5))/2=27.5(本科)第二章 数据搜集 ppt课件开口式组距数列组中值的计算:开口式组距数列组中值的计算:首组假定下限首组上限相邻组组距首组假定下限首组上限相邻组组
33、距 末组假定上限末组下限相邻组组距末组假定上限末组下限相邻组组距先计算开口组的假定上、下限:先计算开口组的假定上、下限:因此有:因此有:首组首组组中值组中值末组末组组中值组中值(本科)第二章 数据搜集 ppt课件频率频率各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重累计次数(频率)累计次数(频率)从变量值低的组开始,将各组次数从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数说明某一组上限以下各组的累计次数(频率)。(频率)。向向上上累累计计向向下下累累计计 从变量值高的组开始,将各组次数从变量值高的组开
34、始,将各组次数(频率)逐次向变量值低的组累计,(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数说明某一组下限以上各组的累计次数(频率)。(频率)。(本科)第二章 数据搜集 ppt课件有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm(本科)第二章 数据搜集 ppt课件 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100(本科)第二章 数据搜集 ppt课件 销售额销售额(百
35、万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100(本科)第二章 数据搜集 ppt课件 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下51010151520202525以上以上41016134382032268641430434750504636207382860869
36、4100100927240146合计合计50100(本科)第二章 数据搜集 ppt课件统计图统计图以点、线条、面积等方法描述、以点、线条、面积等方法描述、显示统计数据的形式显示统计数据的形式具有直观、醒目、易于理解等特点具有直观、醒目、易于理解等特点组成:组成:坐标系坐标系图形图形图例图例单式图单式图复合图复合图叠加图叠加图一个图只用来显示一种现象的一个图只用来显示一种现象的数量特征数量特征用一个图同时显示几种数量的用一个图同时显示几种数量的分布或变化情况分布或变化情况(本科)第二章 数据搜集 ppt课件例例中国体育代表团在雅典奥运会上获金牌的项目中国体育代表团在雅典奥运会上获金牌的项目获金牌
37、项目获金牌项目 金牌数金牌数 占总数占总数比例比例跳水跳水 6枚枚 0.1857举重举重 枚枚 0.1563乒乓球乒乓球 3枚枚 0.0938羽毛球羽毛球 3枚枚 0.0938 体操体操 1枚枚 0.0313 射击射击 4枚枚 0.1250柔道柔道 1枚枚 0.0313 摔跤摔跤 1枚枚 0.0313田径田径 2枚枚 0.0626跆拳道跆拳道 2枚枚 0.0626 排球排球 1枚枚 0.0313 网球网球 1枚枚 0.0313 田径田径 2枚枚 0.0626(本科)第二章 数据搜集 ppt课件1、条形图(、条形图(Bar chart)是用宽度相同的条形的高度或长短来表示数是用宽度相同的条形的高
38、度或长短来表示数据变动的图形,一般用于对单值数列的描述。据变动的图形,一般用于对单值数列的描述。(本科)第二章 数据搜集 ppt课件2 2、饼形图(、饼形图(Pie chartPie chart)是用圆形及圆内扇形的面积来表示数之大小的是用圆形及圆内扇形的面积来表示数之大小的图形,研究结构性问题。图形,研究结构性问题。(本科)第二章 数据搜集 ppt课件圆形图圆形图(饼图饼图 Pie )主要用于显示定类变量的主要用于显示定类变量的次数分布次数分布(本科)第二章 数据搜集 ppt课件(本科)第二章 数据搜集 ppt课件(本科)第二章 数据搜集 ppt课件3、直方图(、直方图(histogram)
39、用矩形面积来表示频数分布的图形,一般适用用矩形面积来表示频数分布的图形,一般适用于组距数列。于组距数列。直方图和条形图的区别:直方图和条形图的区别:条形图:条形的宽度表示类别,是固定的且条形图:条形的宽度表示类别,是固定的且无实际意义,用长度来反映频数无实际意义,用长度来反映频数 直方图:条形的宽度表示各组的组距,有实直方图:条形的宽度表示各组的组距,有实际意义,用长度来表示频数际意义,用长度来表示频数 由于分组数据具有连续性,直方图各矩形连由于分组数据具有连续性,直方图各矩形连续排列,而条形图分开排列续排列,而条形图分开排列(本科)第二章 数据搜集 ppt课件直方图直方图(Histogram
40、 )用于显示连续型变量的用于显示连续型变量的次数分布次数分布(本科)第二章 数据搜集 ppt课件直方图直方图条形图条形图(本科)第二章 数据搜集 ppt课件直方图直方图销量(辆)销量(辆)频数频数202930394049505960697079792 24 410108 84 42 23030表表 汽车销售频数分布表汽车销售频数分布表图图 汽车销售频数分布图汽车销售频数分布图 20 40 60 80(本科)第二章 数据搜集 ppt课件频率直方图频率直方图销量(辆)销量(辆)频率(频率(%)202930394049505960697079796.713.333.326.713.36.7100.0
41、100.0表表 汽车销售频数分布表汽车销售频数分布表图图 汽车销售频数分布图汽车销售频数分布图 20 40 60 8010066.733.3(本科)第二章 数据搜集 ppt课件累计频数直方图累计频数直方图销量(辆)销量(辆)累计频数累计频数202930394049505960697079792 26 61616242428283030表表 汽车销售累计频数汽车销售累计频数图图 汽车销售累计频数汽车销售累计频数 20 40 60 80(本科)第二章 数据搜集 ppt课件4、折线图(、折线图(Frequency polygon)在直方图的基础上,把直方图顶部的中在直方图的基础上,把直方图顶部的中点
42、(组中值)用直线联结起来,它与直方点(组中值)用直线联结起来,它与直方图所围面积相等。图所围面积相等。曲线图曲线图:当变量的取值非常多,变量数列当变量的取值非常多,变量数列的组数无限增多时,折线便趋于一条的组数无限增多时,折线便趋于一条平滑的曲线,这是一种概括描述变量平滑的曲线,这是一种概括描述变量数列分布特征的理论曲线。数列分布特征的理论曲线。(本科)第二章 数据搜集 ppt课件5、茎叶图、茎叶图既能既能给给出数据的分布状况,又能出数据的分布状况,又能给给出每一个原始数据。出每一个原始数据。由由“茎茎”和和“叶叶”两部分两部分组组成。成。树茎405060708090树叶56223689001
43、11123346889901112223334444555577788999990000112222334445566666880022335某班学生成绩茎叶图某班学生成绩茎叶图(本科)第二章 数据搜集 ppt课件次数分布数列的特征次数分布数列的特征钟型分布钟型分布特征是特征是“两头小,中间大两头小,中间大”,即靠近中间,即靠近中间的变量值分布的次数多,靠近两端的变量的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。值分布的次数少,其形状宛如一口古钟。特征是靠近中间的变量值分布的次数少,特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状靠近两端的变量
44、值分布的次数多,其形状宛如英文字母宛如英文字母U。如:人口死亡率。如:人口死亡率nU型分布型分布特征是次数随着变量值的增大而增多或随特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大变量值的增大而减少,其形状宛如英文大写字母写字母J nJ型分布型分布(本科)第二章 数据搜集 ppt课件U U型分布型分布型分布型分布 正正正正J J型分布型分布型分布型分布 反反反反J J型分布型分布型分布型分布 对称分布对称分布对称分布对称分布 右偏分布右偏分布右偏分布右偏分布 左偏分布左偏分布左偏分布左偏分布 (本科)第二章 数据搜集 ppt课件具有容量大、方便计算等特点具有容量大、方便
45、计算等特点统计表的常用结构:统计表的常用结构:统计表统计表以纵横交叉的线条所形成的表格以纵横交叉的线条所形成的表格来表现统计资料的形式来表现统计资料的形式总总 标标 题题宾词栏宾词栏主词栏主词栏数据栏数据栏(本科)第二章 数据搜集 ppt课件某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额(万元)销售额(万元)每百元商品销售额中每百元商品销售额中支付的流通费(元)支付的流通费(元)213536394545464732936038718.316.917.215.614.714.213.612.98.27.17.6按销售额分组按销售额分组(万元)(万元)商店
46、数商店数(个)(个)每百元商品销售额中支每百元商品销售额中支付的流通费(元)付的流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5(本科)第二章 数据搜集 ppt课件统计表的编制规则统计表的编制规则q选择合适的总标题;选择合适的总标题;q主词栏与宾词栏要各归其位,相互对主词栏与宾词栏要各归其位,相互对应;应;q表的上、下端用粗线或双线封口,左表的上、下端用粗线或双线封口,左右两端一般不封口;右两端一般不封口;q可在各列的文字标题下面设置编号加可在各列的文字标题下面设置编号加以标识;以标识;q数据栏不能有空白。数据栏不
47、能有空白。(本科)第二章 数据搜集 ppt课件统计表的加工方法统计表的加工方法对主词栏加工对主词栏加工对宾词栏加工对宾词栏加工(对主体进行分组)(对主体进行分组)单式加工单式加工复式加工复式加工(选择指标及对指标进行分组)(选择指标及对指标进行分组)简单分组简单分组交叉分组交叉分组(本科)第二章 数据搜集 ppt课件对主词栏的单式加工对主词栏的单式加工(本科)第二章 数据搜集 ppt课件对主词栏的复式加工对主词栏的复式加工(本科)第二章 数据搜集 ppt课件按月工资分按月工资分按月工资分按月工资分组组组组按性别分(人按性别分(人按性别分(人按性别分(人)按级别分按级别分按级别分按级别分小计小计
48、小计小计男男男男女女女女小计小计小计小计技工技工技工技工学徒工学徒工学徒工学徒工300300以下以下以下以下300300400400400400500500500500600600600600700700700700以上以上以上以上4 416162222151510105 51 16 6101011118 84 43 3101012124 42 21 14 416162222151510105 50 02 24 45 58 85 54 41414181810102 20 0合计合计合计合计727240403232727224244848对宾词栏的简单分组对宾词栏的简单分组(本科)第二章 数据搜
49、集 ppt课件按月工资按月工资按月工资按月工资分组分组分组分组按级别分(人)按级别分(人)按级别分(人)按级别分(人)总总总总计计计计技工技工技工技工学徒工学徒工学徒工学徒工小计小计小计小计男男男男女女女女小计小计小计小计男男男男女女女女对宾词栏的交叉分组对宾词栏的交叉分组(本科)第二章 数据搜集 ppt课件 本章小结本章小结1、统计数据搜集研究的起点,统计数据来源于两、统计数据搜集研究的起点,统计数据来源于两个渠道:一是调查,通过调查收集到的是原始数个渠道:一是调查,通过调查收集到的是原始数据;而数二是源于已经存在的数据,即二手数据据;而数二是源于已经存在的数据,即二手数据或间接数据。或间接数据。2、统计调查的方法有普查、重点调查、典型调查、统计调查的方法有普查、重点调查、典型调查和抽样调查。分别适用于不同研究目的的需要。和抽样调查。分别适用于不同研究目的的需要。3、统计分组是统计整理的关键环节、统计分组的、统计分组是统计整理的关键环节、统计分组的关键是选择格局研究目的选择分组标志。关键是选择格局研究目的选择分组标志。4、次数分布是分组以后,形成的按一定顺序排列、次数分布是分组以后,形成的按一定顺序排列总体单位的分布,可以采用统计表或统计图显示。总体单位的分布,可以采用统计表或统计图显示。(本科)第二章 数据搜集 ppt课件