《统计数据的搜集(1).ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集(1).ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章统计数据的搜集第二章统计数据的搜集数据的计量尺度与类型统计调查方法与数据搜集方式统计数据的质量 收集数据,就必须对所考察的现象进行计量或测度。这就是说,统计数据是对所考察现象进行计量的结果。对于不同现象,能够计量的程度是不同的。有些现象只能定性(分类),例如人口的性别和民族,企业的信誉等。而有些现象则可以定量(数值),例如温度和收入等。按照对现象计量的精确程度,计量尺度从低级到高级,从粗略到精确分为四个层次(等级)。采用不同的计量尺度可以得到不同类型的统计数据,而不同类型的统计数据又适用于不同的统计分析方法。第一节数据的计量与类型第一节数据的计量与类型一、数据的计量尺度一、数据的计量尺度
2、定类尺度是最粗略,计量层次最低的计量尺度。这种计量尺度按事物属性进行分类或分组,但没有等级之分。也就是说,这种计量尺度只能进行平行的分类或分组。计量结果为每一类别的频数或频率分类时必须符合穷尽和互斥的要求 例如一个学校的学生按性别分为男、女两类,或按民族分为汉族和少数民族两类。这种分类把所考察的个体(学生)划分为不同的类型,但各类型之间是平行的关系,不能区分优劣或大小。也就是说,定类尺度只能区分个体是同类或不是同类,具有=(是同类)及(不是同类)的数学特性。、定类尺度、定类尺度这种计量尺度按事物属性进行分类或分组,同时可排序。即定序尺度不仅可以划分类型,而且还可以确定这些类别的优劣或顺序。计量
3、结果为每一类别的频数或频率各类别具有某种意义上的等级差异,但不能具体测定等级之间差异的大小 例如企业信誉等级就是对企业信誉好坏的一种次序测度,它可以把企业信誉分为好、较好、一般和较差四个类别。显然这些类别具有等级差异,但不能具体测定等级之间差异的大小。因此,定序尺度具有(一个类别优于另一类别)和(一个类别不如另一类别)的数学特性。、定序尺度、定序尺度这种计量尺度不仅能进行分类和排序,并且能测定类别之间的差距计量结果为数值没有绝对零点,只能进行加、减运算 例如温度的计量结果为一个数值,当我们按10划分一个等级时,则相邻两个类别的差距为10。并且温度没有一个实际的0作为起点,0 表示一种温度水平,
4、并不是没有温度。假如甲地:30,乙地15,可以说甲地比乙地高15,但不能说甲地温度是乙地的2倍。因此,对于定距尺度,其结果可以进行加、减运算,但不能作乘、除运算(即不能计算比值)。、定比尺度、定比尺度这种计量尺度不仅能进行分类和排序,也能测定类别之间的差距计量结果为数值有绝对零点,除进行加、减运算外,还可以进行乘、除运算 定比尺度与定距尺度的唯一差别就是定比尺度有实际的0作为起点。例如,收入就有实际的0作为起点,0表示没有收入。假如甲收入600元,乙收入300元,可以说甲比乙多收入300元,也可以说甲收入是乙的两倍。因此,定比尺度可以进行加、减、乘、除运算。、定距尺度、定距尺度表四种计量尺度的
5、比较表四种计量尺度的比较计量尺度数学特性定类尺度定序尺度定距尺度定比尺度分类(,)排序(,)间距(,)比值(,)1.高层次的计量尺度可化为低层次计量尺度,反之则不行2.适用低层次计量尺度的统计方法也适用高层次计量尺度3.,反之则不行二、数据的类型和分析方法二、数据的类型和分析方法、数据类型和分析方法、数据类型和分析方法定类数据定序数据定距数据定比数据 数据类型与 分析方法定性数据定量数据非参数方法参数方法 这就是说,统计分析方法与数据类型有关,或者说统计分析方法对数据类型有要求(表现为类别)(表现为数值)(例:列联分析)(例:参数估计)、变量及其类型变量及其类型定类变量定序变量离散变量连续变量
6、变量类型定性变量定量变量(数值变量)说明现象某一方面特征所采用的名称,称为变量(采用定性数据)(采用定量数据)(例:性别、民族)(例:产品等级)(例:家庭人口)(例:体重、温度)三、统计指标及其类型三、统计指标及其类型时期指标时点指标比例比率统计指标总量指标相对指标平均指标 表现总体数量特征所采用的名称,称为统计指标,具体取值则为指标值(用绝对数表示)(用相对数表示)(用平均数表示)(一段时期内总量)例:年总产值(到某一时刻的总量)例:年未人口总数(部分与全体之比)(任意两指标之比)第二节统计数据的来源第二节统计数据的来源 对使用者,数据来源有两种方式 1.直接来源 2.间接来源一、统计数据的
7、直接来源一、统计数据的直接来源 有两种方法 1.专门调查:专门调查是取得社会经济数据的主要方法 2.科学试验:科学试验则是取得自然科学数据的主要手段 本节重点讨论调查、统计调查方式、统计调查方式普查统计报表随机抽样调查选择抽样调查调查方式全面调查部分调查重点调查抽样调查典型调查为特定目的专门组织的全面调查(用于搜集某一时点上的社会经济现象的数量,例如人口普查)一次性或周期性(例如未尾为“0”年份进行人口普查)规定统一的标准时间(第5次人口普查标准时间为2000年11月1日0时)数据比较准确和规范(按统一规定进行登记)应用范围较窄(调查工作量大,需大量人力和财力)普查普查根据随机抽取的样本推断总
8、体数量特征的非全面调查,是实际工作中应用最广泛的一种部分调查方法 经济(由于只抽取总体的很少一部分,大量节省人力和财力 快速(由于调查工作量小,所需时间短)应用范围广(适用各种调查,特别是破坏性测定和总体太大的情况)准确性高(所需调查人员少,则相对素质高,从而数据质量高,结论可靠)抽样调查抽样调查统计报表是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方法,以全面调查为主。曾是我国主要的数据搜集方法。按填报范围不同分为全面报表和非全面报表(全面报表:要求每一个单位都填报;非全面报表:一部分单位填报)按报送时间不同分为日报、月报、季报和年报按报送范围不同分为
9、国家、部门和地方统计报表统计报表统计报表 从全部单位中选择少数重点单位进行调查的方法,因此是一种部分调查方法。要求总体存在少数重点单位 不能根据调查结果推断总体(重点单位:这些单位虽然数量很少,但这些单位的数值却很大,占总体的比例很高,通过对这些单位的调查就能了解总体的基本情况)例:为了解全国钢铁工业生产情况,就可以把鞍钢、武钢、首钢、宝钢等特大型企业作为重点单位进行调查,就能了解全国钢铁生产的基本情况。重点调查重点调查从全部单位中选择部分典型单位进行调查的方法,因此也是一种部分调查方法。通过典型单位揭示事物的本质和规律不能根据调查结果推断总体典型调查典型调查、数据的搜集方法、数据的搜集方法询
10、问调查数据的搜集方法访问调查邮寄调查电话调查电脑辅助调查座谈会个别深访观察法实验法观察与实验(即在一定调查方式下取得数据的方法)询问调查询问调查通过与被调查者直接或间接接触以获得数据的方法 (介绍以下六种方法)通过面对面地交谈而获得数据的调查方法标准式访问:按事先设计好的问卷或表格进行调查非标准式访问:不事先制作问卷或表格,与被调查者进行自由交谈。在市场调查和社会调查中常采用访问调查。访问调查访问调查(通常随机确定被调查者)通过邮寄或其他方式将调查问卷或调查表送至被调查者手中,按要求填写后再寄回给调查者的调查方法调查者与被调查者没有直接交谈,通过调查问卷或调查表获得数据调查问卷或调查表的发放方
11、式有邮寄,宣传媒介传送和专门场所分发三种 在统计部门进行的统计报表及市场调查机构进行的问卷调查中经常使用邮寄调查。邮寄调查邮寄调查(随机或非随机确定被调查者)利用电话与被调查者交谈获得数据的调查方法 费用低(调查费用较低)效率高(调查时间较少)电话调查时问题的数量不宜太多,随着电话的普及,电话调查的应用越来越广泛。电话调查电话调查(随机或非随机确定被调查)利用电话电脑相结合的调查方法,也称电脑辅助电话调查 整个调查过程借助计算机完成,能缩短调查时间,提高调查效率 需要专门的软件电脑辅助调查电脑辅助调查 (随机或非随机确定被调查)将被调查者集中在调查现场,收集被调查者意见以获得数据的调查方法,也
12、称集体访谈法。人数不宜太多,一般人侧重于定性研究座谈会座谈会(按要求选取被调查者)一次只有一名受访者参加,针对特殊问题的调查方法适合研究较敏感的问题侧重于定性研究个别深度访问个别深度访问(按要求选取被调查)通过直接的观察或实验获得数据的方法观察法通过对被调查者的观察获得数据的方法试验法通过对调查对象进行实验以获得数据的方法,分为室内实验法和市场实验法两种例:广告成对比较实验(室内实验法)对A、B两种广告,除广告外其余条件均保持一致,通过实验比较A、B两种广告的作用大小。观察与实验观察与实验 由于种种原因,不能直接取得数据时,采用间接法,即获取别人调查或试验的第二手数据 .公开出版物或公开报道.
13、网络 引用第二手数据时 1.要注意数据是否适用 2.要注明数据的来源二、统计数据的间接来源二、统计数据的间接来源第三节调查方案设计第三节调查方案设计调查方案的内容调查对象和单位调查项目与调查表调查目的其他内容 调查方案是指导整个调查过程的指导性文件,要说明“做什么与怎么做”明确调查所要达到的具体目标,即说明“为什么调查”例如,我国1990年第四次人口普查的目的是“为正确查清第三次人口普查以来我国在人口数量、地区分布、构成和素质方面的变化,为科学的制定国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料。”一、确定调查目的一、确定调查目的.根据调查目的
14、确定调查对象(第四次人口普查规定“人口普查的对象是具有中华人民共和国国藉并在中国境内长住的人”).调查的基本单位称为单位(也称个体,人口普查的单位是每一个人)需要调查的单位称为调查单位(样本单位)全面调查时总体的每一个单位都是调查单位,而在部分调查时调查单位只是总体的一部分 在市场研究和调查中,通常都采用抽样调查。采用抽样调查时,先根据调查对象确定抽样框,再从抽样框中按一定方式随机抽取一部分单元组成样本。二、确定调查对象和调查单位二、确定调查对象和调查单位(说明“向谁调查”)、调查项目调查的具体内容(可以是定量或定性)、调查表调查项目的表格或问卷(登记调查数据的一种表格).调查表一般由表头、表
15、体和表外附加三部分组成(表头是调查表的名称,用来说明调查的内容、被调查单位名称等。表体是调查表的主要部分,包括调查的具体项目。表体之上是表头,而表体之下是表外附加).问卷由开头部分、甄别部分、主体部分和背景部分组成三、设计调查项目和调查表三、设计调查项目和调查表(说明“调查什么”).确定调查所采用的方式和方法(应明确是全面调查还是非全面调查,以及具体的调查方式,数据的搜集方法).确定调查数据所属的时间和调查的工作期限 我国第四次人口普查的所属时间是“1990年7月1日0时”,普查的工作期限是“1990年7月1日至7月10日完成普查的登记工作。调查的组织与实施工作,包括人员的选择、组织和培训,调
16、查表、问卷的印制等四、方案设计中的其他内容四、方案设计中的其他内容第四节统计数据的质量第四节统计数据的质量一、统计数据的误差、统计数据与真值之间的差距称为误差、有登记性误差和代表性误差两类登记性误差人为因素造成的误差,称为非抽样误差,应力求减少代表性误差用样本推断总体所产生的误差,称为抽样误差,虽然无法消除,但可以计算或控制 最重要的二个方面是精度与准确性 精度 可通过抽样误差来表示,抽样误差小,则精度高 .准确性 可通过非抽样误差来表示,非抽样误差小,则准确性高 关联性 应满足多方面需要 及时性 在尽可能短的时间内取得数据 一致性 保持数据的可比性 成本 尽可能降低成本二、统计数据的质量要求二、统计数据的质量要求