《贾俊平《统计学》(第5版)笔记和课后习题(含考研真题)详解.docx》由会员分享,可在线阅读,更多相关《贾俊平《统计学》(第5版)笔记和课后习题(含考研真题)详解.docx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、贾俊平统计学(第5版)笔记和课后习题(含考研真题)详解书目 内容简介 目 录 第1章导论 1.1复习笔记 1.2课后习题详解 1.3典型习题详解 第2章数据的搜集 2.1复习笔记 2.2课后习题详解 2.3典型习题详解 第3章数据的图表展示 3.1复习笔记 3.2课后习题详解 3.3典型习题详解 第4章数据的概括性度量 4.1复习笔记 4.2课后习题详解 4.3典型习题详解 第5章概率与概率分布 5.1复习笔记 5.2课后习题详解 5.3典型习题详解 第6章统计量及其抽样分布 6.1复习笔记 6.2课后习题详解 6.3典型习题详解 第7章参数估计 7.1复习笔记 7.2课后习题详解 7.3典型
2、习题详解 第8章假设检验 8.1复习笔记 8.2课后习题详解 8.3典型习题详解 第9章分类数据分析 9.1复习笔记 9.2课后习题详解 9.3典型习题详解 第10章方差分析 10.1复习笔记 10.2课后习题详解10.3典型习题详解 第11章一元线性回来 11.1复习笔记 11.2课后习题详解 11.3典型习题详解 第12章多元线性回来 12.1复习笔记 12.2课后习题详解 12.3典型习题详解 第13章时间序列分析和预料 13.1复习笔记 13.2课后习题详解 13.3典型习题详解 第14章指数 14.1复习笔记 14.2课后习题详解 14.3典型习题详解第 第1 章导论 1.1复习笔记
3、 一、统计学 1统计学 统计学是收集、处理、分析、说明数据并从数据中得出结论的科学。数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法探讨数据,并从数据中提取有用信息进而得出结论。2数据分析所用的方法 (1)描述统计:探讨的是数据收集、处理、汇总、图表描述、概括与分析等统计方法; (2)推断统计:探讨如何利用样本数据来推断总体特征的统计方法。二、统计数据的类型 1分类数据、依次数据、数值型数据(按计量尺度不同分类)(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的; (2)依次数据:只能归于某
4、一有序类别的非数字型数据。依次数据虽然也是类别,但这些类别是有序的; (3)数值型数据:按数字尺度测量的视察值,其结果表现为详细的数值。现实中所处理的大多数都是数值型数据。关系:分类数据和依次数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。2观测数据和试验数据(按收集方法分类)(1)观测数据:通过调查或观测而收集到的数据,这类数据是在没有对事物人为限制的条件下得到的; (2)试验数据:在试验中限制试验对象而收集到的数据。3截面数据和时间序列数据(按被
5、描述的现象与时间的关系分类)(1)截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的改变状况;(2)时间序列数据:在不同时间上收集到的数据,这类数据是按时间依次收集到的,用于所描述现象随时间改变的状况。三、统计中的几个基本概念 1总体和样本 (1)总体 总体、个体 总体是包含所探讨的全部个体(数据)的集合,它通常由所探讨的一些个体组成。组成总体的每一个元素称为个体。总体的分类 依据总体所包含的单位数目是否可数可以分为:a有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的; b无限总体:指总体所包括的元素是无限的,不行数的。(
6、2)样本、样本量 样本:从总体中抽取的一部分元素的集合; 样本量:构成样本的元素的数目。2参数和统计量 (1)参数 参数是用来描述总体特征的概括性数字度量,它是探讨者想要了解的总体的某种特征值。探讨者所关切的参数通常有总体平均数、总体标准差、总体比例等。(2)统计量 统计量是用来描述样本特征的概括性数字度量。它是依据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。探讨者所关切的统计量主要有样本平均数、样本标准差、样本比例等。3变量 (1)变量、变量值 变量:说明现象某种特征的概念,其特点是从一次视察到下一次视察结果会呈现出差别或改变。变量值:变量的详细取值。(2)变量的类型
7、 分类变量是说明事物类别的一个名称,其取值是分类数据。依次变量 是说明事物有序类别的一个名称,其取值是依次数据。数值型变量 是说明事物数字特征的一个名称,其取值是数值型数据。依据其取值的不同,又可以分为:a离散型变量:只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举; b连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连绵不断的,不能一一列举。(3)变量的其他分类 随机变量、非随机变量 阅历变量、理论变量 阅历变量所描述的是四周环境中可以视察到的事物;理论变量是由统计学家用数学方法所构造出来的一些变量。1.2课后习题详解 一、思索题 1什么是统计学? 答
8、:统计学是关于数据的科学,它所供应的是一套有关数据收集、处理、分析、说明并从数据中得出结论的方法,统计探讨的是来自各领域的数据。数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法探讨数据,并从数据中提取有用信息进而得出结论。2说明描述统计和推断统计。答:数据分析所用的方法可分为描述统计方法和推断统计方法。(1)描述统计探讨的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。(2)推断统计是探讨如何利用样本数据来推断总体特征的统计方法。比如,对产品的质量进行检验,往往是破坏性的,不行能对每个产品进行测量。这就须要抽取部分个体即样本进行测量,然后
9、依据获得的样本数据对所探讨的总体特征进行推断,这就是推断统计要解决的问题。3统计数据可分为哪几种类型?不同类型的数据各有什么特点? 答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)根据所采纳的计量尺度不同,可以将统计数据分为分类数据、依次数据和数值型数据。在分类数据中,各类别之间是同等的并列关系,无法区分优劣或大小,各类别之间的依次是可以变更的; 依次数据也表现为类别,但这些类别之间是可以比较依次的; 数值型数据具有分类数据和依次数据的特点,并且还可以进行加、减、乘、除运算。(2)根据统计数据的收集方法,可以将其分为观测数据和试验数据。观测数据是通过调查或观测而收集
10、到的数据,这类数据是在没有对事物人为限制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据; 试验数据则是在试验中限制试验对象而收集到的数据,自然科学领域的大多数数据都为试验数据; (3)根据被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的改变状况; 时间序列数据是在不同时间上收集到的数据,这类数据是按时间依次收集到的,用于所描述现象随时间改变的状况。4说明分类数据、依次数据和数值型数据的含义。答:(1)分类数据是只能归于某一类别的非数字型数据,它是对事物进行
11、分类的结果,数据表现为类别,是用文字来表述的。为便于统计处理,对于分类数据可以用数字代码来表示各个类别。(2)依次数据是只能归于某一有序类别的非数字型数据。依次数据虽然也是类别,但这些类别是有序的。(3)数值型数据是按数字尺度测量的视察值,其结果表现为详细的数值。分类数据和依次数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。5举例说明总体、样本、参数、统计量、变量这几个概念。答:(1)总体是包含所探讨的全部个体(数据)的集合。比如,要检验一批灯泡的运
12、用寿命,这一批灯泡构成的集合就是总体。(2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。比如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。(3)参数是用来描述总体特征的概括性数字度量,它是探讨者想要了解的总体的某种特征值。比如总体平均数、总体标准差、总体比例等。(4)统计量是用来描述样本特征的概括性数字度量。它是依据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。比如,样本平均数表示,样本标准差用s表示,样本比例用p等。(5)变量是说明现象某种特征的概念,其特点是从一次视察到下一次视察结果会呈现出差别或改变。如商品销售额、受教化程
13、度、产品的质量等级等都是变量。变量的详细取值称为变量值。6变量可分为哪几类? 答:变量可以分为:(1)分类变量,是说明事物类别的一个名称,其取值是分类数据; (2)依次变量,是说明事物有序类别的一个名称,其取值是依次数据;(3)数值型变量,是说明事物数字特征的一个名称,其取值是数值型数据。7举例说明离散型变量和连续型变量。答:(1)离散型变量是指其数值只能用自然数或整数单位计算的变量。如,企业个数、职工人数、设备台数等。(2)连续型变量是指在肯定区间内可以随意取值的变量,其数值是连绵不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等为连续
14、型变量。8请举出统计应用的几个例子。答:统计应用举例如下:(1)每隔10年进行一次的全国人口普查; (2)对居民手存现金状况的调查; (3)对某学校历年考研成果的调查。9请举出应用统计的几个领域。答:应用统计的领域:(1)企业发展战略; (2)人力资源管理; (3)企业进行市场探讨; (4)财务分析; (5)经济预料; (6)企业产品质量管理。二、练习题 1指出下面变量的类型。(1)年龄。(2)性别。(3)汽车产量。(4)员工对企业某项改革措施的看法(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。答:变量可以分为:分类变量、依次变量和数值型变量。(2)(5)属于分类变量
15、;(4)属于依次变量;(1)(3)属于数值型变量。2某探讨部门打算抽取2000个职工家庭推断该城市全部职工家庭的年人均收入。要求:(1)描述总体和样本。(2)指出参数和统计量。答:(1)总体是该城市全部的职工家庭,样本是抽取的2000个职工家庭。(2)参数是城市全部职工家庭的年人均收入,统计量是抽取的2000个家庭计算出的年人均收入。3一家探讨机构从IT从业者中随机抽取1000人作为样本进行调查,其中60回答他们的月收入在5000元以上,50的人回答他们的消费支付方式是用信用卡。回答以下问题:(1)这一探讨的总体是什么? (2)月收入是分类变量、依次变量还是数值型变量? (3)消费支付方式是分
16、类变量、依次变量还是数值型变量? (4)这一探讨涉及截面数据还是时间序列数据? 答:(1)总体是全部IT从业者; (2)月收入是数值型变量; (3)消费支付方式是分类变量; (4)这项探讨涉及的是截面数据。4一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要缘由是价格便宜。回答以下问题:(1)这一探讨的总体是什么? (2)消费者在网上购物的缘由是分类变量、依次变量还是数值型变量? (3)探讨者所关切的参数是什么? (4)消费者每月在网上购物的平均花费是200元是参数还是统汁量? (5)探讨者所运用的主要是描述统计方法还是推断统计方法? 答:(1)这一探讨的总体是全
17、部的网上购物者; (2)消费者在网上购物的缘由是分类变量; (3)探讨者所关切的参数是全部的网上购物者的月平均花费; (4)消费者每月在网上购物的平均花费200元是统计量; (5)探讨者所运用的主要是推断统计方法。1.3典型习题详解 一、单项选择题 1下列选项中,属于分类变量的有( )。A年龄 B工资 C汽车产量 D性别(男、女)D 变量可以分为分类变量、依次变量和数值型变量。D项属于分类变量;ABC三项都是数值型变量。2下列选项中,属于数值型变量的有( )。A年龄 B性别 C购买商品时的支付方式(现金、信用卡、支票)D员工对企业某项改革措施的看法(赞成、中立、反对)A BC两项是分类变量;D
18、项是依次变量。3某探讨部门打算在全市500万个家庭中抽取5000个家庭,推断该城市全部职工家庭的年人均消费。这项探讨的总体是 、样本是 、参数是 。()A500万个家庭;500万个家庭的人均消费;5000个家庭 B500万个家庭的人均消费;500万个家庭;5000个家庭 C500万个家庭;5000个家庭;500万个家庭的人均消费 D500万个家庭的人均消费;5000个家庭;500万个家庭 C 总体是包含所探讨的全部个体(数据)的集合,它通常由所探讨的一些个体组成;样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量;参数是用来描述总体特征的概括性数字度量,它是探讨者想要了解的总
19、体的某种特征值。4对某市高等学校科研所进行调查,统计总体是()。A某市全部的高等学校 B某一高等学校科研所 C某一高等学校 D某市全部高等学校科研所 D5有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平状况,则统计总体为()。A200个公司的全部职工 B200个公司 C200个公司职工的全部工资 D200个公司每个职工的工资 A6下列属于数值型变量的是()。A月工资 B学历 C健康状况 D性别 A B项是依次变量;CD两项是分类变量。7某探讨部门打算在全市500万个家庭中抽取5000个家庭,推断该城市全部职工家庭的年人均消费。这项探讨的统计量是( )。A5000个家
20、庭 B500万个家庭 C5000个家庭的年人均消费 D500万个家庭的年人均消费 C 统计量是用来描述样本特征的概括性数字度量。它是依据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差、样本比例等。5000个家庭的年人均消费为样本平均数,因此为统计量。A项为样本容量;B项为总体数目;D项为总体特征。8某省的统计机构要考察本省居民的人均住房面积。随机抽取了8000个家庭进行调查。这里的总体是( )。A本省全部居民 B本省全部居民的住房面积 C8000户家庭 D8000户家庭的住房面积 A9在同一时间序列中,各指标值的时间单位一般要求( )。A必需为月
21、B必需为年 C相同 D必需为日 C 同一时间序列中,各指标值的时间单位一般要求相同,这样在分析探讨中无须考虑时间单位不同所造成的差异。10某地区20002009年的每年年末人口数是()。A时间序列数据 B截面数据 C分类数据 D依次数据 A 根据被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。时间序列数据是在不同时间上收集到的数据,这类数据是按时间依次收集到的,用于所描述现象随时间改变的状况。112009年城镇家庭的人均收入数据属于( )。A分类数据 B依次数据 C截面数据 D时间序列数据 C根据被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。其中,截面
22、数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的改变状况。12下列不属于描述统计问题的是( )。A依据样本信息对总体进行的推断 B了解数据分布的特征 C分析感爱好的总体特征 D利用图、表或其他数据汇总工具分析数据 A 数据分析方法可以分为描述统计方法和推断统计方法。描述统计探讨的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是探讨如何利用样本数据来推断总体特征的统计方法。BCD三项都属于描述统计问题。13某高校的一位探讨人员希望估计该高校本科生平均每月的生活费支出,为此,他调查了200名学生,发觉他们每月平均生活费支出是
23、600元。该统计量是()。A该高校的全部学生 B全部高校生的总生活费支出 C该高校全部的在校本科生 D200名学生每月平均生活费支出 D14在下列叙述中,采纳推断统计方法的是( )。A用饼图描述某企业职工的年龄构成 B某日从某食品厂随机抽取了50袋饼干,利用这50袋饼干的平均重量估计这天生产的全部袋装饼干的平均重量 C一个城市在1月份的平均汽油价格 D反映高校生统计学成果的条形图 B ACD三项属于描述统计。15一项民意调查的目的是想确定年轻人情愿与其父母探讨的话题。调查结果表明:45%的年轻人情愿与其父母探讨家庭财务状况,38%的年轻人情愿与其父母探讨有关教化的话题,15%的年轻人情愿与其父
24、母探讨爱情问题。该调查所收集的数据是()。A观测数据 B依次数据 C分类数据 D试验数据 A 根据统计数据的收集方法,可以将其分为观测数据和试验数据。观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为限制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。16依据样本计算的用于推断总体特征的概括性度量值称作( )。A参数 B总体 C样本 D统计量 D 统计量是用来描述样本特征的概括性数字度量。它是依据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差、样本比例等。17为了估计某城市中拥有空调的家庭比例,抽取500个家庭的一个样本
25、,得到拥有空调的家庭比例为80%,这里的80%是()。A参数值 B统计量的值 C样本量 D变量 B18到商场购物停车变得越来越困难,管理人员希望驾驭顾客找到停车位的平均时间。为此某一个管理人员跟踪了50名顾客并记录下他们找到车位的时间。这里管理人员感爱好的总体是()。A管理人员跟踪过的50名顾客 B上午在商场停车的顾客 C在商场停车的全部顾客 D到商场购物的全部顾客C A项为总体的样本。19只能归于某一有序类别的非数字型数据称为( )。A分类数据 B依次数据 C数值型数据 D观测数据 B20通过调查或观测而收集到的数据称为( )。A观测数据 B试验数据 C时间序列数据 D截面数据 A21最近发
26、表的一份报告称,由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车。这一结论属于()。A对样本的描述 B对样本的推断 C对总体的描述 D对总体的推断 D 推断统计是探讨如何利用样本数据来推断总体特征的统计方法二、多项选择题 1根据所采纳的计量尺度,统计数据可以分为( )。A分类数据 B试验数据 C依次数据 D二手数据 E数值型数据 ACE根据所采纳的计量尺度,统计数据可以分为三类:分类数据:由定类尺度计量形成的,表现为类别,通常用文字表述,但不区分依次;依次数据:由定序尺度计量形成的,表现为类别,通常用文字表述,但有依次;数值型数据:由定距尺度和定比尺度计量形成的,说明的是
27、现象的数量特征,通常用数值来表现。2数值型变量依据其取值的不同,可以分为( )。A离散变量 B依次变量 C连续变量 D随机变量 E非随机变量 AC 数值型变量依据其取值的不同,又可以分为离散变量和连续变量。其中,离散变量只能取有限值,而且其取值都以整位数断开,可以一一列举;连续变量可以取无穷多个值,其取值是连绵不断的,不能一一列举。3分类数据和依次数据统称()。A二手数据 B定性数据 C品质数据 D定量数据 E数值型数据BC 分类数据和依次数据所说明的都是事物的品质特征,不能用数值表示,通常用文字表述,其结果表现为类别,故分类数据和依次数据统称为定性数据或品质数据。4连续变量具有的特点包括()
28、。A可以取无穷多个值 B取值连绵不断 C只可以取有限值 D其取值都以整位数断开E取值不能一一列举 ABE5变量可以分为()。A分类变量 B有序变量 C依次变量 D无序变量 E数值型变量 ACE 变量可以分为:分类变量:说明事物类别的一个名称,其取值是分类数据;依次变量:说明事物有序类别的一个名称,其取值是依次数据;数值型变量:说明事物数字特征的一个名称,其取值是数值型数据。6下列数值型变量中,属于连续变量的有( )。A年龄 B温度 C企业数 D人口数 E零件尺寸 ABE ABE三项均可以取无穷多个值,其取值是连绵不断的,不能一一列举,故属于连续变量;CD两项均只能取有限值,而且其取值都以整位数
29、断开,可以一一列举,故属于离散变量。第 第2 章数据的搜集 2.1复习笔记 一、数据的来源 1数据的间接来源 (1)间接来源的数据(二手资料)假如与探讨内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以运用的数据,则称为间接来源的数据。(2)二手资料的优点 搜集比较简单,采集数据的成本低,并且能很快得到。(3)二手资料的局限性 相关性不够,口径可能不一样,数据或许不精确,或许过时等。(4)对二手资料进行评估的内容 资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。为什么目的而搜集?为了某个集团的利益而搜集的数据是值得怀疑的。数据是怎样搜集的?搜集数据可以
30、有多种方法,不同方法所采集到的数据,其说明力和劝服力都是不同的。假如不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。数据的质量来源于数据的生产过程。什么时候搜集的?对于过时的数据,其劝服力自然受到质疑。运用二手数据,要留意数据的定义、含义、计算口径和计算方法,避开错用、误用、滥用。在引用二手数据时,应注明数据的来源,以敬重他人的劳动成果。2数据的干脆来源 (1)调查数据 它是通过调查方法获得的数据。调查数据通常取自有限总体,即总体所包含的个体单位是有限的。普查是对总体中全部个体单位进行的调查,普查数据具有信息全面、完整的特点,对普查数据的全面分析和深化挖掘是统计分析的重要内容。但是,
31、当总体较大时,进行普查将是一项很大的工程,由于普查涉及的范围广,接受调查的单位多,所以耗时、费劲,调查的成本也特别高,因此普查是不行能常常进行的。(2)试验数据 二、调查数据 1概率抽样和非概率抽样 (1)概率抽样 概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有肯定的机会被选入样本。特点 a抽样时是按肯定的概率以随机原则抽取样本。所谓随机原则就是在抽取样本时解除主观上有意识地抽取调查单位,使每个单位都有肯定的机会被抽中。b每个单位被抽中的概率是已知的,或是可以计算出来的。c当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。概率抽样与等概率抽样的区分:概率抽样
32、是指总体中的每个单位都有肯定的非零概率被抽中,单位之间被抽中的概率可以相等,也可以不等。若是前者,称为等概率抽样;若是后者,称为不等概率抽样。概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的牢靠程度。从另一个方面讲,也可以根据要求的精确度,计算必要的样本单位数目。概率抽样的方式 a简洁随机抽样 进行概率抽样须要抽样框,抽样框通常包括全部总体单位的信息,其作用是不仅在于供应了备选单位的名单以供抽选,还是计算各个单位入样概率的依据。简洁随机抽样:从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。简洁随机抽样是一种最
33、基本的抽样方法,是其他抽样方法的基础。特点 简洁、直观,在抽样框完整时,可以干脆从中抽取样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较便利。局限性:第一,它要求包含全部总体单位的名单作为抽样框,当N很大时,构造这样的抽样框并不简单; 其次,依据这种方法抽出的单位很分散,给实施调查增加了困难; 第三,没有利用其他协助信息以提高估计的效率。b分层抽样 将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。优点:第一,保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以
34、有效地提高估计的精度; 其次,在肯定条件下为组织实施调查供应了便利(当层的划分是按行业或行政区划进行时); 第三,既可以对总体参数进行估计,也可以对各层的目标量进行估计等等。c整群抽样 将总体中若干个单位合并为组,这样的组称为群。抽样时干脆抽取群,然后对中选群中的全部单位全部实施调查,这样的抽样方法称为整群抽样。与简洁随机抽样相比,整群抽样的特点在于简化了编制抽样框的工作量,并且调查的地点相对集中,从而节约了调查费用,便利了调查的实施。整群抽样的主要弱点是估计的精度较差。要得到与简洁随机抽样相同的精度,须要增加基本调查单位。d系统抽样 将总体中的全部单位(抽样单位)按肯定依次排列,在规定的范围
35、内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。主要优点:操作简便,假如有协助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度。缺点:对估计量方差的估计比较困难。e多阶段抽样 采纳类似整群抽样的方法,首先抽取群,但并不是调查群内的全部单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。优点:第一,保证了样本相对集中,从而节约了调查费用;其次,不须要包含全部低阶段抽样单位的抽样框; 第三,由于实行了再抽样,使调查单位在更广泛的范围内绽开。在较大规模的抽样调查中,多阶段
36、抽样是常常被采纳的方法。(2)非概率抽样 指抽取样本时不是依据随机原则,而是依据探讨目的对数据的要求,采纳某种方式从总体中抽出部分单位对其实施调查。非概率抽样的方式:便利抽样 调查过程中由调查员依据便利的原则,自行确定入抽样本的单位。便利抽样的最大特点是简单实施,调查的成本低,但是由于便利样本无法代表有明确定义的总体,将便利样本的调查结果推广到总体是没有任何意义的。推断抽样 指探讨人员依据阅历、推断和对探讨对象的了解,有目的地选择一些单位作为样本,实施时依据不同的目的有重点抽样、典型抽样、代表抽样等方式。重点抽样:从调查对象的全部单位中选择少数重点单位,对其实施调查。这些重点单位的数量虽然不多
37、,但在总体中占有重要地位。典型抽样:从总体中选择若干个典型的单位进行深化的调研,目的是通过典型单位来描述或揭示所探讨问题的本质和规律。因此,选择的典型单位应当具有探讨问题的本质或特征。代表抽样:通过分析,选择具有代表性的单位作为样本,在某种程度上,也具有典型抽样的含义。推断抽样是主观的,样本选择的好坏取决于调研者的推断、阅历、专业程度和创建性。这种方式的抽样成本比较低,也简单操作,但由于样本是人为确定的,没有依据随机的原则,因而调查结果不能用于对总体有关参数进行估计。自愿样本 指被调查者自愿参与,成为样本中的一分子,向调查人员供应有关信息。滚雪球抽样 往往运用于对稀有群体的调查中。在滚雪球抽样
38、中,首先选择一组调查单位,对其实施调查之后,再请他们供应另外一些属于探讨总体的调查对象,调查人员依据所供应的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。滚雪球抽样的主要优点:简单找到那些属于特定群体的被调查者,调查的成本也比较低。它适合对特定群体进行探讨的资料搜集。配额抽样类似于概率抽样中的分层抽样,它是首先将总体中的全部单位按肯定的标记(变量)分为若干类,然后在每个类中采纳便利抽样或推断抽样的方式选取样本单位。这种抽样方式操作比较简洁,而且可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似。(3)概率抽样与非概率抽样的比较 非概率抽样适合探究
39、性的探讨和市场调查中的概念测试,其特点是操作简便、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。假如调查的目的是用样本的调查结果对总体相应的参数进行估计,并计算估计的误差,得到总体参数的置信区间,就应当运用概率抽样的方法。概率抽样是依据随机原则抽选样本,此时样本统计量的理论分布是存在的。概率抽样的技术含量更高,无论抽选样本和对调查数据进行分析,都要求有较高的统计学专业学问,调查的成本也比非概率抽样的调查成本高。有时在一项探讨性项目中,可以把概率抽样和非概率抽样相结合,发挥各自的特点,满意探讨中的不同需求。2搜集数据的基本方法 (1)自填式 指在没有调查员帮助的状况下由被调查者自己
40、填写,完成调查问卷。优点 调查组织者对自填式方法的管理相对简单,自填式的调查成本也是最低的,增大样本量对调查费用的影响很小,也有利于被调查者,在肯定程度上可以减小被调查者回答敏感性问题的压力。弱点 a问卷的回收率比较低; b自填式方法不适合结构困难的问卷; c自填式方法的调查周期通常都比较长,调查人员也须要对问卷的递送和回收方法进行细致的探讨和选择; d对于在数据搜集过程中出现的问题,一般难以刚好实行调改措施。(2)面访式 指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答这种调查方式。主要优点 a可以提高调查的回答率; b可以提高调查数据的质量,并且可以对识字率低的群体实施调查;
41、c在问卷设计中可以采纳更多的技术手段,使得调查问题的组合更为科学、合理;d在面访调查中,还可以借助其他调查工具(图片、照片、卡片、实物等)丰富调查内容; e能对数据搜集所花费的时间进行调整。主要弱点 a调查的成本比较高; b面访这种搜集数据的方式对调查过程的质量限制有肯定难度; c对于敏感性问题,在面对面条件下,被调查者通常不会像自填式方法下那样放松,也不情愿回答。(3)电话式 指调查人员通过打电话的方式向被调查者实施调查。电话调查的优点 a速度快,能够在很短的时间内完成调查; b适合样本单位非常分散的状况,由于不须要支付调查员的交通费,数据搜集的成本大大下降; c对调查员也是平安的; d在电
42、话调查中,对访问过程的限制也比较简单。电话调查的局限 a在电话拥有率不高的地区,电话调查这种方式就受到限制; b运用电话进行访问的时间不能太长; c问卷答案的选项过长、过多,不仅造成调查进度的延缓,被调查者还很简单挂断电话; d在被访者不情愿接受调查时,要劝服他们就更为困难。此外,搜集数据的方法还有视察式,即调查人员通过干脆观测的方法获得信息。此外,搜集数据的方法还有视察式,即调查人员通过干脆观测的方法获得信息。3数据搜集方法的选择 选择数据搜集方法时须要考虑的问题有:抽样框中的有关信息;目标总体的特征;调查问题的内容;有形协助物的运用;实施调查的资源;管理与限制;质量要求。三种搜集数据方法的
43、特点如表23所示。 三、试验数据 指在试验中限制试验对象而搜集到的变量的数据。1试验组和比照组 试验法的基本逻辑:有意识地变更某个变量的状况(设为A项),然后看另一个变量改变的状况(设为B项)。假如B项随着A项的改变而改变,就说明A项对B项有影响。试验组:指随机抽选的试验对象的子集。在这个子集中,每个单位接受某种特殊的处理。比照组:每个单位不接受试验组成员所接受的某种特殊的处理。匹配:指对试验单位的背景材料进行分析比较,将状况类似的每对单位分别随机地安排到试验组和比照组。试验组和比照组的产生应遵循随机原则,即将试验单位随机地安排到试验组和随机组。一个好的试验,随机组和比照组的产生不仅应当是随机
44、的,而且应当是匹配的。2试验中的若干问题 试验法的逻辑严密,是证明假设、分析事物因果关系的一个良好方式。但在试验过程中也会遇到一些问题:(1)人的意愿;(2)心理问题;(3)道德问题。3试验中的统计 (1)统计在试验的过程中的作用 确定进行试验所须要的单位的个数,以保证明验可以达到统计显著的结果; 将统计的思想融入试验设计,使试验设计符合统计分析的标准; 供应尽可能最有效地同时探讨几个变量影响的方法。(2)一个好的试验,应当在两个方面都有效:内部的有效性内部的有效性意味着试验测量的精确性。试验的目的是要考察自变量和因变量之间的因果关系,而假如试验视察结果受到其他无关变量的影响,就很难推断自变量
45、与因变量之间的因果关系。外部的有效性 外部的有效性确定是否可以将试验中发觉的因果关系进行推广,即能否将结果推广到试验环境以外的状况。四、数据的误差 指通过调查搜集到的数据与探讨对象真实结果之间的差异。1抽样误差 这是由于抽样的随机性引起的样本结果与总体真值之间的误差。它描述的是全部样本可能的结果与总体真值之间的平均性差异。并且是一种随机性误差,只存在于概率抽样中。影响抽样误差大小的因素:(1)抽样单位的数目。在其他条件不变的状况下,抽样单位的数目越多,抽样误差越小;抽样单位的数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,
46、则为全面调查,也就不存在抽样误差了。(2)总体被探讨标记的变异程度。在其他条件不变的状况下,总体标记的变异程度越小,抽样误差越小。总体标记的变异程度越大,抽样误差越大。抽样误差和总体标记的变异程度成正比改变。这是因为总体的变异程度小,表示总体各单位标记值之间的差异小。则样本指标与总体指标之间的差异也可能小;假如总体各单位标记值相等,则标记变动度为零,样本指标等于总体指标,此时不存在抽样误差。(3)抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采纳不重复抽样比采纳重复抽样的抽样误差小。(4)抽样组织方式不同。采纳不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对