2021-2022年收藏的精品资料中级经济师第2125章统计部分讲义.docx

上传人:知****量 文档编号:18904161 上传时间:2022-06-02 格式:DOCX 页数:57 大小:2.29MB
返回 下载 相关 举报
2021-2022年收藏的精品资料中级经济师第2125章统计部分讲义.docx_第1页
第1页 / 共57页
2021-2022年收藏的精品资料中级经济师第2125章统计部分讲义.docx_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《2021-2022年收藏的精品资料中级经济师第2125章统计部分讲义.docx》由会员分享,可在线阅读,更多相关《2021-2022年收藏的精品资料中级经济师第2125章统计部分讲义.docx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2013中级经济师课程讲义 经济基础知识.第21章第21章统计与统计数据第一节 统计学【本节考点】1、 统计学的两大分支2、 描述统计的含义、内容、举例3、 推断统计的含义、内容、举例【本节内容】一、统计学的含义:统计学是关于收集、整理、分析数据和从数据中得出结论的科学。二、统计学的两大分支(描述统计和推断统计)类型含义及内容举例描述统计研究数据收集、整理和描述的统计方法。其内容包括:(1) 如何取得所需要的数据;(2) 如何用图表或数学方法对数据进行整理和展示;(3) 如何描述数据的一般特征。为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的CPI数据,利用统计图展示CPI

2、,利用增长率计算CPI的走势。推断统计研究如何利用样本数据推断总体特征的统计方法。其内容包括:1、 参数估计:利用样本信息推断总体特征;2、 假设检验:利用样本信息判断对总体假设是否成立。某公司评测顾客满意度,随机抽取部分顾客进行调查,再对顾客总体满意度进行评估,此时需要用到参数估计法,然后验证满意度高的客户更倾向于成为忠诚客户。【例题1:单选】描述统计的研究内容不包括()A如何取得所需要的数据;B如何用图表或数学方法对数据进行整理和展示;C如何描述数据的一般特征。D如何利用样本信息判断对总体假设是否成立【答案】D【例题2:单选】收集统计局发布的CPI数据,利用统计图展示CPI,利用增长率计算

3、CPI的走势,这种统计方法是()。A描述统计B推断统计C客观统计D心理统计【答案】A第二节 变量和数据【本节考点】A 变量的含义及分类B 数据的含义及分类【本节内容】项目含义分类变量变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。定量变量(数量变量)变量的取值是数量。如企业销售额、注册员工数定性变量分类变量变量的取值是类别。如企业所属行业、员工性别顺序变量变量的取值是类别且有顺序。如员工受教育水平数据数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。

4、如企业销售额1000万元。定性数据分类数据分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。测量结果分类变量分类数据统计变量与数据定性变量测量结果顺序变量顺序数据测量结果数值型数据定量变量对于不同类型的数据,可以采用不同的统计方法处理和分析。对分类数据可以计算出各类别的频率,而数值型数据则可以计算均值和方差等统计量。【例题3:多选】定性变量的观测结果是()。顺序变量分类数据顺序数据数值型数据 E分类变量【答案】BC【例题4:0

5、9年多选题改编】下列变量中,通常用数值型数据表示的有()。A.商品销售额B.上班出行方式C.家庭收入D.居住地区E.年龄【答案】ACE第三节 常用的数据特征测度【本节考点】1、 均值和中位数2、 方差和标准差【本节内容】对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。(一)均值和中位数(测度数据的集中趋势)集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值。1、均值均值也就是平均

6、数,就是数据组中所有数值的总和除以该组数值的个数。【注1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。【注2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。【注3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。2、中位数(1)含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。(2)计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:(1)n为奇数:中位数位

7、置是,该位置所对应的数值就是中位数数值。(2)n为偶数:中位数位置是介于和(+1)之间,中位数就是这两个位置对应的数据的均值。(3)适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。【例题5:2008单选题】某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人,其中位数为()A34B35C36D37【答案】B【解析】n为偶数,中位数=(34+36)/2=35.【例题6:单选】下面一组数据为9个家庭的人均月收入数据(单位:元):750;780;850;960;1080;1250;1500;

8、1650;2000;则中位数为()A750B1080C1500D2000【答案】B【解析】n为奇数,中位数位置为5,所对应的数值为1080。【例题7:2011年单选】2010年某省8个地市的财政支出(单位:万元)分别为:59000500026560266450780007800078000132100这组数据的中位数是()万元。A.78000B.72225C.66450D.75894【答案】B【解析】由于所给数据是8个,所以中位数的位置是第4个和第5个数据的平均数。(66450+78000)/2=72225【例题8:2003年单选】集中趋势最主要的测度值是()。A.众数B.中位数C.均值D.几

9、何平均数【答案】C【解析】算术平均数也称为均值,是集中趋势最主要的测度值。【例题9:2007年单选改编】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人其均值、中位数分别为()。A59、58B61、58C61、59D61、70【答案】C【解析】均值=(57+58+58+60+63+70)/6=61中位数=(58+60)/2=59(二)方差和标准差(测度数据的离散趋势)离散程度反映的是各变量值远离中心值的程度。集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据

10、的代表性就越差,离散程度越小,其代表性就越好。【例题10:2010年单选】集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性()。A 越好B越差C始终不变D在一定区间内反复变化【答案】B1、含义:(1)方差是数据组中各数值与其均值离差平方的平均数。是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。(2)标准差:方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。2、计算:指标名称总体样本方差N代表总体单位数。n代表样本单位数。【注】(1)在有放回的简单随机

11、抽样中,样本方差s2是总体方差的无偏估计量(2)在不放回的简单随机抽样中,样本方差s2是总体方差S2的无偏估计量标准差【例题11】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额及样本方差和样本标准差。【解析】A 平均销售额=(520+600+480+750+500)/5=570元B 样本方差第一步:计算差520-570=-50;600-570=30;480-570=90;750-570=180;500-570=-70第二步:计算差平方和(-50)2+(30)2+(90)2+(180)2+(-70)2第三步:计算方差方差=1220

12、0(3)样本标准差=110.453、适用只适用于数值型数据,容易受极端值的影响。【例题12:2010年多选题改编】数值型数据离散程度的测度指标有()。A 中位数B几何平均数C均值D标准差E方差【答案】DE第四节 数据来源【本节考点】一、 观测数据和实验数据二、 一手数据和二手数据【本节内容】分类类别内容按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP、CPI、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数

13、据。自然科学领域的数据大多都是实验数据。按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。【例题13:多选】统计数据按其收集方法,可以分为()。A观测数据B一手数据C主观数据D实验数据E二手数据【答案】AD【例题14:单选】几乎所有与社会经济现象有关的统计数据都是()A观测数据B一手数据C二手数据D实验数据【答案】A第五节 统计调查【本节考点】1、 统计调查的概念及分类2、 统计调查的方式【本节内容】一、统计调查的概念和和分类 1、统计调查的概念统计调查过程有两个

14、重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为搜集到的数据。2、统计调查的分类种类具体内容按调查对象的范围不同全面调查全面统计报表和普查非全面调查非全面统计报表、抽样调查、重点调查和典型调查按调查登记的时间是否连续连续调查观察总体现象在一定时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查间隔相当长的时间所作的调查,为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等。【例题15:2008年多选题】下列调查方式中,属于非全面调查的有()A、 重点调查

15、B、抽样调查C、典型调查D、普查E、全面报表【答案】ABC【例题16:多选】按调查登记的时间是否连续,统计调查分为连续调查和不连续调查,下列现象适合不连续调查的是()A生产设备拥有量B耕地面积C人口的出生死亡D原材料的投入E工厂的产品生产【答案】AB(二)统计调查的方式调查方式含义特征、分类及应用场合统计报表按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。1.按调查对象范围的不同分为全面报表和非全面报表。目前的大多数统计报表都是全面报表。2.按报送周期长短,分为日报、月报、季报、年报等。3.按报表内容和实施范围不同分为国家的、部门的、地方的统计报表。普

16、查为某一特定目的而专门组织的一次性全面调查,主要用于了解处于某一时点状态上的社会经济现象的基本全貌。特点:1.普查通常是一次性的或者周期性的;2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确,规范化程度较高,可以为抽样调查或其他调查提供基本的依据。4.使用范围比较窄,只能调查一些最基本及特定的现象。抽样调查从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查(1).经济性:是抽样调查的一个显著优点。(2).时效性强:可以迅速、及时的获得所需要的信息。(3).适应面广:可用于全面调查能够调查的

17、现象,也能调查全面调查所不能调查的现象,特别适合特殊现象的调查。如:产品质量检验、农产品试验、医药的临床实验。(4).准确性高:重点调查从调查对象的全部单位中选择一部分重点单位进行调查。重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重。调查的目的只要求了解基本状况和发展趋势,不要求掌握全面数据,而调查少数重点单位就能满足需要时,采用重点调查比较适宜。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计

18、局的全国5000家工业企业联网直报制度属于重点调查。典型调查有意识的选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。【注】抽样调查和重点调查、典型调查的区别:抽样调查是随机的抽取调查单位,可以根据抽样结果推断总体的数量特征;重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,因此调查结果不能推断总体。【例题17:2006年单选题】能够根据样本结果推断总体数量特征的调查方式是()A.重点调查B.抽样调查C.典型调查D.所有非全面调查【答案】B【例题18:2009年单选题】为了解全国煤炭企业的生产安全状况,找出安全隐患,专

19、家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于()。A 专家调查B重点调查C系统调查D典型调查【答案】D【例题19:2012年单选题】在进行重点调查时,应选择的调查单位是()。A就调查标志值来说在总体中占绝大比重的单位B有典型意义的单位C主动参与调查的单位D随机抽取的单位【答案】A【例题20:2011年多选题改编】关于抽样调查的说法,正确的有()。A抽样调查中不存在非抽样误差B抽样调查用样本数据推断总体特征C抽样调查适应面广D抽样调查时效性差E抽样调查通常从总体中选择重点单位进行调查【答案】BC【第21章考点总结】1、 统计学的两大分支2、 描述统计和推断统计的含义及内

20、容3、 变量和数据的含义及类型4、 均值及中位数的计算和适用范围5、 方差和标准差的关系及二者的适用范围6、 数据的来源(按收集方法及按来源)7、 统计调查的分类8、统计调查的方式第22章 抽样调查第一节 抽样调查的基本概念【本节考点】1、总体、样本;抽样框、抽样单位;总体参数、样本统计量2、概率抽样的特点,非概率抽样的主要方法3、抽样调查的步骤4、抽样调查中的误差【本节内容】一、抽样调查基本概念概念含义例子总体和总体单元调查对象的全体,组成总体的各个个体称作总体单元或单位。如研究某公司所有注册在职人员(共有1000名)的工资状况,总体是公司所有注册在职员工,每个注册在职人员是总体单元。样本、

21、样本单位及样本量样本是总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。每个被抽中进入样本的单位称为入样单位。样本中包含的入样单位的个数称为样本量。上例中,按一定原则从所有注册在职人员中抽取出200人调查。这200名注册在职员工就是样本;而抽出的每一名员工就是入样单位;该样本的样本量是200.抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常见的抽样框有名录框,如企业名录、电话簿、人员名册。抽样框也可以是一张地图或其他适当的形式,不管是那种形式,抽样框中的单位必须是有序的,便于编号。高质量的抽样框应当提供被调查单位更多的信息,并且没有重复和遗漏。上述例

22、子中,企业1000名注册在职职工的名册,就是抽样框。抽样单元构成抽样框的基本要素,抽样单元可以只包括一个总体单元,也可以包括多个总体单元。要调查城市拥有两套以上住房的人口比例,总体单元是该城市的每个人,但抽样单元可以是该城市的每户家庭或是每个居委会。总体参数总体参数就是总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。如研究某公司所有注册在职人员(共有1000名)的工资状况,公司所有注册在职人员的平均工资就是总体参数。样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数

23、的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。如上例中,200名注册在职职工的平均工资就是该公司所有员工平均工资的一个估计量(样本统计量)【例题1:2012年单选】在研究某城市居民的家庭消费结构时,在全部万户家庭中随机抽取户进行入户调查,这项抽样调查中的样本是指该城市中()。B 抽取出来的户家庭B万户家庭C每一户家庭D抽取出来的每一户家庭【答案】A【例题2:单选】某工厂为了检测出厂的十万只灯泡的寿命,随机抽取了1000只灯泡进行检测.关于该抽样调查下列表述错误的是()。A总体是出厂的十万只灯泡B样本是抽取到的

24、1000只灯泡C全体灯泡的平均寿命是总体参数D1000只灯泡的平均寿命是抽样单元【答案】D【解析】1000只灯泡的平均寿命是样本统计量,也称为估计量。二、概率抽样和非概率抽样抽样方法含义特点具体方式概率抽样依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。1.按一定概率以随机原则抽取样本。2.总体中每个单元被抽中的概率是已知的或者是可以计算出来3.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。若每个单位被抽中的概率相等,则成为等概率抽样;否则称为非等概率抽样。1.简单随机抽样;2.分层抽样3.系统抽样;4.整群抽样5.多阶段抽样非概率抽样调查者根据自己的方便

25、或主观判断抽取样本的方法。抽取样本时并不是依据随机原则。1.判断抽样:调查者依据调查目的和对调查对象的了解,人为确定样本单元;2.方便抽样:拦截式3.自愿样本:网上调查4.配额抽样:总体划分若干类型,将样本数额分配到各类型,从各类型中抽取样本的方法没有严格限制,一般采用方便抽样。【例题3:2011年单选题】下列抽样方法中,属于非概率抽样的是()。A 分层抽样B整群抽样C判断抽样D等距抽样【答案】C【例题4:多选题】相对于非概率抽样而言,概率抽样的特点有()A按一定的概率以随机原则抽取样本B总体中每个单元被抽中的概率是已知的或可以计算出来C每个单位被抽入样本的概率相等D抽取样本时不需要依据随机原

26、则E当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率【答案】ABE三、抽样调查的一般步骤 1、确定调查问题: 2、调查方案设计:明确如何实施调查,包括抽样方案的设计和问卷设计。3、实施调查过程:获得样本单元的调查数据,关键的问题是要保证原始数据的质量。4、数据处理分析:对数据进行检查核对、编码、录入、预处理、统计分析、对总体参数进行估计。5、撰写调查报告:调查活动的最终成果。四、抽样调查中的误差样本估计值和总体参数值之间的差异称为误差,一般来说调查中的误差分为抽样误差和非抽样误差两类。误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。抽到哪一个样本

27、完全是随机的,而抽到不同的样本,对总体的估计就会不同。非抽样误差除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的。如用工商局签发的营业执照作为个体商业的抽样框,对个体商业实施抽样调查,以掌握个体商业零售额的情况。但有些商贩无照经营、有些商贩虽有执照但转行,不再经商;有些虽有一个摊点却办理多个营业执照。这些情形均会导致估计结果失真。(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:由于随机因素造成的。如被调查者恰巧不在家,这种会减少有效样本量,造成估计量方差增大。由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答,这

28、时,回答者与不回答者在调查指标上存在数量的差异,调查的结果中只有回答者的信息,却没有无回答者的信息,这种无回答不仅造成估计量方差增大,还会带来估计偏差。(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。【例题5:单题】抽样误差形成的原因主要是()A、抽样的随机性B、有意虚报、瞒报C、问卷设计缺陷D、调查人员没能够从被调查者那里得到所需要的数据【答案】A【例题6:2010年多选题改编】统计数据的非抽样误差形成的原因主要有()。A受访者提供虚假数字B抄录错误C无回答误差D抽样的随机性E抽样框不完善【答案】BCE【例题7:201

29、0年多选题改编】人口普查统计数据可能存在的误差来源有()。A填报错误B抽样的随机性C抄录错误D汇总错误E有意瞒报【答案】ACDE【解析】普查只存在非抽样误差。所以本题实质是考核登记性误差产生的原因。第二节 几种基本的概率抽样方法【本节考点】各种概率抽样方法的含义、特点【本节内容】一、简单随机抽样(一)含义1、有放回简单随机抽样从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。2、不放回简单随机抽样从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚

30、未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。(二)优缺点优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式也比较简单。缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。(三)适用条件 1、抽样框中没有更多可以利用的辅助信息2、调查对象分布的范围不广阔3、个体之间的差异不是很大【例题8:单选】下列关于简单随机抽样的表述错误的是()。A总体的每个单位入样

31、概率相同B是最基本的随机抽样方法C没有利用抽样框更多的辅助信息D适用个体之间差异较大的调查【答案】D二、分层抽样(一)含义先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。分层抽样样本量在各层分配的方法有两类,如下表:分配方法含义优缺点等比例分配层中单位数越多,抽取的样本单位就越多,该层样本单位比例与该层中的总体单位比例相一致.操作容易,易于理解,在实践中广泛使用。但各层单位数相差悬殊或层内方差过大时抽样误差会很大。不等比例分配层样本单位比例与该层中的总体单位比例不一致。如果各层的总体方差

32、已知,不等比例抽样的抽样误差可能比等比例抽样更小。【例题9:单选】某校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为()A.45,75,15B.45,45,45C.30,90,15D.45,60,30【答案】D【解析】样本量占总体容量的比=135/2700=5%n(高一)/900=5%,所以,n(高一)=5%900=45人n(高二)/1200=5%,所以,n(高二)=5%1200=60人n(高三)/600=5%,所以,n(高三)=5%600=30人(二)优缺点优点:1.不仅可以

33、估计总体参数,同时也可以估计各层参数【例】调查某市中小企业就业的相关指标,可以按照行业将该市中小企业进行分层,再在每个行业内独立随机抽取一部分中小企业进行调查,这样不仅能估计全市中小企业就业的相关指标,还可以在各行业进行推算。2.便于抽样工作的组织。3.每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差。(三)适用条件抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。(层内差异小,层间差异大)三、系统抽样(一)含义系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一

34、个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样。其步骤:1.将总体N个单位按直线排列,依次编号1N;2.根据样本量n确定抽样间隔K抽样间隔=【例】N=24,n=4,抽样间隔是24/4=6若N=23,n=4,抽样间隔是23/4=5.663.在1K的范围内随机抽取一个整数i,令位于i位置上的单位为起始单位,往后每间隔k抽取一个单位,直至抽满n。【接上例】N=24,n=4,抽样间隔是24/4=6,在16之间,随机抽取一个整数2作为起始单位,以6为间隔,可得到样本2;2+6=8;8+6=14;14+6=20(二)优缺点1、优点: (1)操作简便;(2)对抽样框的要求比较简

35、单,它只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单。系统抽样的估计效果与总体排列顺序有关。、无关标识排列:排列顺序与调查内容没有联系。这时系统抽样估计与简单随机抽样估计效率相仿。【例】对汽车尾气排放情况的调查中,是按汽车牌号排列,牌号与尾气排放没有关系,即属于无关标识排列。、有关标识排列:排列顺序与调查内容有关。其抽样精度一般比简单随机抽样的精度高。【例】对汽车尾气排放情况的调查中,按汽车价格排列,价格与尾气排放量有相关性。2、缺点:方差估计比较复杂,这就给计算抽样误差带来一定困难。四、整群抽样(一)含义整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽

36、取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。【例】调查某市在职的房地产行业人员工资水平,将房地产行业所有在职人员按照所属企业分群,直接抽取企业单位,入样的企业单位内所有职工接受调查,没有入样的企业单位员工都不调查。(二)优缺点1、优点: (1)实施调查方便,可以节省费用和时间。(2)抽样框编制得以简化,抽样时只需要群的抽样框2、缺点群内各单位之间存在相似性,差异比较小,而群与群之间的差别比较大,使得整群抽样的抽样误差比较大。(三)适用如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估计误差。【例】调查某地区的男女比例,以家庭为群,整群抽样估计男女比例的误差

37、就低于简单随机抽样。整群抽样特别适合于对某些特殊群结构进行调查。【例题10:2012单选】在调查某城市小学教师亚健康状况时,从该城市的200所小学中随机抽取40所,每个被抽取小学中的所有教师都参与调查,这样抽样方法属于()。A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样【答案】B(五)多阶段抽样(一)含义在大规模抽样调查中,一次抽取到最终样本单位很难实现,往往需要经过二个或二个以上阶段才能抽到最终样本单位,这就是多阶段抽样方法。首选从总体中采用随机方法抽取若干个小总体,称为初级单元;再在这些中选的初级单元中随机抽取若干个单位。(二)优缺点在大范围的抽样调查中,采用多阶段抽样是必要的。首先

38、,多阶段抽样是分阶段进行的,抽样框也可以分级进行准备。其次因为多阶段抽样是在中选单位中的再抽选,这样就使样本的分布相对集中,从而可以节省调查中的人力和财力。多阶段的抽样设计比较复杂,其抽样误差计算也比较复杂。第三节 估计量和样本量【本节考点】3、 估计量的性质4、 抽样误差的估计5、 样本量的影响因素【本节内容】一、估计量的性质(一无有,可记忆为“一无所有”)性质内含一致性随着样本量的增大,估计量的值如果稳定于总体参数的真值,这个估计量就有一致性,可称为“一致估计量”。无偏性对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体均值(样本均值的平均数等于总体均值),这就是样本均值估计

39、量的无偏性。有效性在同一抽样方案下,对某一总体参数,如果有两个无偏估计量1、2,由于样本的随机性,如果1的可能样本取值较2更密集在总体参数真值附近,则认为1比2更有效,此时1的方差小于2的方差。【例题11:单选】抽样统计中,估计量的性质不包括()。A一致性B相关性C无偏性D有效性【答案】B(二)抽样误差的估计抽样误差无法避免,但是可计算的。在不放回简单随机抽样方法中,将样本均值作为总体均值的估计量。则估计量的方差为:样本估计量的方差=【结论】C 抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差越大,抽样误差越大。D 抽样误差与样本量n有关,其他条件相同,样本量越大,抽样误差越小。E

40、抽样误差与抽样方式和估计量的选择也有关。例如分层抽样的估计量方差一般小于简单随机抽样。F 利用有效辅助信息的估计量也可以有效的减小抽样误差。2、实践中,总体方差是未知的,可以利用样本方差来估计,因此估计量方差的的估计公式为:样本估计量的方差=【例12】从某个N=1000的总体中抽出一个样本容量为100的不放回简单随机样本,样本均值50,样本方差200,对总体均值的估计量等于样本均值等于50,估计量的方差是()。【解析】样本估计量的方差=1.8【例13:多选】下列关于抽样误差的表述正确的有()。A抽样误差无法避免,但可计算B抽样误差与总体分布有关,总体方差越大,抽样误差越大。C其他条件相同,样本

41、量越大,抽样误差越小D抽样误差与抽样方式和估计量的选择也有关E分层抽样的估计量方差一般大于简单随机抽样【答案】ABCD三、样本量的影响因素1、调查的精度:用样本数据对总体进行估计时可以接受的误差水平,要求的调查精度越高,所需要的样本量就越大。2、总体的离散程度:在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。3、总体的规模:对于大规模的总体,总体规模对样本量的需求则几乎没有影响(样本量n可大致用公式表示)。但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)。4、无回答情况:无回答减少了有效样本量,在无回答率较高的调查项目中,样本量要大一些

42、,以减少无回答带来的影响。5、经费的制约:事实上,样本量是调查经费与调查精度之间的某种折中和平衡。6、其他:调查的限定时间,实施调查的人力资源也是影响样本量的客观因素。【例题14:多选】影响样本量的因素有()。A总体的离散程度B调查的精度C无回答情况D经费的制约E抽样方法【答案】ABCD【第22章主要考点总结】1、 抽样调查的基本概念(总体、样本、样本量、抽样框、抽样单元、总体参数、样本统计量)2、 概率抽样的特点3、 非概率抽样的特点及主要方法4、 抽样误差及非抽样误差产生的原因5、 各种概率抽样方法的含义、优缺点、适用条件(简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样)6、 估计

43、量的性质7、 抽样误差与哪些因素有关8、 样本量的影响因素第23章相关与回归分析第一节、变量之间的相关分析【本节考点】1、 相关关系分类2、 两变量的散点图3、 相关系数的定义和计算以及取值的含义【本节内容】一、变量之间的相关关系分类标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。如价格不变的条件下,某种商品的销售总额由其销售量决定。不完全相关介于完全相关和不相关之间。大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。如股票的价格与气温的高低。相关的方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(

44、两个变量同方向变化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)相关的形式线性相关两个相关变量之间的关系大致呈现为线性关系。非线性相关两个相关变量之间的关系不表现直线的关系,而近似于某种曲线方程的关系。【注】相关关系并不等于因果关系。【例题1:单选】工人的工资随着劳动生产率的提高而增加,工资与劳动生产率存在()关系。A正相关B不确定C不相关D负相关【答案】A【解析】两个变量同向变化,应为正相关。【例题2:多选】按相关的方向,相关关系可以分为()A完全相关B不完全相关C正相关D负相关E不相关【答案】CD二、两变量的散点图两变量之间的关系可以用散点图来展示,在散点图中,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值。三、相关系数的定义和取值1、定义相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。2、计算:【注】相关系数的取值范围在【-1,1】之间,即-1r+1,pearson相关系数只适用线性相

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁