《几种统计分析模型介绍精选PPT.ppt》由会员分享,可在线阅读,更多相关《几种统计分析模型介绍精选PPT.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、几种统计分析模型介绍第1页,此课件共53页哦n n张业圳n n福建师范大学经济学院副教授、博士、财金系副福建师范大学经济学院副教授、博士、财金系副主任主任n n主要教学研究方向:数量经济学与金融实证分析主要教学研究方向:数量经济学与金融实证分析n n联系电话:联系电话:8736908713609525129n n Email:n n Q Q:107345901n n地址:福建师范大学经济学院邮编:地址:福建师范大学经济学院邮编:350108第2页,此课件共53页哦经济统计分析经济统计分析 统计学研究如何测定、收集、整理、归纳和分析统计学研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的
2、数据,以便给出正确认识的反映客观现象总体数量的数据,以便给出正确认识的方法论科学。方法论科学。经济统计分析就是用统计方法来分析经济现象数量特经济统计分析就是用统计方法来分析经济现象数量特征和经济变量之间的关系。主要的工作有:征和经济变量之间的关系。主要的工作有:1)分析经济现象中变量之间相互关系)分析经济现象中变量之间相互关系2)经济预测)经济预测3)政策评价)政策评价第3页,此课件共53页哦什么是经济统计分析模型什么是经济统计分析模型模型模型 对现实的描述和模拟。对现实的描述和模拟。用不同方法对现实进行描述和用不同方法对现实进行描述和模拟,就构成不同的模型。语义模型、物理模型、几何模拟,就构
3、成不同的模型。语义模型、物理模型、几何模型、数学模型和计算机模拟模型。模型、数学模型和计算机模拟模型。经济数学模型经济数学模型:用数学方法描述经济活动。采用的数学方:用数学方法描述经济活动。采用的数学方法不同,对经济活动提示的程度不同,构成各类不同的经法不同,对经济活动提示的程度不同,构成各类不同的经济数学模型。济数学模型。数理经济模型数理经济模型计量经济学模型计量经济学模型 第4页,此课件共53页哦本次培训主要模型1、聚类分析2、回归分析3)因子分析和主成分分析4)时间序列分析第5页,此课件共53页哦第一部分:预备知识第一部分:预备知识第6页,此课件共53页哦样本与统计量样本与统计量 总体与
4、样本总体与样本 在数理统计中,把研究对象的全体称为在数理统计中,把研究对象的全体称为总体总体(population)或母体或母体,而把组成总体的每个单元,而把组成总体的每个单元称为称为个体个体。抽样抽样 要要了了解解总总体体的的分分布布规规律律,在在统统计计分分析析工工作作中中,往往往往是是从从总总体体中中抽抽取取一一部部分分个个体体进进行行观观测测,这这个个过过程程称称为为抽抽样样。第7页,此课件共53页哦样本与统计量样本与统计量 子样子样 子子样样 是是n个个随随机机变变量量,抽抽取取之之后后的的观观测测数数据据 称称为为样样本本值值或或子子样样观观察察值值。在在抽抽取取过过程程中中,每每
5、抽抽取取一一个个个个体体,就就是是对对总总体体X进进行行一一次次随随机机试试验验,每每次次抽抽取取的的n个个个个体体 ,称称为为总总体体X的的一一个个容容量量为为n的的样样本本(sample)或或子子样样;其其中中样样本本中中所所包包含含的的个个体体数数量量称称为为样样本本容容量量。第8页,此课件共53页哦随机抽样方法的基本要求随机抽样方法的基本要求 独立性独立性即每次抽样的结果既不影响其余各次抽样的即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。结果,也不受其它各次抽样结果的影响。满足上述两点要求的子样称为满足上述两点要求的子样称为简单随机子样简单随机子样.获得简
6、获得简单随机子样的抽样方法叫单随机子样的抽样方法叫简单随机抽样简单随机抽样.从简单随机子样的含义可知,从简单随机子样的含义可知,样本样本 是来自总体是来自总体 、与总体、与总体 具有相同分布的随机变量具有相同分布的随机变量.代表性代表性即子样即子样()的每个分量的每个分量 与总体与总体 具有具有相同的概率分布相同的概率分布。第9页,此课件共53页哦简单随机抽样简单随机抽样 例如例如:要通过随机抽样了解一批产品的次品率,:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。这是一个简单随机抽样。但实
7、际抽样中,往往是不再放回产品,则这不是一个简但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量单随机抽样。但当总量N很大时,很大时,可近似看成可近似看成是简单是简单随机抽样。随机抽样。例如例如:为了分析福建省居民家庭收入状况,对福建:为了分析福建省居民家庭收入状况,对福建省居民家庭收入进行调查。省居民家庭收入进行调查。第10页,此课件共53页哦统计量统计量 则则 例如例如:设设 是从正态总体是从正态总体 中抽取中抽取的一个样本,其中的一个样本,其中 为已知参数为已知参数,为未知参数,为未知参数,是统计量是统计量 不是统计量不是统计量 定义定义 设(设()为总体)为总体X的一个
8、样本,的一个样本,为为不含任何未知参数不含任何未知参数的的连续函数连续函数,则,则称称 为样本(为样本()的一个统计量。)的一个统计量。第11页,此课件共53页哦几个常用的统计量几个常用的统计量 样本均值样本均值(sample mean)设设 是总体是总体 的一个样本,的一个样本,样本方差样本方差(sample variance)第12页,此课件共53页哦样本均方差或标准差样本均方差或标准差 它们的观测值用相应的小写字母表示它们的观测值用相应的小写字母表示.反映总体反映总体X取值的取值的平均平均,或反映,或反映总体总体X取值的离散程度取值的离散程度。几个常用的统计量几个常用的统计量 设设 是总
9、体是总体 的一个样本,的一个样本,第13页,此课件共53页哦子样的子样的K阶(原点)矩阶(原点)矩几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,子样的子样的K阶中心矩阶中心矩第14页,此课件共53页哦它包括两个方面它包括两个方面数据整理数据整理 计算样本特征数计算样本特征数数据的简单处理数据的简单处理 为了研究随机现象,首要的工作是收集原始数据为了研究随机现象,首要的工作是收集原始数据.一般一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。通过整理后才能显示出它们的分布状况
10、。数据的简单处理是以一种直观明了方式加工数据。数据的简单处理是以一种直观明了方式加工数据。第15页,此课件共53页哦计算样本特征数计算样本特征数:数据的简单处理数据的简单处理 数据整理数据整理:将数据分组:将数据分组 计算各组频数计算各组频数 作频率分布表作频率分布表 作频率直方图作频率直方图(1)反映趋势的特征数)反映趋势的特征数 样本均值样本均值中位数中位数:数据按大小顺序排列后,位置居中的那个数:数据按大小顺序排列后,位置居中的那个数 或居中的两个数的平均数。或居中的两个数的平均数。众数众数:样本中出现最多的那个数。:样本中出现最多的那个数。第16页,此课件共53页哦数据的简单处理数据的
11、简单处理 (2)反映分散程度的特征数:极差、四分位差)反映分散程度的特征数:极差、四分位差 极差极差样本数据中最大值与最小值之差,样本数据中最大值与最小值之差,四分位数四分位数将样本数据依概率分为四等份的将样本数据依概率分为四等份的3个数椐,个数椐,依次称为第一、第二、第三四分位数。依次称为第一、第二、第三四分位数。第一四分位数第一四分位数Q1:第二四分位数第二四分位数Q2:第三四分位数第三四分位数Q3:第17页,此课件共53页哦第二部分:参数估计第二部分:参数估计第18页,此课件共53页哦第一节 参数的点估计 一、点估计问题设总体X 的分布函数的形式为已知的F(x,),其中x 是自变量,为未
12、知参数(它可以是一个数,也可以是一个向量)借助于总体X 的一个样本(X1,X2,Xn),来估计未知参数的值的问题,称为参数的点估计问题点估计的问题就是要构造一个适当的统计量(X1,X2,Xn),用样本的一组观察值(x1,x2,xn),得到的观察值(x1,x2,xn),以此来估计未知参数称统计量(X1,X2,Xn)为的估计量,称(x1,x2,xn)为的估计值第19页,此课件共53页哦二、矩估计法的函数,记作l=l()即,l=1,2,,k设总体 X 的分布函数为 ,其中为k 个未知参数.假设总体X 的各阶原点矩存在,则E(X l)是对于总体X 的样本(X1,X2,Xn),样本的l 阶原点矩为,l=
13、1,2,,k令l=Al,l=1,2,,k,第20页,此课件共53页哦即从上述方程组中解出,分别记作以此作为未知参数的估计量,称为矩估计量第21页,此课件共53页哦如果样本观察值为(x1,x2,xn),则得未知参数的矩估计值为上述估计未知参数的方法就叫做矩估计法第22页,此课件共53页哦解此方程组得到与的矩估计量为令即解例1设总体X 的均值为,方差为,且,但与均未知,又设总体X 的一个样本为(X1,X2,Xn),求与的矩估计量第23页,此课件共53页哦解由例4可得例2某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽取12只,测得头部直径(单位:mm)如下:13.3013.3813.40
14、13.4313.3213.4813.5413.3113.3413.4713.4413.50设铆钉头部直径这一总体X 服从正态分布,试求与的矩估计值注此例说明,无论总体X 服从什么分布,样本均值都是总体均值的矩估计量,样本二阶中心矩就是总体方差的矩估计量第24页,此课件共53页哦三、极大似然估计法1设总体X为离散型随机变量,其分布律为其中为未知参数,取值范围为设X1,X2,Xn为来自 X 的样本,则 X1,X2,Xn 的联合分布律为 又设x1,x2,xn为一组样本值,令称L()为样本的似然函数(1)若有,使得对一切,有成立,则称为的极大(或最大)似然估计值,相应的统计量称为的极大(或最大)似然估
15、计量第25页,此课件共53页哦我们规定,使得的就是的极大似然估计值由于ln x是单增函数,所以 与有相同的驻点,因此只需从中解出就是的极大似然估计值,称方程(2)(2)为极大似然方程第26页,此课件共53页哦例3设总体,与未知,(X1,X2,Xn)为总体X 的样本,求与的极大似然估计量解X 的概率密度为设x1,x2,xn 为样本值,似然函数为第27页,此课件共53页哦令解得与的极大似然估计值为因此,与的极大似然估计量为第28页,此课件共53页哦四、估计量的评选标准1无偏性估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同而对同一估计量,由不同的样本观察值得到参数的
16、估计值也可能不同我们很自然地要求估计量的期望等于参数的真值,即无偏性定义设是未知参数的估计量,若,则称为的无偏估计(量)第29页,此课件共53页哦例4设总体X 的均值为,(X1,X2,X3)是总体X 的样本,证明下列两个估计量都是的无偏估计证由于所以与都是的无编估计(只需k1+k2+kn=1,则=k1X1+k2X2+kn Xn 就是的无偏估计)第30页,此课件共53页哦设为参数的估计量,若当时,按概率收敛于,即对于任意正数,有,则称为的一致估计(量)3一致性根据大数定律可知,样本均值是总体均值的一致估计量设与是参数的两个无偏估计量,若,则称比有效.2有效性第31页,此课件共53页哦第二节 参数
17、的区间估计点估计是通过构造统计量(X1,X2,Xn)来对总体X 中的未知参数进行估计,由一个样本值(x1,x2,xn)可得到的估计值(x1,x2,xn)这种估计值是无法知道误差的我们要定出一个范围,并要求以一定的概率保证这个范围包含着的真值这个范围通常以区间的形式给出,我们把这个区间称为置信区间定义设总体X 的分布中含有一个未知参数,(X1,X2,Xn)是来自总体X 的一个样本如果对于给定的常数,统计量1=1(X1,X2,Xn)与2=2(X1,X2,Xn)满足(1)则称随机区间(1,2)是的置信度为的置信区间,分别称1与2为的置信下限与置信上限第32页,此课件共53页哦例1设总体,为已知,未知
18、,(X1,X2,Xn)为来自总体X 的一个样本,求的置信度为的置信区间解由于是的无偏估计,且有由正态分布表可查得,使1称为置信度或置信水平(1)式的含义是,随机区间(1,2)以的概率包含着,也就是说,对每一个样本值(x1,x2,xn)可求得一个具体的区间(1(x1,x2,xn),2(x1,x2,xn)在这些众多的区间中,包含的有100()%个,不包含的有100%个第33页,此课件共53页哦即有取,于是得到的置信度为的置信区间为第34页,此课件共53页哦求未知参数的置信区间的一般方法:1对于给定的样本X1,X2,Xn,构造样本函数,它包含待估参数,而不含其它未知参数,并且Z 的分布已知,在Z 的
19、分布中不依赖任何未知参数2对于给定的置信度,定出两个常数a,b(一般地,按Z 所服从的分布的上分位点来确定),使3从a Z(X1,X2,Xn)b 得到等价的不等式1(X1,X2,Xn)68引例2中的备择假设是双侧的如果根据以往的生产情况,0=68现采用了新工艺,关心的是新工艺能否提高螺钉强度,越大越好此时,可作如下的假设检验:第48页,此课件共53页哦当原假设H0:=0=68为真时,取较大值的概率较小当备择假设H1:68为真时,取较大值的概率较大给定显著性水平,根据可确定拒绝域第49页,此课件共53页哦因而,接受域称这种检验为右边检验备择假设H1:68另外,可设原假设H0:68;若原假设正确,
20、则第50页,此课件共53页哦但现不知 的真值,只知 0=68 小概率事件故取拒绝域显著性水平不超过第51页,此课件共53页哦注注3 3关于零假设与备择假设的选取H0与H1地位应平等,但在控制犯第一类错误的概率的原则下,使得采取拒绝H0的决策变得较慎重,即H0得到特别的保护因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误第52页,此课件共53页哦假设检验步骤假设检验步骤(三部曲三部曲)其中根据实际问题所关心的内容,建立H0与H1在H0为真时,选择合适的统计量V,由H1确定拒给定显著性水平,其对应的拒绝域双侧检验左边检验绝域形式根据样本值计算,并作出相应的判断右边检验qqq第53页,此课件共53页哦