《经典正态线性回归模型课件.ppt》由会员分享,可在线阅读,更多相关《经典正态线性回归模型课件.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、经典正态线性回归模型第1页,此课件共54页哦第2页,此课件共54页哦第3页,此课件共54页哦暨南大学经济学院统计系 陈文静4第4页,此课件共54页哦第5页,此课件共54页哦第6页,此课件共54页哦暨南大学经济学院统计系 陈文静7误差项正态性假定一个注释o1 误差项被认为是许多次要影响因素的和,随着这些次要影响因素的数量变大,误差项的分布倾向于接近正态分布。o2 只有在误差项服从正态分布(或者样本非常大)时,后面将要介绍的t统计量和F统计量才有应用价值。第7页,此课件共54页哦采用正态分布假定的理由第8页,此课件共54页哦第9页,此课件共54页哦暨南大学经济学院统计系 陈文静10 中心极限定理中
2、心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2 2的的一一个个任任任任意意意意总总总总体体体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似似服服从从均均值值为为,方方差差为为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x第10页,此课件共54页哦暨南大学经济学院统计系 陈文静11中心极限定理(central limit th
3、eorem)x x 的的分分布布趋趋于于正正态态分分布布的的过程过程第11页,此课件共54页哦暨南大学经济学院统计系 陈文静12采用正态分布假定的理由续o 2.中心极限理论还说明,即使变量的个数不是很多,或变量不是严格独立,但其和也可视作(或近似于)正态变量。o3、正态分布的一个性质是,正态分布变量的任何线性函数都是正态分布的。o4、正态分布仅设计两个参数:均值和方差,而且许多现象都服从正态分布。o5、小样本时,正态性假定起到了关键性作用,有助于我们推导出OLS估计量的精确概率分布,进一步进行假设检验。第12页,此课件共54页哦暨南大学经济学院统计系 陈文静134.3 在正态性假定下OLS估计
4、量的性质第13页,此课件共54页哦暨南大学经济学院统计系 陈文静141 无偏性(unbiasedness)第14页,此课件共54页哦第15页,此课件共54页哦2 有效性(efficiency)第16页,此课件共54页哦AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()第17页,此课件共54页哦暨南大学经济学院统计系 陈文静183 一致性(consistency)第18页,此课件共54页哦暨南大学经济学院统计系 陈文静19AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()第
5、19页,此课件共54页哦第20页,此课件共54页哦oOLS估计量的值是根据样本数据利用公式计算得出的。对于一个给定的总体,由于研究者通常仅有一个样本,因此,计量经济学的初学者常常假定回归分析只能产生的一个估计值。然而,事实上,来自于相同总体的不同样本都会产生不同的来自于相同总体的不同样本都会产生不同的估计值估计值。所有可能的样本集有一个相同的分布,该分布具有均值和方差。尽管在大多数实际应用中,我们面对的是从总体抽取的唯一样本,但我们仍需要讨论的抽样分布性质。务必记住,抽样务必记住,抽样分布是指不同值的分布,这些值来自不同的分布是指不同值的分布,这些值来自不同的样本,而不是同一样本。样本,而不是
6、同一样本。因为误差项的正态分布同样意味着的OLS估计量也是正态分布,所以这些被假定为正态分布。第21页,此课件共54页哦第22页,此课件共54页哦暨南大学经济学院统计系 陈文静23正态性假定下OLS估计量的性质(续)第23页,此课件共54页哦第24页,此课件共54页哦第25页,此课件共54页哦第26页,此课件共54页哦暨南大学经济学院统计系 陈文静274.5.正态分布或由正态分布所派生的分布正态分布或由正态分布所派生的分布第27页,此课件共54页哦暨南大学经济学院统计系 陈文静28 概率密度函数(probability density function)1.设X为一连续型随机变量,x 为任意实
7、数,X的概率密度函数记为f(x),它满足条件2.f(x)不是概率第28页,此课件共54页哦暨南大学经济学院统计系 陈文静29概率密度函数 密度函数 f(x)表示X 的所有取值 x 及其频数f(x)值值(值值,频数频数)频数频数f(x)abx第29页,此课件共54页哦暨南大学经济学院统计系 陈文静30概率密度函数在平面直角坐标系中画出f(x)的图形,则对于任何实数 a b,P(a X b)是该曲线下从a 到 b的面积f(x)xab在连续分布条件下,曲线下的面积表示概率第30页,此课件共54页哦暨南大学经济学院统计系 陈文静31 分布函数(distribution function)1.连续型随机
8、变量的概率也可以用分布函数F(x)来表示,分布函数定义为:2、根据分布函数,P(aXb)可以写为第31页,此课件共54页哦暨南大学经济学院统计系 陈文静32分布函数与密度函数的图示1.密度函数曲线下的面积等于12.分布函数是曲线下小于 x0 的面积f(x)xx0F F(x x0 0 )第32页,此课件共54页哦暨南大学经济学院统计系 陈文静33连续型随机变量的期望和方差1.连续型随机变量的数学期望2.方差第33页,此课件共54页哦暨南大学经济学院统计系 陈文静34 正态分布(normal distribution)1.由C.F.高斯(Carl Friedrich Gauss,17771855)
9、作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3.许多现象都可以由正态分布来描述 4 经典统计推断的基础x xf f(x x)第34页,此课件共54页哦概率密度函数f(x)=随机变量 X 的密度函数 =正态随机变量X的均值=正态随机变量X的方差 =3.1415926;e=2.71828x=随机变量的取值(-x )第35页,此课件共54页哦暨南大学经济学院统计系 陈文静36正态分布函数的性质3 均值和标准差一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”第36页,此课件共54页哦暨南大学经济学院统计系 陈文静374.均值决定正态分布曲线的
10、中心位置,称为位置参数;标准差决定曲线的“陡峭”或“扁平”程度。越大,正态曲线扁平;越小,正态曲线越陡峭5.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交,当x趋于无穷时,曲线以x轴为其渐近线。6.正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1 正态分布函数的性质第37页,此课件共54页哦暨南大学经济学院统计系 陈文静38 和 对正态曲线的影响xf(x)CAB =1/2=1/2 1 1 1 1 2 2 2 2 =1 =1 第38页,此课件共54页哦暨南大学经济学院统计系 陈文静39正态分布的概率概率是曲线下的面积面积!abx
11、f(x)第39页,此课件共54页哦暨南大学经济学院统计系 陈文静40 标准正态分布(standardize the normal distribution)标准正态分布标准正态分布的概率密度函数标准正态分布的分布函数的分布函数第40页,此课件共54页哦暨南大学经济学院统计系 陈文静41 标准正态分布(standardize the normal distribution)1.一般的正态分布取决于均值和标准差 2.计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表4.任何一个一般的正态分布,可通过下面的线
12、性变换转化为标准正态分布第41页,此课件共54页哦暨南大学经济学院统计系 陈文静42标准正态分布X X 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 1 1Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 第42页,此课件共54页哦暨南大学经济学院统计系 陈文静43第43页,此课件共54页哦暨南大学经济学院统计系 陈文静44由正态分布导出的几个重要分布第44页,此课件共54页哦c2分布(图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n
13、=4=4n n=10=10n n=20=20第45页,此课件共54页哦暨南大学经济学院统计系 陈文静462分布(2 distribution)第46页,此课件共54页哦暨南大学经济学院统计系 陈文静472分布(性质)第47页,此课件共54页哦暨南大学经济学院统计系 陈文静48 t分布第48页,此课件共54页哦暨南大学经济学院统计系 陈文静49第49页,此课件共54页哦暨南大学经济学院统计系 陈文静50第50页,此课件共54页哦第51页,此课件共54页哦暨南大学经济学院统计系 陈文静521.由统计学家费雪(R.A.Fisher)提出的,以其姓氏的第一个字母来命名则2.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 o称F为服从自由度n1和n2的F分布,记为 F分布(F distribution)第52页,此课件共54页哦第53页,此课件共54页哦暨南大学经济学院统计系 陈文静54F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)第54页,此课件共54页哦