第二章-基本统计概念的回顾.ppt

上传人:得****1 文档编号:79213923 上传时间:2023-03-20 格式:PPT 页数:42 大小:668.50KB
返回 下载 相关 举报
第二章-基本统计概念的回顾.ppt_第1页
第1页 / 共42页
第二章-基本统计概念的回顾.ppt_第2页
第2页 / 共42页
点击查看更多>>
资源描述

《第二章-基本统计概念的回顾.ppt》由会员分享,可在线阅读,更多相关《第二章-基本统计概念的回顾.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第二章第二章 基本统计概念的回顾基本统计概念的回顾主要内容2.1 随机试验随机试验2.2 随机变量随机变量2.3 总体的的数字特征总体的的数字特征2.4 样本分布的数字特征样本分布的数字特征2.1 随机试验随机试验p随机试验:指至少有两个可能结果,但不确定哪一个结果随机试验:指至少有两个可能结果,但不确定哪一个结果会出现的过程会出现的过程p总体:随机试验所有可能的集合称为总体(总体:随机试验所有可能的集合称为总体(population)或样或样本空间本空间 例子:在一种双回合游戏中,例子:在一种双回合游戏中,O1表示两个回合全部获胜;表示两个回合全部获胜;O2表示第一个回合获胜,第二个回合失败

2、;表示第一个回合获胜,第二个回合失败;O3表示第一个表示第一个回合失败,第二个回合获胜;回合失败,第二个回合获胜;O4表示两个回合全部失败。表示两个回合全部失败。样本空间有样本空间有4种结果组成:种结果组成:O1,O2,O3,O4p样本点:样本空间(或总体)的每一元素,即每一种结果样本点:样本空间(或总体)的每一元素,即每一种结果成为样本点成为样本点2.1 随机试验随机试验p随机试验的可能结果组成的集合称为事件,它是样本随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集空间的一个子集p如果两个事件不能同时发生,则两个事件称为是互斥如果两个事件不能同时发生,则两个事件称为是互斥的的p如

3、果一个事件的发生与另一个事件的发生的可能性相如果一个事件的发生与另一个事件的发生的可能性相同,则两个事件称为等可能性的。例如抛一枚硬币,同,则两个事件称为等可能性的。例如抛一枚硬币,正面朝上和正面朝下是等可能出现的正面朝上和正面朝下是等可能出现的2.2 随机变量随机变量一、概率分布一、概率分布p 引入一个随机变量来描述总体,随机变量是取值具有引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型随机性的变量,按取值情况可以分为离散型和连续型两种类型。两种类型。p 样本就是样本就是n个相互独立的与总体具有相同分布的随机变个相互独立的与总体具有相同分布的随机变

4、量量x1,xn,即,即n元随机变量。随机试验的可能结果元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集组成的集合称为事件,它是样本空间的一个子集p 总体与样本间的联系在于具有相同的分布总体与样本间的联系在于具有相同的分布2.2 随机变量随机变量一、概率分布一、概率分布p 引入一个随机变量来描述总体,随机变量是取值具有引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型随机性的变量,按取值情况可以分为离散型和连续型两种类型。两种类型。p 样本就是样本就是n个相互独立的与总体具有相同分布的随机变个相互独立的与总体具有相同分布的随机变量

5、量x1,xn,即,即n元随机变量。随机试验的可能结果元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集组成的集合称为事件,它是样本空间的一个子集p 总体与样本间的联系在于具有相同的分布总体与样本间的联系在于具有相同的分布2.2 随机变量随机变量2、概率分布的含义和性质、概率分布的含义和性质p随机变量随机变量X取各个值的概率称为取各个值的概率称为X的概率分布。对一个离散的概率分布。对一个离散型随机变量型随机变量X可以给出如下的概率分布:可以给出如下的概率分布:P(X=xi)=pip对于随机变量对于随机变量X(无论连续还是离散)可以确定实值函数(无论连续还是离散)可以确定实值

6、函数F(x),称为累积分布函数(,称为累积分布函数(cumulative distribution function,CDF),定义如下定义如下F(x)P(Xx)p概率分布性质概率分布性质(1)取值范围)取值范围(2)若)若A,B,C,为互斥事件,则有为互斥事件,则有P(A+B+C+)P(A)P(B)P(C)对于任意事件对于任意事件A,B则有则有P(A+B)P(A)P(B)P(AB)(3)若)若A,B,C,为互斥事件,且为一完备事件组,则为互斥事件,且为一完备事件组,则P(A+B+C+)P(A)P(B)P(C)=1(4)事件事件A,B,C,称为相互独立的事件,如果有称为相互独立的事件,如果有P

7、(ABC)P(A)P(B)P(C)(5)条件概率条件概率P(A|B)=P(AB)/P(B)2.2 随机变量随机变量举例:举例:国际贸易专业有国际贸易专业有200名学生,其中男生名学生,其中男生120人,女生人,女生80人,人,在这些学生中,在这些学生中,40名男生和名男生和24名女生计划选学计量经济名女生计划选学计量经济学,若随机抽取一人,发现这个学生计划选学计量经济学,若随机抽取一人,发现这个学生计划选学计量经济学。那么这个学生是男生的概率是多少?学。那么这个学生是男生的概率是多少?3、连续型随机变量的分布函数及概率密度函数、连续型随机变量的分布函数及概率密度函数p对于连续型随机变量,取任何

8、特定数值的概率为对于连续型随机变量,取任何特定数值的概率为0。p设设F(x)是随机变量是随机变量X的分布函数,如果对任意实数的分布函数,如果对任意实数x,存,存在非负函数在非负函数f(x)0,使使 就称就称f(x)0为为X的概率密度函数的概率密度函数(PDF),且,且f(x)具有性质具有性质2.2 随机变量随机变量4、多元随机变量的概率密度函数、多元随机变量的概率密度函数p联合概率密度函数联合概率密度函数f(X,Y)=P(X=x,Y=y)。p边缘概率密度函数边缘概率密度函数f(X),f(Y)。p条件概率密度函数条件概率密度函数pf(X|Y)=P(X=x|Y=y)p条件概率密度函数条件概率密度函

9、数f(X|Y)f(X,Y)/f(Y)p独立随机变量独立随机变量 如果如果f(X,Y)f(X)f(Y),则称变量,则称变量X和和Y是统计独立的是统计独立的2.2 随机变量随机变量5、随机变量函数、随机变量函数p 设设f(x)是定义在随机变量是定义在随机变量X的一切可能取值集合上的函数。的一切可能取值集合上的函数。如果对于如果对于X的每一个可能值的每一个可能值x,都有另一个随机变量都有另一个随机变量Y的取值的取值y=f(x)与之相对应,则称与之相对应,则称Y为为X的函数,记作的函数,记作Y=f(X)。p常常遇到一些随机变量,它们的分布往往难于直接得到常常遇到一些随机变量,它们的分布往往难于直接得到

10、(例如滚珠体积的测量值等),但与它们有关系的另一个(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。随机变量的分布。其间的关系通常用函数关系表示。2.2 随机变量随机变量2.3 对总体的描述:随机变量的数字特征对总体的描述:随机变量的数字特征p 数学

11、期望数学期望p 方差方差p 数学期望与方差的图示数学期望与方差的图示p 相关系数与协方差相关系数与协方差p 偏度和峰度偏度和峰度一、数学期望(集中趋势的度量)一、数学期望(集中趋势的度量)1、离散型随机变量数学期望的定义离散型随机变量数学期望的定义p 假定有一个离散型随机变量假定有一个离散型随机变量X有有n个不同的可能取值个不同的可能取值x1,x2,xn,而,而p1,p2,pn是是X取这些值相应的概率,取这些值相应的概率,则这个随机变量则这个随机变量X的数学期望定义如下:的数学期望定义如下:p数学期望描述的是随机变量(总体)的一般水平数学期望描述的是随机变量(总体)的一般水平2、连续型随机变量

12、数学期望的定义连续型随机变量数学期望的定义p 若连续型随机变量若连续型随机变量X有分布密度函数有分布密度函数f(x),而积分,而积分 绝对收敛,则称绝对收敛,则称 为为X的数学的数学期望。期望。p数学期望是最容易发生的,因而是可以期待的。它反数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。映数据集中的趋势。一、数学期望(集中趋势的度量)一、数学期望(集中趋势的度量)求离散型随机变量数学期望举例求离散型随机变量数学期望举例例例1 甲、乙两射手在一次射击中的得分(分别用甲、乙两射手在一次射击中的得分(分别用X、Y表示)表示)的分布率如下:的分布率如下:试比较两射手的射击技术水平,并

13、计算如果二人各发一弹,试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。他们得分和的估计值。解解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为因为EXEY,所以乙射手射击水所以乙射手射击水平比较高;二人各发一弹,得分总和最可能在平比较高;二人各发一弹,得分总和最可能在4.3分左右分左右(即(即4分或分或5分)分)例例2:3、数学期望的性质、数学期望的性质(1)如果)如果a、b为常数,则为常数,则 E(aX+b)=aE(X)+b(2)如果如果X、Y为两个随机变量,则为两个随机变

14、量,则 E(X+Y)=E(X)+E(Y)(3)如果如果g(x)和和f(x)分别为分别为X的两个函数,则的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果如果X、Y是两个独立的随机变量,则是两个独立的随机变量,则 E(X.Y)=E(X).E(Y)4、条件期望、条件期望w条件期望值的定义:w对于连续型随机变量的条件期望只要把加总符号换成积分号即可。w几个重要性质几个重要性质(1)一般地(2)(3)重期望律:例:已知例:已知 ,则则 二、方差:离散程度的度量二、方差:离散程度的度量1、随机变量方差的定义、随机变量方差的定义若X为连续型随机变量,则X的方差以下式给出 随机变量的方差

15、记作Var(x)。方差的算术平方根叫标准差。2、方差的性质、方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则为相互独立的随机变量,则 Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,为常数,x,y为两个相互独立的随机变量,则为两个相互独立的随机变量,则Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2例例3 计算本节例计算本节例1中甲射手的方差中甲射手的方差w例1 甲、乙两射手

16、在一次射击中的得分(分别用X、Y表示)的分布率如下:E(X)=2.1 Var(X)=(-1.1)2 0.4+(-0.1)2 0.1+0.92 0.5 =0.89三、数学期望与方差的图示三、数学期望与方差的图示w数学期望描述随机变量的集中程度,方差描述随机变数学期望描述随机变量的集中程度,方差描述随机变量的离散程度。量的离散程度。1 方差同、期望变大方差同、期望变大 2 期望同、方差变小期望同、方差变小51055四、相关系数与协方差四、相关系数与协方差w协方差和相关系数都是描述两个随机变量相互关联程协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。度的参数或统计量。w方差是度量一个

17、随机变量变异程度的指标,而协方差方差是度量一个随机变量变异程度的指标,而协方差则是度量两个随机变量协同变动的指标。要度量两个则是度量两个随机变量协同变动的指标。要度量两个随机变量随机变量之间之间的关系,自然要考察两个变量同时变化的关系,自然要考察两个变量同时变化协同变化的情况,于是需要定义协方差。为了弥协同变化的情况,于是需要定义协方差。为了弥补协方差的不足补协方差的不足受计量单位和数量尺度的影响,受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的指标进而定义了度量两个随机变量呈线性相关程度的指标相关系数。相关系数。1、协方差、协方差(1)定义:令随机变量)定义:令随机变量

18、X和和Y的期望分别为的期望分别为E(x),E(y),其其协方差为协方差为:cov(X,Y)=E(X-E(x)(Y-E(y)=E(XY)-E(X)E(Y)一般而言,两随机变量的协方差可正可负。若两变量一般而言,两随机变量的协方差可正可负。若两变量同方向变动,则协方差为正,反之则为负。同方向变动,则协方差为正,反之则为负。(2)协方差的性质协方差的性质(1)若随机变量X,Y相互独立,则其协方差为0。(2)cov(a+bX,c+dY)=bdcov(X,Y)(3)cov(X,X)=var(X)(3)相关变量的方差相关变量的方差 若随机变量不是独立的,对于X+Y或X-Y的方差为:Var(X+Y)=var

19、(X)+var(Y)+2cov(X,Y)Var(X-Y)=var(X)+var(Y)-2cov(X,Y)(4)若E(y|x)=E(y),则Cov(x,y)=0 证明:利用重期望律2、相关系数、相关系数w相关系数用相关系数用 表示,其计算公式为:表示,其计算公式为:w从公式可看出两变量的相关系数等于它们的协方差与从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。其各自的标准差之比。w相关系数介于相关系数介于-1-1到到1 1之间。之间。w相关系数的典型图形见相关系数的典型图形见P P3131五、偏度五、偏度(skewness)与峰度与峰度(kurtosis)w用于描述概率密度函数

20、形状的数字特征。偏度(S)是对称性的度量;峰度(K)是概率密度函数高低或胖瘦的度量1、偏度(、偏度(S)的计算)的计算 对于正态分布,S0;若偏度S的值为正,则其概率密度为正偏或右偏,分布函数有长的右尾;若S的值为负,则其概率密度为负偏或左偏,分布函数有长的左尾。2、峰度(、峰度(K)的计算的计算 概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长尾的)。对于正态分布的峰度为3,称为常峰态的。五、偏度五、偏度(skewness)与峰度与峰度(kurtosis)2.4 样本分布的数字特征一、样本平均数一、样本平均数w总体的数字特征是一个固定不变的数

21、,称为参数;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。w样本平均数的定义样本平均数的定义:对于样本x1,x2,,xn,则样本平均数为w样本平均数用来描述样本的平均水平(一般水平)。二、样本方差和标准差二、样本方差和标准差1、定义:、定义:对于样本x1,x2,,xn,则称分别为样本方差和标准差。2、样本序列的正态性检验、样本序列的正态性检验偏度:峰度:检验样本序列的正态性可采用检验样本序列的正态性可采用Jarque-Bera检验。该检验检验。该检验的零假设是样本服从正态分布,检验统计量为的零假设是样本服从正态分布,检验统计量为 其中其中m是产生样本序列时用到的估计系数的个数。

22、在零是产生样本序列时用到的估计系数的个数。在零假设下假设下JB统计量服从统计量服从2(2)分布。若为原始数据则分布。若为原始数据则m=0;若序列是通过模型估计得到的,若序列是通过模型估计得到的,m为估计的参数个数。为估计的参数个数。2、样本序列的正态性检验、样本序列的正态性检验检验的显著性水平检验的显著性水平 虚拟假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的虚拟假设,即第类错误;第 类错误是指H0实际上是错误的,但没有拒绝它。检验的显著性水平(significance level)则定义为第类错误的概率,用符号表示为:P(拒绝H0|H0)即当H0为真时拒绝H0的概率

23、。检验的检验的p值值 检验的p值(p-value)是指给定t统计量的观测值,能拒绝虚拟假设的最小显著性水平。小的p值是拒绝虚拟假设的证据。检验的显著性水平和p值 例如:例如:样本序列取2002年我国30个地区以1978年为基衡量的实际人均GDP,采用Eviews软件计算有 S2.32 K=8.53 JB=65.29 p-value=0.00 则2002年各地区人均GDP呈现右偏、尖峰的分布形态,并且在99%的置信水平下拒绝零假设,即序列不服从正态分布。三、样本协方差三、样本协方差 1、协方差的定义式、协方差的定义式若样本容量足够大,可用pij=1/n,那么2协方差的缺陷协方差的缺陷(1)协方差

24、是一个有单位的指标。例如,)协方差是一个有单位的指标。例如,Y为身高(厘米),为身高(厘米),X为体重(千克),那么它们的协方差为体重(千克),那么它们的协方差COV(Y,X)的单的单位为厘米位为厘米.千克。所以不便于用作相互比较。千克。所以不便于用作相互比较。(2)协方差受数据尺度的影响。例如,)协方差受数据尺度的影响。例如,Y为身高(毫米),为身高(毫米),X为体重(克),那么它们的协方差为体重(克),那么它们的协方差COV(Y,X)的单位为的单位为毫米毫米.克。同一组数据计算出来的协方差,(克。同一组数据计算出来的协方差,(2)比()比(1)大)大了了10倍。因此,也不便于用作相互比较。倍。因此,也不便于用作相互比较。于是,需要引入一个度量两个随机变量之间线性关系的指标于是,需要引入一个度量两个随机变量之间线性关系的指标相关系数,以克服单位与尺度的影响。相关系数,以克服单位与尺度的影响。四、样本相关系数四、样本相关系数1、相关系数的定义、相关系数的定义2根据相关系数初步判定变量之间的关系根据相关系数初步判定变量之间的关系正相关:正相关:Y为我国人均消费,为我国人均消费,X为我国人均国民收入,相为我国人均国民收入,相关系数:关系数:0.98精品课件精品课件!精品课件精品课件!负相关负相关Y与与X的相关,系数:的相关,系数:-0.92

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁