《概率与统计基础精选课件.ppt》由会员分享,可在线阅读,更多相关《概率与统计基础精选课件.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于概率与统计基础第一页,本课件共有98页2 一一 随机变量与分布函数随机变量与分布函数1、随机试验随机试验满足条件满足条件:(1 1)可在相同的条件下可在相同的条件下重复重复进行;进行;(2 2)试验结果不止一个)试验结果不止一个,但事先能明确所有的结果;但事先能明确所有的结果;(3 3)试验前不能预知哪一个结果出现的实验称为随机实验。试验前不能预知哪一个结果出现的实验称为随机实验。用用 E E 表示。表示。2、样本空间样本空间随机试验随机试验E E 所有可能的结果所有可能的结果组成的集合称为样本空间记为组成的集合称为样本空间记为=e试验的每试验的每个可能结果称为样本点。个可能结果称为样本点
2、。3、随机事件随机事件满足某些条件的样本点所组成的集合(为满足某些条件的样本点所组成的集合(为 的子集)的子集),常用大写常用大写字母字母A A、B B、C C表示,表示,组成随机事件的一个样本点发生称为随机事件组成随机事件的一个样本点发生称为随机事件发生。发生。第二页,本课件共有98页3例例1 1:E E1 1随机试验随机试验:抛一枚硬币,观察正面、反面了出现的情况。抛一枚硬币,观察正面、反面了出现的情况。样本空间样本空间 1 1:HH,TT;E E:将一枚硬币抛掷三次,观察正面将一枚硬币抛掷三次,观察正面H H、反面、反面T T出现的情况。出现的情况。2 2:HHHHHH,HHTHHT,H
3、THHTH,THHTHH,HTTHTT,THTTHT,TTHTTH,TTTTTT;E E:将一枚硬币抛掷三次,观察出现正面的次数。将一枚硬币抛掷三次,观察出现正面的次数。3 3:00,1 1,2 2,33;E E:抛一颗骰子,观察出现的点数。抛一颗骰子,观察出现的点数。4 4:1 1,2 2,3 3,4 4,5 5,66;E E:记录某城市记录某城市120120急救电话台一昼夜接到的呼唤次数。急救电话台一昼夜接到的呼唤次数。5 5:00,l l,2 2,3 3,;E E:在一批灯泡中任意抽取一只,测试它的寿命。在一批灯泡中任意抽取一只,测试它的寿命。6 6:t tt0t0;E E:记录某地一昼
4、夜的最高温度和最低温度。记录某地一昼夜的最高温度和最低温度。7 7:(x,y)T T0 0 xyTT1 1,这里这里x示最低温度,示最低温度,y表示最高表示最高温度,并设这一地区的温度不会小于温度,并设这一地区的温度不会小于T To o,也不会大于,也不会大于T T1 1。第三页,本课件共有98页4在相同的条件下,进行了在相同的条件下,进行了n n次试验,在这次试验,在这n n次试验中,事件次试验中,事件A A发生发生的次数的次数n nA A称为事件称为事件A A发生的频数。比值发生的频数。比值n nA A n n称为事件称为事件A A发生的频率,发生的频率,并记成并记成n n(A)(A)。4
5、 4 概率概率对于一个随机事件对于一个随机事件A(A(除必然事件和不可能事件外除必然事件和不可能事件外)来说,它在来说,它在一次试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生的可能性。一次试验中发生的可能性。用一个数用一个数P(A)P(A)来表示该事件发生的可能性大小,这个数来表示该事件发生的可能性大小,这个数P(A)P(A)就称为就称为随机事件随机事件A A的概率。的概率。我们希望找到一个数来表示我们希望找到一个数来表示P(A)P(A)。严格定义应用公理化三条件非负性、归一性和可列可加性。严格定义应用公理化三条件非负
6、性、归一性和可列可加性。频率频率当当n n足够大时,足够大时,n(A)P(A)第四页,本课件共有98页5 5、随机变量随机变量是定义在样本空间记是定义在样本空间记 上的一个单值上的一个单值函数,用来表示随机现函数,用来表示随机现象的结果的变量象的结果的变量。常用大写字母X、Y表示,随机变量的取值具有随机性,随机变量的取值有一定的概率(按一定的概率取某个值某个值 )。样本空间上可以定义多个随机变量。随机变量分为离散和连续随机变量。用掷硬币用掷硬币10次来说明上述概念次来说明上述概念掷硬币为随机实验,掷硬币为随机实验,=正面,反面正面,反面为样本空间为样本空间.正面朝上的次数可以定义为随机变量。正
7、面朝上的次数可以定义为随机变量。6 6次正面朝上一个随机事件次正面朝上一个随机事件A A。在所有的实验中,出现在所有的实验中,出现6次朝上事件的频率为次朝上事件的频率为A A 的概率的概率也可以将硬币朝向作为随机变量也可以将硬币朝向作为随机变量X:正面朝上:正面朝上X=1=1,否则,否则X=0=0第五页,本课件共有98页6概率的重要性质概率的重要性质第六页,本课件共有98页7概率的重要性质概率的重要性质第七页,本课件共有98页86、条件概率、条件概率 在事件在事件A A 发生的条件下事件发生的条件下事件B B 发生的概率称为发生的概率称为条件概率条件概率,记为记为满足可列可加性:设满足可列可加
8、性:设B1,B2,两两互不相容的事件,即对于两两互不相容的事件,即对于ij,BiBj=,i,j=1,2,则有则有第八页,本课件共有98页9B1BnAB1AB2ABn全概率公式ABayes公式全概率公式与全概率公式与Bayes 公式公式B2第九页,本课件共有98页10 6 一维随机变量一维随机变量分布函数分布函数对于离散的对于离散的 随机变量随机变量X,x1,x2,xk是X的所有取值,则X的概率的概率分布分布列(也称概率分布)为:列(也称概率分布)为:设 X为随机变量,则对于任意实数x称为X 的分布函数,对离散型随机变量,采用累加的方法求其分布函数,有公式:Xx1x2xkp pp(p(x1)p(
9、p(xk)第十页,本课件共有98页11 对连续型随机变量,其分布函数公式:非负可积函数 是它的概率密度函数右图几何意义,F(x)为阴影部分的面积yyxF(x)x第十一页,本课件共有98页12分布函数的性质分布函数的性质l F(x)单调不减,即l且l F(x)右连续,即第十二页,本课件共有98页13 7 二维随机变量的分布函数二维随机变量的分布函数设设(X,Y)为二维为二维随机变量,(x,y)为任一对实数,称函数称为二维随机变量称为二维随机变量(X,Y)的分布函数,也称为的分布函数,也称为X X和和Y Y的联合分布函数的联合分布函数,对离散型随机变量,其联合分布函数公式:对连续型随机变量,其联合
10、分布函数公式:定义函数:为X关于Y的边缘分布函数,同理第十三页,本课件共有98页14对离散型随机变量,称对连续型随机变量,关于X和关于Y的边缘概率密度为:8、条件概率函数关于X的边缘分布律为为变量(X,Y)的联合概率分布,也称变量变量(X,Y)的联合分布的联合分布律同样关于Y的的边缘分布律对离散型随机变量(X,Y),称为在为在 X=xi 的条件下的条件下,Y 的条件分布律的条件分布律第十四页,本课件共有98页15对连续型随机变量(X,Y),在在X=x的条件下的条件下Y 的条件概率密度为的条件概率密度为在在Y=y的条件下的条件下X的条件概率密度的条件概率密度在在Y=y的条件下的条件下X的的条件分
11、布函数条件分布函数在在X=x的条件下的条件下Y 的条件分布函数的条件分布函数第十五页,本课件共有98页169、相互独立的随机变量相互独立的随机变量 设设(X,Y)为二维为二维随机变量随机变量,对于任意实数 x,y,有有则称随机变量则称随机变量 X 和和Y 是相互独立的是相互独立的X 和和Y 是相互独立是相互独立随机变量与下列条件等价随机变量与下列条件等价对于连续的随机变量,对于连续的随机变量,X 和和Y 是相互独立是相互独立与下列条件等价与下列条件等价如果二维如果二维随机变量随机变量(X,Y)相互独立,则有的相互独立,则有的第十六页,本课件共有98页17 二二 随机变量的数字特征随机变量的数字
12、特征1.一维随机变量一维随机变量数学期望对连续型随机变量,其数学期望公式:对离散型随机变量,其数学期望公式:其中2.一维随机变量一维随机变量方差随机变量X 的方差为方差为Var(X)=D(X)=E X-E(X)2称为均方差与标准差方差与标准差第十七页,本课件共有98页18对连续型随机变量,其方差公式:对离散型随机变量,其方差公式:有公式第十八页,本课件共有98页19设设(X,Y)为二维为二维随机变量,对离散型随机变量,其数学期望为:3 3 二维随机变量的数字特征:二维随机变量的数字特征:对连续型随机变量,其数学期望为:离散和连续型随机变量的方差为:第十九页,本课件共有98页20数学期望和方差的
13、性质:如果如果X 和和Y 是相互独立是相互独立随机变量,则有随机变量,则有对于对于n n个独立的个独立的随机变量,有随机变量,有第二十页,本课件共有98页21随机变量随机变量X和和 Y 的协方差为的协方差为:4 4 协方差与相关系数:协方差与相关系数:离散和连续型随机变量的协方差表达式为离散和连续型随机变量的协方差表达式为:协方差性质协方差性质a,b为任意常数任意常数如果如果X 和和Y 是相互独立,则是相互独立,则第二十一页,本课件共有98页22为为X和和 Y 的相关系数的相关系数相关系数:相关系数:即存在常数a 和b,a0,使得P(Y=aX+b)=1无量纲的量相关系数的性质相关系数的性质2)
14、若)若则则X和和Y 不相关不相关(线性线性)1)3)若)若则X和Y完全线性相关,既(X,Y)的协方差矩阵为:)的协方差矩阵为:第二十二页,本课件共有98页235.偏度与峰度偏度与峰度X 的k阶原点矩X 的k阶中心矩偏度(偏度(偏度(偏度(SkewnessSkewness)公式如下公式如下峰度(峰度(峰度(峰度(KurtosisKurtosis)公式如下公式如下偏度衡量偏度衡量偏度衡量偏度衡量X X围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度S0S0表示右偏(右拖尾),表示右偏(右
15、拖尾),表示右偏(右拖尾),表示右偏(右拖尾),S0S3K3,凸起大于正态分布,凸起大于正态分布,凸起大于正态分布,凸起大于正态分布,K3 K x)=P(X2性质性质2 2:的点的点 为为F F分布的上分布的上 分位点分位点.F 分布的分布的 分位点。设分位点。设 称称F F分布的上分布的上 分位点分位点图形如右图形如右图图.可以通过查表得到可以通过查表得到第三十六页,本课件共有98页37 在统计学中在统计学中,将我们研究的问题所涉及的对象的全将我们研究的问题所涉及的对象的全体称为体称为总体总体,而把总体中的每个成员称为而把总体中的每个成员称为个体个体.例如例如:我们想要研究一家工厂的某种产品
16、的废品率我们想要研究一家工厂的某种产品的废品率.这种产品这种产品的全体就是我们的总体的全体就是我们的总体,而每件产品则是个体而每件产品则是个体.从总体中抽取的一部分个体,称为总体的从总体中抽取的一部分个体,称为总体的一个样本一个样本;样本;样本中个体的个数称为中个体的个数称为样本的容量样本的容量。X1,X2,Xn 称为从总体称为从总体X X得到的容量为得到的容量为n n的随机样本,简称样本。一次的随机样本,简称样本。一次具体的抽取记录具体的抽取记录 x1,x2,xn是随机变量,是随机变量,X1,X2,Xn的一个观察的一个观察值值,成为样本值成为样本值定义:来自总体定义:来自总体X X的样本的样
17、本X1,X2,Xn的函数的函数g(X1,X2,Xn),若是连若是连续的且不含任何未知参数,则称为一个统计量续的且不含任何未知参数,则称为一个统计量四、样本与抽样四、样本与抽样总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值第三十七页,本课件共有98页38统计量统计量1、常用的统计量、常用的统计量设设X1,X2,Xn是是来自总体来自总体X的一个样本,的一个样本,x1,x2,xn 是这一样本的是这一样本的观测值,定义观测值,定义(1)样本均值样本均值(2)样本方差样本方差样本标准差样本标准差第三十八页,本课件共有98页39常用的统计量常用的统计量(3)(3)样本样本 k k 阶
18、原点矩阶原点矩(4)(4)样本样本 k k 阶中心矩阶中心矩并称他们相应的观测值并称他们相应的观测值 k=1,2,仍分别为仍分别为:样本均值、样本方差、样本标准差、样本样本均值、样本方差、样本标准差、样本 k k 阶原点矩、样阶原点矩、样本本 k k 阶中心矩阶中心矩.第三十九页,本课件共有98页402 2、常用统计量的性质、常用统计量的性质设设X1,X2,Xn是是来自总体来自总体X的容量为的容量为n n一个样本,一个样本,若若 X 有期望有期望 EX=和方差和方差var(var(X)=DX=2,如果样本的二阶矩存在,则有如果样本的二阶矩存在,则有2)1)第四十页,本课件共有98页413 3、
19、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布2)前面证明的性质)前面证明的性质1 EX=,var(var(X)=DX=2,可得,可得,(1)和)和(3)证明比较复杂,(见浙江大学概率论与数理统计)证明比较复杂,(见浙江大学概率论与数理统计P172,通过做正通过做正交变化降阶交变化降阶)第四十一页,本课件共有98页423 3、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布证明:由性质证明:由性质2 ,由性质由性质3 3根据根据t分布的定义分布的定义第四十二页,本课件共有98页43两个正态总体样本的抽样分布两个正态总体样本的抽样分布的相互独立的相互
20、独立的简单随机样本的简单随机样本.设与分别是来分别是来自正态总体自正态总体与设分别是两个样本的均值分别是两个样本的均值是两个样本的方差是两个样本的方差则有则有当当时时定理定理3 3第四十三页,本课件共有98页44参数估计总体分布的总体分布的未知参数未知参数的估计的估计总体分布的参数往往是未总体分布的参数往往是未知的知的,需要通过样本来估计需要通过样本来估计.通过样本来估计总体的参通过样本来估计总体的参数数,称为参数估计称为参数估计,它是统计推断的一种重要形式它是统计推断的一种重要形式.参数估计问题的一般提法参数估计问题的一般提法X1,X2,Xn要依据该样本对参数要依据该样本对参数 作出估计,或
21、估计作出估计,或估计的某个已知函数的某个已知函数 。这类问题称为。这类问题称为参数估计。参数估计。设有一个统计总体,总体的分布函数设有一个统计总体,总体的分布函数为为 F(x,)其中其中 为未知参数为未知参数(可以是向量可以是向量)现从该总体抽样,现从该总体抽样,得样本得样本第四十四页,本课件共有98页45点估计1.1.矩估计法矩估计法 用样本炬替代总体炬用样本炬替代总体炬2.2.极大似然法极大似然法3.3.最小二乘法最小二乘法第四十五页,本课件共有98页估计量的评选标准估计量的评选标准(1)无偏性)无偏性(2)有效性)有效性(3)一致性)一致性第四十六页,本课件共有98页47假设假设检验检验
22、参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布未知时的总体分布未知时的假设检验问题假设检验问题 在在本本讲讲中中,我我们们将将讨讨论论不不同同于于参参数数估估计计的的另另一一类类重重要要的的统统计计推推断断问问题题.这这就就是是根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个假假设设是是否否正正确确.这这类类问题称作假设检验问题问题称作假设检验问题 .五、假设检验五、假设检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验总体分布已知,总体分布已知,检验关于未知参检验关于未
23、知参数的某个假设数的某个假设1.假设检验的原理第四十七页,本课件共有98页48 假设检验的两类错误假设检验的两类错误P拒绝拒绝H0|H0为真为真=,P接受接受H0|H0不真不真=.犯两类错误的概率犯两类错误的概率:显著性水平显著性水平 为犯第一类错误的概率为犯第一类错误的概率.H0为真为真实际情况实际情况决定决定拒绝拒绝H0接受接受H0H0不真不真第一类错误第一类错误正确正确正确正确第二类错误第二类错误通常控制犯第一类错误的概率通常控制犯第一类错误的概率.一般事先选定一个数一般事先选定一个数,(0,(0 1),1),要求要求犯第一类错误的概率犯第一类错误的概率.,.,为假设检验的显著性水平,为
24、假设检验的显著性水平,通常只讨通常只讨论犯第一类错误的概率论犯第一类错误的概率第四十八页,本课件共有98页491.假设检验的步骤(1)提出二择一的假设提出二择一的假设H H0 0(往往与试验目的相反)与(往往与试验目的相反)与H H1 1(往往是欲得到的往往是欲得到的结论);结论);(2 2)给定显著水平(小概率)给定显著水平(小概率 ););(3 3)在)在H H0 0成立下,收集数据,寻找检验统计量(如正态成立下,收集数据,寻找检验统计量(如正态,t,F,t,F),由),由统计量的分布,可计算各种取值的概率;统计量的分布,可计算各种取值的概率;(4 4)找出小概率发生的临界值;给出拒绝域形
25、式)找出小概率发生的临界值;给出拒绝域形式(5 5)将样本值和)将样本值和H H0 0代入检验统计量进行计算;代入检验统计量进行计算;(6 6)将计算结果与临界值比较,若大于临界值,小概率事件发生,根)将计算结果与临界值比较,若大于临界值,小概率事件发生,根据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在哪里?生了。错在哪里?(7 7)原来是假设)原来是假设H H0 0错了,因为一切都是在错了,因为一切都是在H H0 0成立下推证的。于是拒绝成立下推证的。于是拒绝H H0 0。否则,不拒绝否则,不拒绝H H0
26、 0。第四十九页,本课件共有98页50假设检验(三部曲)其中双双边边检验检验左边检验左边检验确定拒绝域.l 计算计算,并作出相应判断并作出相应判断.右边检验右边检验l根据实际问题建立假设 与 .l 在在 为真时为真时,选择合适统计量选择合适统计量V ,由由称为显著水平称为显著水平为临界值为临界值第五十页,本课件共有98页512.正态总体的参数检验正态总体的参数检验一、单个正态总体一、单个正态总体N(,2)均值均值 的检验的检验H0:0;H1:01 1)关于)关于 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本.求求:对以上假设的显著性水对以上假设的显著性水平
27、平=的假设检验的假设检验.在在方差方差 2 2已知的情况已知的情况当原假设当原假设 H0:0为真时统计量第五十一页,本课件共有98页52给定小概率给定小概率,查表得:查表得:U 检验法若若小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,所以原假设的拒绝域为所以原假设的拒绝域为计算计算 当当拒绝假设拒绝假设 H0:0,接受接受H0:0,第五十二页,本课件共有98页53 0 0 0 00U 检验法检验法(2 2 已知已知)原假设H0备择假设H1检验统计量及其H0为真时的分布拒绝域右则检验右则检验左则检验左则检验第五十三页,本课件共有98页542.正态总体的参数检验正态总体的参数检验当当方差方
28、差 2 2未未知知时时当假设当假设 H0:0为真时由样本方差由样本方差S S2 2代替代替 2 2,根据抽样分布性质有根据抽样分布性质有给定小概率给定小概率,查表得:查表得:,当,当小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,接受假设H1既既时时第五十四页,本课件共有98页55T T 检验法检验法(2 2 未知未知)T 检验法检验法 0 0 0 00原假设 H0备择假设H1检验统计量及其H0为真时的分布拒绝域第五十五页,本课件共有98页56算例 某种元件的寿命X(以小时计)服从正态分布T没有落在拒绝域中,顾接受假设没有落在拒绝域中,顾接受假设 H0,认为认为平均寿命不大于平均寿命不大
29、于225小时小时根据样本计算和查表得:根据样本计算和查表得:解解 按题意需检验按题意需检验 H0:0225,H1:0225取 0.05,现现n16,已知由表知由表知均未知,现测得均未知,现测得16只元件的寿命如下:只元件的寿命如下:159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 文师傅有理由认为元件的平均寿命大于文师傅有理由认为元件的平均寿命大于225(小时)(小时)第五十六页,本课件共有98页572 2)关于)关于方差方差 2 2 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本
30、.求以下假设显著性水平求以下假设显著性水平 的的假设检验假设检验.当原假设当原假设 为真时为真时检验检验利用样本方差利用样本方差是是 2 2的一个无偏估计的一个无偏估计得得给定给定,当出现当出现时拒绝假设,为时拒绝假设,为方便起见,取方便起见,取假设假设 的拒绝域为的拒绝域为第五十七页,本课件共有98页58 2 02 2 02 2 02 2 02 2 02 2=02 2 02原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域(未知)(未知情况下未知情况下 2 的检验的检验)第五十九页,本课件共有98页60一、两个正态总体一、两个正态总体N(,2)的参数检验的参数检验设X N(1 1
31、2),Y N(2 2 2),两样本X,Y 相互独立,样本(X1,X2,Xn),(Y1,Y2,Ym)样本值(x1,x2,xn),(y1,y2,ym)显著性水平 H0:1 2;H1:2检验检验假设假设当当H0:1=2为真时为真时 拒绝域为 第六十页,本课件共有98页6112=(12,22已知)(1)(1)关于均值差关于均值差 1 1 2 2 的检验的检验12 12 12 12 原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十一页,本课件共有98页6212=12 12 12 12 其中12,22未知12=22原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十二页,本
32、课件共有98页6312=2212221222122212221222(2)(2)关于方差比关于方差比 1 12 2 /2 22 2 的检验的检验1,2均未知原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十三页,本课件共有98页64参数的点估计利用给定样本观察值,算出参数的估计值。参数的点估计利用给定样本观察值,算出参数的估计值。但用点估计的方法得到的估计值不一定是参数的真值,但用点估计的方法得到的估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等(因为总体参数本即使与真值相等也无法肯定这种相等(因为总体参数本身是未知的),也就是说,由点估计得到的参数估计值身是未知的)
33、,也就是说,由点估计得到的参数估计值没有给出它与真值之间的没有给出它与真值之间的可靠程度可靠程度(精度精度),在实际应用,在实际应用中往往还需要知道参数的估计值落在其真值附近的一个中往往还需要知道参数的估计值落在其真值附近的一个范围。范围。为此我们要求由样本构造一个以为此我们要求由样本构造一个以较大的概率较大的概率包含真实参包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间通过构造一个置信区间对未知参数进行估计的方法称为区间估计。估计。六、区间估计六、区间估计第六十四页,本课件共
34、有98页651 1、置信区间定义:、置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定确定的的两个统计量两个统计量则称区间则称区间 是是 的置信度(置信概率的置信度(置信概率,置信水平置信水平)为)为 的双侧置信区间的双侧置信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.作区间估计作区间估计,就是要设法找出两个只依赖于样本就是要设法找出两个只依赖于样本置信上下置信上下限限置信区间是以统计量为端点的随机区间,希望置信区间是以统计量为端点的随机区间,希望 区间区间 包含包含参数真值参数真值 的概率达到指定的要求的概率达到指定的
35、要求.第六十五页,本课件共有98页662.2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间长度长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则.1.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内,内,就是说,概率就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度件下尽可能提高精度.处理可靠性与精度的原则处理可靠性与精度的原则求参数置信区间先先再再保证可靠性提高精度第六十六页,本课件共有98页67
36、2 2、置信区间的求法、置信区间的求法l方差方差 2已知已知,的的置信水平置信水平(度度)为为1-1-置信区间置信区间为:为:(1)(1)一个正态总体一个正态总体 XN(2)的情形的情形由由确定解得到(1)式第六十七页,本课件共有98页68(2)(2)方差方差 2未知未知,的置信区间的置信区间 由确定故的置信区间为第六十八页,本课件共有98页69(3)(3)当当 已知时已知时,方差方差 2 的的置信区间置信区间取统计量,得2 的置信度为置信区间为由概率公式(3)第六十九页,本课件共有98页70随机向量的数字特征随机向量的数字特征 一、数学期望1、定义 是有随机变量构成的随机矩阵,定义X的数学期
37、望为第七十页,本课件共有98页71特别当时 ,便可得到随机向量 的数学期望为第七十一页,本课件共有98页72 2、性质 1)设为常数,则 ;2)设 分别为常数矩阵,则 3)设 为n个同阶矩阵,则第七十二页,本课件共有98页73 二、协方差矩阵二、协方差矩阵 1、定义:设 和 分别为 维和 维随机向量,则其协方差矩阵为第七十三页,本课件共有98页74的的(自自)协方差矩阵协方差矩阵第七十四页,本课件共有98页752、性质 1)若 和 相互独立。则第七十五页,本课件共有98页76 若 的分量相互独立,则(自)协方差矩阵,除主对角线上的元素外均为零,即2)随机向量X的协方差矩阵是非负定矩阵。证:设为
38、任意与X有相同维数的常数向量,则第七十六页,本课件共有98页77 3)设A是常数矩阵,b为常数向量,则Var(AX+b)=AVar(X)A;4 4、若、若(x(x1 1,x,x2 2,,x xp p)和和(y(y1 1,y,y2 2,,y yp p)分别是分别是p p和和q q维随机维随机向量向量,A A和和B B为常数矩阵,则为常数矩阵,则 第七十七页,本课件共有98页78 5 5、若、若(k(k1 1,k,k2 2,,k kp p)是是n n个不全为零的常数,个不全为零的常数,(x(x1 1,x,x2 2,,x xp p)是相互独立的是相互独立的p p维随机维随机向量向量,则,则 6 6、
39、设、设 是是n n维随机向量,记维随机向量,记 A为为nnnn维常数矩阵,则维常数矩阵,则 表示为矩阵的迹,其定义为矩阵主对角线元素之和表示为矩阵的迹,其定义为矩阵主对角线元素之和第七十八页,本课件共有98页79 三、相关系数矩阵 若(x1,x2,,xp)和(y1,y2,,yp)分别是p和q维随机向量,则其相关系数矩阵为第七十九页,本课件共有98页80l 均均均均值值值值 (mean)(mean)即即序序列列的的平平均均值值,用用序序列列数数据据的的总总和和除除以以数数据据的的个个数。数。中位数中位数中位数中位数 (median)(median)即从小到大排列的序列的中间值。是对序列分即从小到
40、大排列的序列的中间值。是对序列分布中心的一个粗略估计。布中心的一个粗略估计。最大最小值最大最小值最大最小值最大最小值 (max and min)(max and min)序列中的最大最小值。序列中的最大最小值。标准差标准差标准差标准差(Standard Deviation)(Standard Deviation)标准差衡量序列的离散程度。计算公标准差衡量序列的离散程度。计算公式如下式如下N 是样本中观测值的个数,是样本中观测值的个数,是样本均值。是样本均值。第八十页,本课件共有98页81l l 偏度偏度偏度偏度(SkewnessSkewness)衡量序列分布围绕其均值的非对称性。衡量序列分布围
41、绕其均值的非对称性。计算公式如下计算公式如下 是变量方差的有偏估计。如果序列的分布是对是变量方差的有偏估计。如果序列的分布是对称的,称的,S值为值为0;正的;正的S值意味着序列分布有长的右拖尾,负的值意味着序列分布有长的右拖尾,负的S值意味值意味着序列分布有长的左拖尾。例着序列分布有长的左拖尾。例1.1中中X的偏度为的偏度为0,说明,说明X的分布是对称的;的分布是对称的;而例而例1.3中中GDP增长率的偏度是增长率的偏度是0.78,说明,说明GDP增长率的分布是不对增长率的分布是不对称的。称的。第八十一页,本课件共有98页82l l 峰度峰度峰度峰度(Kurtosis)度量序列分布的凸起或平坦
42、程度,计度量序列分布的凸起或平坦程度,计算公式如下算公式如下 分布的凸起程度大于分布的凸起程度大于 正态分布;如果正态分布;如果K值小于值小于3,序列分布相对于正,序列分布相对于正态分布是平坦的。例态分布是平坦的。例1.1中中X的峰度为的峰度为2.5,说明,说明X的分布相对于正的分布相对于正态分布是平坦的;而例态分布是平坦的;而例1.3中中GDP增长率的峰度为增长率的峰度为2.14,说明,说明GDP增长率的分布相对于正态分布也是平坦的。增长率的分布相对于正态分布也是平坦的。意义同意义同S中中,正态分布的正态分布的 K 值为值为3。如果。如果 K 值大于值大于3,第八十二页,本课件共有98页83
43、1.2 1.2 均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验l 这部分是对序列均值、中位数、方差的假设检验。在序列对这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择象菜单选择View/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框:,就会出现下面的序列分布检验对话框:第八十三页,本课件共有98页841.1.1.1.均值检验均值检验均值检验均值检验 如果不指定序列如果不指定序列 x 的标准差,的标准差,EViews将在将在 t
44、 统计量中使用统计量中使用该标准差的估计值该标准差的估计值 s。是是 x 的样本估计值的样本估计值,N是是x的观测值的个数。在原假设下,如果的观测值的个数。在原假设下,如果x服从正态分布,服从正态分布,t 统计量是自由度为统计量是自由度为N-1的的t分布分布。l 原假设是序列原假设是序列 x 的期望值的期望值 m,备选假设是,备选假设是 m,即,即 第八十四页,本课件共有98页85l 如果给定如果给定x的标准差,的标准差,EViews计算计算t 统计量:统计量:是指定的是指定的x的标准差。的标准差。要要进进行行均均值值检检验验,在在Mean内内输输入入 值值。如如果果已已知知标标准准差差,想想
45、要要计计算算t统统计计量量,在在右右边边的的框框内内输输入入标标准准差差值值。可可以以输输入入任任何何数数或或标标准准EViews表达式,下页我们给出检验的输出结果。表达式,下页我们给出检验的输出结果。第八十五页,本课件共有98页86 这是检验例这是检验例1.7中中GDP增长率的均值,增长率的均值,检验检验H0:X=10%,H1:X10%。表中的表中的Probability值是值是P值(边际显著水平)。在双值(边际显著水平)。在双边假设下,如果这个值小于检验的显著水平,如边假设下,如果这个值小于检验的显著水平,如0.05则拒绝原假设。则拒绝原假设。这里我们不能拒绝原假设。这里我们不能拒绝原假设
46、。第八十六页,本课件共有98页872.2.方差检验方差检验方差检验方差检验 l 检验的原假设为序列检验的原假设为序列 x 的方差等于的方差等于 2,备选假设为双边的,备选假设为双边的,x 的方差不等于的方差不等于 2,即,即 EViews计算计算 2统计量,计算公式如下统计量,计算公式如下 N为为观观测测值值的的个个数数,为为x的的样样本本均均值值。在在原原假假设设下下,如如果果x服服从从正态分布,正态分布,2 统计量是服从自由度为统计量是服从自由度为N-1的的 2分布分布。要要进行方差检验,在进行方差检验,在Variance处填入在原假设下的方差值。可处填入在原假设下的方差值。可以填入任何正
47、数或表达式。以填入任何正数或表达式。第八十七页,本课件共有98页883.中位数检验中位数检验 l 原假设为序列原假设为序列x的中位数等于的中位数等于m,备选假设为双边假设,备选假设为双边假设,x的的中位数不等于中位数不等于m,即,即 EViews提供了三个以排序为基础的无参数的检验统计量。方法提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于的主要参考来自于Conover(1980)和)和Sheskin(1997)。)。进行中位数检验,在进行中位数检验,在Median右边的框内输入中位数的值,可以右边的框内输入中位数的值,可以输入任何数字表达式。输入任何数字表达式。第八十八页,本
48、课件共有98页891.31.3 分布函数分布函数分布函数分布函数 EViews提供了几种对数据进行初步分析的方法。在提供了几种对数据进行初步分析的方法。在1.1 我我们已列出了几种图来描述序列分布特征。在本节,列出了几种们已列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。这些图包含着复杂计算和大量的特殊操作,对某些完全技这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的介绍,不必掌握所有细节。术性的介绍,不必掌握所有细节。EViews中设置的缺省值除了对中设置的缺省值除了对极
49、特殊的分析外,对一般分析而言是足够用的。直接点击极特殊的分析外,对一般分析而言是足够用的。直接点击ok键接键接受缺省设置,就可以轻松的展现出每个图。受缺省设置,就可以轻松的展现出每个图。第八十九页,本课件共有98页901 1.3.1 序列分布图序列分布图 本节列出了三种描述序列经验分布特征的图。本节列出了三种描述序列经验分布特征的图。1.CDFSurvivorQuantile图图 这个图描绘出带有加或减两个标准误差带的经验累积分布函数,这个图描绘出带有加或减两个标准误差带的经验累积分布函数,残存函数和分位数函数。在序列菜单中或组菜单中选择残存函数和分位数函数。在序列菜单中或组菜单中选择View
50、/Distribution/CDFSurvivorQuantile时时(组菜单的组菜单的Multiple Graphs中中),就会出现下面的对话框:,就会出现下面的对话框:第九十页,本课件共有98页91 其其中中,Cumulative Distribution(累累积积分分布布)操操作作用用来来描描绘绘序序列列的的经经验验累累积积函函数数(CDF)。CDF是是序序列列中中观观测测值值不不超超过过指指定值定值 r 的概率的概率 Survivor(残存残存)操作用来描绘序列的经验残存函数操作用来描绘序列的经验残存函数 第九十一页,本课件共有98页92Quantile(分分位位数数)操操作作用用来来