《概率和统计基础.ppt》由会员分享,可在线阅读,更多相关《概率和统计基础.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于概率与统计基础第一张,PPT共九十八页,创作于2022年6月 一一 随机变量与分布函数随机变量与分布函数1、随机试验随机试验满足条件满足条件:(1 1)可在相同的条件下可在相同的条件下重复重复进行;进行;(2 2)试验结果不止一个)试验结果不止一个,但事先能明确所有的结果;但事先能明确所有的结果;(3 3)试验前不能预知哪一个结果出现的实验称为随机实验。试验前不能预知哪一个结果出现的实验称为随机实验。用用 E E 表示。表示。2、样本空间样本空间随机试验随机试验E E 所有可能的结果所有可能的结果组成的集合称为样本空间记为组成的集合称为样本空间记为=e试验的每试验的每个可能结果称为样本点。
2、个可能结果称为样本点。3、随机事件随机事件满足某些条件的样本点所组成的集合(为满足某些条件的样本点所组成的集合(为 的子集)的子集),常用大写字母常用大写字母A A、B B、C C表示,表示,组成随机事件的一个样本点发生称为随机事件发生。组成随机事件的一个样本点发生称为随机事件发生。第二张,PPT共九十八页,创作于2022年6月2例例1 1:E E1 1随机试验随机试验:抛一枚硬币,观察正面、反面了出现的情况。抛一枚硬币,观察正面、反面了出现的情况。样本空间样本空间 1 1:HH,TT;E E:将一枚硬币抛掷三次,观察正面将一枚硬币抛掷三次,观察正面H H、反面、反面T T出现的情况。出现的情
3、况。2 2:HHHHHH,HHTHHT,HTHHTH,THHTHH,HTTHTT,THTTHT,TTHTTH,TTTTTT;E E:将一枚硬币抛掷三次,观察出现正面的次数。将一枚硬币抛掷三次,观察出现正面的次数。3 3:00,1 1,2 2,33;E E:抛一颗骰子,观察出现的点数。抛一颗骰子,观察出现的点数。4 4:1 1,2 2,3 3,4 4,5 5,66;E E:记录某城市记录某城市120120急救电话台一昼夜接到的呼唤次数。急救电话台一昼夜接到的呼唤次数。5 5:00,l l,2 2,3 3,;E E:在一批灯泡中任意抽取一只,测试它的寿命。在一批灯泡中任意抽取一只,测试它的寿命。6
4、 6:t tt0t0;E E:记录某地一昼夜的最高温度和最低温度。记录某地一昼夜的最高温度和最低温度。7 7:(x,y)T T0 0 xyTT1 1,这里这里x示最低温度,示最低温度,y表示最高温度,表示最高温度,并设这一地区的温度不会小于并设这一地区的温度不会小于T To o,也不会大于,也不会大于T T1 1。第三张,PPT共九十八页,创作于2022年6月3在相同的条件下,进行了在相同的条件下,进行了n n次试验,在这次试验,在这n n次试验中,事件次试验中,事件A A发生的发生的次数次数n nA A称为事件称为事件A A发生的频数。比值发生的频数。比值n nA A n n称为事件称为事件
5、A A发生的频率,并记发生的频率,并记成成n n(A)(A)。4 4 概率概率对于一个随机事件对于一个随机事件A(A(除必然事件和不可能事件外除必然事件和不可能事件外)来说,它在一次来说,它在一次试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生的可能性。的可能性。用一个数用一个数P(A)P(A)来表示该事件发生的可能性大小,这个数来表示该事件发生的可能性大小,这个数P(A)P(A)就称为随就称为随机事件机事件A A的概率。的概率。我们希望找到一个数来表示我们希望找到一个数来表示P(A)P(A)。严格定义应用公理
6、化三条件非负性、归一性和可列可加性。严格定义应用公理化三条件非负性、归一性和可列可加性。频率频率当当n n足够大时,足够大时,n(A)P(A)第四张,PPT共九十八页,创作于2022年6月4 5、随机变量随机变量是定义在样本空间记是定义在样本空间记上的一个单值上的一个单值函数,用来表示随机现函数,用来表示随机现象的结果的变量象的结果的变量。常用大写字母X、Y表示,随机变量的取值具有随机性,随机变量的取值有一定的概率(按一定的概率取某个值某个值 )。样本空间上可以定义多个随机变量。随机变量分为离散和连续随机变量。用掷硬币用掷硬币10次来说明上述概念次来说明上述概念掷硬币为随机实验,掷硬币为随机实
7、验,=正面,反面正面,反面为样本空间为样本空间.正面朝上的次数可以定义为随机变量。正面朝上的次数可以定义为随机变量。6 6次正面朝上一个随机事件次正面朝上一个随机事件A A。在所有的实验中,出现在所有的实验中,出现6次朝上事件的频率为次朝上事件的频率为A A 的概率的概率也可以将硬币朝向作为随机变量也可以将硬币朝向作为随机变量X:正面朝上:正面朝上X=1=1,否则,否则X=0=0第五张,PPT共九十八页,创作于2022年6月5概率的重要性质概率的重要性质第六张,PPT共九十八页,创作于2022年6月6概率的重要性质概率的重要性质第七张,PPT共九十八页,创作于2022年6月76、条件概率、条件
8、概率 在事件在事件A A 发生的条件下事件发生的条件下事件B B 发生的概率称为发生的概率称为条件概率条件概率,记为记为满足可列可加性:设满足可列可加性:设B1,B2,两两互不相容的事件,即对于两两互不相容的事件,即对于ij,BiBj=,i,j=1,2,则有则有第八张,PPT共九十八页,创作于2022年6月8B1BnAB1AB2ABn全概率公式ABayes公式全概率公式与全概率公式与Bayes 公式公式B2第九张,PPT共九十八页,创作于2022年6月9 6 一维随机变量分布函数一维随机变量分布函数对于离散的对于离散的 随机变量随机变量X,x1,x2,xk是X的所有取值,则X的概率的概率分布列
9、分布列(也称概率分布)为:(也称概率分布)为:设 X为随机变量,则对于任意实数x称为X 的分布函数,对离散型随机变量,采用累加的方法求其分布函数,有公式:Xx1x2xkp pp(p(x1)p(p(xk)第十张,PPT共九十八页,创作于2022年6月10 对连续型随机变量,其分布函数公式:非负可积函数 是它的概率密度函数右图几何意义,F(x)为阴影部分的面积yyxF(x)x第十一张,PPT共九十八页,创作于2022年6月11分布函数的性质分布函数的性质l F(x)单调不减,即l且l F(x)右连续,即第十二张,PPT共九十八页,创作于2022年6月12 7 二维随机变量的分布函数二维随机变量的分
10、布函数设设(X,Y)为二维为二维随机变量,(x,y)为任一对实数,称函数称为二维随机变量称为二维随机变量(X,Y)的分布函数,也称为的分布函数,也称为X X和和Y Y的联合分布函数的联合分布函数,对离散型随机变量,其联合分布函数公式:对连续型随机变量,其联合分布函数公式:定义函数:为X关于Y的边缘分布函数,同理第十三张,PPT共九十八页,创作于2022年6月13对离散型随机变量,称对连续型随机变量,关于X和关于Y的边缘概率密度为:8、条件概率函数关于X的边缘分布律为为变量(X,Y)的联合概率分布,也称变量变量(X,Y)的联合分布的联合分布律同样关于Y的的边缘分布律对离散型随机变量(X,Y),称
11、为在为在 X=xi 的条件下的条件下,Y 的条件分布律的条件分布律第十四张,PPT共九十八页,创作于2022年6月14对连续型随机变量(X,Y),在在X=x的条件下的条件下Y 的条件概率密度为的条件概率密度为在在Y=y的条件下的条件下X的条件概率密度的条件概率密度在在Y=y的条件下的条件下X的的条件分布函数条件分布函数在在X=x的条件下的条件下Y 的条件分布函数的条件分布函数第十五张,PPT共九十八页,创作于2022年6月159、相互独立的随机变量相互独立的随机变量 设设(X,Y)为二维为二维随机变量随机变量,对于任意实数 x,y,有有则称随机变量则称随机变量 X 和和Y 是相互独立的是相互独
12、立的X 和和Y 是相互独立是相互独立随机变量与下列条件等价随机变量与下列条件等价对于连续的随机变量,对于连续的随机变量,X 和和Y 是相互独立是相互独立与下列条件等价与下列条件等价如果二维如果二维随机变量随机变量(X,Y)相互独立,则有的相互独立,则有的第十六张,PPT共九十八页,创作于2022年6月16 二二 随机变量的数字特征随机变量的数字特征1.一维随机变量一维随机变量数学期望对连续型随机变量,其数学期望公式:对离散型随机变量,其数学期望公式:其中2.一维随机变量一维随机变量方差随机变量X 的方差为方差为Var(X)=D(X)=E X-E(X)2称为均方差与标准差方差与标准差第十七张,P
13、PT共九十八页,创作于2022年6月17对连续型随机变量,其方差公式:对离散型随机变量,其方差公式:有公式第十八张,PPT共九十八页,创作于2022年6月18设设(X,Y)为二维为二维随机变量,对离散型随机变量,其数学期望为:3 3 二维随机变量的数字特征:二维随机变量的数字特征:对连续型随机变量,其数学期望为:离散和连续型随机变量的方差为:第十九张,PPT共九十八页,创作于2022年6月19数学期望和方差的性质:如果如果X 和和Y 是相互独立是相互独立随机变量,则有随机变量,则有对于对于n n个独立的个独立的随机变量,有随机变量,有第二十张,PPT共九十八页,创作于2022年6月20随机变量
14、随机变量X和和 Y 的协方差为的协方差为:4 4 协方差与相关系数:协方差与相关系数:离散和连续型随机变量的协方差表达式为离散和连续型随机变量的协方差表达式为:协方差性质协方差性质a,b为任意常数任意常数如果如果X 和和Y 是相互独立,则是相互独立,则第二十一张,PPT共九十八页,创作于2022年6月21为为X和和 Y 的相关系数的相关系数相关系数:相关系数:即存在常数a 和b,a0,使得P(Y=aX+b)=1无量纲的量相关系数的性质相关系数的性质2)若)若则则X和和Y 不相关不相关(线性线性)1)3)若)若则X和Y完全线性相关,既(X,Y)的协方差矩阵为:)的协方差矩阵为:第二十二张,PPT
15、共九十八页,创作于2022年6月225.偏度与峰度偏度与峰度X 的k阶原点矩X 的k阶中心矩偏度(偏度(偏度(偏度(SkewnessSkewness)公式如下公式如下峰度(峰度(峰度(峰度(KurtosisKurtosis)公式如下公式如下偏度衡量偏度衡量偏度衡量偏度衡量X X围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度S0S0表示右偏(右拖尾),表示右偏(右拖尾),表示右偏(右拖尾),表示右偏(右拖尾),S0S3K3,凸起大于正态分布,凸起大于正态分布,凸起大于正态分布,凸起大
16、于正态分布,K3 K x)=P(X2性质性质2 2:的点的点 为为F F分布的上分布的上 分位点分位点.F 分布的分布的 分位点。设分位点。设 称称F F分布的上分布的上 分位点分位点图形如右图形如右图图.可以通过查表得到可以通过查表得到第三十六张,PPT共九十八页,创作于2022年6月36 在统计学中在统计学中,将我们研究的问题所涉及的对象的全体将我们研究的问题所涉及的对象的全体称为称为总体总体,而把总体中的每个成员称为而把总体中的每个成员称为个体个体.例如例如:我们想要研究一家工厂的某种产品的废品率我们想要研究一家工厂的某种产品的废品率.这种产品的这种产品的全体就是我们的总体全体就是我们的
17、总体,而每件产品则是个体而每件产品则是个体.从总体中抽取的一部分个体,称为总体的从总体中抽取的一部分个体,称为总体的一个样本一个样本;样本中;样本中个体的个数称为个体的个数称为样本的容量样本的容量。X1,X2,Xn 称为从总体称为从总体X X得到的容量为得到的容量为n n的随机样本,简称样本。一次具的随机样本,简称样本。一次具体的抽取记录体的抽取记录 x1,x2,xn是随机变量,是随机变量,X1,X2,Xn的一个观察值的一个观察值,成为成为样本值样本值定义:来自总体定义:来自总体X X的样本的样本X1,X2,Xn的函数的函数g(X1,X2,Xn),若是连若是连续的且不含任何未知参数,则称为一个
18、统计量续的且不含任何未知参数,则称为一个统计量四、样本与抽样四、样本与抽样总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值第三十七张,PPT共九十八页,创作于2022年6月37统计量统计量1、常用的统计量、常用的统计量设设X1,X2,Xn是是来自总体来自总体X的一个样本,的一个样本,x1,x2,xn 是这一样本的观测是这一样本的观测值,定义值,定义(1)样本均值样本均值(2)样本方差样本方差样本标准差样本标准差第三十八张,PPT共九十八页,创作于2022年6月38常用的统计量常用的统计量(3)(3)样本样本 k k 阶原点矩阶原点矩(4)(4)样本样本 k k 阶中心矩阶中
19、心矩并称他们相应的观测值并称他们相应的观测值 k=1,2,仍分别为仍分别为:样本均值、样本方差、样本标准差、样本样本均值、样本方差、样本标准差、样本 k k 阶原点矩、样本阶原点矩、样本 k k 阶中心矩阶中心矩.第三十九张,PPT共九十八页,创作于2022年6月392 2、常用统计量的性质、常用统计量的性质设设X1,X2,Xn是是来自总体来自总体X的容量为的容量为n n一个样本,一个样本,若若 X 有期望有期望 EX=和方差和方差var(var(X)=DX=2,如果样本的二阶矩存在,则有如果样本的二阶矩存在,则有2)1)第四十张,PPT共九十八页,创作于2022年6月403 3、正态总体的样
20、本均值与样本方差的分布、正态总体的样本均值与样本方差的分布2)前面证明的性质)前面证明的性质1 EX=,var(var(X)=DX=2,可得,可得,(1)和()和(3)证)证明比较复杂,(见浙江大学概率论与数理统计明比较复杂,(见浙江大学概率论与数理统计P172,通过做正交变化降通过做正交变化降阶阶)第四十一张,PPT共九十八页,创作于2022年6月413 3、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布证明:由性质证明:由性质2 ,由性质由性质3 3根据根据t分布的定义分布的定义第四十二张,PPT共九十八页,创作于2022年6月42两个正态总体样本的抽样分布两个正态
21、总体样本的抽样分布的相互独立的相互独立的简单随机样本的简单随机样本.设与分别是来分别是来自正态总体自正态总体与设分别是两个样本的均值分别是两个样本的均值是两个样本的方差是两个样本的方差则有则有当当时时定理定理3 3第四十三张,PPT共九十八页,创作于2022年6月43参数估计总体分布的总体分布的未知参数未知参数的估计的估计总体分布的参数往往是未知总体分布的参数往往是未知的的,需要通过样本来估计需要通过样本来估计.通过样本来估计总体的参数通过样本来估计总体的参数,称为称为参数估计参数估计,它是统计推断的一种重要形式它是统计推断的一种重要形式.参数估计问题的一般提法参数估计问题的一般提法X1,X2
22、,Xn要依据该样本对参数要依据该样本对参数 作出估计,或估计作出估计,或估计的某个已知函数的某个已知函数 。这类问题称为。这类问题称为参数估计。参数估计。设有一个统计总体,总体的分布函数设有一个统计总体,总体的分布函数为为 F(x,)其中其中 为未知参数为未知参数(可以是向量可以是向量)现从该总体抽样,得现从该总体抽样,得样本样本第四十四张,PPT共九十八页,创作于2022年6月44点估计1.1.矩估计法矩估计法 用样本炬替代总体炬用样本炬替代总体炬2.2.极大似然法极大似然法3.3.最小二乘法最小二乘法第四十五张,PPT共九十八页,创作于2022年6月45估计量的评选标准估计量的评选标准(1
23、)无偏性)无偏性(2)有效性)有效性(3)一致性)一致性第四十六张,PPT共九十八页,创作于2022年6月假设假设检验检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布未知时的总体分布未知时的假设检验问题假设检验问题 在在本本讲讲中中,我我们们将将讨讨论论不不同同于于参参数数估估计计的的另另一一类类重重要要的的统统计计推推断断问问题题.这这就就是是根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个假假设设是是否否正正确确.这这类类问问题题称称作假设检验问题作假设检验问题 .五、假设检验五、假设检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检
24、验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验总体分布已知,总体分布已知,检验关于未知参数检验关于未知参数的某个假设的某个假设1.假设检验的原理第四十七张,PPT共九十八页,创作于2022年6月47 假设检验的两类错误假设检验的两类错误P拒绝拒绝H0|H0为真为真=,P接受接受H0|H0不真不真=.犯两类错误的概率犯两类错误的概率:显著性水平显著性水平 为犯第一类错误的概率为犯第一类错误的概率.H0为真为真实际情况实际情况决定决定拒绝拒绝H0接受接受H0H0不真不真第一类错误第一类错误正确正确正确正确第二类错误第二类错误通常控制犯第一类错误的概率通常控制犯第一类错误的概
25、率.一般事先选定一个数一般事先选定一个数,(0,(0 1),1),要求要求犯犯第一类错误的概率第一类错误的概率.,.,为假设检验的显著性水平,为假设检验的显著性水平,通常只讨论犯第通常只讨论犯第一类错误的概率一类错误的概率第四十八张,PPT共九十八页,创作于2022年6月481.假设检验的步骤(1)提出二择一的假设提出二择一的假设H H0 0(往往与试验目的相反)与(往往与试验目的相反)与H H1 1(往往是欲得到的结论)往往是欲得到的结论);(2 2)给定显著水平(小概率)给定显著水平(小概率 ););(3 3)在)在H H0 0成立下,收集数据,寻找检验统计量(如正态成立下,收集数据,寻找
26、检验统计量(如正态,t,F,t,F),由统计量的),由统计量的分布,可计算各种取值的概率;分布,可计算各种取值的概率;(4 4)找出小概率发生的临界值;给出拒绝域形式)找出小概率发生的临界值;给出拒绝域形式(5 5)将样本值和)将样本值和H H0 0代入检验统计量进行计算;代入检验统计量进行计算;(6 6)将计算结果与临界值比较,若大于临界值,小概率事件发生,根据)将计算结果与临界值比较,若大于临界值,小概率事件发生,根据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在哪里?错在哪里?(7 7)原来是假设)
27、原来是假设H H0 0错了,因为一切都是在错了,因为一切都是在H H0 0成立下推证的。于是拒绝成立下推证的。于是拒绝H H0 0。否则,。否则,不拒绝不拒绝H H0 0。第四十九张,PPT共九十八页,创作于2022年6月49假设检验(三部曲)其中双双边边检验检验左边检验左边检验确定拒绝域.l 计算计算,并作出相应判断并作出相应判断.右边检验右边检验l根据实际问题建立假设 与 .l 在在 为真时为真时,选择合适统计量选择合适统计量V ,由由称为显著水平称为显著水平为临界值为临界值第五十张,PPT共九十八页,创作于2022年6月502.正态总体的参数检验正态总体的参数检验一、单个正态总体一、单个
28、正态总体N(,2)均值均值 的检验的检验H0:0;H1:01 1)关于)关于 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本.求求:对以上假设的显著性水平对以上假设的显著性水平=的假设检验的假设检验.在在方差方差 2 2已知的情况已知的情况当原假设当原假设 H0:0为真时统计量第五十一张,PPT共九十八页,创作于2022年6月51给定小概率给定小概率,查表得:查表得:U 检验法若若小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,所以原假设的拒绝域为所以原假设的拒绝域为计算计算 当当拒绝假设拒绝假设 H0:0,接受接受H0:0,第五十二张,PPT共九十八
29、页,创作于2022年6月52 0 0 0 00U 检验法检验法(2 2 已知已知)原假设H0备择假设H1检验统计量及其H0为真时的分布拒绝域右则检验右则检验左则检验左则检验第五十三张,PPT共九十八页,创作于2022年6月532.正态总体的参数检验正态总体的参数检验当当方差方差 2 2未未知知时时当假设当假设 H0:0为真时由样本方差由样本方差S S2 2代替代替 2 2,根据抽样分布性质有根据抽样分布性质有给定小概率给定小概率,查表得:查表得:,当,当小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,接受假设H1既既时时第五十四张,PPT共九十八页,创作于2022年6月54T T 检验法
30、检验法(2 2 未知未知)T 检验法检验法 0 0 0 00原假设 H0备择假设H1检验统计量及其H0为真时的分布拒绝域第五十五张,PPT共九十八页,创作于2022年6月55算例 某种元件的寿命X(以小时计)服从正态分布T没有落在拒绝域中,顾接受假设没有落在拒绝域中,顾接受假设 H0,认为认为平均寿命不大于平均寿命不大于225小小时时根据样本计算和查表得:根据样本计算和查表得:解解 按题意需检验按题意需检验 H0:0225,H1:0225取 0.05,现现n16,已知由表知由表知均未知,现测得均未知,现测得16只元件的寿命如下:只元件的寿命如下:159 280 101 212 224 379
31、179 264 222 362 168 250 149 260 485 170 文师傅有理由认为元件的平均寿命大于文师傅有理由认为元件的平均寿命大于225(小时)(小时)第五十六张,PPT共九十八页,创作于2022年6月562 2)关于)关于方差方差 2 2 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本.求以下假设显著性水平求以下假设显著性水平 的的假假设检验设检验.当原假设当原假设 为真时为真时检验检验利用样本方差利用样本方差是是 2 2的一个无偏估计的一个无偏估计得得给定给定,当出现当出现时拒绝假设,为方时拒绝假设,为方便起见,取便起见,取假设假设 的
32、拒绝域为的拒绝域为第五十七张,PPT共九十八页,创作于2022年6月57 2 02 2 02 2 02 2 02 2 02 2=02 2 02原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域(未知)(未知情况下未知情况下 2 的检验的检验)第五十九张,PPT共九十八页,创作于2022年6月59一、两个正态总体一、两个正态总体N(,2)的参数检验的参数检验设X N(1 1 2),Y N(2 2 2),两样本X,Y 相互独立,样本(X1,X2,Xn),(Y1,Y2,Ym)样本值(x1,x2,xn),(y1,y2,ym)显著性水平 H0:1 2;H1:2检验检验假设假设当当H0:1=2为
33、真时为真时 拒绝域为 第六十张,PPT共九十八页,创作于2022年6月6012=(12,22已知)(1)(1)关于均值差关于均值差 1 1 2 2 的检验的检验12 12 12 12 原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十一张,PPT共九十八页,创作于2022年6月6112=12 12 12 12 其中12,22未知12=22原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十二张,PPT共九十八页,创作于2022年6月6212=2212221222122212221222(2)(2)关于方差比关于方差比 1 12 2 /2 22 2 的检验的检验1,
34、2均未知原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域第六十三张,PPT共九十八页,创作于2022年6月63参数的点估计利用给定样本观察值,算出参数的估计值。参数的点估计利用给定样本观察值,算出参数的估计值。但用点估计的方法得到的估计值不一定是参数的真值,即但用点估计的方法得到的估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等(因为总体参数本身是使与真值相等也无法肯定这种相等(因为总体参数本身是未知的),也就是说,由点估计得到的参数估计值没有给未知的),也就是说,由点估计得到的参数估计值没有给出它与真值之间的出它与真值之间的可靠程度可靠程度(精度精度),在实际应用中往往
35、还,在实际应用中往往还需要知道参数的估计值落在其真值附近的一个范围。需要知道参数的估计值落在其真值附近的一个范围。为此我们要求由样本构造一个以为此我们要求由样本构造一个以较大的概率较大的概率包含真实参数的一个包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计。置信区间对未知参数进行估计的方法称为区间估计。六、区间估计六、区间估计第六十四张,PPT共九十八页,创作于2022年6月641 1、置信区间定义:、置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给
36、定 若由样本若由样本X1,X2,Xn确定确定的两的两个统计量个统计量则称区间则称区间 是是 的置信度(置信概率的置信度(置信概率,置信水平置信水平)为)为 的双侧置信区间的双侧置信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.作区间估计作区间估计,就是要设法找出两个只依赖于样本就是要设法找出两个只依赖于样本置信上下置信上下限限置信区间是以统计量为端点的随机区间,希望置信区间是以统计量为端点的随机区间,希望 区间区间 包含参数真值包含参数真值 的概率达到指定的要求的概率达到指定的要求.第六十五张,PPT共九十八页,创作于2022年6月652.2.估计的精度要尽可能的高估计的精度要尽
37、可能的高.如要求区间如要求区间长度长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则.1.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内,内,就是说,概率就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度件下尽可能提高精度.处理可靠性与精度的原则处理可靠性与精度的原则求参数置信区间先先再再保证可靠性提高精度第六十六张,PPT共九十八页,创作于2022年6月662 2、置信区间的求法、置信区间的求法l方差方差 2已知已知
38、,的的置信水平置信水平(度度)为为1-1-置信区间置信区间为:为:(1)(1)一个正态总体一个正态总体 XN(2)的情形的情形由由确定解得到(1)式第六十七张,PPT共九十八页,创作于2022年6月67(2)(2)方差方差 2未知未知,的置信区间的置信区间 由确定故的置信区间为第六十八张,PPT共九十八页,创作于2022年6月68(3)(3)当当 已知时已知时,方差方差 2 的的置信区间置信区间取统计量,得2 的置信度为置信区间为由概率公式(3)第六十九张,PPT共九十八页,创作于2022年6月69随机向量的数字特征随机向量的数字特征 一、数学期望1、定义 是有随机变量构成的随机矩阵,定义X的
39、数学期望为第七十张,PPT共九十八页,创作于2022年6月70特别当时 ,便可得到随机向量 的数学期望为第七十一张,PPT共九十八页,创作于2022年6月71 2、性质 1)设为常数,则 ;2)设 分别为常数矩阵,则 3)设 为n个同阶矩阵,则第七十二张,PPT共九十八页,创作于2022年6月72 二、协方差矩阵二、协方差矩阵1、定义:设 和 分别为 维和 维随机向量,则其协方差矩阵为第七十三张,PPT共九十八页,创作于2022年6月73的的(自自)协方差矩阵协方差矩阵第七十四张,PPT共九十八页,创作于2022年6月742、性质 1)若 和 相互独立。则第七十五张,PPT共九十八页,创作于2
40、022年6月75 若 的分量相互独立,则(自)协方差矩阵,除主对角线上的元素外均为零,即2)随机向量X的协方差矩阵是非负定矩阵。证:设为任意与X有相同维数的常数向量,则第七十六张,PPT共九十八页,创作于2022年6月76 3)设A是常数矩阵,b为常数向量,则Var(AX+b)=AVar(X)A;4 4、若、若(x(x1 1,x,x2 2,,x xp p)和和(y(y1 1,y,y2 2,,y yp p)分别是分别是p p和和q q维随机维随机向量向量,A A和和B B为常数矩阵,则为常数矩阵,则 第七十七张,PPT共九十八页,创作于2022年6月77 5 5、若、若(k(k1 1,k,k2
41、2,,k kp p)是是n n个不全为零的常数,个不全为零的常数,(x(x1 1,x,x2 2,,x xp p)是相互独立的是相互独立的p p维随机维随机向量向量,则,则 6 6、设、设 是是n n维随机向量,记维随机向量,记 A为为nnnn维常数矩阵,则维常数矩阵,则 表示为矩阵的迹,其定义为矩阵主对角线元素之和表示为矩阵的迹,其定义为矩阵主对角线元素之和第七十八张,PPT共九十八页,创作于2022年6月78 三、相关系数矩阵 若(x1,x2,,xp)和(y1,y2,,yp)分别是p和q维随机向量,则其相关系数矩阵为第七十九张,PPT共九十八页,创作于2022年6月79l 均值均值均值均值
42、(mean)(mean)即序列的平均值即序列的平均值,用序列数据的总和除以数据的个数。用序列数据的总和除以数据的个数。中位数中位数中位数中位数 (median)(median)即从小到大排列的序列的中间值。是对序列分布中即从小到大排列的序列的中间值。是对序列分布中心的一个粗略估计。心的一个粗略估计。最大最小值最大最小值最大最小值最大最小值 (max and min)(max and min)序列中的最大最小值。序列中的最大最小值。标准差标准差标准差标准差(Standard Deviation)(Standard Deviation)标准差衡量序列的离散程度。计算公式如标准差衡量序列的离散程度。
43、计算公式如下下N 是样本中观测值的个数,是样本中观测值的个数,是样本均值。是样本均值。第八十张,PPT共九十八页,创作于2022年6月80l l 偏度偏度偏度偏度(SkewnessSkewness)衡量序列分布围绕其均值的非对称性。计算衡量序列分布围绕其均值的非对称性。计算公式如下公式如下 是变量方差的有偏估计。如果序列的分布是对称是变量方差的有偏估计。如果序列的分布是对称的,的,S值为值为0;正的;正的S值意味着序列分布有长的右拖尾,负的值意味着序列分布有长的右拖尾,负的S值意味着序值意味着序列分布有长的左拖尾。例列分布有长的左拖尾。例1.1中中X的偏度为的偏度为0,说明,说明X的分布是对称
44、的;而的分布是对称的;而例例1.3中中GDP增长率的偏度是增长率的偏度是0.78,说明,说明GDP增长率的分布是不对称的。增长率的分布是不对称的。第八十一张,PPT共九十八页,创作于2022年6月81l l 峰度峰度峰度峰度(KurtosisKurtosis)度量序列分布的凸起或平坦程度,计算度量序列分布的凸起或平坦程度,计算公式如下公式如下 分布的凸起程度大于分布的凸起程度大于 正态分布;如果正态分布;如果K值小于值小于3,序列分布相对于正态,序列分布相对于正态分布是平坦的。例分布是平坦的。例1.1中中X的峰度为的峰度为2.5,说明,说明X的分布相对于正态分的分布相对于正态分布是平坦的;而例
45、布是平坦的;而例1.3中中GDP增长率的峰度为增长率的峰度为2.14,说明,说明GDP增长率增长率的分布相对于正态分布也是平坦的。的分布相对于正态分布也是平坦的。意义同意义同S中中,正态分布的正态分布的 K 值为值为3。如果。如果 K 值大于值大于3,第八十二张,PPT共九十八页,创作于2022年6月821.2 1.2 均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验l 这部分是对序列均值、中位数、方差的假设检验。在序列对这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择象菜单选择View/tests for desc
46、riptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框:,就会出现下面的序列分布检验对话框:第八十三张,PPT共九十八页,创作于2022年6月831.1.1.1.均值检验均值检验均值检验均值检验 如果不指定序列如果不指定序列 x 的标准差,的标准差,EViews将在将在 t 统计量中使用该标准差统计量中使用该标准差的估计值的估计值 s。是是 x 的样本估计值的样本估计值,N是是x的观测值的个数。在原假设下,如果的观测值的个数。在原假设下,如果x服从正态分布,服从正态分布,t 统计量是自由度为统计量是自由度为N-1的的t分布分布。l 原假设是
47、序列原假设是序列 x 的期望值的期望值 m,备选假设是,备选假设是 m,即,即 第八十四张,PPT共九十八页,创作于2022年6月84l 如果给定如果给定x的标准差,的标准差,EViews计算计算t 统计量:统计量:是指定的是指定的x的标准差。的标准差。要要进进行行均均值值检检验验,在在Mean内内输输入入 值值。如如果果已已知知标标准准差差,想想要要计计算算t统统计计量量,在在右右边边的的框框内内输输入入标标准准差差值值。可可以以输输入入任任何何数数或或标标准准EViews表表达式,下页我们给出检验的输出结果。达式,下页我们给出检验的输出结果。第八十五张,PPT共九十八页,创作于2022年6
48、月85 这是检验例这是检验例1.7中中GDP增长率的均值,增长率的均值,检验检验H0:X=10%,H1:X10%。表中的表中的Probability值是值是P值(边际显著水平)。在双边值(边际显著水平)。在双边假设下,如果这个值小于检验的显著水平,如假设下,如果这个值小于检验的显著水平,如0.05则拒绝原假设。则拒绝原假设。这里我们不能拒绝原假设。这里我们不能拒绝原假设。第八十六张,PPT共九十八页,创作于2022年6月862.2.方差检验方差检验方差检验方差检验l 检验的原假设为序列检验的原假设为序列 x 的方差等于的方差等于 2,备选假设为双边的,备选假设为双边的,x 的方的方差不等于差不
49、等于 2,即,即 EViews计算计算 2统计量,计算公式如下统计量,计算公式如下 N为为观观测测值值的的个个数数,为为x的的样样本本均均值值。在在原原假假设设下下,如如果果x服服从从正态分布,正态分布,2 统计量是服从自由度为统计量是服从自由度为N-1的的 2分布分布。要要进行方差检验,在进行方差检验,在Variance处填入在原假设下的方差值。可以填处填入在原假设下的方差值。可以填入任何正数或表达式。入任何正数或表达式。第八十七张,PPT共九十八页,创作于2022年6月873 3.中位数检验中位数检验中位数检验中位数检验l 原假设为序列原假设为序列x的中位数等于的中位数等于m,备选假设为双
50、边假设,备选假设为双边假设,x的中位的中位数不等于数不等于m,即,即 EViews提供了三个以排序为基础的无参数的检验统计量。方法提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于的主要参考来自于Conover(1980)和)和Sheskin(1997)。)。进行中位数检验,在进行中位数检验,在Median右边的框内输入中位数的值,可以输入任右边的框内输入中位数的值,可以输入任何数字表达式。何数字表达式。第八十八张,PPT共九十八页,创作于2022年6月881.31.3 分布函数分布函数分布函数分布函数 EViews提供了几种对数据进行初步分析的方法。在提供了几种对数据进行初步分