《考研数学概率论总结(共33页).doc》由会员分享,可在线阅读,更多相关《考研数学概率论总结(共33页).doc(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上考研数学概率论部分重难点总结概率论是考研数学必须全得的分数,其实概率论也是考验数学三驾马车中最简单的一门,代数是最难的一门,因此,学好概率论是考验数学的必须部分。下面进行总结1.1 概率这门课的特点与线性代数一样,概率也比高数容易,花同样的时间复习概率也更为划算。但与线代一样,概率也常常被忽视,有时甚至被忽略。一般的数学考研参考书是按高数、线代、概率的顺序安排的,概率被放在最后,复习完高数和线代以后有可能时间所剩无多;而且因为前两部分分别占60%和20的分值,复习完以后多少会有点满足心理;这些因素都可能影响到概率的复习。概率这门课如果有难点就应该是“记忆量大”。在高数
2、部分,公式、定理和性质虽然有很多,但其中相当大一部分都比较简单,还有很多可以借助理解来记忆;在线代部分,需要记忆的公式定理少,而需要通过推导相互联系来理解记忆的多,所以记忆量也不构成难点;但是在概率中,由大量的概念、公式、性质和定理需要记清楚,而且若靠推导来记这些点的话,不但难度大耗时多而且没有更多的用处(因为概率部分考试时对公式定理的内在推导过程及联系并没有什么要求,一般不会在更深的层次上出题)。记得当初看到陈文灯复习指南概率部分第二章随机变量及其分布、第三章随机变量的数字特征中在每章开始列出的那些大表格时,感觉其中必然会有很多内容是超纲的、不用细看;但后来复习时才发现,可以省略不看的内容少
3、之又少,由大量的内容需要记忆。所以对于概率部分相当多的内容都只能先死记硬背,然后通过足量做题再来牢固掌握,走一条“在记忆的基础上理解”的路。记牢公式性质,同时保证足够的习题量,考试时概率部分20%的分值基本上就不难拿到了。1.2 概率第一章随机事件和概率本章内容在历年真题中都有涉及,难度一般不大。虽然对于本章中的古典概型可以出很难的题目,但大纲的要求并不高,考试时难题很少。填空、选择常考关于事件概率运算的题目,大多围绕形如、这样的式子利用各种概率运算公式求解;其它内容如全概率公式和贝叶斯公式在小题中和大题中都有可能考到。在“概率事件的关系及运算”部分有很多公式可以借助画集合运算图来辅助做题,比
4、如事件若与事件有包含关系,则可作图长方形内的点都属于的范围,圆形则代表的范围。这样一来即易看出事件包含关系的定义“发生时必发生,发生时不一定发生”;事件与的并可作图,则是、两个圆形(包含相交部分),对于这个大图形中的任意一点来说,不是属于就是属于,体现了 “事件与至少有一个发生”的定义;同理,事件与的差表示事件与同时发生,在上图中所有满足条件的点组成了两圆相交的那一部分。对于其它的概率运算公式也可用图辅助理解,有的题甚至可以直接通过作图来得到答案。如公式可以借助右图表示公式左端的等于、三个圆形各自互不相交的三部分再加上四小部分,而公式右端中的代表的区域包括、各自互不相交的三部分,比左端多加了一
5、次和两次,这时等式是不平衡的;再减去即是,与公式左端所代表的图形相比只少了一块,加上即可,故再加后等式成立。区别互斥、互逆、对立与不相容:事件与事件互斥也叫与不相容,即,事件与事件对立就是与互逆,即为与的关系。公式组在历年考研真题中频繁用到,很多题利用这三个公式间的相互转化关系很容易求得答案。这三个公式的含义从直观上就能理解:公式(1)表示事件、同时发生的概率等于发生的概率减去发生而不发生的概率;(2)式表示事件、同时发生的概率等于发生的概率乘以在发生的条件下也发生的概率;当、相互独立时,也就是指事件与事件的发生互不影响,此时应该有、所以由(2)式即可得出(3)式。出题人从这三个公式意义上的相
6、通性出发可以很灵活地构造题目,在后面的评题中会对这个知识点作更具体的讨论。1.3 第二章随机变量及其分布、第三章随机变量的数字特征、第四章大数定律和中心极限定理对于这一部分的复习可说的东西不多,因为在考试中出现的概率题目其实有相当大一部分难度是被解题所用的繁杂公式“分走”了,既然理解、掌握和牢记公式本身就不容易,那么题目的结构相对而言就要简单一些,我们甚至会发现历年真题中的有的题就像是课本上的例题一样。这种情况有点像我们在英语考试中作阅读理解题,问题本身的含义并不复杂,难就难在文章中的单词“似曾相识”和句子看不懂上。而英国学生考“语文”时做的阅读理解问题肯定要比我们遇到的题目要复杂深入的多因为
7、考察的重点不一样。所以对于概率部分的复习,有两个步骤即可:首先是牢记公式,然后是把题做熟,在练习过程中透彻理解概念公式和性质定理。陈文灯复习指南概率第二、三章把知识点列成了大表格,所有东西一目了然,复习时用来记忆和对比很方便。对于第二章的大表格也可以利用各部分之间的联系来对照复习,比如说二维分布的性质基本上与一维分布的性质一一对应(类似于二重积分和定积分性质之间的关系),二维边沿分布的内容与一维分布本质上也是相通的,离散型和连续型分布的各知识点也可互相对比、区别记忆。也就是“一维和二维相联系、离散和连续相对比、随机变量分布和随机变量函数的分布相区别”。同时对于重要分布如二项、泊松、正态、均匀、
8、指数分布必需记得非常牢,因为考试时会直接拿这些分布做题干来考察各章知识点,万一出现“由于题干中的分布函数不会写或写错而导致整道大题知道怎么做也没法做”的情况将是非常可惜的。本章的一维连续分布和二维离散分布在历年真题中出现频率最高,最常考分布是均匀、指数和正态分布。对于一维连续型分布的性质可借助图像理解因为分布函数,所以分别可用图中的阴影部分表示,容易看出多条性质,包括、等;而且在具体做题时用图像辅助理解也很有效,比如频繁在真题中出现的正态分布,作图辅助解题的效果更为明显。陈文灯复习指南第三章随机变量的数字特征也是用表格说话的,同样需要认真记好。本章在历年真题中最常出现的题目考察点是几个重点公式
9、,尤其是式子,大小题都可能利用这一式子的左端或右端出题而以另一端设置答案。还有数学期望与方差的定义及性质也是考察重点,可由下表对比记忆:数学期望方差(连续型) 若、相互独立,则有、(历年真题不止一次利用这个点作为填空和选择题中的小陷阱,因为一不留神就会写成,正如一样,但实际上)若、相互独立,则有无对应性质若、相互独立则同时具有以下4条性质:1. 2.3. 4. ,利用各式定义可以推导出来。考试大纲对第四章大数定理和中心极限定理的要求是:“了解切比雪夫不等式,了解切比雪夫大数定律、伯努利大数定律、辛钦大数定律,了解格林定理和林莫佛定理”。这三个“了解”在历年真题中的体现就是本章内容几乎是不考的,
10、只出现过直接考察公式定义的小题。同时本章的几个公式、定理也不好记,推导就更不是什么简单任务了。即便如此,以上的信息也还是不能成为放弃这一章的理由,因为对于这样“又难、大纲要求又低”的知识点考试时出题的深度也会是最浅的。如在真题中出现过的一个本章的填空题几乎就是直接考察切比雪夫不等式的公式本身,这样的情况对于难度低的知识点和重要知识点来说是绝不可能出现的,比如若你在06年考研数学试卷上见到一道填空题是让填出这个公式的话,那你肯定是把题义理解错了。所以花时间记住这几个公式其实是比较划算的,因为如果考试出一道有关的填空题,4分的得失将完全取决于记没记住公式。这样的4分当然要比在大题中绞尽脑汁得到的4
11、分好拿的多。从另一方面说,这些定理也是可以理解的:本章所有的大数定理都是指在独立同分布且存在数学期望的条件下若干随机变量的平均值依概率收敛到均值的期望,即。因为独立同分布,所以有,故有公式右侧,应有,即为辛钦大数定律;若用表示在n重伯努利试验中事件的发生次数则可得到伯努利大数定律。通过以上的分析可以减少一些死记硬背的难度。1.4 概率第五章数理统计的基本概念、第六章参数估计、第七章假设检验数理统计部分在考研数学试卷中占有概率部分1/3的分值,这一部分考点较少,参数估计最为重要,其次是样本与抽样分布,假设检验部分则很少考到。对于参数估计部分,需要记清楚据估计和极大似然估计各自的步骤,然后通过足量
12、做题来熟练掌握;对于样本与抽样分布,重要的是分布、t分布和F分布各自的条件和结论公式 ,在历年真题中考察过; 对于假设检验,大纲要求为:“1.理解显著性检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误”。可见大纲对于假设检验的要求还是较高的,但往年出题不多,不知道会不会在以后的考试中加大考察力度。概率这门课的全称是概率论和数理统计,数理统计是对概率论的实际应用,而概率论则充当了理论基础的角色。数理统计中的统计量如样本均值、样本方差等的概念性质都能在概率论中找到出发点。其实,数理统计就是一个先对随机变量做实际观测得到一系列具体数据,再利用“样本与抽样分布”部分的公式归纳出样
13、本均值、方差等统计量,在此基础上利用参数估计等方法推断出随机变量整体分布和数学特征的过程。 参数估计中的矩估计法就是令总体矩与样本矩相等,建立等式以求出总体矩;极大似然估计中的似然函数就是指样本取观察值的概率,自然应等于,其值越大就说明越有利于使者组样本值出现,故极大似然估计法要求求出使取最大值的作为参数的估计量。分析理解一下概率论和数理统计的前后联系可以起到“在大脑中进行数据压缩”的作用,而且这两部分的题目应该可以相互结合,从近年来的真题中可以隐隐约约感受到这种趋势。1.5 知识点总结第1章 随机事件及其概率(1)排列组合公式 从m个人中挑出n个人进行排列的可能数。 从m个人中挑出n个人进行
14、组合的可能数。(2)加法和乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事):mn某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由mn 种方法来完成。(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结
15、果称为随机事件。(5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用来表示。基本事件的全体,称为试验的样本空间,用表示。一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,表示事件,它们是的子集。为必然事件,为不可能事件。不可能事件()的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件()的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算关系:如果事
16、件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:AB,或者A+B。属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。A、B同时发生:AB,或者AB。AB=,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。运算: 结合率:A(BC)=(AB)C A(BC)=(AB)C 分配率:(AB)C=(AC)(BC) (A
17、B)C=(AC)(BC) 德摩根率: ,(7)概率的公理化定义设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1 0P(A)1, 2 P() =13 对于两两互不相容的事件,有常称为可列(完全)可加性。则称P(A)为事件的概率。(8)古典概型1 ,2 。设任一事件,它是由组成的,则有P(A)= =(9)几何概型若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,。其中L为几何度量(长度、面积、体积)。(10)加法公式P(A+B)=P(A)+P(B)-P(AB)当P
18、(AB)0时,P(A+B)=P(A)+P(B)(11)减法公式P(A-B)=P(A)-P(AB)当BA时,P(A-B)=P(A)-P(B)当A=时,P()=1- P(B)(12)条件概率定义 设A、B是两个事件,且P(A)0,则称为事件A发生条件下,事件B发生的条件概率,记为。条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(/B)=1P(/A)=1-P(B/A)(13)乘法公式乘法公式:更一般地,对事件A1,A2,An,若P(A1A2An-1)0,则有。(14)独立性两个事件的独立性设事件、满足,则称事件、是相互独立的。若事件、相互独立,且,则有若事件、相互独立,则可得到与、与、
19、与也都相互独立。必然事件和不可能事件与任何事件都相互独立。与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。(15)全概公式设事件满足1两两互不相容,2,则有。(16)贝叶斯公式设事件,及满足1 ,两两互不相容,0,1,2,2 ,则,i=1,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。(
20、17)伯努利概型我们作了次试验,且满足u 每次试验只有两种可能结果,发生或不发生;u 次试验是重复进行的,即发生的概率每次均一样;u 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,。第二章 随机变量及其分布(1)离散型随机变量的分布律设离散型随机变量的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为P(X=xk)=pk,k=1,2,,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:。显然分布律应满足下列条
21、件:(1), (2)。(2)连续型随机变量的分布密度设是随机变量的分布函数,若存在非负函数,对任意实数,有, 则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1 。2 。(3)离散与连续型随机变量的关系积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。(4)分布函数设为随机变量,是任意实数,则函数称为随机变量X的分布函数,本质上是一个累积函数。 可以得到X落入区间的概率。分布函数表示随机变量落入区间( ,x内的概率。分布函数具有如下性质:1 ;2 是单调不减的函数,即时,有 ;3 , ;4 ,即是右连续的;5 。对于离散
22、型随机变量,;对于连续型随机变量, 。(5)八大分布0-1分布P(X=1)=p, P(X=0)=q二项分布在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。, 其中,则称随机变量服从参数为,的二项分布。记为。当时,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。泊松分布设随机变量的分布律为,则称随机变量服从参数为的泊松分布,记为或者P()。泊松分布为二项分布的极限分布(np=,n)。超几何分布随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。几何分布,其中p0,q=1-p。随机变量X服从参数为p的几何分布,记为G(p)。均匀分布设随机
23、变量的值只落在a,b内,其密度函数在a,b上为常数,即axb 其他,则称随机变量在a,b上服从均匀分布,记为XU(a,b)。分布函数为 axb 0, xb。当ax1x2b时,X落在区间()内的概率为。指数分布 ,0, ,其中,则称随机变量X服从参数为的指数分布。X的分布函数为 , x0。 记住积分公式:正态分布设随机变量的密度函数为, ,其中、为常数,则称随机变量服从参数为、的正态分布或高斯(Gauss)分布,记为。具有如下性质:1 的图形是关于对称的;2 当时,为最大值;若,则的分布函数为。参数、时的正态分布称为标准正态分布,记为,其密度函数记为,分布函数为。是不可求积函数,其函数值,已编制
24、成表可供查用。(-x)1-(x)且(0)。如果,则。 (6)分位数下分位表:;上分位表:。(7)函数分布离散型已知的分布列为,的分布列(互不相等)如下:,若有某些相等,则应将对应的相加作为的概率。连续型先利用X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。第三章 二维随机变量及其分布(1)联合分布离散型如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。设=(X,Y)的所有可能取值为,且事件=的概率为pij,称为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示
25、: YXy1y2yjx1p11p12p1jx2p21p22p2jxipi1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)连续型对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X,Y)|axb,cyx1时,有F(x2,y)F(x1,y);当y2y1时,有F(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)(5)对于.(4)离散型与连续型的关系(5)边缘分布离散型X的边缘分布为;Y的边缘分布为。连续型X的边缘分布密度为Y的边缘分布密度为(6)条件分布离散型在已知X=xi的条件下,Y取值的条件分布为在已
26、知Y=yj的条件下,X取值的条件分布为连续型在已知Y=y的条件下,X的条件分布密度为;在已知X=x的条件下,Y的条件分布密度为(7)独立性一般型F(X,Y)=FX(x)FY(y)离散型有零不独立连续型f(x,y)=fX(x)fY(y)直接判断,充要条件:可分离变量正概率密度区间为矩形二维正态分布0随机变量的函数若X1,X2,Xm,Xm+1,Xn相互独立, h,g为连续函数,则:h(X1,X2,Xm)和g(Xm+1,Xn)相互独立。特例:若X与Y独立,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。(8)二维均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D
27、的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)U(D)。例如图3.1、图3.2和图3.3。y1 D1O 1 x图3.1yD211 O 2 x图3.2yD3dcO a b x图3.3(9)二维正态分布设随机向量(X,Y)的分布密度函数为其中是5个参数,则称(X,Y)服从二维正态分布,记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即XN(但是若XN(,(X,Y)未必是二维正态分布。(10)函数分布Z=X+Y根据定义计算:对于连续型,fZ(z)两个独立的正态分布的和仍为正态分布()。n个相互独立的正态分布的线性组合,仍服从正态分布。, Z=max,
28、min(X1,X2,Xn)若相互独立,其分布函数分别为,则Z=max,min(X1,X2,Xn)的分布函数为:分布设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和的分布密度为我们称随机变量W服从自由度为n的分布,记为W,其中所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。分布满足可加性:设则t分布设X,Y是两个相互独立的随机变量,且可以证明函数的概率密度为我们称随机变量T服从自由度为n的t分布,记为Tt(n)。F分布设,且X与Y独立,可以证明的概率密度函数为我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为Ff(n1, n2).第四
29、章 随机变量的数字特征(1)一维随机变量的数字特征离散型连续型期望期望就是平均值设X是离散型随机变量,其分布律为P()pk,k=1,2,n,(要求绝对收敛)设X是连续型随机变量,其概率密度为f(x),(要求绝对收敛)函数的期望Y=g(X) Y=g(X)方差D(X)=EX-E(X)2,标准差, 矩对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即k=E(Xk)= , k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=, k=1,2, .对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即k=E(Xk)
30、= k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=k=1,2, .切比雪夫不等式设随机变量X具有数学期望E(X)=,方差D(X)=2,则对于任意正数,有下列切比雪夫不等式切比雪夫不等式给出了在未知X的分布的情况下,对概率的一种估计,它在理论上有重要意义。(2)期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。(3)方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a2D(X); E(aX)
31、=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(XY)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(XY)=D(X)+D(Y) 2E(X-E(X)(Y-E(Y),无条件成立。而E(X+Y)=E(X)+E(Y),无条件成立。(4)常见分布的期望和方差期望方差0-1分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布n2nt分布0(n2)(5)二维随机变量的数字特征期望函数的期望方差协方差对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即与
32、记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。相关系数对于随机变量X与Y,如果D(X)0, D(Y)0,则称为X与Y的相关系数,记作(有时可简记为)。|1,当|=1时,称X与Y完全相关:完全相关而当时,称X与Y不相关。以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).协方差矩阵混合矩对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:(6)协方差的性质(i) cov (X, Y)=cov (Y, X);(ii) cov(aX,bY)=ab co
33、v(X,Y);(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);(iv) cov(X,Y)=E(XY)-E(X)E(Y).(7)独立和不相关(i) 若随机变量X与Y相互独立,则;反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是X和Y不相关。第五章 大数定律和中心极限定理(1)大数定律切比雪夫大数定律设随机变量X1,X2,相互独立,均具有有限方差,且被同一常数C所界:D(Xi)C(i=1,2,),则对于任意的正数,有特殊情形:若X1,X2,具有相同的数学期望E(XI)=,则上式成为伯努利大数定律设是n次独立试验中事件A发生的次数,p是事件A在每次
34、试验中发生的概率,则对于任意的正数,有伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即这就以严格的数学形式描述了频率的稳定性。辛钦大数定律设X1,X2,Xn,是相互独立同分布的随机变量序列,且E(Xn)=,则对于任意的正数有(2)中心极限定理列维林德伯格定理设随机变量X1,X2,相互独立,服从同一分布,且具有相同的数学期望和方差:,则随机变量的分布函数Fn(x)对任意的实数x,有此定理也称为独立同分布的中心极限定理。棣莫弗拉普拉斯定理设随机变量为具有参数n, p(0p1)的二项分布,则对于任意实数x,有(3)二项定理若当,则超几何分布的极限分布为二项分布
35、。(4)泊松定理若当,则其中k=0,1,2,n,。二项分布的极限分布为泊松分布。第六章 样本及抽样分布(1)数理统计的基本概念总体在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。个体总体中的每一个单元称为样品(或个体)。样本我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我
36、们称之为样本的两重性。样本函数和统计量设为总体的一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。常见统计量及其性质样本均值样本方差样本标准差样本k阶原点矩样本k阶中心矩,,其中,为二阶中心矩。(2)正态总体下的四大分布正态分布设为来自正态总体的一个样本,则样本函数t分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布。F分布设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数其中表示第一自由度为,第二自由度为的F分布。(3)正态总体下
37、分布的性质与独立。第七章 参数估计(1)点估计矩估计设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。若为的矩估计,为连续函数,则为的矩估计。极大似然估计当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称为样本的似然函数,简记为Ln.当总体X为离型随机变量时,设其分布律为,则称为样本的似然函数。若似然函数在处取到最大值,则称分别为的最大
38、似然估计值,相应的统计量称为最大似然估计量。若为的极大似然估计,为单调函数,则为的极大似然估计。(2)估计量的评选标准无偏性设为未知参数的估计量。若E ()=,则称 为的无偏估计量。E()=E(X), E(S2)=D(X)有效性设和是未知参数的两个无偏估计量。若,则称有效。一致性设是的一串估计量,如果对于任意的正数,都有则称为的一致估计量(或相合估计量)。若为的无偏估计,且则为的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。(3)区间估计置信区间和置信度设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含
39、这个待估参数,即那么称区间为的置信区间,为该区间的置信度(或置信水平)。单正态总体的期望和方差的区间估计设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:(i)选择样本函数;(ii)由置信度,查表找分位数;(iii)导出置信区间。已知方差,估计均值(i)选择样本函数(ii) 查表找分位数(iii)导出置信区间未知方差,估计均值(i)选择样本函数(ii)查表找分位数(iii)导出置信区间方差的区间估计(i)选择样本函数(ii)查表找分位数(iii)导出的置信区间第八章 假设检验基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。为
40、了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。这里所说的小概率事件就是事件,其概率就是检验水平,通常我们取=0.05,有时也取0.01或0.10。基本步骤假设检验的基本步骤如下:(i) 提出零假设H0; (ii) 选择统计量K;(iii) 对于检验水平查表找分位数;(iv) 由样本值计算统计量之值K;将进行比较,作出判断:当时否定H0,否则认为H0相容。两类错误第一类错误当H0为真时
41、,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即P否定H0|H0为真=;此处的恰好为检验水平。第二类错误当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即P接受H0|H1为真=。两类错误的关系人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平。大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把取得很小,如0.01,甚至0.001。反之,则应把取得大些。单正态总体均值和方差的假设检验条件零假设统计量对应样本函数分布否定域已知N(0,1)未知未知专心-专注-专业