《第四章随机数产生原理优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章随机数产生原理优秀PPT.ppt(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章随机数产生原理第四章随机数产生原理第一页,本课件共有100页2022/12/5信息统计分析24.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5 正态分布随机数的产生正态分布随机数的产生4.6 MATLAB统计库中的随机数发生器统计库中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第二页,本课件共有100页2022/12/5信息统计分析3v以以随随机机数数产产生生为为基基础础的的Monte-Carlo方方法法
2、已已成成为为现现代代科科研研的的重重要要手手段段之之一一。其其意意义义早早以以超超出出了了概概率率论论与与数数理理统统计计的的范范畴畴。广广泛泛应应用用于于计计算算方方法法、随随机机数数规规划划、管管理理科科学学、物物理理化化学学中中的的高高分分子子结结构构的的研研究究等等领领域域。我我们来看一些例子。们来看一些例子。第三页,本课件共有100页2022/12/5信息统计分析41、数值计算的研究、数值计算的研究数数值值计计算算的的研研究究可可以以说说是是一一切切Monte-Carlo应应用用的的基基础础,在在计计算算数数学学领领域域我我们们遇遇到到了了很很多多的的复复杂杂计计算算,一一个个典典型
3、型的的例例子子是是计计算算积积分分。对对于于一一维维、二二维维的的问问题题早早已已获获得得解解决决。但但是是当当遇遇到到高高维维积积分分问问题题时时,我我们们传传统统的的数数值值方方法法都都由由于于计计算算量量太太大大而而陷陷于于了了困困境境。但但是是高高维维积积分分问问题题又又偏偏偏偏是是物物理理、高高分分子子化化学学、运运筹筹学和最优化问题迫切而必须解决的问题。我们来看一个例子。学和最优化问题迫切而必须解决的问题。我们来看一个例子。这里这里第四页,本课件共有100页2022/12/5信息统计分析5这是一个众所周知的积分公式,我们当然也可以把它一般的看这是一个众所周知的积分公式,我们当然也可
4、以把它一般的看为是一个高维积分,如果从传统的数值计算方法来看待,则高为是一个高维积分,如果从传统的数值计算方法来看待,则高维问题是随着维数的增加计算量成指数增加的,计算很快就失维问题是随着维数的增加计算量成指数增加的,计算很快就失去控制。但是如果我们换一个角度来看待这个问题,从概率论去控制。但是如果我们换一个角度来看待这个问题,从概率论的角度,它实际是:的角度,它实际是:即是即是f(x)的均值,对于均值我们有一个很好的估计,即)的均值,对于均值我们有一个很好的估计,即第五页,本课件共有100页2022/12/5信息统计分析6【例【例4.1.1】用用Monte-Carlo 对对 积分积分解:将积
5、分区域和值域看成是一个边长为一的正方形。利用均匀分布随解:将积分区域和值域看成是一个边长为一的正方形。利用均匀分布随机数将点撒在正方形中,计算小于函数的个数并除全部点数。这就是积机数将点撒在正方形中,计算小于函数的个数并除全部点数。这就是积分的近似值。分的近似值。%利用利用Monte-Carlo方法计算定积分方法计算定积分x=rand(1,1000);x_2=x.2;JF=mean(x_2)%作作Monte-Carlo积分示意图积分示意图for i=1:1000 xx=rand(1,100);yy=rand(1,100);endx1=linspace(0,1,50);y1=x1.2;plot(
6、xx,yy,.,x1,y1,linewidth,2)axis equalh=legend(x-y,x2);JF=0.3346第六页,本课件共有100页2022/12/5信息统计分析7面积计算结果为:面积计算结果为:s=0.3482第七页,本课件共有100页2022/12/5信息统计分析8【例【例4.1.2】利用利用Monte-Carlo方法计算定积分。方法计算定积分。解:抽两组随机数,求每组元素的平方代入给定的函数,然后求平均值解:抽两组随机数,求每组元素的平方代入给定的函数,然后求平均值即得积分的近似值。即得积分的近似值。%Monte-Carlo方法积分二重积分并与数值方法的结果进行比较方法
7、积分二重积分并与数值方法的结果进行比较Q=dblquad(sin(x.2+y.2),0,1,0,1)%数值求积分命令数值求积分命令x=rand(2,100000);%产生两组随机数产生两组随机数Sin_xy=sin(x(1,:).2+x(2,:).2);%代入函数代入函数JF_Sin_xy=mean(Sin_xy)%用用Monte-Carlo方法求积分值方法求积分值计算结果为:计算结果为:Q=0.5613JF_Sin_xy=0.5612当抽样数很大时结果很接近。我们可以从当抽样数很大时结果很接近。我们可以从Monte-Carlo方法中看出,方法中看出,如果维数增加实际计算难度并不增加,因此是处
8、理高维问题的有效方如果维数增加实际计算难度并不增加,因此是处理高维问题的有效方法。法。第八页,本课件共有100页2022/12/5信息统计分析9这这里里x是是积积分分定定义义域域中中的的均均匀匀分分布布随随机机数数,这这是是革革命命性性的的一一个个视视角角。从从这这个个视视角角,我我们们把把繁繁难难的的积积分分计计算算变变成成了了简简单单的的算算术术平平均均,而而大大量量的的抽抽样样计计算算又又是是计计算算机机的的拿拿手手好好戏戏,更更重重要要的的是是当当维维数数增增加加时时并并不不增增加加计计算算难难度度,从从而而用用Monte-Carlo 方方法法研研究究高高维维积积分分问问题题已已是是当
9、今计算数学界的热门课题。当今计算数学界的热门课题。2 2、管理科学的系统仿真研究、管理科学的系统仿真研究 管管理理科科学学中中的的系系统统仿仿真真研研究究,如如服服务务系系统统、库库存存系系统统等等。其其共共性性就就是是研研究究的的对对象象是是随随机机数数,如如顾顾客客到到达达时时间间一一般般是是一一个个服服从从指指数数分分布布的的随随机机数数,而而服服务务时时间间也也可可以以看看成成是是服服从从某某种种分分布布的的随随机机数数,当当一一个个系系统统是是多多队队多多服服务务体体系系时时,问问题题就就变变的的相相当当复复杂杂了了。我我们们很很难难用用数数学学的的解解析析式式来来表表达达。这这时时
10、Monte-Carlo方方法法也也是是有有利利的的武武器器。对对于于这这个个领领域域的的已已有有各各种种比比较较成成熟的专用软件如熟的专用软件如GPSS、SIMULATION等可以使用等可以使用。第九页,本课件共有100页2022/12/5信息统计分析103.物理化学中的分子领域物理化学中的分子领域50年年代代科科学学家家已已经经在在高高分分子子领领域域使使用用Monte-Carlo方方法法了了。这这一一领领域域所所研研究究的的问问题题更更加加复复杂杂,计计算算量量非非常常之之大大。高高分分子子材材料料是是由由几几乎乎是是无无穷穷的的高高分分子子链链组组成成,而而每每一一个个链链的的长长度度又
11、又是是10的的好好几几次次方方。而而链链的的构构象象又又是是千千差差万万别别,而而且且是是随随机机游游动动的的。如如何何在在中中微微观观上上几几乎乎是是无无规规律律的的现现象象中中去去判判断断其其宏宏观观的的性性质质?用用数数学学的的解解析析式式来来说说明明这这样样的的现现象象是是苍苍白白无无力力的的。Monte-Carlo方方法法是是一一个个很很好好的的工工具具,它它使使得得科科学学家家用用Monte-Carlo方方法法去去探探索索高高分分子子运运动动的的规规律律。一一个个典典型型的的例例子子是是:对对于于高高分分子子多多链链体体的的研研究究这这是是一一个个很很复复杂杂的的问问题题,直直到到
12、标标度度理理论论和和重重正正化化群群理理论论方方法法的的引引入入,才才使使得得单单链链构构象象统统计计问问题题得得到到了了较好的解决。较好的解决。第十页,本课件共有100页2022/12/5信息统计分析114.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5 正态分布随机数的产生正态分布随机数的产生4.6 MATLAB统计库中的随机数发生器统计库中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第十一页,本课件共有1
13、00页2022/12/5信息统计分析12v前前面面Monte-Carlo方方法法的的例例子子是是以以高高质质量量的的随随机机数数为为基基础的。通过完全的随机抽样或调查可以产生随机序列础的。通过完全的随机抽样或调查可以产生随机序列。当我们用当我们用Monte-Carlo方法研究一个实际问题时,我们需要快方法研究一个实际问题时,我们需要快速地获得大量的随机数。用计算机产生这样的随机数是非常方速地获得大量的随机数。用计算机产生这样的随机数是非常方便的,用数学方法在计算机上产生的随机数称为伪随机数。便的,用数学方法在计算机上产生的随机数称为伪随机数。第十二页,本课件共有100页2022/12/5信息统
14、计分析13基本定理:基本定理:如果随机变量如果随机变量X的分布函数的分布函数F(x)连续,则)连续,则R=F(x)是)是0,1上的均匀分布的随机变量。上的均匀分布的随机变量。以以表示随机变量表示随机变量R 的分布函数,则有的分布函数,则有(4.2.1)证:因为分布函数证:因为分布函数F(x)是在()是在(0,1)上取值单调递增的连续函数,)上取值单调递增的连续函数,所以当所以当X在在(,x)内取值时,随机变量)内取值时,随机变量R则在(则在(0,F(x))上)上取值,且对应于(取值,且对应于(0,1)上的一个)上的一个R值,至少有一个值,至少有一个x满足,见图满足,见图4.2.1第十三页,本课
15、件共有100页2022/12/5信息统计分析14=证毕证毕图图4.2.1 (4.2.2)第十四页,本课件共有100页2022/12/5信息统计分析15基本定理给出了任一随机变量和均匀分布基本定理给出了任一随机变量和均匀分布R之间的关系。而有些随之间的关系。而有些随机变量可以通过分布函数的逆变换来获得,因此如果我们可以机变量可以通过分布函数的逆变换来获得,因此如果我们可以产生高质量的均匀分布,我们就可以通过变换获得高质量的其产生高质量的均匀分布,我们就可以通过变换获得高质量的其他分布。见公式他分布。见公式(4.2.3)(4.2.3)例例4.2.1 求指数分布的随机数。令求指数分布的随机数。令 从
16、从而而我我们们用用服服从从0,1上上的的随随机机数数R,通通过过上上面面的的公公式式就就可可以以得得到到指数分布的随机数了。指数分布的随机数了。第十五页,本课件共有100页2022/12/5信息统计分析16例例4.2.1 产生产生1000个均匀分布随机数,利用变换产生个均匀分布随机数,利用变换产生=6的指数分布并进的指数分布并进行拟合优度检验。行拟合优度检验。clc,clearx=linspace(0,20,100);R=rand(1,1000);%产生产生1000个(个(0,1)均匀随机数)均匀随机数ex=-6*log(1-R);%变换为指数分布随机数变换为指数分布随机数ex=ex;m=me
17、an(ex)v=var(ex)subplot(1,2,1),cdfplot(ex)subplot(1,2,2),hist(ex)kstest(ex,ex expcdf(ex,6)%拟合优度检验拟合优度检验结果为:结果为:H=0,接受原假设,变换后的确为接受原假设,变换后的确为=6的指数分布的指数分布第十六页,本课件共有100页2022/12/5信息统计分析17第十七页,本课件共有100页2022/12/5信息统计分析184.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5 正态分布随
18、机数的产生正态分布随机数的产生4.6 MATLAB统计库中的随机数发生器统计库中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第十八页,本课件共有100页2022/12/5信息统计分析19算法要求算法要求产生的数值序列要具有均匀总体简单子样的一些概率统计产生的数值序列要具有均匀总体简单子样的一些概率统计特性,通常包括分布的均匀性,抽样的随机性,试验的独特性,通常包括分布的均匀性,抽样的随机性,试验的独立性和前后的一致性。立性和前后的一致性。产生的随机数要有足够长的周期。产生的随机数要有足够长的周期。产生随机数速度快,占用内存
19、小。产生随机数速度快,占用内存小。第十九页,本课件共有100页2022/12/5信息统计分析20为了达到快速的要求,一般采用递推公式为了达到快速的要求,一般采用递推公式(4.3.1)目前最常用的方法是上述方法的一个特例:目前最常用的方法是上述方法的一个特例:混合同余法混合同余法(4.3.2)其中其中a,b,M 以及初值以及初值y 都是正整数,其中都是正整数,其中modM运算定义为:运算定义为:任一整数任一整数y 可唯一表示为公式可唯一表示为公式则则容易看出容易看出 x 满足满足0 x1。第二十页,本课件共有100页2022/12/5信息统计分析21乘同余法乘同余法当当 b=0 时,有时,有(4
20、.3.4)加同余法加同余法 以下形式的同余法称为加同余法以下形式的同余法称为加同余法(3.4.5)第二十一页,本课件共有100页2022/12/5信息统计分析22 例例4.3.1 历史上比较有名的称为历史上比较有名的称为“菲波那西菲波那西”数列为加同余法数列为加同余法的特例。的特例。(4.3.6)当当M=8 时,取初值得时,取初值得“菲波那西菲波那西”数列。数列。0,1,1,2,3,5,8,13,21,34,55,89,144,253 对上述数列取模得:对上述数列取模得:0,1,1,2,3,5,0,5,5,7,1,1 (4.3.7)再除以模再除以模M 我们可得到我们可得到(0,1)之间的序列之
21、间的序列。第二十二页,本课件共有100页2022/12/5信息统计分析23我们知道对于一个来自均匀分布的随机序列,应该满足独立性、均匀性我们知道对于一个来自均匀分布的随机序列,应该满足独立性、均匀性等统计特性,但伪随机数往往有一些缺陷,例如等统计特性,但伪随机数往往有一些缺陷,例如(4.3.7)序列到一定序列到一定长度后,又开始重复下面的序列,这称为周期性是一种明显的长度后,又开始重复下面的序列,这称为周期性是一种明显的规律,与随机性矛盾。通常我们只能选用一个周期内的序列作规律,与随机性矛盾。通常我们只能选用一个周期内的序列作为我们的伪随机数。因此研究一种算法,使得其产生的随机序为我们的伪随机
22、数。因此研究一种算法,使得其产生的随机序列的周期尽可能长,我们可以通过调节(列的周期尽可能长,我们可以通过调节(4.3.1)的参数来实现。)的参数来实现。因此如何来获得一个周期比较长的序列,就成了我们研究的一因此如何来获得一个周期比较长的序列,就成了我们研究的一个内容:有关伪随机数序列的周期有如下的一些结论:个内容:有关伪随机数序列的周期有如下的一些结论:第二十三页,本课件共有100页2022/12/5信息统计分析24定理定理 4.3.1 混合同余法产生序列达最大周期混合同余法产生序列达最大周期M 的充要条件:的充要条件:(1)b 与与M 互素互素(2)对于对于M 的任意素因子的任意素因子p,
23、有,有(3)如果如果4 是是M 的因子,则的因子,则 显然乘同余法产生的序列达不到周期显然乘同余法产生的序列达不到周期M(不满足(不满足(1)。当)。当取取(k为任意整数)时,因为为任意整数)时,因为M 只有一个素因子只有一个素因子2,且且4是是M 的因子,则由条件(的因子,则由条件(2)、()、(3)有)有,从而混合同余发生器达到最大周期的算法为:从而混合同余发生器达到最大周期的算法为:(3.4.8)第二十四页,本课件共有100页2022/12/5信息统计分析25其中其中c,d为任意整数。混合同余发生器是否达到最大周期为任意整数。混合同余发生器是否达到最大周期M与初始值与初始值无关。无关。对
24、于乘同余发生器,由同余运算的定义,知其由如下性质对于乘同余发生器,由同余运算的定义,知其由如下性质(1)如果如果则有:则有:(2)如果)如果则则其中(其中(c,M)是)是c,M的最大公约数。的最大公约数。第二十五页,本课件共有100页2022/12/5信息统计分析26利用这些性质可得到以下定理。利用这些性质可得到以下定理。定理定理4.3.2 对乘同余发生器,若对乘同余发生器,若,则使,则使成立得最小正整数成立得最小正整数V 就是此发生器得周期。就是此发生器得周期。在数论中称在数论中称V 为为a 关于关于M 的阶数,对于乘同余发生器,若种子与的阶数,对于乘同余发生器,若种子与M 互素,则其周期就
25、是关于互素,则其周期就是关于M 的阶数。这样一来,寻找达到最大的阶数。这样一来,寻找达到最大周期的同余发生器的问题就转化为数论方面寻求周期的同余发生器的问题就转化为数论方面寻求M达到最大阶达到最大阶数数a 的问题了。的问题了。Knuth 对这一问题的研究作了总结。对这一问题的研究作了总结。第二十六页,本课件共有100页2022/12/5信息统计分析27从算法上我们知道公式是递推的,因此一般的随机发生器程序都要从算法上我们知道公式是递推的,因此一般的随机发生器程序都要预先赋初值,这种初值为种(预先赋初值,这种初值为种(Seed),有些统计软件如),有些统计软件如SPSS要要求用户给出求用户给出S
26、eed.以以均均匀匀分分布布(0,1)随随机机变变量量R变变换换成成的的随随机机变变量量。以以r,u,分分别别表表示示(0,1)均均匀匀分分布布,指指数数分分布布,N(0,1)标标准准正正态态分分布布。其其他他常常见见的分布如卡方分布、的分布如卡方分布、F分布等的抽样方法见表分布等的抽样方法见表4.3.1。第二十七页,本课件共有100页2022/12/5信息统计分析28第二十八页,本课件共有100页2022/12/5信息统计分析294.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5
27、 正态分布随机数的产生正态分布随机数的产生4.6 MATLAB统计库中的随机数发生器统计库中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第二十九页,本课件共有100页2022/12/5信息统计分析30v直接抽样法由基本定理我们知道,对于有些随机变量可以建立与由基本定理我们知道,对于有些随机变量可以建立与R的函数关系,因的函数关系,因此只需对此只需对R进行抽样,利用函数的映射关系我们就可以方便地得到该随机进行抽样,利用函数的映射关系我们就可以方便地得到该随机变量的抽样了。如前面的指数分布随机数。变量的抽样了。如前面的指数分布
28、随机数。v变换抽样产生随机变量的变换抽样方法,是讨论均匀分布的不同函数分布,为产生随机变量的变换抽样方法,是讨论均匀分布的不同函数分布,为随机变量抽样提供一些简单可行的算法。在概率论中,从不同的角度随机变量抽样提供一些简单可行的算法。在概率论中,从不同的角度出发,对随机变量函数进行了讨论,以下列出一些结果。出发,对随机变量函数进行了讨论,以下列出一些结果。第三十页,本课件共有100页2022/12/5信息统计分析31设随机变量设随机变量X 具有密度函数具有密度函数,是对随,是对随机变量机变量X 的变换,且的变换,且的逆函数存在,记为的逆函数存在,记为有一阶连续导数,则随机变量的密度函数有一阶连
29、续导数,则随机变量的密度函数,(4.4.1)例例4.4.1 R,1-R均为(均为(0,1)上的均匀分布随机变量,设随机向)上的均匀分布随机变量,设随机向量(量(X,Y)具有二维联合密度。对于随机变量)具有二维联合密度。对于随机变量X,Y 进行函数进行函数变换变换第三十一页,本课件共有100页2022/12/5信息统计分析32其中,函数其中,函数,的逆变换存在,记为的逆变换存在,记为且存在一阶偏导数,设且存在一阶偏导数,设J 为为Jacobi 变换变换则随机变量的二维联合密度为则随机变量的二维联合密度为(4.4.2)第三十二页,本课件共有100页2022/12/5信息统计分析33例例4.4.2
30、用变换抽样产生标准正态分布的随机变量用变换抽样产生标准正态分布的随机变量U 随机变量随机变量U 的密度函数为的密度函数为:取随机数取随机数,则则相互独立、服从相互独立、服从N(0,1)分布。解上面的两个方程,得逆变换)分布。解上面的两个方程,得逆变换公式公式第三十三页,本课件共有100页2022/12/5信息统计分析34由由(4.4.2),随机变量,随机变量的密度函数的密度函数从而我们知道是两个独立的标准正态分布。从而我们知道是两个独立的标准正态分布。下面还有几个常用的二维函数的变换结果。下面还有几个常用的二维函数的变换结果。1)随机变量和随机变量和的密度函数的密度函数(4.4.3)2)随机变
31、量的积随机变量的积 的密度函数的密度函数(4.4.4)第三十四页,本课件共有100页2022/12/5信息统计分析353)随机变量的商随机变量的商 X/Y(4.4.5)3、值序抽样、值序抽样 值序统计量值序统计量,通常称为值序量。是随机向量,通常称为值序量。是随机向量的一个函数,取其一个实现的一个函数,取其一个实现并排序得并排序得其中的第其中的第 l 个个值为函数值。显然这是一个统计量值为函数值。显然这是一个统计量第三十五页,本课件共有100页2022/12/5信息统计分析36若随机变量若随机变量的各个分量独立且同分布,则值序统计量的各个分量独立且同分布,则值序统计量的密度函数的密度函数和分布
32、函数分别为:和分布函数分别为:这里,这里,F(x),f(x)分别为随机变量在分布函数和密度函数。分别为随机变量在分布函数和密度函数。第三十六页,本课件共有100页2022/12/5信息统计分析37特别当随机变量特别当随机变量为为0,1上的均匀分布时,上的均匀分布时,得密度函数为:得密度函数为:这是这是 分布的密度函数分布的密度函数因此我们可以很容易地产生特殊的因此我们可以很容易地产生特殊的 分布的随机数。分布的随机数。第三十七页,本课件共有100页2022/12/5信息统计分析38例例4.4.3 产生服从产生服从分布的随机数分布的随机数若随机变量若随机变量的密度函数为:的密度函数为:利用(利用
33、(0,1)均匀分布随机数我们可以如下产生特殊)均匀分布随机数我们可以如下产生特殊 随随机数机数(1)(2)(3)(4)第三十八页,本课件共有100页2022/12/5信息统计分析39我们来验证(我们来验证(2),即是否服从),即是否服从a=1,b=5的贝塔分布,按公式抽的贝塔分布,按公式抽5个均匀个均匀分布的随机数,取其中最小的为一个样本,共取分布的随机数,取其中最小的为一个样本,共取1000个,然后用分布的个,然后用分布的Kolmogorov-Smirnov拟合优度检验,程序如下:拟合优度检验,程序如下:%例例4.4.3验证验证(2)%抽抽5个均匀分布随机数,产生一个服从个均匀分布随机数,产
34、生一个服从bata分布的随机数分布的随机数for i=1:1000 B(i)=min(rand(1,5);endB=B;%转置为列向量转置为列向量h=kstest(B,B betacdf(B,1,5)%检验服从检验服从bata分布吗?分布吗?计算结果为:计算结果为:h=0接受原假设,服从接受原假设,服从a=1,b=5的贝塔分布。学习者可以验证其余的抽的贝塔分布。学习者可以验证其余的抽样公式。样公式。第三十九页,本课件共有100页2022/12/5信息统计分析404.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的
35、产生其他分布随机数的产生4.5 正态分布随机数的产生正态分布随机数的产生4.6 MATLAB统计库中的随机数发生器统计库中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第四十页,本课件共有100页2022/12/5信息统计分析41v正态分布在数理统计中具有基础性的作用,因此产生高质量的正态分布有重要的意义,这一节我们将介绍几种数值方法求正态分布,利用中心极限定理产生正态分布的随机数。第四十一页,本课件共有100页2022/12/5信息统计分析42 1)利用中心极限定理产生随机数利用中心极限定理产生随机数 中心极限定理:中心极
36、限定理:设设 服从均值为服从均值为,方差为,方差为2 2 的某一分布,令的某一分布,令(4.5.1)则当则当n 充分大时,充分大时,渐近地服从标准正态分布渐近地服从标准正态分布N(0,1)注意,这个定理没有指出随机变量注意,这个定理没有指出随机变量x 是服从什么分布的。这是服从什么分布的。这正是该定理的神奇之处。我们现在已经能产生正是该定理的神奇之处。我们现在已经能产生0,1均匀分均匀分布的随机数了,那么我们可以利用这个定理来产生标准正态布的随机数了,那么我们可以利用这个定理来产生标准正态分布的随机数。分布的随机数。第四十二页,本课件共有100页2022/12/5信息统计分析43现在我们产生现
37、在我们产生n个个0,1均匀分布随机数,均匀分布随机数,由公式(由公式(4.5.1)我们有:)我们有:为编程方便,我们特别选为编程方便,我们特别选 n=12,则,则 这样我们很方便地就把标准正态分布随机数计算出来了。这样我们很方便地就把标准正态分布随机数计算出来了。第四十三页,本课件共有100页2022/12/5信息统计分析44例例4.5.1 利用中心极限定理产生标准正态分布随机数并检验利用中心极限定理产生标准正态分布随机数并检验%example 4.5.1clc,clearfor i=1:1000R=rand(1,12);X(i)=sum(R)-6;endX=X;m=mean(X)v=var(
38、X)subplot(1,2,1),cdfplot(X)subplot(1,2,2),histfit(X)h=kstest(X,X normcdf(X,0,1)结果为:结果为:H=0,接受原假设,变换后的确为标准正态分布。接受原假设,变换后的确为标准正态分布。第四十四页,本课件共有100页2022/12/5信息统计分析45第四十五页,本课件共有100页2022/12/5信息统计分析464.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5 正态分布随机数的产生正态分布随机数的产生4.6
39、MATLAB统计工具箱中的随机数发生器统计工具箱中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第四十六页,本课件共有100页2022/12/5信息统计分析47随机数发生器随机数发生器在在MATLAB统计工具箱中为我们提供了大量的产生各种随机数发统计工具箱中为我们提供了大量的产生各种随机数发生器程序,我们只需要调用就可以产生我们想要的随机数。生器程序,我们只需要调用就可以产生我们想要的随机数。第四十七页,本课件共有100页2022/12/5信息统计分析48betarnd贝塔分布随机数发生器chi2rnd卡方分布随机数发生器e
40、vrnd极值随机数发生器exprnd指数分布随机数发生器frndF分布随机数发生器gamrnd伽马分布随机数发生器geornd几何分布随机数发生器hygernd超几何分布随机数发生器lognrnd对数正态分布随机数发生器mvnrnd多元正态分布随机数发生器mvtrnd多元t分布随机数发生器nbinrnd负二项分布随机数发生器ncfrnd非中心F分布随机数发生器第四十八页,本课件共有100页2022/12/5信息统计分析49nctrnd非中心t分布随机数发生器ncx2rnd非中心卡方分布随机数发生器normrnd正态分布随机数发生器poissrnd泊松分布随机数发生器trndt分布随机数发生器u
41、nidrnd离散均匀分布随机数发生器unifrnd连续均匀分布随机数发生器wblrnd威布尔分布随机数发生器第四十九页,本课件共有100页2022/12/5信息统计分析50例例4.6.1 设正态二维分布的密度函数为:设正态二维分布的密度函数为:作二维分布的散点图和直方图作二维分布的散点图和直方图%例例4.6.1 二维独立正态分布的散点图和直方图二维独立正态分布的散点图和直方图mu=0 0;sigma=1 0;0 1;r=mvnrnd(mu,sigma,1000);subplot(1,2,1),plot(r(:,1),r(:,2),+)subplot(1,2,2),hist3(r,10 10)第
42、五十页,本课件共有100页2022/12/5信息统计分析51第五十一页,本课件共有100页2022/12/5信息统计分析524.1 引言引言4.2 伪随机数产生原理伪随机数产生原理4.3 0,1均匀分布随机数的算法均匀分布随机数的算法4.4 其他分布随机数的产生其他分布随机数的产生4.5 正态分布随机数的产生正态分布随机数的产生4.6 MATLAB统计工具箱中的随机数发生器统计工具箱中的随机数发生器4.7 随机数的检验随机数的检验4.8 案例分析案例分析第四章第四章 随机数的产生原理随机数的产生原理第五十二页,本课件共有100页2022/12/5信息统计分析53v我们已经基本清楚伪随机数的产生
43、原理,由于并不是真正的随机数,很自然的问题是,它们是否具有真正随机数的那些统计性质如参数大小、独立性,均匀性等等。v设:随机数具有连续的分布函数F(X),则随机变量R=(X)是均匀分布(0,1)的随机变量,因此如果R通过统计检验随机变量 X也可以通过。因此我们以下着重讨论均匀分布R的检验问题,再简单地讨论正态随机数检验问题。第五十三页,本课件共有100页2022/12/5信息统计分析54 1、统计检验中两类常用统计量的构造检验方法统计检验中两类常用统计量的构造检验方法(1)设随机变量)设随机变量X 具有数学期望具有数学期望E(X)=,和有限方差,和有限方差D(X)=,我们抽,我们抽N 次样本。
44、次样本。X1,X2,XN,当,当N充充分大时,统计量分大时,统计量(4.6.1)以以N(0,1)为极限分布,取显著水平)为极限分布,取显著水平=0.05,则拒绝为则拒绝为(,1.96),(),(1.96,)。)。当当 1.96,则认为差异显著,拒绝假设,则认为差异显著,拒绝假设E(X)=第五十四页,本课件共有100页2022/12/5信息统计分析55(2)将样本)将样本X1,X2,NN,按一定规则分为不相交的,按一定规则分为不相交的K 组,记组,记i 组的观测频数为组的观测频数为ni(i=1,,k),若随机变量),若随机变量X 落于弟落于弟i 组的概率为组的概率为Pi,则得理论频数,则得理论频
45、数m i=N Pi,由,由ni,mi构造统计量。构造统计量。=(4.6.2)渐近服从自由度为渐近服从自由度为的分布,简记的分布,简记这里,这里,l 是确定概率是确定概率P 时,由子样时,由子样X 中给出的约束条件数。为有效地进行中给出的约束条件数。为有效地进行统计检验,一般要求(统计检验,一般要求(4.6.2)的样本数)的样本数N30;在(;在(4.6.2)中)中k5,mi5。第五十五页,本课件共有100页2022/12/5信息统计分析56当统计量的自由度当统计量的自由度时,时,U=渐近服从渐近服从N(0,1)分布。)分布。服从柯尔莫格洛夫服从柯尔莫格洛夫斯米尔诺夫的统计量斯米尔诺夫的统计量取
46、显著性水平取显著性水平=0.05,=0.05,可拒绝原假设。可拒绝原假设。我们可以用这种方法进行独立性,及拟合优度检验。我们可以用这种方法进行独立性,及拟合优度检验。第五十六页,本课件共有100页2022/12/5信息统计分析572、随机数的统计性质检验随机数的统计性质检验设均匀分布的随机样本为:设均匀分布的随机样本为:(4.6.34.6.3)是一组需要检验的是一组需要检验的0,1均匀分布随机数,利用均匀分布随机数,利用(4.6.1),(4.6.2)我们构造统计量来对常用的参数进行统计检验。我们构造统计量来对常用的参数进行统计检验。第五十七页,本课件共有100页2022/12/5信息统计分析5
47、81)参数检验)参数检验参数检验是检验参数估计值与理论值的差异是否显著的方法,参数检验是检验参数估计值与理论值的差异是否显著的方法,设我们有设我们有0,1 均匀分布样本均匀分布样本R1,R2,RN(4.6.44.6.4)我们可以构造以下统计量(参数估计量)我们可以构造以下统计量(参数估计量)第五十八页,本课件共有100页2022/12/5信息统计分析59即随机变量即随机变量R的一阶距,二阶距和方差这些参数的估计量。根据的一阶距,二阶距和方差这些参数的估计量。根据随机变量随机变量R的理论分布,不难计算的理论分布,不难计算第五十九页,本课件共有100页2022/12/5信息统计分析60现在我们可以
48、应用中心极限定理及(现在我们可以应用中心极限定理及(4.5.1)来构造统计量了)来构造统计量了渐近服从渐近服从N(0,1)分布,从而可以推断样本估计值与理论参数的)分布,从而可以推断样本估计值与理论参数的差异。我们还可以利用同样的方法去构造三阶矩、四阶矩,对随机差异。我们还可以利用同样的方法去构造三阶矩、四阶矩,对随机变量的偏度和峰度进行参数检验。变量的偏度和峰度进行参数检验。第六十页,本课件共有100页2022/12/5信息统计分析61例例4.7.1 对随机数发生器对随机数发生器unifrnd产生的产生的1000个随机数进行均值、方差、个随机数进行均值、方差、偏度和峰度等的参数的检验。偏度和
49、峰度等的参数的检验。偏度计算方法为:偏度计算方法为:u3=mean(R-R_mean)/R_std).3)*0.408248*sqrt(n);峰度计算方法为:峰度计算方法为:uu=mean(R-0.5)/sqrt(1/12).4)-1.75u4=uu*0.204124*sqrt(n);function s1,s2,s3,s4=moment_test(R)%对(对(0,1)均匀分布随机数进行矩检验均匀分布随机数进行矩检验n=length(R);R_mean=mean(R);R_var=var(R);R_std=std(R);u1=sqrt(12*n)*(R_mean-0.5);if abs(u1
50、)1.96 s1=pass;else s1=*;end第六十一页,本课件共有100页2022/12/5信息统计分析62%对方差进行检验对方差进行检验var(R)u2=sqrt(180*n)*(R_var-1/12)if abs(u2)1.96 s2=pass;else s2=*;end%对偏度进行检验对偏度进行检验u3=mean(R-R_mean)/R_std).3)*0.408248*sqrt(n);if abs(u3)1.96 s3=pass;else s3=*;end第六十二页,本课件共有100页2022/12/5信息统计分析63%对偏度进行检验对偏度进行检验uu=mean(R-0.5)