《Matlab第4章概率统计.doc》由会员分享,可在线阅读,更多相关《Matlab第4章概率统计.doc(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流Matlab第4章概率统计.精品文档.Matlab 第4章 概率统计本章介绍MATLAB在概率统计中的若干命令和使用格式,这些命令存放于MatlabR12ToolboxStats中。4.1 随机数的产生4.1.1 二项分布的随机数据的产生命令 参数为N,P的二项随机数据函数 binornd格式 R = binornd(N,P) %N、P为二项分布的两个参数,返回服从参数为N、P的二项分布的随机数,N、P大小相同。R = binornd(N,P,m) %m指定随机数的个数,与R同维数。R = binornd(N,P,m,n) %m,n分别表示R
2、的行数和列数例4-1 R=binornd(10,0.5)R = 3 R=binornd(10,0.5,1,6)R = 8 1 3 7 6 4 R=binornd(10,0.5,1,10)R = 6 8 4 6 7 5 3 5 6 2 R=binornd(10,0.5,2,3)R = 7 5 8 6 5 6n = 10:10:60;r1 = binornd(n,1./n)r1 = 2 1 0 1 1 2r2 = binornd(n,1./n,1 6)r2 = 0 1 2 1 3 14.1.2 正态分布的随机数据的产生命令 参数为、的正态分布的随机数据函数 normrnd格式 R = normrn
3、d(MU,SIGMA) %返回均值为MU,标准差为SIGMA的正态分布的随机数据,R可以是向量或矩阵。R = normrnd(MU,SIGMA,m) %m指定随机数的个数,与R同维数。R = normrnd(MU,SIGMA,m,n) %m,n分别表示R的行数和列数例4-2n1 = normrnd(1:6,1./(1:6)n1 = 2.1650 2.3134 3.0250 4.0879 4.8607 6.2827n2 = normrnd(0,1,1 5)n2 = 0.0591 1.7971 0.2641 0.8717 -1.4462n3 = normrnd(1 2 3;4 5 6,0.1,2,
4、3) %mu为均值矩阵n3 = 0.9299 1.9361 2.9640 4.1246 5.0577 5.9864 R=normrnd(10,0.5,2,3) %mu为10,sigma为0.5的2行3列个正态随机数R = 9.7837 10.0627 9.4268 9.1672 10.1438 10.59554.1.3 常见分布的随机数产生常见分布的随机数的使用格式与上面相同表4-1 随机数产生函数表函数名调用形式注 释Unifrndunifrnd ( A,B,m,n)A,B上均匀分布(连续) 随机数Unidrndunidrnd(N,m,n)均匀分布(离散)随机数Exprndexprnd(La
5、mbda,m,n)参数为Lambda的指数分布随机数Normrndnormrnd(MU,SIGMA,m,n)参数为MU,SIGMA的正态分布随机数chi2rndchi2rnd(N,m,n)自由度为N的卡方分布随机数Trndtrnd(N,m,n)自由度为N的t分布随机数Frndfrnd(N1, N2,m,n)第一自由度为N1,第二自由度为N2的F分布随机数gamrndgamrnd(A, B,m,n)参数为A, B的分布随机数betarndbetarnd(A, B,m,n)参数为A, B的分布随机数lognrndlognrnd(MU, SIGMA,m,n)参数为MU, SIGMA的对数正态分布随机
6、数nbinrndnbinrnd(R, P,m,n)参数为R,P的负二项式分布随机数ncfrndncfrnd(N1, N2, delta,m,n)参数为N1,N2,delta的非中心F分布随机数nctrndnctrnd(N, delta,m,n)参数为N,delta的非中心t分布随机数ncx2rndncx2rnd(N, delta,m,n)参数为N,delta的非中心卡方分布随机数raylrndraylrnd(B,m,n)参数为B的瑞利分布随机数weibrndweibrnd(A, B,m,n)参数为A, B的韦伯分布随机数binorndbinornd(N,P,m,n)参数为N, p的二项分布随机
7、数georndgeornd(P,m,n)参数为 p的几何分布随机数hygerndhygernd(M,K,N,m,n)参数为 M,K,N的超几何分布随机数Poissrndpoissrnd(Lambda,m,n)参数为Lambda的泊松分布随机数4.1.4 通用函数求各分布的随机数据命令 求指定分布的随机数函数 random格式 y = random(name,A1,A2,A3,m,n) %name的取值见表4-2;A1,A2,A3为分布的参数;m,n指定随机数的行和列例4-3 产生12(3行4列)个均值为2,标准差为0.3的正态分布随机数 y=random(norm,2,0.3,3,4)y =
8、2.3567 2.0524 1.8235 2.0342 1.9887 1.9440 2.6550 2.3200 2.0982 2.2177 1.9591 2.01784.2 随机变量的概率密度计算4.2.1 通用函数计算概率密度函数值命令 通用函数计算概率密度函数值函数 pdf格式 Y=pdf(name,K,A)Y=pdf(name,K,A,B)Y=pdf(name,K,A,B,C)说明 返回在X=K处、参数为A、B、C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表4-2。表4-2 常见分布函数表name的取值函数说明beta或BetaBeta分布bino或Bi
9、nomial二项分布chi2或Chisquare卡方分布exp或Exponential指数分布f或FF分布gam或GammaGAMMA分布geo或Geometric几何分布hyge或Hypergeometric超几何分布logn或Lognormal对数正态分布nbin或Negative Binomial负二项式分布ncf或Noncentral F非中心F分布nct或Noncentral t非中心t分布ncx2或Noncentral Chi-square非中心卡方分布norm或Normal正态分布poiss或Poisson泊松分布rayl或Rayleigh瑞利分布t或TT分布unif或Unifo
10、rm均匀分布unid或Discrete Uniform离散均匀分布weib或WeibullWeibull分布例如二项分布:设一次试验,事件A发生的概率为p,那么,在n次独立重复试验中,事件A恰好发生K次的概率P_K为:P_K=PX=K=pdf(bino,K,n,p)例4-4 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。解: pdf(norm,0.6578,0,1)ans = 0.3213例4-5 自由度为8的卡方分布,在点2.18处的密度函数值。解: pdf(chi2,2.18,8)ans = 0.03634.2.2 专用函数计算概率密度函数值命令 二项分布的概率值函数
11、binopdf格式 binopdf (k, n, p) %等同于, p 每次试验事件A发生的概率;K事件A发生K次;n试验总次数命令 泊松分布的概率值函数 poisspdf格式 poisspdf(k, Lambda) %等同于命令 正态分布的概率值函数 normpdf(K,mu,sigma) %计算参数为=mu,=sigma的正态分布密度函数在K处的值专用函数计算概率密度函数列表如表4-3。表4-3 专用函数计算概率密度函数表函数名调用形式注 释Unifpdfunifpdf (x, a, b)a,b上均匀分布(连续)概率密度在X=x处的函数值unidpdfUnidpdf(x,n)均匀分布(离散
12、)概率密度函数值Exppdfexppdf(x, Lambda)参数为Lambda的指数分布概率密度函数值normpdfnormpdf(x, mu, sigma)参数为mu,sigma的正态分布概率密度函数值chi2pdfchi2pdf(x, n)自由度为n的卡方分布概率密度函数值Tpdftpdf(x, n)自由度为n的t分布概率密度函数值Fpdffpdf(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布概率密度函数值gampdfgampdf(x, a, b)参数为a, b的分布概率密度函数值betapdfbetapdf(x, a, b)参数为a, b的分布概率密度函数值lognp
13、dflognpdf(x, mu, sigma)参数为mu, sigma的对数正态分布概率密度函数值nbinpdfnbinpdf(x, R, P)参数为R,P的负二项式分布概率密度函数值Ncfpdfncfpdf(x, n1, n2, delta)参数为n1,n2,delta的非中心F分布概率密度函数值Nctpdfnctpdf(x, n, delta)参数为n,delta的非中心t分布概率密度函数值ncx2pdfncx2pdf(x, n, delta)参数为n,delta的非中心卡方分布概率密度函数值raylpdfraylpdf(x, b)参数为b的瑞利分布概率密度函数值weibpdfweibpd
14、f(x, a, b)参数为a, b的韦伯分布概率密度函数值binopdfbinopdf(x,n,p)参数为n, p的二项分布的概率密度函数值geopdfgeopdf(x,p)参数为 p的几何分布的概率密度函数值hygepdfhygepdf(x,M,K,N)参数为 M,K,N的超几何分布的概率密度函数值poisspdfpoisspdf(x,Lambda)参数为Lambda的泊松分布的概率密度函数值例4-6 绘制卡方分布密度函数在自由度分别为1、5、15的图形 x=0:0.1:30; y1=chi2pdf(x,1); plot(x,y1,:) hold on y2=chi2pdf(x,5);plo
15、t(x,y2,+) y3=chi2pdf(x,15);plot(x,y3,o) axis(0,30,0,0.2) %指定显示的图形区域则图形为图4-1。4.2.3 常见分布的密度函数作图1二项分布图4-1例4-7x = 0:10;y = binopdf(x,10,0.5);plot(x,y,+)2卡方分布例4-8 x = 0:0.2:15;y = chi2pdf(x,4);plot(x,y)图4-23非中心卡方分布例4-9x = (0:0.1:10);p1 = ncx2pdf(x,4,2);p = chi2pdf(x,4);plot(x,p,-,x,p1,-)4指数分布例4-10x = 0:0
16、.1:10;y = exppdf(x,2);plot(x,y)图4-35F分布例4-11x = 0:0.01:10;y = fpdf(x,5,3);plot(x,y)6非中心F分布例4-12x = (0.01:0.1:10.01);p1 = ncfpdf(x,5,20,10);p = fpdf(x,5,20);plot(x,p,-,x,p1,-)图4-47分布例4-13x = gaminv(0.005:0.01:0.995),100,10);y = gampdf(x,100,10);y1 = normpdf(x,1000,100);plot(x,y,-,x,y1,-.)8对数正态分布例4-14
17、x = (10:1000:125010);y = lognpdf(x,log(20000),1.0);plot(x,y)set(gca,xtick,0 30000 60000 90000 120000)set(gca,xticklabel,str2mat(0,$30,000,$60,000, $90,000,$120,000)图4-59负二项分布例4-15x = (0:10);y = nbinpdf(x,3,0.5);plot(x,y,+)10正态分布例4-16 x=-3:0.2:3; y=normpdf(x,0,1); plot(x,y)图4-611泊松分布例4-17x = 0:15;y =
18、 poisspdf(x,5);plot(x,y,+)12瑞利分布例4-18x = 0:0.01:2;p = raylpdf(x,0.5);plot(x,p)图4-713T分布例4-19x = -5:0.1:5;y = tpdf(x,5);z = normpdf(x,0,1);plot(x,y,-,x,z,-.)14威布尔分布例4-20 t=0:0.1:3; y=weibpdf(t,2,2); plot(y)图4-84.3 随机变量的累积概率值(分布函数值)4.3.1 通用函数计算累积概率值命令 通用函数cdf用来计算随机变量的概率之和(累积概率值)函数 cdf格式 说明 返回以name为分布、
19、随机变量XK的概率之和的累积概率值,name的取值见表4-1 常见分布函数表例4-21 求标准正态分布随机变量X落在区间(-,0.4)内的概率(该值就是概率统计教材中的附表:标准正态数值表)。解: cdf(norm,0.4,0,1)ans = 0.6554例4-22 求自由度为16的卡方分布随机变量落在0,6.91内的概率 cdf(chi2,6.91,16)ans = 0.02504.3.2 专用函数计算累积概率值(随机变量的概率之和)命令 二项分布的累积概率值函数 binocdf格式 binocdf (k, n, p) %n为试验总次数,p为每次试验事件A发生的概率,k为n次试验中事件A发生
20、的次数,该命令返回n次试验中事件A恰好发生k次的概率。命令 正态分布的累积概率值函数 normcdf格式 normcdf() %返回F(x)=的值,mu、sigma为正态分布的两个参数例4-23 设XN(3, 22)(1)求(2)确定c,使得解(1) p1= p2=p3=p4=则有:p1=normcdf(5,3,2)-normcdf(2,3,2)p1 = 0.5328p2=normcdf(10,3,2)-normcdf(-4,3,2)p2 = 0.9995p3=1-normcdf(2,3,2)-normcdf(-2,3,2)p3 = 0.6853p4=1-normcdf(3,3,2)p4 =
21、0.5000专用函数计算累积概率值函数列表如表4-4。表4-4 专用函数的累积概率值函数表函数名调用形式注 释unifcdfunifcdf (x, a, b)a,b上均匀分布(连续)累积分布函数值 F(x)=PXxunidcdfunidcdf(x,n)均匀分布(离散)累积分布函数值 F(x)=PXx expcdfexpcdf(x, Lambda)参数为Lambda的指数分布累积分布函数值 F(x)=PXxnormcdfnormcdf(x, mu, sigma)参数为mu,sigma的正态分布累积分布函数值 F(x)=PXxchi2cdfchi2cdf(x, n)自由度为n的卡方分布累积分布函数
22、值 F(x)=PXxtcdftcdf(x, n)自由度为n的t分布累积分布函数值 F(x)=PXxfcdffcdf(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布累积分布函数值gamcdfgamcdf(x, a, b)参数为a, b的分布累积分布函数值 F(x)=PXxbetacdfbetacdf(x, a, b)参数为a, b的分布累积分布函数值 F(x)=PXxlogncdflogncdf(x, mu, sigma)参数为mu, sigma的对数正态分布累积分布函数值 nbincdfnbincdf(x, R, P)参数为R,P的负二项式分布概累积分布函数值 F(x)=PXx
23、ncfcdfncfcdf(x, n1, n2, delta)参数为n1,n2,delta的非中心F分布累积分布函数值 nctcdfnctcdf(x, n, delta)参数为n,delta的非中心t分布累积分布函数值 F(x)=PXxncx2cdfncx2cdf(x, n, delta)参数为n,delta的非中心卡方分布累积分布函数值raylcdfraylcdf(x, b)参数为b的瑞利分布累积分布函数值 F(x)=PXxweibcdfweibcdf(x, a, b)参数为a, b的韦伯分布累积分布函数值 F(x)=PXxbinocdfbinocdf(x,n,p)参数为n, p的二项分布的累
24、积分布函数值 F(x)=PXxgeocdfgeocdf(x,p)参数为 p的几何分布的累积分布函数值 F(x)=PXxhygecdfhygecdf(x,M,K,N)参数为 M,K,N的超几何分布的累积分布函数值 poisscdfpoisscdf(x,Lambda)参数为Lambda的泊松分布的累积分布函数值 F(x)=PXx说明 累积概率函数就是分布函数F(x)=PXx在x处的值。4.4 随机变量的逆累积分布函数MATLAB中的逆累积分布函数是已知,求x。逆累积分布函数值的计算有两种方法4.4.1 通用函数计算逆累积分布函数值命令 icdf 计算逆累积分布函数格式 说明 返回分布为name,参
25、数为,累积概率值为P的临界值,这里name与前面表4.1相同。如果,则例4-24 在标准正态分布表中,若已知=0.975,求x解: x=icdf(norm,0.975,0,1)x = 1.9600例4-25 在分布表中,若自由度为10,=0.975,求临界值Lambda。解:因为表中给出的值满足,而逆累积分布函数icdf求满足的临界值。所以,这里的取为0.025,即 Lambda=icdf(chi2,0.025,10)Lambda = 3.2470例4-26 在假设检验中,求临界值问题:已知:,查自由度为10的双边界检验t分布临界值lambda=icdf(t,0.025,10)lambda =
26、 -2.22814.4.2 专用函数-inv计算逆累积分布函数命令 正态分布逆累积分布函数函数 norminv格式 X=norminv(p,mu,sigma) %p为累积概率值,mu为均值,sigma为标准差,X为临界值,满足:p=PXx。例4-27 设,确定c使得。解:由得,=0.5,所以X=norminv(0.5, 3, 2)X= 3关于常用临界值函数可查下表4-5。表4-5 常用临界值函数表函数名调用形式注 释unifinvx=unifinv (p, a, b)均匀分布(连续)逆累积分布函数(P=PXx,求x)unidinvx=unidinv (p,n)均匀分布(离散)逆累积分布函数,x
27、为临界值expinvx=expinv (p, Lambda)指数分布逆累积分布函数norminvx=Norminv(x,mu,sigma)正态分布逆累积分布函数chi2invx=chi2inv (x, n)卡方分布逆累积分布函数tinvx=tinv (x, n)t分布累积分布函数finvx=finv (x, n1, n2)F分布逆累积分布函数gaminvx=gaminv (x, a, b)分布逆累积分布函数betainvx=betainv (x, a, b)分布逆累积分布函数logninvx=logninv (x, mu, sigma)对数正态分布逆累积分布函数 nbininvx=nbinin
28、v (x, R, P)负二项式分布逆累积分布函数ncfinvx=ncfinv (x, n1, n2, delta)非中心F分布逆累积分布函数 nctinvx=nctinv (x, n, delta)非中心t分布逆累积分布函数ncx2invx=ncx2inv (x, n, delta)非中心卡方分布逆累积分布函数raylinvx=raylinv (x, b)瑞利分布逆累积分布函数weibinvx=weibinv (x, a, b)韦伯分布逆累积分布函数binoinvx=binoinv (x,n,p)二项分布的逆累积分布函数geoinvx=geoinv (x,p)几何分布的逆累积分布函数hygei
29、nvx=hygeinv (x,M,K,N)超几何分布的逆累积分布函数 poissinvx=poissinv (x,Lambda)泊松分布的逆累积分布函数例4-28 公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,36),求车门的最低高度。解:设h为车门高度,X为身高求满足条件的h,即,所以h=norminv(0.99, 175, 6)h = 188.9581例4-29 卡方分布的逆累积分布函数的应用在MATLAB的编辑器下建立M文件如下:n=5; a=0.9; %n为自由度,a为置信水平或累积概率x_a=chi2inv(a,n)
30、; %x_a 为临界值x=0:0.1:15; yd_c=chi2pdf(x,n); %计算的概率密度函数值,供绘图用plot(x,yd_c,b), hold on %绘密度函数图形xxf=0:0.1:x_a; yyf=chi2pdf(xxf,n); %计算0,x_a上的密度函数值,供填色用fill(xxf,x_a, yyf,0, g) %填色,其中:点(x_a, 0)使得填色区域封闭图4-9text(x_a*1.01,0.01, num2str(x_a) %标注临界值点text(10,0.10, fontsize16Xchi2(4) %图中标注text(1.5,0.05, fontsize22
31、alpha=0.9 ) %图中标注结果显示如图4-9。4.5 随机变量的数字特征4.5.1 平均值、中值命令 利用mean求算术平均值格式 mean(X) %X为向量,返回X中各元素的平均值mean(A) %A为矩阵,返回A中各列元素的平均值构成的向量mean(A,dim) %在给出的维数内的平均值说明 X为向量时,算术平均值的数学含义是,即样本均值。 例4-30 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 mean(A)ans = 1.3333 3.0000 3.0000 5.3333 mean(A,1)ans = 1.3333
32、3.0000 3.0000 5.3333命令 忽略NaN计算算术平均值格式 nanmean(X) %X为向量,返回X中除NaN外元素的算术平均值。 nanmean(A) %A为矩阵,返回A中各列除NaN外元素的算术平均值向量。例4-31 A=1 2 3;nan 5 2;3 7 nanA = 1 2 3 NaN 5 2 3 7 NaN nanmean(A)ans = 2.0000 4.6667 2.5000命令 利用median计算中值(中位数)格式 median(X) %X为向量,返回X中各元素的中位数。median(A) %A为矩阵,返回A中各列元素的中位数构成的向量。median(A,di
33、m) %求给出的维数内的中位数例4-32 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 median(A)ans = 1 3 4 5命令 忽略NaN计算中位数格式 nanmedian(X) %X为向量,返回X中除NaN外元素的中位数。 nanmedian(A) %A为矩阵,返回A中各列除NaN外元素的中位数向量。例4-33 A=1 2 3;nan 5 2;3 7 nanA = 1 2 3 NaN 5 2 3 7 NaN nanmedian(A)ans = 2.0000 5.0000 2.5000 命令 利用geomean计算几何平均数
34、格式 M=geomean(X) %X为向量,返回X中各元素的几何平均数。 M=geomean(A) %A为矩阵,返回A中各列元素的几何平均数构成的向量。说明 几何平均数的数学含义是,其中:样本数据非负,主要用于对数正态分布。例4-34 B=1 3 4 5B = 1 3 4 5 M=geomean(B)M = 2.7832 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 M=geomean(A)M = 1.2599 3.0000 2.5198 5.3133命令 利用harmmean求调和平均值格式 M=harmmean(X) %X为向量,
35、返回X中各元素的调和平均值。 M=harmmean(A) %A为矩阵,返回A中各列元素的调和平均值构成的向量。说明 调和平均值的数学含义是,其中:样本数据非0,主要用于严重偏斜分布。例4-35 B=1 3 4 5B = 1 3 4 5 M=harmmean(B)M = 2.2430 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 M=harmmean(A)M = 1.2000 3.0000 2.0000 5.29414.5.2 数据比较命令 排序格式 Y=sort(X) %X为向量,返回X按由小到大排序后的向量。 Y=sort(A) %
36、A为矩阵,返回A的各列按由小到大排序后的矩阵。 Y,I=sort(A) % Y为排序的结果,I中元素表示Y中对应元素在A中位置。sort(A,dim) %在给定的维数dim内排序说明 若X为复数,则通过|X|排序。例4-36 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 sort(A)ans = 1 2 0 3 5 2 4 7 3 Y,I=sort(A)Y = 1 2 0 3 5 2 4 7 3I = 1 1 3 3 2 2 2 3 1命令 按行方式排序函数 sortrows格式 Y=sortrows(A) %A为矩阵,返回矩阵Y,Y按A的第1列由小到大,以
37、行方式排序后生成的矩阵。 Y=sortrows(A, col) %按指定列col由小到大进行排序 Y,I=sortrows(A, col) % Y为排序的结果,I表示Y中第col列元素在A中位置。说明 若X为复数,则通过|X|的大小排序。例4-37 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 sortrows(A)ans = 1 2 3 3 7 0 4 5 2 sortrows(A,1)ans = 1 2 3 3 7 0 4 5 2 sortrows(A,3)ans = 3 7 0 4 5 2 1 2 3 sortrows(A,3 2)ans = 3 7
38、0 4 5 2 1 2 3 Y,I=sortrows(A,3)Y = 3 7 0 4 5 2 1 2 3I = 3 2 1命令 求最大值与最小值之差函数 range格式 Y=range(X) %X为向量,返回X中的最大值与最小值之差。 Y=range(A) %A为矩阵,返回A中各列元素的最大值与最小值之差。例4-38 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 Y=range(A)Y = 3 5 34.5.3 期望命令 计算样本均值函数 mean格式 用法与前面一样例4-39 随机抽取6个滚珠测得直径如下:(直径:mm)14.70 15.21 14.90 14.91 15.32 15.3