《ly7概率统计.ppt》由会员分享,可在线阅读,更多相关《ly7概率统计.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据的统计分析数据的统计分析随机试验随机试验参数估计参数估计假设检验假设检验随机试验随机试验古典概率:古典概率:事件事件A发生的概率发生的概率在在100人的团体中,如果不考虑年龄的差异,研究是否有人的团体中,如果不考虑年龄的差异,研究是否有两个以上的人生日相同。假设每人的生日在一年两个以上的人生日相同。假设每人的生日在一年365天中天中的任意一天是等可能的,那么随机找的任意一天是等可能的,那么随机找 个人(个人(365)问这些人生日各不相同的概率是多少?问这些人生日各不相同的概率是多少?至少有两个人生日相同的概率为多少?至少有两个人生日相同的概率为多少?P169for n=1:100 p0(n
2、)=prod(365:-1:365-n+1)/365n;p1(n)=1-p0(n);endn=1:100;plot(n,p0,n,p1,-)xlabel(人数人数),ylabel(概率概率)legend(生日各不相同的概率生日各不相同的概率,至少两人相同的概率至少两人相同的概率)axis(0 100-0.1 1.1),grid on统计作图统计作图在数据较小、较少的情况下输入在数据较小、较少的情况下输入Matlab交互环境交互环境境下输入境下输入M文件的形式输入文件的形式输入数据数据数据量较大,且不以计算机可读数据量较大,且不以计算机可读形式存在形式存在load*.M读数据文件的命令读数据文件
3、的命令读入读入load*.txtP180函数名称函数名称功能功能简简介介Max(x)求最大求最大值值Min(x)求最小求最小值值Median(x)求中求中值值 Range(x)求极差求极差Mean(x)求算求算术术平均平均值值Std(x)求求样样本本标标准差准差Var(x)求求样样本方差本方差Cov(x)求求协协方差矩方差矩阵阵基基本本统统计计函函数数表表例例8-19 某班(共有某班(共有120名学生)的高等数学成名学生)的高等数学成绩绩如下:如下:74 63 78 76 89 56 70 97 89 94 76 88 65 83 72 41 39 72 73 68 14 76 45 70 9
4、0 46 54 61 75 76 49 57 78 66 64 74 78 87 86 73 47 67 21 66 79 67 68 65 56 84 66 73 68 72 76 65 70 94 53 65 77 78 53 74 59 50 98 67 89 78 63 92 54 87 84 80 63 64 85 66 69 69 60 54 75 33 30 62 74 65 84 73 55 85 75 76 81 71 83 72 56 84 76 75 67 65 35 94 59 47 45 67 75 36 78 82 94 70 84 75根据以上数据作出根据以上数据
5、作出该门课该门课程成程成绩绩的的频频数表和直方数表和直方图图。解:(解:(1)数据输入:)数据输入:v方法方法1:在:在Matlab的交互环境下直接输入的交互环境下直接输入;v方法方法2:将以上数据以一列的形式存为:将以上数据以一列的形式存为A.txt文件文件,用用 (2)用用hist命令作频数表和直方图:命令作频数表和直方图:(区间个数为区间个数为5,可,可省略省略)N,X=hist(A,5)120名学生高数成绩的频数表;名学生高数成绩的频数表;hist(A,5)120名学生高数成绩的直方图;名学生高数成绩的直方图;load A.txt 命令读入数据。命令读入数据。matleb命令:命令:l
6、oad A.txt disp(高数成绩的频数表高数成绩的频数表),N,X=hist(A,5)%N为频数为频数频数是如何计算的?频数是如何计算的?hist(A,5)%直方图直方图 a1=min(A);a2=max(A);disp(成绩最小值成绩最小值,blanks(4),最大值最大值)disp(a1,a2)N,X=hist(A,5)N=3 10 22 60 25X=22.4000 39.2000 56.0000 72.8000 89.6000成绩最小值成绩最小值 最大值最大值 14 98845=16.814+16.8=30.8所以,成绩在所以,成绩在1430.8之间有之间有3人。人。22.4从哪
7、儿从哪儿来的?来的?M=68.9583 71.5000 84.0000 249.5697 15.7978例例8-20 求例求例8-19中中A的均值、中位数、极差、方差的均值、中位数、极差、方差 和标准差。和标准差。解:在命令窗口输入:解:在命令窗口输入:M=mean(A),median(A),range(A),var(A),std(A)函数功能mu,sigma,muci,sigmaci=normfit(x,alpha)正态总体的均值、标准差的极大似然估计mu和sigma,返回在显著性水平alpha下的均值、标准差的置信区间muci和sigmaci,x是样本(数组或矩阵),当alpha缺省时设定
8、为0.05.mu,muci=expfit(x,alpha)指数分布的极大似然估计,返回显著性水平alpha下的置信区间muci,x是样本(数组或矩阵),当alpha缺省时设定为0.05.a,b,aci,bci=unifit(x,alpha)均匀分布的极大似然估计,返回显著性水平alpha下的置信区间aci,bci,x是样本(数组或矩阵),当alpha缺省时设定为0.05.p,pci=binofit(x,n,alpha)二项分布的极大似然估计,返回在显著性水平alpha下的置信区间pci,x是样本(数组或矩阵),当alpha缺省时设定为0.05.lambda,lambdaci=poissfit(
9、x,alpha)泊松分布的极大似然估计,返回显著性水平alpha下的置信区间lambdaci,x是样本(数组或矩阵),当alpha缺省时设定为0.05.参数估计的参数估计的Matlab函数函数参数估计参数估计例例8-22 某厂生产的瓶装运动饮料的体积假定服从正态分布,某厂生产的瓶装运动饮料的体积假定服从正态分布,抽取抽取10瓶,测得体积(毫升)为瓶,测得体积(毫升)为595,602,610,585,618,615,605,620,600,606,求均值求均值 、标准差、标准差 的极大似然估计值及置信水平为的极大似然估计值及置信水平为0.90的的置信区间。置信区间。x=595 602 610 5
10、85 618 615 605 620 600 606;mu,sigma,muci,sigmaci=normfit(x,0.90)mu=605.6000sigma=10.8033muci=605.1584 606.0416sigmaci=10.8864 11.5724假设检验假设检验正态总体的均值和方差假设与检验正态总体的均值和方差假设与检验单个正态总体单个正态总体 均值均值 的假设检验的假设检验1.已知,关于已知,关于 的检验的检验 (U检验法检验法)h,p,ci=ztest(x,mu,sigma,alpha,tail)x -样本(数组或矩阵)样本(数组或矩阵)mu -原假设原假设 中的中的
11、sigma -总体标准差总体标准差alpha -显著性水平显著性水平 ,缺省时,缺省时0.05tail -对备择假设对备择假设 的选择的选择 tail=0时,备择假设时,备择假设 ,(默认),(默认)tail=1时,备择假设时,备择假设 tail=-1时,备择假设时,备择假设h,p,ci=ztest(x,mu,sigma,alpha,tail)h=0表示表示“在显著性水平在显著性水平alpha的情况下,接受的情况下,接受 ”h=1表示表示“在显著性水平在显著性水平alpha的情况下,拒绝的情况下,拒绝 ”p -假设假设 下样本均值出现的概率下样本均值出现的概率 ci -均值的置信区间均值的置信
12、区间例例8-23 在某粮店的一批大米中,随机地抽测在某粮店的一批大米中,随机地抽测6袋,袋,其重量为其重量为26.1,23.6,25.1,25.4,23.7,24.5(单位:(单位:千克)。设每袋大米的重量千克)。设每袋大米的重量 ,问能否认为问能否认为这批大米的袋重是这批大米的袋重是25千克(千克()?)?x=26.1 23.6 25.1 25.4 23.7 24.5;h,p,ci=ztest(x,25,0.316,0.01,0)结果:结果:h=0p=0.0387ci=24.4010 25.0656接受接受H0解:按题意:解:按题意:已知已知 ,程序如下:,程序如下:x=26.1 23.6
13、25.1 25.4 23.7 24.5;h,p,ci=ztest(x,25,0.316,0.1,0)h=1p=0.0387ci=24.5211 24.9455结果:结果:拒绝拒绝H0当当 时,命令为:时,命令为:单个正态总体单个正态总体 均值均值 的假设检验的假设检验2.未知,关于未知,关于 的检验的检验 (t检验法检验法)h,p,ci=ttest(x,mu,alpha,tail)例例 某种原件的寿命某种原件的寿命X(以小时计)服从正态分布(以小时计)服从正态分布其中其中 均未知,现测得均未知,现测得16只元件的寿命如下:只元件的寿命如下:159 280 101 212 224 379 179
14、 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于问是否有理由认为元件的平均寿命大于225(小时)(小时)?解:按题意需检验:解:按题意需检验:x=159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170;h,p,ci=ttest(x,225,0.05,1)取取 ,程序如下:,程序如下:h=0p=0.2570ci=198.2321 Infh=0,p=0.2570,说明在显著水平为说明在显著水平为0.05的情况下,的情况下,不能拒绝原假设,认为元件的平均寿命不大于不能拒绝原
15、假设,认为元件的平均寿命不大于225小时。小时。单个正态总体单个正态总体 方差方差 的假设检验的假设检验是相应的一个样本观测值是相应的一个样本观测值总体总体是来自总体的样本。是来自总体的样本。x=x1,x2,xn;chi2=(n-1)*var(x)/sigma2;u1=chi2inv(alpha/2,n-1)u2=chi2inv(1-alpha/2,n-1)if chi2u2 h=1else h=0end检验假设检验假设chi2inv(p,n)是求是求 时,时,中的中的 ,即即 分布的逆概率函数分布的逆概率函数例例8-24 例例8-23中能否认为每袋大米质量的标准差中能否认为每袋大米质量的标准
16、差?x=26.1 23.6 25.1 25.4 23.7 24.5;chi2=5*var(x)/0.1u1=chi2inv(0.01/2,5)u2=chi2inv(1-0.01/2,5)if chi2u2 h=1else h=0endchi2=48.5333u1=0.4117u2=16.7496h=1拒绝拒绝H0,每袋大米的每袋大米的质量的方差不等于质量的方差不等于0.1作业vP190 17、20、22考试安排考试安排v考试时间:考试时间:40分钟。每人分钟。每人2题。题。v开卷考试,只能带书本,不可拷贝开卷考试,只能带书本,不可拷贝.注意事项:1、在E盘建立word文档(程序以及运行结果),文件名为“考试+姓名+学号”;2、随时保存;3、提交以后到教室机确认是否提交成功