概率统计实验.docx

上传人:叶*** 文档编号:36030096 上传时间:2022-08-25 格式:DOCX 页数:24 大小:46.62KB
返回 下载 相关 举报
概率统计实验.docx_第1页
第1页 / 共24页
概率统计实验.docx_第2页
第2页 / 共24页
点击查看更多>>
资源描述

《概率统计实验.docx》由会员分享,可在线阅读,更多相关《概率统计实验.docx(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、13.6 概率统计实验学习目标1 会用Mathematica求概率、均值与方差;2 能进行常用分布的计算;3 会用Mathematica进行期望与方差的区间估计;4 会用Mathematica进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica自带的统计程序包,其中有实现常用统计计算的各种外部函数。一、 样本的数字特征1. 一元的情况Mathematica的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic程序包子集中,位于目录D:M

2、athematica4.0AddOnsStandardPackagesStatistics下。通过查看Help,可以找到包含所需外部函数的程序文件名。在程序文件DescriptiveStatistics.m中,含有实现一元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差(最大数减最小数)。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。StandardDeviationMLEdat

3、a 求标准差。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。 解:In1:= Statistics DescriptiveStatistics In2:= data = 6.5,3.8,6.6,5.7,6.0,6.4,5.3; In3:=Lengthdata Out3=7 In4:=Mindata Out4= 3.8 In5:=Maxdata Out5= 6.6 In6:=SampleRangedata Out6= 2.8

4、In7:=Mediandata Out7= 6. In8:=Meandata Out8= 5.75714 In9:=Variancedata Out9= 0.962857 In10:=StandardDeviationdata Out10= 0.981253 In11:=VarianceMLEdata Out11= 0.825306 In12:= StandardDeviationMLEdata Out12= 0.908464 说明:在上例中,In1首先调入程序文件,求数据个数、最大值与最小值使用内部函数。2. 多元的情况 在程序文件MultiDescriptiveStatistics.m中,

5、含有实现多元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。 StandardDeviationMLEdata 求标准差。 Covariancexlist,ylist 求x,y的协方差(无偏估计)。 CovarianceMLExlist,ylist 求x,y的协方差。Correlationxlist,ylist 求x,y的相关系数。

6、实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例2 给出4个样本值:1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33,计算样本个数、均值、方差、标准差等。 解:In1:= Statistics MultiDescriptiveStatistics In2:= data = 1.1,2.0,3.2,1.3,2.2,3.1, 1.15,2.05,3.35,1.22,2.31,3.33; Lengthdata Out3=4 In4:=SampleRangedata Out4= 0.2,0.31,0.2

7、5 In5:=Mediandata Out5= 1.185,2.125,3.265 In6:=Meandata Out6= 1.1925,2.14,3.245 In7:=Variancedata Out7= 0.00755833,0.0200667,0. In8:=VarianceMLEdata Out8= 0.00566875,0.01505,0.010325 In9:=CentralMomentdata,2 Out9= 0.00566875,0.01505,0.010325 In10:=x=dataAll,1;y=dataAll,2; z=dataAll,3; In11:=Covarian

8、cex,y Out11=0.0093 In12:=Covariancez,z Out12=0. In13:=CovarianceMLEy,y Out13=0.01505 In14:=Correlationy,z Out14=0. In15:=Correlationx,x Out15=1.二、 常用分布的计算 在计算机出现以前,统计计算总是依赖一堆函数表。使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。1. 离散分布 程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。其中常用的离散分布有: BernoulliDistributio

9、np 贝努利分布。 BinomialDistributionn,p 二项分布。 GeometricDistributionp 几何分布。 HypergeometricDistributionn,M,N 超几何分布。 PoissonDistribution 泊松分布。 DiscreteUniformDistributionn 离散的均匀分布。 NegativeBinomialDistributionn,p 负二项分布。 以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。真正进行计算的是下面的求值函数,它们使用以上的分布表达式

10、作为一个参数。 常用的求值函数有: Domaindist 求dist的定义域。 PDFdist,x 求点x处的分布dist的密度值。 CDFdist,x 求点x处的分布函数值。 Quantiledist,q 求x,使CDFdist,x达到q。Meandist 求分布dist的期望。 Variancedist 求方差。 StandardDeviationdist 求标准差。 ExpectedValuef,dist,x 求Ef(x)。 CharacteristicFunctiondist,t 求特征函数(t)。 Randomdist 求具有分布dist的伪随机数。 RandomArraydist,

11、dims 求维数为dims的伪随机数的数组。例3 观察下面二项分布的各种基本计算。 In1:= Statistics DiscreteDistributions In2:= b=BinomialDistributionn,p Out2=BinomialDistributionn,p In3:=Meanb Out3=np In4:=Varianceb Out4= n(1-p)p In5:=CharacteristicFunctionb,t Out5= (1-p+e it p)n In6:=b=BinomialDistribution10,0.3 Out6= BinomialDistributio

12、n10,0.3 In7:=Domainb Out7= 0,1,2,3,4,5,6,7,8,9,10 In8:=PDFb,4 Out8= 0.200121 In9:=CDFb,3.9 Out9= 0.649611 In10:=CDFb,4 Out10= 0.849732 In11:=Varianceb Out11= 2.1说明:在上例中,首先调入程序文件。In2用b表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。In3In5进行的是符号运算,可以得到期望、方差等的一般公式。这是本程序与一般统计软件的不同之处,充分表达了Mathematica的特色。

13、接下来给出具体的参数值,进行数值计算,这些计算取代了查表。以下是一些更广泛、深入的例子。例4 观察下面离散分布的各种计算。 In1:= Statistics DiscreteDistributions In2:= h=HypergeometricDistributionn,M,N; Meanh Out3= In4:=Varianceh Out4= In5:= p=PoissonDistribution5; PDFp,2 Out6= In7:=N% Out7=0.0842243 In8:=PDFp,20 /N Out8=2.6412110-7 In9:=NCDFp,20,20 Out9=0.99

14、9999912 In10:=ExpectedValuex2,p,x Out10=30 In11:=RandomArrayp,2,10 Out11=3,4,6,10,2,5,7,2,5,5, 4,3,2,11,5,4,2,2,4,6说明:在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望与方差公式就与教科书上的相同了。In5中给出的参数是准确数5,Mathematica在下面进行的仍是符号计算,得到准确结果。如果参数改为5.0 ,则计算结果就都是近似值了。In10是求E2,ExpectedValue是一个很有用的函数,务必注意。除了以上介绍的内容外,还有些不常用的函数本书没有

15、列出,有兴趣的读者可以浏览Help。2. 连续分布 程序文件ContinuousDistributions.m 中,含有用于连续分布计算的函数。其中常见的连续分布有: NormalDistribution, 正态分布。 UniformDistributionmin,max 均匀分布。 ExponentialDistribution 指数分布。 StudentTDistributionn t分布。ChiSquareDistributionn 2分布。 常用的求值函数与离散分布相同,这里不再列出。例5 计算:(1)N(0,1),求:P(1.96),P( -1.96),P(-12)。(2)N(8,0

16、.5),求:P(10),P(79)。 解:In1:= Statistics ContinuousDistributions In2:= n=NormalDistribution0,1; In3:=CDFn,1.96 Out3=0.975002 In4:=CDFn,-1.96 Out4=0.0249979 In5:=CDFn,2.- CDFn,-1. Out5= 0.818595 In6:= n=NormalDistribution8,0.5; In7:=CDFn,10 Out7=0.999968 In8:=CDFn,9- CDFn,7 Out8=0.9545 说明:在上例中,由于In2没有使用

17、小数点,这时在In5中需要使用小数点才能得到近似值,否则得到符号解。反之,由于In6使用了小数点,后面的计算则不必再使用小数点了。如果使用人工查表的方法求In7,还需要首先转换成标准正态分布,这里就显得方便了。例6 绘制2分布在n分别为1,5,15时的分布密度函数图。 解:In1:= Statistics ContinuousDistributions In2:=PlotPDFChiSquareDistribution1,x, PDFChiSquareDistribution5,x, PDFChiSquareDistribution15,x,x,0,30, PlotRange0,0.2得到如图

18、13-46所示的函数图形。图13-46 2分布的分布密度图 说明:上例中的绘图语句使用了函数嵌套,其中的函数名较长,最好自制统计函数模板。 因为这些统计计算都可以是符号的,所以能用于查询各种公式。以下是一个实例: In1:= Statistics ContinuousDistributions In2:=PDFNormalDistribution0,1,x Out2= In3:= n=NormalDistribution,; Meann Out4= In5:=Variancen Out5= 2 In6:= e=ExponentialDistribution; Meane Out7= In8:=

19、Variancee Out8= In9:=ExpectedValuex2,e,x Out9= 三、 区间估计1. 总体数学期望的区间估计 程序文件ConfidenceIntervals.m 中,含有用于总体参数区间估计的函数。其中用于总体数学期望的区间估计的函数是: MeanCIdata,KnownVariancevar 已知方差var,由数据表data求总体数学期望的置信区间(基于正态分布)。 MeanCIdata 由数据表data求总体数学期望的置信区间(方差未知、基于t分布)。 其中参数KnownVariance也可以改为 KnownStandardDeviation,即已知标准差。 以

20、上两个函数由样本数据表data直接求置信区间。但有时已知的是样本平均值,这时改用以下函数: NormalCImean,sd 标准差已知,且sd=,由样本平均值mean求总体数学期望的置信区间(基于正态分布)。 StudentTCImean,se,dof 用于方差未知,由样本平均值mean求总体数学期望的置信区间(基于t分布),其中,se =,而dof是自由度(等于n - 1)。以上函数都有可选参数:ConfidenceLevel 置信度,默认值为0.95。例7 已知某炼铁厂的铁水含碳量(%)服从正态分布,现测得5炉铁水的含碳量分别是:4.28,4.4,4.42,4.35,4.37。如果已知标准

21、差为=0.108,求铁水平均含碳量的置信区间(置信度为0.95)。 解:In1:= Statistics ConfidenceIntervals In2:= data=4.28,4.4,4.42,4.35,4.37; MeanCIdata,KnownVariance 0.1082 Out3=4.26934,4.45866 例8 假定新生男婴的体重服从正态分布,随机抽取12名男婴,测得体重分别是(单位:g):3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试求新生男婴平均体重的置信区间(置信度为0.95)。解:In4:= d

22、ata=3100,2520,3000,3000,3600,3160,3560,3320, 2880,2600,3400,2540; MeanCIdata Out5=2818.2,3295.13 例9 在例7中如果改为已知测得9炉铁水的含碳量的平均值是4.484,其余条件不变,再求铁水平均含碳量的置信区间(置信度为0.95)。 解:In6:=NormalCI4.484,0.108 / Out6=4.41344,4.55456 例10 铅的比重测量值服从正态分布,测量16次算出=2.705,S=0.029。试求铅的比重的置信区间(置信度为0.95)。 解:In7:=StudentTCI2.705,

23、0.029/Sqrt16,15 Out7=2.68955,2.72045 当调入程序文件ConfidenceIntervals.m时,为了计算各种统计量,这个程序会自动调入程序文件DescriptiveStatistics.m。因此,也可以首先由数据计算函数StudentTCI的各个参数,如下所示: In1:= Statistics ConfidenceIntervals In2:= data=2.1,1.2,0.7,1.0,1.1,3.2,3.2,3.3,2.1,0.3; m=Meandata Out3=1.82 In4:= se=StandardErrorOfSampleMeandata

24、Out4=0.354275 In5:=StudentTCIm,se,Lengthdata-1,ConfidenceLevel0.9 Out5=1.17057,2.46943 说明:上例中,In4利用数据直接求出se,而不是像教科书上先求S,In5示范了设置置信度为0.9的方法。2. 总体方差的区间估计 对总体的方差进行区间估计的函数是: VarianceCIdata 由数据表data求总体方差的置信区间(基于2 分布)。 ChiSquareCIvariance,dof 由无偏估计样本方差variance,求总体方差的置信区间,其中dof是自由度(等于n - 1)。例11 试求例8的新生男婴体重

25、方差的置信区间(置信度为0.95)。 解:In1:= Statistics ConfidenceIntervals In2:= VarianceCI3100,2520,3000,3000,3600,3160,3560, 3320,2880,2600,3400,2540 Out2=70687.2,406072. 例12 设炮弹速度服从正态分布,取9发炮弹测得无偏估计样本方差S2=11(m/s)2,求炮弹速度方差的置信区间(置信度为0.9)。 解:In3:= ChiSquareCI11,8,ConfidenceLevel0.9 Out3=5.67474,32.2033 四、 回归分析 对于线性回归

26、,如果只想得到回归方程,只要使用函数Fit就行了。例13 已知某种商品的价格与日销售量的数据: 价格(元) 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 销量(斤) 5.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 试求线性回归方程,再求价格为4时的日销售量。 解:In1:=data1.0,5.0,2.0,3.5,2.0,3.0,2.3,2.7, 2.5,2.4, 2.6,2.5,2.8,2.0,3.0,1.5, 3.3,1.2,3.5,1.2; Fitdata,1,x,x Out2=6.43828-1.57531x In3:=%

27、 2 / . x4 Out3=0.137029 以上函数虽然能用最小二乘法求出回归方程,但是没有相关性检验。 程序文件LinearRegression.m中,含有实现多元线性回归的专用函数,具体调用格式如下: Regressdata,funs,vars 由表data的数据,求由基函数表funs中函数的线性组合构成的回归方程,其中funs中函数的自变量由表vars给出。 其中表data的一般形式为x11,x21,y1,x12,x22,y2,表funs的一般形式为f1,f2,而表vars的一般形式为x1,x2,其实这里的表示法与函数Fit相同,具体表示式的例子可以参看前面的例子,这里不再重复。例1

28、4 使用Regress重解例13。 解:数据已经在解例13时输入,这里使用Regress继续求解。 In4:= 1.96)与P(0.2 X 1.8)。3 从自动车床加工的同类零件中抽取16件,测得长度值为(单位:cm):12.15,12.12,12.01,12.28,12.09,12.16,12.03,12.01,12.06,12.13,12.07,12.11,12.08,12.01,12.03,12.06 设零件长度服从正态分布,求方差的置信区间(取置信水平为0.05)。4 有一大批袋装化肥,现从中随机地取出16袋,称得重量(kg)如下:50.6,50.8,49.9,50.3,50.4,51.0,49.7,51.2,51.4,50.5,49.3,49.6,50.6,50.2,50.9,49.6 设袋装化肥的重量近似地服从正态分布,试求总体均值的置信区间与总体方差2的置信区间(置信度分别为0.95与0.90)。5 对某矿体的8个采样进行测定,得到该矿体含铜量x(%)与含银量Y(%)的数据如下,试建立回归直线方程。x3734414341344045Y1.92.41012103.61013第 99 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 文案大全

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁