《数学 均值和方差的渐近性质.docx》由会员分享,可在线阅读,更多相关《数学 均值和方差的渐近性质.docx(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、常见数字特征估计量的渐进行为研究摘 要 在函数的极限行为描述上,渐近分析是一种非常重要的方法,并被广泛应用于各个领域。可以提供近似概率分布的有限样本统计的是统计学中的渐近理论,例如似然比统计的偏差和期望值。 渐近分析也是探索在现实世界现象的数学建模中出现的常微分方程和偏微分方程的关键工具。离散型随机变量和非离散型随机变量一般根据取值来决定 。离散型随机变量的意思是所有可能的取值都可以一一展列出来的一种随机变量;反之。如果所有可能取值不能按规定次序一一展列出来,这也就叫做是非离散型随机变量。当概率分布中的离散型随机变量时,二项分布是简单并且应用实践较为 广泛的。若都有一个分布曲线,且有连续的随机
2、变量。这个随机变量是有分布的,并且有规律性的分布曲线,这个分布也就是正态分布。接下来本文就将详细介绍常见数字特征量的由来, 证明以及相关应用。本文分为三个部分:第一部分介绍了数学期望,方差,分位数,峰度系数,协方差以及各个常见特征量的定义性质以及应用,并举例证明。第二部分介绍了大数定律的相关定理和中心极限定理的相关定理和公式推理并进行随机模拟,最后用MATLAB 绘图实现实现。第三部分介绍了均值和方差的渐近性质。关键词 数学期望方差分位数峰度系数协方差大数定律中心极限定理正态分布Study on the asymptotic behavior of common digital feature
3、 estimatorsAbstract Asymptotic analysis is a method to describe the behavior of a function near its limit. The method of asymptotic analysis has been applied in many scientific fields. In statistics, asymptotic theory provides limited sample statistics of approximate probabilitydistributions, such a
4、s likelihood ratio statistics and deviations in the expected values. Asymptotic analysis is also a key tool to explore ordinary and partial differential equations in mathematical modeling of real world phenomena.Random variables are divided into discrete random variables and non discrete random vari
5、ables according to their values. All possible values can be listed one by one in a certain order. Such random variables are called discrete random variables. If possible values are full of an interval and cannot be listed one by one in order, such random variables are called non discrete random vari
6、ables.If random variables are continuous, there is a distribution curve. There is a special and very common distribution, and its distribution curve is very regular, that is, normal distribution. The normal distribution curve depends on some characterizations of the random variable, the most importa
7、nt of which are the average value and the difference degree. Next, this paper will introduce the origin, proof and related applications of common digital feature quantity in detail.This paper is divided into three parts:In the first part of this paper, the definition and application of mathematical
8、expectation, variance, quantile, coefficient of kurtosis, covariance and each common characteristic quantity are introduced and proved by examples.In the second part of this paper, we introduce the related theorem of the law of large numbers and the related theorem and formula reasoning of the centr
9、al limit theorem, and carry out random simulation. Finally, we use MATLAB to realize the drawing.The third part introduces the asymptotic properties of variance.Keywords mathematical expectation variance quantile kurtosis coefficient covariance law of large numbers, central limit theorem Normal dist
10、ribution.目录引言11 常见的数字特征21.1 数学期望31.1.1 定义与性质31.1.2 期望的应用41.2 方差41.2.1 定义与性质51.2.2 方差的应用51.3 分位数61.3.1 定义与性质61.3.2 分位数的应用71.4 峰度系数71.4.1 定义与性质71.4.2 样本峰度81.5 偏度系数81.6 协方差91.6.1 定义与性质101.6.2 协方差的应用81.7 相关系数82 大数定律92.1 相关定理92.2 随机模拟92.2.1 随机模拟算法93 中心极限定理的模拟与应用133.1 基本理论133.2 模拟与分析143.2.1 数学模型143.2.2 设计
11、过程153.2.3 模拟仿真结果163.3 实际应用174 渐近行为研究21参考文献22致谢23引言渐近分析是一种非常重要的方法,并被广泛应用于各个领域。可以提供近似概率分布的有限样本统计的是统计学中的渐近理论,例如似然比统计的偏差和期望值。 渐近分析也是探索在现实世界现象的数学建模中出现的常微分方程和偏微分方程的关键工具。若都有一个分布曲线,且有连续的随机变量。这个随机变量是有分布的,并且有规律性的分布曲线,这个分布也就是正态分布。在飞速发展的现在,概率论越来越多的被人使用,并应用很多领域。甚至人们在日常生活中都可以用到概率论相关的知识,简单的生活应用都可以为人们日常生活中带来很大的用处。而
12、渐近分析在数学领域以及其他相关领域用到的很多,它可以为数学建模,模拟分析等等作为一种数学工具来计算解决常微分方程和偏微分方程的问题。伴随着人们逐渐对渐近性研究的逐渐深入,科学家也会遇到问题,比如概率收敛等等较深方面的难题,所以此次论文写作也为我增添了很多知识层面上的进步,也理解科学家研究的辛苦。出于我对数学方面的喜爱,才选了这个课题,让我深入研究了平时课本上学不到的东西,接触了很多新的以及以前从来没有想象过的东西,数学的深澳不是一朝一夕就能探索完的,这也是我为什么选这个题目的原因,希望以后会继续研究数学问题,将这种不懈的精神延续下去。101 常见的数字特征1.1 数学期望1.1.1 基本定义与
13、性质定义 1.1.1: (1)连续型 设随机变量 X 的概率密度为 f (x) ,若积分-xf (x)dx 绝对收敛,则称积分-xf (x)dx 的值为 X 的期望。记为 E( X ) = -xf (x)dx.(2) 离散型 设随机变量 X 的分布律为 PX = xk= pk, k = 1,2, 若级数 x pkki=1绝对收敛,则称级数 x pkki=1的和为随机变量 X 的数学期望。记为E( X ) .性质 1.1.2:(1)设 X 是随机变量, C 是常数,则 E(CX ) = CE( X ) .(2) 设 X ,Y 是任意两个随机变量,则E( X + Y ) = E( X ) + E(
14、Y ) .(3) 设 X ,Y 是相互独立的随机变量,则E( XY ) = E( X )E(Y ) .(4) 设C 是常数,则 E(C) = C .1.1.2 期望的应用在医学上的应用某医院的工作人员要在大量的人数中检查某地的患肺炎率,设要对 N 个人进行普查,如果一个一个的检验需要检验 N 次,倘若把这些人归分成N 组,把 K 个人的血样混合,K+1K +1每人次,倘若是阳性,则再逐个检测,一共需要K1次,平均每人需要次。KK例 1.1.1:某地区的患肺炎率为0.4% ,如若对这地区的5000 人进行检验,问哪种方法方便?解 将这5000 人分成 5000 组,每组则分到 K 个人,每人所需
15、检验的次数为随机变量 X ,K则 X 的概率分布为X1KK +1KP(1- 0.004)k1(- 1- 0.004)k每个人的平均所需检验次数的期望为:1k +1 11E( X ) = K (1- 0.004)K +k1- (1- 0.004)k= K 0.996k +1- K 0.996k1= 1+ K - 0.996k.显然,当K = 1,2,3,4, 时, E( X ) 1,比逐个检验的次数要小,所以可得第二种方法更简单。1.2 方差1.2.1 定义和性质方差是各个数据与其算术平均数的离差平方和的平均数,概率论里面定义 1.2.1:的方差是用来衡量检验随机变量和均值二者之间的偏离程度。而
16、在统计学里面的方差,即样本方差,指的是每个样本值和全体样本值的平均数差的平方值的平均值。方差是衡量数据和期望值相差的度量值。一般用s 2表示。方差计算公式:s 2 =( X - m)2N.s 2 为总体方差, X 为随机变量, m 为总体均值, N 为总体例数。样本方差计算公式S 2 = ( X - X )2 /(n -1).为在概率分布中,设 X 是一个离散型随机变量,倘若 EX - E( X )2其中 E( X ) 是 X 的期望值, X 是变量值。X 的方差,记为 D( X ) ,离散型随机变量方差公式:D( X ) = EX - E( X ) 2= E( X 2 ) -E( X ).性
17、质 1.2.2:(1) 设C 是常数,则 D(C) = 0 .(2) 设 X 是随机变量, C 是常数,则 D(CX ) = C 2 D( X ), D( X + C) = D( X ).(3) 设 X与Y 是两个随机变量,则D( X Y ) = D( X ) + D(Y ) 2Cov( X ,Y ).其中协方差Cov( X ,Y ) = EX - E( X )Y - E(Y ).(4) D(aX + bY ) = a2 DX + b2 DY + 2abCov( X ,Y ) .1.2.2 方差的应用(1) 方差在经济学中的应用例 1.2.3:某企业想在转型方面得到决策建议,以下数据通过调查得
18、知,转型成功获利 70万元每月,失败则损失 50 万元每月,问企业是否可以转型成功。解 :设增加的利润用x 表示,则x 的概率分布是P(x = 50) = 0.35, P(x = -20) = 0.65.所以,利润期望为E(x ) = 50 0.35 + (-20) 0.65 = 4.5.D(x ) = (50 - 4.5)2 0.35 + (-20 - 4.5)2 0.65 = 1114.75.(2) 方差在农业中的应用例 1.2.4: 两种品种试验A 和 B 五年的平均收获常量如下。品种第一年第二年第三年第四年第五年A9.89.910.11010.2B9.410.310.89.79.8(单
19、位:吨/平方千米)解 :求出A、B 两种期望值E(x )= 1 9.8 + 9.9 +10.1+10 +10.2)= 10.0.(A5求出A、B 两种方差E(x) = 1 (9.4 +10.3 +10.8 + 9.7 + 9.8) = 10.0.b5D(xAD(xB) = 0.02) = 0.124B 的方差大于A 的方差,所以甲比较稳定,因此种植A.1.3 分位数1.3.1 分位数的定义定义 1.3.1:分位数是一种方法,即可以用概率来切割一个数据。分位数也被称为分位点。这个点对应 P 概率。若0 P 0 ,有lim Phnn- m e= lim P 1 n xnni i=1- m 0, 有
20、lim Pn- p e = 1.mnn2.2 随机模拟2.2.1 随机模拟的算法辛钦大数定律:X1) 系统随机产生n 个服从N(0,1)的数值,令 n=100,求出 n 个随机数的平均值X2) 将上一步重复实验m 组,取m = 100,=0.05,统计m 组中 X 成立的次数及出现的频率。其运行结果为:n出现次数出现频率100760.76200660.66300830.83400860.86500880.88600840.84700950.95800910.91900950.951000960.961100970.971200970.971300970.971400990.991500980.
21、981600950.951700980.981800960.961900970.9720001001.00将上述结果整理如下表:表 2.2.1nX 出现的次数X 0, 有1 lim P 1 n nk =n Xkk =1- m e = 1.伯努利大数定律的随机模拟:因为n A是 n 重伯努利试验中事件A 发生的次数,所以nA 表示事件A 发生的频率。伯努利大数定律表明事件A 发生的频率nnA 依概率收敛于事件A 的概率P。n1) 从两点分布B(1,p)中随机产生n 个数,令 p= 0.5,n= 50,n 代表统计 1 出现的个数21事件 A 出现的频数nA,计算- p ;nnAnAn2) 将 1
22、)重复m 组,取 m = 100,对给定的=0.05,统计m 组中nAn- p e 出现的频率。运行结果为:- p e 成立的次数及n出现次数出现频率107450.745305620.562903590.3592701070.10781040.004表 2.2.3将上述结果整理如下:107450.745305620.562903590.3592701070.10781040.004nA- p e 成立的nA- p e 成立的nnn次数次频率nA从以上图表可清晰看见,实验证明,当n 的值越来越大, n A和 n 的偏差值大于等于P()逐渐趋于 0,事件的频率与概率之间产生大偏差的可能性会很小也就
23、是当n 很大时才会出现。做很多次相关实验,就可以让一个事件可能会发生的频率来代替这个事件所可能产生的概 率。从而简单直接的得出结果。3 中心极限定理模拟与分析3.1 基本理论中心极限定理包括很多种其他形式,但是它们的最终结果是相同的,它们的区别体现在于定理运用条件的不同和使用方法的不同。下文中简单介绍,最常用的是列维定理,也用它证明了独立同分布是近似拟合正态分布的。定理 3.1.1:拉普拉斯中心极限定理 在n 重贝努利试验中,发生 A 情况的概率为p , mn为n 次试验中发生 A 情况的次数,有nlim Pm- np x =1 x e- 2 dt.2pt2nnp(1- P)-定理 3.1.2
24、:列维中心极限定理 若x ,x12,L 是一组独立同分布的随机变量,并且其数学期望和方差分别为 E(xi) = m 和 D(xi) = s 2 , i = 1,2,L, 则令n x - nE(x )n xi=1i=1nD(x )ii=1i=1nsix=ii=,n则x的分布函数 Fnn(x) = pzn x,当n 时,趋向于标准正态分布 N (0,1) ,即n x - nmi=1ns2pi1x- 2lim F(x) = lim P x = e t2dt .nnn-定理 3.1.3:(格列汶科定理)当n 时,经验分布函数 Fn(x) 关于 x 一致地收敛于总体的分布函数 F ( X ) ,即Pli
25、msupF (x) - F (x) = 0 = 1.n - x 0(k = 1,2, ).,则随机变量之和的标准化变量kk的分布函数 Fn(x)对于任意 x 满足 lim Fn(x)= f (x).则随机变量之和nXkk =1的标准化向量的分布函数 Fn(x)对于任意x 满足:kk =1 k =1k D nXk =1k nX- E nXY=nnXk =1kns=- nm.lim F nk =1kns(x)= lim P X- nm x = x 1e-t2= f (x).2p2 dtnnn-记 :kk =1nsnXY =n- nm.则Y 为nXnkk =1的标准化随机变量.又因为lim PY x
26、= f (x)nn即 n 足够大时, YnY 近似 N (0,1),n的分布函数近似为标准正态随机变量的分布函数所以nXnkk =1= sY + m 近似 N (m,( 1s)2)。nnn独立同分布函数表达式:iN x y = i=1,N正态分布函数表达式:-(x-m)22psy = e2s 2 .3.2.2 证明设计过程为了验证当K非常大时,Y 近似服从N(0,1)n首先分别构造了独立分布函数和正态分布函数的数学表达公式,然后取得足够且很大大的随机数,这个随机数是独立同分布的随机数。然后用 matlab 软件绘图来观察两个分布的拟合情况。源代码如下:clear; close; K=1000;
27、 N=K; M=100;r=rand(N,M); mu=N*0.5; sigma=sqrt(N/12); s=sum(r);mu=mean(s); sigma=std(s);n,x=hist (s,mu-5*sigma:sigma:mu+5*sigma); bar(x,n/M/sigma,y);hold on;h=mu-5*sigma:0.1*sigma:mu+5*sigma; t=exp(-(h-mu).2/2/sigma2)/sqrt(2*pi)/sigma; plot(h,t,k,LineWidth,3,Color,b);title(中心极限定理);legend(独立 RV 和,正态分布
28、); hold off;3.2.3 模拟仿真结果运用 matlab 进行绘图,结果如下图:图 3.2.3图 3.2.4分析以上模拟的结果:由图可知正态分布曲线和独立同分布直方图是几乎接近重合的,如果仔细观察两张图的话,可以清晰并且直观的看出二者拟合程度更高,接近重合。这两张图形所使用的源代码唯一的不同之处就在于k 的取值,第一张图形中 k 的取值为 1000 第二张图形中k 的取值为 100,由此可得出:当k 很大时,独立同分布近似拟合正态分布。3.3 实际应用1) 在小学规模设置方面的应用例 3.3.1:假设武汉地区 2 所小学的规模、师资配备、收费价格都相同。片区有 500 名适龄学生,假
29、设每名学生选择学校是相互独立的,问每个小学至少开设多少个班(每班 30 人)才能保证小学缺少学位而离开的概率小于5%?解:令 X 为 500 名学生当中选某小学的人数,设小学可接受s 名学生入学。X 服从二项分布B(500,0.5),则算得期望为250,方差为125,由棣莫佛拉普拉斯定理中心极限定理知 (x - 250)125近似服从标准正态分布N(0,1) ,因此P (X s)= P X - 250 s - 250 f s - 250 0.95.125125125根据标准正态分布表可得出:125s - 250 1.645求解得 s268。小学每班容量为 30 人,268/30 取整等于 9,所以每个小学至少开设九个班级,才能保证概率小于%5。2) 在生产供应量方面的应用例 3.3.2:某公司每个会议室都配备扩音设备,领导开会前需要到值班室领取话筒和电池,为了保障工作的顺利进行,需要准备大量的电池。现有一批电池共100 节,它们的寿命服从l = 130 的指数分布,每次使用一节,用完即换新的。这批电池壳使用 2500h 以上的概率是多少?解:设每节电池的寿命为随机变量X,并且X , X ,., X 相互独立,因为X 服12100i从l = 130的指数分布,所以EX= 30, DX= 302ii,可求得E 100 X =3000,D 100 X =90000.i