《2022年随机变量模型的确定借鉴 .pdf》由会员分享,可在线阅读,更多相关《2022年随机变量模型的确定借鉴 .pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 第十一章随机变量模型的确定11.1 随机变量模型的确定三种情形: . 随机变量分布的类型已知, 需要由观测数据确定该分布的参数. 由观测数据确定随机变量概率分布类型, 并在此基础上确定其参数. 由已有的观测数据难以确定该随机变量的理论分布形式, 则定义一个实验分布1 分布参数的确定分布参数的类型(1) 位置参数 (记为) 确定分布函数取值范围的横坐标。当改变时 , 相应的分布函数仅仅向左或向右移动而不发生其它变化, 因而又称为 位移参数 。例如, 均匀分布函数U(a,b), 其密度函数为 : 图 11.1 均匀分布 U(a, b ) 的密度函数f(x) 1/ (b-a)0 a b x 名师
2、资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 15 页 - - - - - - - - - 2 fxbaaxb( )10其它其中参数a定义为位置参数, 当a改变时 (保持ba不变 ), fx( )向左或向右移动。(2) 比例参数 (记为):决定分布函数在其取值范围内取值的比例尺。的改变只压缩或扩张分布函数, 而不会改变其基本形状。例如, 指数分布函数EXPO(), 其密度函数为 : f xexx( )/100其它(3) 形状参数 (记为):确定分布函数的形状, 从而改变分布
3、函数的性质, 例如, 韦伯分布 Weibull(,), 其密度函数为 : fxxexx( )(/)1100其它图 11.2 指数分布 EXPO( ) 的密度函数0 0.5 1.0 x f(x) 2.0 1.0 =0.5=1.0=2.0名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 15 页 - - - - - - - - - 3 当改变时 , 其形状发生很大的变化。随机变量X Y, 如果存在一个实数, 使X与Y具有相同的分布 , 则称X与Y仅仅是位置上不同变量; 如果对于
4、某个正实数, 使得X与Y具有相同的分布 , 则称X与Y仅仅是比例尺不同的随机变量; 如果X与Y具有相同的分布, 则称X与Y仅在位置与比例上不同。2. 分布参数的估计最大似然估计 : 设参数, 观测数据为xxxn12,在离散分布情形 , 可令Px( )为该分布的概率质量函数, 定义似然函数L( )为: LPxP xP xn( )()().()12则L( )是联合质量函数, 的最大似然估计值是使L( )取最大值的, 即对于所有可能的值 , 图 11.3 韦伯分布 Wilbull(,) 0 0.5 1.0 1.5 2.0 2.5 x f(x) 1.5 1.0 =3 =2=1 名师资料总结 - - -
5、精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 15 页 - - - - - - - - - 4 )()(LL。在连续分布情形 , 令)(xf为该分布的概率密度函数, 其似然函数定义为)(L: )().()()(21nxfxfxfL例:指数分布 , 被估计的参数()0, 其分布密度函数为fxex( )/1由Leeexxxxninin()exp/1111121为求使L( )取最大值的, 先对L( )取自然对数 : RLnxini( )ln( )ln11由于RL( )ln( )是严格递增的 , L(
6、)取最大值等价于R( )取最大值 , 为此, 对R( )求极值 : dRdnxini1021可得inixnx n1/( )名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 15 页 - - - - - - - - - 5 又由d Rdnxini222312当x n( ) 时, 由于xi为正 , 可见d Rd220, 因而x n( )为最大值 , 从而得到参数的最大似然估计值为( )/x nxnini111.2 分布类型的假设由观测数据来确定随机变量的分布类型-对观测数据进行
7、适当的预处理, 然后根据预处理的结果对分布类型进行假设。1. 连续分布类型的假设预处理方法有三种 , 即点统计法、直方图法及概率图法。(1) 点统计法:基于连续分布的变异系数特征来进行分布类型的假设。变异系数的定义是: 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 15 页 - - - - - - - - - 6 Var xE x( ) /( )其中 Var( )x与 E( )x分别为分布的方差与均值。点统计法对观测数据进行如下预处理: x nxnini( )/1Snx
8、x nnini2121( )( )/ ()则的似然估计为 : Snx n2( ) /( )然后根据值并参照各类分布的变异数据来假设观测数据的分布类型-粗(2) 直方图法将观测数据xxxn12,的取值范围分成k个断开的相邻区间bbb b0112, ,bbkk1, 每个区间宽度相等 , 记为bbbjj 1(,)jk1 2。对任意j,设ni为第j个区间上观测点的个数, 记gnnij/(,)jk1 2名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 15 页 - - - - - -
9、 - - - 7 定义函数h xxbgbxbxxijik( )0001做出h x( )的直方图 , 再将该图与基本理论分布的密度函数图形进行比较(先忽略位置及比例尺的差别), 观察何 种 分 布 与h x( )的 图 形 类 似 , 则 可 假 设 观 测 数 据xxxn12,服从该类型分布,然后再采用前面介绍的方法确定其参数。在实际使用时 , 可能需要增加一些其值特别大或特别小的观测数据,以便与理论分布进行比较。使用直方图法的困难在于如何确定区间长度b。b太大, 将丢失信息 , b太小 , 则观测数据中的噪声滤除得不够 (一般观测数据中总是存在一定的噪声)。19322411161541381
10、1 115655414321432211111111时间样本数050b.0 1.0 2.0 0.20 0.15 0.10 0.05 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 15 页 - - - - - - - - - 8 (3) 概率图法直方图法:将观测数据的直方图与理论分布的密度函数进行比较概率图法:将观测数据定义成一个实验分布函数, 然后将它与理论分布函数进行比较后再进行假设设观测数据xxxn12,共有m个取值 (mn, 因为可能存在取值相同的观测点), 分别
11、记为x(1), x(2), , x m(), 实验分布函定义为 : nnixFi/)(, ,)im1 2其中ni表示小于或等于x i ( )的观测数据的个数 , 且nnm。为了避免由有限个观测数据得到的实验分布函数值等于1, 对上式可略加修正 , 可采用下式来定义 : ( )(. ) /Fx innni05概率图法采用所谓“分位点”比较法: 定义: 分布函数的分位点为:设01g, 则xFgg1( )称为F x( )的分位点。如果F x( )与G y( )都是分布函数 , 分别取不同的g值, 相应得到不同的 (xygg,), 若F x( )与G y( )名师资料总结 - - -精品资料欢迎下载
12、- - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 15 页 - - - - - - - - - 9 是相同的分布函数 , 则由(xygg,)形成的轨迹是斜率为45 的直线。反过来说,如果由两个分布函数F x( ) 与G y( )按相同的一组g值求得各自的分位点xygg, 在xoy平面上确定(,)xygg的轨迹 , 若该轨迹是一条斜率为45 的直线 , 则可以确认F x( )与G y( )的分布是相同的。为了假设( )(. ) /F x inngii05的分布类型 , 可取( )F x i的分位点为x i ( ),
13、分别对应( )F x i的值为 gi, 然后从 基本理论分布中选择一种, 按gi分别求得其分位点yi, 然后在xoy平面上画出x iyi( ),的轨迹 , 观察是否是斜率为 45 的直线 , 若比较接近 , 则可假设观测数据的分布类型与所选分布的类型相同。有时, x iyi( ),的轨迹虽然呈直线形状, 但斜率却不是 45 , 这说明这两个分布的类型是相同的, 只是位置参数和 (或)比例参数不同 , 那么可对x i ( )进行如下下变换 : )(ixyi得到的iyix),(的轨迹必然是斜率为45 的直线。这就说明 , 只要分位点x iyi( ),的轨迹接近直线 , 不管其斜率如何 , 观测数据
14、的分布与所选分布的类型是相同的。概率图法只需要判断分位点轨迹偏离线性度的程度, 不会对观测数据造成信息丢失。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 15 页 - - - - - - - - - 10 3 实验分布 -难以由观测数据确定一个理论分布原始观测数据为单个数据:xxxn12,先将该n个数据按递增顺序排列。 由于可能有相同值的数据, 经排序后得到x(1), x(2), , x m(), (mn),该观测数据的实验分布可由下式来定义: F xxxinnxx j
15、x jx jx jxx jjmxxn( )( )( )()( )( )()(, ,)01111111121观测数据是分组数据:即不知道观测数据的数值, 而仅知道该n个数据分布在m个相邻区间aa01, aa12, , aamm1,上 及 每 个 区 间上 数 据 的 个 数。 记 第j个 区间 上 的 个 数 为njmj(, ,.)12, 则nnnnm12., 实验分布函数的表达式为: 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 15 页 - - - - - - -
16、- - 11 F xxannnnxaaaaxajmxaikijjjjjjm( ), ,012101111111.3 拟合优良度检验由观测数据假设了其分布的类型并估计出其参数以后, 一般需要检验 该分布与这些观测数据吻合的程度, 即进行拟合优良度检验。1 2检验将该拟合分布的取值范围分为K个相等子区间aa01, aa12, , aakk1, 其中可能a0, 或/ ak, 然后计算 : Pfx dxjaajj1( )(, ,)jK12,其中( )f x是拟合的分布密度函数。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理
17、 - - - - - - - 第 11 页,共 15 页 - - - - - - - - - 12 对离散情形 , )(?:1iaxaIjxPPjij(, ,)jK12,其中()P xj是拟合分布的质量函数。2检验的步骤可概括如下: (1) 分别计算每个区间上观测数据的个数jN(, ,)jK12, 记iKjNn1(2) 计算按拟合分布得到的期望个数, 即nPj(, ,)jK12(3) 计算2检验的统计值:212jKjjjNnPnP()(4) 结果判断首先要规定检验水平a, 如果拟合分布中有m个参数是从观测数据按最大似然估计得到的, 则可以证明 , 当n时, KmaaKa1 12121 12,进
18、行2检验时 , 区间的确定将影响检验的效能。为了使检验无偏 , 要求按Pj基本相等来确定区间, 即所选区间aajj1,(, ,)jK12, 使PPPK12。 另外, 根据经验 , 区间的个数宜在3040以下, 并能使nPj5, 以提高检验的有效性。在离散分布的情形下, 不可能保证Pj完全相等 , 但应使Pj的值尽可能接近。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 15 页 - - - - - - - - - 13 2 柯尔莫哥洛夫 -斯米尔洛夫 (K-S 检验)
19、2检验的困难: 按Pj相等来确定aajj1,时要对( )F x进行逆运算 , 而在某些情况下 , 求( )F x的逆运算比较困难 , 或者( )F x无封闭形式无法求( )F x 的逆运算 ; 当 n 较小时 , Pnj5/的值较大 , 从而得到的区间过大, 结果造成观测数据的信息丢失。K-S 检验:将拟合的分布函数( )F x与由观测数据定义的实验分布函数)x(F进行比较。设观测数据为xxxn12, 观测数据的实验分布函数)x(F采用如下定义 : ( )()Fxxxnni数据的个数(对所有x) 这样, )x(F是右连续的阶跃函数。K-S 检验规则:根据)x(F与( )F x的接近程度来决定是
20、否拒绝原假设H0。评价接近程度的指标是采名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 15 页 - - - - - - - - - 14 用)x(F与( )F x之间的最大距离Dn:DFxF xnxnsup( )( )若Dn超过规定的常数1 ,nd(其中是要求的检验水平 ),则拒绝H0, 否则不拒绝H0。问题: 对于不同的分布 , dn的值是不同的 ; 即使是同一分布 , 不同的下1 ,nd也不相同 , 而且尚无通用的表可查。1. 指数分布 EXPO( ):15.02
21、6. 02 .0dnnnDn若成立 , 则拒绝H0, 其中1d的值为 ; 0.150 0.100 0.050 0.25 0.10 1d0.926 0.990 1.094 1.190 1.308 2. 正态分布N( ,)2185.001. 0dDnnn若成立 , 则拒绝H0, 其中1d的值为 : 0.150 0.100 0.050 0.25 0.10 1d0.775 0.819 0.895 0.955 1.035 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 15 页
22、- - - - - - - - - 15 习题(1) 利用 K-S 检验法检验下列样本是否符合均值为0.0、方差为 2.5 的正态分布。检验水平为=0.05。1.549422 2.444344 -1.356287 -1.158468 1.986288 -1.317650 1.203433 -2.405187 -0.983101 -0.942457 2.627202 2.295194 0.253501 0.256372 -1.221426 -2.819277 2.729291 1.374238 -0.028606 0.940219 -1.100076 -2.032944 -1.105679 1.
23、694956 0.019935 (2)若有一批样本数为50 的三极管,其放大倍数值分别为:34.7 56.2 38.4 54.1 57.4 51.7 60.6 67.7 78.1 38.2 49.2 42.8 45.2 53.4 80.4 97.4 84.5 65.3 66.4 73.4 61.1 68.4 69.4 81.3 74.4 36.3 47.2 52.4 69.2 89.7 76.6 67.3 66.2 59.8 59.2 63.2 38.4 44.6 70.1 28.1 52.3 44.5 46.4 64.4 66.4 54.2 78.8 62.0 32.4 48.5 设为随机变量X,X的取值范围为( 0,100) ,试计算其均值和方差,且用直方图法确定该随机变量的分布类型,并对其进行=0.10 水平的2检验。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 15 页 - - - - - - - - -