《计算建模复习13-随机模拟基础.pdf》由会员分享,可在线阅读,更多相关《计算建模复习13-随机模拟基础.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计算建模复习13-随机模拟基础 随机变量的仿真 如何产生一个分布的随机变量?系统仿真,函数变换均匀分布随机数的产生加同余法:乘同余法:加法和乘法相结合:一般要求:c与M是互素的如果4是M的一个因子,a=4k+1的形式,则混合同余法可以获得最大周期最大周期:混合同余法反馈位移寄存器发生器组合发生器一般产生随机数后,需要对随机数进行各种检验来确定其统计特性符合要求:参数检验,均匀性检验,独立性检验参数检验:最小值,最大值,周期等信息伪随机数:分类器无法区分产生的是真正的随机数还是伪随机数发生器产生的随机数累计函数的逆变换:设随机变量的分布函数为,随机变量服从0,1区间上的均匀分布。因此随机变量函数
2、变换:基本思想:将两个分布之间的函数关系用显式的函数进行表达先产生0,1上均匀分布的随机数,令即可得到满足条件的随机数例题:假设已有均匀分布的随机数,给出产生指数分布随机数的计算公式。指数分布的分布函数就是在区间0,1上均匀分布的随机数变换得到就是指数分布解方程 利用数值算法也是一种思路当F可用或者容易近似的时候,利用线性插值方法可以得到F的一种粗略估计筛选拒绝法(拒绝抽样法):设待抽样的随机变量的概率密度函数为,其中 应该是一个易于抽样的函数(被称为建议分布)则.首先从建议分布中抽取一个样本,再产生一个0,1之间均匀分布的随机数R如果 则作为抽样结果,否则丢弃继续进行下一轮抽样直观解释:例题
3、:考虑设这个建议分布为指数分布,即将由上述筛选拒绝法的算法流程如下:产生分布密度为 的指数分布的随机数利用上述函数的反变换得到代入计算产生0,1之间均匀分布的随机数最后如果则抽样结果为y否则继续例题:只需要取建议分布 下面确定c使得都有,这只需要取的最大值即取,于是将可以分解为算法:选择随机数,直接代入计算。若则接收否则拒绝马尔科夫链蒙特卡洛方法:建立一个平稳分布为的马尔科夫链来得到分布 的样本构造一个非周期,不可约的马尔科夫链使其平稳分布等于我们的目标分布,对于足够大的t这样的马尔科夫链就近似f的边缘分布决定马尔科夫链得到的样本以及由这些样本得到的估计量与目标分布的近似程度MH算法!齐次马尔
4、科夫链的遍历性和不可约性 复习:(首达时间概率),表示0时刻从i状态出发在n时刻首次抵达状态j的概率复习:(迟早到达概率),表示系统从状态i出发迟早到达状态j的概率,定义为从状态 出发经过有限步骤到达状态j的概率,则状态i为常返态,否则称为非常返态(滑过态)复习:(常返态的充要条件)状态i是常返态的充要条件是这是由于复习:(平均返回时间):如果则为正常返否则为零常返复习:(不可约性):所有状态互通如果不可约意味着例题:复习:马尔科夫链的周期态和非周期态:马尔科夫链的遍历态和平稳分布:定义在状态空间 上的概率分布称为马尔科夫链的平稳分布,如果吉布斯抽样算法:为了得到t+1时刻的样本:从条件分布得
5、到服从分布的一个样本从条件分布得到一个样本按照上述步骤依次进行下去可以任意取进行上述迭代重要性抽样:设随机变量X具有联合概率密度,假设需要估计的参数设另一个概率密度函数,满足就有于是上述估计的参数为如果分布密度的选取使得上述式子具有较小的方差,那么这就是一个有效的估计高斯分布随机数的仿真 变换法:假设两个独立的,均匀分布的随机数,则有:这里假设m=0,的特殊情况进行证明当写出用Y的形式进行表达后,可以求出即其联合概率密度发现其(这个概率密度)可以写成两个均值为0,方差为1的乘积近似法(中心极限定理:)随机变量数字特征的计算 均值的计算直接法:递推法(实时计算均值的一种好思路):递推结束后可以得
6、到所有数据的均值方差的计算直接法:也就是说递推法(实时计算均值的一种好思路,但需要同时递推均值和方差):根据上述方差的第二个公式即可得出定义如何根据概率来选择数据 问题:如果已经有数据,如何从这些数据中等概率的选取m个元素来进行测试?假设当前待处理的元素为,其自身及其右侧还具有的元素个数为设为还需要选择的元素个数,则选择的概率为即还需要选取的元素个数比上其自身及其右侧剩余的元素个数设表示选中的概率显然第一个被选取的概率为第二个 被选取的概率为如果不能直接得到X中的元素个数?如何给出只遍历一次的算法?首先取集合的前m个元素放在集合A中对于第i个元素其中,以 的概率等概率替换A中任意一个元素最后的
7、集合A就是我们希望的结果证明:证明如下结论:当第i个元素处理完毕后(就是上述的替换或者不替换),A中每个元素存在的概率实际上就是用数学归纳法证明上述结论。首先当第m个元素处理完毕后,A中每个元素存在的概率就是1,因为前m个元素一定存在于A中考虑处理第m+1个元素的情况。该元素以概率替换A中的任意一个元素,因此该元素存在于A中的概率就是,齐次对于A中已有的m个元素(第m+1个元素还没有替换它之前)中的任何一个元素,在第m+1个遍历完成后存在的概率等于事件(第m+1个元素替换了,并且替换的是这个元素)的非,于是概率为.因此结论成立现在考虑第i-1个元素遍历完成后,A中每个元素存在的概率为 ,往证第
8、i个元素遍历完成后,A中每个元素存在的概率为.考虑处理第i个元素的情况,该元素以 的概率替换A中的任意一个元素,因此该元素存在于A中的概率就是,其次对于A中的m个元素的每个元素而言,其存在的概率都是 ,在第i个元素遍历后这个元素还存在的概率就是即证。(归纳假设)直接根据生成的随机数的分布来进行选取:0,1之间的均匀随机数如何生成随机排列(洗牌算法)RANSAC基础 定义:外点Random sample consensus:字面意思,随机采样一致同意问题:给定一组二维测量数据点,寻找一条直线使得测量点到*直线的几何距离的平方和最小,并且使得内点偏离该直线的距离小于t个单位*阈值t将测量数据分为内
9、点和外点,根据测量噪声进行设置main idea:随机选择两点,由这两点确定一条直线l根据阈值t,确定与l的几何距离t的数据点集,称其为直线l的一致集 重复若干次随机选择,得到直线和相应的一致集使用几何距离求最大一致集的最佳拟合曲线,作为数据的最佳匹配曲线推广到一般的模型,估计模型参数确定求解模型,确定模型参数p,所需要的最小数据点的个数,由 个数据点组成的子集称为模型M的一个样本从数据点集中随机的抽取一个样本J由该样本计算模型的要给实例.确定与阈值小于t的数据点所构成的集合将其记作,将其称为的一致集。如果一致集中数据点的个数大于阈值T,则使用重新估计模型,并输出结果,否则返回步骤2;经过K次随机抽样,选择最大的一致集,使用其重新估计模型M,输出结果RANSAC实现中需要注意的事项:z:表示K次抽样中所有样本都是坏样本的概率w:内点比例距离阈值t:经验选取,如果测量误差服从0均值,标准差的高斯分布终止阈值:(一般规则:如果根据内点比例的估计值,内点数目与一致集大小相当的时候停止)RANSAC算法的自适应算法(终止RANSAC抽样)