《输入数据建模课件.ppt》由会员分享,可在线阅读,更多相关《输入数据建模课件.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、输入数据建模输入数据建模第1页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 随机数和随机变量2.1.1 确定性系统和随机系统2.1.2 随机变量与随机数2.1.3 随机数的产生2.1.4 随机数的产生方法2.2 数据采集与处理2.2.1 数据的收集2.2.2 随机变量分布的辨识2.3 拟合输入分布与相关性检验2.3.1 拟合优良度检验2.3.2 随机变量的相关与回归分析2.4 经验分布2.4.1 连续型变量的经验分布2.4.2 离散型变量的经验分布2.5 Stat:Fit在输入数据建模中的应用2.5.1 用Stat:Fit进行数据检验2.5.2 利用Stat:Fit全自动化拟
2、合2.5.3 利用Stat:Fit进行手工拟合注:关于输入数据拟合及Stat:Fit应用主要参考了面向应用的仿真建模与分析:使用ExtendSim(秦天保,王岩峰.清华大学出版社.2009)一书,需要深入学习此部分内容的读者可从该书中获取相关知识。第2页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量 确定性系统和随机系统确定性系统和随机系统 对于一个离散事件系统而言,如果状态变化及其间隔可以预先完全确定,则称这个系统为确定性系统。如果状态变化及其间隔具备某种不确定性,则称这个系统为随机系统。造成这两种系统不同的根本原因就是随机系统中的随
3、机事件。物流系统仿真从理论到实践第3页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机变量与随机数随机变量与随机数 设某一次实验产生的样本空间为,X是定义在上的实函数,即对于内的任一样本点,为一实数,则称X为一个随机变量。若随机变量只能在有限或可列无穷多个(实数)点上取值,则称该随机变量为离散型随机变量。对于离散型随机变量的所有可能值 ,记其概率 ,则称 为离散型随机变量的分布列。第4页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机变量与随机数随机变量与随机数 随机变量X在
4、一个或多个非退化的实数区间上可以连续取值,且存在一个非负的实函数f(x),使得对于任一区间(a,b),有,则称x为连续型随机变量,f(x)为x的概率密度函数。设X的概率密度函数为 ,则X为0,1上的均匀分布函数。在计算机上可产生X的抽样序列 ,通常称 为0,1上均匀分布随机变量x的随机数。第5页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生随机数的产生计算机产生随机数的通常方法是利用一个递推公式:给定了k个初始值 ,就可以利用这个递推公式推算出第k+1个数Xk+1:。第6页,此课件共32页哦第二章第二章 输入数据建模输入数据
5、建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生随机数的产生平方取中法平方取中法是最早产生随机数的一种方法,任取一个2k位的数为种子,乘方后去掉头尾取中间2k位作为第一个随机数,再取第一个随机数为种子,按相同的方法得到第二个随机数,以此类推,就可以得到一个随机数列。这种方法的缺点是容易产生退化,一旦尾数出现0后就无法清除。此外,用这种方法得到的随机数分布均匀性比较差。第7页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生随机数的产生同余法同余法是将一组数据通过一系列特定的数字运算,最后利用一个数字的整除求余,所
6、得的数值就是一个伪随机数。这种特定的数字运算公式为:其中a为乘法因子,c为加法因子,M为模数(为随机数的周期)。当a=1时为加法同余;c=0时为乘法同余;a1、c0时为混合同余。第8页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生方法随机数的产生方法(1 1)逆变换法)逆变换法(反函数法)如果 ,而 是分布函数 的反函数,则 。由随机数 可直接生成规定分布 的随机数 。设随机变量x的分布函数为 ;在区间0,1上取均匀分布的独立随机变量u;由分布函数的反函数 得到的值即为所需要的随机变量x;即为所需的随机变量。第9页,此课件共
7、32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生方法随机数的产生方法(2 2)卷积法)卷积法 卷积法就是通过两个或多个随机变量的相加来得到新的具有某种所希望的分布的随机变量。卷积法可以用来生成爱尔朗分布、近似正态分布和二项式分布的随机变量。假设具有独立均匀分布的随机变量 ,令 ,则Y的分布称为 的m折卷积。第10页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生方法随机数的产生方法(3 3)合成法)合成法合成法适用于产生分布函数F为多个分布函数 的凸函数的情况。设对于任
8、意x,其中,每个 为一个分布函数。同样,如果X的密度函数可写为 ,其中 都是密度函数。产生一个正随机数J,使得 计算返回概率分布函数为 的X。第11页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生方法随机数的产生方法(4 4)取舍法)取舍法 取舍法通过某个检验条件决定取舍得到F(x)的随机数。定义一个函数t,使得对于所有的x都有 ,因为 ,所以函数t不是密度函数。而函数 则是一个密度函数。用下列算法来生成密度为r的随机变量Y:生成密度为r的Y;生成独立于Y的 ;如果 ,则返回 ;否则返回步骤,再次抽样。第12页,此课件共32
9、页哦第二章第二章 输入数据建模输入数据建模2.1 2.1 随机数和随机变量随机数和随机变量随机数的产生方法随机数的产生方法(5 5)函数变化法)函数变化法 函数变化法是关于随机分布的函数的抽样法。通过随机分布之间的关系式推导出分布函数的关系式,利用常用分布的随机数生成某个确定分布的随机数。由 的随机分布生成 的随机分布的步骤为:生成独立的 随机数据 ;令 ;就是 的随机数序列。第13页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.2 2.2 数据采集与处理数据采集与处理数据的收集数据的收集系统名称典型的输入数据排队系统顾客到达的间隔时间顾客被服务时间的分布库存系统需求顾客的分布顾
10、客需求量的分布物料订货的提前期分布生产系统作业到达的间隔时间作业类型的概率每种作业每道工序服务时间的分布可靠性系统生产无故障作业时间第14页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.2 2.2 数据采集与处理数据采集与处理数据的收集数据的收集收集数据的方法主要有以下几种:(1)通过实际预测获得系统的输入数据。例如,观测在一段时间内通过路口的车辆数目。(2)由项目管理人员提供实际系统的运行数据。(3)从已经发表的研究成果、论文中收集类似系统的输入数据模型。第15页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.2 2.2 数据采集与处理数据采集与处理随机变量分布的辨
11、识随机变量分布的辨识 随机变量的分布类型确定往往是对采集的数据进行预处理后进行分布类型的假设。分布类型的假设方法有多种,如果实际系统的输入数据服从理论分布,会给仿真运行带来很多便利。第16页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.3 2.3 拟合输入分布与相关性检验拟合输入分布与相关性检验拟合优良度检验拟合优良度检验 测试连续随机变量的区间数目推荐值样本总数n区间数目k样本总数n区间数目k20不使用 测试10010 20505 10100第17页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.3 2.3 拟合输入分布与相关性检验拟合输入分布与相关性检验随机变量的
12、相关与回归分析随机变量的相关与回归分析 ,其中,。Q反映了观察值偏离回归值的程度;U反映了变量x对变量y线性关系的密切程度。定义相关系数 。用相关系数可以反映变量x和y的线性相关程度。r接近于0,说明变量x和y之间没有密切的线性关系;r接近1,说明两者之间线性关系很密切。第18页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.4 2.4 经验分布经验分布 当无法用理论分布来拟合输入数据或者不需要采用理论分布时,可以直接用观测到的数据及每个数据占全部数据的比例来定义一个分布,这种分布被称为经验分布(empirical distribution)。第19页,此课件共32页哦第二章第二章
13、 输入数据建模输入数据建模2.4 2.4 经验分布经验分布连续型变量的经验分布连续型变量的经验分布 若原始单个数据 在定义其实验分布时,先将该n个数据按递增顺序排列。由于可能有相同值的数据,经排序后得到 ,该观测数据的实验分布可由下式来定义:第20页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.4 2.4 经验分布经验分布连续型变量的经验分布连续型变量的经验分布 若观测数据时分组数据,即不知道观测数据的数值,而仅知道该n个数据分布在m个相邻区间 上及每个区间上数据的个数。为定义这类观测数据的经验分布,记第j个区间上的个数为nj(j=1,2,m),则n1+n2+nm=n,实验分布函
14、数的表达式为:第21页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.4 2.4 经验分布经验分布离散型变量的经验分布离散型变量的经验分布若观测数据是离散随机变量,在原始单个数据情形下,可定义其经验分布的质量函数如下:其中 对分组数据,其质量函数为:然后由这些质量函数即可得到相应的经验分布函数。第22页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用 Stat:Fit是来自Geer Mountain Software()公司的一个软件包,用于帮助分析确定分布的类型,如果需要的话,还可以
15、提供被分析数据的最佳拟合。数据的检验通常包括独立性检验、同质性检验、平稳性检验三种。其中独立性检验和同质性检验可以通过Stat:Fit完成,而平稳性检验不能通过Stat:Fit完成。第23页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用用用Stat:FitStat:Fit进行数据检验进行数据检验(1 1)独立性检验)独立性检验 独立性检验(test for independence或test for randomness),又称随机性检验,检验观察到的样本数据之间是否相互独立,即是否互相拥有影响
16、。如果数据之间没有影响,则称数据是独立的或随机的。独立性检验,常用散点图Scatter Plot,子相关图Autocorrelation Plot,趋势段测试Runs Test这3种检验方法。要全部三种检验都通过才行。第24页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用用用Stat:FitStat:Fit进行数据检验进行数据检验(1 1)独立性检验)独立性检验散点图自相关图第25页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建
17、模中的应用在输入数据建模中的应用用用Stat:FitStat:Fit进行数据检验进行数据检验(1 1)独立性检验)独立性检验趋势段测试第26页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用用用Stat:FitStat:Fit进行数据检验进行数据检验(2 2)同质性检验)同质性检验 同质性检验(test for homogenecity)。检验数据是否来自同一分布,查看直方图有几个峰值,若有2个或以上峰值则说明不同质。下图显示数据的频率直方图说明数据不同质,即数据不是服从同一分布。第27页,此课件
18、共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用利用利用Stat:FitStat:Fit全自动化拟合全自动化拟合 全自动化拟合功能能够自动选择合适的连续或离散分布来匹配输入数据,对这些分布进行极大似然估计,检验结果的匹配度,并以他们的相对排位来显示这些分布。相对排位是由使用有效吻合度估算的观察决定的。(1)在Stat:Fit中输入原始数据。(2)数据检验(3)执行自动拟合第28页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输
19、入数据建模中的应用利用利用Stat:FitStat:Fit进行手工法拟合进行手工法拟合 Stat:Fit的手工法适用于:连续随机变量理论分布、离散随机变量理论分布、连续随机变量经验分布、离散随机变量经验分布。第29页,此课件共32页哦第二章第二章 输入数据建模输入数据建模2.5 Stat2.5 Stat:fitfit在输入数据建模中的应用在输入数据建模中的应用利用利用Stat:FitStat:Fit进行手工法拟合进行手工法拟合下面对用Stat:Fit进行连续随机变量手工拟合的步骤介绍如下:输入原始数据。设置输入数据选项。数据检验。设置拟合参数。执行拟合并选择最佳分布。选择P-value最大的分
20、布。第30页,此课件共32页哦第二章第二章 输入数据建模输入数据建模习题习题2.1 什么是确定性系统?什么是随机系统?2.2 随机数的产生方法有哪些?2.3 利用逆变换法,求解服从分布密度函数 的随机数。2.4 利用取舍法,求解服从分布密度函数 的随机数。2.5 收集随机数时需要注意什么?2.6 如何辨识连续随机变量分布类型?离散随机变量分布类型呢?第31页,此课件共32页哦第二章第二章 输入数据建模输入数据建模习题习题2.7 考察如下一组随机数:0.430.090.520.980.780.440.210.120.640.760.380.670.970.460.070.180.490.470.
21、220.470.690.990.770.760.650.140.250.370.990.20.740.030.710.280.650.50.540.130.870.50.970.170.320.910.280.390.650.730.930.240.990.710.990.640.50.660.010.240.810.940.730.150.450.10.180.820.960.430.570.940.270.340.650.790.030.490.690.850.370.50.60.930.480.420.040.460.040.910.970.260.810.620.790.880.460.740.060.110.920.87取 )(1)利用 检验确定此随机数序列的均匀性。(2)利用K-S检验确定此随机数序列的均匀性。(3)利用自相关检验确定此随机数序列的独立性。(4)利用连贯性检验确定此随机数序列的独立性。2.7 拟合优度检验的方法有哪些?2.8 学习使用stat:Fit进行数据检验。第32页,此课件共32页哦