《管理系统模拟精选PPT.ppt》由会员分享,可在线阅读,更多相关《管理系统模拟精选PPT.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、管理系统模拟第1页,此课件共70页哦1输入数据建模输入数据建模原始数据原始数据原始数据经验分布理论分布处理处理确定数值范围计算频率预处理分布类型辨识参数估计拟合度检验输入数据模型输入数据模型直接使用第2页,此课件共70页哦2(1)在仿真运行中直接使用收集到的数据)在仿真运行中直接使用收集到的数据该方法很直接,也可以用来做确定性模型的有效性检验有效性检验,但是有两个缺点缺点:(1)只能用收集到的历史数据来驱动仿真模型;(2)经常没用足够多的数据来进行多次仿真试验。第3页,此课件共70页哦3(2)把收集到的数据定义为经验分布)把收集到的数据定义为经验分布该方法可以根据实际数据值的范围范围、某个数据
2、值出现的频率频率,用随机数来产生所需要的随机变量值,能够产生足够多的数据来进行多次仿真试验。第4页,此课件共70页哦4(3)将数据拟合为某种理论分布)将数据拟合为某种理论分布如果发现所收集的数据能够较好地服从某种理论分布(Theoretical Distribution),倾向于采用第 3种方法而不是第2种方法。建立输入数据理论分布的几个主要步骤建立输入数据理论分布的几个主要步骤收集原始数据基本统计分布的辨识参数估计以拟合度检验第5页,此课件共70页哦54.2 收集原始数据收集原始数据一、收集输入数据的方法一、收集输入数据的方法()通过实际观测实际观测获得系统的输入数据。()由项目管理人员项目
3、管理人员提供的实际系统运行数据。()从已经发表的研究成果、论文研究成果、论文中收集类似系统的输入数据模型。二、收集数据时,要注意以下几点:二、收集数据时,要注意以下几点:()在收集数据的同时就分析数据,确定收集到的数据是否足够。()将性质相同的数据集组合在一起。()确定两个随机变量是否相关。()注意一组观测到的、似乎是独立的样本是否具有自相关性。第6页,此课件共70页哦64.3 随机变量分布的辨识随机变量分布的辨识 连续型连续型随机变量分布类型辨识 离散型离散型随机变量分布类型辨识点统计法直方图法线图法点统计法第7页,此课件共70页哦74.3.1连续型随机变量分布类型辨识连续型随机变量分布类型
4、辨识(1)点统计法)点统计法点统计法确定连续随机变量分布类型的基本思路为,首先计算连续型随机变量的偏差系数偏差系数,再根据偏差系数的特征寻求与其相近的理论分布,并假设随机变量的分布为这一理论分布。偏差系数是偏差与均值的比:其中:var(x)随机变量分布的方差;E(x)均值。第8页,此课件共70页哦8如果有随机变量X,则有:其中:随机变量采集数据的均值;s2(n)随机变量采集数据的方差。所以,第9页,此课件共70页哦9第10页,此课件共70页哦10点统计法点统计法例例41:用汽车到达银行的时间间隔原始数据汽车到达银行的时间间隔原始数据接近1,假设间隔服从指数分布。第11页,此课件共70页哦11(
5、2)直方图法)直方图法 直方图是一种图形估计方法。基本原理是:基本原理是:用观测到的样本数值建立随机变量的概率概率密度函数分布密度函数分布的直方图,然后把得到的直方图与理论分布的概率密度函数曲线图形做对比对比,从图形上图形上直观地判断被观测随机变量是否满足某种理论分布。第12页,此课件共70页哦12具体做法:具体做法:1)将所有观测数值分为k个区间长度相等的相邻区间。bj-1,bj),j=1,2,k。区间宽度b=bjbj-12)对于第i个区间bj-1,bj),令gj表示在第j个区间中的观测数据数量nj占整个观测数据的比例,即gj=njn。3)定义函数,4)将定义的观测数据取值的区间画在横坐标轴
6、上,在垂直坐标轴上标记出频率函数,画出被观测变量的直方图。5)将直方图与理论分布的概率密度函数对比,确定被观测数据服从哪种理论分布。第13页,此课件共70页哦13b0 b1 b2 b3 bj bj-1 bkx1 x2 xa xa+1 xb xb+1 xc xi+1 xm Xm+1 xnbbbbb第14页,此课件共70页哦14例例42:1)首先确定观测数据的范围 在观测到的间隔时间数据中,最小间隔是0.01min,最大间隔是1.96min,观测数值范围为0.0,2.0。2)确定相邻区间宽度为b=0.1,b0=0,b20=2.0,构造出20个长度相等的相邻区间。第15页,此课件共70页哦153)统
7、计第j个区间所包括的观测数据数目占所有观测数据数目的比例gj,下表中列出了具体数值。第16页,此课件共70页哦164)根据上表给出函数h(X)。5)将连续的区间在横轴上表出,将函数h(x)的数值在纵轴上表出,画出直方图。6)将直方图与理论分布的概率密度函数曲线做比较。从图形上看,间隔符合服从指数分布。第17页,此课件共70页哦17要注意选择区间宽度要注意选择区间宽度第18页,此课件共70页哦18第19页,此课件共70页哦194.3.2 离散型随机变量分布类型的辨识离散型随机变量分布类型的辨识(1)点统计法)点统计法与连续型随机变量点统计法方法相同,同样是采用计算偏差系数的方法,寻找偏差系数相近
8、的理论分布进行假设。第20页,此课件共70页哦20(2)线图法)线图法 线图法是把采集到的数据与假设的理论分布的概率质量函数曲线进行比较。如果找到相近的,则可以假设其为该理论分布。具体做法步骤如下:设观察数据为:x1,x2,xn;将其按递增顺序排列,设共有 m个取值(mn),分别为:x(1),x(2),x(m);x(i)的数据个数占整个观测数据个数的比例数为hi;以x(i)作为自变量,以hi的值为函数值,即:hi=f(x(i)),i=1,2,m;由函数值 hi向相应的自变量 X(i)做垂线所得的图形称为线图(见下图);与假设的理论分布的概率质量函数概率质量函数比较,确定随机变量的分布。第21页
9、,此课件共70页哦21第22页,此课件共70页哦22例:观测在7:00am7:05am时间段内到达某十字路口西北拐角的车辆数目。每周观测 5天,连续观测 20周,在 5分钟内到达的车辆数目列表 45中。第23页,此课件共70页哦23第24页,此课件共70页哦244.4 参数估计参数估计用直方图或线图确定样本数据服从的理论分布理论分布之后,还要根据已经观察到的样本计算出理论分布的参数理论分布的参数。如果可以确定理论分布的参数,我们就建立了输入参数的一个数学模型,可以用前面(第三章)介绍的方法来生成随随机变量的数值机变量的数值。第25页,此课件共70页哦25按照统计学的说法,假设某随机变量的总体分
10、布是F,分布F的参数未知,要用已经观测到的部分样本来计算全部样本总体分布F的参数的真值,这样的统计推断问题被称为估计估计(Estimation)。在数理统计学中有许多参数估计的方法。点估计:点估计:如果用统计方法给出的结果是关于参数真值的一个点,称为点估计(点估计(Point Estimation);区间估计:区间估计:如果给出参数真值存在的一个区间,称为区间估计区间估计(Interval Estimation)。第26页,此课件共70页哦26点估计点估计(1)样本均值样本均值 样本均值是随机变量X期望值E(X)的一个点估计,刻画了随机变量的一个特征,即随机变量倾向于某个数值,(2)样本方差样
11、本方差 样本的方差越大,说明样本与均值的偏离越大,即样本数值的分散性大;反之,样本的方差越小,说明样本数值的集中程度比较高。第27页,此课件共70页哦27第28页,此课件共70页哦28例:用汽车到达银行的时间间隔原始数据汽车到达银行的时间间隔原始数据即:第29页,此课件共70页哦29例:用车辆数目数据车辆数目数据即:第30页,此课件共70页哦304.5 拟合度检验拟合度检验 通过做辨识和参数估计,可以估计出观测样本的分布及其参数。在得到了这个估计的理论分布及其参数之后,需要判断观测样本分布与估计的理论分布的接近程度,即确定估计的理论分布的拟合度。比较直观的方法之一是直接把直方图与所估计理论分布
12、的概率密度函数曲线做对比。假设所估计理论分布的概率密度函数为,对于连续型随机变量,比较的具体方法是:把直方图与b 曲线画在一起。第31页,此课件共70页哦31例:我们估计汽车银行顾客到达时间间隔服从=2.506的指数分布,将直方图与概率密度曲线做对比。拟合样本数据得到顾客到达间隔时间的概率密度函数,直方图与画在一起:第32页,此课件共70页哦32第33页,此课件共70页哦33拟合度检验的定量方法:拟合度检验的定量方法:2检验(ChiSquare Test)KolmogorovSmirnov检验(柯尔莫哥洛夫斯米尔诺夫检验、KS检验)第34页,此课件共70页哦344.5.12 检验(检验(Chi
13、Square Test)2 检验以下假设是否成立。H0:随机变量X满足假定的分布;如果H0假设被接受,那么被检验的随机变量就满足所假定的分布;如果H0假设被拒绝,则被检验的随机变量不满足所假定的分布。第35页,此课件共70页哦352 检验的方法:(1)将n个观测样本按数值大小分到k个相邻区间aj-1,aj)(j=1,2,k)中,按照公式计算2 统计量。其中 Nj为在第 j个区间中的观测样本数观测样本数,pj为按照假设的假设的分布确定的分布确定的样本在该区间中出现的概率。对于连续连续型型变变量量,对于离散型随机离散型随机变变量量,是所假设的分布的概率密度函数,是所假设的分布的概率质量函数。第36
14、页,此课件共70页哦36(2)2服从ks1自由度的ChiSquare分布。k为所划分区间的数目,s为所假定的分布的参数数目。如果则H0假设被拒绝。是显著水平,相应的(1一)100就是置信度。第37页,此课件共70页哦37不要求k个相邻区间的宽度都相等。对于离散型随机变量,区间的数量由观测样本的取值数目确定;对于连续型随机变量,区间数量采用表4.8中的推荐值。第38页,此课件共70页哦38例46:在5分钟内到达十字路口西南拐角的车辆数目被假设为服从泊松分布,通过参数拟合得到3.64。在显著水平0.05时,用2测试检验在5分钟内到达十字路口西南拐角的车辆数目是否服从所假设的泊松分布。离散泊松分布的
15、概率质量函数为,第39页,此课件共70页哦39表49是按照离散泊松分布的概率密度函数计算出的整数X取值011时的概率质量。将总共100个样本值分为7个相邻的区间,再根据离散泊松分布的概率密度质量计算出,如果满足所假定的泊松分布,在每个取值区间内应该出现的样本数目npi;。pi为所假设的泊松分布取第i个区间中的数值的概率质量,n为全部样本的数目。检测统计量的计算过程在表410中列出。第40页,此课件共70页哦40统计量 显著水平取为0.05。泊松分布有一个参数,则上分布的自由度为,k-S-1=7-1-1=5查表可得关键值,因此在显著水平取0.05,H0假设被拒绝,即样本数据不服从不服从所假定的泊
16、松分布。第41页,此课件共70页哦41 在计算2统计量时,Ni是分段区间中所包含的样本数量,换算成占全部样本的比例就可以得到直方图直方图。pi则是所假设的理论分布的数值出现在分段区间内的概率,代表了概率密度函数或概率质量。2 统计量可以被理解为直方图与概率密度函数曲线或线图与概率质量函数曲线偏差曲线的偏差量偏差量,2 测试则是定量化的直方图与概率密度或线图与概率质量函数曲线对比方法。采用2测试需要确定分段区间确定分段区间,如何确定分段区间没有严格的规则,区间数量不同对统计量有比较大的影响。对于同一组样本,在选择某个区间数量时,得到了样本不服从所假设分布的结论;选择另外的区间数目,则可能得出样本
17、服从所假设分布的结论。另外,当样本数量样本数量比较少的时候,不能采用2测试。第42页,此课件共70页哦424.5.2 KolmogorovSmirnov 检验检验KS检验是把经验分布函数与所假设分布的分布函数做比较。使用KS检验不用确定分段区间,对样本数量也没有限制。第43页,此课件共70页哦43KS检验步骤检验步骤假设观测到一组样本X1,X2,Xn,进行KS测试的步骤如下:(1)定义样本的经验分布函数)定义样本的经验分布函数Fn(X)。Fn(x)是数值小于等于X的观测样本占全部样本数目的比例(2)计计算算KS统计统计量量Dn。Dn是经验分布函数Fn(x)与所假设的分布函数的最大偏差值。第44
18、页,此课件共70页哦44将观测值按照递增的顺序排列X(1)X(2)X(n),分别计算,统计量Dn的值越大,经验分布函数与所假设的分布函数的偏差越大。(3)判断样本是否服从所假设的分布。)判断样本是否服从所假设的分布。根据将统计量与一定显著水平下的关键值dn,比较,如果Dndn,,则H0假设被接受,样本服从所假设的分布;否则,H0假设被拒绝,样本不服从假设的分布。第45页,此课件共70页哦45K检验临界值表检验临界值表第46页,此课件共70页哦46 例4.7:在100分钟时间内观测到了50个顾客到达的间隔时间,单位分钟。按照顾客到达的先后顺序,时间间隔如下:用KS测试检验间隔时间是否满足指数分布
19、?第47页,此课件共70页哦47顾客到达的间隔时间是在(0,100)时间区间上收集到的,如果间隔时间间隔时间服从指数分布,那么顾客到达时间到达时间在(0,100)时间区间上是均匀分布的。为了方便起见,把顾客到达时间规一化规一化到(0,1)区间上。规一化后的到达时间如下:第48页,此课件共70页哦48经验分布函数与(0,1)均匀分布均匀分布偏差的计算过程列在表411中。从表 411可以得到,所以 KS统计量 第49页,此课件共70页哦49统计量D的关键值可以查表得到,取显著水平a0.05,当n=50时,统计量D比关键值小,所以检验结果表明间隔时间服从指数分布。最初的KS测试只能应用于所假设分布的
20、参数全部已知的场合,不能使用参数估计所给出的参数。改进后的KS测试可以使用从样本得到的参数,有关详细内容参见相关书籍。虽然KS测试有它的优势,但与2测试相比它的应用范围比较小。第50页,此课件共70页哦50例:某随机数发生器产生出 5个随机数,ui0.44,0.81,0.14,0.05,0.93,要求显著性水平为=0.05。用KS检验是否符合均匀分布。第51页,此课件共70页哦51首先将所产生的随机数由小到大排列,并进行检验步骤中的各项计算,如下表所示:由表可见 D+0.26,D0.21,故Dmax(0.26,0.21)0.26。当 0.05和N5时,由表 3-1可知D的临界值D5,0.950
21、.565。由于DD5,0.95,故不能拒绝所产生的随机数的分布与理论均匀分布之间无显著差异的假设。第52页,此课件共70页哦52SN(X)和)和F(x)的比较)的比较0.05 0.14 0.44 0.810.93第53页,此课件共70页哦53思考:已知有如下随机数:53,47,42,46,47,51,51,59,47,51(1)对其做理论分布假设并检验。(提示及要求:第1步:用偏差判断属于哪种概率密度函数的分布;第2步:做直方图,从图形上判断属于哪种概率密度函数的分布;第3步:用第一步计算的参数和第二步得到的直方图的结论,做一条理论分布曲线与直方图相拟合或用卡方检验、KS检验。)(2)有人认为
22、符合泊松分布,你认为对吗,说明理由。第54页,此课件共70页哦544.7 经验分布经验分布当无法用理论分布来拟合输入数据或者不需要采用理论分布的时候,我们直接用观测到的数据及每个数据占全部数据的比例来定义一个分布,这种分布被称为经验分布(Empirical Distribution)。经验分布具有离散离散和连续连续两种类型。第55页,此课件共70页哦554.7.1 离散型变量的经验分布离散型变量的经验分布假定观测到的样本数据为X1,X 2,Xn,建立离散数据经验分布的步骤如下。(1)计算样本数值的相对频率。n个样本共有k个取值,按照递增的顺序排列X(1)X(2)X(n)(kn)。对于每样本值X
23、(j),p(j)是数值为X(j)的样本的数目占全部观测样本的比例,称为相对频率。(2)将样本值X(j)及其对应的相对频率p(j)列表,或做相对频率的直方图 第56页,此课件共70页哦56例:对中午到餐厅就餐的顾客进行观察,发现每批顾客的入数在18之间。需要确定每批顾客数目的数据模型。观测了最近的300批顾客,每批顾客数目及其相应的出现次数在下表中列出。每批客人的数目出现次数相对频率1300.10 21100.37 3450.15 4710.24 5120.04 6130.04 770.02 8120.04 第57页,此课件共70页哦57在图4.9中给出的每批顾客数目的累计频率曲线累计频率曲线代
24、表了样本的经验分布经验分布 第58页,此课件共70页哦58批量到达过程,是系统仿真中经常遇到的一种到达模式,如一批多个工件同时进入加工系统、一批多个顾客同时到达餐厅、一个订单中包括多种商品等。我们首先首先要确定各批次之间的间隔时间服从哪种分布,通常是指数分布。然后然后,再来建立每个批次的顾客数量模型。设N(t)是到在时刻为止,已经到达的顾客批次数目。我们可以建立到达过程N(t),t0的模型。如果Bi是第i个批次中的顾客数目,X(t)是到t时刻为止已经到达的顾客数目。假定B满足独立同分布,而且独立于到达过程N(t),t0,那么 X(t),t0是一个复合过程。第59页,此课件共70页哦59例:第6
25、0页,此课件共70页哦604.7.2 连续型变量的经验分布连续型变量的经验分布对于连续型变量,不定义概率密度函数,而直接用累计频率累计频率定义分布函数。在定义的经验分布的时候,需要考虑两种情况:能够得到原始的全部观测数据;能够得到原始的全部观测数据;只能得到变量数值落在若干区间内的次数。只能得到变量数值落在若干区间内的次数。第61页,此课件共70页哦61 能够得到原始的全部观测数据能够得到原始的全部观测数据假设得到了全部样本X1,X2,Xn,可以得到分段线性的分分段线性的分布函数布函数。定义分布函数的步骤如下。(1)将观测到的样本按照数值增大的顺序增大的顺序排列,设X(i)为第i个最小的数据值
26、,即X(1)X(2),X(n)(2)按照下列公式计算分布函数F(x),第62页,此课件共70页哦62例:第63页,此课件共70页哦63 只能得到变量数值落在若干区间内的次数只能得到变量数值落在若干区间内的次数不知道原始的样本数值是多少,但是知道样本总数为n,样本按照k个相邻区间(a0,al,(a1,a2,(ak-1,a k,分成k组。落在第j个区间内的样本数量为nj,按照以下步骤定义分段线性的经验分布函数G。(1)定义经验分布函数G在区间分界点上的数值。第64页,此课件共70页哦64(2)进行线性插值,计算在每个区间内的分布函数。第65页,此课件共70页哦65 例例:输送带系统出现故障时需要用
27、一段时间进行维修,共收集到了100个维修时间。如表4.14所示,维修时间以半小时为间隔分为6个相邻区间。建立维修时间的模型。根据区间的变界值,a00.0,a63.0。在区间分界点上的分布函数值为:G(0)0,G(0.5)0.21,G(1.0)0.33,G(1.5)=0.62,G(2.0)0.81,G(2.5)0.89,G(3.0)1.00。第66页,此课件共70页哦66产生随机数为0.83,则维修时间为多少?G(x)0.83G(2.0)0.81,G(2.5)0.89,由公式:0.830.81(x-2.0)(0.89-0.81)/(2.5-2.0)解得:X=2.125第67页,此课件共70页哦67第68页,此课件共70页哦68经验分布产生的随机变量取值只能在样本的最小值和最大值之间最小值和最大值之间。如果得到的样本数目比较少,由于无法生成比样本最大值更大的数字,影响了经验分布的可靠性可靠性。第69页,此课件共70页哦69本章要求通过例子熟练掌握、加深理解输入建模的方法第70页,此课件共70页哦70