《MATLAB统计工具箱在数学建模中的应用.ppt》由会员分享,可在线阅读,更多相关《MATLAB统计工具箱在数学建模中的应用.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、MATLAB 统计工具箱统计工具箱在数学建模中的应用在数学建模中的应用确定性模型和随机性模型确定性模型和随机性模型随机因素可以忽略随机因素可以忽略随机因素影响可以简单随机因素影响可以简单地以平均值的作用出现地以平均值的作用出现随机因素影响必须考虑随机因素影响必须考虑概率模型概率模型回回归模型模型马氏氏链模型模型确定性模型确定性模型随机性模型随机性模型例例:报童的利童的利润为了获得最大的利润,报童每天应购进多少份报纸?为了获得最大的利润,报童每天应购进多少份报纸?概率模型概率模型162天报纸需求量的调查天报纸需求量的调查 报童早上购进报纸零售,晚上将未卖掉的报纸退回。报童早上购进报纸零售,晚上将
2、未卖掉的报纸退回。购进价购进价b(=0.8元元)零售价零售价a (=1元元)退回价退回价c(=0.75元元)售出一份赚售出一份赚 a-b退回一份赔退回一份赔 b-c199 136 214 195 219 224 197 213 187 187 200 230 172 227 157 114 156 问题分析分析购进太多购进太多卖不完退回卖不完退回赔钱赔钱购进太少购进太少不够销售不够销售赚钱少赚钱少应根据需求确定购进量应根据需求确定购进量每天需求量是随机的每天需求量是随机的目目标函数函数应是是长期的日平均利期的日平均利润每天收入是随机的每天收入是随机的存在一个合存在一个合适的购进量适的购进量=每
3、天收入的期望每天收入的期望值随机性随机性优化模型化模型需求量的随机规律由需求量的随机规律由162天报纸需求量的调查得到天报纸需求量的调查得到 每天需求量为每天需求量为 r 的概率的概率 f(r),r=0,1,2模型建立模型建立 设每天购进设每天购进 n 份,份,日平均收入日平均收入为 G(n)求求 n 使使 G(n)最大最大 已知售出一份赚已知售出一份赚 a-b;退回一份赔退回一份赔 b-cr视为连续变量视为连续变量模型建立模型建立模型建立模型建立由(由(1)或()或(2)得到的)得到的n是每天是每天平均利润最大的最佳购进量。平均利润最大的最佳购进量。结果解果解释nP1P2取取n使使 a-b
4、售出一份赚的钱售出一份赚的钱 b-c 退回一份赔的钱退回一份赔的钱0rpMATLAB 统计工具箱常用命令工具箱常用命令(一一)命令名称输入输出n,y=hist(x,k)频数表x:原始数据行向量k:等分区间数n:频数行向量y:区间中点行向量hist(x,k)直方图同上直方图m=mean(x)均值x:原始数据行向量均值ms=std(x)标准差同上标准差s功能概率密度分布函数逆概率分布均值与方差随机数生成字符pdfcdfinvstatrnd分布均匀分布指数分布正态分布2分布t分布F分布二项分布泊松分布字符 unifexpnormchi2 t fbinopoissMATLAB 统计工具箱常用命令工具箱
5、常用命令(一一)y=normpdf(1.5,1,2)正态分布x=1.5的概率密度(=1,=2)y=fcdf(1,10,50)F分布x=1的分布函数(自由度n1=10,n2=50)y=tinv(0.9,10)概率=0.9的逆t分布(分位数,自由度n=10)用用MATLAB 统计工具箱求解工具箱求解报童模型童模型 根据数据确定需求量的概率分布根据数据确定需求量的概率分布 p(x)baotongdata.m 由由 计算计算 nbaotong1.m回回归模型模型 例例1:血压与年龄、体重指数、吸烟习惯血压与年龄、体重指数、吸烟习惯 序号 血压年龄体重指数吸烟习惯 序号 血压年龄体重指数吸烟习惯1144
6、3924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41体重指数体重指数=体重(体重(kg)/身高(身高(m)的平方)的平方 吸烟习惯吸烟习惯:0表示不吸烟,表示不吸烟,1表示吸烟表示吸烟 建立血压与年龄、体重指数、吸烟习惯之间的建立血压与年龄、体重指数、吸烟习惯之间的回归模型回归模型模型建立模型建立血压血压y,年龄,年龄x1,体重指数,体重指数x2,吸烟习惯,吸烟习惯x3 y与与x1的散点图的散点图y与与x2的散点图的散点图线性回归模型线性回归模型回归系数回归系数 0,1
7、,2,3 由数据估计由数据估计,是随机误是随机误差差 MATLAB 统计工具箱常用命令工具箱常用命令(二二)b=regress(y,X)b,bint,r,rint,s=regress(y,X,alpha)输入输入:y因变量因变量(列向量列向量),X1与自变量组成的矩阵,与自变量组成的矩阵,Alpha显著性水平显著性水平(缺省时设定为(缺省时设定为0.05)s:3个个统计统计量:量:决定系数决定系数R2,F值值,F(1,n-2)分布大于分布大于F值值的概率的概率p,p 时时回回归归模型有效模型有效输输出出:b=(),),bint:b的置信区间,的置信区间,r:残差残差(列向量列向量),rint:
8、r的置信区间的置信区间rcoplot(r,rint)残差残差及其置信区间作图及其置信区间作图回回归归系数系数回回归归系数系数估估计值计值回回归归系数系数置信区置信区间间 045.36363.5537 87.1736 10.3604-0.0758 0.7965 23.09061.0530 5.1281 311.8246-0.1482 23.7973R2=0.6855 F=18.8906 p0.0001 s2=169.7917模型模型求解求解回回归归系数系数回回归归系数系数估估计值计值回回归归系数系数置信区置信区间间 058.510129.9064 87.1138 10.43030.1273 0.
9、7332 22.34490.8509 3.8389 310.30653.3878 17.2253R2=0.8462 F=44.0087 p0.0001 s2=53.6604剔除异常点剔除异常点(第第2点和第点和第10点点)后后xueya01.m例例2 软件开件开发人人员的薪金的薪金资历资历 从事专业工作的年数;管理从事专业工作的年数;管理 1=管理人员,管理人员,0=非管理人员;教育非管理人员;教育 1=中学,中学,2=大学,大学,3=更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考分
10、析人事策略的合理性,作为新聘用人员薪金的参考 编编号号薪金薪金资资历历管管理理教教育育01138761110211608103031870111304112831020511767103编编号号薪金薪金资资历历管管理理教教育育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料名软件开发人员的档案资料 回回归模型模型分析与假分析与假设 y 薪金,薪金,x1 资历(年)资历(年)x2=1 管理人员,管理人员,x2=0 非管理人员非管理人员1=中学中学2=大学大学3=更高更高资历每加一年薪金的增长是常数;资历每加
11、一年薪金的增长是常数;管理、教育、资历之间无交互作用管理、教育、资历之间无交互作用 教教育育线性回性回归模型模型 a0,a1,a4是待估计的回归系数,是待估计的回归系数,是随机误是随机误差差 中学:中学:x3=1,x4=0;大学:大学:x3=0,x4=1;更高:更高:x3=0,x4=0 模型求解模型求解参数参数参数估计值参数估计值置信区间置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994-3826 -2162 a4148-636 931 R2=0.957 F=226 p=0.000R2,F,p 模型整体上可模型整体上可用
12、用资历增加资历增加1年年薪金增长薪金增长546 管理人员薪金管理人员薪金多多6883 中学程度薪金比中学程度薪金比更高的少更高的少2994 大学程度薪金比大学程度薪金比更高的多更高的多148 a4置信区间包含零置信区间包含零点,解释不可靠点,解释不可靠!中学:中学:x3=1,x4=0;大学:大学:x3=0,x4=1;更高:更高:x3=0,x4=0.x2=1 管理,管理,x2=0 非管理非管理x1资历资历(年年)xinjindata.m xinjin.m 残差分析方法残差分析方法 结果分析果分析残差残差e 与资历与资历x1的关系的关系 e与管理与管理教育组合的关系教育组合的关系 残差全为正,或全
13、为负,残差全为正,或全为负,管理管理教育组合处理不当教育组合处理不当 残差大概分成残差大概分成3个水平,个水平,6种管理种管理教育组合混在教育组合混在一起,未正确反映一起,未正确反映 应在模型中增加管理应在模型中增加管理x2与与教育教育x3,x4的交互项的交互项 组合组合123456管理管理010101教育教育112233管理与教育的组合管理与教育的组合进一步的模型一步的模型增加管理增加管理x2与教育与教育x3,x4的交互项的交互项参数参数参数估计值参数估计值置信区间置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1
14、514a4-348-545 152a5-3071-3372-2769a618361571 2101R2=0.999 F=554 p=0.000R2,F有改进,所有回归系数置信有改进,所有回归系数置信区间都不含零点,模型完全可用区间都不含零点,模型完全可用 消除了不正常现象消除了不正常现象 异常数据异常数据(33号号)应去掉应去掉 e x1 e 组合组合去掉异常数据后去掉异常数据后的的结果果参数参数参数估计值参数估计值置信区间置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-30
15、56-3171 2942a619971894 2100R2=0.9998 F=36701 p=0.0000e x1 e 组合组合R2:0.957 0.999 0.9998F:226 554 36701 置信区间长度更短置信区间长度更短残差残差图十分正常图十分正常最终模型的结果可以应用最终模型的结果可以应用xinjindata2.m xinjin1.m 模型模型应用用制订制订6种管理种管理教育组合人员的教育组合人员的“基础基础”薪金薪金(资历为资历为0)组合组合管理管理教育教育系数系数“基础基础”薪金薪金101a0+a39463211a0+a2+a3+a513448302a0+a41084441
16、2a0+a2+a4+a619882503a011200613a0+a218241中学:中学:x3=1,x4=0;大学:;大学:x3=0,x4=1;更高:更高:x3=0,x4=0 x1=0;x2=1 管理,管理,x2=0 非管理非管理大学程度管理人员比更高程度管理人员的薪金高大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略低大学程度非管理人员比更高程度非管理人员的薪金略低 例例33商品商品销售量与价格售量与价格 回回归模型模型x1(元元)120 140 190 130 155 175 125 145 180 150 x2(元元)100 11090150
17、210 150 250 270 300 250y(个个)102 100 12077469326696585某厂生产的一种电器的销售量某厂生产的一种电器的销售量y与竞争与竞争对手的价格对手的价格x1及本厂的价格及本厂的价格x2有关有关,该商品在该商品在10个城市的销售记录如下个城市的销售记录如下 根据数据建立根据数据建立y与与x1和和x2的模型的模型;若某市本厂产品售价若某市本厂产品售价160(元),竞争对手(元),竞争对手售价售价170(元),预测该市的销售量(元),预测该市的销售量.将将(x1,y),(),(x2,y)各各1010个点分别画图个点分别画图y与与x2 2有较明显的线有较明显的线
18、性关系,性关系,y与与x1 1之间之间的关系难以确定的关系难以确定需要对模型需要对模型y=f(x1,x2)作几种作几种尝试,用统计分析尝试,用统计分析决定优劣。决定优劣。例例33商品商品销售量与价格售量与价格 b,bint,r,rint,stats=regress(Y,X,alpha)例例33商品商品销售量与价格售量与价格 一次函数的回归模型一次函数的回归模型 回回归归系系数数回回归归系系数数估估计计值值回回归归系数系数置置信区信区间间 066.5176-32.5060 165.5411 10.4139-0.2018 1.0296 2-0.2698-0.4611 -0.0785 R2=0.65
19、27 F=6.5786 p=0.0247 s2=307.1639结结果不是太好果不是太好:=0.05时模型有效,但时模型有效,但 =0.01时时模型不能用;模型不能用;R2 较小;较小;1的置信区间包含零点。的置信区间包含零点。MATLAB 统计工具箱常用命令工具箱常用命令(三三)rstool(x,y,model,alpha)xnm矩阵矩阵,n是数据容量是数据容量,yn维列向量,维列向量,alpha显著性水平显著性水平多元二多元二项式回式回归model从以下从以下4个模型中选取个模型中选取:(设设m=2)例例33商品商品销售量与价格售量与价格 x1=;x2=;x=x1 x2;y=;rstool
20、(x,y,quadratic)Export向工作区传送参数:向工作区传送参数:beta-回归系数,回归系数,rmse-剩余标准差剩余标准差s,residuals-残差残差(向量向量);Shangpin.m以剩余标准差以剩余标准差 rmse 最小为标准,比较最小为标准,比较4种模型种模型Model:linear purequadratic interaction quadratic rmse:18.7362 16.6436 19.1626 18.6064 =(-312.5871 7.2701 -1.7337 -0.0228 0.0037)例例33商品商品销售量与价格售量与价格 MATLAB 统计
21、工具箱常用命令工具箱常用命令(四四)逐步回逐步回归归 stepwise(x,y,inmodel,penter,premove)x候选变量集合的候选变量集合的nk 数据矩阵(数据矩阵(n是数据容量是数据容量,k是变量数目)是变量数目);y因变量数据向量(因变量数据向量(n维)维);Inmodel初始模型中包括的候选变量集合的指标初始模型中包括的候选变量集合的指标(矩阵(矩阵x的列序数,缺省时设定为全部候选变量)的列序数,缺省时设定为全部候选变量);penter引入变量的显著性水平(缺省时设定为引入变量的显著性水平(缺省时设定为0.05);premove剔除变量的显著性水平(缺省时剔除变量的显著性
22、水平(缺省时设定为设定为0.10)。)。例例33商品商品销售量与价格售量与价格 x=x1;x2;x1.*x2;x1.2;x2.2;stepwise(x,y)Shangpin.mMATLAB 统计工具箱常用命令工具箱常用命令(五五)非线性回归分析非线性回归分析 b,R,J=nlinfit(x,y,model,b0)x自变量数据矩阵,自变量数据矩阵,y因变量数据向量,因变量数据向量,model模型的函数名(模型的函数名(m文件:文件:y=f(b,x),b为待估系数为待估系数 ),),b0回归系数回归系数 的初值的初值;b 的估计值,的估计值,R残差,残差,J估计预测误差的估计预测误差的Jacobi矩阵。矩阵。bi=nlparci(b,R,J)bi回归系数的置信区间 nlintool(x,y,model,b)得到一个交互式画面 谢谢大家!谢谢大家!