《统计回归归模型数学模型件姜.pptx》由会员分享,可在线阅读,更多相关《统计回归归模型数学模型件姜.pptx(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计回归归模型数学模型件姜统计回归归模型数学模型件姜10.1 牙膏的销售量牙膏的销售量 问问题题建立牙膏销售量与价格、广告投入之间的模型建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量预测在不同价格和广告费用下的牙膏销售量 收集了收集了30个销售周期本公司牙膏销售量、价格、个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价广告费用,及同期其它厂家同类牙膏的平均售价 9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803
2、.851销售量销售量(百万支百万支)价格差价格差(元)(元)广告费用广告费用(百万元百万元)其它厂家价格其它厂家价格(元元)本公司价格本公司价格(元元)销售周期销售周期第1页/共32页基本模型基本模型y 公司牙膏销售量公司牙膏销售量x1其它厂家与本公司其它厂家与本公司价格价格差差x2公司广告费用公司广告费用x2yx1yx1,x2解释变量解释变量(回归变量回归变量,自变自变量量)y被解释变量(因变量)被解释变量(因变量)0,1,2,3 回归系数回归系数 随机随机误差(误差(均值为零的均值为零的正态分布随机变量)正态分布随机变量)第2页/共32页MATLAB 统计工具箱统计工具箱 模型求解模型求解
3、b,bint,r,rint,stats=regress(y,x,alpha)输输入入 x=n 4数据矩阵数据矩阵,第第1列为全列为全1向量向量alpha(置信置信水平水平,0.05)b 的的估计值估计值 bintb的置信区间的置信区间 r 残差向量残差向量y-xb rintr的置信区间的置信区间 Stats检验统计量检验统计量 R2,F,p yn维数据向量维数据向量输输出出 由数据由数据 y,x1,x2估计估计 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6956-7.4989 0.1077 0.34860.
4、0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3第3页/共32页结果分析结果分析y的的90.54%可由模型确可由模型确定定 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3F远超过远超过F检验的临界值检验的临界值 p远小于远小于=0.05 2的置信区间包含零点的置信区间包含零点(右端点距零点很近右端点距零点很近)x2对
5、因变量对因变量y 的影响不太显的影响不太显著著x22项显项显著著 可将可将x2保留在模型中保留在模型中 模型从整体上看成模型从整体上看成立立第4页/共32页销售量预测销售量预测 价格差价格差x1=其它厂家其它厂家价格价格x3-本公司本公司价格价格x4估计估计x3调整调整x4控制价格差控制价格差x1=0.2元,投入广告费元,投入广告费x2=650万元万元销售量预测区间为销售量预测区间为 7.8230,8.7636(置信度(置信度95%)上限用作库存管理的目标值上限用作库存管理的目标值 下限用来把握公司的现金流下限用来把握公司的现金流 若估计若估计x3=3.9,设定,设定x4=3.7,则可以,则可
6、以95%的把握的把握知道销售额在知道销售额在 7.8320 3.7 29(百万元)以上(百万元)以上控制控制x1通过通过x1,x2预测预测y(百万支百万支)第5页/共32页模型改进模型改进x1和和x2对对y的的影响独影响独立立 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311-3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3参数参数参数估计值参数估计值置信区间置信区间29.113313.7013 44.525211
7、.13421.9778 20.2906-7.6080-12.6932 -2.5228 0.67120.2538 1.0887-1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p=0.0000 3 0 1 2 4x1和和x2对对y的影响的影响有交互作有交互作用用第6页/共32页两模型销售量预测两模型销售量预测比较比较(百万支百万支)区间区间 7.8230,8.7636区间区间 7.8953,8.7592(百万支百万支)控制价格差控制价格差x1=0.2元,投入广告费元,投入广告费x2=6.5百万元百万元预测区间长度更短预测区间长度更短 略有增加略有增加 第7页/
8、共32页x2=6.5x1=0.2 x1x1x2x2两模型两模型 与与x1,x2关系的关系的比较比较第8页/共32页交互作用影响的讨论交互作用影响的讨论价格差价格差 x1=0.1 价格差价格差 x1=0.3加大广告投入使销售量增加加大广告投入使销售量增加(x2大于大于6百万元)百万元)价格差较小时增加的速率更大价格差较小时增加的速率更大 x2价格优势会使销售量增加价格优势会使销售量增加 价格差较小时更需要靠广告来吸引顾客的眼球价格差较小时更需要靠广告来吸引顾客的眼球 第9页/共32页完全二次多项式模型完全二次多项式模型 MATLAB中有命令中有命令rstool直接求解直接求解x1x2从输出从输出
9、 Export 可可得得第10页/共32页10.2 软件开发人员的薪软件开发人员的薪金金资历资历 从事专业工作的年数;管理从事专业工作的年数;管理 1=管理人员,管理人员,0=非管理人员;教育非管理人员;教育 1=中学,中学,2=大学,大学,3=更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考分析人事策略的合理性,作为新聘用人员薪金的参考 编号编号薪金薪金资历资历管理管理教育教育0113876111021160810303187011130411283102编号编号薪金薪金资历资历管理
10、管理教育教育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料名软件开发人员的档案资料 第11页/共32页分析与假设分析与假设 y 薪金,薪金,x1 资历(年)资历(年)x2=1 管理人员,管理人员,x2=0 非管理人非管理人员员1=中学中学2=大学大学3=更高更高资历每加一年薪金的增长是常数;资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用管理、教育、资历之间无交互作用 教教育育线性回归模型线性回归模型 a0,a1,a4是待估计的回归系数,是待估计的回归系数,是随机误是随机误差差 中学:中学:
11、x3=1,x4=0;大学:大学:x3=0,x4=1;更高:更高:x3=0,x4=0 第12页/共32页模型求解模型求解参数参数参数估计值参数估计值置信区间置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994-3826 -2162 a4148-636 931 R2=0.957 F=226 p=0.000R2,F,p 模型整体上可用模型整体上可用资历增加资历增加1年薪金增长年薪金增长546 管理人员薪金多管理人员薪金多6883 中学程度薪金比更高的少中学程度薪金比更高的少2994 大学程度薪金比更高的多大学程度薪金比更高的多1
12、48 a4置信区间包含零点,解释不可靠置信区间包含零点,解释不可靠!中学:中学:x3=1,x4=0;大学:大学:x3=0,x4=1;更高:更高:x3=0,x4=0.x2=1 管理,管理,x2=0 非管理非管理x1资历资历(年年)第13页/共32页残差分析方残差分析方法法 结果分析结果分析残差残差e 与资历与资历x1的关系的关系 e与管理与管理教育组合的关系教育组合的关系 残差全为正,或全为负,管理残差全为正,或全为负,管理教育组合处理不当教育组合处理不当 残差大概分成残差大概分成3个水平,个水平,6种管理种管理教育组合混在一起,未正确反映教育组合混在一起,未正确反映。应在模型中增加管理应在模型
13、中增加管理x2与教育与教育x3,x4的交互项的交互项 组合组合123456管理管理010101教育教育112233管理与教育的组合管理与教育的组合第14页/共32页进一步的模进一步的模型型增加管理增加管理x2与教育与教育x3,x4的交互的交互项项参数参数参数估计值参数估计值置信区间置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372-2769a618361571 2101R2=0.999 F=554 p=0.000R2,F有改进,所有回归系数置信区间都不含零点,
14、模型完全可用有改进,所有回归系数置信区间都不含零点,模型完全可用 消除了不正常现象消除了不正常现象 异常数据异常数据(33号号)应去掉应去掉 e x1 e 组组合合第15页/共32页去掉异常数据后去掉异常数据后的结果的结果参数参数参数估计值参数估计值置信区间置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2=0.9998 F=36701 p=0.0000e x1 e 组组合合R2:0.957 0.999 0.9998
15、F:226 554 36701 置信区间长度更短置信区间长度更短残差残差图十分正常图十分正常最终模型的结果可以应最终模型的结果可以应用用第16页/共32页模型应用模型应用 制订制订6种管理种管理教育组合人员的教育组合人员的“基础基础”薪金薪金(资历为资历为0)组合组合管理管理教育教育系数系数“基础基础”薪金薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中学:中学:x3=1,x4=0;大学:;大学:x3=0,x4=1;更高:更高:x3=0,x4=0 x1=0;x2=1
16、 管理,管理,x2=0 非管理非管理大学程度管理人员比更高程度管理人员的薪金高大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略大学程度非管理人员比更高程度非管理人员的薪金略低低 第17页/共32页对定性因素对定性因素(如管理、教育如管理、教育),可以,可以引入引入0-1变量变量处理,处理,0-1变量的个数应比定性因素的水平少变量的个数应比定性因素的水平少1 软件开发人员的薪金软件开发人员的薪金残差分析方法残差分析方法可以发现模型的缺陷,可以发现模型的缺陷,引入交互作用项引入交互作用项常常能够改善模型常常能够改善模型 剔除异常数据剔除异常数据,有助于得到
17、更好的结果,有助于得到更好的结果注:可以直接对注:可以直接对6种管理种管理教育组合引入教育组合引入5个个0-1变量变量 第18页/共32页10.4 投资额与国民生产总值和物价指数投资额与国民生产总值和物价指数 问问题题建立投资额模型,研究建立投资额模型,研究某地区某地区实际投资额与国实际投资额与国民生产总值民生产总值(GNP)及物价指数及物价指数(PI)的关系的关系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145 992.7144.281.63
18、422417.8423.0170.8679 944.0149.371.50422163.9386.6160.8254 873.4133.361.40051918.3324.1150.7906 799.0122.851.32341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生
19、国民生产总值产总值投资额投资额年年份份序序号号根据对未来根据对未来GNP及及PI的估计,预测未来投资额的估计,预测未来投资额 该地区该地区连续连续20年的统计数据年的统计数据 第19页/共32页时间序列中同一变量的顺序观测值之间存在时间序列中同一变量的顺序观测值之间存在自相关自相关以时间为序的数据,称为以时间为序的数据,称为时间序列时间序列 分分析析许多经济数据在时间上有一定的许多经济数据在时间上有一定的滞后滞后性性 需要诊断并消除数据的自相关性,建立新的模型需要诊断并消除数据的自相关性,建立新的模型若采用普通回归模型直接处理,将会出现不良后果若采用普通回归模型直接处理,将会出现不良后果 投资
20、额与国民生产总值和物价指数投资额与国民生产总值和物价指数 1.32341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生国民生产总值产总值投资额投资额年年份份序序号号第20页/共32页基本回归模型基本回归模型投资额与投资额与 GNP及物价指数间均有很强的线性关系及物价指数间均
21、有很强的线性关系t 年份,年份,yt 投资额,投资额,x1t GNP,x2t 物价指物价指数数 0,1,2 回归系数回归系数 x1tytx2tyt t 对对t相互相互独立的零均值正态随机变量独立的零均值正态随机变量第21页/共32页基本回归模型的结果与分析基本回归模型的结果与分析 MATLAB 统计工具箱统计工具箱 参数参数参数估计值参数估计值置信区间置信区间 0322.7250224.3386 421.1114 10.61850.4773 0.7596 2-859.4790-1121.4757 -597.4823 R2=0.9908 F=919.8529 p=0.0000剩余标准差剩余标准差
22、 s=12.7164 没有考虑时间序列数据的没有考虑时间序列数据的滞后性影响滞后性影响R20.9908,拟合度高,拟合度高模型优点模型优点模型缺点模型缺点可能忽视了随机误差存在可能忽视了随机误差存在自相关自相关;如果;如果存在自相关性,用此模型会有不良后果存在自相关性,用此模型会有不良后果第22页/共32页自相关性的定性诊断自相关性的定性诊断 残差诊断法残差诊断法模型残差模型残差作残差作残差 etet-1 散点图散点图大部分点落在第大部分点落在第1,3象限象限 t 存在正的自相关存在正的自相关 大部分点落在第大部分点落在第2,4象限象限 自相关性直观判断自相关性直观判断在在MATLAB工作区中
23、输出工作区中输出et为随机误差为随机误差 t 的估计的估计值值 et-1et t 存在负的自相关存在负的自相关 基本回归基本回归模型的随机误模型的随机误差项差项 t 存在正的自相关存在正的自相关 第23页/共32页自回归自回归性性的的定量诊断定量诊断自回归模自回归模型型自相关系数自相关系数 0,1,2 回归系数回归系数=0无无自相关性自相关性 0 0如何估计如何估计 如何消除自相关如何消除自相关性性D-W统计量统计量D-W检验检验 ut 对对t相互相互独立的零均值正态随机变量独立的零均值正态随机变量存在负存在负自相关性自相关性存在正存在正自相关性自相关性广义差分法广义差分法 第24页/共32页
24、D-W统计量与统计量与D-W检验检验 检验水平检验水平,样本容量,样本容量,回归变量数目回归变量数目D-W分布分布表表n较大较大DW4-dU44-dLdUdL20正自正自相关相关负自负自相关相关不能确定不能确定不能确定不能确定无自相关无自相关检验检验临界值临界值dL和和dU由由DW值的大小确定值的大小确定自相关性自相关性第25页/共32页广义差分变换广义差分变换 以以*0,1,2 为为回归系数的普通回归模回归系数的普通回归模型型原模原模型型 DW值值 D-W检检验验无自相关无自相关 有自相关有自相关 广义差分广义差分继续此过程继续此过程原模型原模型 新模型新模型 新模型新模型 步步骤骤 原模型
25、原模型变换变换不能确定不能确定增加数据量;选用其它方法增加数据量;选用其它方法 第26页/共32页投资额新模型的建立投资额新模型的建立 DWold dL 作变换作变换 原模原模型残型残差差et样本容量样本容量n=20,回归,回归变量数目变量数目k=3,=0.05 查表查表临界值临界值dL=1.10,dU=1.54DWold=0.8754原模型有原模型有正自相关正自相关DW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关第27页/共32页参数参数参数估计值参数估计值置信区间置信区间*0163.49051265.4592 2005.21
26、78 10.69900.5751 0.8247 2-1009.0333-1235.9392 -782.1274R2=0.9772 F=342.8988 p=0.0000总体效果良好总体效果良好 剩余标准差剩余标准差 snew=9.8277 sold=12.7164投资额新模型的建立投资额新模型的建立 第28页/共32页新模型的自相关性检验新模型的自相关性检验dU DWnew 4-dU 新模新模型残型残差差et样本容量样本容量n=19,回归,回归变量数目变量数目k=3,=0.05 查表查表临界值临界值dL=1.08,dU=1.53DWnew=1.5751新模型无自相关新模型无自相关性性DW4-d
27、U44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关新模型新模型还原为还原为原始变量原始变量一阶自回归模型一阶自回归模型第29页/共32页一阶自回归一阶自回归模型残差模型残差et比比基本回归基本回归模型要小模型要小新模型新模型 et*,原模型原模型 et+残差图比较残差图比较新模型新模型 t *,新模型新模型 t +拟合图比较拟合图比较模型结果比较模型结果比较基本回归模型基本回归模型一阶自回归模型一阶自回归模型第30页/共32页投资额预测投资额预测对未来投资额对未来投资额yt 作预测,需先作预测,需先估计出未来的国民估计出未来的国民生产总值生
28、产总值x1t 和物价指数和物价指数 x2t设已知设已知 t=21时,时,x1t=3312,x2t=2.1938一阶自回归模型一阶自回归模型2.06883073.0424.5201.95142954.7474.9191.78422631.7401.9180.7436 691.1113.530.7277 637.7 97.420.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生国民生产总值产总值投资额投资额年年份份序序号号一阶自回归模型一阶自回归模型基本回归模型基本回归模型t 较小是由于较小是由于yt-1=424.5过小所过小所致致第31页/共32页