2022年投资组合优化模型分享 .pdf

上传人:H****o 文档编号:39897155 上传时间:2022-09-08 格式:PDF 页数:16 大小:918.85KB
返回 下载 相关 举报
2022年投资组合优化模型分享 .pdf_第1页
第1页 / 共16页
2022年投资组合优化模型分享 .pdf_第2页
第2页 / 共16页
点击查看更多>>
资源描述

《2022年投资组合优化模型分享 .pdf》由会员分享,可在线阅读,更多相关《2022年投资组合优化模型分享 .pdf(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1 投资组合优化模型摘要长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,

2、以获得最高的回报。对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益 U与 x,y 之间的关系,对于模型中的各项自变量前的系数估计量,利用spss 软件来进行逐步回归分析。发现DW 值为 0.395,所以原模型的随机误差项违背了互相独立的基本假设的情况,即存在自相关性。为了处理数据间的自相关问题,运用了迭代法,先通过 Excel 进行数据的处理和修正,达到预定精度时停止迭代,再一次用spss 软件来进行检验,发现DW 值变为 2.572,此时 DW 值落入无自相关性区域。在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能

3、为投资者实践提供某种程度的科学依据。对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB 软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。最后,对模型的优缺点进行评价,指出了总收益与购买A 类资产 x 份数和 B类资产 y 份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。关键字:经济效益回归模型自相关迭代法线性规划有效投资方法一、问题重述某金融机构选定了A,B两种投资品种,购买 A类资产 x 份和 B类资产 y 份的投资收益是 U,经分析测算有如下收益表:U A B 3.7 2 5 5.4 3 8 6.6 4

4、11 7.4 5 14 10.2 6 17 名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 16 页 -2 10.7 12 25 12.5 20 35 13.2 30 25 14.4 40 28 14.1 47 32 17.6 100 46 18 120 40 16.6 125 40 19.4 240 50 19.3 100 240 18.7 80 250 19.6 130 150 21 170 260 22 236 270 请解决以下问题:(1)确定 U与 x,y 的关系;(2)若 A的价格是每份 120 元,B的价格是每份 80 元,现有资金 960 万元,选定有效的投资方案

5、以使收益最大。二、问题分析对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买 A类资产和购买 B资产各自都会带来收益,因此,一般先确定 U与 x、y 之间的关系,有利于我们在决定投资时,如何分配对A,B两类资产的投入资金的比重,这也是我们建立模型首先要解决的难点。观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行

6、预测和分析。对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB软件来进行求解,得到最优解,最后进行检验。三、模型假设1投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”的假设。2.在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。3.假设题设中给的参数是准确值没有偏差。4.存在无风险资产,即本文对A、B两类资产的投资都为无风险投资。5.每种投资是否收益是相互独立的。6.对收益率和风险的预测值是可信的名师资料总结-精品资料欢迎下载-名师精心

7、整理-第 2 页,共 16 页 -3 四、符号说明U收益x,购买 A类资产的份数y,购买 B类资产的份数0、1、2分别为回归模型的常数项,自变量x、y 前面的系数i第 i 个样本回归模型的随机误差项Ut第 t 个收益的回归估计xt第 t 个购买 A类资产的样本份数yt第 t 个购买 B类资产的样本份数五、理论背景1.多元线性回归一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多

8、元性回归。设y 为因变量 X1,X2,Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:Yi=0+1X1i+2X2i+,+kXki+ii=1,2,n其中 k 为解释变量的数目,j(j=1,2,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为E(YX1i,X2i,Xki,)=0+1X1i+2X2i+,+kXkij也被称为偏回归系数(partial regression coefficient)建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自

9、变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。2、自相关的概念如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。对于模型Yi=0+1X1i+2X2i+,+kXki+i i=1,2,n 随机误差项互不相关的基本假设表现为:Cov(i,j)=0 ij,i,j=1,2,n 如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。在其他

10、假设仍旧成立的条件下,序列相关即意味着E(i,j)!=0 名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 16 页 -4 3、自相关性的后果(1)参数估计量非有效(2)变量的显著性检验失去意义(3)模型的预测失效4、自相关性的检验杜宾-瓦森(Durbin-Watson)检验法该方法的假定条件是:(1)解释变量 X 非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项;(5)没有缺失数据。D.W.统计量若0D.W.dl则存在正自相关dlD.W.du

11、不能确定duD.W.4-du无自相关4-duD.W.4-dl不能确定4-dlD.W.4 存在负自相关或nnTENNE11)(21121nnnE)()()()(21121nnnEEEE21121)()(nnnEE2112)()(nnEE2I2名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 16 页 -5 5、具有自相关性模型的估计(1)广义最小二乘法(2)一阶差分法(3)广义差分法(4)随机误差项相关系数的估计科克伦-奥科特迭代法首先,采用 OLS法估计原模型 Yi=0+1Xi+i得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式i=1i-1+2i-2+Li-L

12、+i得到1,2,k,作为随机误差项的相关系数1,2,k的第一次估计值。其次,将上述1,2,k,带入以差分模型Yi-1Yi-1-,-iYi-1=0(1-1-,-i)+i(Xi-1Xi-1-,-iXi-1)+i i=1,2,,n 在此,将 0,1 代回原模型,计算出原模型随机误差项的新的“近似估计值”,并以之作为模型i=1i-1+2i-2+,+ki-k+的样本观测值,采用OLS法估计该方程,得到1,2,k作为相关系数1,2,k的第二次估计值。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,k的估计值之小于这一精度时,迭代终止。杜宾(Durbin)两步法该方法仍是先估

13、计1,2,k,再对差分模型进行估计。第一步,变换差分模型为下列形式:Yi=1Yi-1+,+lYi-l+0(1-1-,-k)+1(Xi-1Xi-1-,-kXi-k)+i i=1,2,,n 名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 16 页 -6 采用 OLS法估计该方程,得到各 Yj(j=i-1,i-2,,i-k)前的系数1,2,k的估计值 1,2,,,k。第二步,将估计的1,2,k,代入差分模型采用 OLS法估计,得0(1-1-,-k),1 的估计量,记为*0,*1。六、模型建立问题一:假定收益U与 x、y 之间存在线性关系,则可建立二元线性回归模型U=0+1*x+2*y+

14、式中,U表示总的收益;x 表示购买 A类资产的份数;y 表示购买类资产的份数;、分别表示回归方程的常数项、x 和 y 前面的系数;表示随机误差项。问题二:由上一问得到的模型U=9.042+0.047x+0.19y 后,求目标函数的最大值建立约束条件:120 x+80y9600000 X0 Y0 式中,x、y 表示的是整数。七、模型求解及优化1.问题一(1)根据数据资料定义变量U(收益)、x(A类资产的份数)、y(B类资产的份数),再将全部数据输入spss 界面,建立数据文件。于是:)?1(?1*00l,*11?名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 16 页 -7(2)选

15、择 U为因变量,以 x、y 为自变量,进行逐步回归;在Statistics对话框中选择 Estimate、Model fit、Discriptives、Durbin-Watson;选择 Plots对话框的残差直方图、残差正态概率图。并输出以ZRESID为 X轴,以 DPENDNT为 Y轴的散点图;在 Save对话框里选择保存未标准预测值、未标准预测值残差、标准预测值、标准预测值残差;Options 对话框选项选择默认选项,各选项确认以后,交系统运行。(3)结果及分析描述统计表如下:Descriptive Statistics Mean Std.Deviation N U 14.231579 5

16、.6033772 19 x 77.368421 77.1479175 19 y 81.368421 97.2106593 19 表中显示各个变量的全部观测量的Mean(均值)、Std.Deviation(标准差)和观测量总数 N。U 的均值和标准差分别为14.231579、5.6033772,x 的均值和标准差分别为 77.368421、77.1479175,y 的均值和标准差分别为81.368421、97.2106593。名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 16 页 -8(4)相关系数矩阵如下:Correlations U x y Pearson Correlati

17、on U 1.000.852.725 x.852 1.000.614 y.725.614 1.000 Sig.(1-tailed)U.000.000 x.000.003 y.000.003.N U 19 19 19 x 19 19 19 y 19 19 19 表中显示了三个自变量两两间的Pearson 相关系数,以及关于相关系数关系等于零的假设的单尾显著性检验概率。从表中看到因变量U(收益)与自变量 x(A类资产的份数)、y(B类资产的份数)之间相关系数一次为0.852、0.725,反应它们之间有显著的相关关系,而可以看出在同等条件下,购买 A类资产相比购买B类资产的收益更大。(5)回归系数表

18、如下:Coefficients(a)Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std.Error Beta B Std.Error 1(Constant)9.445.995 9.492.000 x.062.009.852 6.704.000 2(Constant)9.042.912 9.911.000 x.047.011.653 4.511.000 y.019.008.325 2.244.039 a Dependent Variable:U 据表中数据费标准化系数B的数值可以知道,逐步回归过程中先后建

19、立的两个回归模型分别是:模型 1:U=9.445+0.062*x 模型 2:U=9.042+0.047*x+0.019*y 即0=9.042,1=0.047,2=0.019 Std.Error(标准误)列显示的是各系数的估计标准误差。从模型中可以看到,购买类资产和购买类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 16 页 -9(6)回归模型概述表如下:Model Summary(c)Model R R Square Adjusted R Square Std.Error of th

20、e Estimate Durbin-Watson 1.852(a).726.709 3.0207048 2.890(b).791.765 2.7154146.395 a Predictors:(Constant),x b Predictors:(Constant),x,y c Dependent Variable:U 回归模型概述表中给出了第一个模型中因变量U与自变量 x之间的相关系数R=0.852,说明变量 U与x之间具有显著的线性关系。第二个模型中因变量U 与x、之间的复相关系数 R=0.890,反映了变量 U与x、y之间具有高度线性关系。对于第二个模型给出了杜宾-瓦特森检验 DW=0.3

21、95,此时的 dl=1.08,du=1.53,因为0DWdl,所以误差项 1、2,n间存在正自相关。由于回归模型存在序列自相关性,在此,我们用迭代法来处理。Ut=k0+k1xt+k2yt et=*et-1+ut 令Ut=Ut-*Ut-1xt=xt-*xt-1 yt=yt-*yt-1其中,上式中的自相关系数p是未知的,可以由 DW 值做出估计 p=1-1/2*DW,计算后得出 p的估计值为 0.8025。于是原式变为Ut=0+1*xt+2*yt+ut(7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel做出有变换后的数据,并录入spss界面进行检验由变换后的数据得出的回归模型

22、概述表如下:Model Summary(c)Model R R Square Adjusted R Square Std.Error of the Estimate Durbin-Watson 1.635(a).403.366 1.0569473 2.772(b).596.542.8975783 2.572 a Predictors:(Constant),xtb Predictors:(Constant),xt,ytc Dependent Variable:Ut概述表中给出了第二个模型给出了杜宾-瓦特森检验 DW=2.572,此时的名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共

23、16 页 -10 dl=1.08,du=1.53,因为 dlDW4-du,所以说明误差项 1、2,n间存在正自相关已经消除。同时,我们可以观察到修改后的回归模型的残差值也基本在水平线y=0附近随机分布在此时自相关回归中,回归预测值Ut不是用 k0+k1*xt+k2*yt计算,而是用Ut=k0+*Ut-1+k1(xt-*xt-1)+k2*(yt-*yt-1)在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1 和yt-1,即Ut=k0+*Ut-1+k1(xt-*xt-1)+k2*(yt-*yt-1)=9.042+0.8025*22+0.047*(xt-0.8025*236)+

24、0.019*(yt-0.8025*270)=13.678845+0.047*xt+0.019*ytt 统计量值和 t 分布的双侧显著性概率 Sig.皆远小于 0.05,可以认为回归系数是显著的。2.问题二:根据问题一得到的模型和给出的已知条件,可以得到目标函数:max U=13.678845+0.047*x+0.019*y 约束条件:120 x+80y=0 y=0 用MATLAB 软件来求解线性规划的命令如下:c=-0.047-0.019;A=120 80;b=9600000;Aeq=;beq=;名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 16 页 -11 lb=0;0;v

25、b=;x,fval=linprog(c,A,b,Aeq,beq,lb,vb)结果:x=1.0e+04*8.0000 0.0000 fval=-3.7600e+03 并运用 MATLAB 还可以求出该模型的图像syms x y U x=0:2:300;y=0:2:300;U=13.678845+0.047*x+0.019*y;x,y=meshgrid(x,y);surf(x,y,U)可得在 A的价格是每份 120元,B的价格是每份 80元,资金 960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买 A类资产 80000份,这是预计的最大收益是 3773.679。名师资料总结-精品

26、资料欢迎下载-名师精心整理-第 11 页,共 16 页 -12 八、模型检验模型检验主要是针对问题一所提出的模型进行检验。对回归系数的显著性检验,我们用的是t 检验。t 检验:在多元线性回归中,回归方程显著并不意味着美国自变量对U的影响显著,所以需要对每个变量进行显著性检验。如果某个自变量 xj 对作用不显著,那么在回归模型中,它的系数j 就取值为零。因此,检验变量是否显著,等价于检验假设H0j:j=0,j=1,2,,,p 据此可以构造 t 统计量tj=cjj其中是回归标准差。当 tjt/2时,拒绝元假设 H0j:j=0,认为 j显著不为零,自变量 xj对因变量 y 的线性效果显著;当 tjt

27、/2时,接受原假设 H0j:j=0,认为 j为零,自变量 xj对因变量 y 的线性效果不显著。下图是回归系数表Coefficients(a)Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std.Error Beta B Std.Error 1(Constant)9.445.995 9.492.000 x.062.009.852 6.704.000 2(Constant)9.042.912 9.911.000 x.047.011.653 4.511.000 y.019.008.325 2.244.039 a

28、 Dependent Variable:U 图中的 Sig 即显著性 P值,由 x 的 P0.000,由此可知此自变量x 显著,y的 P0.039,自变量 y 也显著。由spss软件做出的残差统计表如下:Residuals Statistics(a)Minimum Maximum Mean Std.Deviation N Predicted Value 2.940604 6.030249 3.742167 1.0247230 18 Std.Predicted Value-.782 2.233.000 1.000 18 Standard Error of Predicted Value.227.

29、761.335.153 18 名师资料总结-精品资料欢迎下载-名师精心整理-第 12 页,共 16 页 -13 Adjusted Predicted Value 1.334061 6.122075 3.665045 1.2092543 18 Residual-1.4082221 1.8736107.0000000.8431280 18 Std.Residual-1.569 2.087.000.939 18 Stud.Residual-1.621 2.185.028 1.032 18 Deleted Residual-1.5040683 2.3974390.0771220 1.0913442 1

30、8 Stud.Deleted Residual-1.725 2.556.053 1.096 18 Mahal.Distance.139 11.280 1.889 2.977 18 Cooks Distance.000 1.710.132.396 18 Centered Leverage Value.008.664.111.175 18 a Dependent Variable:Ut 本表显示预测值(Predicted Value)、残差(Std.Predicted Value)、标准化预测值(Standard Error of Predicted Value)、标准化残差的最小值(Minimu

31、m)、最大值(Maximum)、均值(Mean)、标准差(Std.Deviation)以及样本容量(N)。根据概率的 3-原则,上图中标准化残差的绝对值的最大值为1.5693,说明样本数据中没有奇异数据,模型具有有效性。残差分布直方图和观测量累计概率P-P图如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 13 页,共 16 页 -14 回归分析中,总是假设残差 服从正态分布,残差分布直方图和观测量累计概率P-P图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态的假设做出检验。从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是很明显的服从正态分布

32、。尽管这样,也不能盲目地否定残差服从正态分布的假设,因为我们用来进行的样本量太小,样本容量仅为19.观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。输出的图形中还有一个因变量的回归标准化残差图,如下所示:名师资料总结-精品资料欢迎下载-名师精心整理-第 14 页,共 16 页 -15 对于问题二最优解的检验由于x,y 是正整数,且有约束条件 120 x+80y9600000,可知(x,y)的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数U=13.67

33、8845+0.047*x+0.019*y,经变化可得到 y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U 为最大,此时的 x与y值便是最优投资组合。用MATLAB 画出的图像如下再者,由问题一建立的模型中,我们可以看到x前的回归系数为 0.047,y前面的回归系数为 0.019,再由A的价格是每份 120元,B的价格是每份 80元,在不考虑常数项的情况下,计算可得对于 A的投资,每增加 1元可得到的收益是 0.0003917而对于 B的投资,每增加1元可得到的收益是 0.0002375,所以我认为在资金有限,不考虑风险的情况下,投资者

34、应该先考虑投资 A类资产,如果减去能购买 A类最多份数后的剩余的资金 J,满足 80J120,则此时应该再考虑买一份B类资产。关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,再代入目标函数进行检验,但是对于多元的线性规划最优解,还是要建立相关的矩阵,再来进行计算和检验。九、模型评价及优化模型的优点:(1)本模型根据已有数据较好的体现了总收益与购买A、B类资产的份数之间的关系,而且该模型简单易懂,使得求解有了很大的简化。(2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住了分析的要点,较好的完成了数据的提取与应用。(3)在本文中,我们分别用了spss、Exce

35、l、MATLAB等软件来进行数据的分析和处理,这样有利于提高模型的准确度和预测的可信性。名师资料总结-精品资料欢迎下载-名师精心整理-第 15 页,共 16 页 -16 模型的缺点:(1)由于模型是建立在假设是确定值的基础上的而实际中0、1、2常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,缺乏动态性。(2)该模型没有考虑到各类投资的风险性,。(3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定模型的优化和推广:将0、1、2 作为随机变量来考虑,并进而考虑个投资项目之间的相关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进模型。十、参考文献1 郝黎仁 樊元 郝哲欧,spss 试用统计分析,北京:中国水利水电出版社,2002,P217-P222。2 葛哲学,精通 MATLAB,北京:电子工业出版社,2008,P126-P127。3 何晓群 刘文卿,应用回归分析,北京:中国人民大学出版社,2011,P56-P58,P71-P72,P105-P115。4 韩中庚,数学建模方法及其应用,北京:高等教育出版社,2005.6,P16-P18。5 赵静 但琦,数学建模与数学实验,北京:高等教育出版社,2003.6,P52。名师资料总结-精品资料欢迎下载-名师精心整理-第 16 页,共 16 页 -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁