《基于遗传算法的开放式基金投资决策支持系统的设计与实现.pdf》由会员分享,可在线阅读,更多相关《基于遗传算法的开放式基金投资决策支持系统的设计与实现.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、收稿日期2009-11-11作者简介黄贵懿(1979-),男,重庆荣昌人,高级工程师,硕士,主要从事数据挖掘和智能信息系统方面的研究.2010年6月重庆文理学院学报(自然科学版)Jun1,2010第29卷 第3期Journal of ChongqingUniversity ofArts and Sciences(Natural Science Edition)Vol129No13基于遗传算法的开放式基金投资决策支持系统的设计与实现黄贵懿(重庆文理学院,重庆 永川 402160)摘 要开放式基金决策支持系统是以基金历史表现为基础,针对投资者组合投资时需同时满足收益最大化、风险分散化和组成比例灵活
2、化等要求,运用改进后的多目标寻优遗传算法设计的应用程序.该系统采用C#.NET+SQL server 2005实现.实测结果证明,该系统能够高效率地满足用户在基金投资决策时的多样化需求.关键词决策支持系统;遗传算法;开放式基金中图分类号TP391文献标志码A文章编号1673-8012(2010)03-0038-04 我国的开放式基金在国家政策大力支持下,发行的规模逐年增大,基金投资者迅猛增长,而基金投资理财产品本身就具有一定的不确性和风险性,不同类型的基金收益与风险区别较大.如果仅仅以基金短期表现作为选择依据,可能会给投资者带来巨大的投资风险1.所以,理性的投资方式是投资者根据自己对风险的承受
3、能力,在综合考察基金收益与风险后进行选择性投资.基于这种理念,现在的投资者往往同时投资几只不同的基金,来分散市场变化所带来的风险.但在如何把握投资收益最大化与风险最小化这对矛盾时,许多投资者显得十分困惑.基金投资决策支持系统的设计思想就是运用遗传算法设计出多目标寻优模型,帮助投资者寻找出符合自身风险承受能力的最佳基金投资组合方案.为此,需要解决以下三大技术难点:1.如何寻找基金组合使其既满足收益最大化,又确保其不超过一定的风险度;2.满足第1条的同时,如何寻找不同投资比例的基金最优配置;3.满足上述2点的同时,如何确保组合方案能按照用户需要实现动态生成.1 遗传算法概述遗传算法是由美国Mich
4、igan大学的J.H.Holland于上个世纪60年代提出的一种自适应优化搜索算法.遗传算法思想来源于生物学领域的遗传学和适者生存的自然规律,是一种群体性操作.遗传算法在开始时先随机产生一系列染色体,计算其适应度,再根据适应度对各染色体进行选择、交换、变异等遗传操作,剔除适应度低的染色体,留下适应度高的染色体,从而得到新的种群.遗传算法就是这样反复迭代着,向着更优解的方向不断进化,直到满足预定的优化目标为止2.2 系统的设计与实现2.1 数据预处理为获取每只基金风险与收益的基础特征,结合开放式基金特点设计了收益增长函数f1和收益变动(风险)函数f2,用于求出每只基金的收益与风险历史表现值.再对
5、所有基金的表现值进行K均值聚类的尺度变换,将得到的每只基金收益与风险的聚类值作为系统寻优选择的基础数据.f1=1nni=1vi,(1)83 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/f2=1nni=1wi.(2)其中i代表日,vi为i日的净值增长值,wi为i日净值增长率,n为交易日之和.在系统中,使用了20062008年中120只开放式基金26个月的日净值数据,并按公式(1)和公式(2)进行了计算,将其结果值从低到高分别聚类为9级,分别作为每只基金收入与风险的特征
6、数据.2.2 染色体编码方法对染色体的编码方式主要有二进制编码、实数编码、整数或字母排列编码等.二进制编码方法其编码、解码操作简单易行,交叉、变异等遗传操作便于实现,符合最小字符集编码原则.但由于Hamming悬崖的存在,二进制编码对于函数优化问题存在严重缺陷3.实数编码表示法是一个N维浮点向量,X=(X1,X2,XN).实数表示法没有二进制表示法的上述缺点,比较接近问题空间,适合一些多维、高精度、要求连续的函数优化问题,适合于在遗传算法中表示范围较大的数,便于较大空间的遗传搜索,提高了运行效率,便于遗传算法与经典优化方法的混合使用.鉴于上述特点,在本系统的设计中就运用实数编码方式对染色体进行
7、编码.对所有基金进行重新按序编号后,以实数编号作为单个染色体.2.3 算法设计与描述基金组合优化算法流程图如图1所示.算法的具体描述如下:1)运用聚类算法分别对每只基金的利润水平和风险水平进行计算,使用的方法与风格分析模块类似.2)根据用户设定的最大基金组合数d,可接受的最大风险值u,随机生成基因个体d和群的大小w.3)启动分配生成算法,即在确定的基金组合数下,随机生成一组分配方案,分配比例之和不超过100%.计算:v=v+1,如果v V,则转入步骤10).4)按当前分配方案,运用适应函数计算出每个个体的适应值(收益值)和风险值.计算:n=n+1,如果n N,则转入步骤9).5)惩罚风险值高于
8、u的个体,降低其适应值.6)运行轮赌算法,保留适应度高的个体,淘汰适应度低的个体.7)运用部分交叉匹配算法,按比率t实现两两交配.8)按比率z实现个体的变异,并返回步骤4).9)将群体中适应值最高的个体和当前分配方案存入数组中,返回步骤3).10)对存储数组按适应度进行降序排序,输出数组中前3个个体.说明:V和N分别为分配方案的生成数和遗传进化代数,此两变量可根据实际情况进行设定.本课题程序中,根据实验结果设定以下几组值:V=100,N=10,z=0.01,d的范围为1,9,f的范围为1,9.图1 基金组合优化算法流程图2.4 适应度函数的定义遗传算法在优化搜索中以适应度函数作为寻优依据,其定
9、义是否合理将直接影响整个遗传算法的执行质量.在本算法中,采用染色体对应的收益与所占比例的总和作为染色体的适应值,其适应度函数定义如下:f=mi=1IiDi.(3)其中,Ii表示第i只基金的收益能力值,Di表示第i只基金所占比例.f的值越大,个体的适应度越高.93 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/对于风险值高于用户设置要求的染色体,则采用惩罚机制,将其适应值定为0.3 实验结果3.1 对比测评结果随机算法是指从所有基金中随机选取一组基金,计算其适应度,若适
10、应度符合风险要求,则该组基金可作为候选项输出,若适应度不符合风险要求,则从所有基金中再随机抽取另一组基金组合.如果共抽取m代,则保留m代中适应度最大的一组.当设定染色体数为3,组合比例分别为30%、30%和40%,风险度为9时,利用随机算法与遗传算法分别运算30代,比较其运行结果如表1所示.表1 运行结果对比表代数随机算法抽取组合中最优适应度遗传算法组合中最优适应度第0代5.24.1第5代6.17.0第10代6.47.8第20代6.98.4第30代7.18.7当设定染色体数为3,组合比例分别为70%、20%和10%,风险度为5时,利用随机算法与遗传算法分别运算30代,比较其运行结果如表2所示.
11、表2 运行结果对比表代数随机算法抽取组合中最优适应度遗传算法组合中最优适应度第0代2.43.1第5代3.54.2第10代3.74.8第20代3.95.3第30代4.25.6 由表1和表2中的数据对比可见,在寻找最优组合时,无论是在收敛速度上还是全局寻优能力上,改进后的遗传算法都优于随机算法.3.2 实例分析除了通过与随机算法进行对比,还可以通过本系统实际运行的结果来反证算法的有效性.系统输出界面提供了2个可供选择的下拉列表:一项是“您最多选择的基金数”,即用户设定的基金数d;一项是“您可承受风险度”,即用户设定的最大风险值f.输出结果则为3组最佳组合方案,每组均有基金名称和建议投资的比例.当设
12、定最多选择的基金数为3,可承受的风险度为9时,系统运行的结果如图2所示.图2 用户选择后的生成界面图2中基金固有的风格特征和收益与风险级的分析结果为:在组合1中,投资90%的工银瑞信核心价值:股票型基金,收益为9级,风险为8级;投资10%的上投摩根阿尔法:股票型基金,收益为9级,风险为9级.在组合2中,投资80%的汇添富优势精选:股票型基金,收益为9级,风险为9级;投资20%的上投摩根阿尔法:股票型基金,收益为9级,风险为9级.在组合3中,投资70%的银华核心价值:股票型基金,收益为9级,风险为9级;投资30%的汇添富优势精选:股票型基金,收益为9级,风险为9级.由以上候选组合可以明显看出,在
13、可接受风险设定为较大值时,系统自动选择了收益最高风险也最高的股票型基金作为候选组合输出.当设定最多选择的基金数为3,可承受的风险度为1时,运行结果如图3所示.图3 用户选择后的生成界面图3中基金固有的风格特征和收益与风险级的分析结果为:在组合1中,投资60%的长盛中信全债:普通债券型基金,收益1级,风险1级;投资40%的嘉04 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/实浦安保本:保本型基金,收益1级,风险1级.在组合2中,投资30%的银河银联收益:普通债券型基金
14、,收益1级,风险1级;投资70%的申万巴黎盛利配置:保守配置型基金,收益1级,风险1级.在组合3中,投资20%的宝康债券:普通债券型基金,收益1级,风险1级;投资80%的富国天利增长债券:普通债券型基金,收益1级,风险1级.由以上候选组合可以明显看出,在可接受风险设定为最小值时,系统输出了风险较小收益相对较好的债券型和货币型基金.当设定最多选择的基金数仍为3,可承受的风险度为5时,即风险取中值的情况下,输出的结果如图4所示.图4 用户选择后的生成界面图4中基金固有的风格特征和收益与风险级的分析结果为:在组合1中,投资30%的华夏红利:股票型型基金,收益8级,风险6级;投资30%的巨田资源优选:
15、股票型型基金,收益7级,风险6级;投资40%的融通蓝筹成长:积极配置型,收益5级,风险3级.在组合2中,投资30%的汇添富优势精选:股票型基金,收益9级,风险9级;投资70%的融通蓝筹成长:积极配置型基金,收益5级,风险3级.在组合3中,投资80%的融通蓝筹成长:积极配置型基金,收益5级,风险3级;投资20%的上投摩根阿尔法:股票型基金,收益9级,风险9级.由以上候选组合可以明显看出,在可接受风险设定为中值时,系统自动选择风险居中且收益相对较好的股票型基金和风险相对稳定的配置型基金.4 结语设计的开放式基金决策支持系统运用改进后的遗传算法,可根据用户的喜好选择,以基金的实际风格特征为依据,找出
16、最佳的基金投资组合.但由于该寻优模型是基于基金的历史表现而得出的,在未来的时间里,基金的收益与风险还要受到许多不确定因素的影响,所以最优组合是相对于当前而言的,所得出的信息仅供用户投资时参考.参考文献1蔡明超.证券投资基金绩效评价 理论与实务M.上海:上海财经大学出版社,2005:21-23.2张文修,梁怡.遗传算法的数学基础M.西安:西安交通大学出版社,2000:102-103.3Eshelman L,Mathias K,Schaffer J.Real-coded ge2netic algorithms and intervalschemata in Foundations ofGeneti
17、c Algorithms J.Morgan Kaufmann Publishers,2001(2):187-202.Design and implementation of decision support system of fundinvestment based on genetic algorithm sHUANG Gui-yi(Chongqing University ofArts and Sciences,Yongchuan Chongqing 402160,China)Abstract:Decision support system of open-end fund is bas
18、ed on the perfor mance of historic fund.In termsofmaxi mizing income,risk decentralization and flexible portfolio invest ment,i mproved genetic algorithmswas used to design the application program.The model was realized with C#.NET and SQL server 2005.The results showed that the program would meet the users different requestswith high-efficiency.Key words:decision support system;genetic algorithms;open-end fund(责任编辑 吴朝平)14 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/