《基于遗传神经网络的公司财务危机研究论文(21页).docx》由会员分享,可在线阅读,更多相关《基于遗传神经网络的公司财务危机研究论文(21页).docx(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-基于遗传神经网络的公司财务危机研究论文-第 20 页一、绪 论(一)研究背景与意义从1979年改革开放开始到2015年间,中国以持续37年年均9.5%的超高速增长率,在人类经济史上书写了不曾有过的奇迹,而这种奇迹的产生,离不开中国资本市场的飞跃式的发展。上海和深圳两地证券交易所在1990 年11月26 日,上海证券交易所建立,1991 年7月3 日,深圳证券交易所建立。的建立,是中国股票市场初步形成的标志,是中国资本市场发展的标志。根据统计数据,在1991年,我国上市公司在14家左右,而到2014年这一数量增大到2584,23年间增长了184倍;截至2014年10月底,沪深股市的总市值在30
2、.05万亿元左右,总市值排名已超过日本,排全球第二。如今时间已来2015年,蓦然回首,中国资本市场已经走过了25年曲折而又不凡的历程。我国上市公司在中国资本市场的发展中得到了锻炼和成长,在这个过程中公司管理模式更加优化,已经逐渐成为推进国民经济发展的重要力量。截至2007,上市公司主营收入达到了我国GDP总量的38.57%,而截至2011年,这一数字已快速增长为45.54%。上市公司不仅在经济上贡献卓越,同时,在实现科技创新、推动环保发展等经济转型中发挥重大作用。毋庸置疑,中国上市公司已经成为国民经济重要的支柱之一。但是接连爆发的经济危机,使世界经济增速不断放缓。2007年美国爆发的国际金融危
3、机,迅速波及世界各地,至今仍未完全恢复。2009年欧债危机爆发,三大评级机构下调欧洲多国主权信用评级,其中惠誉(FitchRatings)将希腊主权评级下调至CCC级,欧洲股市重挫,全球股市风声鹤唳。到2011年,美国债务达到法定债务上限14.29万亿美元,美债危机爆发,全球市场因标普(Standard & Poors)将美国主权评级下调而大规模动荡。当人们还未从周期性的金融危机中恢复时,2014年俄罗斯经济危机再度来袭。在油价下跌、政治因素、经济制裁等多重压力下,卢布迅速贬值,其中卢布兑美元汇率跌幅高达19%;股市崩盘,俄罗斯股指RTS指数大跌19%,创1995年以来最大跌幅。为遏制卢布贬值
4、,俄罗斯央行意外将基准利率从10.5%上调至17%,从那之后卢布汇率略有攀升。然而,17%的基准利率却使俄罗斯大批公司不堪高昂的借贷成本而面临破产。国际经济环境的动荡,让中国经济乃至中国的上市公司都经历着巨大的考验。2014年10月,上海黄金交易所推出国际版,首次允许外国机构交易黄金。在未来,中国金融市场门户开放的步伐还将继续加快,中国公司所面临的国内外竞争压力也继续加大。根据统计,2008共有29家上市公司首次进入ST公司在1998年4月22日,证监会实施了新的规则,对财务状况恶化、经营出现异常或违反重大规定的上市公司股票进行特别处理,标为ST股。在2003年4月2日,沪深交易所颁布关于对存
5、在股票终止上市风险的公司加强退市风险警示等问题的通知,对有可能有退市风险的上市公司,标为“*ST”股,用以表示“退市风险警示”。这项举措被广泛认为是保护投资者利益,减小市场风险的合理措施。名单;而2009年我国沪深两市又新增ST公司32家;2010年这个数字更是增加到53家。由此可以看出我国上市公司的ST群落有不断的扩充的趋势。公司财务危机的发生原因是多方面的,可能是逐渐恶化的财务危机,也可能是突发的债务危机。但从实际来看,公司财务危机的发生通常表现为财务状况由正常到逐步恶化再到最终濒临破产的一个渐进的过程。也就是说,通过科学的分析公司财务数据,建立一套完善的预测模型,是可以在财务危机来临之前
6、做好预防措施,保护公司及投资者的利益。1对于公司来说,进行财务危机分析能协助公司管理者在危机发生之前监测危机并及时改变决策有效管理经营过程中的各种问题,包括财务漏洞和经营隐患等,能够提前预测危机,进而做到改进公司的运营水平和提高财务危机的应对能力,从而最终实现预防财务危机、提前应对风险、且使损失达到最小等目标,这样才能确使公司的持续发展和继续壮大;财务危机分析能监督公司在危机发生前调整公司资产结构,使用持续鉴别以及处理坏账资金、不良资产等途径,从而提高公司的利润盈利能力和账务偿还能力;与此同时,进行财务危机分析还能建立公司管理者以及公司员工关于财务危机的处理能力以及对危机预防意识,对提升信心,
7、以及对于公司文化的塑造和升华也大有帮助。2对于广大普通投资者来说,不论是进行上市公司的债券投资,或是进行股市投资,都要对所投资公司的财务状况进行评估,以帮助他们准确判断所投资公司的盈利能力、偿债能力等,并根据评估推测当前公司的股票价格有无高估或者低估,从而提早做出判断,为他们的投资方向做出决策。3对于国家资本市场管理部门来说,构筑财务危机分析模型能在危机发生之前筛选出即将陷入财务危机的上市公司,提前下发行政干预,降低公司破产的预期,进而能够避免高昂的破产停业支出以及因广大民众失业而导致的民生状况恶化,并在宏观上优化资源配置。与此同时,财务危机分析还能为管理部门提供参考依据,根据不同的危机等级实
8、施不同的监管力度。4对于社会宏观经济发展来说,构筑合符中国经济实际的财务危机分析模型,能促进宏观经济平稳健康的发展。(二)研究思路、内容和结构本设计以上证A股及深证A股的上市公司为研究对象,将因财务状况异常而被特别处理(ST)作为公司进入财务危机的标志,使用主成分分析法选取上市公司前三年的财务指标,作为GA-BP神经网络模型输入变量建立上市公司财务危机分析模型,最后,用随机选取的60家上市公司测试样本对所建立的模型进行检验。本设计的结构和思路如下:第一章绪论,包括研究背景与意义,研究思路内容和结构。第二章文献综述,首先介绍了国内外学者对于公司财务危机的研究成果,其次介绍了国内外学者分析公司财务
9、危机进行不同方法的尝试,然后引出公司财务危机分析模型的出现、发展和在金融经济等多方面的应用。第三章公司财务危机的定义及原因,这也是本设计重要的理论基础。首先介绍了公司财务危机的定义及相关性质,然后介绍了公司财务危机多方面的形成原因分析。第四章遗传神经网络模型的构建,首先简要介绍了遗传算法和人工神经网络算法的基本思想及特点,随后介绍了如何用遗传算法优化BP神经网络算法。第五章GA-BP神经网络模型的建立及实证分析,详细的介绍了样本数据的选取、指标变量的筛选、模型建立及参数选择。随后根据实验结果,分析优化模型。第六章总结与展望,分析上一章模型计算出的参数结果,总结通过GA-BP神经网络模型得出的结
10、论。之后说明了由于数据的选取、数据的处理方式和模型的选用等方面原因而导致计算结果的误差和整个文章的缺点与不足。二、文献综述自20世纪30年代开始,西方经济学界开始有关财务风险的研究,工作大都偏向于财务预警模型的构建。财务风险预警系统在预警公司财务风险、识别公司财务漏洞上有较强应用,已成为西方学界的共识。Fitzpatrick(1932)学者的单变量破产预测研究是最早进行财务危机的探索之一,在他的研究中,发现用净利润股东权益和股东权益负债来预测公司破产的能力较强,并在公司发生危机的前三年,这两类指标出现了明显的差异性。在1966年,学者Beaver的研究也使用了单变量模型,但在研究广度上继续开拓
11、,使用了79个有财务状况不佳的公司。研究最终认为资产负债率(债务总额/资产总额)、资产收益率(净收益/资产总额)和债务保障率(现金流量/债务总额)三个指标能对公司财务危机有较为有效的。在1968年,学者Altman在这一公司危机研究当中,首次运用了多元判定分析法(Multiple Discriminant Analysis)。在研究过程中,其选择了产生财务危机和财务良好的公司各33家来进行对比,对比原则是行业与资产规模都要相当。根据研究,其选择了五个影响力最大的变量作为模型输入变量,该多元线性判定模型为:Z=1.2X1+1.4X2+3.3X3+0.6X4+1.0X5其中: X1=营运资本/总资
12、产;X2=留存收益/总资产;X3=二息税前利润/总资产;X4=股东权益的市值/总负债的账面价值;X5=销售收入/总资产。该模型就是有名的Z-SCORE模型。该模型的判断规则为:当Z2.675时,公司的财务情况较好,即发生财务危机的概率较小;当1.51Z2.675时,可以认为公司的财务情况不稳定;当Z1.51时,可认为公司有较大财务危机风险。经总结统计,Altman研究的Z-SCORE模型的预测成功率达到95%以上。在1977年,学者Martin运用了多元逻辑(Logistic)回归法进行财务危机研究,为该领域首次。最后,将研究结果与Z-SCORE模型、Zeta模型进行比较研究,结论认为Logi
13、stic模型在预测效果上更优。在1980年,学者Ohlson也运用多元逻辑(Logistic)回归方法对公司财务危机领域进行了研究,他选择了从1970年到1976年105个破产公司以及2058个非破产公司,然而不同的是,他只选取了规模、资本结构、业绩以及变现能力这四个财务指标变量进行预测,其结论是准确率达到了96.12%。在1985年,学者Bartzak和Norman在多元逻辑(Logistic)回归方法上进行了创新,其在选择财务指标变量上,选取了大量与经营现金流相关的财务指标变量,对1971年到1982年的60个破产公司以及230个非破产公司开展了研究。然而,研究结果显示增加使用与经营现金流
14、相关的财务危机指标并不能提生预测的精度。直到20世纪90年代初,整体学界在公司财务危机研究领域运用的研究方法还集中在统计类的方法中。在此阶段,统计类的研究方法貌似进入瓶颈阶段,没有新的方法来推进预测精度的进一步提高。因而,在20世纪90年代,这一领域的学者开始探索新的研究方法来提升预测精度。这个阶段出现的新方法有:人工神经网络法、生存分析法、期权定价模型等。在1990年,学者Odom和Sharda开创性的运用了人工神经网络(Artificial Neural Networks)方法于公司财务危机预测研究中。该模型使用了Altman的Z-SCORE模型的5个指标变量作为模型的输入变量,选取197
15、5年至1982年间破产公司和非破产公司各65家作为训练样本。研究结论显示其对保留样本失败类公司与正常类公司的预测准确率分别为81.75%和78.18%,然而,人工神经网络在计算上较为复杂,理论基础尚未成熟,成为该模型的缺点。在1995年,学者Daily和Dalton研究发现公司的董事长和总经理是否为同一人,也对公司财务危机预测有影响,与公司破产率呈正比关系。在2000年,学者Charitou和Trigeorgis运用期权定价模型于公司财务危机领域研究,他们主要选择了1983年到1994年近139对公司,研究发现公司资产当期市价、到期债务面值、公司价值变化的标准差等期权变量在公司财务危机模型中有
16、较大影响力。我国的财务危机研究在近20世纪80年代开始逐渐起步。最早的研究是吴世农、黄世忠(1986)的公司破产的分析指标和预测模型,两人在文章中引入了财务风险预警模型的概念。在1999年,佘廉的著作公司预警管理理论出版,受到了国家自然科学基金委员会的鼎力支持。从此往后,这一领域开始受到广泛的关注,国内的一些学者也开始这一方向的研究。张玲(2000)对120家企业进行了研究,她选取了60家公司的数据用于二类线性判别模型的构建,然后用另外60家公司的财务数据作为对之前建立模型的检验样本。结论认为这一模型有较强的风险预测能力,预测范围能达到危机发生前4年。赵健梅,王春莉(2002)选取了近80家上
17、市公司作为研究对象,分别采用了多元分析和单变量分析方法进行了研究,来辨别ST公司与非ST公司,研究发现所建模型在分类能力和预测能力都有不错的表现。然而,在他们的模型中,以总资产利润率或净资产利润率为指标的单变量指标模型的辨别精度高于多变量模型。在2001年,吴世农、卢贤义研究了多种预测财务危机的方法。他们选取了ST公司和非ST公司各70家,采用单变量分析研究ST公司被ST的前5年时间的财务数据,并与非ST公司的财务数据进行对比。最后筛选确定了6个影响因子较大的财务指标,并以这六个指标为基础,应用Fisher线性判定分析、Logistic回归分析和多元线性回归分析方法,建立了三种财务风险预警模型
18、。研究发现ST公司在被ST的之前两年内,财务数据的平均差异显著不同于非ST公司。在2002年,卫建国、唐红也用我国上市公司为研究样本,使用了“Z-score”模型进行实证研究。研究发现,判定财务危机的临界值应存在地区性的差异,对我国的情况应做出修正。我们学界在这一领域的研究,大致都是向西方学界学习,在研究方法以及研究数据选取上都较为相似。然而,在2002年,学者王新宇以及周敏在研究这一命题时将模糊算法以及人工神经网络算法开创性的结合在一起,并创立了新的公司财务危机模型Fuzzy-ANN模型。在2004年,学者李晓峰、徐玖平运用控制理论中的rough集理论,结合人工神经网络模型,创新性的开展了公
19、司财务危机相关领域的研究。在他们的研究中,建立了Rough-ANN模型,并且通过比较研究结果,他们认为Rough-ANN模型有着更好的预测精度。这些学者的不懈努力,为我们这一领域的研究迈出了一大步。在2001到2010年期间,在公司财务危机这项研究中,中国学者开创性的尝试了更多的财务指标,使用了更多的公司治理指标和宏观经济指标。例如,在2005年,陈良华学者使用率第一大股东比例以及董事占比; 在2006年,主克敏学者使用了股东对资金占用率情况、股权受代理成本。但总体来说,除了财务指标以外,其他指标的探索相对较少。三、公司财务危机的内涵及成因(一)公司财务危机的内涵关于财务危机的内涵,在学界还并
20、没有统一化公式化的定义,不同的学者对该名词都有着不同的解释以及理解。然后,随着时代的发展,越来越多的财务危机案例,让人们对该名词的内涵有了越发深刻的理解。我国在公司财务危机的研究过程中,大都将公司被标ST作为发生财务危机的标志,来对研究对象分类。经总结分析,公司财务危机的表现有以下几个方面:1、从公司的运营情况方面分析。发生财务危机的表现有公司产销周期中断,公司营业额非正常下降,绩效评估表现不佳。2、从公司的资产结构方面分析。发生财务危机的表现有产品滞销导致库存累计,应收账款增加,坏账增加。3、从公司的偿债能力方面分析。发生财务危机的表现有违约情况增加,流动负债非正常增长,短期偿债能力大幅下降
21、。4、从公司的现金流量方面分析。发生财务危机的表现有现金流不足,现金总流入小于现金总支出。 (二)公司陷入财务危机的成因分析经综合分析归纳,总结出公司财务危机发生的以下几点原因:1.公司外部因素的影响。主要有两个方面:经济大环境的变化以及政府宏观经济调控政策的变化,都能对公司财务造成重大危机。经济环境的变化如战争、自然灾害、国家政治危机等都是对财务危机影响巨大的变量。与此同时,政府的调控政策如税收政策、行业鼓励政策、行业监管政策等也对公司经营有着重大影响。如何有效及时的监测公司外环境的变化,及时应对危机的发生,提高公司对环境变化的适应能力,成为各上市公司共同面对的问题。2.公司管理水平的影响。
22、公司管理层的管理水平很大程度上会影响公司的盈利水平从而影响财务危机发生的可能。公司在市场中的产品竞争力水平,市场宣传能力,对市场产品的定价调整能力等都取决于公司管理层的决策,因而管理层的决策直接决定公司的经营水平,关乎公司的发展与生存。特别对中小型公司来说,公司的决策直接关系着融资、销售、生产、人事等各方面,进而影响公司的经营水平,进而影响公司财务危机发生可能。所以对于财务危机的发生因素,公司管理层的决策能力与水平占很大部分。3.财务杠杆的影响。对于普通中小公司财务杠杆运用的决定着公司财务状况的好坏,不同的财务杠杆在不同的条件下有不同的作用。在投资利润率大于负债利润率的时候,财务杠杆会产生积极
23、的影响,结果是公司股东能够获得更大的额外收益。在投资利润率小于负债利润率的时候,财务杠杆会产生负面的影响,结构是公司股东承担更大的额外损失。这些额外损失便构成了企业的财务风险,甚至导致破产。即财务杠杆在放大收益的同时在放大风险,对财务危机的产生有重要影响。4.公司资本结构的影响。包括总资本中自有资本的比率,以及公司股权资本与债务资本比率的关系。维持良好的资本结构对公司的发展与生存至关重要,在实际情况中,资本结构还要伴随公司经营状况、宏观经济环境做出相应的调整。但公司资本结构不合理,就容易出现流动负债增多,融资不足等情况,导致公司财务危机的发生。5.道德风险的影响。这部分影响主要由人的不道德的行
24、为产生,如假账、违约、投机、欺瞒等行为都会给公司财务负面影响,直接导致公司产生大量坏账、死帐等,进而加大公司财务危机风险。四、遗传神经网络模型的构建(一)遗传算法概述遗传算法在1975年由Michigan大学的J.Holland教授提出,其著作Adaptation in Natural and Arificial Systems出版后受到广泛关注。遗传算法是仿照生物进化原则基于全局的优化搜索算法。其基本原理是采用概率规则在每一次进化过程中将最优解保留,即寻找评价函数的最优值。在遗传算法中,这种生物进化的过程被抽象成选择、交叉、变异三个算子,分别模仿染色体选择机制和交叉机制,以及染色体上基因的变
25、异机制。由于遗传算法不需提前获取搜索空间的知识,具有随机性和全局性,使得遗传算法在多领域得到广泛的应用。遗传算法的主要步骤有:1.编码:对搜索空间进行二进制编码,即用无符号二进制整数来表示个体。2.对种群进行初始化:随机选取N个个体作为初始群落,并设置好最大进化代数。3.个体适应度评价:遗传算法中,个体适应度的大小决定这个基因被遗传的概率,可直接使用目标函数值作为个体适应度。4.选择运算(Selection Operator):选择运算是为了从群体中选择适应度较大的个体,使之能有较大的概率遗传到下一代。选择方法有:轮盘赌选择、排序选择、最优个体选择、随机联赛选择等。一般较常用的有轮盘赌选择,其
26、中每个个体被选择的概率与其个体的适应度成正比。5.交叉运算(Crossover Operator):交叉运算以一定的交叉概率Pc选择两个父代染色体将相异部分的基因进行交换,交换后即产生了新的个体,是遗传运算中产生新个体的主要步骤。交叉方法有:单点交叉、两点交叉、均匀交叉、算术交叉。在遗传算法中运用交叉运算时,大多使用单点交叉,具体操作是应对种群中的个体进行随机配对,然后在确定交叉点位置是采取随机选择策略,最终,对交叉点上的基因进行调换处理。6.变异运算(Mutation Operator):变异运算随机选择群体中的个体,并以一定的变异概率Pm随机改变个体上的某个基因的值。这也是遗传算法产生新个
27、体的步骤之一。变异方法有:基本位变异、均匀变异(一致变异)、边界变异、非均匀变异、高斯变异等。一般采用基本位变异,首先随机产生个体变异点位置,然后以一定变异概率将变异点基因值取反。7.重复选择、交叉、变异三个基本运算,直到进化出的群落满足某种精度要求,随即停止运算,所得即是最优解。解空间编码搜索空间初始种群体p(t)相互确定目标函数适应度评价选择、交叉、变异生成新的群体p(t+1)N符合解码Y输出C*输出X*遗传算法的运算过程(二)人工神经网络算法概述人工神经网络(Artifical Neural Network)是一种借鉴大脑互相连接的神经元的结构以及特点,通过大量的神经元单位来处理大规模并
28、行式信息的非线性算法模型。由于其的自学习性,高度组织性以及并行性等特点,已经广泛应用于模式识别,信号处理以及其他更大领域中。早在1958,计算学家Rosenblatt就提出了“感知机”(Perception)的概念,并构建了一个三层神经网络模型,其中在构造网络连接时,基于模型处于噪声环境,选择了符合自然环境的网络间的随机连接。然而,在这之后,学者Minsk和Papery在著书Perception中指出感知机的处理能力有限,随后使60年代后期对人工神经网络的探索进入低谷。然而在这期间,一个对这个领域执着的学者,如来自芬兰的Kohonen的自组织映射,来自波斯顿大学的Grossberg的自适应共振
29、理论研究,都为下一步人工神经网络的发展奠定了坚实的基础。到了20世纪80年代,人工神经网络的到了快速的发展。在1982年,Hopfield学者利用HNN模型将神经网络运用于组合优化的问题上,是人工神经网络发展中一大创新。他提出了“计算能量函数”从而确定了网络稳定性的判断方法。其研究的创新为人工神经网络在优化计算以及联系记忆方面开拓了新的方法。至今,人工神经网络经过多年的发展已出现上百种模型,应用的领域也非常广泛。而是用最多最广泛的是BP神经网络模型,其良好的学习精度以及有效解决非线性问题的能力,是其受到广大学者的青睐。其本质是基于误差反向传播算法的多层前馈神经网络。1、 BP网络算法原理首先我
30、们应该确定BP神经网络的整体结构。 我们设输入层、隐含层、输出层分别含有m、p、n个神经元,设置BP网络训练样本为N对。然后设置BP网络变量:输入样本向量:期望输出向量:网络的实际输出向量:网络中间各层的加权输入:网络中间各层的输出:输出层各层的加权输入:输入层至隐含层的连接权值:隐含层至输出层的连接权值:隐含层各单元的阈值:输出层各单元的阈值:其中:;激活函数采用Sigmoid型函数:,其导数为: (4.2.1)输入输出变量之间的关系: (4.2.2) (4.2.3)对于第k对训练样本,我们可以设置其实际输出和期望输出之间的误差为如下定义: (4.2.4)网络全局误差: 输出单元的较正误差:
31、 (4.2.5)由式(4.4.1)可得:中间各隐含层单元的较正误差: (4.2.6)有式(4.4.1)和式(4.4.3),进一步可得:BP网络的全局误差是的定义范围是在全部训练样本集上,如要让BP网络的全局误差在曲面上,要按按梯度下降,就需对隐含层和输出层的阈值和连接权值的负梯度满足要求: (4.2.7) (4.2.8) (4.2.9) (4.2.10)其中按梯度下降的原则,即连接权值和阈值的变化,要正比于负梯度,故而有: (4.2.11) (4.2.12) (4.2.13) (4.2.14)其中, ;故而可得经过调整后的网络连接权值和阈值如下:其中L表示训练次数 (4.2.15) (4.2.
32、16) (4.2.17) (4.2.18)2、BP算法训练过程从上述算法训练过程,综合分析得出BP网络采用以下训练的过程:(1)在模型训练开始之前,变量,应给予一个随机初始值。(2)其次,开始训练,给模型输出初始样本。(3)然后使用输入,连接权值以及阈值算出隐含层的各个单元输出:,其中 (4.2.19)(4)使用,连接权值和阈值算出输出层的各个单元输出:,其中 (4.2.20)(5)接下来我们使用,以及BP网络实际的输出,计算出输出层各个结点的校正误差:,其中 (4.2.21)(6)、使用、算出隐含层各单元的校正误差: ,其中 (4.2.22)(7)使用、和算出隐含层到输出层之间的新连接权值:
33、 (4.2.23) (4.2.24)(8)使用、和算出输入层到隐含层之间的新连接权值: (4.2.25) (4.2.26)(9)接下来完成第一组训练后,我们需要选择新的第二组训练样本,使用遗传算法优化的新的连接权值对样本进行再次训练。(10)当全部样本经过训练后,其全局误差函数小于初始设定值时,训练结束。3、BP算法流程图通过上述BP网络算法分析,可以得出,BP网络算法实际为一种非线性优化的过程。它将训练样本的信息储存在连接权值和阈值之中,然后在每次训练时逐步优化,直到满足训练误差或是训练次数,得到输出值。归纳BP网络的训练流程如下:否是是输入训练样本计算中间层单元的输出调整中、输层权和阈值计
34、算输出层校正误差调整入、中层权和阈值训练样本更新更新训练次数全部样本训练完否?误差预定初始化权值阈值矩阵训练结束,输出权值、阈值矩阵下一个样本下一轮训练否BP神经网络的训练流程4、BP算法的特点BP网络算法广泛应用于实际问题,大多数人工神经网络都使用BP网络算法,其主要特点有:(1)、BP网络算法优点:第一、BP网络算法可使用于近乎任一的非线性优化关系,这当然需要较多的隐含层和隐含节点。第二、BP网络学习算法是一种全局的学习算法,因此其具有较强泛化能力的特点。(2)、BP网络算法缺点:第一、BP网络算法的缺点之一就是收敛速度的缓慢,这通常需要近乎千次的训练,并且伴随训练样本维数的上升,BP网络
35、算法的性能会变差。第二、BP网络算法中隐含层节点的个数,目前较难确定。第三、BP网络算法容易陷入局部最小问题。(三)遗传算法优化神经网络的方案及算法实现1BP神经网络模型缺点的优化BP神经网络有着收敛速度较慢,容易陷入局部最小的缺陷。其连接权值用梯度下降法来确定,但难以找到最优的权值。而利用遗传算法可以很好的解决上述问题。遗传算法不同于单点搜索方法,而实质是一种全局搜索方法,有效减少陷入局部最优解的可能性。2.GA-BP模型的建立我们采用BP神经网络模型为主,使用GA算法优化BP神经网络方法连接权值的的形式。其优化方法过程实现如下:首先确定BP神经网络结构,设有三层,其中、分别为第个神经元输入
36、层、隐含层、输出层的输出;我们设置、分别为输入层与隐含层以及隐含层与输出层之间的连接权值。(1)首先需初始化种群P,以及对交叉概率、变异概率、和进行初始化的工作。接下来要对种群中的个体进行编码,编码方式采用实数编码方法,随后我们需要拟定种群数量初始值,设为30。 (2)确定初始种群中每个成员的适应度函数,并给成员适应度进行排序,以一下概率值来选定种群中的个体:我们设为个体的一个适配值,其可以用误差平方和E来度量,即为:其中设定代表染色体数;为输出层的节点个数;为学习样本的个数;为教师信号。(3)我们以概率对个体和进行交叉算法,产生新个体和,然后对没有进行交叉运算种群中的个体进行复制。(4)随后
37、使用变异概率进行变异运算产生的新个体。(5)将新得到的个体重新放入种群之中,且需要重新计算新得个体的适应度函数。(6)若经过上述过程后,得出说要求的个体,则停止运算,否则转(3)。运算结果得到种群中最优个体,将其解码后,即为优化后的连接权值系数。五、GA-BP神经网络模型的建立及实证分析(一)样本数据的选取及数据来源 本设计首先构建了GA-BP神经网络模型,在训练数据上选取2011年ST公司以及非ST公司各30家,在训练数据上使用2012年ST公司以及非ST公司各30家进行验证。模型输出变量为1和0,我们定义1为ST公司,定义0为非ST公司。这样通过模型的输出变量,我们可以轻易的判断输出变量认
38、为该公司是ST公司还是非ST公司。 本设计使用来自万德网(wind)的资讯数据。模型使用的输入变量来自各上市公司年报以及通过年报上的财务指标计算得出。(二)指标变量的筛选如图对上市公司的财务指标进行归纳总结,将公司的财务指标体系总结出四大类别,分别是:偿付能力、成长能力、营运能力以及盈利能力。而要使模型能够判断出公司是否陷入财务危机,理论上应该尽可能的多选取不同种类的财务指标作为输入变量,并且应涵盖四大能力。然而,输入变量过多反而会加重模型的训练负担,训练速度较慢。故使用一种方法筛选出影响力大的指标显得尤为重要。在本设计中,我们使用主成分分析法选择出贡献因子较大的七个指标:每股经营现金流量指数
39、、净利润增长率、存货周转率、总资产周转率、净资产收益率、资产负债率、流动比率。如图所示,这七个财务指标的贡献率以达到85%以上,满足模型判断选定公司是否进入财务危机的需要。进行主成分分析后选定的财务指标上市公司企业信用指标体系(筛选后)一级指标二级指标偿付能力资产负债率流动比率成长能力净利润增长率每股经营现金流量指数营运能力存货周转率总资产周转率盈利能力净资产收益率主成分分析相关检验KMO检验0.72Kaiser认为该值小于0.5时不宜做因子分析Bartlett检验118.685Approx.Chi-Square(统计量)0.0001显著水平小于0.05累计贡献度88.71%(三)模型建立及参
40、数选择 如图所示,本设计模型采取的结构为,使用三层BP神经网络作为主构架,含有输入层、隐含层和输出层,对输入变量进行训练。训练后判断输出变量是否满足停止要求,若不满足,则使用遗传算法对连接权值以及阈值进行优化处理,重复训练过程,直到满足停止要求,输出变量。首先我们设置模型在输出层的误差函数是:Es=i=130(yi-Oi)2,我们设定Oi、yi分别为排在第i位的样本的输出值以及理想值,其中我们将训练样本的个数设为30。之前我们已经定下输入变量为七个指标,即输入层神经元为7,输出变量为1或0,即输出层神经元的数量为1,接下来我们应着手确定隐含层的神经元个数。隐含层神经元数量的选择,一直是广大学者
41、遇到的难题,因为当隐含层神经元数量过少时,不能达到训练要求;而当隐含层神经元数量过多时,会导致训练结果误差太大。在本设计中,我们通过不断的测试,选择不同的隐含层神经元数量,对结果误差率进行对比,选择使模型输出误差较小的16个隐含层神经元数为最佳。接下来我们隐含层神经元使用的激发函数为tansig函数:fx=1-ex1+ex,其中x为输入层神经元所输入的变量值。由于输出层的值为1或0,当输出为1时,说明该样本训练结果为ST公司;当输出值为0时,说明该样本训练结果为非ST公司。故根据输出层神经元的特性,应选用Sigmoid函数:gx=11+ex其中x为隐含层神经元的输出值。BP神经网络经历多年发展
42、完善后衍生出很多不同的训练方法,经综合分析考量,我们选取误差较小,收敛较快的L-M (Levenberg-Marquardt)训练算法。我们将2000定为最大训练步数,0.01为期望最小误差。在应用遗传算法优化权值过程中遗传算法选择继承、交叉、选择三个运算对连接权值以及阈值进行优化。遗传算法中涉及的参数种群规模、交叉概率、变异概率及评价参数,根据文章需要,分别确定为:种群规模40,交叉概率Pc=0.1,变异概率Pm=0.6,评价参数a=0.05。(四)实验结果与分析1.使用遗传算法对BP神经网络连接权值以及阈值进行优化。(1)遗传算法种群初始化:首先应采用随机原则,借助matlab工具中的m*
43、randn()函数,生成起始种群P=x1,x2,x40,其中我们设置每一个xi含有连接权值以及阈值向量,其向量的维度数我们定为128。(2)选择运算:在本设计中使用轮盘赌方法进行选择运算,选用Es为适应度函数,即误差函数,为种群中的个体进行排序。选择概率采用Michalewicz指数排序法eval(vi)=a(1-a)i-1。(3)交叉运算:按照之前设定的交叉概率,对种群中选定个体进行交叉运算,若交叉后判断子代强于父代,则用子代代替父代。(4)变异运算:变异运算首先应随机选择变异点位置,将变异点基因以一定变异概率进行变异后,判断子代是否强于父代,若是这取代父代。经过遗传算法的选择、交叉、变异的
44、运算处理,判断输出值是否满足BP神经网络连接权值以及阈值的精度要求。若满足,则将种群进化取值代进GA-BP神经网络模型。在本设计中进化代数取300代,误差为0.0027,误差满足要求。2.测试及训练结果。在matlab平台上建立好GA-BP神经网络模型程序操作,实验结果如下图所示。该GA-BP神经网络模型判断结果如下:非ST公司误判为ST公司的数目为3家,准确率达95,将ST公司误判为非ST公司的数目仅为2家,准确率达到了96.7。60个训练样本和60个测试样本的准确率分别是98.33和93.33,120个样本的准确率为95.83。GA-BP神经网络实验结果分类名称训练集(60)测试集(60)总数(60)非ST(30)ST(30)非ST(30)ST(30)错误数0、12、25正确率98.33%93.33%95.83%BP神经网络实验结果分类名称训练集(60)测试集(60)总数(60)非ST(30)ST(30)非ST(30)ST(30)错误数0、15、28正确率98.33%88.33%93.33% 如图,从实验结果发现,在训练样本集相同的情况下,GA-BP神经网络的训练效果明显优于单纯的BP神经网络。而且从收敛速度上来看,GA-BP神经网络误差的收敛速度明显快于单纯的BP神经网络。经过分析,我们认为在训练样本再逐步加大时,这个误差还能够继续减小。