农业相关-淘文阁

资源描述

《基于上市企业数据的实证研究,经济师论文.docx》由会员分享，可在线阅读，更多相关《基于上市企业数据的实证研究,经济师论文.docx（12页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基于上市企业数据的实证研究,经济师论文本篇论文目录导航：【题目】【第一章】【第二章】【第三章】【第四章】基于上市企业数据的实证研究【结论/以下为参考文献】 4 基于上市企业数据的实证研究 4.1 评价方式方法确实定。已有学术研究中，关于信誉风险辨别有较多方式方法，既有基于机器学习的神经网络、决策树、支持向量机 SVM 等非线性方式方法，又有如 Logit 回归等线性方式方法。李萌基于 Logit 模型研究了商业银行的信誉风险评估50.胡海青，张琅，张道宏基于 SVM 与 BP 神经网络方式方法研究了供给链金融视角下的中小企业信誉风险评估51.张奇，胡蓝艺，王珏用 Logit 与 SVM

2、模型研究了银行业的信誉风险预警模型52.刘远亮，高书丽基于北京地区信贷数据用主成分分析法和Logistic 回归方式方法建立了信誉风险辨别模型53.邓爱民，王珂用主成分分析法与 Logistic 回归法相结合，利用深圳证券交易所 60 家企业的样本数据对供给链金融业务的信誉风险进行实证分析54. 两类模型各有优势和缺乏。线性方式方法在预测精到准确度方面低于非线性方式方法，但在稳健性方面有独特优势。稳健性是形容模型对训练样本以外的样本的适用性，稳健性高的模型在对训练样本以外的样本有很高的适用性，预测精度会保持稳定。但是，机器学习的方式方法只能给出预测而不能对结果进行解释，线性回归的方式方法能够

3、对结果进行解释。在非线性方式方法中，根据已有文献的查阅，SVM使用较为广泛，适用性较强。因而，本文选择 SVM 和 Logit 两种模型同时建模，以便互相补充和比照。 4.2 样本和数据。 4.2.1 数据的来源。考虑到指标选取的代表性、指标数据的可得性，本文根据线上供给链金融信誉风险综合评价体系，将中小企业及核心企业财务状况、供给链状况、线上化指标的三级指标作为一个整体，汇总得到 23 个变量见表 3-2,原始数据见附表 2。本文的数据主要来源于 wind 资讯的公司财务数据专题，少量缺失数据从国泰安数据服务中心_公司研究系列_上市公司财务指标分析数据库进行补充。wind 资讯数据库的

4、公司财务专题板块包括行业层面、单个上市公司层面的财务数据、财务报表附注的债权债务数据、主营构成等较为全备的数据，并且细分出了多个股票市场板块。定性指标的取值离散程度较小，需要进行综合评价，对数据精度的要求也相对较低，符合吕跃进和张维55 提出的心理因素划分评价等级以及数量等级确定理论的适用背景，本文根据网上颁布的上市公司的年度报告等相关公开资料对样本企业进行四级评价，分别给予 10/7/4/0的分数。吕跃进和张维的这一理论被很多学者用来解决学术研究中定性变量难以获得的问题，本文也借鉴前人的分析方式方法，采用这一理论来解决定性数据的问题41 54. 4.2.2 样本的选取。国内学术研究通常

5、将上市企业陷入财务窘境作为违约的标志，本文也采用这一方式方法。将非 ST 上市公司界定为财务正常公司，将 STspecial treatment,十分处理的上市公司界定为财务窘境公司。本文研究样本来自沪深两市的 A 股市场，选取截止 2021 年所有十分处理的陷入财务窘境的 46 家企业，并选择类似的财务正常的非 ST 企业组成本文的全部样本。类似样本的选取主要根据数据库中的不同行业分类方式方法wind 行业划分、证监会行业划分，选取与 ST 企业行业划分一样的财务正常公司，并综合考虑数据的可得性，最后选取了 104 家财务正常公司，组成了本文实证研究的 150个样本总体。在

6、SVM 模型的实证研究经过中，随机从两类样本中分别选取70%的样本量作为训练组，用这些数据来构建模型，得到最优分类超平面的参数；剩余 30%的样本量作为测试组，用这些数据来检测训练样本构建出来模型的预测准确性。 4.3SVM 模型建模。线上供给链金融信誉风险评估的目的是通过对申请贷款企业所处行业状况、本身资信状况、核心企业资信状况、供给链关系状况、线上特有指标等方面进行全面综合评估，进而决定能否为其提供贷款。不同银行在实践中使用不同的信誉等级评估标准，但最终转化为能否为企业提供贷款的二分类问题，支持向量机 SVM 模型作为一种机器学习的方式方法，在二分类问题有方面较好的适用性，SVM 适用于

7、解决小样本、非线性以及多维变量的模型辨别问题。在建模之前，要对数据进行预处理，主要包括缺失值的处理和数据的标准化。 4.3.1 数据预处理及标准化。本文通过 wind 资讯与国泰安数据库的互相补充，出现的缺失值较少，仍然缺失的数据选择该指标同行业样本的均值来填补。训练样本集中包含的关于分类的信息和数据是机器学习和分类器优化的唯一渠道，华而不实所包含的先验信息对分类器的学习效果和最终性能有很重要的影响。建模之前首先需要进行数据标准化，原因如下：1提高数据分类的准确性，减少取值较大数据淹没取值较小数据的可能性，否则会阻碍模型算法从数据中提取规律的效率；2防止出现计算困难，而陷入出现不收敛等问题

8、，提高系统处理数据的效率。在核函数计算经过中，需要计算特征向量的内积，如高斯核函数，若不标准化，大的特征值可能引起数值计算困难。本文采用极差变换法，使用 R 软件自带的 scale 函数进行输入变量数据的标准化，公式如下： 4.3.2 训练样本集和测试样本集。用标准化后的新数据作为支持向量机的输入数据，支持向量机的输出为 1 和 0 ,代表融资企业的信誉风险的不同级别，1 表示企业是 ST 企业，存在财务窘境；0 表示企业是非 ST 企业，财务正常。为检验模型的有效性，选取 105样本的 70%个样本作为训练集，用于构造 SVM 模型；选取45样本的 30%个样本作为测试集，用于评估模型

9、的稳健性，即泛化能力。样本集的具体信息。 4.3.3 模型构建。支持向量机的算法是由俄罗斯学者 V.N.Vapnik 于 1995 年提出的一种人工智能算法，在机器学习和统计学领域引起了大量的关注。主要思想是构建一个超平面，使不同样本分类集群之间的隔离边缘到达最大。换言之，SVM 追求构造风险最小化，通过固定经历体验风险，使置性风险最小化，也就是使样本对总体的代表性最强，追求模型的泛化能力34.因而，具有较好的稳健性和准确率，进而被广泛地应用于信誉风险评级领域。样本集的分类间隔等于2/|w|,因而使间隔最大等价于|w|2最小。知足条件4.3.1且使得|w|2最小的超平面称为最优分类超平面

10、，使4.3.1中等号成立的训练集中的样本点称作支持向量。通过拉格朗日方式方法将上述优化问题转化为不等式约束条件下二次函数的最值问题，得到存在唯一解，即最优分类函数为：构造一个可变的间隔，找到同时知足错分样本数最少和分类间隔距离最大的参数，求得最优分类超平面。华而不实，C 是常数，决定对分类错误样本的惩罚程度，这是机器学习算法的一种决策规则，通过不断地深度学习来找到样本分类的内在规律，进而应用到训练样本的预测经过中。 4.3.4 核函数的选取和参数选择。理论上来讲，任何事物都不会完全一样，只要有足够的分类维度就能够将其辨别出来，但在实践中，我们对事物的了解有限，也不可能穷尽他所有的特征，并

11、不能实现这种理想的状态。核函数是一种能够将低维空间中的非线性问题转化为高维空间中的线性问题的有效工具，能够借此求解高维空间中的最优、分类超平面。一般在建模中会采用符合 Mercer 条件的内积核函数Kxi,xj，实现通过非线性变换之后的高维空间中的线性分类，这种变换不需要给出详细的函数形式，仍能够进行计算，分类函数变为高斯径向基核函数为最常用的内积核函数，实证研究证明通过这种核函数得到的 SVM 模型性能较好。多项式核有更多的超平面参数，参数调整比拟复杂；因而，本文选择最常用的径向基核函数：本文以使错分样本数最小和分类间隔最大为原则，在高维空间中构造可变的间隔，最后采用穿插验证方式方法确实

12、定参数，这些建模经过使用 R 软件来完成。R 软件执行程序如附录 1 所示。本文选择 SVM 建模最常用的 e1071 包，使用 R 软件进行建模。在模型建立的经过中，模型参数的选择是一个重要的环节。本文选取 SVM 模型自带的函数 svm.tune 通过 10 折穿插验证10-fold cross-validation的方式方法来确定最优的参数：Gamma 值和惩罚值 C.惩罚项 C 反映了模型对分类错误样本的惩罚，C 取值越大表示对分类错误样本的宽容度越低，对训练集样本来讲，训练的模型分类准确度更高层次，但是可能会降低模型的泛化能力，对测试集的性能不一定好。因而，需要通过全面考虑两个指标

13、来确定最优的惩罚项 C.对于径向基核函数的参数 Gamma 也使用同样的准则来确定参数取值。本文实证研究对传统的指标体系只包含融资企业的财务数据和线上供给链金融体系进行了比照研究。在基于传统的指标体系的建模中，最优的C=100,Gamma=0.0001;在基于线上供给链金融评价指标体系数据实证的经过中，最优的 C=100,Gamma=0.001.后续的测试集样本实证模型是基于这些最优参数取值构建的。 4.3.5 SVM 模型实证结果分析。本文基于传统信誉风险评估体系和线上供给链金融信誉风险评估指标体系进行了实证比照研究。传统体系的指标包括：行业增长率 IND_G、营运能力指标应收账款周转率

14、 RT 及增长率 RT_G、存货周转率 IT 及增长率 IT_G、总资产周转率 AT 及增长率 AT_G、偿债能力指标速动比率 QR 及增长率QR_G、利息保障倍数 ICR 及增长率 ICR_G、净利润负债比率 LEV 及增长率LEV_G、盈利能力指标销售净利率 NPM 及增长率 NPM_G、总资产净利率ROA 及增长率 ROA_G、净资产收益率 ROE 及增长率 ROE_G。供给链体系包含另外 3 个指标：应收账款账龄 Receiv_y、账龄 1 年以内应收账款占比 Rec_1y、目的企业应收账款总额中核心企业所占比例 coop、企业的供给链金融线上化程度 online.实证经过分别将两类指

15、标作为自变量，将融资企业能否为 ST 企业作为因变量Y，1 表示该企业是 ST 企业，0 表示该企业不是 ST 企业。实证经过中，使用 R 软件中的程序进行训练，构建分类的 SVM 模型，最后利用训练出来的模型对测试集样本进行分类。基于传统风险评价体系的样本分类结果。基于供给链评价体系的样本分类结果，如表 4-3 所示；两种体系的分类结果比照表。统计每组判定错误的样本，分别计算训练样本集、测试样本集和样本总体的第一类分类错误率和第二类分类错误率 . 4.4Logit 模型建模。 Logit 模型假设事件发生的概率服从 Logistic 函数的累计概率，适用于因变量为分类变量的情况，

16、能够预测事件发生的概率，一般将 0.5 设为临界值：若P 0.5,则事件发生的概率较大。模型通过最大似然法对模型的参数进行估计。模型合适用于本文的能否违约问题的研究。P 为企业财务窘境ST=1 的概率，则 1-P 表示企业财务正常ST=0 的概率。两种风险评价体系下，Logit 模型的表示出式为： Logit 模型是一种线性模型，常用于样本点的分类，经过较多实证研究的检验，分类正确率较高。模型中，营运能力指标和盈利能力指标的回归系数预期符号是负的，这类指标的取值越大，越可能是财务正常ST=0 的企业。偿债能力方面的指标回归系数预期符号不绝对，由于财务杠杆应适度，并非越大越好。线上

17、供给链体系特有的 3 个指标：应收账款账龄 Receiv_y、账龄 1 年以内应收账款占比 Rec_1y、目的企业应收账款总额中核心企业所占比例 coop、企业的供给链金融线上化程度 online.Receiv_y的回归系数预期符号是正的，账龄越大，应收账款收回的可能性越小，财务窘境ST=1 的可能性越大。 online 的回归系数预期符号是负的，线上化程度越高，企业的竞争力越强，财务正常ST=0 的可能性越大。本文运用 R 软件分别基于传统体系和线上供给链金融体系的指标建立 Logit 回归模型并进行比照分析。建模经过中采用双向逐步回归法进行模型的选择，变量选择的标准是 AIC 信息

18、准则，AIC = 2k ?2ln L。一般来讲增加变量会提高模型的拟合优度，但又要避免过度拟合Overfitting。因而，应该优先考虑 AIC 值最小的那个模型。AIC 准则的方式方法寻找能够最好地解释数据，但包含的变量最少的模型。基于两类体系实证研究的 Logit 回归模型的回归结果。根据4.4.3 4.4.4式两种体系的回归方程计算每个企业的违约概率，概率大于 0.5 断定为 ST 企业，与企业原始的能否 ST 进行比照，得到基于Logit 模型的样本断定结果，并计算模型的弃真取伪率。 4.5 实证结果比照分析。我们国家商业银行传统的信誉风险评估体系主要关注融资企业本身的财务

19、状况，不考虑核心企业的信誉状况、供给链合作情况及中小企业的电子商务信誉。本文的线上供给链金融体系增加了上述三个方面的评价。为了分析比拟两种评价指标体系只考虑财务指标的传统的评价体系和基于供给链的综合评价指标体系对中小企业信誉风险的辨别评价效果，本文分别基于这两种信誉风险评估体系建立了 SVM 模型和 Logit 模型，计算了各类情况下样本的分类正确率。根据统计学的理论，第一类错误即弃真错误 , 第二类错误即取伪错误通常被用来检验分类经过的判定效果。在线上供给链金融信誉风险辨别经过中，第一类错误是指银行将特殊警示的 ST 企业判定为正常经营的非 ST 企业第二类错误指将正

20、常经营的非 ST 企业判定为特殊警示的 ST 企业 .两类错误相比而言，第一类错误将不能归还贷款的财务问题企业误判为能归还贷款的财务良好企业，这类错误若发生，将给银行带来损失，可能导致银行的此项贷款无法收回并构成坏账。若出现第二类错误，银行可能会损失掉利息收入。银行客户承受风险的能力相对较低，因而对银行来讲，第一类错误比第二类错误造成的后果愈加严重。由表 4-8 比照，能够看出，SVM 模型的第一类错误率相比 logit 模型更低，因而，从审慎监管的角度来讲，SVM模型更合适银行对中小企业信誉风险的评估。我们发现：在运用一样模型的情况下，基于线上供给链金融的评价体系的中小企业信誉风险评估准确率远高于基于传统信誉风险评估体系。因而，线上供给链金融的信誉风险评估指标体系更有利于正确预测中小企业的信誉风险水平。

展开阅读全文