回归大作业基于多元线性回归的期权价格预测模型.pdf

上传人:修**** 文档编号:75980101 上传时间:2023-03-06 格式:PDF 页数:19 大小:1.63MB
返回 下载 相关 举报
回归大作业基于多元线性回归的期权价格预测模型.pdf_第1页
第1页 / 共19页
回归大作业基于多元线性回归的期权价格预测模型.pdf_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《回归大作业基于多元线性回归的期权价格预测模型.pdf》由会员分享,可在线阅读,更多相关《回归大作业基于多元线性回归的期权价格预测模型.pdf(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基于多元线性回归的期权价格预测模型基于多元线性回归的期权价格预测模型王某某王某某(北京航空航天大学 计算机学院 北京 100191)1摘摘要:要:期权是国际市场成熟、普遍的金融衍生品,是金融市场极为重要的金融工具。2015 年 2 月 9日,上海证券交易所正式推出了我国首支场内交易期权上证 50ETF 期权,翻开了境内场内期权市场的新篇章。50ETF 期权上市以来,市场规模逐步扩大,其发展情况境外期权产品相同时期。本文以此为研究背景,以“50ETF 购 12 月”这支期权为研究对象,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归

2、模型,预测该期权的明日收盘价。本次研究以多元线性回归的全模型(模型 1)为出发点,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。进而通过主成分回归(模型4)和逐步回归(模型 5)进行降维,结果表明因变量与解释变量之间存在强烈的线性相关关系,且主成分回归和逐步回归相比全模型有更好的预测能力。关键词:关键词:期权价格 多元线性回归 50ETF 多重共线性 因子分析一、一、引言期权(option)是依据合约形态划分的一种衍生品,指赋予其购买方在规定期限内按买卖双方约定的价格(即协议价格或行权价格)购买或者出售一定数量某种金融资产(即标的资

3、产)的权利的合约。期权购买方为了获得这个权利,必须支付给期权出售方一定的费用,错误错误 未找到引用源。未找到引用源。称为权利金或期权价格!。2015 年 2 月 9 日,上海证券交易所正式推出了我国首支场内交易期权上证50ETF,翻开了境内场内期权市场的新篇章。期权是与期货并列的基础衍生产品,是金融市场极为重要的金融工具之一。自 50ETF 上市以来,市场规模逐步扩大。2015 年 2 月日均合约成交面值为亿元,12 月就达到了亿元,增长了倍;2 月日均合约成交量为万张,12 月就达到了万张,增长了倍;2错误错误 未找到引用源。未找到引用源。月权利金总成交额为亿元,12 月就达到了亿元,增长了

4、倍!。我国股票市场有上亿的个人投资者,是一个较为典型的散户市场!。相较于专业投资机构讲,散户缺乏时间,精力以及专业分析,投资具有很大的投机行为。对于这些投资者来说,期权价格的变动则是他们最为关注的问题,其变化直接影响到自身的收益。在实际情况中,影响股票价格的因素很多,涉及到金融政策、利率政策以及国际市场等因素,其错误错误 未找到引用源。未找到引用源。作用机制也相当复杂!。因此,对于期权价格预测的研究,则可以降低投资者的投资风险,及时调整投资结构,从而保障自身的收益。本文选择“50ETF 购 12 月(期权代码:)”这支期权作为研究对象,根据过去一个月内期权的交易数据,以今日开盘价、收盘价、最高

5、价、最低价、结算价、成交量、成交额、持1作者简介:王某某,北京航空航天大学研究生错误错误 未找到引用源。未找到引用源。仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。下文由如下几部分构成:第二部分介绍了本次研究的数据集,包括数据来源、和数据字段;第三部分重点介绍了各个多元线性回归模型,包括全模型及异方差检验,残差的独立性检验、误差的正太分布检验和多种共线性检验,在第 4 小节和第 5 小节分别采用主成分回归和逐步回归对模型加以改善;第四部分运用第三部分建立的各个模型对期权价格进行了预测;第五部分对本文研究进行了总结并未来的研究加以展望。二、数据说明本次研究的数据来

6、源于Wind 资讯金融终端,从上面获取了“50ETF 购 12 月”这支期权自 2016 年 10 月 24 日至 2016 年 11 月 24 日(只包含工作日)共计24 日的交易数据。经过整理后得到最终的数据字段,见表1。表 1 期权交易数据字段收盘价成交额开盘价成交量最高价持仓量最低价涨停价结算价跌停价期权交易数据见附录1。三、三、建模1 1 符号说明符号说明各个变量及其符号说明见表2。表 2 各个变量及其符号说明变量变量明日收盘价明日收盘价今日开盘价今日开盘价今日收盘价今日收盘价今日最高价今日最高价符号符号今日最低价今日最低价今日结算价今日结算价今日成交额今日成交额今日成交量今日成交量

7、今日持仓量今日持仓量今日涨停价今日涨停价今日跌停价今日跌停价2 2 解释变量与指标变量的散点图解释变量与指标变量的散点图在建立模型之前,首先利用 MATLAB 绘制各个解释变量与指标变量(明日收盘价)之间的散点图,观察各个解释变量与指标变量之间的关系,散点图结果见图1。图 1 各个解释变量与指标变量(明日收盘价)的散点图通过图一中的散点图可以看出,明日收盘价与今日收盘价、今日开盘价、今日最高价、今日最低价、今日结算价、今日持仓量、今日涨停价以及今日跌停价之间有较为明显的线性关系;而与今日成交额以及今日成交量之间的线性关系并不明显。3 3 全模型全模型通过散点图我们观察到指标变量与各个解释变量之

8、间大致上为线性关系,所以考虑多元线性回归模型进行建模。模型建立与求解模型建立与求解首先建立各个解释变量与指标变量的全模型,即考虑如下模型:式中,回归系数。在 MATLAB中使用 regress 函数即可求解此多元线性回归模型,求解结果见表3.表 3 MATLAB 求解全模型结果,都是与解释变量无关的未知参数,其中,称为回归系数回归系数回归系数的估计值回归系数的估计值回归系数置信区间回归系数置信区间0=00从上表容易看出模型(1)成立,此时指标变量与解释变量满足的回归模型为:(模型 1)在 MATLAB中画出模型 1 的残差分布,见图 2。除第 12 个数据外其余残差的置信区间均包含零点,因此第

9、12 个点应当视为异常点,将其剔除后重新计算,得到模型2:图 2 模型 1 的残差分布(模型 2)模型 2 的=,=,=。但同时我们发现,各个回归系数的置信区间仍然均包含零点。画出模型 2 的残差分布,发现又出现了异常点,按照上面的方法剔除异常点直至没有异常点产生。最终一共去掉了5个异常点(分别是 2,12,15,22 以及 23),最终得到模型 3:(模型 3)模型 3 的=,=,。可见模型 2 相当显著,各个回归系数的置信区间均不包含零点;但是去除的数据点有5 个(总共23 个),去除的异常点比较多,容易去除有用信息,所以我们只把模型3 作为后期预测的一个对比模型,在之后的分析中,我们只考

10、虑去除第12 个异常点的数据。接下来进行异方差检验,残差的独立性检验以及多重共线性检验。异方差检验异方差检验通过 SPSS 画出残差对预测值的散点图,见图3。图 3 残差对预测值的散点图根据图 3 可以认为数据基本不存在异方差性,即认为随机误差具有相同的方差。残差的独立性检验残差的独立性检验通过 SPSS 的 Durbin-watson检验得到 DW 值为,模型 2 中解释变量数量 k(包括常数项)为 7,样本数量 n 为 22,查 DW 分布表得到相应的认为随机误差之间无自相关错误错误!未找到引用源。未找到引用源。,。由于,。误差的正态分布检验误差的正态分布检验通过 SPSS 画出正态 P-

11、P 图以及回归标准化残差频率分布直方图,见图4。图 4 误差的正太分布检验图从上图可以认为误差服从均值为0 的正态分布。多重共线性检验多重共线性检验多元线性回归模型的基本假设中要求设计矩阵 X 的列向量之间不存在密切的线性关系错误错误!未找到引用源。未找到引用源。,如果存在,就称它们之间存在多重共线性。表 4 多重共线性诊断结果通过 SPSS 进行多重共线性诊断,结果如下表。从上表可以看出绝大部分变量的 VIF 值远远大于 10,说明严重存在多重共线性,针对多重共线性的问题,接下来用主成分分析加以处理。4 4 主成分回归主成分回归利用 MATLAB对这个十个解释变量进行主成分分析,分析过程如下

12、。1)对原始数据进行标准化处理即每个元素的值减去该列的均值,然后除以这一列的方差。2)计算相关系数矩阵R,结果见表表 5 解释变量的相关系数3)计算特征值和累计贡献率见表6表 6 各个解释变量的特征根和累计贡献率变量变量特征根特征根累计贡献率累计贡献率%可以看出,前两个特征根的累计贡献率就达到了 90%以上,主成分分析效果很好。下面选择前四个主成分(累计贡献率%)进行综合分析。4)前四个特征根对应的特征向量见表7表 7 前四个特征根对应的特征向量第 1 个特征向量第 2 个特征向量第 3 个特征向量第 4 个特征向量5)主成分回归模型求得的主成分回归模型如下:(模型 4)5 5 逐步回归逐步回

13、归主成分回归求出的主成分是原始变量的线性组合,表示新的综合变量。接下来使用逐步回归的方法来筛选变量。在逐步回归中,决定一个变量时候有必要进入模型或者从模型中错误错误 未找到引用源。未找到引用源。剔除时,常用的方法是偏F 检验!,关于偏 F 检验这里不做赘述。在 MATLAB中使用 stepwise 函数进行逐步回归错误错误!未找到引用源。未找到引用源。,运行结果如图 5图 5 逐步回归结果求得的逐步回归模型如下:(模型 5)四、预测接下来我们利用上面求得的模型来进行期权价格预测。利用模型 1、模型2、模型3、模型4 和模型 5 分别预测了 11 月 25 日至 12 月 10 日的期权价格,1

14、1 月 25 日至 12 月 20 日的真实期权以及预测结果如表8。表 8 各个模型的预测结果日期日期2016-11-252016-11-282016-11-292016-11-302016-12-012016-12-022016-12-052016-12-062016-12-072016-12-082016-12-092016-12-122016-12-132016-12-142016-12-15真实数据真实数据模型模型 1 1模型模型 2 2模型模型 3 3模型模型 4 4模型模型 5 52016-12-162016-12-192016-12-20各个模型的平均误差以及误差百分比见表9。表

15、 9 各个模型预测结果评价真实数据真实数据平均误差平均误差百分比模型模型 1 1%模型模型 2 2%模型模型 3 3%模型模型 4 4%模型模型 5 5%从表 8 和表 9 可以看出,模型4(主成分回归)和模型5(逐步回归)的结果最好,而模型 3 由于去掉了较多的异常点反而导致预测结果不好。接下来不考虑模型3,画出其余 4个模型的预测结果与真实数据的折线图,见图6在图 4 中,横坐标表示数据的序号,分别与各个日期对应,其中前面24 个数据来自训图 6 4 个模型预测结果与真实数据的折线图练集,故而各个模型的预测结果与实际结果接近;后面的数据则来自测试集,可以看出各个模型的预测结果与实际数据存在

16、一定差异,不过总体趋势与实际数据比较匹配。其中模型4和模型 5 的预测结果最好。五、结论本文从以期权今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,期权明日收盘价为指标变量,建立了多元线性回归模型1,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。进而通过主成分回归(模型4)和逐步回归(模型 5)进行降维,通过预测结果与真实数据的差异比较了各个模型的预测效果,结果表明主成分回归以及逐步回归相比全模型有更好的预测能力。实际情况中,该期权的当日价格波动一般不会超过15%,而普遍真是情况是8%以

17、内,可见模型 4 和模型 5 的预测效果并不理想,今后的研究可以在以下两个方面进行改进:不断向模型加入得到的最新数据;运用时间序列模型进行研究。参考文献1吴清.期权交易策略十讲M.上海人民出版社,20162李珺.基于因子分析的多元线性回归方法及其在股价预测中的应用D.南京大学,20143孙海燕,周梦,李卫国,冯伟.数理统计M.北京航空航天大学出版社,20164司守奎.数学建模算法与应用(第 2 版)M.国防工业出版社,2015Option price forecasting model based onOption price forecasting model based onmultipl

18、e linear regressionmultiple linear regressionWang MoumouWang MoumouSchool of Computer Science,BeiHang University,Beijing 100191Abstract:Abstract:Option is one kind of universal financial derivatives with a matureinternational market,and it is extremely important financial instrument.OnFebruary 9,201

19、5,the Shanghai Stock Exchange officially launched Chinas first floortrading options-SSE 50ETF options,opened a new chapter in the domestic marketoptions market.50ETF options since listing,the market gradually expanded,thedevelopment of offshore options products the same period.In this paper,thebackg

20、round of this study,50ETF purchase December this option for the studytotodays opening,closing price,the highest price,lowest price,settlement price,volume,turnover,open interest,price and the limit price for the explanatoryvariables,through multiple linear regression model,the option of the closing

21、price oftomorrow.In this study,the heterogeneity test,residual independence test,errorpositive distribution test and multicollinearity test were taken as the starting point ofthe whole model(model 1)of multivariate linear regression to show that the modeldid not violate the basic assumptions of regr

22、ession.The results show that there is astrong linear correlation between the dependent variable and the explanatoryvariable,and the principal component regression and the stepwise regression arebetter than the whole regression model(step 4)and stepwise regression(model 5).The results show that there

23、 is a strong linear correlation between the dependentvariable and the explanatory variable,and the principal component regression andstepwise regression have better prediction ability than the whole model.Keywords:Keywords:Option price,Multiple linear regression,Multicollinearity,Factor analysis附录1

24、1 期权交易数据期权交易数据日期日期2016-11-242016-11-232016-11-222016-11-212016-11-182016-11-172016-11-162016-11-152016-11-142016-11-112016-11-102016-11-092016-11-082016-11-072016-11-042016-11-032016-11-02收盘价收盘价开盘价开盘价最高价最高价最低价最低价结算价结算价2016-11-012016-10-312016-10-282016-10-272016-10-262016-10-252016-10-24日期日期2016-11-

25、242016-11-232016-11-222016-11-212016-11-182016-11-172016-11-162016-11-152016-11-142016-11-112016-11-102016-11-092016-11-08成交额成交额4298215583260660492515531596785915343608584837797成交量成交量3716434638434534104214411478134631551967112129831271持仓量持仓量6612658470577075773577457946823883068700858487938790涨停价涨停价跌停价跌停价2016-11-072016-11-042016-11-032016-11-022016-11-012016-10-312016-10-282016-10-272016-10-262016-10-252016-10-241495279767101729024384439804508933082775723084967228654322144514062069449282912451490227588663760931078994899495131088410831109051127111374116041177411898

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 企业管理

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁