爱知世博会游客流量分析及预测.pdf

上传人:qwe****56 文档编号:69630350 上传时间:2023-01-07 格式:PDF 页数:15 大小:521.63KB
返回 下载 相关 举报
爱知世博会游客流量分析及预测.pdf_第1页
第1页 / 共15页
爱知世博会游客流量分析及预测.pdf_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《爱知世博会游客流量分析及预测.pdf》由会员分享,可在线阅读,更多相关《爱知世博会游客流量分析及预测.pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、爱知世博会游客流量分析及预测爱知世博会游客流量分析及预测中南财经政法大学中南财经政法大学杨永川杨永川 袁外袁外 胡颖胡颖一、摘要世博会是是一项由主办国政府组织或政府委托有关部门举办的有较大影响和悠久历史的国际性博览活动。人流量的多少是判别世博成功与否的重要标志,我们通过科学的方法对世博人流量和影响它的因子进行分析,得出影响世博人流量的主成分,并建立这些因子与一天游客数量的数学关系,提出次日游客数量的预测模型,说明其可行性。本文主要运用了 SPSS,EVIWS 软件和线性回归,主成分分析,平稳性检验,ARMA 的数学模型对以上问题进行分析。通过对世博人流量和影响它的因子分析,我们可以将它推广到其

2、他更多的大型体育盛事,大型公益活动等等的人流量的分析与预测,为我们更好的展开各种大型的,人流量大的,复杂的活动提供一种科学的指导思想!二、问题重述问题一中由于影响人流量的因子较多,且他们之间可能存在一定的相关性,我们很难分析出它们各自对人流量的具体影响,故引入主成分分析。我们首先将因子进行了适当的分类和合理的整合,对天气 w 分成三种类型,节假日,星期几分成两种类型,引入虚拟变量,并引进时间序列的二次和时间序列的三次。将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标,同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来指标的信息。这样分析更加简便灵活。问

3、题二用线性回归的方法,通过 SPSS 软件,建立这些因子与一天游客数量的数学关系。问题三要求对次日的人流量进行预测,由于人流量与日期有关,引进时间序列,对其多次差方进行平稳性检验,得到比较平稳的差方,根据 ARMA 模型求出人流量与时间序列的关系。用残差和白噪声对其可行性和显著性进行检验。最终的出一个合理科学可行的预测方案与模型。三、关键字主成分分析线性回归分析时间序列平稳性自相关ARMA 模型四、模型假设1,世博场馆的容量是无限的,人流量也可以是无限的。2,世博场馆外的交通和世博的服务对游客的参观热情没影响。3,世博期间没有任何突发和不可抗拒的事件。4,世博期间主办方没有举行任何的优惠活动,

4、世博门票一直没变。5,外界的一切体育活动,社会活动对世博没有任何的影响。五、模型的建立与求解(一)问题一及问题二的建模及求解1、数据符号说明:(1)影响参加世博会人流量的因子主要有日期,节假日,星期几,天气。经过对数据的分析,我们发现长假和世博的展开阶段对人们参加世博是有一定的影响的,故引进长假和世博展开阶段两个虚拟变量。(2)由于随着时间的推移参观世博的人数也会不同,故可以构建时间序列变量。此外我们作天数-人流量的散点图,可以看出天数和人流量可能存在三次函数关系,故引进时间序列的二次方和三次方变量。(3)星期几对人们的影响主要体现在双休日和工作日上,故可以将其归到节假日一类。节假日可以分为长

5、假和短假两种。超过三天为长假,否则为短假。对以上的数据说明进行数据化处理TTTTTTWSJA时间序列时 间 序 列二次时 间 序 列三次天气世博阶段节假日星期几注:因子变成虚拟变量的说明天气 W晴W=1雨W=-1多云W=0世博阶段 S60W=1125W=3其它W=2节假日 J超过三天J=1其它J=0星期几 A双休日A=1工作日A=0时间序列 TT=日数2、主成分分析模型1(1)主分成分析原理介绍主成分分析是设法将原来众多具有一定相关性(比如 P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来 P 个指标作线性组合,作为新的综合指标。最经典的做法就是用

6、 F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即 Var(F1)越大,表示 F1包含的信息越多。因此在所有的线性组合中选取的 F1应该是方差最大的,故称 F1为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取 F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再 F2中,用数学语言表达就是要求 Cov(F1,F2)=0,则称 F2为第二主成分,依此类推可以构造出第三、第四,第 P 个主成分。(2)主成分分析数学模型F2=a12ZX1+a22ZX2+ap2ZXpFp=a1mZX1+a2mZX2+apmZXp其中 a1i,a2i,ap

7、i(i=1,m)为 X 的协方差阵的特征值多对应的特征向量,ZX1,ZX2,ZXp 是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响注:本文指的数据标准化是指 Z 标准化。A=(aij)pm=(a1,a2,am,),Rai=iai,R 为相关系数矩阵,i、ai是相应的特征值和单位特征向量,12p0。进行主成分分析主要步骤如下:1.指标数据标准化(SPSS 软件自动执行);2.指标之间的相关性判定;3.确定主成分个数 m;4.主成分 Fi表达式;5.主成分 Fi命名;(3)数据采集1 时间

8、序列-人流量的散点图表 12 日本爱知世博会人流量及其相关数据(4)主成分分析的结果首先我们用 SPSS 软件对数据进行主成分分析,得到能充分反应原信息的无相关的较少的综合指标:表 2表 3表 4表 5表 6数据结果分析:1 在表 2 显示了该分析从每个原始变量中提取的信息,我们可以看到,出了天气 W 信息损失较大外,主成分几乎包含了原始变量的 70%左右。2 从表 3(解释的总方差)显示了各主成分解释原始变量总方差的情况,我们可以知道第一主成分和第二主成分包括了原始变量的 75%以上。表 4(碎石图)显示了第一主成分和第二主成分的特征值大于 1,其他的都小于 1。故我们只提取两个主成分。3

9、从表 4(成分矩阵)我们可以看出日数 T,时间序列二次 TT,时间序列三次 TTT 和世博阶段 S 主要影响第一主成分。节假日 J,星期几 A 和天气 W 主要影响第二主成分。4 从表 5 中,我们可以看出(因子得分系数矩阵表)各原始变量表示主成分的系数信息。上面表格中的系数是将原始变量标准化后表示主成分的系数,由因子得分系数矩阵得到:F1=0.218X1+0.181X2+0.22X3+0.201X4+0.908X5+0.982X6+0.979X7F2=0.032X1-0.045X2+0.824X3-0.576X4+0.054X5+0.027X6+0.030X7(注:X1,X2,X3,X4,X

10、5,X6,X7分别表示日数 T 节假日 J,星期几 A,天气 W,世博阶段S,时间序列三次 TTT,时间序列二 TT。)所以影响世博人流量的综合指标中,我们可以发现,T,TT,TTT,S,这些都是与时间有关,我们不妨称为时间因子。则第一主成分主要是时间因子。而影响第二主成分的主要是与游客的忙与闲有关,故我们可以认为第二主成分主要是闲暇因子,即第一主成分为时间因子,第二主成分为闲暇因子。3、回归分析和模型2用多元线性回归的方法来分析各个因素对世博人流量的影响,我们不妨设 P=F(T,TT,TTT,S,J,A,W)。下面用软件 SPSS 分析。其数据如下:表 7表 8表 9表 10表 11表 12

11、结果说明:1 表 7 显示变量引入办法为全部引入法。2 表 8 显示模型中的回归系数,常数及 t 检验结果,从表中可以看到 t 检验的 P 值:T,J,A,W,TTT,TT 的回归系数均小于 0.05.只有世博阶段的回归系数 P=0.1670.05.所以变量世博阶段 s 与 P 直接不存在线性回归关系,这可能与样本单位数韧少有关。从新引入自变量 T,J,A,W,TTT,TT 判定它们与 P 之间的线性回归关系。3 表 9 显示的是引入 T,J,A,W,TTT,TT 这 6 个变量。4 表 10 显示复相关系数 R=0.897,可决系数 R2=0.805 估计标准误 S=20811.37。5 表

12、 11 显示了方差分析的结果,检验统计量 F=122.133,P=0.00 小于 0.05。故可以认为整个线性回归方程是显著的。6 表 12 显示各回归系数对应的 t 检验的 p 值都小于 0.05。故可认为这些变量与 P存在线性回归关系,且线性回归模型为:P=13976.319+3435.330T+13393.610J+23198.831A+6526.898W+0.157TTT-41.810TT。(二)问题二建模及求解1、模型分析及建立从总体中顺序抽取 180 个样本,180 依次编号形成一个时间序列。总体的最后 5 个数据用于检验。表 1:0q的时间序列序列号 t123179180游客人数

13、0q430234611556597222934203514图 1序列 q0的自相关和偏相关图图 2序列 q1的自相关和偏相关图Dependent Variable:D(NO)Method:Least SquaresDate:05/22/11Time:21:09Sample(adjusted):3/27/2005 9/20/2005Included observations:178 after adjustmentsConvergence achieved after 20 iterationsMA Backcast:3/26/2005VariableCoefficientStd.Errort-

14、StatisticProb.AR(1)0.4705840.1048694.4873380.0000MA(1)-0.8635020.061556-14.027940.0000R-squared0.165669Mean dependent var884.2697Adjusted R-squared0.160929S.D.dependent var24952.68S.E.of regression22856.86Akaike info criterion22.92306Sum squared resid9.19E+10Schwarz criterion22.95881Log likelihood-2

15、038.153Hannan-Quinn criter.22.93756Durbin-Watson stat1.769765Inverted AR Roots.47Inverted MA Roots.86图 3ARMA(1,1)模型图数据分析:1 图 1 显示运用 eviews 软件进行,进行平稳性检验。对0q(原始游客人数)平稳性检验,结果为不平稳。2 图 2 显示偏相关系数在 k=1 后迅速趋近于 0,所以 p=1;自相关系数在 k=1 之后也迅速趋近于 0,q=1。将人数 q 作一阶差分转换后继续检验平稳性,结果平稳。3图 3 建 立 模 型 ARMA(1,1),模 拟 时 间 序。D(N

16、O)=0+AR(1)=0.470584118982,MA(1)=-0.863501953543,BACKCAST=3/27/2005,ESTSMPL=3/27/2005 9/20/2005为人流量一阶差分的预测模型。2、模型检验(可行性检验)。图 4 ARMA(1,2)模拟残差相关图图 5ARMA(1,1)模型拟合图数据分析:1 对残差序列进行白噪声检验,可以看出 ACF 和 PACF 都没有显著异于零,Q 统计量的 P 值都远远大于 0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。常数和滞后一阶参数的 P 值都很小,参数显著;因此整个模型比较精简,模型较优。所以此预测模型是

17、可行的!六、模型评价模型一,对于主成分的分析,设法将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标,同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来指标的信息。避免了因原始指标间存在相关性所造成的聚类偏差,并且能够很好的将这些因子进行分类,更好的说明影响人流量的主要因子。此模型的优点还有引进了虚拟变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为 0 或1。引入虚拟变量可使线形回归模型变得更复杂,但对问题描述更简明。由于一些因子的反映的信息比较多,如天气 W 中,存在天气的类型较多,多云,雨,多云-雨,晴雨等等。如何更加科学合理得对这

18、些因子进行数值虚拟化,全面的精确反映全部的信息是此模型应该改正之处。此模型在处理这些问题是存在一定的缺陷,只是很粗略的将某些因子虚拟成两种或三种类型。模型二,采用线性回归的方法求解回归模型,具有很强的灵活性和逻辑性。在模型一中我们就根据日数-人流量的散点图,大概知道人流量和日数存在 三次函数的关系,故我们合理地将时间序列的二次,三次引入到这回归求解中,使复杂的多元非线性回归变成简单的线性回归,降低了求解难度。合理灵活剔除世博阶段 s 这一与人流量不存在线性关系的变量,最终得出人流量与其他六个因子的线性回归关系。模型新颖而且极具可行性。模型三,运用时间序列很好地拟合出人流量与日数的关系。其优点就

19、是经过多次差分,并检验其平稳性。这样的拟合性更强,更具预测效果。由于差分阶此越多,其求求解的过程就越复杂,这也是此模型的缺点,如能更加简洁,更加简单的方法那就更好了。对于可行性的检验,运用残差相关图和模型模拟图来检验真实值与预测值之间的误差大小,这是方法检验准确,快捷。能很好的检验预测的效果,且具可行性。七、附录1、参考文献:1.潘省初编著,计量经济学第一版,中国人民大学出版社,20042.张波 张景肖编著,应用随机过程第一版,北京大学出版社,20043.谢识予 朱弘鑫编著,高级计量经济学第一版,复旦大学出版社,20054.张文彤编著,SPSS 统计分析基础教程第一版,高等教育出版社,20045.赵建新编著,计量经济学第一版,苏州大学出版社,2004

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁