《毕业设计-基于主成分分析的企业运营评价数学建模优秀论文.doc》由会员分享,可在线阅读,更多相关《毕业设计-基于主成分分析的企业运营评价数学建模优秀论文.doc(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、题 目 基于主成分分析的企业运营评价 摘要本文研究了该后勤集团的多项指标,运用主层分分析法作综合分析。并且建立指标与时间的回归模型,分析出这些指标表现优劣的年份以及未来五年走势。问题一,要求对该后勤集团的经济效益、发展潜力以及内部运营情况等指标作综合分析。将处理后的数据进行主成分分析,得出评价结果。为了解决各细化指标单位及数值的差异,对数据进行标准化处理。将处理后的数据进行主成分分析,最后用每个主成分的方差贡献率来作为权重计算综合得分,综合公式如下:由此公式得出评价结果。分析结果可以知道这几年经济效益最好的是2009年,最差的是2001年。问题二,在问题一数据分析的基础上指出这些指标表现优劣的
2、年份以及未来五年走势。每个指标是随着时间的变化而改变的,因此可以建立指标与时间的回归模型。经济效益指标与时间的回归方程为:因此,由上函数关系和拟合图可知经济效益指标未来三年先上升然后开始下降。即2010年经济效益的综合得分为3.627,2011年为3.233,2012年为2.307,此后几年均为下降趋势。关键字 主成分分析法 指标与时间的回归模型 方差贡献率一、问题的背景与重述1.1问题背景高校后勤工作是高校一切工作正常运行的保障和基础,直接关系到高校的稳定和改革发展在进一步推进高校后勤社会化改革的同时,必须把做好高校后勤工作。提高高校后勤服务育人和管理育人水平作为高校重点工作之一。随着后勤社
3、会化改革进程的加快,高校师生对后勤服务和管理水平的要求越来越高,高校后勤本身也需要不断调整,使自己的服务管理水平符合科学化、程序化、专业化之要求。最近几年高校规模的扩大,给学生社区和食堂管理带来了新的课题。综上所述,非常有必要分析后勤集团的各项指标发展情况,从过去的发展中借鉴经验,从而建立科学高效的发展计划,促进高校后勤企业在创造社会效益的同时创造经济效益,为高校改革发展,做出更大贡献。1.2问题的重述高校后勤集团是高等教育体制改革的产物,在经济上自负盈亏,独立核算。某高校后勤集团为了研究公司运营绩效走势,详细了调查了2000年至2009年的运营指标。包括经济效益指标、发展能力指标、内部运营指
4、标以及客户满意度指标。每个指标下面又有细化指标,且给出了我们具体调查结果,见题目中表1、表2、表3以及表4。要求:分析上述数据,并通过数学建模知识回答下述问题。1、 分别对该后勤集团的经济效益、发展潜,力以及内部运营情况等指标作综合分析;2、并且指出这些指标表现优劣的年份以及未来五年走势。二、问题分析2.1对问题一的分析题目除了给出一些细化指标外还给出了客户满意度指标。而餐饮企业客户的满意指标与其运营情况有很大关系,所以把该指标的影响考虑进去。从新的指标体系中不难发现,指标的个数较多,而且指标之间还存在一定的相关性,使得观测数据在一定程度上反映的信息有所重迭。因此,采用多元统计分析中的主成份分
5、析法来完成综合评价。首先,用因子分析法对满意度进行综合评分,得到每年的满意度分数。把满意度加入每个指标的细化指标得到新的评价体系。为了解决各细化指标单位及数值的差异,对数据进行标准化处理。将处理后的数据进行主成分分析,得出评价结。2.2对问题二的分析 问题二要求对每项指标的未来五年的发展做一个预测。根据问题一分析的结果,可以看出每个指标是随着时间的变化而改变的,因此可以考虑建立指标与时间的回归模型。通过回归方程对未来五年做一个预测。从而可以清楚的看出企业在五年中的发展情况。三、模型假设1假设所有数据真实有效;2未来企业环境不会出现太剧烈的变化;3假设后勤集团在食堂上的运营情况,代表整个集团;4
6、假设未来五年发展不受外界环境影响。1四、符号说明为了便于问题的求解,我们给出以下符号说明:(其他未说明的符号在文中第一次出现时会做详细的说明。)符号说明第i个年的第j个指标第j个指标均值第j个指标标准差第个指标与第个指标的相关系数第个主成分的方差贡献率为各量标准化数据五、模型的建立与求解5.1模型一的建立与求解5.1.1数据的预处理(1)因子分析法对满意度进行综合评分因子分析是将多个变量浓缩为少数几个因子,以再现原始变量与因子之间的相关关系。这些因子能够反映原有众多变量的主要信息。顾客的满意程度为主观愿望指标,带有一定的模糊性同时也与后勤消费人数有复杂关系。将二者合并一起做因子分析便可得出支配
7、顾客满意度潜在因素。形成新的综合评价指标。表1 因子提取结果表成分特征值公因子17.83公因子20.655公因子30.237下表给出了每个因子的得分,用每个因子特征值的方差贡献率对各因子得分进行加权,即可得出各年的加权综合评分,计算公式为:表2综合评价表年份公因子1公因子2公因子3综合评价2000-3.34338-0.915610.696986-2.324542001-2.73517-1.176710.083387-2.431142002-2.796450.208317-0.834-3.32992003-2.442240.865791-0.26973-2.380222004-0.57770.8
8、45652-0.01706-0.4461920050.703260.4811820.0101170.70522120060.9328110.3838990.1989871.09911320072.6464240.7308580.6494143.12910420083.289584-0.399480.1147713.07056920094.322866-1.0239-632873.18035.1.2数据标准化出理将满意度综合指标加入以后对新的评价样本进行数据标准化处理,假设进行主成分分析的指标变量有m个:,共有n年。第i个年的第j个指标为。将各指标转化成标准指标。公式为:,即,为第个指标的样本均
9、值和样本标准差。下式为标准化指标变量,表示第j个指标均值,表示第j个指标标准差。处理结果见附录。5.1.3模型一的建立经对济效益指标、内部运营指标和发展潜力指标建立评价模型,采用主成分分析方法3进行综合评价。主成分分析方法具有很好的降维处理技术,能将多个指标化为几个不相关的综合因子,并且综合因子变量能够反映原始指标变量的绝大部分信息,能较好地解决多指标评价的要求。通过主成分分析、选择个主分量,以每个主分量的方差贡献率作为权数,构造综合评价函数: (1)其中为第个主成分的得分.当计算出每个指标的第主成分得分后,可由主成分得分衡量每个企业在第个主成分所代表的经济效益方面的程度及地位.当把个主成分得
10、分代入(1)式后,即可计算出每个企业综合评价函数得分。以这个得分的大小排序,即可排列出每个企业经济效益名次.综合评价函数值越大,综合经济效益越好.1、计算相关系数矩阵相关系数矩阵,式中是第个指标与第个指标的相关系数。2、计算特征值和特征向量计算相关系数矩阵的特征值,及对应的特征向量,。其中,是由特征向量组成的个新的指标变量。式中是第1主成分,是第2主成分,是第主成分3、征值的方差贡献率和累积贡献率。称为主成分的方差贡献率。为主成分的累积贡献率。当特征值小于1或累积贡献率大于85%时,则选择前个指标变量作为个主成分,代替原来个指标变量,从而可对个主成分进行综合分析。综合公式如下:其中为第个主成分
11、的方差贡献率,根据综合得分值就可进行价。5.1.4模型一的求解1、效益指标用主成分分析法,把经济效益的六个指标看为六个变量,用分析六个变量之间的相关系数,并通过进行数据处理,得出其相关系数矩阵,如表3所示。表3 相关系数矩阵经营收入年终节余返还工资上缴利润人均收入综合评价经营收入1.0000.9420.8660.9421.0000.962年终节余0.9421.0000.9331.0000.9420.916返还工资0.8660.9331.0000.9330.8660.926上缴利润0.9421.0000.9331.0000.9420.916人均收入1.0000.9420.8660.9421.00
12、00.962综合评价0.9620.9160.9260.9160.9621.000表3为六个变量的相关系数矩阵,其中全部数据在0.8以上,结果验证啦分析中的假设,说明它们之间的相关性非常高,如果直接用于分析,可能会带来严重的共线性问题导致结果重叠。因此利用主成分分析提取出主要信息,然后使用提取出的主成分代替原变量进行分析,就可以避开原变量的共线性问题。通过分析相关系数矩阵特征向量的方差贡献率,得到下表:表4 总特征值表初始特征值提取平方和载入合计特征值的贡献率%累积贡献率%合计特征值的贡献率%累积贡献率%15.68494.72694.7265.68494.72694.72620.1903.174
13、97.90030.1161.93399.83340.0100.167100.00056.379E-161.063E-14100.00061.154E-161.923E-15100.000表4为整个分析中核心的部分:它把主成分按照特征根从大到小的次序排列,可见第一个主成分的特征根为5.684,它解释了数据总变异的94.726%,这说明该成分的解释力度足够大。这六个变量只需要提取出第一个变量作为主成分即可。另一方面,下图给出了特征根的碎石图:图1碎石图该图中,具有较强解释能力的因子一般在图中表现为较大的斜率,从上图可以看出第一个因子在非常陡峭的斜率上,后面的因子斜率开始变平缓,因此选择第一个因子为
14、主成分。为了确定每个变量的线性组合系数,还要计算主成分对应的的变量特征值,结果如下表:表5 特征向量表第一主成分特征向量经营收入年终节余返还工资上缴利润人均收入综合评价0.440.440.420.440.440.44根据表5可以得到主成分的表达式其中为各量标准化数据。以第一个主成分的贡献率为权重,构建主成分综合评价模型:可以得到各年份后勤集团的经济效益指标的综合评价值以及排序结果如下:表6 综合评价表年份2000200120022003200420052006200720082009评价得分-3.07098-3.03762-2.63964-1.2488-0.315370.6247161.163
15、0362.3357052.8528953.336059排名10987654321分析结果可以知道这几年经济效益最好的是2009年,最差的是2001年。5.2模型二的建立与求解5.2.1未来五年走势预测根据主成分分析的结果,可知第一主成分能够很好地解释原始的各项指标,所以,用他的发展情况推断经济效益的发展。用对经济效益指标的年份与第一主成分得分的得分进行曲线回归分析,得到曲线模型拟合曲线。图2 曲线模型拟合曲线可以看出,图中个出了曲线模拟拟合曲线及观测值(即各年得分)的散点图。从图中可以直观的看出三次模型拟曲线与原始观测值拟合度比线性好,因此用三次模型作为预测曲线。另外还给出了模型汇总和参数估计
16、值表7 模型摘要和参数估算方程式模型摘要参数估计值R 平方Fdf1df2显著性常量b1b2b3线性(L)立方(U).982425.46718.000-4.398.800-.014.993297.30436.000-3.127-.310.238可以看出3个回归曲线中,三次模型的F值最大同时相伴概率值小于0.05,也从数据上说明了自变量对因变量有显著影响。此外还个出了该曲线回归方程中常量及各系数的估计值。因此经济效益指标与时间的回归方程为因此,由上函数关系和拟合图可知经济效益指标未来三年先上升然后开始下降。即2010年经济效益的综合得分为3.627,2011年为3.233,2012年为2.307,
17、此后几年均为下降趋势。2、发展能力指标和内部运营指标根据主成分分析结果(见附录),选取两个主成分对发展能力进行综合评价,选取一个主成分对内部运营指标进行综合评价。具体过程同经济效益指标的处理方法,最终得出各年份后勤集团在发展能力指标和内部运营指标下的表现优劣情况,排名情况如表5 综合评价表年份2000200120022003200420052006200720082009发展能力-0.19102-0.1975-0.161710.0440870.2048790.3946290.4097560.6739770.6442910.657226排名91087654132内部运营-2.49917-2.29
18、19-2.18391-1.28122-0.373910.8491491.2923792.0173062.1993182.271954排名10987654321由上表可知各从2000年到2009年力指标和内部运营指标下的表现逐渐优化。用同样的的方法对内部运营和发展能力指标进行预测。用对其综合指标和时间进行曲线拟合,曲线模型拟合图如下:模拟曲线图 1 模拟曲线图 2可以直观看出三次模型的拟合度最好,根据模型汇总和参数估计值见附录,其回归方程为:发展能力内部运营由函数关系和时间序列拟合图可知内部运营和发展能力标未来五年是呈下降趋势的。六、模型评价与改进6.1模型的优缺点分析6.1.1.模型的优点1、
19、模型运用的主成分分析法建立了综合评价函数函数,而避免了现行评价方法中人为确定权数的却陷。对于一个指标体系复杂的评价系统,这种方法具有普遍适用性;2、主成份分析法不仅可用于主要指标的选择,还可以用于分析影响企业经济效益的主要因素,作为管理者的决策依据,这对于企业;3、可消除评价指标之间的相关影响。因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标之间相关程度越高,主成分分析效果越好。可减少指标选择的工作量;4、对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容些;5、当评级
20、指标较多时还可以在保留绝大部分信息的情况下少数几个综合指标代替原指标进行分析主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前后方差较大的几个主成分来代表原变量,从而减少了计算工作量。6.1.2.模型的缺点1、预测模型的回归方程4是以时间序列为自变量的,而实际上企业的发展与时间没有直接关系。这里的回归拟合5只是从过去的数据中模拟出未来发展的趋势,因此模型对数据太少的实际问题预测误差较大;2、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释;3、主成分的解释其含
21、义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。七、模型的推广本文主要运用了主层分分析法来解决问题。这在日常生活中的各个领域都能广泛应用。主层次分析法不仅能够对济效益指标、内部运营指标和发展潜力指标进行综合评价。还可以用于水环境质量评价中,由于水质系统是由各种污染指标变量组成的复杂系统,各个因子之间有着不同程度的相关性。主成分分析法将多因子纳入同一系统进行定量化研究,是比较完善的多元统计分析方法。近年来,主成分分析法在水质评价中被广泛研究与应用,并取得了不少成果。主层分分析法还可以应用于地区产业竞争力评价。主成分分析法是客观赋权法的主要方法之一,通
22、过降维的方法消除指标间的信息重叠。它能克服均值法掩盖竞争力内部各构成要素相对作用不同的事实。因此采用主成分分析法对地区产业竞争力进行综合评价。而且现阶段我国中药作为一种新的分析方法,主成分分析法已普遍被用于中药质量标准研究数据的统计分析中,通过对数据降维、变量提取与压缩、确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选。主成分分析法的引入对鉴别和评价中药材及其饮片的质量以及中药种质资源的优选,具有重要的科学价值和实际意义。九、参考文献1 杨小平,统计分析方法与应用教程,清华大学出版社,2008;2主成分与因子分析的异同比较及应用 ,
23、王芳,理论探讨,14-17 ,,2003年第5期;3数学模型,姜启源 ,谢金星,叶俊编 ,4版, 北京高等教育出版社,2011.1;4高辉, 基于多个回归方程拟合的数据挖掘方法研究与设计D.东北师范大学,2012;5吕学峰,张光超,任志鹏.,基于的顶板稳定性因素多元回归分析J. 现代矿业,2014,12:143-144。附录 表1年份总资产周转率人均产值正式员工占总员工比例人均服务人数综合评价(元)(人)2000 -0.81 -1.12 1.63 -1.53 -0.9162 2001 -0.81 -1.12 1.41 -1.19 -0.9577 2002 -0.81 -1.26 0.50 -1
24、.37 -1.3079 2003 -1.04 -0.60 0.42 0.00 -0.9379 2004 -1.04 -0.29 0.20 0.92 -0.1844 2005 0.62 0.32 -0.41 0.45 0.2641 2006 0.38 0.69 -0.56 1.10 0.4176 2007 1.56 0.88 -0.94 0.17 1.2084 2008 1.09 1.14 -1.09 0.70 1.1856 2009 0.85 1.35 -1.16 0.77 1.2284 表2年份资本积累率营业增长率发展基金占年终结余比人员素质评价综合评价2000-0.0840.02400.2
25、4-0.9162 2001-0.0910.02700.26-0.9577 2002-0.0370.0630.30.28-1.3079 20030.0260.4370.30.31-0.9379 20040.0430.20.30.32-0.1844 20050.0620.3740.370.340.2641 20060.0590.1590.410.360.4176 20070.0740.1810.530.381.2084 20080.0650.0960.510.391.1856 20090.0680.0830.510.41.2284 表3年份资本积累率营业增长率发展基金占年终结余比人员素质评价综合评
26、价2000-0.0840.02400.24-0.9162 2001-0.0910.02700.26-0.9577 2002-0.0370.0630.30.28-1.3079 20030.0260.4370.30.31-0.9379 20040.0430.20.30.32-0.1844 20050.0620.3740.370.340.2641 20060.0590.1590.410.360.4176 20070.0740.1810.530.381.2084 20080.0650.0960.510.391.1856 20090.0680.0830.510.41.2284 附录 表1 内部运营解释总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %14.36887.35887.3584.36887.35887.3582.4969.92297.2803.0941.88399.1634.030.60899.7715.011.229100.000表2 内部运营解释总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %14.36887.35887.3584.36887.35887.3582.4969.92297.2803.0941.88399.1634.030.60899.7715.011.229100.00012