《应用多元统计分析论文.pdf》由会员分享,可在线阅读,更多相关《应用多元统计分析论文.pdf(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用多元统计分析论文Revised on November 25,2020山东省十一城市综合实力统计分析山东省十一城市综合实力统计分析摘摘要要:本文根据中国城市经济发展研究中心提出的城市综合经济实力和区域的概念,并利用 2009 年各城市社会经济发展状况的截面数据,就山东省11 市的经济数据进行分析。首先建立了评价的指标体系,其次,分别采用主成分分析法和聚类分析法对山东省根据行政区域划分的 11 个市的综合经济实力进行了全面的评价和比较,并在此基础上提出了促进山东各市经济协调发展、共同进步的相关措施。关键词:关键词:城市经济主成分分析聚类分析一、引言一、引言在区域经济发展中,城市处于核心和龙头
2、的地位,提高城镇化水平、加快城市化进程是解决当前和未来一系列问题的关键。山东经济发展显示出不平衡的态势,鲁东的少数几个城市 GDP 几乎占据全省三分之二11。很显然,山东省各市的城市化水平也存在显着差异,青岛、济南等的城市化水平始终走在全省乃至全国前列,泰安和滨州则相对落后。随着黄河三角洲经济一体化进程的加快,山东作为沿海省份必须清楚的看到发展差异并找出差异形成的原因,通过核心城市的优先发展带动区域经济和社会的快速发展,是现实提出的急需解决的问题。为此,本文在参阅相关文献的基础上,根据中国城市经济发展研究中心中国城市经济发展研究中心提出的城市综合经济实力以及区域的概念,根据区域的行政划分,从山
3、东省 11 个市出发,利用 2009 年各城市社会经济发展状况的截面数据,首先建立了评价指标体系,其次,分别采用主成分分析法和聚类分析法对山东省 11 个市的综合经济实力进行了综合的评价和排位,并在此基础上提出了促进山东省各市经济协调发展、共同进步的相关措施。面对区域差距带来的影响,山东省应该继续加大固定资产投资的力度,在制定区域发展策略时应该加强区域间的交流和合作,促进各地区优势互补,共同发展。同时,也要积极鼓励引进外资和开拓国际市场,加快与国际经济的接轨和融合。另外,还要继续扩大中心城市的规模,在积极建设环渤海产业带的同时,不断加强鲁西和鲁中产业带的建设,提高中心城市的综合竞争力,扩大其对
4、周围地区的辐射和带动作用,最终逐步缩小区域差距,促进各地区和谐发展、共同繁荣。城市综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社会中的地位和影响力。从此定义可以看出,评价城市综合实力应使用城市经济总量,它应该包括国内生产总值、固定资产状况、社会消费水平、外贸出口水平、交通运输能力、通讯设施状况、地方财政实力、人才科技状况及社会医疗保障水平等统计指标22。二、山东省各地区的模型经济分析二、山东省各地区的模型经济分析本文选取了以下 10 项指标来构建评价体系。X1:人均生产总值(元);X2:地区生产总值(亿元);X3:财政收入占 GDP 的比重(%);X4:第三产业产值比重(%);X
5、5:全社会固定资产投资总额(亿元);X6:社会消费品零售总额(亿元);X7:出口总额(亿元);X8:货运总量(万吨)(铁路+公路+水运);X9:每万人中科技人员数(人/万人);X10:每万人医院卫生院床位数(个/万人)11。本文以山东省 11 个市作为样本,选用上述 10 个评价指标,则评价样本矩阵为表 1。表表1 1 11 11个市的变量矩阵个市的变量矩阵城市X1X2X3X4X5X6X7X8X9X10青岛济南济宁淄博烟台潍坊日照威海泰安东营滨州604145677143129368294823646936304963281326076342442205322536166041020514400
6、3622山东省统计局山东省统计局.山东省统计年鉴山东省统计年鉴2010M.2010M.中国统计出版社中国统计出版社1 1、主成分分析法、主成分分析法主成分分析法是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。主成分在变差信息量中的比例越大,它在综合评价中的作用就越大33。以两个指标来衡量n个样本的简单情况为例。n个样本之间的变量信息用离差平方和表示,则综合评价时的总变差为:将原始指标数据进行标准化(这里标准化以后的变量均值为0,方差为1)。由于原始数据有不同的含义,且量纲不同,这样经过标准化以后使数据集中每个变量的变
7、化范围大体相同,这样再进行分析具有很强的客观性33。标准化以后的数据用Z01,Z02,Z03Z10表示(如表2)。设有n个样本,p项指标,可得数据矩阵X(Xij)n p,i 1,2 ,n表示n个样本,j 1,2,p表示p个指标,xij表示第i个样本的第j项指标值。用Zscore法33对数据进行标准化变换:(xij)i1n式中xjnS2j(xi1nij xj)2(n 1)i 1,2,nj 1,2,p表表2 2 原始数据标准化后的结果原始数据标准化后的结果Z01Z02Z03Z04Z05Z06Z07Z08Z09Z10对标准化后的数据进行主成分分析1表表3 3 特征根和方差贡献率表特征根和方差贡献率表
8、Total Variance ExplainedTotal Variance Explained(总方差解释总方差解释)Initial EigenvaluesInitial Eigenvalues(初始特征值)(初始特征值)TotalTotalComponentComponent(成份)(成份)(合计)(合计)1 12 23 34 45 56 67 78 89 91010.772.772.300.300.211.211.093.093.069.069.014.014.002.002.001.001%of Variance%of VarianceCumulative%Cumulative%(方差
9、的(方差的%).929.929.690.690.136.136.018.018.008.008(累计(累计%)TotalTotal(合计)(合计)Extraction Sums of Squared LoadingsExtraction Sums of Squared Loadings(提取平方和载入)(提取平方和载入)%of Variance%of Variance(方差的(方差的%)Cumulative%Cumulative%(累计(累计%)从表3可以看出,前2个主成分的累计方差贡献率达到%(85%),选择2个主成分已足够。且经过主成分分析后,这2个主成分是相互独立的,这对分析带来很大的客
10、观性。表表4 4 因子载荷阵因子载荷阵Component MatrixComponent Matrixa aVAR00001VAR00001VAR00002VAR00002VAR00003VAR00003VAR00004VAR00004VAR00005VAR00005VAR00006VAR00006VAR00007VAR00007VAR00008VAR00008VAR00009VAR00009VAR00010VAR00010ComponentComponent1 1.964.964.870.870.933.933.431.431.980.980.912.912.946.946.847.847.
11、868.868.744.7442 2.095.095.122.122.787.787.259.259.194.194根据表4可得这2个主成分的表达式为;Y1=*X1+*X2+*X3+*X4+*X5+*X6+*X7+*X8+*X9+*X10Y1=*X1+*X2+*X3+*X4+*X5+*X6+*X7+*X8+*X9+*X10Y2=*X1-*X2+*X3+*X4-*X5+*X6-*X7+*X8-*X9-*X10Y2=*X1-*X2+*X3+*X4-*X5+*X6-*X7+*X8-*X9-*X10从上述表达式可看出第2主成分在第4个指标上的系数相对较大,在第9个、第10个2个指标上的权重为负,其含义
12、是有第三产业越大和只有较少的知识分子、较少的病床将获得较大的数值。第2主成分排序,结果见表5.表表5 5名次12345678910112 2、聚类分析法、聚类分析法主成分分析法城市青岛济南烟台潍坊济宁淄博日照东营威海泰安滨州聚类分析(Cluster Analysis)就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理44。首先对数据进行正规化,计算公式为:XiXi=(Xi-Xmin)/(Xmax-Xmin)=(Xi-Xmin)/(Xmax-Xmin)公式中XiXi为正规化后的值,XiXi为原值,Xmax
13、Xmax为最大值,XminXmin为最小值。进行正规化后,0 0 XiXi1 1。所有参与聚类分析的指标数据见下表。表表6 6 正规化后的变量正规化后的变量城市青岛济南济宁淄博烟台潍坊日照威海泰安东营滨州10101010101010101010根据上表的数据,利用统计软件SPSS对山东的11个市进行聚类分析,得出如下结果(见表6)。表表6 6 11 11市的聚类分析结果市的聚类分析结果Agglomeration ScheduleAgglomeration ScheduleCluster CombinedCluster Combined(群集组合)(群集组合)StageStage阶阶1 12 2
14、3 3Cluster 1Cluster 1(群集(群集1 1)8 83 37 7Cluster 2Cluster 2(群集(群集2 2)10105 58 8CoefficientsCoefficients(系数)(系数).099.099.187.187.279.279Stage Cluster First AppearsStage Cluster First Appears(首次出现阶群集)(首次出现阶群集)Cluster 1Cluster 1(群集(群集1 1)0 00 00 0Cluster 2Cluster 2(群集(群集2 2)0 00 01 1Next StageNext Stage
15、(下一阶)(下一阶)3 35 57 74 45 56 67 78 89 910109 93 31 13 36 63 31 111114 42 27 79 96 63 3.413.413.547.547.765.765.867.8670 02 20 05 50 07 76 60 00 00 03 34 48 89 98 87 710109 99 910100 0说明:合并前从111依次表示青岛、济南、济宁、淄博、烟台、潍坊、日照、威海、泰安、东营、滨州。1111市经济区域划分聚类树状图市经济区域划分聚类树状图RescaledDistanceClusterCombineRescaledDistan
16、ceClusterCombineCASE05CASE05LabelNum+-+-+-+-+-+LabelNum+-+-+-+-+-+威海威海88东营东营1010日照日照77济宁济宁33烟台烟台55淄博淄博44泰安泰安99滨州滨州1111潍坊潍坊66青岛青岛11济南济南22从聚类分析的过程可得如下结论。威海,东营同属北部地区,相似系数最大,最早聚合,明显为一类,然后两者聚为一类后又与东南地区的另一个城市日照聚为新的一类,这从侧面反映出了山东东部地区的经济存在很大程度上的相似性;济宁和烟台在发展上都应加强第三产业,发展程度也较相近,划为一类,两者在归为一类后于淄博合并成为新的一类;泰安,滨州的经济
17、发展都比较落后,所面临的问题也最多,相似系数也比较大,因此归为一类;而潍坊最为特殊,从经济发展水平到产业结构等于其他城市差别有点大,难以成为一类;最后济南和青岛作为是对经济发展最好的两个城市归为一类。三、模型分析和结果三、模型分析和结果评价一个地区的综合经济实力并进行比较,经济指标的选取非常重要,要有代表性地表现出城市的综合经济状况。由于部分指标间有很强的相关性,因此在选取时不必选取过多的指标55。通过比较、筛选,最后选取10个指标,获得了较准确满意的结果。采取了两种评价分析模型,每种分析各有特色。就单一评价分析来说,评价结果虽然有些差异,但综合来看呈现出一致性,较好的说明了山东地区间综合经济
18、实力的排名。综合起来看,相对发达和落后地区的差异还是比较大的,说明山东各市经济发展水平不平衡,需要采取相应政策和措施,实现全省各县市经济的快速、协调发展。首先,济南作为省会城市,是山东省政治、经济、文化的中心。青岛,华东地区重要的工业基地和对外贸易口岸,黄河三角洲东翼经济中心,排名第一。这两个城市的得分远远高于其他城市,说明城市规模的大小和城市化程度的高低与经济增长有直接的关系。济南经济实力非常雄厚,但企业盈利能力有待加强。而青岛则是工业基地、加工基地和物资集散地,能大量吸引技术应用型人才,具有很大的发展潜力,在发展工业的同时还要更加重视第三产业的发展。烟台,潍坊,济宁,淄博得分比较相近,存在
19、问题却各异。济宁要注意扶持农业的发展,利用其旅游资源带动第三产业的进步,采取多种手段吸引人才,要充分意识到人力资本对改善地区经济差距的作用;淄博除了注意调整产业结构和发展教育外,还要注意固定资产投资的回报问题;烟台要加大财政投入,加强基础设施建设,刺激消费,发展第三产业;潍坊企业盈利能力较差,有待加强。威海,东营是环渤海地区发展比较好的城市,在发展经济的同时要分别注意增加财政投入、刺激消费和吸引人才。日照土地产出率很低,这与该市本身人多地少有关,另外日照劳动生产率不高,说明还要进一步形成规模,以先进技术带动效率提升。泰安,滨州的经济基础相对薄弱,要想全省均衡发展就必须以强带弱,支持省内欠发达地
20、区发展,加大投资和政府间转移支付。欠发达地区要充分利用资源、区位等优势,特别是劳动成本低的优势,承接发达地区的产业梯度转移,建成资源加工型和劳动密集型为主体的。在此,我们再结合文中确定的经济实力判别原则将经济区域做如下分类(见表12)。表 12 各市经济发展情况分类表经济发展程度地市级特发达地区较发达地区青岛、济南烟台,潍坊,济宁,淄博正常发展地区威海,东营,日照欠发达地区泰安,滨州四、参考文献四、参考文献1山东省统计局.山东省统计年鉴2010M.中国统计出版社2欧向军.区域经济发展差异理论、方法与实证山东省为例M.经济科学出版社3苏金明,傅荣华,周建斌,张莲花.统计软件SPSS for Wi
21、ndows实用指南M.电子工业出版社4朱建平.应用多元统计分析.科学出版社5何晓群.现代统计分析方法与应用M.中国人民大学出版社学学号号经济管理学院经济管理学院学学 年年 论论 文文题题目目山东省十一城市综合实力统计分析专业班级专业班级2009 级统计学一班学生姓名学生姓名崔泽利指导教师指导教师杨立勋职职称称教授2012年3月22日经济管理学院学年论文成绩评定表学院:经济管理学院班级:2009级统计学一班学生姓名:崔泽利学号:优秀良好中等及格项目分值(100%x90%)(90%x80%)(80%x70%)(70%x60%)参考标准参考标准参考标准参考标准写作态度认真,研 写作态度比较究作风科学
22、严谨。认真,研究作保证论文完成时间 风严谨良好,15并按任务书中规定 能按期圆满完的进度开展各项工 成任务书规定作的任务写作态度尚好,遵守组织纪律,保证论文时间,能按期完成各项工作写作态度尚可,能遵守组织纪律,能按期完成任务不及格(x60%)参考标准写作马虎,纪律涣散,工作作风不严谨,不能保证论文时间和进度调查调研方案基本不可行评分写作态度调查调研论证能力调查调研方案可调查调研方案调查调研方案行,开展和取得的 可行,开展和可行,开展和20效果很好取得的效果好取得的效果较好30论点鲜明,论据确 论点正确,论凿,论文表现出对 据可靠,对实观点正确,论述有理有据,调查调研方案基本可行,取得了一定的效
23、果观点正确,对实际问题有一基本观点有错误或主要材料实际问题有很强的 际问题有较强分析能力和概括能 的分析能力和力,文章材料翔实 概括能力,文可靠,说服力很强 章材料比较翔实可靠,有一定的说服力创新有重大改进或独特 有较大改进或10见解,有一定实用 新颖的见解,价值实用性尚可结构严谨,逻辑性 结构合理,符强,层次清晰,语 合逻辑,文章言准确,文字流层次分明,语畅,语言准确、生 言准确,文字25动,完全符合规范 流畅,符合规化要求,书写工范化要求,书整,用计算机打印 写工整,用计成文算机打印成文对实际问题有一定的分析能力,材料能说明观点定的分析能力,材料基本能说明观点不能说明观点有一定改进或新的见解结构合理,层次较为分明,文理通顺,用词比较准确,达到规范化要求,书写比较工整,用计算机打印成文有一定见解观念陈旧结构基本合理,逻辑基本清楚,文字尚通顺,达到规范化要求内容空泛,结构混乱,文字表达不清,错别字较多,达不到规范化要求论文撰写质量及规范化指导教师评定成绩:指导教师签名:年月 日