《spss影响城市人均GDP差异因素的分析.doc》由会员分享,可在线阅读,更多相关《spss影响城市人均GDP差异因素的分析.doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-datespss影响城市人均GDP差异因素的分析我国各地区交通运输业状况的分析研究*影响城市人均GDP差异因素的分析 分 院 城市与环境科学学院 专 业 地理信息系统 姓 名 * 学 号 * 影响城市人均GDP差异因素的分析*(* 城市与环境科学学院, 中国 长春 130000;)摘 要:首先选取2001年全国30个省、市、自治区的11个指标(出生率、人口自然增产率、期望寿命
2、、平均受教育年龄、识字率、人均GDP、城乡居民储蓄年底余额、人均社会消费额、成年劳动力比重、城市人口比重、第三产业人口比重),应用 SPSS统计软件对此进行了主成分分析;然后结合主成分分析结果,利用聚类分析方法得到了全国综合人均GDP发展水平的区域谱系图;最后在此基础上,探讨了全国省际综合发展水平的区域相似性和差异性。研究结果表明:利用主成分分析和系统聚类方法分析中国省际综合交通发展水平,不仅可以克服传统的基于人工选用指标进行综合分析所存在的数据不易处理的缺陷,而且结果准确性高,是对中国城市人均GDP差异影响因素的分析的一种新的尝试。关键词:人均GDP; 主成分分析; 系统聚类; 中国城市-1
3、引言西方国家对城市经济发展状况进行的实证研究已经有很多了。一类是延续了增长经济学的方法对城市进行经济增长因素分析。除去传统的资本、劳动力和技术进步因素外,近年来则更强调与政府和地理环境有关的众多影响因素。另一类由城市最佳规模的研究产生出来,突出了集聚经济对城市经济发展的影响,认为城市规模越大,经济效益越高。人均GDP是一国经济的最大基本面,它是研究产业结构和产业演变趋势的主要解释变量,也是反映疑惑经济发展情况的重要指标,因而无论对经济政策的制定,还是投资分析均具有重要意义。人均GDP则是一国经济的最大基本面,它是研究产业结构和产业演变趋势的主要解释变量,因而无论对经济政策的制定,还是投资分析均
4、具有重要意义。但是,究竟哪些因素会影响人均GDP的变化呢?为了今后能更好地了解、利用本研究选取了2001年中国30个省、市、自治区的11个指标交通,应用 SPSS统计软件对此进行了主成分分析;然后结合主成分分析结果,利用聚类分析方法得到了影响人均GDP水平谱系图;最后结合各地区自身的地理状况和经济发展水平,探讨了影响人均GDP水平的区域相似性和差异性。2全国交通运输业发展的“降维”分析2.1 指标选取 影响人均GDP包括城乡居民储蓄年底余额、第三产业人口比重、城市人口比重、人均社会消费额、平均受教育年限等影响因子。,城市统计年鉴从1998年以后改为公布地级及地级以上城市的数据为主。所以,本文以
5、2001年的全国30个省、市、自治区在1990年代出现了一些把县级市改为地级及以上市市辖区的情况,为了保持历年数据的一致性,将这些县级市与相应的地级及以上市合并计算。为了检验我国城市在不同规模级和不同地域上是否有差别,又将这30个城市按地区分成东部地区城市、中部地区城市、西部地区城市和按规模分成大城市、中等城市、小城市,并对这些评价指标作主成分(降维)分析。 X1出生率(以为单位)。人口出生率反映人口出生的强度,它是一年出生人口数与该年平均人口数之比。 X2人口自然增长率(以%为单位)。人口自然增长率,是反映人口发展速度和制定人口计划的重要指标,也是计划生育统计中的一个重要指标,它表明人口自然
6、增长的程度和趋势 X3期望寿命(以岁为单位)。期望寿命又称平均期望寿命,指0岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下,已经活到X岁年龄的人们平均还有可能继续存活的年岁数。 X4平均受教育年限(以年为单位)。 X5识字率(以%为单位)。 X6人均GDP(元/人)常作为发展经济学中衡量经济发展状况的指标,是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具。将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口(目前使用户籍人口)相比进行计算,得到人均国内生产总值。是衡量各国人民生活水平的一个标准,为了更加客观的衡量,经常与购买力平价结
7、合 X7城乡居民储蓄年底余额(元) X8人均社会消费额(元) X9成年劳动力比重(%) X10城市人口比重(%) X11第三产业人口比重(%)2.2 指标间的相关性分析利用SPSS软件对原始数据做标准化处理,然后计算得出各指标之间的相关系数矩阵,其结果见表1。表1 相关系数矩阵Table1 The correlated matrix of 5 indicesX1X2X3X4X5X6X7X8X9X10X11X1X2X3X4X5X6X7X8X9X10X111.0000.785-0.614-0.694-0.491-0.557-0.582-0.589-0.768-0.586-0.5650.7851.0
8、00-0.701-0.775-0.592-0.640-0.676-0.626-0.826-0.700-0.631-0.614-0.7011.0000.8130.6990.6570.6570.6570.5450.6430.563-0.694-0.7750.8131.0000.8680.6470.6900.7270.7850.7650.737-0.491-0.5920.6990.8681.0000.2950.3240.3640.5040.4130.425-0.557-0.6400.6570.6470.2951.0000.9670.8960.7150.9120.776-0.582-0.6760.65
9、70.6900.3240.9671.0000.9560.7640.9320.863-0.589-0.6260.6570.7270.3640.8960.9561.0000.7600.8950.892-0.768-0.8260.5450.7850.5040.7150.7640.7601.0000.8470.728-0.586-0.7000.6430.7650.4130.9120.9320.8950.8471.0000.861-0.565-0.6310.5630.7370.4250.7760.8630.8920.7280.8611.000由表1不难得出,原始变量数据中,X6(人均GDP)和X7(城乡
10、居民储蓄年底余额),X7(城乡居民储蓄年底余额)和X8(人均社会消费额),X6(人均GDP)和X10(城市人口比重),X7(城乡居民储蓄年底余额)和X10(城市人口比重)均存在着较大的正相关。2.3 主成分贡献率及其主成分载荷分析通过SPSS软件计算得到主成分特征值、贡献率、累积贡献率(如表2所示)。由表2可知,前两个主成分的累积贡献率为84.687%(理论上80%-85%),所以选取前两个主成分,就可以综合代表11个指标所反映的中国各地区交通运输的特征和基本情况。主成分载荷矩阵(表3)表明:第一主成分(贡献率为48.949%)在人均GDP、人均社会消费额和城市人口比重上具有很大的正载荷(0.
11、917、0.910、0.889),这3个指标反映了影响人均GDP差异的主要因素,可以说明第一主成分在某种程度上代表着影响因子的整体状况。第二主成分(贡献率为35.739%)在识字率上具有较大的正载荷(0.934),在出生率上具有较大的负载荷,这说明第二主成分在一定程度上代表着影响因子的差异。表2 主成分特征值、贡献率和累积贡献率Table2 The eigenvalue,contribution rate and accumulative contribution rate of PC特征值贡献率累积贡献率125.3843.93148.94935.73948.94984.687表3 主成分载荷
12、矩阵Table3 The load matrix of PCA12X1X2X3X4X5X6X7X8X9X10 X11-0.447-0.5070.4300.4800.0440.9170.4990.9100.6850.8890.830-0.670-0.7230.7420.8420.9340.2570.2840.3160.5620.3740.3562.4 全国各省主成分得分评价与分析计算各省、市、自治区在第一主成分和第二主成分得分,如果一个区域在某一主成分上的得分为正,则意味着这一区域的该主成分在平均发展水平之上;反之,得分为负则表明在平均水平以下。另外。也可以按照各个主成分的贡献率,定义综合主成分
13、得分,它反映了各省、市、自治区人均GDP影响差异发展水平。中国第一主成分和第二主成分得分前五位的省份及其得分情况,具体见表4。表4 第一、第二、第三主成分得分前五名的省份Table 4 The five best provinces with the high scores in PCA1,PCA2, PCA3, respectively第一主成分第二主成分序号 省份 得分 省份 得分12345北京上海天津浙江西藏3.130863.061981.576330.635880.57258河北吉林黑龙江辽宁江苏1.157790.881670.806480.773870.76008从表4中可知,北京、
14、上海、天津、浙江、西藏、河北、吉林、黑龙江、辽宁、江苏、等省份的主成分得分均为正,说明这些省份人均GDP均在全国的平均水平之上。第一、第二主成分得分上的差异,综合反映了5个人均GDP的评价指标在区域结合上的差异。北京、上海、天津、浙江、西藏等省份在城乡居民储蓄年底余额和人均GDP等方面表现的有为突出。河北、吉林、黑龙江、辽宁、江苏等省份在识字率上表现明显3.影响人均GDP差异因素相似性和差异性分析 系统聚类分析方法是定量地研究地理事物分类问题和地理分区问题的重要方法。因此我们采用系统聚类分析方法对中国各省、市、自治区人均GDP相似性和差异性作综合和系统的分析3.1 基于欧氏距离的聚类计算首先采
15、用标准差标准化方法对两个主成分得分的数据进行处理;然后采用欧氏距离测度样本间距离;最后计算出8种系统聚类分析方法的结果,通过比较选出最短距离法计算类间的距离并对样本进行分类,从而得到影响城市人均GDP因素的谱系图(见图1)。 图1人均GDP差异因素分析谱系图Figure 1 GDP per capita differences in factor analysis of pedigree chart3.2全国综合交通发展水平的区域相似性和差异性分析当类间距离取14.2 (谱系图中第一条长竖线所示)和5.8(谱系图中第二条长竖线所示)时,可以将中国30个省、市、自治区划分为三个类和两个亚类。第一
16、类:湖南、陕西、山西、重庆、山东、河南广西、四川、安徽、海南、江西、黑龙江、江苏、吉林、河北、内蒙古、湖北17个省,其中湖南、陕西、山西、重庆、山东、河南、广西、四川、安徽、海南、江西为一亚类,黑龙江、江苏、吉林、河北、内蒙古、湖北为一亚类。这17个省、市都是城市人口比重大的地区。人均第三产业增加值对人口城市化水平的影响是滞后的。由此可以认为,在推进城市化的进程中不能忽略第三产业的发展,一定区域内经济的发展要因地制宜,宜工则工、宜第三产业则发展第三产业,不能过分强调工业对城市化推动的作用,要看到各产业对城市化的推动作用是同样的,关键看该产业是否适合该区域经济、社会和自然的和谐发展。人均GDP
17、对第三产业的发展水平有着明显的制约作用。二者之间的对数关系说明,在国民经济处于较低的水平时,人均GDP 的增加对第三产业增长有较大的拉动作用。第二类:辽宁、福建、北京、上海、天津、浙江 6个省。人口比重对第三产业的发展水平也有着明显的制约作用。二者之间的对数关系说明,在国民经济处于较低的水平时,农村人口比重的减少对第三产业增长有较大的拉动作用。北京、上海、天津、浙江 4个省,但与发达国家相比还有差距,发达国家中大城市的第三产业比重通常在80%以上,我们仅是接近70%,还需继续努力,在“十一五”规划中第三产业仍然有较大的发展空间第三类:青海、西藏、贵州、宁夏、云南、甘肃、新疆 7个省。这些地区人
18、口自身发展仍然存在很多问题,必须增加各地区的教育投资,只有把教育搞上去,才能为我国的人均GDP做出更大的贡献。4结论通过主成分分析将选用的用于分析影响人均GDP因素发展的11个指标,“降维”成2个综合的、独立的,且功能明确的主成分,避免了11个斜交的、相关的指标在分析问题上造成的偏差。2个主成分累计贡献律达90.29%;由主成分载荷可知X6(人均GDP)和X7(城乡居民储蓄年底余额),X7(城乡居民储蓄年底余额)和X8(人均社会消费额),X6(人均GDP)和X10(城市人口比重),X7(城乡居民储蓄年底余额)和X10(城市人口比重)均存在着较大的正相关。对影响人均GDP的因素突出;各主成分得分
19、和综合主成分得分,第三产业总产值在GDP中的比重不断增加是世界各国经济发展过程中所表现出的一个共同特征,是经济发展过程中的一个重要规律。但是,第三产业的发展水平的高低,在很大程度上取决于国民经济的发展水平和人口结构情况,盲目追求第三产业在GDP中的比重是不符合第三产业发展的客观规律的。主成分得分基础上的系统聚类分析结果(谱系图),揭示出了影响人均GDP因素在各地区的相似性、差异性特点和规律。参考文献:1 地理科学编辑委员会,地理科学M,北京: 科学出版社,2004.59-862 韩渊丰.中国区域地理M, 广州:广东高等教育出版社,2000.366-3983 赵济,陈传康.中国地理M,北京:高等
20、教育出版社,1999.67-944 杨令斌. 中国省际综合交通发展水平的定量分析J.国家自然科学基金项目,2005,11:25-26.5 王国强. 当前中国交通运输业发展主要存在的问题及对策J. 广西电业,2003,12:41-43.6 国家发展改革委宏观经济研究院课题组.“十一五”时期中国交通运输业的发展对策J. 宏观经济研究,2005,10:35-40.7 杨令宾等. 吉林省主要城市经济发展与环境关系探析J,经济地理,2005,12.269-2728 杨令宾.计量地理学M,长春: 吉林人民出版社,2005.96-100,129-133 9 国家统计局.中国统计年鉴M,北京:中国统计,200
21、5.549-580Differences in factors affecting urban analysis of per capita GDPDUAN haoyu( College of Urban and Environmental Science, Changchun Normal University, Changchun 130000, China;)Abstract: First select the 2001 national 30 provinces, municipalities and autonomous regions of 11 indicators (birth
22、 rate, population natural increase rate, life expectancy, average age, education, literacy, per capita GDP, savings by the end of the balance of urban and rural residents, per capita social spending , the proportion of adult workers, the proportion of urban population, the proportion of the populati
23、on of tertiary industry), this in SPSS statistical software principal component analysis; then combined with principal component analysis, cluster analysis method used has been the development of the countrys GDP per capita level of integrated regional pedigree chart; last on this basis, to explore
24、the countrys comprehensive development level of inter-provincial region similarities and differences. The results show that: the use of principal component analysis and clustering analysis of Chinas system of inter-provincial integrated transport development, not only can overcome the traditional ma
25、nual selection of indicators based on comprehensive analysis of the data is not easy to deal with the existence of defects, and the results of high accuracy, is Chinas urban per capita GDP differences affect the analysis of the factors of a new attempt.Keywords: per capita GDP; principal component analysis; system clustering; Chinese cities