《多元统计方法在房地产中的应用(毕业论文).doc》由会员分享,可在线阅读,更多相关《多元统计方法在房地产中的应用(毕业论文).doc(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、编号: 毕业设计(论文)题 目:多元统计方法在房地产 中的应用 学 院: 专 业: 学生姓名: 学 号: 指导教师单位: 指导教师: 职 称: 题目类型: 理论研究 实验研究 工程设计 工程技术研究 软件开发XXXX 年 XX 月 XX 日摘 要房地产业是国民经济中的一个大产业,它随着社会生产力的发展,特别是市场经济的发展和工业化、城市化进程的加快应运而生,并迅速成长为国民经济中一个独立的、巨大的产业部门。中国房地产业在短短的十几年内经历了大起大落的发展阶段,且跟随着各省市的经济发展水平脚步,房地产区域发展也极不平衡,所以对房地产区域进行分类以制定相关政策有重要意义。房地产市场的区域分类是进行
2、房地产微观市场分析和宏观市场研究的基础。只有进行了合理有效的区域分类,才有可能对房地产市场行为有清晰的把握和认识。本文基于各省市房地产市场发展规模的各项指标,运用多元统计方法中的因子分析、聚类分析、方差分析对我国房地产市场进行了分析,有利于正确认识与评价我国各省市房地产业之间的差异。同时,多元统计分析的结果对提出房地产业的发展战略,促进中国房地产业的持续、协调发展具有重要意义。关键词:房地产;区域分类;因子分析;聚类分析;方差分析AbstractThe real estate industry is one of the major industries of national economy
3、, and it is developed with the social development of productive forces, especially the development of market economy and the process of industrialization, urbanization, and the rapid growth of national economy in an independent, huge industry departments. Chinese real estate industry had experience
4、the dramatic development stage in only a few years, and with the level of economic development in various provinces, real estate area development is very uneven.So it is important to make the classification of real estate for formulating relevant policy. The classification of the real estate market
5、areas is the basis of analysis of the micro regional market and the research foundation of the macro market.Only the reasonable classification, the real estate market behavior could be use a clear grasped and understood clearly.Based on the indexes of the real estate market development in various pr
6、ovinces, and with the methods of multivariate statistical, such as factor analysis, cluster analysis and variance analysis, the analysis of the real estate market of our country has been given, which is contributed to correctly understand and evaluat the difference of Chinese provinces real estate i
7、ndustry between different regions. At the same time, the results of the analysis are benifit to propose the development strategy of the real estate industry. And also, they are contribute to the harmonious development of Chinese real estate industry.KEYWORDS: Real estate; Classification; factor anal
8、ysis; cluster analysis; variance analysi目 录引言11 中国房地产现状分析31.1 房地产总体情况分析31.2 房地产企业情况分析32 理论基础52.1 因子分析52.1.1 因子分析简介52.1.2 因子得分62.1.3 因子分析的步骤62.1.4 因子旋转72.1.5 综合得分及得分排序72.2聚类分析72.2.1 聚类分析原理72.2.2 谱系聚类方法介绍82.3 方差分析92.3.1 方差分析简介92.3.2 单因素方差分析基本步骤103 实证分析113.1 数据来源、指标选取及指标体系113.1.1数据来源113.1.2 指标体系113.2 2
9、008年的实证分析123.2.1全国31个省市地区指标值分布的初步比较123.2.1数据标准化处理133.2.2主成份分析133.2.3因子分析143.2.4 综合评价163.2.5聚类分析173.2.6方差分析194 历年的主要研究结果204.1 房地产发展水平的总体趋势分析204.2 房地产经济区划的聚类结果比较分析215 结论与建议245.1 结论245.2 建议24谢 辞26参考文献27附 录28 第40页 共40页引言 房地产业是国民经济的基础性、先导性产业。近年来,我国房地产业持续快速发展,已经成为推动我国经济发展的重要产业,房地产业作为国民经济新的增长点而迅速崛起,成为衡量国民经
10、济是否良性发展的标尺之一。但是 ,无论是房地产经济发展水平,还是发展增长速度在我国各省市之间都存在很大差异,正确认识与评价我国各省市之间的差异,并在此基础之上制定相应的宏观调控政策,对促进我国房地产经济的协调发展具有重要的意义。房地产行业是一个巨大的区域差异,收入显著差别。社会经济发展和人民的经济生活水准的差异,使不同地区的发展程度,房地产布局结构,规模和速度有巨大的区域差异。我国是一个幅员辽阔的、各区域经济不平衡的国家,地区的自然条件、资源、经济和技术条件、管理水平以及因素,如历史和文化有很大的不同。这种不平衡也决定了不平衡的房地产开发等,房地产行业具有很强的相关性,对国民经济发展起着巨大的
11、推动作用。直接关系到房地产相关的行业多达50个以上,房地产行业不仅涉及建筑材料业,住房设备行业,工程机械行业和冶金,化工,机械,电子,仪器仪表,通讯,和其他资本货物生产部门,还涉及到家电,纺织品,家具和其他民用工业,以及旅游,园林,交通,商业和其他服务。房地产,被称为国民经济的“风向标”和“晴雨表”,在国民经济发展中发挥基础性作用,带头作用。区域房地产行业正成为一支重要力量,促进经济增长,成为国民经济的主导,支柱产业和新的经济增长点和区域经济发展,而且也促进有效发展的房地产行业。但是,我国不同地区之间的差异较大,经济发展水平,房地产的区划问题,还需要对房地产中的各类指标数据做进一步研究才能得出
12、结论。国内外专家学者在房地产区域细分问题上提出了不同的看法,各个国家的具体实行措施也截然不同。美国人口普查局进行市场调查是以大都市统计区(MSAs)为依据的。这是一个基于数据的联邦划分标准,它通常包括一个人口在50000以上的建制县和至少一个的外围县。它的基本划分依据是区域内的流动性。这个方法最重要的特点是,在每一个区域单位内部,劳动力在地理位置上是可以自由流通迁徙的,而不受工作单位地理位置的影响。而我国现阶段房地产市场的划分是以地理位置和行政区域单位为标准的。这个方法是延续了行政建制的特点,显然在经济领域有严重的弱点。中国国土辽阔,生产力发展不平衡。循序渐进的经济改革方法,没有在全国范围一次
13、性地铺开,导致了中国各个行政区域经济发展的不平衡性。即使相邻的省份,经济状况也是有相当的差距。以此为基础对房地产市场进行区域划分显然是不能合理体现市场发展特点的。又由于中国传统的定居观念使得中国居民不具有西方人的流动传统,中国人口众多,交通相对落后,迁徙成本大于西方国家,这造成中国居民流动性大大弱于西方国家。另外,中国特有的户籍制度也大大限制了人员的流动。缺乏了流动性的前提条件,中国显然不能实行大都市统计区的区域划分方法。在本文,提出了中国房地产市场区域划分的新思路。运用多元统计方法中的因子分析、聚类分析、方差分析,选取反映房地产市场发展状况的重要指标,在31个 行政区划分的基础上,采用因子分
14、析和聚类分析方法对31个地区进行深入分析,进一步整合区域划分范围,以便更好地分析区域的房地产微观市场行为,针对不同区域进行宏观调控。1 中国房地产现状分析1.1 房地产总体情况分析随着中国政治经济实力越来越强大和全球经济的日趋一体化,中国房地产业迅速发展,中国房地产市场的种种问题也逐渐暴露出来,房价涨幅过快,房产开发结构不合理,地方相关政策不完善等等,影响着我国经济的发展。我国房地产企业也如雨后春笋般成立着,这么多的房地产企业如何在竞争激烈的市场上占有不败的一席之地,至关重要的是经营战略的制定应用,但房地产企业中也同样存在着许多问题,所以研究企业如何解决存在的问题已经迫在眉睫,另外我们还得借鉴
15、国外房地产业是如何解决这些问题的,这样才能使企业做大做强做久,才能让社会主义经济建设取得长远成效。1.2 房地产企业情况分析中国房地产目前的企业整体上有4个特点:(1)房地产企业数量众多,规模小。(2)中国房地产企业开发能力低,规模经济差。 (3)房地产企业资产负债率偏高,经营风险大。 (4)房地产企业信用差,不重视品牌的创立。我们知道,中国现在正处于社会主义初级阶段,经济水平和发达国家有较长的距离,房地产业发展水平和经济发展水平密切相关。我国地域辽阔,房地产市场规模大,由于房地产开发业的进入壁垒较低,房地产业的高利润吸引了大批量社会游资涌入,但房地产业属于开发周期较长的资金密集型产业,项目开
16、发周期较长使得企业需要长期的资金支持,大部分的投资者并没有雄厚的资金支持,造成了他们建立的企业只能是规模小,开发能力低,规模经济差。这些企业普遍存在着自有资金不足,企业所需开发资金主要依靠银行贷款解决,负债率高,经营的风险大。小企业由于资金不足,需要资金快速周转,缩短开发周期,面积缩水、价格欺诈、质量低劣等问题时有发生,这不仅侵犯了消费者的合法权益,而且直接影响着房地产企业自身的发展,不重视自身的信用和品牌,消费者认可度下降,房子不好卖,又造成了资金周转问题,形成了恶性循环。但我国房地产业的总体发展水平的上升趋势是必然的,随着经济的发展,人们生活水平的提高,财富的积累加大,对房产的需求也就变大
17、了,需求决定着供给,房地产业正搭着经济高速发展这趟列车前行,作为现代经济的基本单位和资源配置基本手段的企业,虽仍然存在着很多问题,总体来说还不能很好地满足这些要求,但中国房地产企业的未来发展态势将在很大程度上决定中国房地产市场和房地产业的未来走势和发展方向。房地产企业是中国房地产市场的主体,房地产企业的数量及其发展情况直接关系到整个中国房地产业的发展,2008年的官方统计数据显示全国共有38212个房地产企业,占中国房地产企业总数的80多。随着中国城镇住房制度改革的不断深化,房地产企业将会得到长足的发展。2 理论基础2.1 因子分析2.1.1 因子分析简介因子分析是主成份分析的推广和发展,也是
18、多元统计分析方法中降维的一种方法。因子分析是研究相关阵或协差阵的内在的依赖关系,将多个变量进行总和,并用少数几个因子来再现原始变量和因子之间的相关关系的一种统计方法。“因子”是指一个(或一组)假设的、抽象的变量,其对观测变量发挥这支配或影响作用,因子可以分为公共因子(主因子)和特殊因子两种。所谓公共因子是指一个假设的、抽象的变量,它可以用来解释两个或两个以上的原始变量。而特殊因子则指一个假设的、抽象的变量,它只能用来解释一个原始变量,与其他变量无关。因子分析的数学模型:设有n个样品,每个样品观测有p个变量。为消除数据量纲的差异及数量级所造成的影响,需将样本观测数据进行标准化处理,使得标准化后的
19、变量均值为0,方差为1。建立R型因子分析模型如下:设,个变量,如果表示为:或 =+或称为公共因子,是不可观测的变量,它们的系数称为因子载荷。是特殊因子,是不能被前m个公共因子包含的部分。并且满足:,不相关。即互不相关,方差为1。即互不相关,方差不一定相等。2.1.2 因子得分因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因
20、子得分。设公共因子F由变量J表示的线性组合为:该式子被称为因子得分函数,由它来计算每个样品的公共因子得分,若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2。但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。2.1.3 因子分析的步骤因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。(一)因子分析常常有以下四个基本步骤:(1)确认待分析的原变量是否适合作因子分析;(2)构造因子变量;(3)利用旋转方法使因子变量更具有可解释性
21、。(4)计算因子变量得分。(二)因子分析的计算过程:(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同;(2)求标准化数据的相关矩阵;(3)求相关矩阵的特征值和特征向量;(4)计算方差贡献率与累积方差贡献率;(5)确定因子。设F1,F2,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标。2.1.4 因子旋转建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。对因子模型提供
22、了八种旋转方法,例如:正交方差最大旋转、正交四次方最大旋转等。最常用的旋转方法是正交方差最大旋转(VARIMAX)和PROMAX旋转。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转,常用的正交旋转方法有VARIMAX法等;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有PROMAX法等。2.1.5 综合得分及得分排序通过因子分析输出各个因子得分,以每个因子的方差贡献率为权数,进行加权综合,计算出总得分,以此进行综合得分排序。综合得分公式为:总得分=F1的方差贡献率
23、F1的得分+F2的方差贡献率F2的得分+.提取n个因子,就有n项。2.2聚类分析2.2.1 聚类分析原理聚类分析实质上是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。聚类分析是研究样品或指标分类问题的一种多元统计方法,系统聚类法是聚类分析中应用最为广泛的一种方法,它的基本思想是逐步将距离近的类合并在一起。由于在新类中不止一个样品,所以首先要定义类与类之间的距离(定义距离的方法不同,形成了不同的系统聚类方法),然后将距离最小的类合并,每次合并至少要减少一类。如此下去,一直到所有样品合并为一类为止。常用的系统聚类法有几种:最短距离法、最长距离法,中间距离法、重心法
24、、类平均法、可变类平均法和离差平均和法。用系统聚类法进行聚类时,样品一旦划分到某个类以后就不变了,这要求分类方法准确。2.2.2 谱系聚类方法介绍SAS/STAT中提供了谱系聚类、快速聚类、变量聚类等聚类过程。谱系聚类是一种逐次合并类的方法,最后得到一个聚类的二叉树聚类图,其想法是,对于n个观测,先计算其两两的距离得到一个距离矩阵,然后把离得最近的两个观测合并为一类,于是我们现在只剩n-1个类(每个单独的未合并的观测作为一个类)。计算这n-1个类两两之间的距离,找到离得最近的两个类将其合并,就只剩下了n-2个类直到剩下两个类,把它们合并为一个类为止。当然,真的合并成一个类就失去了聚类的意义,所
25、以上面的聚类过程应该在某个类水平数(即未合并的类数)停下来,最终的类就取这些未合并的类。决定聚类类个数是一个很复杂的问题。设观测个数为n,变量个数为v,G为在某个聚类水平上的类的个数,xi为第i个观测,是当前(水平G)的第K类,为中的观测个数,为均值向量,为类中的均值向量(中心),为欧氏长度,为总离差平方和,为类的类内离差平方和,为聚类水平G对应的各类的类内离差平方和的总和。假设某一步聚类把类和类合并为下一水平的类,则定义为合并导致的类内离差平方和的增量。用代表两个观测之间的距离或非相似性测度,为第G水平的类和类之间的距离或非相似性测度。进行谱系聚类时,类间距离可以直接计算,也可以从上一聚类水
26、平的聚类递推得到。观测间的距离可以用欧氏距离或欧氏距离的平方,如果用其他距离或非相似性测度得到了一个观测间的距离矩阵也可以作为谱系聚类方法的输入。根据类间距离的计算方法的不同,有多种不同的聚类方法。其中几种介绍如下:(1)类平均法(METHOD=AVERAGE)测量两类每对观测间的平均距离,即在时若类和类合并为下一水平的类,则类和类的距离的递推公式为(2)最短距离法(METHOD=SINGLE) 计算两类观测间最近的一对的距离,即递推公式为(3)Ward最小方差法(或称Ward离差平方和法,METHOD=WARD) 当观测间距离为时递推公式为Ward方法并类时总是使得并类导致的类内离差平方和增
27、量最小。2.3 方差分析2.3.1 方差分析简介方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想可概述为:把全部数据关于总均数的离差平方和分解成几部分,每一部分表示某一影响因素或诸影响因素之间或交互作用所产生的效应。将各部分方差与误差方差想比较,依据F值做出统计推断,从而接受或拒绝某些因素或交互作用对考察指标的重要影响。方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3
28、、分析因素间的交互作用,4、方差齐性检验。实现方差分析功能的过程主要有ANOVA过程和GLM过程。1.ANOVA过程ANOVA过程主要用于处理均衡设计(即:对于每个变量、每个水平的观测数是相等的,另外还可以处理拉丁方设计、正交设计等)的一元、多元方差分析和重复测量的方差分析,也可用于多个变量的对比检验。2.GLM过程GLM过程是一个非常通用的方差分析方法,GLM(General Linear Model)过程用到的统计方法有:回归分析、方差分析、协方差分析、多元方差分析和偏相关,GLM过程同时还提供了多种诊断方法:随机效应检验、常用的假设检验对比估计和多变量的对比检验等。相对于ANOVA过程,
29、GLM过程在处理不均衡设计时更有效。2.3.2 单因素方差分析基本步骤(1)提出原假设:H0无差异;H1有显著差异。(2)选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验。(3)计算检验统计量的观测值和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。(4)给定显著性水平,并作出决策。3 实证分析3.1 数据来源、指标选取及指标体系3.1.1数据来源本文研究的时期为2004-2008年,一共5年,分年度对我国的房地产发展的经济区划进行考察,研究对象包括中国31个省市地区,所用数据全部通过2005-2009年中国统计年鉴中的数据进行收集和整理而来。3.1.2 指标体
30、系本文选择了反映房地产经济发展水平的3大类指标:房地产投资及建设指标、房地产销售指标和房地产开发企业指标组成全国省市房地产经济发展水平评价指标体系,如表1。表1 房地产经济发展水平评价指标体系一级评价指标二级评价指标( Ii )三级评价指标( Iij )房地产经济发展水平房地产投资情况(1) 完成投资额 (I11 ,万元)(2) 资金来源 (I12,万元)房地产企业经营情况(3) 房地产开发主营业务收入 (I21,万元)(4) 利润总额 (I22,万元)房地产开发成本(5) 房地产竣工房屋造价 (I3,万/m2)房地产销售情况(6) 商品房销售额 (I41,万元)(7) 商品房平均售价 (I4
31、2,元/ m2)房地产开发企业指标(8) 开发企业个数 (I51,个)(9) 开发企业平均从业人数 (I52,人)(10) 本年完成开发土地面积 (I53,万 m2)(11) 房屋建筑面积竣工率(I54)选择以上指标构建3大类指标主要基于以下理由:1. 构造指标的原始数据能在历年统计年鉴中找到并规范使用。 2. 指标能反映出房地产经济发展的各方面,综合后能反映各省市地区房地产整体发展状况。3. 原始数据均取自统计年鉴,数据在时间上具有较好的前后一致性,各年度的横截面数据也具有较好的可比性。3.2 2008年的实证分析3.2.1全国31个省市地区指标值分布的初步比较使用SAS软件将全国31个省市
32、地区的原始数据进行初步处理,分析结果如图1,统计出的各项指标的期望,标准差和变异系数如表2. 图1表2 全国31个省市地区指标值的的横向比较(2008)指标变量样本数期望标准差变异系数(%)标准差系数极差系数(极差/均值*100)I11(万元)3110065546.528264932.0182.11326.94I12(万元)3112780438.7711671852.1491.33367.61I21(万元)318611885.489215093.39107408.39I22(万元)311107170.941533524.56138.51500.33I3(万/m2)31 1702.97437.5
33、625.6983.91I41(万元)318086510.657322580.3790.55354.55I42(元/m2)313682.712197.6059.67284.03I51(个)311232.65935.1475.86307.87I52(人)31664.85289.8443.59211.37I53(万 m2)31926.13779.2184.14347.29I543125.137.0227.94104.66观察表2所示的11个指标的变异系数,我们发现2008年房地产开发主营业务收入、利润总额这两个指标的标准差系数均超过了100%,其余指标也大部分超过了50%,这表明我国的房地产业地区之
34、间的发展存在巨大的不平衡,地区之间存在极大的差异。而极差系数则把这种差异性表现得更加明显,并且发展最快的地区和最落后的地区落差非常大。这种情况表明对这31个省市地区进行房地产发展水平区划非常必要。3.2.1数据标准化处理为了消除各个变量所用量纲的影响,常事先将数据进行无量纲化处理,采用方法是标准差标准化。其处理方法为: 对于每个指标 , 其样本均值和样本方差:做标准差变换: 标准化后的数据中, 每个指标的平均值都是0,标准差都是1,因而可认为与指标的量纲无关。3.2.2主成份分析将标准化后的数据,使用SAS8.2软件进行主成份分析法对上述11个指标进行测评。主成份分析用于研究如何将多个变量指标
35、间的问题化为较少的几个新指标问题,这些新的指标彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。这个处理损失的信息很少,从而达到了降维的目的。以2008年的统计数据为基础,应用统计分析软件SAS8.2对全国31个省市地区的房地产经济发展水平进行评价分析。分析结果如图2。图2 主成份分析3.2.3因子分析经过主成份分析之后,提取了3个因子,他们的累计贡献率达到了89.28%。前3个主成份代表了全部原始指标89.28%的信息,表明主成份分析对原始指标分类作用是有效和客观的。使用SAS8.2软件对数据进行因子分析,因子分析数据、程序见附录2,主要分析结果如图3、图4,它们的总
36、方差解释和旋转因子载荷矩阵见表3和表4。图3 因子分析结果图4 旋转因子载荷矩阵表3 总方差解释主成份初始特征值特征值方差的贡献率累积的贡献率16.78050.61640.616421.87760.17070.787131.16280.10570.8928表4 旋转因子载荷矩阵指标因子F1F2F3I11完成投资额0.87090.1810-0.0693I12资金来源0.78600.3317-0.0504I21房地产开发主营业务收入0.74810.41090.0364I22利润总额0.68270.46910.0941I3房地产竣工房屋造价-0.04570.9164-0.0198I41商品房销售额0
37、.77550.36840.0097I42商品房平均售价-0.11660.9977-0.0231I51开发企业个数1.0003-0.2423-0.0538I52开发企业平均从业人数0.3129-0.0897-0.7150I53本年完成开发土地面积1.0303-0.36360.0301I54房屋建筑面积竣工率0.1289-0.08970.9407提取的3个因子分别用 F1、F2、F3表示,由表4的旋转因子载荷矩阵可以得到因子评价函数:其中,f为旋转因子载荷矩阵系数。同时, 从因子载荷矩阵来看,可以发现:第一主成分 F1 中I11、I12、I21、I22、I41、I51、I52、I53的系数明显大于
38、同列中的其他指标的系数,这表明第一主成份F1主要代表各省市房地产投资建设、开发企业规模和盈利水平;第二主成份 F2 中的I3、I42的系数明显大于同列中其他指标的系数,表明第二主成分主要代表各省市商品房建造成本和平均售价情况;第三主成份F3中I54的系数明显大于同列其他指标的系数,表明第二主成份主要代表各省市的房屋建设面积竣工率。3.2.4 综合评价综合评价的方法是将提取的3个主成分标准得分与相应的方差贡献率相乘,求和后得到每个市的综合得分,按以下公式计算:其中, Si 为各市房地产经济发展水平的综合得分,Ti 为第i 个因子的贡献率,Fi 为第i 个因子得分。因子得分、综合得分及名次见表5。
39、表5 各省市因子得分、综合得分及名次省市F1F2F3S得分名次得分名次得分名次得分名次北京0.2603103.133110.251170.75036天津-0.4366200.742260.222711-0.118914河北0.042712-0.242514-0.713624-0.090513山西-0.686825-0.671123-0.156216-0.554427内蒙古-0.175916-0.5417210.32049-0.167016辽宁0.803250.0389100.2511100.52837吉林-0.629623-0.5021200.83176-0.385922黑龙江-0.43161
40、9-0.7819271.81764-0.207417上海0.550362.514120.396780.81035江苏3.177110.66017-0.2355182.04611浙江1.355541.10264-1.7232310.84164安徽0.26599-0.407416-0.8660270.002910福建-0.1399150.09299-1.518030-0.230818江西-0.363917-0.7727260.031912-0.352920山东1.82913-0.358615-0.0322151.06283河南0.36678-0.795929-0.7452260.01149湖北-0
41、.046814-0.039611-0.029413-0.038711湖南0.080111-0.787228-0.737825-0.163015广东2.076121.95073-0.0295141.60952广西-0.516421-0.593122-0.527422-0.475323海南-1.1272300.79125-0.515321-0.614228重庆0.003813-0.182613-0.447120-0.076112四川0.40517-0.432118-0.534923-0.11948贵州-0.884327-0.722125-1.052528-0.779631云南-0.426018-0
42、.458319-0.262719-0.368621西藏-1.2109310.163781.83113-0.524926陕西-0.572822-0.103212-1.348929-0.513325甘肃-0.832526-0.823430-0.173717-0.672130青海-1.110729-0.4315171.30685-0.620129宁夏-0.966928-0.6954242.21051-0.481124新疆-0.657124-0.8469311.90792-0.347919 从各省市房地产经济发展水平的综合得分来看,江苏省、广东省和山东省排名前三位,它们的综合得分领先于其他各省市, 反
43、映了这三个省的确在房地产投资及建设规模、房地产销售和房地产开发企业等方面在各省市中处于领先地位, 房地产经济发展水平较高。3.2.5聚类分析本文采用系统聚类分析中的Ward法(离差平方和法)将因子分析的结果,即对各省市的综合得分进行聚类分析,运用SAS8.2软件提供的系统聚类法对31个省市进行Q型聚类(程序见附录2)得到聚类结果,见图5、图6。在NCL=3时,CCC达到了最大的峰值0.65。PSL在NCL=25和NCL=4时两次达峰值,但在NCL=4时峰更陡些。因为NCL=3时,PSF=213,而在NCL=2时则降到104。PST在多处出现峰值,从NCL=4到NCL=3峰值不比NCL=10到NCL=9增加的幅度低。综合CCC、PSF、PST2这3个统计量的结果可知:将31个样品分为4类较合适。图5 聚类分析结果图6 房地产经济区划聚类图(2008)根据聚类图,我们看到有四个聚集比较密集的区域:1号到5号为第一个聚集区;6号到7号为