《2022年SPSS分析教程和在房地产应用方面的实例.docx》由会员分享,可在线阅读,更多相关《2022年SPSS分析教程和在房地产应用方面的实例.docx(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -SPSS分析教程和在房地产应用方面的实例第一节数据的建立和DISCRIPTIVES , MEANS 的初步分析现下的中国的市场调研当中统计方法应用的结果要求并不是很高的,由于在一个行业的起步阶段我们并不会对市场分析要求很高的精度,而是要求有一个总体的明白即可; 但是,任何一个成熟的行业都必定是一个专业型很强的结合体,房地产行业亦然; 随着将来房地产行业的不断整合和专业化,定性分析占主导地位必定要被定量分析占主导位置的分析方法所取代,体会的重要性将逐步被统计分析所弱化;为什么呢?由于统计分析就是对以往获得的体会
2、的定量分析而 已,所不同的是:统计是肯定理性化的,统计数据不会说谎的!其实现在的发达国家的决策主要已经考统计分析来说话了,但是大到我们整个国家, 小到我们成都地区的房地产行业,统计分析仍只是在一个初级应用阶段,技术水平也不高,也不被重视; 我们需要用统计数据去分析消费者心理,分析楼盘的价格, 分析楼盘的定位等等,那么最直接的方法就是用现在最广泛应用的 SPSS 去分析;那么作为并非是统计专业人士的我们,怎样去学习和应用呢?我预备用一些很具体的例子和模块来给大家一步一步讲解,我尽量完全无误的操作一遍:1.1 数据的输入和储存1.1.1 SPSS 的界面当打开 SPSS 后,呈现在我们面前的界面如
3、下:细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 1 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -请将 鼠标在上图中的各处停留,很快就会弹出相应部位的名称;请留意窗口顶部显示为“SPSS for Windows Data Editor” ,说明现在所看到的是 SPSS 的数据治理窗口;这是一个典型的Windows 软件界面,有菜单栏、工具栏;特殊的, 工具栏下方的是数据栏, 数据栏下方就是数据治理窗口的主界 面;该界面和 E 购买面积 CEL 极为相像,
4、由如干行和列组成,每行对应了一条 记录,每列就对应了一个变量;由于现在我们没有输入任何数据,所以行、列的 标号都是灰色的; 请留意第一行第一列的单元格边框为深色,说明该数据单元格 为当前单元格;对数据表界面操作不熟识的可先温习一下E 购买面积 CEL 的操作(由于它的帮忙是中文的),也可以尝试用 10.0 的中文版操作;我们现在主要用 SPSS11.5来操作,由于它的功能更强大,而且现在已经普遍用12.0 版本了;我们当前用的 11.5 ,10.0 的 SPSS 系统打开时会显现一个导航对话框,请 单击右下方的 Cancer 按钮,即可进入上面的主界面;1.1.2 定义变量细心整理归纳 精选学
5、习资料 - - - - - - - - - - - - - - - 第 2 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -我们需要建立许多个变量, 由于我们的调查表有许多问题,我先来定义几个 变量:(操作)界面最左方为变量名,;往下是变量情形描述,可以看到系统默认该变量为 数值型,长度为 8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;现在 系统默认新变量为数值变量;最下方就依次是确定、取消和帮忙按钮;好,先来建立变量家庭人数; 请将变量名改为家庭人数, 然后单击 OK 按钮;在绝大多数情形下,
6、SPSS 给出的默认数据类型和数据精度完全可以满意需 要,只是不太好看而已;至于标签等比较花哨的选项,反正我也很少用;现在我 们才刚刚入门,一切从简;第一列的名称已经改为了“ 家庭人数” ,这就是我们所定义的新变量“ 家庭人 数” ;现在我们来建立变量购买面积;单击其次行第一列的单元格,同样,将变量 名改为购买面积,然后确认;(操作)是分组型的 我们现在再来定义购房单价;同样:(操作)留意是数值型1.1.3 输入数据我们先来输入变量购买面积的值,请确认一行二列单元格为当前单元格,弃 鼠标而用键盘,输入第一个数据 1:(操作)用类似的输入方式,我们将家庭人数的数目输入完毕:(略)细心整理归纳 精
7、选学习资料 - - - - - - - - - - - - - - - 第 3 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -然后开头输入单价的数据:(略)1.1.4 储存数据挑选菜单 File=Save ,由于该数据从来没有被储存过,所以弹出 Save as对话框如下:单击储存类型列表框,可以看到SPSS 所支持的各种数据类型,有DBF 、Fo 购买面积 Pro、E 购买面积 CEL 、ACCESS 等,这里我们仍旧将其存为 SPSS自己的数据格式( *.sav 文件);在文件名框内键入潜在消费者数
8、据并回车,可以看到数据治理窗口左上角由Untitled 变为了现在的消费者数据;为什么这里的对话框会显现汉字?是这样的,需要从编程的角度来说明:SPSS 在弹出该对话框时会调用Windows 系统的公用函数,由于我们用的是中文 Windows 系统,所以调用出来的就是中文;1.2 数据的预分析细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 4 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -1.2.1 数据的简洁描述第一我们需要知道数据的基本情形,如均数、标准
9、差等;挑选Analyze=Descriptive Statistics=Descriptives 下:(操作)假如按 SPSS 标准的叫法,这里应当是调用了菜单,系统弹出描述对话框如Descriptives (应当叫描述,或就描述统计学吧;)过程,为了防止太生硬,我们称为调用对话框,等大家熟悉 SPSS 了以后,在统计分析中可能两种称呼会混用;该对话框可分为左右两大部分,左侧为全部可用的侯选变量列表,右侧为选入变量列表;我们只需要描述期望单价, 用鼠标选中期望单价, 单击中间的,变量期望单价的标签就会移入右侧,留意这时 OK 按钮变黑, 说明已经可以进行分析了,单击它,系统会弹出一个新的界面如
10、下所示:Descriptive Statistics Std. 方案单价N 55 Range Minimum Maximum Sum Mean Deviation Variance 3700 1800 5500 140800 2560.00 876.356 768000.000 Valid N 55 listwise 该窗口上方的名称为SPSS for Windows Viewer ,即(结果)浏览窗口,整个的结构和资源治理器类似, 左侧为导航栏, 右侧为具体的输出结果; 结果表格 给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量;从中可以看到, 55 个数据总的均数为2560 ,
11、标准差为 876.356 ;细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 5 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -我们以上的做法对吗? 当然有问题 !光看总的描述是不够的, 仍应当看看分组的描述情形;这里要用到文件分割功能,请切换回数据治理窗口,挑选Data=Split File 菜单,系统弹出文件分割对话框如下:挑选单项按钮 Organize output by 家庭人数,将变量家庭人数选入右侧的选入变量框,单击 OK 钮,此时界面不会有任何转
12、变,但请再做一次数据描述,你就可以看到现在数据是分家庭人数=1 和家庭人数 =2 两种情形在描述了!Descriptive Statisticsa 方案单价N 10 Minimum Maximum Sum Mean Std. Deviation Variance 2000 2100 20900 2090.00 31.623 1000.000 Valid N listwise 10 a 家庭人数= 单身Descriptive Statisticsa 方案单价N 16 Minimum Maximum Sum Mean Std. Deviation Variance 1800 3000 35700
13、2231.25 415.883 172958.33Valid N listwise 3 16 a 家庭人数= 夫妻Descriptive Statisticsa 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 6 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -N Minimum Maximum Sum Mean Std. Deviation Variance 方案单价15 1800 4500 35000 2333.33 659.726 435238.09Va
14、lid N listwise 5 15 a 家庭人数= 三口之家Descriptive Statisticsa 方案单价N 5 Minimum Maximum Sum Mean Std. Deviation Variance 3400 4500 18300 3660.00 472.229 223000.00Valid N listwise 0 5 a 家庭人数= 三代同堂Descriptive Statisticsa N Minimum Maximum Sum Mean Std. Deviation Variance 1782500.0 00 方案单价9 2100 5500 30900 343
15、3.33 1335.103 Valid N listwise 9 a 家庭人数= 其他从描述可知两组的均数和标准差等数值都分别显示了,很明显三代同堂的消费水平最高, 标准差排其次说明他们这个群体期望的房价比较稳固;一个人的消费水平最低, 且收入也比较稳固的分布, 假如样本数量多的话说明当地租赁形式会比较好; -个人的一点估量;:)这个时候假如实行定性的分析,就事半功倍了;假如定义了文件分割,就它会在以后的全部统计分析中起作用,直到你重新定义文件分割方式为止;对了,在分析的过程中,我们仍要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,挑选单项按钮中的“creat 家庭人数” ,
16、单击OK 按钮就可以了;1.2.2 绘制直方图Analyze all cases, do not 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 7 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -统计指标只能给出数据的大致情形,没有直方图那样直观, 我们就来画个直方图瞧瞧!挑选 Graphs=Histogram ,系统会弹出绘制直方图对话框如下:将变量方案单价选入 内会绘制出如下直方图:方案单价 40302010Variable 挑选框内,单击 OK 按钮;
17、此时结果浏览窗口Std. Dev = 876.36 Mean = 2560.002000.02500.03000.03500.04000.04500.05000.05500.0N = 55.00计 划 单 价细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 8 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -1.3 按要求进行统计分析下面我们要用 SPSS 来做成组设计两样本均数比较的检验;1第一我讲 MEANS (平均值检验);这个是最简洁的,MEANS 的基
18、本功能是分组运算指定变量的描述统计量;包括均值MEANS ,标准差 STD DEVIATION ,总和 SUM ,观测值数目 COUNT ,方差 VARIANCE 等一系列单变量描述统计量;仍可以给出方差分析表和 线性检验结果;步骤:1)ANALYZE= COMPARE MEANS= MEANS ,打开 MEANS 对话框;2)挑选因变量,比如我们挑选房价作为因变量,(操作),可以一个,也可以多个,我们这里只讲一个,如我们挑选家庭人数作为 自变量;再在 OPTION 里挑选我们需要比较的数值;点 OK;现 在出来这个表:Case Processing Summary Cases 方案单价* 家
19、庭人N Included N Excluded N Total Percent Percent Percent 55 100.0% 0 .0% 55 100.0% 数Report 方案单价细心整理归纳 精选学习资料 家庭人数Mean N 10 Std. Deviation Grouped % of Total % of Total N 第 9 页,共 18 页 Median Sum 单身2090.00 31.623 2090.00 14.8% 18.2% 夫妻2231.25 16 415.883 2162.50 25.4% 29.1% 三口之家2333.33 15 659.726 2227.2
20、7 24.9% 27.3% - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -三代同堂3660.00 5 472.229 3475.00 13.0% 9.1% 其他3433.33 9 1335.103 3320.00 21.9% 16.4% Total 2560.00 55 876.356 2166.67 100.0% 100.0% 第一个图是对我们这次MEANS 过程的总结;其次个图是报告;从这上面看,基本的统计结果和数据一目了然;比如:假如我们抽取样本的时 候
21、提取的样本比例和整个购房者家庭情形的真实比例相符,整个从总访 问者所占的比重可以看到,单身,夫妻,三口之家所占的比重最大;那 么,我们是不是可以说:我们针对的消费群体主要是这三个群体而忽视 三代同堂和其他呢?我们是不是可以说我们的投资也按这个比例投 呢?(?)当然不是!由于我们也要考虑购买力!怎么样来衡量这个购房总价家庭的购买力呢?我们仍是用 MEANS ,不过这次因变量是总购房款;如图:家庭人数Mean N 10 Std. Deviation Median Sum % of Total N Sum 单身190000.00 31622.777 190000.00 7.8% 18.2% 1900
22、000 夫妻315625.00 16 149129.418 275000.00 20.8% 29.1% 5050000 三口之家353333.33 15 398616.656 192000.00 21.8% 27.3% 5300000 三代同堂900000.00 5 339116.499 775000.00 18.5% 9.1% 4500000 其他841111.11 9 691799.184 690000.00 31.1% 16.4% 7570000 Total 442181.82 55 437728.526 250000.00 100.0% 100.0% 24320000 从总房款所占的比
23、例: 单身 7.8% ,夫妻 20.8% ,三口 21.8% ,三代 18.5% ,其他 31.1% 看,我们更应当留意夫妻,三口,和其他三个群体,特殊是其他这个群体,我们的开发投资也很应当参考这个比例;那么这个结论不就和上面的结论不一样了么?所以,我想提示各位,肯定要挑选正确细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 10 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -(不是说虚假,而是挑选变量肯定要留意挑选正确的变量进行统计!)的统计数据和统计方法!
24、3)两个自变量的挑选和掌握:A两个分类均放在第一层(平行 +)的操作:I把家庭人数送入 INDEPENDENT LIST 框中,建立第一个掌握层;2把哪种建筑送入栏中建立其次个掌握层;3其中家庭人数有 5 个统计量,建筑风格有 6 个统计量;那么,对因变量的分析就是先给出家庭人数 5 个组的基本描述统计量,再给出建筑风格6 个变量的统计量;B两个分类变量分别放在两层(垂直*)的操作:a.同上挑选家庭人数b.单击 NEXT 按钮,挑选变量建筑风格,作为其次层;现在就分 5*6=30 组给出可以承担的单价的一些描述统计量:Report 购房总价家庭人数哪种建筑Mean N 10 Std. Devi
25、ation Grouped % of Total % of Total N Sum Median Sum 单身多层190000.00 31622.777 190000.00 7.8% 18.2% 1900000 夫妻Total 190000.00 10 31622.777 190000.00 7.8% 18.2% 1900000 多层216666.67 3 57735.027 216666.67 2.7% 5.5% 650000 三口之家电梯200000.00 4 .000 200000.00 3.3% 7.3% 800000 花洋300000.00 6 .000 300000.00 7.4%
26、 10.9% 1800000 联排600000.00 3 .000 600000.00 7.4% 5.5% 1800000 Total 315625.00 16 149129.418 275000.00 20.8% 29.1% 5050000 多层200000.00 1 . 200000.00 .8% 1.8% 200000 细心整理归纳 精选学习资料 电梯150000.00 8 32071.349 150000.00 4.9% 14.5% 1200000 花洋440000.00 5 54772.256 440000.00 9.0% 9.1% 2200000 第 11 页,共 18 页 - -
27、 - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -独立别墅1700000.01 . 1700000.00 7.0% 1.8% 1700000 0 三代同堂Total 353333.33 15 398616.656 192000.00 21.8% 27.3% 5300000 联排750000.00 4 57735.027 750000.00 12.3% 7.3% 3000000 其他独立别墅1500000.01 . 1500000.00 6.2% 1.8% 1500000
28、 0 Total 5 339116.499 775000.00 18.5% 9.1% 4500000 900000.00 电梯242500.00 4 15000.000 242500.00 4.0% 7.3% 970000 Total 联排800000.00 2 .000 800000.00 6.6% 3.6% 1600000 独立别墅1666666.63 416333.200 1800000.00 20.6% 5.5% 5000000 7 Total 9 691799.184 690000.00 31.1% 16.4% 7570000 841111.11 多层196428.57 14 365
29、02.296 200000.00 11.3% 25.5% 2750000 电梯185625.00 16 46038.933 190000.00 12.2% 29.1% 2970000 花洋363636.36 11 80903.983 355555.56 16.4% 20.0% 4000000 联排711111.11 9 92796.073 716666.67 26.3% 16.4% 6400000 独立别墅1640000.05 304959.014 1700000.00 33.7% 9.1% 8200000 0 Total 442181.82 55 437728.526 250000.00 1
30、00.0% 100.0% 24320000 c.同样我们可以分第三第四层;那样,统计结果的数目就会急剧扩大;CANOVA TABLE AND ETA复选项和 TEST FOR LINEARITY复选项;(操作)我们把第一层建筑类型,其次层人口和一为人数二为建筑分析作比较;可得图:ANOVA Table Sum of 购房总价Between Groups Combined Squares df 4 Mean Square F Sig. 97912795624478198922220.342 .000 * 哪种建8903.310 25.830 筑细心整理归纳 精选学习资料 Linearity 71
31、88769391 71887693988647.102 .000 8856.720 56.720 Deviation from 2602510173 8675033900178.089 .000 Linearity 0046.596 5.532 第 12 页,共 18 页 - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -Within Groups 55545861250 11109172258.914.863 297 Total 10346738154 8181
32、8.180 Measures of Association 购房总价* 哪种建筑R R Squared Eta Eta Squared .834 .695 .973 .946 每个数据见统计分析P219;略;比较重点的就是J结果性的:SIG- 显著性概率,即假设成立的概率,我们这里是假设是:这几个建筑组的房屋总价均值相等;即这个假设发生的概率是 其房屋总价的均值差异显著!0.000 接近 0; 由此我们得出结论:不同的建筑组,R- 是因变量总房款的观测值和猜测值之间的相关系数,虽然没有直接求出回来方程,但 我们应当知道,R越接近 1说明回来方程的猜测性能越好;即回来方程越有效;这里看到 R值等
33、于 0.834 ,说明回来方程猜测性能很好;Eta SQUARED- 等于(组间偏差平方和BETWEEN GROUPS) /(组内偏差平方和WITHIN GROUPS)等于 0.946 ,越接近 1说明因变量(总价)与掌握变量(建筑)关系亲密;假如 ETA等于 0就是说他们无关;这个图说明白什么呢?由于SIG 近似为 0.000 就说明白房屋的总价和房屋的建筑方式是特别相关的;不同的建筑方式对房屋的总价的 平均值存在特别显著的差异的!并且总价的平均值是和房屋的建筑 方式呈上升趋势的;现在又举例说明房屋总价按人口数目分组后是不是也呈显著的差异呢?(实际举例操作一遍;并说明每个指标)2T TEST
34、 (T 检验的过程)略 A单一样本 T 检验:检验单个变量的均值是否与给定的常数之 间存在差异;例如:我们想知道这个地方的消费者能够接受 的价格平均数(我们的统计数据)和给定的常数(比如说经 验丰富者估量这个地方的均价;)之间存在的差异;细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 13 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -已知我们把住宅的均价定在2500 ,我们现在判定我们所考察地区的消费者能接受的房价和我们定的房价比,是不是差异很大或就接近,
35、有什么差异!步骤:1建立无效假设 H0:假设两个数据相等2ANALYSE= COMPARE MEAN= ONE SAMPLE T TEST 次序挑选;One-Sample Statistics Std. Error 方案单价N 55 Mean Std. Deviation Mean 2560.00 876.356 118.168 One-Sample Test Test Value = 2500 95% Confidence Interval 方案单价t Df Sig. 2-tailed Mean of the Difference Difference Lower Upper .508 54
36、 .614 60.00 -176.91 296.91 3由图做结果分析:a. 样本均值 2560 与 2500 比较,略高b. T 值 0.508 ,自由度 54,双尾 T 检验的 P 值为 61.4% 5% ,说明无效假设成立,即: 我们定的房价的均值和消费者预期的房价的均值基本相等c.CONFIDENCE INTERVAL OF THE DIFFERENCE差值的 95%置信区间;说明白: 消费者期望的均值和我们细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 14 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料
37、- - - - - - - - - - - - - - -定价的差有 95%的可能性落在 -176.91-296.91 之间;B独立样本的 T 检验:要求被比较的两个样本彼此独立,即没 有配对关系;而且均来自正态总体;而且均值是对于检验有 意义的描述统计量;例如:从付款方式来说,一次付款和按揭两种情形消费者期望的单价是不是有显著性差异?Group Statistics Std. Error 方案单价付款方式N 42 Mean Std. Deviation Mean 一次付2628.57 961.525 148.366 按揭12 2358.33 492.597 142.200 Independe
38、nt Samples Test Levenes Test for 方案单价Equal variances Equality of Variances t-test for Equality of Means 95% Confidence IntervaUSig. Mean Std. Error F Sig. t df 2-tailed Difference Difference Difference 4.880 .032 .935 52 .354 270.24 289.140 Lower -309.964 assumed Equal variances 1.315 36.40.197 270.
39、24 205.508 -146.389 not assumed 9 MEANS说明白STD DEVIATION 标准差;假如两组相差太大就没有统计意义;假如差别有统计意义就要使用校正 T检验;从SIG的 P值可以看到,显著性概率为 0.032 0.05 ,因此结论是两组方差差异显著,下面的T检验过程结果中应当挑选 EQUAL VAARIANCES NOT ASSUMED (假设方差不相等);从双尾 T检验的结果 0.197 0.05看,并无显著性差异!细心整理归纳 精选学习资料 MEAN DIFFERENCE 205.508 第 15 页,共 18 页 STD; ERROR DIFFERENCE差值的标准误差为差值的置信区间是-309.964854之间 - - - - - - - - - - - - - - - - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -C配对样本的 T 检验:要求被比较的两个样本有配对关系;要求两个样本均来自正态总体;而且均值是对于检验有意义的描述统计量;均值的配对比较是比较常见的;(略)D这里我举例的时候犯错了 ,用 T 检验有一个重要的条件就是样本量肯定要相等或就差不多才有可比性 ,肯定切记哦 . 3ONE-WAY ANOVA 过程;(略)1.4 储存和导出分析结