1、基于BP神经网络的住房租金预测研究.docx

上传人:一*** 文档编号:69096732 上传时间:2022-12-30 格式:DOCX 页数:9 大小:75.49KB
返回 下载 相关 举报
1、基于BP神经网络的住房租金预测研究.docx_第1页
第1页 / 共9页
1、基于BP神经网络的住房租金预测研究.docx_第2页
第2页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《1、基于BP神经网络的住房租金预测研究.docx》由会员分享,可在线阅读,更多相关《1、基于BP神经网络的住房租金预测研究.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、青岛黄海学院2019届毕业设计(论文)1、绪论1.1.1研究背景当今社会,一谈起租房,人们往往想到的是高房租,不论哪个国家,面临的住房租赁市场都比较严峻,在国家政策方面,推进福利政策,使大中人群有房子住,这一举措极大的推动了我国房地产市场以及商品房租赁市场的发展。从某个角度来看,月租金的高低对住房租赁市场的发展起了决定性因素,是目前面的一大难题。近几年来,城市房价收入比维持在7.0左右,远远超过世界银行规定的3-6的标准,近几年来,北京房租收入比高达13,这无疑给人们的住房问题带来很大的影响,就目前的状况而言,房租的高低还需考虑。1.1.2研究意义从人口特征来看,城乡流动人口愈来愈多,人口的不

2、稳定性和收入的限制,使得租房越来越受到大家的欢迎,为了逃避高房价的压力,人们不得不选择租房子。这其中的流动人口主要为在外工作人员、应届毕业生,大多为中低收入人群,外出就业主要选择一二线发达城市,因此增强对一线城市商品房租赁价格的研究和分析,明确住房租金的发展趋势,无论是对我国房屋租赁市场的发展、还是租户选择合适的住房,都具有重要的意义。经济和科技的迅速发展,也带动了住房月租金的增长,月租金受城市宏观经济政策、人群收入及就业政策、土地市场、地理位置因素、周边交通因素、住房格局等多元因素的影响。就租房这个常规行业来看,从提供方讲,房东想获得较高的租金,获得更大的利益;从使用方讲,租客因为收入压力,

3、想寻找低价房源,就此产生的信息不对称性问题,使得住房租赁市场停滞不前。依据商品房的住房格局、交通便利度等主体特征对其月租金进行预测并通过数字信息呈现,为房东和租客提供相应参考,人们可以根据拥有同等性质的住房,结合自身因素,选择合适的房源,也为住房租赁市场提供依据。1.2国内外研究现状1.2.1国外研究现状对于租房这个传统行业,国外学者主要从住房租金满意度、收入以及工资等外部因素分析对住房租赁价格的影响。比如:ArmandsPutis根据相互评价指标对房屋租金满意度进行评价,建立多目标规划模型和单目标线性规划模型,得到稳定且有效的分布结果,这使得分配中效率和公平问题得以有效解决。Clark,Ni

4、kLomax通过计算房屋租金的收入弹性,展示出日本的普通民众在二战后参与改善住房条件活动的多少,结果表明人群幸福感指数的增高,使更想拥有自己的房子。1.2.2国内研究现状国内对神经网络的应用多集中在生物科学、电子科学、计算机科学、医学等领域,神经网络是通过类似于神经元信息传递的方式对数据资料进行复杂的处理,BP神经网络模型针对非线性、多影响因素的住房租赁价格预测非常适合。弓亚伟(2016)从理论层面分析保障性住房定价原则,描述月租金的上升趋势,从成本因素、收入因素、国家对市场的定价干预分析对房租高低的影响,建立住房租金定价模型,实证分析平均月收入与租金的测算关系,为公租房定价提供依据。郝晨帆(

5、2018)从住房支付能力方面对公租房定价进行研究,对居民可支配收入进行计算,发现人们可以支付的起公租房租金,通过研究,可以使公租房在定价过程中考虑中、低收入者的需求,进而科学的定价。1.2.3综述综上所述,学术界对住房租赁价格的研究比较广泛。总结学者研究经验,从公租房层面来讲,发现收入、市场租金和建设成本对住房租金定价都有一定影响,但这些文献忽略了对商品房租金定价的研究。还可以发现,学者们对住房租金的研究一般都从外部因素入手,很少有从房屋本身性质方面进行研究的。1.3主要研究内容本文基于城市规模变大,城市流动人口增多,租房形式越来越普遍的前提下。首先,基于要平衡租客和房东之间的信息不对称目的出

6、发,选取某一线城市2000组住房资料数据进行研究和分析。其次,借助Pycham软件查看住房资料数据的异常值,分析变量间的相关性。然后,借助程序,以多元组影响因素为输入变量,月租金为输出变量,对2000组住房资料数据构建BP神经网络模型,最后,通过训练好的神经网络关系模型预测得出住房租赁价格。为租房市场提出合理化建议,进而使中、低收入者住有所居。2相关理论2.1我国住房租赁市场现状一谈起房地产市场,人们往往想到的是过高的房价,随之带来了我国的平均房价收入比不断增加。流动人口的不断增长,使得租房比例迅速上升,据国家统计局整理,2015年我国租房占比已达到了67%,而在这其中40%的租赁来源是商品房

7、,由此可见,租房多次受到人们的热捧,尤其是商品房。国家自颁布住房改革方案以来,对中、低收入群体尤为重视,尽可能的保护中、低收入者的切身利益,完成住有所居的关键举措。就理论研究来说,房屋租赁价格的制定没有固定的标准和方法,各省份及各城市的确定标准也不相同。租赁住房租金的确定对租赁住房的永续发展具有重要意义。就现实研究来说,21世纪以来,住房月租金由宏观经济政策(外部因素)、主体因素(内部因素)、国家政策(国家因素)等多元因素综合决定,信息的不流通使得对租房行业面临资源浪费的风险。原因有二:第一,房东只考虑自身利益,把租金提的过高;第二,租客找不到高性价比的住房,因此,国家应促进房屋月租金的合理定

8、价,保护多方利益。住房体制改革不断推进,除了给房地产老板带来机遇外,也带动了房租的上涨,也给住房一级市场巨大的反作用,住房租赁价格以及成交量明显提升,过高的月租金已经让应届大学生束手无策。对住房月租金合理定价,维护市场的未定发展。2.2神经网络模型2.2.1人工神经网络人工神经网络,有类似于树突的部分,用于接收并收集外界资料信息,将其连接为一个集合,传递给胞体,而后传递给下一个神经元,如图1:如图1所示,传入层V通过w向“树突”传递信号,连接到组合函数(.),经过u传递到激活函数A(.),输出为Z,传输给下一个神经元。如图1所示,人造神经元汇集外界资料信息,以传入层(v1、v2、v3)的形式,

9、将信号传输给中间层(组合函数、激活函数),经过复杂的训练,将训练结果以传出层的形式传递给外界,完成对数据资料的预测。在该模型中,传入层比较随意,能对不同数目的输入变量进行处理,与之相对应,输出层中变量个数也可多可少,对一个或者多个变量都具有较好的预测能力,比如,因变量可能有N(N2)个,自变量间可以是互相有关联的线性相关,也可是不相关关系,同样,因变量可以具有较高的相关性,也可互相不相关。从常理上来看,人工神经网络对输入变量和输出变量间非线性关系的情况更适用,在信息传递过程中,中间层的确定至关重要,它负责对外界信息处理的工作,中间层的数目也具有弹性,当然,隐含层过多,会拖慢学习效率,使得训练的

10、实际时间变长,如果层数太少,不能有效的处理外部传递进来的资料,预测结果反而不好,误差变大,结果不具有可参考价值,因此在训练过程中,对隐含层的确定要谨慎。就当前研究背景来看,大多数受欢迎的神经网络模型都是对线性模型的推广,不同于一元或多元线性模型,神经网络它通过连接函数连接到系统成分中,其中是Y(因变量)的位置参数。令,此时,假设使用传出层中的线性模型可令,h是中间层(隐含层)的输出变量向量值。假设A为传出层的激活函数,令传出值为。当时,可得,此时可见,神经网络算法与广义线性模型使用了同等的连接函数,类似于广义线性模型,神经网络模型可以使用多种多样的Y。误差函数是指与的差异,其中是检测值i的,预

11、测值与期望值差值越小,证明结果更好,如果输出层是非线性关系时,可通过偏差来计算误差。2.2.2BP神经网络2.2.2.1BP神经网络原理目前最受欢迎的人工神经网络有DCIGN、BiSTM、DCGAN、BP等,在这其中BP神经网络最受欢迎。不同于人类神经元传递信号过程的是,BP神经网络是人工的,通过反向的方式传递信息,与传统的人工神经网络相同,BP神经网络分别是由传入层(输入变量)、中间层(隐含变量)、传出层(输出变量),它通过对数据资料学习和映射,得到预测值。为了提高模型的准确度,得到最优结果,BP神经网络传播过程分为两步,具体表现为信号从外到内的传输和误差从内到外的传输。但这两个过程并非同时

12、进行,第一步,信号从外部经过三次打磨,到达内部,误差随即开始传输,反向重复信号传输的过程,这两个过程反复训练和学习,误差训练到较小的水平,模型结束,输出结果,当然,这是一个构建模型并反复修正的过程,如图2所示:BP神经网络是前人经过多次失败的尝试,产生的新理论,它是通过误差反向传递算法提出的,本意是通过构建线性方程的方法,将外界信息,经过多次训练,传递给输出层,得到最终的预测。BP神经网络是用软件模拟,并通过不停的迭代,寻找最优预测值的过程,它是基于最速梯度下降法训练学习的过程。第一, 确定下降方向,规定负方向为最优下降方向:第二,沿负梯度方向展开训练,选择点,其中为:第三,在此过程中需满足:

13、结果希望训练中的最小点是。当然最速梯度下降法也有一定的弊端,通过最速“梯度下降”法进行训练,得到的结果可能是区间的最小值。2.2.2.2BP算法的步骤对于BP神经网络而言,不停的模拟训练的过程,可总结为八个部分。第一步,数据标准化,通常是将数据处理到绝对值1以内,计算学习训练次数以及精度。第二步,计算期望,这里狭义的指定是输出量的期望。第三步,前期工作准备完成后,这时要确定传入层、中间层和传出层的层数,研究表示,中间层的确定对预测结果的影响巨大,理应慎重。第四步,计算误差,如果近似为线性关系,可以直接计算误差,如果关系较为复杂,可以通过误差函数与传出层的偏导数的计算来确定,例如指数分布。第五步

14、,分别计算各层之间的连接权值以及误差函数的偏导数,计算过程如下:第六步,计算误差函数的偏导数,对误差和误差函数进行分析,为了得到最理想的预测结果,通过偏导数对谅解权值进行修正。第七步,计算误差,观察模型预测结果是否良好,模型是否可靠。第八步,分析模型结果,观察误差是否与设定的期望误差相近,学习次数是否大于假设的学习次数,如果符合规定,结束模型的训练,若不相符,选取合适的精度和学习次率,重复上述过程,不断的修改模型,直到达到合适的精度,进入下一步学习过程。对第八步函数注释说明:(1) 双曲正切S形(2) 对数S形转移函数(3) 线性函数3.实证分析3.1模型的可行性分析BP神经网络适合于较大的数

15、据量的预测,适合于线性或者非线性关系的变量,房屋月租金受位置地段、装修状态、厅卫数量等多元组因素的影响,月租金以及其影响因素之间是复杂的多元关联,BP神经网络模型可以经过传入层将影响月租金的自变量信息传输给中间层,借助机器模仿人脑的信息传递和转译,将外界信息进行复杂的训练,传输给传出层,得到预测值,BP神经网络的自变量可选择的余地比较宽泛,对非线性关系变量的研究具有一定优势。在预测过程中要注意学习速率的确定,过高会使得预测结果不准确,过低会拖慢运行速率,同样,神经元层数的确定也很关键,选择较多的神经元会避免在预测过程中,前文提到的最速梯度下降法,要求数据训练到极小值,进而使得预测结果更精确。本

16、文在选择模型时为了将误差降到可接受的范围,从住房本身性质出发,选择最适合的预测模型,得到更实用的结果。流动人口的增加将我国住房租赁市场推到高潮,完成住有所居已经变成我国当前不可逃避的任务,房屋月租金作为房地产市场重点参考对象,预测精度是否准确以及模型是否适合对我国住房租赁市场的发展具有重大的意义。我国当前对住房租赁价格的探索大多针对公租房租金的研究并且是从国家经济、个人收入、消费习惯等外部因素入手,忽略了对商品房租金的预测。本次研究,从商品房租赁市场出发,就住房本身的内部信息,如小区房屋出租数量、房屋面积、居住状态、卧室数量等19个影响因素出发,借助Pycham软件提取特征,构建BP神经网络模

17、型对资料数据进行分析,通过传出层预测房屋月租金,基于上述理论是完全可行的。3.2模型的建立和求解3.2.1变量说明本文选取某一线城市2000组2018年1-3月经过专业脱敏的住房资料数据,针对月租金展开预测,作为一种绝对数指标,它不仅能够反映租赁市场的情况,也从侧面说明了住房一级市场的发展状况。住房租金的过高或者过低将直接影响到租客及房东的切身利益,从而关系到国家的长治久安。针对月租金的多元组影响因素构建模型,预测我国一线城市住房租金,具有不可忽视的意义。所谓数据脱敏,是使用java语言,粉碎敏感信息,经过有规律的变形,保护住户的隐私,既不丧失数据真实性又不会侵犯个人隐私。本文选取19个影响月

18、租金的特征作为自变量:卫的数量()、房屋面积()、厅的数量()、卧室数量()等(其他变量及命名见附录一),选择10组数据进行展示,如表:3.2.2数据预处理查看数据的缺失值将原始数据导入Pycham软件,做数据的缺失率观察。得到表3和图3:根据表3和图3可知,居住状态、装修状态和出租方式这三个特征严重缺失,已经超过了85%,造成的原因可能是国家在统计过程中,未得到确切的信息;距离、地铁站点、地铁线路超过半数的数据缺失,可能是小区周边距离地铁站点较远,忽略了对地铁相关信息的统计,其他特征缺失值较少。从现实意义来说,装修状况、居住状态和出租方式这三个特征量对月租金影响较大,但在统计过程中,缺失率较

19、大,不容易填补,做删除处理,其他影响因素做保留处理。查看特征变量之间的相关关系借助Pycham软件,做热力图,观察多元组特征变量之间是否相关。两变量之间的线性相关关系可通过线性相关系数去度量,相关系数有三种表现形式:(1) Person相关系数皮尔逊相关系数是统计工作中最受欢迎的相关系数,通过衡量变量间尺度的差异来定义变量间的相关关系。计算过程如下:该式主要针对样本观测值进行定义,分别表示两个样本值,r越大,相关关系越大,反之,则越小,当r=0时,两变量间不存在线性关系,但可能还有其他关系,例如:多元方程关系、指数方程关系、对数方程关系等。(2) Spearman等级相关系数在实际统计工作中,

20、由于变量资料的来源不同,特征也就存在很大差异,当衡量变量间的尺度为顺序尺度时,使用该相关系数,运算过程如下:它适用于小样本(30),非正态分布及衡量数据标准为顺序尺度。(3) Kendall相关系数计算过程如下:其中U为一致对数目,V为非一致对数目:当U较大,V较小时,两者呈现出较强的正相关性,反之,负相关关系,如果一致对数目与非一直对数目相近时,两者之间存在其他关系的可能性较大。热力图可以是一种或多种相关系数的计算,一般是Pearsoncorrelationcoefficient的计算,本次研究分析特征变量与月租金的皮尔逊相关关系,忽略房屋朝向(非数据信息)和id两特征变量,在删除严重缺失的

21、三个特征变量(装修状况、居住状态和出租方式)的基础上,借助Pycham软件做热力图(程序见附录一),如图所示:根据热力图可知,剩余的14个特征变量与月租金之间线性不显著,卫的数量、房屋面积、厅的数量、卧室数量这四个特征量与月租金相关度较大,其他特征明显低于0.2。因此本文选取卫的数量、房屋面积、厅的数量、卧室数量这四个特征量分析其与月租金的关系,并作为自变量预测月租金。在数据清理完成后,借助Pycham软件,做出房屋面积与月租金对比的散点图根据图可知,房屋面积与月租金之间是正相关关系,卧室的数量、客厅的多少和卫生间的数量与月租金也存在正相关关系,散点图见附录二。3.2.3最小二乘预测用常规的最

22、小二乘法构建以住房月租金为因变量,自变量是热力图筛选出的四个特征变量的多元线性回归模型:借助Eviews10对2000组住房资料数据进行最小二乘回归,结果如表:根据表可知,最小二乘拟合方程为:Prob(F-statistic)0.05,表明方程显著,通过检验,房屋面积、卧室数量、厅的数量、卫的数量的P值均小于0.05,显然可知,回归系数通过显著性检验。,证明在最小二乘回归中,回归直线解释了接近40%的信息,大约有60%的信息不能被回归直线解释,拟合效果较差,线性相关关系不明显,说明这四个特征量与月租金的关系不能很好的通过线性回归来解释。3.2.4BP神经网络模型的建立与求解3.2.4.1BP神

23、经网络模型的训练(1)确定输入层和输出层选取2000组住房资料相关数据作为样本,以2000乘5的矩阵传入Matlab软件中,在这其中,以上述过程删选出的四个特征变量为输入变量,在BP神经网络中用int表示,以月租金(y)作为传出变量,在BP神经网络中用out表示。(2) 确定隐含层隐含层数量计算公式为:此处,m表示输入层个数,z代表的隐含层数量,本文中取4,n为输出层个数,本文中取1,a的取值范围是(0,10),经过多次尝试,本次研究中,a取4,选用最速梯度下降的方式,用来训练BP神经网络,均方误差0.0001,训练50000次,通过Matlab软件,预测月租金,选取10组数据进行展示,如表(

24、程序见附录三):做预测月租金与实际月租金的对比图,如图所示:根据表可知,差距较小,上下波动幅度较小,误差较小,表明该模型可靠性很大,预测结果真实。根据图可知,预测月租金和实际月租金曲线吻合度较高,表明针对住房月租金的预测,BP神经网络模型比较可靠。3.2.4.2住房月租金的预测继续选取100组2018年4月缺失月租金的测试集,用模型预测4月份的月租金,传入层设为4,中间层选用6,传出层设为1,取0.05的学习速率,0.0001的均方误差,训练50000次,借助Matlab软件,预测未知的月租金,选取10组数据进行展示,如表(程序见附录四):根据表可知,卧室的数量极大的影响住房月租金,当卧室数量

25、为3时月租金明显高于卧室数量是2时,同样,都大于卧室数量为1时的月租金,其次,卫的数量对月租金也存在较大的影响程度,比对7和10,7与10相差1个卫的数量,月租金相差2左右,当其他变量相同时,房屋面积也可能会对月租金形成一定的影响,但相差不是太大,例如1,2,3。4. 结论与建议本文以房屋自身特征为分析对象,基于2000组某一线城市的实际住房资料数据,预测住房月租金的大小,基于学者研究文章的预测结果,得到如下结论:从国内外学者研究可知,住房月租金受收入弹性、国家政策、房屋收入比、房地产市场等外界因素的影响,而在这其中,国家政策对月租金有很大程度的影响,国家政策的变化将直接影响到国家宏观经济的发

26、展,也间接的影响到国家住房市场土地的供给,从而给住房月租金从外界施加过大或者过小的压力。本文主要从房屋主体出发,就成本因素、区位因素、房间数量、交通便利度等内部因素出发,分析房屋月租金的高低程度,在这其中,房间的数量对月租金的也有比较大的影响,卧室数量的多少直接影响到租金的大小,当然,房屋面积及客厅的数量也会很大程度的左右月租金的确定。装修状态、出租方式和居住状态也可能会极大的影响租金的确定,不过,在查找数据时,未得到确切的数据,致使缺失率较高,没能研究这几个特征变量很是遗憾。关于上述结论,提出如下意见:第一, 人们收入的增加使得追求幸福的愿望更强烈,大多数人们通过外出打工获得更多的收入,国家

27、对该流动人口的关心及扶持力度还是不够,应提高福利保障制度,增加租房补贴,改善一二三线城市关于租房保障的制度,可以适当平衡外来人口与本地人口地方政策,控制宏观经济以及通货膨胀率,对落户、教育、医疗适当补贴,从而保障流动人口住有所居。第二, 经济的发展使得人们幸福感指数也不断增加,这使得人们普遍喜欢大户型的房子,房地产市场也紧抓大多数人的喜好,设计户型,反而增大了房子的成本,中低收入者人群解决住宿问题变成一种奢望。房地产市场可以改变户型样式,为中低收入者提供低成本的房子。第三, 大量的流动人口中,应届大学生和农民工又占了大多数,开始工作的初期,可以选择与其他人合租的方式,解决住宿问题。本文研究中,最速梯度下降法达到的最小值可能是某个区间的极小值,需要在训练的过程中,反复修改参数,达到最优的预测效果,还需要在日后的学习中改善模型,得到最准确的预测值。9

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁