《城市小区推荐系统的设计与实现,软件工程硕士论文.docx》由会员分享,可在线阅读,更多相关《城市小区推荐系统的设计与实现,软件工程硕士论文.docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、城市小区推荐系统的设计与实现,软件工程硕士论文摘 要 随着社会的发展,海量数据在给人们带来生活便利的同时也带来了困扰。以用户购房为例,海量房源数据使用户容易陷入信息过载的泥潭,难以获取到有效数据;并且区位资源已经成为用户购房考虑的重要因素,但是用户难以将自个对于区位资源的需求同房源数据关联起来。本文针对以上用户购房时碰到的问题进行设计实现。 系统由六个模块组成,分别是数据台账、查询统计、区位资源、房源推荐、房源比照和个人信息。数据台账模块展示整体房价和区位资源的情况;查询统计模块面向用户提供房源查询;区位资源模块从不同角度为用户提供区位资源相关服务;房源推荐模块根据用户信息进行房源推荐;房源比
2、照模块用于对不同房源进行比照分析;个人信息模块用于个人信息管理。在房源推荐模块,本文在推荐算法研究的基础上针对实际情况,提出一个基于内容推荐和基于用户协同过滤的混合推荐模型,将基于内容的推荐算法和基于用户的协同过滤算法采用级联式的方式组合,并结合 K-Means 算法进行房源数据粗分类、通过矩阵计算得出用户兴趣偏好、使用灰色关联分析求出房源间的相关联度。最后使用 NDCG 和Coverage 两种评估指标将模型与传统推荐算法的实验结果进行比照分析,验证本文提出的混合推荐模型在 NDCG 评估指标可到达47.8%,Coverage 到达43.3%,相比传统推荐算法在推荐效果上具有很大的提升。 最
3、后系统通过测试,能够帮助用户快速获取想要查找的信息、推荐房源等,有效解决用户购房时的烦恼,具有实际使用价值。 本文关键词语: 混合推荐模型;房源推荐;区位资源;用户兴趣偏好 。 Abstract With the development of society, massive data brings convenience to people s life, but alsobrings trouble. For example, the massive housing data makes users easily fall into the mire ofinformation overl
4、oad and difficult to obtain effective data; And location resources have becomean important factor for users to consider when buying houses, but it is difficult for users toassociate their demand for location resources with the data of housing sources. This paper isfaced with the above problems encou
5、ntered by users to design and implement. The system consists of six modules, which are data account, query statistics, locationresources, housing recommendation, housing comparison and personal information. The dataaccount module shows the overall housing price and location resources; The query and
6、statisticsmodule provides the function of house source query for users; Location resource moduleprovides users with location resource related services from different perspectives; The housingrecommendation module recommends the housing according to the user information; Thehousing comparison module
7、is used for comparative analysis of different housing sources; Thepersonal information module is used for personal information management. In the listingrecommendation module, based on the research of recommendation algorithm, this paperproposes a hybrid recommendation model of content-based recomme
8、ndation and user basedcollaborative filtering, which combines the content-based recommendation algorithm and userbased collaborative filtering algorithm in a cascade way, and combines k-means algorithm toroughly classify the listing data and construct the matrix calculate the user s interest prefere
9、nce,use the gray correlation analysis to get the correlation degree between the houses. Finally,NDCG and Coverage are used to compare the experimental results of the model and thetraditional recommendation algorithm. It is verified that the hybrid recommendation modelproposed in this paper can achie
10、ve 47.8% in NDCG evaluation index and 43.3% in Coverage,which has a great improvement compared with the traditional recommendation algorithm. Finally, through the test, the system can help users quickly get the information they wantto find, recommend house source and so on, and effectively solve the
11、 problems of users whenbuying houses, which has practical value. Key Words : Hybrid Recommendation Model; Housing Recommendation; LocationResource; User Interest Preference 。 1、绪论 1.1、 研究背景及意义 。 在过去的二十年里,中国互联网迎来了高速发展的黄金时期,而“互联网+ 、“人工智能 、“5G 等口号也从科研人员口中走向了寻常百姓家。互联网的大力发展,再给人们带去便利的同时,也带来了很多的困扰。新“摩尔定律 指
12、出互联网上的信息量仍以每六个月翻一倍的速度增长1。在如今大数据时代中,很多的互联网用户在海量数据中感到迷茫,深陷于信息过载的泥潭中。而过去的二十年,也是我们国家的房地产发展的黄金阶段,全国各地随处可见正在修建或者准备开发的新楼盘,但是房地产信息产业却没能紧跟发展脚步,也陷入了信息爆炸的泥潭,而很多互联网企业却捉住时代发展的时机,根据用户数据分析出用户偏好,进而进行个性化推荐,实现精准营销。例如阿里巴巴根据用户的淘宝账号的个人信息和交易数据对用户进行构建用户画像,来实现商品的精准推荐;如亚马逊、京东的推荐系统也是基于用户线上消费数据进而构建用户画像来实现精准营销2,进而促进整个产业链的发展。房地
13、产信息产业无法向很多互联网企业一样,根据用户信息数据,帮助用户迅速找到有效房源数据,既束缚了本身的发展,又给用户购房增加了烦恼。 另一方面如今随着社会的不断进步,时代观念的也在悄然发生变化。过去用户购房更多的考虑是自个能够拥有一个生活住所,而不会考虑其他的社会因素;如今用户出于各种原因此需要购买房屋,因而在进行购房时通常需要综合考虑众多因素,尤其以房价、房屋面积等房源因素和娱乐资源、学区资源、医疗资源等社会因素。除此之外高昂的房屋价格,导致很多人购房愈加慎重,上述原因从另一角度给购房用户在看房购房时增加了困扰。 推荐系统起源于上个世纪90年代,是一个通过挖掘海量数据,寻找数据之间关联的智能系统
14、,经太多年的研究和发展,推荐技术已经相对成熟并且得到广泛应用。推荐系统通过收集和分析挖掘用户过去的行为数据和其他信息,根据分析结果对用户和物品去建模,再结合推荐算法实现符合用户需求的产品推荐。推荐系统已经在电子商务、社交网络、新闻、广告等多个领域证明它的强大能力,而很多互联网公司也纷纷将推荐系统应用到自个的产品中,并且产品大获成功。 本文从用户购房的实际情况出发,设计实现了城市小区推荐系统。通过利用推荐系统强大的挖掘能力在海量数据中快速、准确、高效的找出用户需求的小区,除此之外结合用户购房时对于社会因素,尤其是房源的区位资源因素的考虑,根据用户的基本信息,为购房用户进行房源推荐,帮助用户解决看
15、房购房时的困扰。 【由于本篇文章为硕士论文,如需全文请点击底部下载全文链接】 1.2、国内外研究现在状况. 1.3、论文的主要研究内容. 1.4、 论文主要工作及组织构造. 2、相关技术研究 2.1、网络爬 虫技术. 2.1.1、网络爬 虫原理. 2.1.2、网络爬 虫策略. 2.2、推荐系统框架 2.2.1、协同过滤算法. 2.2.2、基于内容的推荐算法 2.2.3、混合推荐算法. 2.3、聚类算法. 2.4、本章小结. 3、系统分析. 3.1、系统客户分析. 3.2、系统可行性分析. 3.2.1、经济可行性. 3.2.2、技 术可行性. 3.2.3、操作可行性 . 3.3、系统功能需求分析
16、. 3.4、系统非 功能需求 3.4.1、性能 需求 3.4.2、界面 需求. 3.4.3、算法 需求. 3.5、本章小结 4、系统设计 4.1、系统概要设计 4.1.1、系统总 体架构设计 4.1.2、系统功能架构. 4.2 、系统具体设计 4.2.1、资源区位数据获取 4.2.2、数据 台账模块. 4.2.3、查询统计模块. 4.2.4、区位资源模块. 4.2.5、房源推荐模块 4.2.6、房源比照 模块. 4.2.7、个 人信息模块 4.3、数据库 设计. 4.3.1、 概述. 4.3.2、关键 表设计. 4.4、本章小结. 5、混合推荐模型. 5.1、基于内容推荐和基于用户协同过滤的混
17、合推荐模型 5.1.1、算法整 体流程设计 5.1.2、基于用户的协同过滤算法 5.1.3 、KMeans 聚类算法 5.1.4、用户 兴趣偏好计算 5.1.5、灰色 关联分析 5.1.6、基于内容的推荐算法. 5.2、实验数据. 5.2.1、数据 来源. 5.2.2、特 征提取 5.3、实验结 果 5.3.1、评估指 标. 5.3.2、实验结 果分析 5.4、本章小结 6、系统实现与测试 6.1、爬虫网络实现 6.2、系统实 现 6.2.1、数据 台账模块实现 6.2.2、查询统计模块实现 6.2.3、区位资源模块实现 6.2.4、房源推 荐模块实现 6.2.5、房 源比照模块实现 6.2.
18、6、个人信 息模块实现 6.3、系统测试. 6.4、本章小结 . 结 论 本文在用户在购房场景下面对海量房产数据,难以找到有效数据以及购房用户无法将房源信息与区位资源结合考虑的背景下,结合自个研究学习的内容,设计开发了城市小区推荐系统,帮助用户解决找房难、找房不满意的问题。华而不实在面对传统推荐算法在房源推荐上效果不佳的背景下提出了一种基于内容推荐和基于用户协同过滤的混合推荐模型,并通过实验证明该模型相比传统推荐算法在房源推荐上具有更好的推荐效果。 用户利用此系统既能够整体了解该地区房价整体变化和整体区位资源分布,可以以具体了解某一处房源信息和周边区位资源情况,系统根据用户个人信息为用户进行房
19、源推荐。 本文主要完成的内容如下: 1通过网络爬虫的方式,爬取实验所需要的部分数据。包括小区房源数据和区位资源数据,并将爬取的数据和国土资源局提供的房产交易数据进行整合分析处理。 2在传统推荐算法的研究基础上,提出一种基于内容推荐和基于用户协同过滤的混合推荐模型,并通对该模型与传统的推荐算法进行实验比照分析,验证该模型在房源数据上具有更好的推荐效果。 3开发了城市小区推荐系统,实现系统的主要功能。包括区位资源信息分析和查询、房源信息查询、房源推荐、房源比照等功能。在系统设计上结合Map VGL的地图组件,将相关数据通过地图形式进行展示,让用户对于房源和区位资源有更直观的了解和认识。 本文基于本
20、身所学内容完成对以上内容的分析、设计和实现,但是由于个人本身能力有限,对推荐系统和推荐算法的学习有限、在系统设计上也有存在欠考虑的地方,因而系统还需要进一步改良和完善,因而下一步的工作计划如下: 1继续研究推荐算法,考虑对算法进一步改良,通过调整参数、融合其他推荐模型等方式方法来进一步提高推荐结果的准确率。 2系统设计所使用的数据是用户显式反应数据,后面将尝试通过将用户显式反应数据和用户隐式反应数据结合,进一步提取其他用户特征以及用户购房时其他购房考虑要素,并进行实验。 3系统设计方面也有考虑缺乏的地方,下一步也将对系统进行进一步的测试和完善。 以下为参考文献 1 吴瑶瑶,杨庚. 云环境下分布
21、式文件系统负载平衡研究J. 计算机工程与应用, 2022,55(10): 67-72. 2 陈树栋. 基于用户消费行为的用户画像技术研究D. 广州: 华南理工大学, 2021. 3 李善涛. 基于跨域的信息推荐技术研究及应用D. 北京: 北京邮电大学, 2020. 4 Greg Linden, Smith Brent, York Jeremy. A recommendations: Item-to-item collaborative filteringJ. IEEE Internet Computing, 2003, 7(1): 76-80. 5 Meshal Alfarhood, Chen
22、g Jianlin. Deep learning-based recommender systems. 2021:1-23. 6 Alexandros Karatzoglou, Hidasi Balazs. Deep learning for recommender systems.Como, Italy: 2021: 396-397. 7 张紫嫣,周驰. 结合类别偏好的协同过滤推荐算法J. 计算机应用与软件, 2021,38(01): 293-296. 8 高仰,刘渊. 融合知识图谱和短期偏好的推荐算法J. 计算机科学与探寻求索, 1-14. 9 康来松,刘世峰,宫大庆. LBSN 中基于加
23、权异构信息网络的兴趣点推荐J. 系统工程,2020, 38(06): 14-24. 10 Qian Zhang, Lu Jie, Jin Yaochu. Artificial intelligence in recommendersystemsJ. Complex Intelligent Systems, 2021, 7(1): 439-457. 11 栗恒. 基于社交环境和时空数据的个性化位置推荐研究D. 重庆: 重庆大学, 2021. 12 张雨萌. 基于内容推荐的视频服务平台的设计与实现D. 北京: 北京交通大学, 2020. 13 周德懋,李舟军. 高性能网络爬虫:研究综述J. 计算机
24、科学, 2018, 36(08): 26-29. 14 唐芳草. 基于神经网络的技术合同风险分析技术研究D. 哈尔滨: 哈尔滨工程大学,2021. 15 Chunxia Yin, Liu Jian, Zhang Huiying. Topic-specific crawling algorithm basedon EIPage RankJ. Journal of Information and Computational Science, 2018, 7(2):341-347. 16 付志鸿. 基于 Storm 云平台的分布式网络爬虫技术研究与实现D. 成都: 电子科技大学,2021. 17 张
25、荣耀. 基于实值条件受限玻尔兹曼机的推荐算法研究D. 天津: 天津大学, 2021. 18 姚觐轲. 推荐系统中协同过滤算法及隐私保卫机制研究D. 沈阳: 东北大学, 2020. 19 刘君良,李晓光. 个性化推荐系统技术进展J. 计算机科学, 2020, 47(07): 47-55. 20 Qusay-H Mahmoud, Al-Masri Eyhab, Wang Zhixin. Design and implementation of a 1 吴瑶瑶,杨庚. 云环境下分布式文件系统负载平衡研究J. 计算机工程与应用, 2022,55(10): 67-72. 2 陈树栋. 基于用户消费行为的
26、用户画像技术研究D. 广州: 华南理工大学, 2021. 3 李善涛. 基于跨域的信息推荐技术研究及应用D. 北京: 北京邮电大学, 2020. 4 Greg Linden, Smith Brent, York Jeremy. A recommendations: Item-to-item collaborative filteringJ. IEEE Internet Computing, 2003, 7(1): 76-80. 5 Meshal Alfarhood, Cheng Jianlin. Deep learning-based recommender systems. 2021:1-2
27、3. 6 Alexandros Karatzoglou, Hidasi Balazs. Deep learning for recommender systems.Como, Italy: 2021: 396-397. 7 张紫嫣,周驰. 结合类别偏好的协同过滤推荐算法J. 计算机应用与软件, 2021,38(01): 293-296. 8 高仰,刘渊. 融合知识图谱和短期偏好的推荐算法J. 计算机科学与探寻求索, 1-14. 9 康来松,刘世峰,宫大庆. LBSN 中基于加权异构信息网络的兴趣点推荐J. 系统工程,2020, 38(06): 14-24. 10 Qian Zhang, Lu
28、Jie, Jin Yaochu. Artificial intelligence in recommendersystemsJ. Complex Intelligent Systems, 2021, 7(1): 439-457. 11 栗恒. 基于社交环境和时空数据的个性化位置推荐研究D. 重庆: 重庆大学, 2021. 12 张雨萌. 基于内容推荐的视频服务平台的设计与实现D. 北京: 北京交通大学, 2020. 13 周德懋,李舟军. 高性能网络爬虫:研究综述J. 计算机科学, 2018, 36(08): 26-29. 14 唐芳草. 基于神经网络的技术合同风险分析技术研究D. 哈尔滨:
29、哈尔滨工程大学,2021. 15 Chunxia Yin, Liu Jian, Zhang Huiying. Topic-specific crawling algorithm basedon EIPage RankJ. Journal of Information and Computational Science, 2018, 7(2):341-347. 16 付志鸿. 基于 Storm 云平台的分布式网络爬虫技术研究与实现D. 成都: 电子科技大学,2021. 17 张荣耀. 基于实值条件受限玻尔兹曼机的推荐算法研究D. 天津: 天津大学, 2021. 18 姚觐轲. 推荐系统中协同过滤
30、算法及隐私保卫机制研究D. 沈阳: 东北大学, 2020. 19 刘君良,李晓光. 个性化推荐系统技术进展J. 计算机科学, 2020, 47(07): 47-55. 20 Qusay-H Mahmoud, Al-Masri Eyhab, Wang Zhixin. Design and implementation of a smart system for personalization and accurate selection of mobile servicesJ.Requirements Engineering, 2007, 12(4): 221-230. 21 吴清春. 多源信息
31、融合的推荐模型研究D. 北京: 北京交通大学, 2020. 22 Zengmao Wang, Guo Yuhong, Du Bo. Matrix completion with preference ranking fortop-n recommendation. Stockholm, Sweden: 2021: 3585-3591. 23 Dheeraj Bokde, Girase Sheetal, Mukhopadhyay Debajyoti. Matrix Factorizationmodel in Collaborative Filtering algorithms: A survey
32、. Fr. Agnel Ashram,Bandstand, Bandra West, Mumbai, Maharashtra, 400 050, India: 2021: 136-146. 24 Silvia Puglisi, Parra-Arnau Javier, Forne Jordi, et al. On content-basedrecommendation and user privacy in social-tagging systemsJ. Computer Standardsand Interfaces, 2021, 4117-27. 25 翁海瑞,林穗,何立健. 基于内容推荐
33、与时间函数结合的新闻推荐算法J. 计算机与数字工程, 2020, 48(12): 2973-2977. 26 聂帅华. 基于内容推荐/协同过滤推荐算法的智能交友网站的设计 amp;实现D. 武汉:华中师范大学, 2021. 27 Miquel Montaner, Lpez Beatriz, de la Rosa Josep-Llus. A Taxonomy ofRecommender Agents on the InternetJ. The Artificial intelligence review, 2003,19(4): 285-330. 28 邵煜,谢颖华. 协同过滤算法中冷启动问题研
34、究J. 计算机系统应用, 2022, 28(02):246-252. 29 Benjamin Schelling, Plant Claudia. KMN - Removing noise from K-means clusteringresults. Regensburg, Germany: 2021: 137-151. 30 Resmiye Nasiboglu, Tezel Baris-Tekin, Nasibov Efendi. Learning the stressfunction pattern of ordered weighted average aggregation using
35、 DBSCANclusteringJ. International Journal of Intelligent Systems, 2022, 34(3): 477-492. 31 Mesmin-J Mbyamm Kiki, Zhang Jianbiao, Kouassi Bonzou-Adolphe. Map Reduce FCMclustering set algorithmJ. Cluster Computing, 2021, 24(1): 489-500. 32 伍艺. 面向大数据集的递增聚类方式方法研究D. 北京: 北京理工大学, 2021. 33 胡文江,胡大伟,高永兵,等. 基于
36、关联规则与标签的好友推荐算法J. 计算机工程与科学, 2020, 35(02): 109-113. 34 Pavan. Single Pass Seed Selection Algorithm for k-MeansJ. Journal of computerscience, 2018, 6(1): 60-66. 35 郭永坤,章新友,刘莉萍,等. 优化初始聚类中心的 K-means 聚类算法J. 计算机工程与应用, 2020, 56(15): 172-178. 36 张靖,段富. 优化初始聚类中心的改良 k-means 算法J. 计算机工程与设计, 2020,34(05): 1691-1694. 37 何明,孙望,肖润,等. 一种融合聚类与用户兴趣偏好的协同过滤推荐算法J. 计算机科学, 2021, 44(S2): 391-396.