《(1.1.26)--挖掘幸福感数据挖掘数据挖掘.ppt》由会员分享,可在线阅读,更多相关《(1.1.26)--挖掘幸福感数据挖掘数据挖掘.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、天池新人赛快来一起挖掘幸福感!目 录CONTENTS01020304项目介绍求解思路详细过程比赛结果项目介绍01求解思路01赛题背景在社会科学领域,幸福感的研究占有重要的位置。如果能发现影响幸福感的共性,生活中是不是将多一些乐趣;如果能找到影响幸福感的政策因素,便能优化资源配置来提升国民的幸福感。02赛题说明赛题使用公开数据的问卷调查结果,选取其中多组变量,来预测其对幸福感的评价。幸福感预测的准确性不是赛题的唯一目的,更希望选手对变量间的关系、变量群的意义有所探索与收获。03数据来源赛题使用的数据来自中国人民大学中国调查与数据中心主持之中国综合社会调查(CGSS)项目。赛题感谢此机构及其人员提
2、供数据协助。中国综合社会调查为多阶分层抽样的截面面访调查。赛题使用公开数据的问卷调查结果,选取其中多组变量,包括个体变量(性别、年龄、地域、职业、健康、婚姻与政治面貌等等)、家庭变量(父母、配偶、子女、家庭资本等等)、社会态度(公平、信用、公共服务等等),来预测其对幸福感的评价。04数据说明考虑到变量个数较多,部分变量间关系复杂,数据分为完整版和精简版两类项目介绍求解思路可见数据集并不是很大求解思路02求解思路观察数据观察数据求解思路数据特征较多求解思路14#查看每个特征的缺失情况train.isnull().sum()求解思路挑选特征查看数据分布情况求解思路将异常数据删除#删除训练集中无效的标签对应的数据train=train.loctrainhappiness!=-8train.shape数据清洗和整理数据清洗和整理求解思路求解思路最初选用这66个特征,效果并不好求解思路stackingLGBXGBABC CABC详细过程03详细过程详细过程详细过程详细过程详细过程比赛结果04比赛结果实验结果比赛结果比赛结果汇报完毕,谢谢!2020