《Python数据分析与挖掘实战-教学大纲.docx》由会员分享,可在线阅读,更多相关《Python数据分析与挖掘实战-教学大纲.docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Python数据分析与挖掘实战教学大纲课程名称:Python数据分析与挖掘实战课程类别:必修适用专业:大数据技术类相关专业先修课程:Python编程基础总学时:64学时(其中理论28学时,实验36学时)总学分:4.0学分一、课程的性质随着云时代的来临,大数据技术将具有越来越重要的战略意义。大数据已经渗透到每一 个行业和业务职能领域,逐渐成为重要的生产要素,人们对于海量数据的运用将预示着新一 轮生产率增长和消费者盈余浪潮的到来。大数据分析技术将帮助企业用户在合理时间内攫取、 管理、处理、整理海量数据,为企业经营决策提供积极的帮助。大数据分析作为数据存储和 挖掘分析的前沿技术,广泛应用于物联网、云
2、计算、移动互联网等战略性新兴产业。虽然大 数据目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的大数 据分析人才更是各企业争夺的热门。为了满足日益增长的大数据分析人才需求,特开设 Python数据分析与挖掘实战课程。二、课程的任务理论上,要求学生掌握Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘 算法基础等数据分析与挖掘的主要方法。技能上,结合服装店服装销售、沐浴露销售、景区人流量、服装企业贡献率、餐饮系统 等现实场景,使学生学会使用Python语言进行数据探索、数据预处理、分类与预测、聚类 分析、时序预测、关联规那么挖掘、智能推荐、偏差检测等操作,并从信用
3、卡、餐饮企业、金 融服务、020优惠券、电商产品等贴近学生生活的场景案例,进行知识点和真实案例相结 合,使学生进一步掌握数据分析与数据挖掘的流程和技能。思政上,将落实立德树人的根本任务,将育人元素揉入教学中,引导学生的环保理念, 增强学生法律意识,培养学生的工匠精神、平安生产、职业道德、技能珍贵、科学探索、独 立思考、思辨能力等。三、教学条件Python 3.8.5+ Anaconda3 2020.11+ scikit-learn 0.22+ PyMySQL 0.10.0+ SciPy 1.4.1+四、课程学时分配序号教学内容理论学时实验学时其它1第1章数据挖掘基础1第2章Python数据挖掘
4、编程基础213第3章数据探索224第4章数据预处理425第5章数据挖掘算法基础1056第6章信用卡高风险客户识别257第7章餐饮企业菜品关联分析158第8章金融服务机构资金流量预测149第9章020优惠券使用预测2510第10章电视产品个性化推荐2511第11章基于TipDM数据挖掘平台实现金 融服务机构资金流量预测12总计2836五、教学内容及学时安排1.理论教学序 号章节名称主要内容教学目标学时1数据挖掘基础1 .掌握数据挖掘的流程2 .了解常用的数据挖掘建模工具3 .掌握Python数据挖掘环境配置的方法掌握数据挖掘的流 程12Python数据挖 掘编程基础1 .掌握Python的基本命
5、令2 .掌握Python的数据结构3 .掌握Python中库的导入与添加的方 法4 . 了解Python数据分析预处理常用库5 .了解Python数据挖掘建模常用库和 框架1 .了解Python的基 本命令、数据结构以 及库的导入与添加2 .熟悉Python数据 挖掘相关库的安装 和使用方法3 . 了解书本配套附 件的使用23数据探索1 .掌握一致性分析的方法2 .掌握缺失值分析的方法3 .掌握异常值分析的方法4 .掌握描述性统计分析的方法5 .掌握分布分析的方法6 .掌握比照分析的方法7 .掌握周期性分析的方法8 .掌握贡献度分析的方法9 .掌握相关性分析的方法1 .掌握Python中数 据
6、质量分析的方法2 .掌握Python中数 据特征分析的方法24数据预处理1 .掌握重复值、缺失值、异常值处理 方法2 .掌握数据规范化和离散化的方法3 .掌握独热编码的方法4 .掌握多表合并的方法5 .掌握分组聚合的方法1 .掌握Python中数 据清洗的方法2 .掌握Python中数 据变换的方法3 .掌握Python中数 据合并的方法41 .了解常用的分类与回归算法2 .掌握线性模型的原理3 .掌握决策树算法的原理4 .掌握最近邻分类算法的原理5 .掌握支持向量机算法的原理6 .掌握神经网络算法的原理7 .掌握集成算法的原理8 .掌握分类与回归算法的评价方法9,了解常用聚类分析算法10 .
7、掌握聚类分析算法的评价方法11 .掌握K-Means聚类算法的原理12 .掌握密度聚类算法的原理13 .掌握层次聚类算法的原理14 . 了解Python主要关联规那么算法15 .掌握Apriori算法的原理16 .掌握FP-Growth算法的原理17 . 了解Python主要智能推荐算法18 .掌握智能推荐模型的评价方法19 .掌握协同过滤推荐算法的原理20 .掌握基于流行度的推荐算法的原 理21 . 了解Python主要时序模式算法22 .23 .掌握时间序列预处理的方法24 .了解平稳时间序列分析25 .掌握非平稳时间序列分析1 .掌握Python中分 类与回归的方法2 .掌握Python
8、中聚 类分析的方法3 .掌握Python中关 联规那么分析的方法4 .掌握Python中智 能推荐的方法5 .掌握Python中时 序模式的分析方法101 .分析信用卡高风险客户识别背景和 数据2 .熟悉信用卡高风险客户识别的步骤 与流程3 .了解描述性统计分析4 . 了解K-Means聚类算法5 .分析聚类结果1 .熟悉信用卡高风 险客户识别的步骤 与流程2 ,掌握探索整体数 据分布和不同属性 之间的关系的方法3 .掌握用K-Means 聚类算法对根据信 用卡客户数据进行 客户分群4 .掌握对聚类结果 进行特征分析的方 法2数据挖掘算法 基础信用卡高风险 客户识别7餐饮企业菜品 关联分析1
9、.分析餐饮企业菜品背景和数据2 .熟悉餐饮企业菜品关联分析的步骤 与流程3 .数据探索分析4 .数据清洗和属性构造5 .了解 Apriori 算法6 .评价Apriori模型1 .了解案例的背景、 数据说明和分析目 标2 .掌握每日用餐人 数、营业额和菜品热 销度的分析方法3 .掌握数据清洗、属 性构造的方法4 .掌握构建Apriori 模型的方法5 .掌握模型评价方 法18金融服务机构 资金流量预测1 .分析金融服务机构资金流量背景和 数据2 .熟悉金融服务机构资金流量预测的 基本流程与步骤3 . 了解平稳性检验和白噪声检验的方 法4 .了解时间序列模型的定阶方法5 . 了解ARIMA算法6
10、 .掌握时间序列模型的评价方法1 .了解案例的背景、 数据说明和分析目 标2 .熟悉金融服务机 构资金流量预测的 步骤与流程3 .掌握数据平稳性 的检验和处理方法, 以及白噪声检验4 .掌握用ARIMA模 型对资金流量进行 预测5,掌握对ARIMA模 型的检验19020优惠券使 用预测1 .分析020优惠券使用的背景和数据2 .熟悉020优惠券使用预测的分析步 骤与流程3 .了解数据分析探索的方法4 .了解决策树算法5 .了解梯度提升算法6 . 了解XGBoost分类算法7 .掌握分类模型的评价方法1 .了解案例的背景、 数据说明和分析目 标2 ,掌握描述性统计 分析方法3 .掌握分析优惠形
11、式、用户消费行为、 商户投放优惠券信 息的方法4 .掌握数据清洗和 数据变换的数据预 处理方法5 .掌握构建决策树、 梯度提升和 XGBoost分类模型 的方法6 .掌握模型评价方 法210电视产品个性 化推荐1 .分析电视产品个性化推荐的背景和 数据2 .熟悉电视产品个性化推荐的步骤与 流程3 .了解基于物品的协同过滤算法4 .了解基于流行度的推荐算法5 .掌握智能推荐算法的评价方法1 . 了解电视产品个 性化推荐案例的背 景、数据说明和分析 目标2 ,掌握常用的数据 清洗方法,对数据进 行数据清洗3 .掌握常用的数据 探索方法,对数据进 行分布分析、比照分 析和贡献度分析4 .掌握常用的属
12、性 构造方法,构建用户 画像标签5 .熟悉基于物品的 协同过滤算法和基 于流行度的推荐算 法,构建推荐模型6 .掌握推荐系统的 评价方法,对构建的 推荐模型进行模型 评价211基于TipDM数 据挖掘平台实 现金融服务机 构资金流量预 测1 .平台简介2 .配置数据组件3 .配置属性构造4 .配置数据筛选5 .配置周期性差分6 .配置序列检验7 .配置分析与建模1 .了解TipDM大数 据挖掘建模平台的 相关概念和特点2,熟悉使用TipDM 大数据挖掘建模平 台配置金融服务机 构资金流量预测任 务的总体流程1学时合计282 .实验教学序号实验工程名称实验要求学时1Python数据挖 掘编程基础
13、1 .使用Python基本命令2 .使用Python的数据结构12数据探索1 .使用Python进行数据质量分析2.使用Python进行数据特征分析23数据预处理1 .使用Python进行数据清洗2 .使用Python进行数据变换3 .使用Python进行数据合并24数据挖掘算法1 .使用线性模型进行预测5基础2 .使用决策树算法进行预测3 .使用最近邻分类算法进行预测4 .使用支持向量机算法进行预测5 ,使用神经网络算法进行预测6 .使用集成算法进行预测7 .使用K-Means算法进行聚类分析8 .使用密度聚类算法进行聚类分析9 .使用层次聚类算法进行聚类分析10 .使用Apriori算法进
14、行关联分析11,使用FP-Growth算法进行关联分析12 .使用协同过滤推荐算法进行推荐分析13 .使用基于流行度的推荐算法进行推荐分析14,使用ARIMA模型进行时间序列分析5信用卡高风险 客户识别1 .描述性统计分析2 .分析客户历史信用记录3 .分析客户经济情况4 .分析客户经济风险情况5 .清洗数据6 .属性构造7 .构建K-Means聚类模型8 .评价K-Means聚类模型56餐饮企业菜品 关联分析1 .分析每日用餐人数和营业额2 .分析菜品热销度3 .清洗数据4 .属性构造5 .构建Apriori模型6 .评价Apriori模型57金融服务机构 资金流量预测1 .属性构造2 .截
15、取平稳局部数据3 .周期性差分4 .平稳性检验和白噪声检验5 .时间序列模型的定阶6 .评价ARIMA模型48020优惠券使 用预测1 .描述性统计分析2 .分析优惠形式信息3 .分析用户消费行为信息4 .分析商户投放优惠券信息5 .清洗数据6 .变换数据7 .构建决策树分类模型8 .构建梯度提升分类模型9 .构建XGBoost分类模型10 .评价分类模型59电视产品个性1 .清洗数据5化推荐2 .探索数据3 .构造属性4 .构建基于物品的协同过滤算法的推荐模型5 .构建基于流行度的推荐算法模型6 .评价智能推荐模型10基于TipDM数 据挖掘平台实 现金融服务机 构资金流量预 测1 .使用T
16、ipDM大数据挖掘建模平台获取数据2 .使用TipDM大数据挖掘建模平台进行分组聚合、数据 筛选、差分、序列检验等操作3 .使用TipDM大数据挖掘建模平台进行时间序列模型构 建、模型检验和模型评价等操作2学时合计36六、考核方式突出学生解决实际问题的能力,加强过程性考核。课程考核的成绩构成二平时作业 (10%) +课堂参与(20%) +期末考核(70%),期末考试建议采用开卷形式,试题应包 括基本概念、数据探索、数据预处理、分类与预测、聚类分析、时序预测、关联规那么挖掘、 智能推荐、偏差检测等局部,题型可采用判断题、选择、简答、应用题等方式。七、教材1 .教材翟世臣,张良均.Python数据分析与挖掘实战M.北京:人民邮电出版社.2022.2 .参考资料1黄红梅,张良均.Python数据分析与应用M.北京:人民邮电出版社.2018.2张良均,谭立云.Python数据分析与挖掘实战(第2版)M.北京:机械工业出 版社.2019.3张健,张良均.Python编程基础M.北京:人民邮电出版社.2018.