《《数据挖掘与分析》教案.pdf》由会员分享,可在线阅读,更多相关《《数据挖掘与分析》教案.pdf(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、xxxx 财财经经大大学学教教案案2016201620172017 学年度第学年度第一一学期学期分院(部)xxx 学院教研室课程名称数据挖掘与分析任教专业年级、班级2xxxx教师姓名x职称x使用教材x 等.Python 数据分析与挖掘实战.机械工业出版社.2016.xx 财 经 大 学 教 务 处 制授课内容(教学章节或单元):授课时数第一章 数据挖掘基础教学目的及要求:1、掌握大数据基本概念及相关应用;2、了解数据挖掘基本任务及建模过程;3、掌握数据挖掘建模工具。教学基本内容(重点、难点):第一节 大数据1、主要内容大数据基本概念及应用。2、基本概念和知识点大数据的概念。3、问题与应用(能力
2、要求)理解大数据的概念。第二节从餐饮服务到数据挖掘1、主要内容数据挖掘的概念。2、基本概念和知识点数据挖掘的概念。3、问题与应用(能力要求)了解数据挖掘的概念。第三节数据挖掘的基本任务1、主要内容数据挖掘的基本任务。2、基本概念和知识点数据挖掘的基本任务。3、问题与应用(能力要求)了解数据挖掘的基本任务。第四节数据挖掘建模过程1、主要内容定义挖掘目标、数据采样、数据探索、数据预处理、数据建模以及模型评价。2、基本概念和知识点定义挖掘目标、数据采样、数据探索、数据预处理、数据建模以及模型评价。3、问题与应用(能力要求)了解定义挖掘目标、数据采样、数据探索、数据预处理、数据建模以及模型评价。23第
3、五节常用的数据挖掘建模工具1、主要内容常用的数据挖掘建模工具。2、基本概念和知识点常用的数据挖掘建模工具。3、问题与应用(能力要求)了解常用的数据挖掘建模工具。重点:重点:数据挖掘的基础知识;难点:难点:数据挖掘建模过程。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:作业:作业:1、简述大数据与数据挖掘的概念。2、探讨大数据在生活中的应用。参考资料(含参考书目、文献等):1张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2Magnus Lie Hetland.Python基础教程(第
4、 2 版修订版).人民邮电出版社,2015.3Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第二章 HTML 语言教学目的及要求:1、掌握 HTML 的基础知识;2、掌握 HTML 语言的基本语句;33教学基本内容(重点、难点):第一节 Dreamwaver 安装过程1、主要内容Dreamwaver 安装过程。2、基本概念和知识点Dreamwaver 安装过程。3、问题与应用(能力要求)掌握 Dreamwaver 安装过程。第二节 HTML 语言1、主要内容 HTML 语言。2、基本概念和知识点学习 HTML 语言。
5、3、问题与应用(能力要求)掌握 HTML 语言。重点:重点:Python 数据分析工具难点:难点:Python 数据分析工具教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:1.学会使用 HTML 语言。2.要求学生使用 Dreamwaver,实现基本命令的操作。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3Wesley J.Chun.Pyt
6、hon 核心编程(第二版).人民邮电出版社,2008.4授课内容(教学章节或单元):授课时数第三章基于 Python 的数据挖掘教学目的及要求:1、学会安装 Python;2、掌握 Python 的基础知识;3、理解和掌握函数基础知识;4、理解和掌握条件语句和循环语句;5、理解和掌握字符串操作、文件操作;6、理解和掌握全局变量与导入模块变量;7、理解和掌握多线程编程。教学基本内容(重点、难点):第一节 Python 安装过程1、主要内容Python 安装过程。2、基本概念和知识点Python 安装过程。3、问题与应用(能力要求)掌握 Python 安装过程。第二节 Python 基础知识1、主
7、要内容Python 语言的优势、Python 常用注释、算法概念、面向对象等简单介绍。2、基本概念和知识点Python 语言的优势、Python 常用注释、算法概念、面向对象等简单介绍。3、问题与应用(能力要求)理解 Python 语言的优势、Python 常用注释、算法概念、面向对象等简单介绍。第三节函数基础知识1、主要内容Python 基本输入输出函数的简单用法、系统提供内部函数、第三方提供函数库、用户自定义函数。2、基本概念和知识点35Python 基本输入输出函数的简单用法、系统提供内部函数、第三方提供函数库、用户自定义函数。3、问题与应用(能力要求)理解和掌握 Python 基本输入
8、输出函数的简单用法、系统提供内部函数、第三方提供函数库、用户自定义函数。第四节条件语句和循环语句1、主要内容条件语句、循环语句。2、基本概念和知识点条件语句、循环语句。3、问题与应用(能力要求)了解条件语句、循环语句。第五节字符串操作和文件操作1、主要内容字符串操作、文件操作。2、基本概念和知识点字符串操作、文件操作。3、问题与应用(能力要求)了解字符串操作、文件操作。第六节全局变量与导入模块变量1、主要内容全局变量与导入模块变量。2、基本概念和知识点全局变量与导入模块变量。3、问题与应用(能力要求)全局变量与导入模块变量。第七节多线程编程1、主要内容多线程编程,该章节主要了解为主。2、基本概
9、念和知识点多线程编程。3、问题与应用(能力要求)了解多线程编程。重点:重点:Python 安装、Python 基础知识难点:难点:函数基础知识教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件6讨论、思考题、作业:讨论、思考题:讨论、思考题:1.讨论 Python 的使用方法。2.简述题 Python 的优势。作业:作业:1.完成 Python 的安装;2.实验完成 Python 的基本语句。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Het
10、land.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):第四章Kmeans 聚类数据分析及 Anaconda 介绍教学目的及要求:1、掌握 Anaconda 软件的安装过程及简单配置;2、掌握聚类及 Kmeans 算法;3、用 Kmeans 实现运动员位置聚集。教学基本内容(重点、难点):第一节 Anaconda 软件安装及使用步骤1、主要内容Anaconda 软件安装及使用步骤。2、基本概念和知识点Anaconda 软件安装及使用步骤。3、问题与应用(
11、能力要求)掌握 Anaconda 软件安装及使用步骤。第二节聚类及 Kmeans 介绍1、主要内容聚类原理、Kmeans 算法。2、基本概念和知识点7授课时数3聚类原理、Kmeans 算法。3、问题与应用(能力要求)理解聚类原理、Kmeans 算法。第三节案例分析:Kmeans 聚类运动员数据1、主要内容数据集、基本命令。2、基本概念和知识点数据集、基本命令。3、问题与应用(能力要求)理解数据集、基本命令。重点:重点:Anaconda 软件安装及使用步骤;聚类及Kmeans 介绍。难点:难点:基本命令的运行。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多
12、媒体课件讨论、思考题、作业:讨论、思考题讨论、思考题:1.简述聚类原理?2.简述 Kmeans 算法?作业:作业:1.实验实现 Kmeans 聚类运动员数据参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第五章决策树 DTC 数据分析38教学目的及要求:1、掌握分类及决策树算法;2
13、、理解鸢尾花数据集;3、掌握决策树实现鸢尾数据集分析过程。教学基本内容(重点、难点):第一节分类及决策树1、主要内容分类、决策树。2、基本概念和知识点分类、决策树。3、问题与应用(能力要求)掌握分类、决策树。第二节鸢尾花卉 Iris 数据集1、主要内容鸢尾花卉 Iris 数据集。2、基本概念和知识点鸢尾花卉 Iris 数据集。3、问题与应用(能力要求)理解鸢尾花卉 Iris 数据集。第三节决策树实现鸢尾数据集分析1、主要内容决策树实现鸢尾数据集分析。2、基本概念和知识点决策树实现鸢尾数据集分析。3、问题与应用(能力要求)理解决策树实现鸢尾数据集分析。重点:重点:分类及决策树;鸢尾花卉 Iris
14、 数据集;决策树实现鸢尾数据集分析难点:难点:决策树实现鸢尾数据集分析教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:讨论、思考题:讨论、思考题:1.简述分类?92.什么是决策树?作业:作业:1.实验决策树实现鸢尾数据集分析;参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民
15、邮电出版社,2008.授课内容(教学章节或单元):授课时数第六章线性回归教学目的及要求:1、掌握机器学习常用数据集;2、理解线性回归;3、掌握 LinearRegression使用方法;4、掌握使用线性回归判断糖尿病。教学基本内容(重点、难点):第一节数据集1、主要内容diabetes dataset 数据集、sklearn 常见数据集、UCI 数据集。2、基本概念和知识点diabetes dataset 数据集、sklearn 常见数据集、UCI 数据集。3、问题与应用(能力要求)掌握 diabetes dataset数据集、sklearn 常见数据集、UCI 数据集。第二节线性回归1、主要
16、内容机器学习、单变量现行回归、一元回归模型。2、基本概念和知识点机器学习、单变量现行回归、一元回归模型。3、问题与应用(能力要求)理解机器学习、单变量现行回归、一元回归模型。第三节 LinearRegression使用方法1031、主要内容 LinearRegression 使用方法。2、基本概念和知识点 LinearRegression 使用方法。3、问题与应用(能力要求)理解 LinearRegression使用方法。第四节线性回归判断糖尿病1、主要内容Diabetes 数据集、基本命令。2、基本概念和知识点Diabetes 数据集、基本命令。3、问题与应用(能力要求)理解 Diabete
17、s 数据集、基本命令。重点:重点:数据集;线性回归;LinearRegression 使用方法难点:难点:数据集教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:1.简述线性回归?2.简述 LinearRegression使用方法?作业:作业:1.实验实现线性回归判断糖尿病;参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.
18、Chun.Python 核心编程(第二版).人民邮电出版社,2008.11授课内容(教学章节或单元):授课时数第七章 关联规则教学目的及要求:1、掌握常用关联规则算法;2、理解和掌握 Apriori 算法。教学基本内容(重点、难点):第一节 基本概念1、主要内容关联规则。2、基本概念和知识点关联规则。3、问题与应用(能力要求)理解和掌握关联规则。第二节常用关联规则算法1、主要内容Apriori、FP-Tree、Eclat 算法、灰色关联法。2、基本概念和知识点Apriori、FP-Tree、Eclat 算法、灰色关联法。3、问题与应用(能力要求)理解 Apriori、FP-Tree、Eclat
19、 算法、灰色关联法。第三节 Apriori 算法1、主要内容关联规则、频繁项集、Apriori 算法。2、基本概念和知识点关联规则、频繁项集、Apriori 算法。3、问题与应用(能力要求)掌握关联规则、频繁项集、Apriori 算法。重点:重点:常用关联规则算法、Apriori 算法;难点:难点:Apriori 算法。教学方法:讲授法讨论法自学指导法其他312教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:1.简述关联规则基本概念。2.学习 Apriori 算法。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战
20、.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第八章 时序模式教学目的及要求:1、理解时间序列算法、时间序列的预处理;2、理解和掌握平稳时间序列分析、非平稳时间序列分析。教学基本内容(重点、难点):第一节 时间序列算法1、主要内容AR 模型、MA 模型、ARMA 模型、ARIMA 模型。2、基本概念和知识点AR 模型、MA 模型、ARMA 模型、ARIMA 模型。3、问题与应用
21、(能力要求)了解 AR 模型、MA 模型、ARMA 模型、ARIMA 模型。第二节时间序列的预处理1、主要内容平稳性检验、纯随机性检验。2、基本概念和知识点平稳性检验、纯随机性检验。3、问题与应用(能力要求)133理解平稳性检验、纯随机性检验。第三节平稳时间序列分析1、主要内容AR 模型、MA 模型、ARMA 模型、平稳时间序列建模。2、基本概念和知识点AR 模型、MA 模型、ARMA 模型、平稳时间序列建模。3、问题与应用(能力要求)了解 AR 模型、MA 模型、ARMA 模型、平稳时间序列建模。第四节非平稳时间序列分析1、主要内容差分运算、ARIMA 模型。2、基本概念和知识点差分运算、A
22、RIMA 模型。3、问题与应用(能力要求)理解差分运算、ARIMA 模型。重点:重点:AR 模型;MA 模型;ARMA 模型;ARIMA 模型。难点:难点:差分运算;ARIMA 模型;平稳时间序列建模。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:讨论、思考题:讨论、思考题:1.讨论 AR 模型、MA 模型、ARMA 模型、ARIMA 模型的使用。2.简述平稳时间序列建模过程。作业:作业:1.实验;参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2
23、.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.143.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):第九章基于正则表达式的 Web 爬虫教学目的及要求:1、理解正则表达式以及常用的网页爬取正则表达式;2、理解和掌握 Python 爬虫常用函数。教学基本内容(重点、难点):第一节 正则表达式1、主要内容正则表达式、Python 正则表达式。2、基本概念和知识点re 模块、Match、Pattern。3、问题与应用(能力要求)了解 re 模块、Match、Patter
24、n。第二节常用的网页爬取正则表达式1、主要内容网页爬取正则表达式。2、基本概念和知识点网页爬取正则表达式。3、问题与应用(能力要求)理解网页爬取正则表达式。第三节 Python 爬虫常用函数1、主要内容Urlparse 模块、Urllib 模块、Urllib2 模块。2、基本概念和知识点Urlparse 模块、Urllib 模块、Urllib2 模块。3、问题与应用(能力要求)了解 Urlparse 模块、Urllib 模块、Urllib2 模块。第四节案例分析:使用正则表达式爬取百科知识15授课时数31、主要内容在线百科介绍、基本代码。2、基本概念和知识点在线百科、基本代码。3、问题与应用(
25、能力要求)理解在线百科、基本代码。重点:重点:正则表达式;Python 爬虫常用函数;难点:难点:Python 爬虫常用函数。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:讨论、思考题讨论、思考题:1.简述爬虫思想?作业:作业:1.实验使用正则表达式爬取新浪博客文章。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Ch
26、un.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第十章离群点检测教学目的及要求:1、了解常用离群点检测方法;2、掌握基于模型的离群点检测方法;3、掌握基于聚类的离群点检测方法。316教学基本内容(重点、难点):第一节离群点检测1、主要内容离群点分类、离群点检测方法。2、基本概念和知识点离群点分类、离群点检测方法。3、问题与应用(能力要求)理解离群点分类、离群点检测方法。第二节基于模型的离群点检测方法1、主要内容一元正态分布中的离群点检测、混合模型的离群点检测。2、基本概念和知识点一元正态分布中的离群点检测、混合模型的离群点检测。3、问题与应
27、用(能力要求)掌握一元正态分布中的离群点检测、混合模型的离群点检测。第三节基于聚类的离群点检测方法1、主要内容丢弃远离其他簇的小簇、基于模型的聚类。2、基本概念和知识点丢弃远离其他簇的小簇、基于模型的聚类。3、问题与应用(能力要求)掌握丢弃远离其他簇的小簇、基于模型的聚类。重点:重点:离群点检测方法;一元正态分布中的离群点检测;混合模型的离群点检测;丢弃远离其他簇的小簇;基于模型的聚类。难点:难点:一元正态分布中的离群点检测;混合模型的离群点检测;丢弃远离其他簇的小簇;基于模型的聚类。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作
28、业:1.简述基于模型的离群点检测方法?2.简述基于聚类的离群点检测方法?17参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第十一章基于 Selenium 的自动登录爬虫教学目的及要求:1、了解 Python 自动登录技术;2、掌握基于 Selenium 的自动登录爬虫。3教学基本
29、内容(重点、难点):第一节 Python 自动登录技术1、主要内容Selenium 操控鼠标键盘、Python 设置登录请求。2、基本概念和知识点Selenium 操控鼠标键盘、Python 设置登录请求。3、问题与应用(能力要求)理解 Selenium 操控鼠标键盘、Python 设置登录请求。第二节新浪微博1、主要内容新浪微博介绍、爬取新浪微博数据过程。2、基本概念和知识点新浪微博介绍、爬取新浪微博数据过程。3、问题与应用(能力要求)掌握爬取新浪微博数据过程。第三节案例分析:Selenium 自动登录 163 邮箱1、主要内容 Selenium 自动登录 163 邮箱代码详解。2、基本概念
30、和知识点Selenium 自动登录 163 邮箱代码详解。3、问题与应用(能力要求)掌握 Selenium 自动登录 163 邮箱代码。重点:重点:Selenium 操控鼠标键盘;Python 设置登录请求;Selenium 自动登录 163 邮箱。难点:难点:Selenium 自动登录 163 邮箱。18教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:1.实验Selenium 自动登录爬取新浪微博知识。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016
31、.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.授课内容(教学章节或单元):授课时数第十二章基于 Python 的神经网络分析教学目的及要求:1、了解神经网络基础知识;2、掌握神经网络代码编写;3、掌握 Python 神经网络工具包。教学基本内容(重点、难点):第一节神经网络基础知识1、主要内容机器学习、生物神经网络、人工神经网络、神经网络用途。2、基本概念和知识点机器学习、生物神经网络、人工神经网络、神经网络用途。3、问题与应用(能力要求
32、)理解机器学习、生物神经网络、人工神经网络、神经网络用途。第二节神经网络简单实现1、主要内容神经网络代码编写。2、基本概念和知识点神经网络代码编写。3、问题与应用(能力要求)掌握神经网络代码编写。第三节 Python 神经网络工具包1931、主要内容神经网络工具包及框架、PyBrain 安装过程、PyBrain 基本用法。2、基本概念和知识点神经网络工具包及框架、PyBrain 安装过程、PyBrain 基本用法。3、问题与应用(能力要求)掌握神经网络工具包及框架、PyBrain 安装过程、PyBrain 基本用法。第四节案例分析:使用神经网络训练1、主要内容神经网络代码详解。2、基本概念和知
33、识点神经网络代码详解。3、问题与应用(能力要求)掌握神经网络代码。重点:重点:神经网络代码实现;Python 神经网络工具包。难点:难点:使用神经网络训练。教学方法:讲授法讨论法自学指导法其他教学手段:多媒体实物模型挂图音像其他板书设计:见多媒体课件讨论、思考题、作业:1.实验使用神经网络训练。参考资料(含参考书目、文献等):1.张良均,王路,谭立云,苏剑林等.Python 数据分析与挖掘实战.机械工业出版社,2016.2.Magnus Lie Hetland.Python基础教程(第 2 版修订版).人民邮电出版社,2015.3.Wesley J.Chun.Python 核心编程(第二版).人民邮电出版社,2008.20