《《数据仓库与数据挖掘》教学大纲(本科).docx》由会员分享,可在线阅读,更多相关《《数据仓库与数据挖掘》教学大纲(本科).docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据仓库与数据挖掘教学大纲课程英文名DATA WAREHOUSING AND DATA MINING课程代码I1201Z14学分3总学时48理论学时24实验/实践学时24课程类别专业课课程性质必修先修课程线性代数概率论及其应用统计适用专业信息管理与信息系统开课学院经济与管理学院执笔人审定人制定时间2018年4月注:课程类别是指公共基础课/学科基础课/专业课;课程性质是指必修/限选/任选。一、课程地位与课程目标(一)课程地位数据仓库与数据挖掘是近年兴起的新的信息处理技术,目的是通过抽取、转换、分析和模型 化处理,从大量的现实数据库中获取决策所需的关键性数据。本课程能为专业课程提供必要的数 据分析
2、挖掘技术,为解决管理中的实际问题提供实用技术方法,是信息管理与信息系统专业学生 的一门学科基础必修课。(二)课程目标.掌握创建数据仓库的方法、模型和步骤。1 .掌握数据挖掘、机器学习的基本概念和常用方法。2 .具备使用数据挖掘方法、机器学习解决经济管理实际问题的能力。二、课程目标达成的途径与方法本课程本着学以致用的原则,结合当前的实践,以课堂教学为主,结合自学、课堂讨论、课 外作业以及实验等方式,通过模型建立和过程求解的原理、方法和技巧的教学,使学生在解决问 题的过程中学会数据仓库构建、数据挖掘、机器学习方法,从而使用数据挖掘、机器学习的方法 来解决经济管理的实际问题。三、课程目标与相关毕业要
3、求的对应关系注:1 .支撑强度分别填写H、M或L (其中H表示支撑程度高、M为中等、L为低)。课程目 标课程目标对毕业要求的支撑程度(H、M、L)毕业要求3毕业要求4毕业要求5毕业要求7课程目标1LMHM课程目 标2LMHM课程目 标3LMHM四、课程主要内容与基本要求第一章数据仓库概论主要内容:数据数据仓库的历史、概念、数据模型、数据仓库设计开发方法。基本要求:了解数据数据仓库和数据挖掘的历史、发展;掌握数据仓库系统的特点和作用; 掌握数据仓库存储的数据模型(MOLAP、ROLAP存储模型),元数据的概念;掌握数据仓库设计 方法,数据仓库开发方法。第二章数据预处理主要内容:数据对象与属性类型
4、、数据的基本统计描述、数据可视化;数据清洗、数据集成、 数据归约、数据变换与数据离散化。基本要求:掌握数据对象与属性类型、数据的基本统计描述;了解数据可视化;掌握数据清 洗、数据集成、数据归约、数据变换与数据离散化方法。第三章分类挖掘算法主要内容有K近邻算法、决策树分类、朴素贝叶斯分类、Logistic回归、支持向量机。基本要求:掌握K近邻算法、决策树分类、朴素贝叶斯分类、Logistic回归;理解支持向 量机算法;掌握综合运用各分类算法解决实际问题的能力。第四章回归预测算法主要内容:包括线性回归:局部加权线性回归、岭回归;树回归。基本要求:理解线性回归;了解树回归;掌握线性回归解决数值预测问
5、题实际问题的解决能 力。第五章无监督学习算法主要内容:聚类算法:K均值聚类算法、DBSCAN算法;频繁集关联分析:Apriory、FP-growth 算法。基本要求:掌握K均值聚类算法、Apricnry的原理和使用;理解DBSCAN算法、FP-growtho第六章神经网络与遗传算法主要内容:包含神经网络的概念与几何意义、反向传播模型(BP);超曲面神经网络;遗 传算法原理、基于遗传的分类学习系统。基本要求:掌握神经网络的概念与几何意义、反向传播模型(BP) , 了解超曲面神经网络、 遗传算法原理、基于遗传的分类学习系统。五、课程学时安排章节号教学内容学时数学生任务对应课程目 标第1章1.1 数
6、据仓库与数据挖掘概论1.2 数据仓库的数据获取与管理1.3 数据仓库的设计、开发和应用1.4 联机分析处理(OLAP)2完成下列作业:1、完成围绕某 主题设计一个数据仓 库存储方案3、4、5第2章2.1数据对象与属性类型2. 2数据的基本统计描述2. 3数据可视化2. 4数据清洗与数据集成2. 5数据归约2. 6数据变换与数据离散化6完成下列作业:1、 对案例中数 据进行清洗并规约处 理,最后给出数据可视 化图。3、4、5第3章3.1数据挖掘概述3. 2 K近邻算法3. 3决策树分类3.4朴素贝叶斯分类3. 5 Logistic 回归3.6支持向量机22完成下列作业:1、对给出的数据进行 贝叶
7、斯分类运算,得到模 型,并对新数据进行分类 预测2、讨论决策树方法的 适用范围,并找到实际使 用场景。3、4、5第4章4. 1线性回归4.2树回归4完成线性回归一个案 例。3、4、5第5章5.1聚类算法:K均值聚类算法、 DBSCAN 算法;5. 2频繁集关联分析:Apricrry、 FP-growth 算法8完成下列作业:1、对给出的数据进行 聚类运算,解释聚类结果2、对给出的数据进行 关联规则挖掘,并给出解 释3、4、5第6章6.1 神经网络的概念与几何意义6.2 反向传播模型(BP)6.3 超曲面神经网络6.4 遗传算法原理6完成下列作业:1、讨论深度学习中的 神经网络与课本中神经网 络
8、的区别和联系,并写出 报告3、4、5六、实践环节及基本要求序 号实验项目名称学时基本要求学生任务实验 性质实验 类别1K近邻算法 决策树分类4掌握算法原理, 以及算法应用; 掌握算法原理, 以及算法应用。实现K近邻算法 和决策树程序, 并对数据集进行 训练。演示必做2朴素贝叶斯分类4掌握算法原理, 以及算法应用。实现算法程序, 并对数据集进行 训练。综合必做3Logistic 回归Apriory算法验证4掌握算法原理, 以及算法应用。实现算法程序, 并对数据集进行 训1练。演示必做4聚类算法应用4掌握算法原理, 以及算法应用。实现算法程序,并对数据集进行综合必做注:1.实验性质指演示性、验证性
9、、设计性、综合性等;2,实验类别指必做、选做等。七、考核方式及成绩评定考核内容考核方式评定标准(依据)占总成绩比例过程考核到课率、平时作业、 上机实验和报告课堂考勤,按时完成并上交平时作业和 实验报告平时成绩占30%期末考核闭卷考试成绩占70%考核类别考试成绩登记方式百分制八、推荐教材与主要参考书1、推荐教材:Peter Harrington.机器学习实战(第三版),人民邮电出版社2015. 9Jiawei Ilan.数据挖掘概念与技术(第三版),清华大学出版社2012.08 2、主要参考书:蒋盛益.数据挖掘原理与实践电子工业出版社2016.02梁亚声.数据挖掘原理、算法与应用机械工业出版社2015.04陈封能.数据挖掘导论 完整版人民邮电出版社2014. 04