《Python语言与数据分析》教学大纲(2023年版).docx

上传人:碎****木 文档编号:95057592 上传时间:2023-08-14 格式:DOCX 页数:18 大小:39.29KB
返回 下载 相关 举报
《Python语言与数据分析》教学大纲(2023年版).docx_第1页
第1页 / 共18页
《Python语言与数据分析》教学大纲(2023年版).docx_第2页
第2页 / 共18页
点击查看更多>>
资源描述

《《Python语言与数据分析》教学大纲(2023年版).docx》由会员分享,可在线阅读,更多相关《《Python语言与数据分析》教学大纲(2023年版).docx(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Python 语言与数据分析教学大纲英文名称:Python Language and Data Analysis课程代码:课程类别:通识公共选修课课程性质:选修开课学期:大二第 2 学期总 学 时:36讲课:22,实训:14 总 学 分 :2考核方式:寻常考勤、作业、课堂表现、期末大作业先修课程:大学计算机根底统计学适用专业:一、课程简介本课程着眼于 Python 语言在数据分析方面的应用,依据数据分析的步骤,从数据预处理、分析、可视化等方面介绍了数据分析的方式,并通过六个完整的数据分析实例进展相关学问的学习。主要内容包括 Python 根底学问介绍、数据预处理、数据分析根底工具 NumPy、

2、处理构造化数据工具 Pandas、数据分析与学问觉察、scikit-learn 实现数据分析、Matplotlib 交互式图表绘制以及六个完整实例。本课程通过理论授课加实训的方式完成教学,理论授课课时为22 学时,实训为14 课时。考核方式由寻常考勤、实训作业、课堂表现和期末大作业构成。二、课程目标及其对毕业要求的支撑通过本课程的学习,使得学生从数据分析的根底理论学问入手,依据数据分析的根本流程循序渐进的学习数据分析学问,并使用 Python 编程进展实战操作。试验局部通过完整数据分析实例的学习,帮助学生更好的把握数据分析技能,做到理论与实践相结合,方法与应用相结合。本课程除要求学生把握数据分

3、析的根底学问和相关Python 库使用,更重要的是要求学生把握理论与实践结合的学习方式,为将来从事相关工作打下良好的根底。序号课程目标支撑的毕业要求10 / 15目标 1:把握数据分析的流程和根本工具;理解 python 编程的模式和面对对1象编程的原理;了解数据分析根本慨念、思维、处理过程等。把握现代体育组织和企业的实务操作技术和战略,具备较强的实务操作力气和分析解决问题的力气,能够为现代体育组织和企业安康进展供给有价值的询问和供给实际运作效劳。目标 2:能够娴熟把握python 的语法,编写 python 程序设计完成相关任务; 能够应用 python 进展数据的读写、整2把握现代体育组织

4、和企业的实务操作技术和战略,具备较强的实务操作力气和分析解决问题的力气,能够为现代体育组织理、清洗和处理;能够应用 numpy 和和企业安康进展供给有价值的询问和提供实际运作效劳。3pandas 进展统计分析; 能够应用matplotlib 进展可视化分析。目标 3:具备构造化思维和规律思维能把握现代体育组织和企业的实务操作技力;具备对学问、技术的自主更、术和战略,具备较强的实务操作力气和分终身学习的力气;具备确定的工程治理析解决问题的力气,能够为现代体育组织和系统解决问题的力气;具备互联网思和企业安康进展供给有价值的询问和提维和大数据思维;具有确定的创业力气供实际运作效劳。和创意识。三、课程

5、教学要求第一章 数据分析是什么教学内容:第一节 数据分析与数据挖掘的关系其次节 机器学习与数据分析的关系第三节 数据分析的根本步骤第四节 Python 和数据分析第五节 本章小结学生学习预期成果:1. 了解数据分析的定义和历史背景;2. 了解数据分析的目的和任务;3. 了解数据分析与数据挖掘的关系;4. 了解机器学习与数据分析的关系;5. 了解数据分析的根本步骤,即数据收集、数据预处理、数据分析与学问觉察和数据后处理,以及每个根本步骤的概念与内容;6. 了解 Python 在数据分析领域所具有的优点;教学重点:1. 数据分析的根本步骤;2. 数据分析与数据挖掘的关系;教学难点:数据分析与数据挖

6、掘的关系;其次章 Python从了解Python 开头教学内容:第一节 Python 及 pandas、scikit-learn、matplotlib 的安装1. Windows 操作系统下Python 的安装2. macOS 下 Python 的安装3. pandas、scikit-learn 和matplotlib 的安装4. 使用科学计算发行版Python 进展快速安装其次节 Python 根底学问1. 缩进2. 模块化的系统3. 注释4. 语法第三节 重要的Python 库1. Pandas2. Scikit-learn3. Matplotlib4. 其它第四节 Jupiter 第五节

7、 本章小结学生学习预期成果:1. 了解Python的进展史;2. 了解Python及Pandas、scikit-learn、Matplotlib的安装;3. 把握Python的根底学问及Python的一些特性,包括缩进在Python的重要性、Python 包的使用方法、注释的使用方法、Python语法学问;4. 了解Pandas、scikit-learn、Matplotlib等重要Python库;5. 了解Jupyter交互式数据科学与科学计算开发环境;教学重点:1. Python 的根底学问;2. Python 的一些特性,包括缩进在 Python 的重要性、Python 包的使用方法、注释

8、的使用方法、Python 语法学问;教学难点:Python 语法学问;第三章 数据预处理不了解数据,一切都是空谈教学内容:第一节 了解数据其次节 数据质量1. 完整性2. 全都性3. 准确性4. 准时性第三节 数据清洗第四节 特征工程1. 特征选择2. 特征构建3. 特征提取第五节 本章小结学生学习预期成果:1. 了解数据的集中趋势、离散程度、相关性测量、数据缺失、噪声、离群点等概念;2. 了解数据质量标准评估的完整性、全都性、准确性和准时性4个要素;3. 了解数据清洗的概念及方式,包括缺失值的处理、噪声数据的处理、不全都数据的处理和特别数据的处理;4. 了解数据的特征选择、特征构建和特征提取

9、;教学重点:1. 数据质量标准评估;2. 数据清洗;教学难点:数据质量标准评估;数据清洗;第四章 NumPy数据分析根底工具教学内容:第一节 多维数组对象:ndarray 对象1. ndarray 对象的创立2. ndarray 对象的数据类型其次节 ndarray 对象的索引、切片和迭代第三节 ndarray 对象的shape 操作第四节 ndarray 对象的根底操作第五节 本章小结学生学习期望成果:1. 了解NumPy 库的作用;2. 把握多维数组对象ndarray 的使用,包括 ndarray 的创立、ndarray 的索引、切片和迭代、ndarray 的 shape 的操作、ndar

10、ray 的根底操作等。教学重点:多维数组对象ndarray 的使用;教学难点:多维数组对象ndarray 的使用;第五章 pandas处理构造化数据教学内容:第一节 根本数据构造1. Series2. DataFrame其次节 基于 pandas 的Index 对象的访问操作1. pandas 的 Index 对象2. 索引的不同访问方式第三节 数据统计和计算工具1. 统计函数:协方差、相关系数、排序2. 窗口函数第四节 数学聚合和分组运算1. agg 函数的聚合操作2. transform 函数的转换操作3. apply 函数的一般操作第五节 本章小结学生学习期望成果:1. 了解Pandas

11、库的作用和特色功能;2. 了解Pandas中Series和DataFrame两种主要数据构造;3. 把握Series对象的创立、访问和操作;把握DataFrame对象的创立、访问和操作;4. 把握基于Pandas的Index对象的访问操作;5. 了解Pandas的相关数学统计和计算工具;6. 了解Pandas的数学聚合和分组运算;教学重点:1. series 对象的使用;2. 基于 Pandas 的Index 对象的访问操作;教学难点:series 对象的使用;基于Pandas 的 Index 对象的访问操作;第六章 数据分析与学问觉察一些常用的方法教学内容:第一节 分类分析1. 规律回归2.

12、 线性判别分析3. 支持向量机4. 决策树5. k 近邻6. 朴实贝叶斯 其次节 关联分析1. 根本概念2. 经典算法第三节 聚类分析1. k 均值算法2. DBSCAN第四节 回归分析1. 线性回归分析2. 支持向量回归3. k 紧邻回归第五节 本章小结学生学习期望成果:1. 了解分类分析的根本概念;2. 了解规律回归、线性判别分析、支持向量机、决策树、K近邻和朴实贝叶斯的相关学问;3. 了解关联分析的根本概念,包括关联规章定义、指标定义和关联规章挖掘定义;4. 了解关联分析的Apriori算法、FP-Tree算法、PrefixSpan算法;5. 了解聚类分析的概念;6. 了解K均值算法和D

13、BSCAN;7. 了解回归分析的根本概念和常用方法;教学重点:1. 分类分析的根本概念;2. 关联分析的根本概念;3. 聚类分析的根本概念;4. 回归分析的根本概念和方法;教学难点:分类分析的根本概念;关联分析的根本概念;聚类分析的根本概念;回归分析的根本概念和方法;第七章 scikit-learn实现数据的分析教学内容:第一节 分类方法1. 规律回归2. 支持向量机3. 最近邻4. 决策树5. 随机梯度下降6. 高斯过程分类7. 多层感知器8. 朴实贝叶斯 其次节 回归方法1. 最小二乘法2. 岭回归3. Lasso 回归4. 贝叶斯岭回归5. 决策树回归6. 高斯过程回归7. 最近邻回归

14、第三节 聚类方法1. k 均值2. 相像性传播3. 均值漂移4. 谱聚类5. 层次聚类6. DBSCAN7. BIRCH第四节 本章小结学生学习期望成果:1. 了解 SciPy 和 scikit-learn 的作用;2. 把握 scikit-learn 的分类方法、回归方法和聚类方法,分类方法包括 Logistic 回归、SVM、最近邻分类器、决策树、随机梯度下降、高斯过程分类、神经网络分类和朴实贝叶斯,回归方法包括最小二乘法、岭回归、Lasso、贝叶斯岭回归、决策树回归、高斯过程回归和最近邻回归,聚类方法包括 K-means、Affinity propagation、Mean-shift、S

15、pectral clustering、Hierarchical clustering、DBSCAN 和 Birch;教学重点:1. scikit-learn 的分类方法;2. scikit-learn 的回归方法;3. scikit-learn 的聚类方法;教学难点:scikit-learn 的分类方法;scikit-learn 的回归方法;scikit-learn 的聚类方法;第八章 Matplotlib交互式图表绘制教学内容:第一节 分类方法其次节 图表样式的修改以及图表装饰项构造第三节 根底图表绘制1. 直方图2. 散点图3. 饼图4. 柱状图5. 折线图6. 表格7. 不同坐标系下的图

16、像第四节 Matplotlib3D第五节 Matplotlib 与 Jupiter 结合第六节 本章小结学生学习期望成果:1. 了解Matplotlib的作用;2. 把握Matplotlib中的根本布局对象的建立;3. 把握修改图表样式、修改装饰项和添加注释的方法;4. 把握根底图表的绘制,包括直方图、散点图、柱状图、折线图和表格;5. 了解使用Matplot3D绘制三维图形的方法;6. 了解Matplotlib与Jupiter结合使用的方法;教学重点:1. Matplotlib中的根本布局对象的建立;2. 修改图表样式、修改装饰项和添加注释的方法;3. 根底图表的绘制,包括直方图、散点图、柱

17、状图、折线图和表格;教学难点:根底图表的绘制,包括直方图、散点图、柱状图、折线图和表格;修改图表样式、修改装饰项和添加注释的方法;第九章 实战:影评数据分析与电影推举教学内容:第一节 明确目标与数据预备1. 明确目标2. 数据采集与处理3. 工具选择其次节 初步分析1. 用户角度分析2. 电影角度分析第三节 电影推举第四节 本章小结学生学习期望成果:1. 了解本实例中对数据的采集和处理;2. 使用pandas对用户评分数据和电影信息数据进展初步分析;3. 了解用户评分统计信息的查看方式和相关图表的绘制方式;4. 了解电影评分分布的查看方式和图表绘制方式;5. 了解使用协同过滤算法实现电影推举的

18、方法;教学重点:1. 用户评分统计信息的查看方式;2. 用户评分统计信息图表的绘制方式;3. 电影评分分布的查看方式和图表绘制方式;教学难点:协同过滤算法实现电影推举;第十章 实战:汽车贷款违约的数据分析教学内容:第一节 数据分析常用的Python 库其次节 数据样本分析1. 初步分析样本的全部变量2. 变量类型分析3. Python 代码实践第三节 数据分析的预处理1. 目标变量探究2. X 变量初步探究3. 连续变量的缺失值处理4. 分类变量的缺失值处理第四节 数据分析的模型建立与模型评估1. 数据预处理与训练集划分2. 承受回归模型进展数据训练3. 承受决策树模型进展数据分析4. 承受随

19、机森林模型优化决策树模型第五节 本章小结学生学习期望成果:1. 了解本实例中用到的数据的各项属性以及变量类型;2. 了解数据预处理相关方法,如连续变量和分类变量的缺失值处理;3. 了解模型建立与模型评估,包括承受回归模型进展数据分析、承受决策树模型进展数据分析、承受随机森林模型优化决策树模型等;教学重点:1. 连续变量和分类变量的缺失值处理;2. 模型建立与模型评估;教学难点:模型建立与模型评估;第十一章 实战:Python 表格数据分析教学内容:第一节 背景介绍其次节 前期预备与根本操作1. 根本术语概念说明2. 安装 openpyxl 并创立一个工作簿3. 从 Excel 工作簿中读取数据

20、4. 迭代访问数据5. 修改与插入数据第三节 进阶内容1. 为 Excel 工作簿添加公式2. 为 Excel 工作簿添加条件格式3. 为 Excel 工作簿添加图表第四节 数据分析实例1. 背景与前期预备2. 使用 openpyxl 读取数据并转化为Dataframe 对象3. 绘制数值列直方图4. 绘制相关性矩阵5. 绘制散布矩阵6. 将可视化结果插入Excel 工作簿中第五节 本章小结学生学习期望成果:1. 了解openpyxl的背景和安装方式;2. 了解如何使用openpyxl创立工作簿;3. 把握使用openpyxl从Excel工作簿中读取、迭代访问、修改与插入数据;4. 了解为Ex

21、cel工作簿添加公式、条件格式、图表的方法;5. 了解将openpyxl读取到的数据转为Dataframe对象的方式;6. 了解绘制数据列直方图、相关性矩阵和散布矩阵的方式,并能够将可视化结果插入Excel工作簿;教学重点:1. 使用 openpyxl 从 Excel 工作簿中读取、迭代访问、修改和插入数据;2. 绘制数据列直方图、相关矩阵和散布矩阵的方式;教学难点:使用 openpyxl 从 Excel 工作簿中读取、迭代访问、修改和插入数据;第十二章 实战:利用手机的购物评论分析手机特征教学内容:第一节 工程介绍其次节 从 Kaggle 上下载数据第三节 筛选想要的数据第四节 分析数据1.

22、 算法介绍2. 算法应用第五节 本章小结学生学习期望成果:1. 了解利用Kaggle猎取本实例的数据的方式;2. 了解数据的筛选过程;3. 了解词袋算法Count Vectorizer和TF_IDF和无监视学习算法;4. 了解使用Count Vectorizer结合k均值提取数据;5. 了解使用spaCy进展名词提取和使用TextBlob进展情感分析的方法,并依据数据生成柱状图;教学重点:1. 数据的筛选过程;2. 无监视学习算法;教学难点:无监视学习算法;第十三章 实战:基于k 近邻模型推想葡萄酒种类的数据分析与可视化教学内容:第一节 机器学习的模型和数据其次节 k 近邻模型的介绍与初步建立

23、1. k 近邻模型的初步建立2. 使用专业库建立k 近邻模型3. 使用 scikit-learn 第三节 数据分析可视化第四节 本章小结学生学习期望成果:1. 了解k近邻模型的工作原理;2. 了解k近邻模型的初步建立方式;3. 了解数据归一化的方式;4. 了解训练集、测试集的划分以及分类器正确率的测试方法;5. 了解使用NumPy和scikit-learn建立k近邻模型并进展测试的方式;6. 了解使用Matplotlib进展数据可视化的方法;教学重点:1. 近邻模型的工作原理;2. 数据归一化的方式;3. 使用 matplotlib 进展数据可视化的方法;教学难点:使用 matplotlib

24、进展数据可视化的方法;第十四章 实战:美国波士顿房价推想教学内容:第一节 数据清洗其次节 数据分析第三节 分析结果第四节 本章小结学生学习期望成果:1. 了解Jupyter Notebook的安装方式和使用方法;2. 了解本实例用到的数据集的引入、描述和条件检索;3. 了解对缺失值和特别值的处理方法;4. 了解成对矩阵图的绘制;5. 了解独热编码;6. 了解相关度的热力图的绘制;7. 了解箱线图的绘制;8. 了解对目标变量分布的拟合以及概率曲线图,选择适宜的模型进展拟合;9. 了解集成学习;10. 了解评估模型的指标auc的计算方法。教学重点:1. 缺失值和特别值的处理方法;2. 箱线图的绘制

25、;3. 矩阵图的绘制;教学难点:缺失值和特别值的处理方法;箱线图的绘制;矩阵图的绘制;四、建议教学安排章节模块1234567891011121314主要内容章数据分析是什么Python从了解Python 开头数据预处理不了解数据,一切都是空谈NumPy数据分析根底工具 pandas处理构造化数据数据分析与学问觉察一些常用的方法scikit-learn实现数据的分析Matplotlib交互式图表绘制实战:影评数据分析与电影推举实战:汽车贷款违约的数据分析实战:Python 表格数据分析实战:利用手机的购物评论分析手机特征实战:基于 k 近邻模型推想葡萄酒种类的数据分析与可视化实战:美国波士顿房价

26、推想学时对应课程目标教学方式方法考核方式2目标 1、2理论讲授期末大作业2目标 1、2理论讲授期末大作业2+1目标 1、2理论讲授+实训期末大作业2+1目标 1、2理论讲授+实训期末大作业2+1目标 1、2理论讲授+实训期末大作业2+1目标 1、2理论讲授+实训期末大作业2+1目标 1、2理论讲授+实训期末大作业2+1目标 1、2理论讲授+实训期末大作业1+1目标 2、3理论讲授+实训期末大作业1+1目标 2、3理论讲授+实训期末大作业1+1目标 2、3理论讲授+实训期末大作业1+2目标 2、3理论讲授+实训期末大作业1+2目标 2、3理论讲授+实训期末大作业1+1目标 2、3理论讲授+实训期

27、末大作业合计3622+14五、课程成绩评定根本考核方法:通过考勤、作业、课堂表现等评定学生寻常成绩占 50%,通过期末大作业评定学生理论成绩期末大作业占50%状况综合评价学生成绩。要留意改革考核手段与方法,建议加强课堂表现及在线课程学习的考核。2 次未提交作业则无法获得学分,作业分实训作业20%为:A 档16-20 分,B 档12-15 分,C 档5-11 分。1、2、3学生考勤20%2 次未参与课程则无法获得学分1、2、3课堂互动10%课堂提问互动环节表现活泼可获得总分值1、2、3期末大作业50%百分制,60 分为及格,折合为 50 分。1、2、3考核依据成绩比例考核/评价细则对应课程目标寻常成绩50%期末考核50%六、教材及课程资源一教材Python 数据分析与可视化. 2023.2二课程资源课程所属教研室负责人: 执笔人: 审核人:2023 年 11 年 27 日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁