《数据分析与统计软件》课程教学大纲.docx

上传人:太** 文档编号:86542525 上传时间:2023-04-14 格式:DOCX 页数:13 大小:34.13KB
返回 下载 相关 举报
《数据分析与统计软件》课程教学大纲.docx_第1页
第1页 / 共13页
《数据分析与统计软件》课程教学大纲.docx_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《《数据分析与统计软件》课程教学大纲.docx》由会员分享,可在线阅读,更多相关《《数据分析与统计软件》课程教学大纲.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据分析与统计软件教学大纲一、课程基本信息课程名称数据分析与统计软件Data Analysis With Statistical Software课程编码SCC321911030开课院部理学院课程团队统计团队学分3.0课内学时56讲授32实验0上机24实践0课外学时56适用专业数学与应用数学授课语言中文先修课程概率论、数理统计数据分析与统计软件是数学与应用数学专业的核心必修课程。它是一门以概率论与数理统计和计算机软件为基础,关于数据的分 析描述和推断(学习)的科学,是数据科学的基础内容。它已广泛应用到自然科学、工程技术、经济金融和社会科学的许多领域中,与大 数据分析和人工智能密切相关。该课主要

2、内容有:统计软件R(Python)基础知识,探索性数据分析,回归分析,分类分析,机器学习的回 归分类方法,聚类分析,主成分分析。通过教学,能够使学生掌握数据分析的基本理论和常用的多元数据分析方法,掌握R (Python)软 件在数据分析中的使用,了解现代数据分析的新进展,培养学生发现和解决数据科学领域实际问题的能力以及数据思维和计算思维能力, 为将来研究和实际工作打下必要基础。Data analysis and statistical software is a core compulsory course for mathematics and applied mathematics maj

3、ors. It is a science based on probability theory, mathematical statistics and computer software, and is the basic content of data science. It has been widely used in many fields of natural science, engineering technology, economic finance and social science, and is closely related to big data analys

4、is and artificial intelligence. The main contents of this lesson include: basic knowledge of Statistical Software R(Python), exploratory data analysis, regression analysis, classification analysis, regression classification method of machine 1 earning, cluster analysis and principal component analys

5、is. Through teaching, students can master the basic theory of data analysis and commonly used multivariate data analysis methods, master the use of R(Python) software in data analysis, and understand the new progress of modern data analysis, to cultivate students* ability to discover and solve pract

6、ical problems in the field of data science, as well as data thinking and computational thinking, so as to lay a necessary foundation for future research and practical work.负责人大纲执笔人审核人6图书人工智能与机器学习,王秋月,中国人民大学出版社,2020, ISBN:9787300 275819.7图书 An Introduction to Statistical Learning with Applications in

7、 R, Gareth James, Springer, 2013, ISBN:9781461471387.8图书 Statistical Regression and Classification_From Linear Models to Machine Learning, Norman Matloff, CRC Press, 2017, ISBN:9781498710916.9图书Data Science Using Python and R, Chantal D. Larose, Wiley, 2019, ISBN:9781119526834.二、课程目标序号代号课程目标0BE毕业要求指

8、标点任务自选1Ml目标1 :掌握数据分析的基本理论和常用的多元数据分析方法。是3.23.22M2目标2 :培养学生发现和解决数据科学领域实际问题的数据思维和计算思维能力是3. 13. 13M3目标3:掌握R (Python)软件在数据分析中的使用。是3. 13. 14M4目标4 :通过使用英文统计软件,提高学生的专业英语水平。是4. 15M5目标5 :能保障课程正常秩序(政治层面、课堂保障层面,非学生能力层面)否三、课程内容序号章节号标题课程内容/重难点支撑课程目标课内 学时教学方式课外 学时课外环节1第1章第一章R软件的 使用本章重点难点:统计软件R的基础知识、R在数据分析中的使 用。/ /

9、21. 11.1 .R软件简介R软件下载安装与启动,R软件的界面。M30.5讲授0. 5自学31.21.2 . R数据结构R的对象与属性,向量、因子、数组、矩阵、数据框与列表。M30.5讲授0.5自学41.31.3 . R数据的输入与输出数据的输入,数据的输出。M30.5讲授0. 5自学/作业51.41.4 . R编程条件控制,循环控制。M30.5讲授0.5自学/作业61.51.5 . R图形基本画图,高级绘图。M30.5讲授0.5自学71.61.6 .其它软件在 数据分析中的使用 介绍Python、MATLAB、SAS和SPSS在数据分析中的使用介绍。M30.5讲授/讨论0.5自学8上机1上

10、机:R软件 基本操作上机(1) : R软件基本操作M3, M42上机2撰写实验 报告9第2章第2章探索性数 据分析本章重点难点:数据的数字特征和图示方法。/102. 12.1 . 一维数据的样本均值,中位数,分位数,极差,方差,偏度,峰度。Ml1讲授1自学数字特征112.22. 2 .数据的分布 图示五数概括,直方图,茎叶图,箱线图,QQ图,经验分布函数, 正态检验。Ml1讲授1自学12上机2上机:一维数 字特征与数据的分 布图示上机(2): 一维数字特征与数据的分布图示M3, M42上机2撰写实验 报告132.32. 3 .多维数据的 数字特征随机向量的分布与数字特征,多维样本均值,协方差阵

11、,相关 阵。Ml1讲授1作业142.42. 4 .多维正态分 布及统计推断初步多元正态分布的概念基本性质,参数估计,案例与软件实现。Ml1讲授/讨论1作业/自学15上机3上机:多维数 字特征与参数估计上机(3):多维数字特征与参数估计M3, M42上机2撰写实验 报告16第3章第3章回归分析本章重点难点:回归分析中估计检验方法及软件实现、回归分 析中相关公式的推导/173. 13.1 . 一元线性回 归分析3.1 一元线性回归分析Ml, M22讲授2作业18上机4上机:一元线 性回归分析上机(4):一元线性回归分析M3, M42上机2撰写实验 报告193.23.2 .多元线性回 归分析(1)多

12、元线性回归分析数学模型,参数估计与假设检验。Ml2讲授2作业203.33.3 .多元线性回 归分析(2)假设检验,回归诊断,预测,案例与软件实现。Ml1讲授1作业213.43. 4 .自变量选择 与逐步回归自变量选择原理方法,Lasso方法,案例与软件实现。Ml, M21讲授1作业/综合 大作业223.53.5 .非线性回归 模型非线性回归,案例与软件实现。Ml1讲授1作业23上机5上机:多元线上机(5):多元线性回归分析M3, M42上机2撰写实验性回归分析报告24第4章第4章分类分析本章重点难点:Logistic回归、距离判别法和贝叶斯判别法及 软件实现、判别方法的基本思想及公式推导。/2

13、54. 14.1 . Logistic 回 归Logistic回归模型,案例分析与软件实现Ml, M21讲授1作业264.24. 2 .分类效果评 价交叉核实,混淆矩阵,R0C曲线Ml1讲授1作业/自学27上机6上机(6):Logistic 回归上机(6) : Logistic回归M3, M42上机2撰写实验 报告284.34.3 .距离判别判别的基本思想,距离判别方法,案例分析与软件实现。Ml1讲授1作业294.44. 4 . Bayes 判别Bayes判别的基本思想和方法,案例分析与软件实现。Ml, M22讲授2作业/综合 大作业304.54. 5 . Fisher 判别Fisher判别的

14、基本思想和方法。Ml1讲授/讨论1作业/自学31上机7上机(7):判别分 析上机(7):判别分析M3, M42上机2撰写实验 报告32第5章第5章机器学习 的回归分类方法本章重点难点:机器学习的回归分类方法的问题背景、数学原 理与软件实现。/335. 15.1 .决策树及其 组合方法决策树原理算法,随机森林原理方法,案例分析与软件实现。Ml, M22讲授2作业/综合 大作业34上机8上机(8):决策树上机(8):决策树M3, M42上机2撰写实验 报告355.25.2 .支持向量机支持向量机原理算法,案例分析与软件实现。Ml, M22讲授2作业/综合 大作业36上机9上机(9):支持向 量机上

15、机(9):支持向量机M3, M42上机2撰写实验 报告375.35.3 .神经网络神经网络原理算法,案例分析与软件实现。Ml, M22讲授2作业/综合 大作业38上机10上机(10):神经网 络上机(10):神经网络M3, M42上机2撰写实验 报告39第6章第6章聚类分析本章重点难点:系统聚类法及软件实现、类间距离计算公式推 导。/406. 16.1 .距离和相似 系数聚类的基本思想,距离度量,相似系数度量。Ml1讲授1作业416.26. 2 .谱系聚类法谱系聚类基本原理和计算方法,案例分析与软件实现。Ml, M21讲授1作业/综合 大作业426.36. 3 .快速聚类法快速聚类基本原理,K

16、-Means聚类算法。Ml1讲授/讨论1作业/自学43上机11上机(11):聚类分 析上机(11):聚类分析M3, M42上机2撰写实验 报告44第7章第7章主成分分 析本章重点难点:主成分分析的数学模型及应用软件实现、主成 分的推导与性质。/457. 17. 1 .总体主成分主成分数学模型,主成分及其性质。Ml2讲授2作业467.27. 2 .样本主成分样本主成分的计算,案例分析与软件实现。Ml, M21讲授1作业/综合 大作业47上机12上机(12):主成分 分析上机(12):主成分分析M3, M42上机2撰写实验 报告四、考核方式序号考核环节操作细节总评占比1平时作业1 .每周布置2道题

17、目,平均每次课1道题以上。2 .成绩采用等级制(百分制),根据作业完成准确性、是否按时上交、是否独立完成评分。3 .考核学生对数据科学基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力。题型主要有简答题、 分析和计算题。10%2上机1 .本课程24个学时上机实验,共十二次上机实验。2 .成绩采用等级制(百分制),根据上机实验完成情况评分。3 .考核学生对数据科学软件编程实现知识的应用能力,对实验结果的正确分析和解读。20%3大作业1 .本课程要求利用R语言等现代数据分析工具建立研究对象的数据科学模型,编写出相应的程序实现计算,给出结论。2 .根据模型建立情况和上机计算分析结论的准

18、确性评分。15%4考勤随机点名、刷卡点名等5%5课堂表现随机检查学生上课精神状态、回答问题情况5%6期末考试1.半开卷考试,学生可带一张A4纸。成绩采用百分制,卷面成绩总分100分。3.主要考核学生对数据科学基本理论和方法的掌握情况,学生综合运用所学知识分析问题、解决问题的能力,题型主要 有填空题、简答题、计算题、软件解读题等。45%五、评分细则序号课程目标考核环书大致占比评分等级1Ml平时作业40%A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确。C-独立思考、按时完成

19、,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准 确。D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱。2Ml上机10%A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分 析解读实验数据,B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正 确分析解读实验数据。c-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没 有正确分析解读实验数据。D-上机实验过程中不能完成实验要求,不能得到正确的实验结果。3Ml期末考试40%(见试卷评分标准)4

20、Ml大作业10%A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分 析非常到位,方法等方面有一定创新。B-利用R语后等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。C-利用R语百等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。D-利用R语言等现代数据分析工具建立研究对象的模型不正确,编写的程序不能给出模型的计算结果,解 读分析不到位5M2平时作业10%A-在解决数据科学领域实际问题时思维和计算无误。B-在解决数据科学领域实际问题时思维和计算存在

21、少量错误。 c-在解决数据科学领域实际问题时思维和计算存在一定量错误。D-在解决数据科学领域实际问题时思维和计算存在大量错误。6M2上机60%A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分 析解读实验数据。B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正 确分析解读实验数据。C-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没 有正确分析解读实验数据。D-上机实验过程中不能完成实验要求,不能得到正确的实验结果。7M2大作业20%A-利用R语言等现代数据分析工具

22、建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分 析非常到位,方法等方面有一定创新。B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。D-利用R语言等现代数据分析工具建立研究对象的模型不正确,编与的程序不能给出模型的计算结果,解 读分析不到位8M2期末考试10%(见试卷评分标准)9M3平时作业10%A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,

23、书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确。C-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准 确。D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱。10M3上机50%A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分析解读实验数据。B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正 确分析解读实验数据。c-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没 有正确分析解读实验数据。D-上机

24、实验过程中不能完成实验要求,不能得到正确的实验结果。11M3大作业30%A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分 析非常到位,方法等方面有一定创新。B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。D-利用R语言等现代数据分析工具建立研究对象的模型不止确,编写的程序不能给出模型的计算结果,解 读分析不到位12M3期末考试10%(见试卷评分标准)13M4平时作业1

25、0%A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确。C-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准 确。D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱。14M4上机70%A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分 析解读实验数据。B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正 确分析解读实验数据。C-上机实验过程中

26、认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没 有正确分析解读实验数据。D-上机实验过程中不能完成实验要求,不能得到正确的实验结果。15M4大作业10%A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分析非常到位,方法等方面有一定创新。B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结 果,解读分析基本到位。D-利用R语言等现代数据分析工具建立研究对象的模型不正确,

27、编与的程序不能给出模型的计算结果,解 读分析不到位16M4期末考试10%(见试卷评分标准)17M5考勤50%A全勤。B-缺勤1次。C-缺勤2-3次。D-缺勤3次以上。2缺勤3次及以上且很少参加课堂讨论。18M5课堂表现50%A-精神状态饱满,回答问题准确。B-精神状态良好,问题回答较好。 c-精神状态一般,问题回答一般。D-精神状态较差,回答问题有误评分等级说明:A, B, C, D, E = 90-100, 80-89, 70-79, 60-69, 0-59; A, B, C, D = 90-100, 75-89, 60-74, 0-59; A, B, C=90-100, 75-89, 60

28、-74, 0-59; A, B = 80-100, 0-79六、教材与参考资料序号教学参考资料明细1图书1数据分析与R软件(第2版),李素兰,科学出版社,2017, ISBN:9787030531582. (*主教材)2图书1数据科学,方匡南,电子工业出版社,2018., ISBN:9787121342448.3图书1数据科学导论一一R与Python实现,吴喜之,高等教育出版社,2019, ISBN:9787040525458.4图书1应用回归及分类一一基于R,吴喜之,中国人民大学出版社,2016, ISBN:9787300222875.5图书1大数据挖掘与统计机器学习(第2版),吕晓玲,宋捷,中国人民大学出版社,2019, ISBN:9787300264066.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁