《《探索性数据分析》课程教学大纲.docx》由会员分享,可在线阅读,更多相关《《探索性数据分析》课程教学大纲.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、探索性数据分析教学大纲一、课程基本信息课程名称探索性数据分析Exploratory Data Analysis课程编码SCC322511020开课院部理学院课程团队统计团队学分2.0课内学时32讲授| 32实脸0上机0实践0课外学时32适用专业数据科学与大数据技术授课语言中文先修课程数学分析(A)【、高等代数与几何(27)、数学分析(R) H、高等代数与几何(2-2、概率论课程简介 (必修)探索性数据分析是数据科学与大数据技术专业的必修课、学科基础课程。它是对已有数据在尽量少的先验假设下通过作图、制 表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法.,主要教学内容包括:一维
2、数据的统计特征,二维数据的统计特征,克方图,箱线图,分位数图,系统聚类法,均值聚类法,主成分分 析,因子分析,典型相关分析,费谢尔线性判别分析,方差分析。通过该课程的教学,能够使学生掌握探索性数据分析的基本概念、基本知识和基本方法,熟悉利用Vat lab或者Python软件进行特征 提取,培养学生运用探索性方法分析数据的能力,为后续课程的学习打下坚实基朋。Exploratory data analysis is a compulsory and basic course for the major of data science and big data technology. It is a
3、 data analysis method that explores the structure and laws of data through mapping, tabulation, equation fitting, calculation of characteristic quantities and other means under the prior assumptions of the existing data as little as possible.The main teaching contents include: statistical characteri
4、stics of one-dimcnsional data, statistical characteristics of two-dimensional data, histogram, box chart, quantile chart, systematic clustering method, mean clustering method, principal component analysis, factor analysis, canonical Correlation Analysis, Fisher linear discriminant analysis, variance
5、 analysis.Through the teaching of this course, students can master the basic concepts, basic knowledge and basic methods of exploratory data analysis, and be familiar with feature extraction using Matlab or Python software, to cultivatestudents ability to use exploratory methods to analyze data and
6、lay a solid foundation for the follow-up courses.负责人审核人二、课程目标序号代号课程目标OBE毕业要可R指标点任务自选1Ml目标1 : 了解掌握探索性数据分析的基批知识、基本方法.是3. 12M2目标2 :掌握复杂大数据处理和分析的基础知识,借助专业软件学会分析处理数据.是4. 13M3目标3;通过课程的学习,培育蛟强的软件开发能力.是8. 14Ml目标4 :能保灌课程正常秩序(政治层面、课堂保障层面.非学生能力层面)否三、返程内容序号章节号标题课程内容/重难点支撑课程目标课内 学时教学方式课外学时课外环节1第一章第一至数据的统 计特征本章重点
7、难点:均值、方差、极差、协方差阵、Pearson相关 系数、Spearman相关系数。/21. 11.1 一维数据的统 计特征均值,方差.极差,偏度,峰度。Ml1讲授1作业31.21.2二维数据的统 计特征协方差阵,相关阵,Pearson相关系数.Spearman相关系数Ml1讲授1作业4第二章第二金分布图型本意重点难点:一元直方图、二元直方图、基木箱线图、概率 图、QQ图、分位数图。/52.12.1直方图一元直方图,二元直方图Ml1讲授1作业62.22. 2箱线图基本箱线图.基本箱线图的变形。M21讲授1作业72.32. 3分位数图概率图,QQ图.分位数图M21讲授1作业8第三章第三章聚类分
8、析本章重点难点.距离、重心法、离差平方和法、均值聚类法。11/93.13.1聚类标准距离,相似系数。M22讲授与讨 论2作业103.23. 2系统聚类法展短距离法.最长距离法,重心法.类平均法,离差平方和 法。M26讲授6作业113.33. 3动态聚类法均值聚类法.初始凝聚点。M31讲授4作业12第四章第四至降维分析本章重点难点:主成分分析、累计贡献率、因子载荷、组间平 方和、误差平方和、线性判别函数,/ /134. 14.1主成分分析主成分分析.贡献率;累计贡献率。Ml4讲授与讨 论4作业144.24. 2因子分析公共因子,因子载荷;特殊因子;共性方差;典型相关分析。M22讲授2作业154.
9、3L3费谢尔线性判 别分析组间平方和,误差平方和,判别效率,线性判别函数,M31讲授4作业16第五金第五章方差分析本章至点难点:方差分析,因子,水平,方差分析模型.主效 应,交互作用.有无重复试验/175. 15.1单因素方差分析因子,水平,主效应,单因素方差分析模型,误差平方和.单 因素方差分析表Ml2讲授2作业185.25.2双因素方差分 析双因素方差分析模型,交互作用,双因素方差分析表,有重复 试验,无重复试蛤M23讲授3作业四、名核方式序号考核环节操作细节总评占比1平时作业1 .每周布置2-3道题目,平均每次课1道题以上。2 .成绩采用百分制,根据作业完成准确性、是否按时上交、是否独立
10、完成评分。3 .考核学生对探索性数据分析基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力慰型主要有分析 和计算题。20%2大作业1 .本课程要求学生给出其所学章节的知识点,列出学生认为的难点、垂点。2 .根据认真态度、内容多少评分。3 .利用Matlab或Python编写聚类等算法。20%3考勤随机点名、刷卡点名等5%4课堂表现随机枪查学生上课精神状态、回答问题情况5%5期末考试1 .闭卷考试,成绩采用百分制,卷面成绩总分10。分。2 .主要考核学生对探索性数据分析基本知识的掌提能力,学生综合运用所学知识分析问题、解决问题的能力,题型主要 有简答题、分析题、计算题等。50%五、
11、评分细则序号课程目标考核环节大致占比评分等级1Ml平时作业80%A.独立思考、按时完成,解题思路清晰、步骤完整、格式合理、答案准审B.独立思考、按时完成,解题思路比较清晰、步骤比较完整、格式合理、答案准确C.独立思考、按时完成,解题思路比较清晰、步骤比较完整、格式比蛟合理、答案准确D.作业抄袭.未能按时完成,解遨思路混乱2Ml课堂表现20%A.精神状态饱满,回答问题准确 B.精神状态良好,问题回答蛟好 C.精神状态一般,问题回答一般 精神状态较差,回答问题有误3M2期末考试100%A.90-100B. 80-89C. 70-79D. 60-69E. 0-594M3大作业100%A.书写认真规范
12、,态度端正.知识点全面,页数满足要求B.书写较认真规范,态度较端正,知识点较全面,页数满足要求C.书写较规范,态度一般.知识点不全面,页数基本满足要求D.书写潦草.复制知识点,页数不满足要求5M4考勤100%A.全勤B.缺勤1次C.缺勤2-3次D.缺勤3次以上评分等级说明:A, B, C, D, E=90-100.80-89, 70-79,60-69,0-59:A. B, C, D=90-100, 75-89,60-74,0-59:A, B, C=90-100,75-89,60-74,0-59:A, B=80-100,0-79六、教材与参考资料序号教学参考资料明细1图书MATLAB数据探索性分析,温迪,清华大学出版社,2018, ISBX:9787302471999.2图书数据分析方法,梅长林,范金城,高等教育出版社,2006. ISBN:7040186845.