《《大数据原理与软件应用》课程教学大纲(2022).pdf》由会员分享,可在线阅读,更多相关《《大数据原理与软件应用》课程教学大纲(2022).pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 大数据原理与软件应用 课程教学大纲 一、课程名称 1中文名称:大数据原理与软件应用 2英文名称:Big data principle and software application 二、课程概况 课程类别:专业选修课 学时数:16 学时 学分数:1 学分 适用专业:产业经济学、国际贸易、金融学专业 开课学期:第一学期 开课单位:经济管理学院 三、四、教学目的及要求 大数据原理与软件应用为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。课程将系统讲授大数据的基本概念、大数据处理
2、架构 Hadoop、关联分析建模与挖掘算法的实现原理和技术应用、回归分析模型与预测算法、神经网络与深度学习算法模型及其应用实践等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。五、课程主要内容及先修课程 第一章:认识大数据(2 课时)基本内容:1大数据的价值所在 2大数据产生的时代背景 3.大数据的概念和特点 4.大数据的类型及价值 第二章:Stata 软件应用和大数据挖掘分析(2 课时)基本内容:1Stata 软件应用基本知识 2大数据挖掘的相关算法和过程 3.从网络中挖掘大数据的研究价值 第三章:R 软件的应用和大数据分析挖掘工具(2 课时)主要内容:1.R 软件应
3、用的基本知识 2.大数据分析挖掘的基本工具 3.大数据分析挖掘项目的实施步骤 第四章:关联分析建模与挖掘算法的实现原理和技术应用(2 课时)1预测、推荐分析建模与算法原理及其在 Spark MLlib 中的实现与应用,包括:2Spark 频繁模式挖掘算法(parallel FP Growth Algorithm)应用 3.Spark 关联规则挖掘(Apriori)算法及其应用 4.以上算法在 Spark MLib 中的实现原理和实际场景中的应用案例。第五章:回归分析模型与预测算法(2 课时)1.利用线性回归(多元回归)实现访问量预测 2.利用非线性回归预测成交量和访问量的关系 3.基于 R+S
4、park 实现回归分析模型及其应用操作 4.Spark 回归程序实现异常点检测的程序示例 第六章:神经网络与深度学习算法模型及其应用实践(3 课时)1.神经网络算法 Neural Network的实现方法和挖掘模型应用 2.基于人工神经网络的深度学习的训练过程 3.传统神经网络的训练方法 4.Deep Learning的训练方法 5.深度学习的常用模型和方法:卷积神经网络;循环神经网络模型;限制波尔兹曼机 论文阅读报告:1 学时 期末考试:2 学时 先修课程包括:数学:微积分和线性代数基础,统计学基础 统计软件应用 六、课程教学方法 大数据原理与软件应用是一门经济统计类专业的选修课程,具有实时
5、性强、内容综合、实践性强等特点。本课程教学环节除课堂讲授外,还包括了学生自主讲解和展示课、案例分析课、讨论课、软件实操部分。通过学生的自主查询、实践和讨论,激发学生的学习积极性和主动性,培养学生自主学习和表达自我的能力,同时提高学生在分析问题、总结问题上的灵敏度,在此过程中,让学生更加深入理解所学内容,充分感受大数据在各领域的应用,达到学有所用的目的,提高学生的实践能力。七、课程考核方式 考试,笔试(闭卷)各考核环节占总分的比例:平时:30%,期末考试:70%平时成绩主要依据是课后作业的完成、论文阅读报告、小组讨论等。八、课程使用教材 大数据技术原理与应用概念、存储、处理、分析与应用林子雨编著,人民邮电出版社,2015 年 8 月 九、课程主要参考资料 1 陆嘉恒.Hadoop 实战.机械工业出版社.2011 年.2 曾大聃,周傲英(译).Hadoop 权威指南中文版.清华大学出版社.2010 年.3 迪米达克(Nick Dimiduk),卡拉纳(Amandeep Khurana),谢磊.HBase 实战中文版.人民邮电出版社;第 1 版(2013 年 9 月 1 日)分委员会主席审批:年 月 日 学院主管院长审批:年 月 日 编号:C3/研部 03/002 注:(1)英文课程名称务必写准确;(2)需编写的内容统一用宋小四号,行间距固定值 22 磅。