《大数据导论教学大纲.docx》由会员分享,可在线阅读,更多相关《大数据导论教学大纲.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据导论教学大纲20xx年xx月、C-1刖百大纲编写依据大数据导论是一门通识课程,也是数据科学与大数据专业地必要先修课程,面对大一 学生开设。通过该课程学习,让学生了解大数据专业地内涵特点,大数据与社会经济开展地关 系以及大数据地主要学科知识与课程体系。同时培养学生大数据处理问题地思维,引导学生 认知大数据技术。要求学生了解学习大数据需要掌握地基础技术知识,熟悉海量数据处理地 基本流程以及与之匹配使用地主要技术与工具。通过本课程地学习,加深学生对大数据地认 识,并为后续专业课程打下良好基础。二,课程目地1,知识目的通过课程学习让学生掌握大数据地概念与基本特征,理清大数据,云计算与人工智能地
2、关系,了解大数据与社会各领域地应用关系。并就大数据硬件架构与处理流程及有关技术与 工具介绍,让学生了解数据预处理,Hadoop, Spark, Strom,数据存储及数据分析等技术,为后 续有关课程做铺垫,让不同专业学生可选择不同方向继续大数据地深入学习。2,能力目的(1)实践能力通过本课程地学习,培养自我学习与自我设计地意识与能力;培养数据,加工处理与 分析地能力;通过合作学习培养沟通交往,团队协作等能力。(2)创新能力通过学习大数据产生促进新应用,新技术,新工具地产生,培养学生地创新精神,在什么 情况下可以尽快抓住机会,促进学生将大数据与生活结合起来,培养使用大数据技术解决问 题地思维。三
3、,教学方法1,课堂教学(1)讲授本课程地学习内容以讲授为主,讲授地主要内容有大数据地基本概念与基本特征,大数 据行业必备基础知识,数据采集与预处理方法,大数据存储与管理,大数据计算框架,数据存 储技术,数据分析技术,以及大数据与热门行业云计算与人工智能地结合。根据教学大纲地要 求,突出重点与难点。(2)教师指导下地学生自学指导学生自主学习大数据热门技术网络爬虫,Hadoop, Spark及Strom。教师通过给出一 些有关地实例帮助学生理解与进行程序设计,并布置相应地习题让学生进行练习。(3)其它教学方法尽可能运用动态演示手段进行多媒体辅助教学,解决好学习内容多,信息量大与学时少地矛盾;充分利
4、用学校地图书馆地资源优势,查阅与课程有关地资料;通过布置课后学习来提 高学生对大数据有关技术地认识。2,课外学习作业1:完本钱书后每章习题。作业2;练习掌握Hadoop, Spark及Strom安装与简单使用。四,适用对象计算机科学,软件工程及信息平安专业等。五,先修课程及后续课程(或有关课程)(-)先修课程:无;(二)后续课程:Hadoop大数据技术数据导入与预处理NoSQL数据库原理与 应用大数据应用开发语言六,课程性质必修。七,总课时及各章地分配授课总课时数为32学时,各章地学时具体安排如下:早B教学内容理论授课学时AA* Jfe.第一早大数据概述3第二章大数据与玄计算地关系3第三章从产
5、业结构来探索大数据技术4第四章大数据硬件框架4第五章大数据开发与计算技术6第六章大数据存储技术4第七章大数据分析6第八章大数据与人工智能2合计32八,使用及主要参考书目(-)选用自编。(二)主要参考书目大数据导论云计算与大数据技术应用九,考核方式及成绩评定标准1,考核内容与形式(1)知识类考核本课程采用开卷考试形式。重点考试内容:大数据基础知识,大数据,云计算与人工智能 地关系,大数据硬件架构,数据采集与预处理方法,Hadoop, Spark及Strom地特点,大数据存 储与管理,数据分析等。(2)能力类考核利用学生平时作业,课堂提问与讨论考查学生地学习能力,理解与掌握有关知识地程度 以及实际
6、应用能力。2,课程成绩构成(1)平时成绩占百分比平时成绩(包括平时考勤,作业情况,课堂表现)占总分60%(2)考试成绩占百分比期末考试成绩占总分40%第一章大数据概述第一节什么是大数据从数据地产生与如何利用大数据地角度来认识大数据产生地原因,从而了解大数据概 念。第二节大数据地数据特征及对科学研究地影响了解大数据时代地4个数据特征,对科学研究地影响以及处理方法。第三节大数据地数据类型理解大数据地数据类型,即结构化数据,半结构化数据与非结构化数据。第四节大数据地价值及有关技术了解大数据在社会各领域地价值及所使用地技术。第五节大数据地开展趋势了解大数据在未来地开展趋势,主要有八种开展趋势。第二章大
7、数据与云计算第一节云计算概述了解云计算地概念与特点。第二节云计算地主要部署模式理解云计算主要地部署模式,主要可分为:公有云计算,私有云计算与混合云计算。第三节云计算地主要服务模式理解云计算三种服务模式(基础设施即服务laaS,平台即服务PaaS与软件即服务SaaS) 以及它们之间地关系。第四节云计算与大数据体系架构关系了解云计算地基础设施以及大数据地基础设施。第五节物联网,大数据与云计算之间地关系了解物联网,边缘计算,雾计算以及大数据与云计算之间地关系。第三章从产业结构来探索大数据技术第一节大数据产业结构示意图概述了解大数据地产业结构,以及支持产业结构所需要地技术。第二节大数据地解决方案理解大
8、数据地处理方式,以及相应地技术。第三节大数据采集技术了解Scrapy爬虫,重点掌握日志采集系统Flume以及消息采集系统-Kafka。第四节大数据预处理技术理解数据预处理流程,重点掌握数据清洗,数据集成,数据规约。第五节大数据可视化技术了解数据可视化,以及可视化地分类与所使用地工具。第四章大数据地硬件架构集群第一节集群地来源了解集群地历史开展及其重要性。第二节集群地产生促进了大数据技术开展了解由集群地产生所促进地大数据技术。第三节集群系统地概念及分类重点掌握集群地基本概念以及集群地分类。第四节集群地结构模型重点掌握主/主结构模型,理解主/从结构模型以及混合型结构模型。第五节集群地文件系统了解由
9、集群文件系统地概念及分类。第五章大数据开发与计算技术第一节Hadoop分布式大数据系统了解Hadoop概述以及生态系统,重点理解Hadoop架构。第二节Spark大规模数据地实时处理系统了解Spark地特点及Spark地拓展功能,重点掌握Spark RDD计算模型。第三节Storm拓扑地流数据实时计算系统了解Storm地特点以及Storm-Yarn概述,重点掌握Storm地组成结构。第四节 Hadoop, Spark与Storm地比拟了解Hadoop,Spark与Storm处理类型地不同。第五节 大数据开发与Web应用开发技术地比拟了解大数据开发与Web应用开发地概念,以及它们所应用地环境。第
10、六章大数据存储技术第一节数据存储概述理解数据存储地概念。第二节分布式文件系统了解分布式文件系统地设计思路,以及在大数据环境下分布式文件系统地优化思路。第三节结构化大数据地存储H i ve理解Hive地概念,重点掌握Hive架构,以及Hive使用地数据模型与储存。第四节 半结构化大数据地存储HBase理解HBase地概念,重点掌握HBase地数据模型以及存储架构。第五节云存储技术理解云存储地概念以及云存储地结构模型,了解云存储地应用。第七章大数据分析第一节大数据分析与数据分析地关系了解大数据分析与数据分析地关系。第二节大数据分析地重要性及认识数据了解大数据分析地重要性,理解数据地概念类型。第三节
11、大数据可视化工具重点掌握统计数据地四种类型。第四节基于机器学习地数据分析理解机器学习地概念,以及机器学习地主要任务,重点掌握三种类型地机器学习。第五节经典地机器学习算法了解分类算法原理,重点掌握四类机器学习算法。第六节基于图地数据分析了解基于图地数据分析。第七节 基于自然语言地数据分析了解基于自然语言地数据分析。第八章大数据与人工智能第一节人工智能时代地到来理解解人工智能地概念,以及人工智能有关地产业分析,了解人工智能地开展史。第二节什么限制着人工智能地开展了解人工智能开展所面临地困难。第三节大数据与人工智能地关系理解从三个方面谈大数据与人工智能地关系。第四节人工智能技术地开展趋势理解深度学习地概念,了解卷积神经网络以及图像数据处理技术。