《2022年《Spark大数据技术与应用》教学大纲 .pdf》由会员分享,可在线阅读,更多相关《2022年《Spark大数据技术与应用》教学大纲 .pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Spark 大数据技术与应用教学大纲课程名称:Spark 大数据技术与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64 学时总学分:4.0 学分一、课程的性质本课程是为大数据技术类相关专业学生开设的课程。NoSQL 数据库大多具有横向扩展能力强、数据模型灵活等特点,在互联网、电力、电信、金融以及工业物联网等领域具有广泛应用。作为开源软件,NoSQL 数据库的使用和部署较为简单,不需要掌握复杂的底层技术原理,适合ICT 领域中的各个专业人员学习和使用。被统称为“NoSQL”的非关系型数据库,大多具有优秀的分布式部署能力、横向扩展能力和灵活的数据模型。本课程介绍NoSQL 数据库的起源
2、、基本技术原理、常见存储模式等知识,介绍HBase、Cassandra、MongoDB、Neo4j 和 Redis 等热门 NoSQL 软件的技术原理、架构特点和使用方法,使学生掌握常见NoSQL 数据库的部署和使用方法,理解分布式大数据系统可能遇到的技术难题和解决方法,进而更深入的理解大数据领域的开源工具和技术原理。二、课程的任务通过本课程的学习,使学生掌握HBase、Cassandra、MongoDB、Neo4j 等热门NoSQL软件的基本技术原理、架构特点和使用方法。掌握常见NoSQL 数据库的部署和使用方法,理解分布式大数据系统可能遇到的技术难题和解决方法,进而更深入的理解大数据领域的
3、开源工具和技术原理。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 4 页 -三、教学内容及学时安排序号章节名称主要内容教学目标学时1 第 1 章 绪论1.1 数据库的相关概念1.2 关系型数据库管理系统1.3 NoSQL 的起源和特点1.4 大数据的技术体系1.了解数据库的发展历程2.了解关系型数据库遇到的瓶颈3.了解 NoSQL 的起源和基本特点4.了解大数据的技术的特点和技术体系,以及各个环节所解决的主要问题和解决方式5.了解 NoSQL 在大数据技术体系中的地位和作用2 2 第2章NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾2.2 分布式数据管理的特点2.
4、3 分布式系统的一致性问题2.4 NoSQL 的常见存储模式2.5 NoSQL系统其他相关技术1.回顾关系数据库的重要机制,事务、完整性等。2.了解关系型数据库的分布式部署方式3.理解分布式数据管理的分片、多副本等策略和带来的问题4.理解分布式数据管理中的多副本、分布式事务带来的一致性问题5.掌握 NoSQL 常见的数据存储模式6.了解 NoSQL 的一些重要相关技术4 3 第3章Hadoop和 HDFS 简介3.1.Hadoop 概述3.2.HDFS 原理3.3.使用和管理HDFS 3.4.MapReduce 简介3.5.HIVE 简介1.了解 Hadoop 的历史和特点2.掌握 HDFS
5、的基本原理3.掌握 HDFS 部署和操作方法4.了解 Hadoop 的其他相关技术特点5 4 第4章Hbase 基本原理4.1.HBase 概述4.2.HBase 的数据模型4.3.HBase 的拓扑结构4.4.HBase 部署4.5 子节点伸缩性管理4.6.Hbase 基本 Shell 操作4.7 批量导入导出4.8.通过 JAVA 的访问 HBase 4.9.通过 Python 访问 HBase 1.了解 HBase 的历史和特点2.掌握HBase 的基本数据模型和拓扑结构3.掌握HBase 部署和操作方法4.掌握HBase 的编程接口和编程方法10 名师资料总结-精品资料欢迎下载-名师精
6、心整理-第 2 页,共 4 页 -5 第5章HBase 高级原理5.1.水平分区原理5.2.列族与 Store 的相关原理5.3.数据表的基本设计原则5.4.HBase 集群的高可用性与伸缩性5.5.HBase 的扩展使用1.掌握 HBase 的数据分区原理2.掌握 HBase 的列族结构与读写机制3.了解 HBase 集群部署与高可用性方案4.了解 HBase 的扩展插件5 6 第 6 章Cassandra原理和使用6.1-6.2 Cassandra基本原理6.3.Cassandra部署与配置6.4.CQL 语言与 cqlsh 环境6.5.CQL 数据查询与更新6.6.Cassandra的维
7、护与扩展6.7.通 过JAVA的 访 问Cassandra 6.8.通 过Python的 访 问Cassandra 1.了解 Cassandra的历史和特点2.掌握 Cassandra的基本数据模型和拓扑结构3.掌握 Cassandra部署和操作方法4.掌握 Cassandra的编程接口和编程方法8 7 第 7 章文档型数据库原理和使用简介7.1-7.2.MongoDB的技术原理7.3.安装配置MongoDB 7.4.MongoDB的基本命令行操作7.5.地理信息数据操作7.6.MongoDB 集群化部署7.7.通 过JAVA的 访 问MongoDB 7.8.通 过Python的 访 问Mon
8、goDB 1.了解 MongoDB 的历史和技术特点2.掌握 MongoDB 部署和操作方法3.掌握 MongoDB 的分片和多副本机制与部署方式4.掌握 MongoDB 的编程接口和编程方法8 8 第 8 章其他NoSQL 数据库简介8.1 图数据库简介8.2 Neo4j 的安装与使用8.3.Redis 和内存数据库8.4 搜索引擎系统1.了解 Neo4j 的技术特点2.掌握 Neo4j 部署和操作方法3.掌握 Neo4j 的编程接口与编程方法(可选)4.了解 Redis 和搜索引擎的技术特点5.Redis 的部署和基本使用方法(可选、可补充)6 学 时 合 计48 四、考核方式突出学生解决实际问题的能力,加强过程性考核。课程考核的成绩构成=出勤(10%)名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 4 页 -+平时作业与课堂练习(30%)+课程设计(60%)。名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 4 页 -