《大数据技术原理与应用(第3版)).doc》由会员分享,可在线阅读,更多相关《大数据技术原理与应用(第3版)).doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、厦门大学本科课程教学大纲课程名称大数据技术原理与应用课程代码英文类别代号CSCI授课对象大数据、计算机、软件工程等信息相关专业本科生适用年级本科生大三或大四课程类型专业方向性课程课程课型总学分总学时授课讨论实验/上机实践其他232320000先修课程编程语言一、课程简介大数据技术入门课程,为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。课程将系统讲授大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并
2、行编程模型MapReduce、数据仓库Hive、基于内存的大数据处理架构Spark、流计算框架Flink、大数据在各个领域的应用。在Hadoop、HDFS、HBase、MapReduce、Hive、Spark和Flink等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。二、培养目标(1) 能够建立对大数据知识体系的轮廓性认识,了解大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,并了解云计算、物联网的概念及其与大数据之间的紧密关系;(2) 能够了解Hadoop的发展历史、重要特性和应用现状,Hadoop项目结构及其各个组件,并熟练掌握Hadoo
3、p平台的安装和使用方法;(3) 能够了解分布式文件系统的基本概念、结构和设计需求,掌握Hadoop分布式文件系统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌握分布式文件系统HDFS的使用方法;(4) 能够了解分布式数据库HBase的访问接口、数据模型、实现原理和运行机制,并熟练掌握HBase的使用方法;(5) 能够了解NoSQL数据库与传统的关系数据库的差异、NoSQL数据库的四大类型以及NoSQL数据库的三大基石;基本掌握Redis、MongoDB等NoSQL数据库的使用方法;(6) 能够了解云数据库的概念、基本原理和代表性产品的使用方法;(7) 能够熟练掌握分布式编程框架Ma
4、pReduce的基本原理和编程方法;(8) 能够掌握数据仓库Hive的基本原理和使用方法;(9) 能够了解大数据处理架构Spark的基本原理和编程方法;(10) 能够了解流计算框架Flink的基本原理和编程方法;(11) 能够了解大数据在互联网等领域的典型应用。三、教学方法(1) 本课程采用理论授课与学生课后上机实践相结合,帮助学生更好消化吸收课程知识。(2) 积极践行O2O教学理念,努力提升教学水平,在大数据课程教学方面积极开拓创新,实现线下教学和线上服务的巧妙结合。课程主讲教师建设了国内高校首个大数据课程公共服务平台,提供讲义PPT、课程习题、学习指南、授课视频、技术资料等全方位、一站式免
5、费服务,帮助学生更好学习大数据课程。四、主要内容及学时安排 章(或节)主要内容学时安排1介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系22介绍大数据处理架构Hadoop43分布式文件系统HDFS的基本原理和使用方法44分布式数据库HBase的基本原理和使用方法45NoSQL数据库的概念和基本原理26云数据库27分布式并行编程模型MapReduce原理和使用方法48数据仓库Hive的基本原理和使用方法29Spark原理与基础编程410流计算211Flink原理与基础编程2合计32五、考核方式与要求(1)平时成绩:学生完成上机练习题目,并提交上机实验报告,实验报告成绩作为平
6、时成绩;(2)期末考试:采用笔试,闭卷;(3)最终成绩:平时成绩和期末考试成绩按5:5比例加权求和。六、选用教材大数据技术原理与应用(第3版)林子雨编著,人民邮电出版社,2020年12月,第3版七、参考书目与文献1 陆嘉恒. Hadoop实战. 机械工业出版社. 2011年.2 曾大聃, 周傲英(译). Hadoop权威指南中文版. 清华大学出版社. 2010年.3 迪米达克 (Nick Dimiduk),卡拉纳 (Amandeep Khurana),谢磊. HBase实战中文版.人民邮电出版社; 第1版 (2013年9月1日)八、课程网站等支持条件课程主讲教师建设了国内高校首个大数据课程公共
7、服务平台,提供讲义PPT、课程习题、学习指南、授课视频、技术资料等全方位、一站式免费服务,帮助学生更好学习大数据课程,网站地址:九、其它信息大纲制定者:林子雨 大纲审定者: 大纲制定时间:2020年12月XMU Undergraduate Course SyllabusCourse namePrinciples and Applications of Bigdata TechnologyCourse code Category codeCSCIProgrammeComputer Science, Software Engineering. etcSemesterSemester 2, Year
8、 3Course typeBasic Common Courses General Education Courses Disciplinary General Courses Specialized Courses Other Teaching ProcessesCourse focusLecture Experiment Skill-training PracticalCreditTotal learning hoursLectureTutorialExperimentPracticalOthers232320000PrerequisitesProgramming Language; 1.
9、Course descriptionAn introductory course for bigdata. Knowledge discussed in this course include Hadoop, HDFS, HBase, NoSQL, cloud database, MapReduce, Spark, an so on.2. Learning goals(1) To help students to know about the basic knowledge map about bigdata;(2) To study the ecosystem of Hadoop and t
10、he installation and usage of Hadoop;(3) To study the well-known distributed file system, i.e. HDFS, including the architecture, storage theory, read-and-write process, programming methods, and so on;(4) To study the distributed database system i.e. HBbase, including the API, data model, implementati
11、on theory, and so on;(5) To study NoSQL, including the difference between SQL and NoSQL, CAP theory, BASE theory, NewSQL, and so on;(6) To study the basic concept and theory of cloud databases, and discuss several examples of cloud databases;(7) To study the distributed parallel programming model, i
12、.e., MapReduce, including the shuffle process and programming practice;(8) Be able to master the basic principle and use method of Hive;(9) To study the main-memory-based computing architecture, i.e., Spark, including the performance comparison between Spark and Hadoop, theory of RDD, programming me
13、thod, and so on;(10) Be able to understand the basic principle and programming method of Flink;(11) To study the applications of bigdata in various fields.3.Teaching approaches(1)The course mainly takes the form of lecture, and also the students are required to program on their own computer to bette
14、r comprehend the knowledge of bigdata.(2)Large amount of online course resources are also provided to students, including course video, technical literature, ppt, programming guide, and so on.4. Content outline of the courseChapter(Section)ContentLearning hours1The basic concept of bidata; the relat
15、ionship between bigdata, cloud computing and the Internet of Things.22The architecture and ecosystem of Hadoop43The basic principles and programming method of HDFS44The basic principles and programming method of HBase45The concept and principle of NoSQL46The concept and principle of cloud database27
16、The distributed parallel programming model, namely MapReduce48The basic principle and usage of Hive29The basic principle and programming method of Spark410Flink principle and basic programming2Total325. Assessment methods and requirementsThe course involves homework and closed-book examination.The f
17、inal score includes two parts, i.e., homework(50%) and final examination(50%).6.TextbooksZiyu Lin. Principles and Applications of Big Data Technology-Big Data Conception(The third edition), Storage, Processing, Analysis and Application. The POSTS & TELECOM PRESS, Dec, 2020.7.ReferencesTom White. Had
18、oop: The Definitive Guide (3rd edition). The OREILLY PRESS, May 2012.8.Website9.OthersFilled out by: Ziyu Lin Approved by: Jiawen WU Date:Jan,2020 厦门大学本科课程大纲填写说明(Notes)1 须同时填写课程大纲中文版和英文版。2 课程名称必须准确、规范。3 课程代码:非任课教师填写。该课程在教务系统生成后,由学院代为填写。4 授课对象填写专业。5 适用年级填写可修读本课程的时间,如本科三年级第一学期。6 课程类型指公共基本课程、通识教育课程、学科通
19、修课程、专业(或专业方向)课程、其他教学环节。7 课程课型指理论课、实验课、技能课、实践课。8 总学时=授课学时+讨论学时+实验学时+上机学时+其他学时9 先修课程是与该课程具有严格的前后逻辑关系,非先修课程则无法学习该课程。10.培养目标不少于150字。11.考核方式包括成绩登记方式、成绩组成、考核标准等。成绩登记方式包括百分制、通过/不通过等。成绩组成指各种考核方式占比。考核标准指衡量各项考评指标得分的基准。12.选用教材和主要参考书要求注明作者、书目、出版社、出版年份。例如,“丹利维尔:民主、官僚制组织和公共选择,中国青年出版社,2001年。”13.其它信息指课堂规范要求等,如课上禁止使
20、用手机、缺勤要求等。14.课程英文类别代号:英文类别代号代号英文说明代号中文说明ANTH:Anthropology人类学类课程;ARCH:Architecture建筑类课程;ARTS:Arts艺术类;AUTO:Automation自动化类课程;BIOL:Biology生物科学类课程;BUSI:Business Administration工商管理类课程;CHEE:Chemical Engineering化工类课程;CHEM:Chemistry化学类课程;CHIN:Chinese中国语言文学类课程;CIVL:Civil Engineering土建类课程;CSCI:Computer Science
21、计算机科学类课程;ECON:Economics经济学类课程;EENG:Electronic Engineering电子工程类课程;ELIN:Electrical Information电气信息类课程;ELIS:Electronic Information Science电子信息科学类课程;ENGL:English英国语言文学类课程;ENVS:Environmental Science环境科学类课程;FREN:French法国语言文学类课程;GERM:German德国语言文学类课程;HIST:History历史学类课程;JAPA:Japanese日本语言文学类课程;JOUR:Journalism
22、新闻传播类课程;LAWS:Laws法学类课程;MATH:Mathematics数学类课程;MATL:Material材料类课程;MECH:Machinery机械类课程;MECM:Clinical Medical临床医学类课程;MEDN:Nursing Medical护理学类课程;MEPH:Pharmacy Medical药学类课程;MEPM:Preventive Medical预防医学类课程;METC:Traditional Chinese Medical中医学类课程;MIED:Military军事学类课程;OCEA:Oceanography海洋科学类课程;PHIL:Philosophy政治学
23、类课程;PHYC:Physics物理学类课程;PHYS:Physical Education体育学类课程;POLI:Political Science政治学类课程;PUBM:Public Management公共管理类课程;RUSN:Russian俄罗斯语言文学类课程;SENG:Software Engineering软件工程类课程;SOSA:Sociology and Social Anthropology社会学类课程;IDPE:Ideological and Political education思想政治教育类课程;ENER:Energy Science能源科学类课程;ASTR:Astronomy天文学类课程;MELM:laboratory medicine实验医学类课程;MEECClinical Medical (English Courses)英文授课临床医学类课程KORN:Korean韩国语言文学类课程ITAL:Italian意大利语言文学类课程ARAB:Arabic阿拉伯语言文学类课程MALA:Malay马来语言文学类课程