数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt

上传人:创****公 文档编号:85124276 上传时间:2023-04-10 格式:PPT 页数:26 大小:4.94MB
返回 下载 相关 举报
数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt_第1页
第1页 / 共26页
数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt_第2页
第2页 / 共26页
点击查看更多>>
资源描述

《数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt》由会员分享,可在线阅读,更多相关《数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨厦门大学计算机科学系 2020版林子雨林子雨厦门大学计算机科学系厦门大学计算机科学系E-mail:主页:主页:http:/ 大数据技术概述大数据技术概述(PPT版本号:版本号:2020年年12月版本)月版本)大数据基础编程、实验和案例教程(第大数据基础编程、实验和案例教程(第2版)版)教材官网:http:/ 大数据时代大数据时代1.2 大数据关键技术大数据关键技术1.3 大数据软件大数据软件1.4 内容安排内容安排百度搜索厦门大学数据库实验室网站访问平台大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.1大数

2、据时代大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术表1-1 大数据技术的不同层面及其功能技技术层术层面面功能功能数据采集利用ETL工具将分布的、异构数据源中的数据如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;或者也可以把实时采集的数据作为流计算系统的输入,进行实时处理分析数据存储和管理利用分布式文件系统、数据仓库、关系数据库、NoSQL数据库、云数据库等,实现对结构化、半结构化和非结构化海量数据的存储和管理数据处理与分析利用分布式并行编程模型和计算框架,结合机器学习

3、和数据挖掘算法,实现对海量数据的处理和分析;对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据数据隐私和安全在从大数据中挖掘潜在的巨大商业价值和学术价值的同时,构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术分布式存储分布式处理GFSHDFSBigTableHBaseNoSQL(键值、列族、图形、文档数据库)NewSQL(如:SQLAzure)MapReduce大数据两大核心技术大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术大数据计算模式大数据计算

4、模式解决问题解决问题代表产品代表产品批处理计算针对大规模数据的批量处理MapReduce、Spark等流计算针对流数据的实时计算Flink、Storm、S4、Flume、Streams、Puma、DStream、Super Mario、银河流数据处理平台等图计算针对大规模图结构数据的处理Pregel、GraphX、Giraph、PowerGraph、Hama、GoldenOrb等查询分析计算大规模数据的存储管理和查询分析Dremel、Hive、Cassandra、Impala等表1-2大数据计算模式及其代表产品大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3大数据软件大

5、数据技大数据技术术大数据大数据软软件件数据采集Kafka数据存储与管理HDFS、HBase、Redis、MongoDB数据处理与分析MapReduce、Spark、Hive、Flink数据可视化D3、ECharts表1-3 本教程所涉及的大数据软件大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.1Hadoop大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.2Spark图1-2BDAS架构大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.4NoSQL数据库NoSQL数据库是一种不同于关系数据库的数据库管理系统,是对一大类

6、非关系型数据库的统称,它所采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型。NoSQL数据库没有固定的表结构,通常也不存在连接操作,也没有严格遵守ACID约束,因此,与关系数据库相比,NoSQL具有灵活的水平可扩展性,可以支持海量数据存储。此外,NoSQL数据库支持MapReduce风格的编程,可以较好地应用于大数据时代的各种数据管理。NoSQL数据库的出现,一方面弥补了关系数据库在当前商业应用中存在的各种缺陷,另一方面也撼动了关系数据库的传统垄断地位。NoSQL数据库虽然数量众多,但是,归结起来,典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据

7、库和图数据库。本教程将介绍两种流行的NoSQL数据库产品的安装和使用方法,即键值数据库Redis和文档数据库MongoDB。大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.4内容安排图1-3本教程中涉及的相关大数据软件大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.4内容安排图1-4本教程中大数据软件之间的相互关系大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.5本章小结大数据技术是一个庞杂的知识体系,包含了大量相关技术和软件。在具体学习相关技术及其软件之前,非常有必要建立对大数据技术体系的整体性认识。因此,本章首先从总体上介绍了大数据关键技术和各类大数据软件。鉴于不同的大数据学习者有着不同的学习需求,为了方便读者迅速找到对应的学习章节,本章给出了本教程的整体内容安排。此外,与教程配套的相关资源的建设,是帮助读者更加有效、高效学习本教程的重要方面,因此,本章最后详细列出了与本教程配套的各种丰富的在线资源,全部可以通过网络自由免费访问。大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨附录A:主讲教师林子雨简介单位:厦门大学计算机科学系E-mail:个人网页:http:/ of Computer Science,Xiamen University,2020

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁