hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析21ija.docx

上传人:jix****n11 文档编号:48210026 上传时间:2022-10-05 格式:DOCX 页数:21 大小:4.19MB
返回 下载 相关 举报
hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析21ija.docx_第1页
第1页 / 共21页
hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析21ija.docx_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析21ija.docx》由会员分享,可在线阅读,更多相关《hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析21ija.docx(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、hadoop开发案例 hadoop视频教程-Greenplum Hadoop大数据应用案例剖析 基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析课程讲师:迪伦课程分类:Java适合人群:高级课时数量:96课时用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop涉及项目:Greenplum Hadoop大数据分析平台更新程度:完毕hadoop开发案例课程实战、实用、实际,总共 96 课时,系史上最全最深入的讲解Greenplum、Hadoop、云计算相关领域的技能课程,北风网仅以此课程献给有志于从事大数据行业,追求高薪的有想法的程序员

2、。hadoop开发案例视频教程学习地址: 课程价格分析: 随着云计算、大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈。谷歌、淘宝、百度、京东等底层都应用hadoop。越来越多的企 业急需引入hadoop技术人才。由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员。 Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万50万 。 一般需要大数据处理的公司基本上都是大公司,所以学习hadoop技术也是进大公司的捷径! hadoop

3、开发案例视频教程的讲师拥有多年Greenplum和Hadoop实战经验,hadoop开发案例课程注重实践,原理剖析,实践分享,让学员能快速全面地掌握Greenplum操作和调优,以及Hadoop的搭建与运用实战。 课程亮点多多: 亮点一、技术混搭 Greenplum+Hadoop,让你全面掌握玩转大数据的倚天剑和屠龙刀,让你学到不一样的精彩,成为不一样的复合型 人才! 亮点二、高成低也就 亮点三、既注重技术基础,手把手传授技术,通过实操实战的讲授过程让学员沉淀技术,打好牢固坚实的基础;另外,也不 忘从行业、架构的高度,帮助大家扩宽视野,游刃有余。 亮点四、注重实践:原理剖析,实践分享;让学员能

4、快速全面地掌握Greenplum操作和调优,以及Hadoop的搭建与运用实战。 实战、实用、实际 亮点五、 全面覆盖了Greenplum完整知识体系,及关系型数据库管理和调优思想; 亮点六、课程涵盖Hadoop生态系统中所有常用组件; 亮点七、 学完此课程可以获得IT行业高薪职业发展能力。你 了 解 大 数 据 吗 ?“大数据”时代来临您准备好了么?从十大技术和十大巨头了解大数据Greenplum转身:Hadoop是数据库的未来 GREENPLUM适用场景: Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的操作系统、数据库等,它的特

5、点主要就是查询速度快,数据装载速度快,批量DML处理快。而且性能可以随着硬件的添加,呈线性增加,拥有非常良好的可扩展性。因此,它主要适用于面向分析的应用。比如构建企业级ODS/EDW,或者数据集市等等。 GREENPLUM的前景: GREENPLUM 诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展很快,在国内市场发展也很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。正是由

6、于产品发展速度很快,但是在相关人才上存在很大缺口。 Greenplum Hadoop大数据分析平台: 大量的半结构化和非结构化信息无法管理和存储,大数据增长速度惊人,每年以几何级数速度增长,需要有专业化的解决方案应对大数据挑战。EMC收购了Greenplum之后,推出的针对Hadoop的Greenplum的数据库软件。采用Greenplum HD技术管理半结构化和非结构化信息,整体TCO更低,除了进行有效存储和管理,可以通过MapReduce技术进行并行的分析和挖掘,把大量的数据存储变成有价值的数据资产。 课程内容简介: 本课程分两大部分: 第一部分全面深入地介绍了Greenplum数据库,包

7、括架构特性、部署、管理、开发和调优等,由浅入深,理论结合实战,让同学全面彻底掌握这把大数据利剑。 第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等实战运用。另外还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在各个互联网巨头商业环境的运用。 本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士。 课程结束时,帮助学员实现如下目标: 1、了解Greenplum和Hadoop的历史及目前发展的

8、现状、以及它们的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。 2、深入理解Greenplum的技术核心和管理操作,以此为基础,进而掌握MPP架构数据库的使用和调优的思想。 3、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。 4、深入理解Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对

9、Hadoop集群进行管理和优化。 5、理解什么是云计算和Hadoop在云计算领域的运用,以及理解Hadoop在各个互联网巨头商业环境的运用。 第一部分 Greenplum 分布式数据库基础(41课时) 1 Greenplum架构 什么是Greenplum Greenplum体系结构 Greenplum高可用性架构 2 安装Greenplum 配置环境 安装并初始化GPDB系统 启停数据库 配置GP系统 3 分布式数据库存储 数据是如何存储的 分布策略 4 GBDB查询处理 查询命令的执行 SQL查询处理机制 并行查询计划 5 角色权限及客户端认证管理 客户端认证 管理用户和组 6 客户端接口和

10、程序 pgAdmin III PSQL 7 定义数据库对象 创建并管理数据库 创建并管理表空间 创建并管理模式 创建并管理表 分区表 数据分布与分区 压缩存储与行列存储 序列、索引与视图 8 管理数据 插入、更新、删除记录 事务管理 空间回收和统计 9 查询数据 定义查询 使用函数和运算符 查询分析 10 工作负载及资源管理 GP工作负载管理概述 配置工作负载管理 创建资源队列 分配资源队列 检查资源队列状态 11 装载和卸载数据 GP装载命令概述 装载数据到GP 从GP卸载数据 格式化数据文件 12 备份恢复 串行备份和恢复 并行恢复和恢复 13 性能调优 如何进行调优 常见的性能问题 14

11、 GP系统配置参数 关于GP的Master参数与本地化参数 设置配置参数 配置参数种类 15 开启高可用性 GP高可用概述 开启GP的Mirror 获知Segment何时失败 恢复失败的Segment 恢复失败的Master 16 GP MapReduce MapReduce基础 GP MapReduce编程 MapReduce作业执行和故障诊断 第二部分 Hadoop分布式平台(55课时) 1 Hadoop的起源和体系 Hadoop思想起源:Google Hadoop子项目家族 Hadoop的架构 2 Hadoop的安装与配置 准备和配置环境 三种运行模式 完全分布式模式安装 3 HDFS-

12、大数据存储 HDFS概念与体系结构 HDFS的可靠性 HDFS文件操作 HDFS API 4 关于MapReduce MapReduce编程模型 MapReduce的集群行为 MapReduce任务的优化 MapReduce工作机制 错误处理及作业调度机制 5 MapReduce应用开发 Hadoop Eclipse插件开发 数据筛选程序开发 倒排索引程序开发 6 Hadoop监控与管理 页面监控 hadoop备份 7 HBase数据库 Hbase体系结构 HBase shell HBase API应用实例 HBase场景应用 HBase模式设计 8 Hive数据仓库 Hive组件与体系架构

13、Hive安装配置 Hive的服务接口 HiveQL常用操作 Hive的优化 Hive UDF编程 Hive综合实战 9 Pig数据分析平台 Pig框架 Pig安装配置 Pig的使用 Pig的数据模型 常用Pig Latin操作 Pig UDF编程 Pig数据分析实战 10 ZooKeeper分布式服务框架 ZooKeeper工作原理 ZooKeeper设计目标 ZooKeeper的数据结构和组成 ZooKeeper的安装配置 ZooKeeper命令行工具 ZooKeeper API ZooKeeper实战:Hadoop任务调度 11 Chukwa集群监控系统 Chukwa的组成 Chukwa架

14、构和设计 Chukwa安装与配置 常用Chukwa命令 实现自定义数据处理 12 Hadoop商业应用案例 云计算概念和特征 云计算服务模式和形态 Hadoop在云计算的运用 京东商城 百度 阿里巴巴 腾讯 13 Greenplum Hadoop集群 集成架构的特征 集成架构的优势 配置gphdfs协议使用环境 使用HDFS外部表 课程总目录: 以下职位在向你招手:1. Greenplum数据仓库工程师2. Hadoop运维工程师3.大数据平台架构师并可有机会向以下高薪职位发出挑战 一、Q:学这个课程需要什么基础? A、讲师回答本课程适合于有一定java基础知识,对数据库和sql语句有一定了解

15、,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士 二、Q:讲师水平如何?值得信赖吗? A:讲师迪伦,10年以上IT行业从业经验,某知名500强企业大数据平台架构师,资深大数据处理专家。熟练掌握和应用多种技术架构和数据库,包括UNIX,Greenplum、Hadoop、Oracle、Cognos等,以及熟悉数据仓库、ETL、报表、数据分析等领域的技术运用。 三、Q:我该怎么学,如何才能学好这门课程,给些建议 ? A: 讲师回答: 1.时间上的安排建议 本课程96讲,建议每天以2-3课程的进度进行学习,并在课后尽量独立完成课堂所讲的实例。 2.学习要求 不要只是做一名忠实

16、的听众,请跟随我一起搭环境、做实验。遇到问题多想多问多尝试,享受解决问题的快感吧! 3.讲师建议 a. 如果没有学习基础,建议先补充一点Linux、Java基础,会更加得心应手; b. 活学活用,举一反三。只有在熟练掌握各种技术在各种情况下的应用之后,才能掌握实现一个业务需求的最佳路径和最优方案; c. 学海无涯苦作舟,坚持最重要,让现在的努力成就你不后悔的将来吧! 四、Q:课程涉及到哪些技术,版本是多少? A:课程涉及到以下技术,目前基本都是最新版本: 1. Linux RedHat 版本是5.2 2. Ant 版本是1.8 3 Java 版本是 JDK1.6 4.Mysql 版本是5.6.16 5.Greenplum 版本是4.2 6.Hadoop 版本是1.2.1 7.Hbase 版本是0.94.16 8.Hive 版本是0.11 9.Pig 版本是0.12 10.ZooKeeper 版本是3.4.5 11.Chukwa 版本是0.4 前一个课程:基于Luc

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术规范

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁