零基础学习hoop编程篇.pdf

上传人:wj151****6093 文档编号:73682873 上传时间:2023-02-21 格式:PDF 页数:26 大小:1.15MB
返回 下载 相关 举报
零基础学习hoop编程篇.pdf_第1页
第1页 / 共26页
零基础学习hoop编程篇.pdf_第2页
第2页 / 共26页
点击查看更多>>
资源描述

《零基础学习hoop编程篇.pdf》由会员分享,可在线阅读,更多相关《零基础学习hoop编程篇.pdf(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、零基础学习 hoop 编程篇 The pony was revised in January 2021编程需要注意哪些问题?编程需要注意哪些问题?3.3.如何创建如何创建 mapreducemapreduce 程序及其包含几部分?程序及其包含几部分?4.4.如何远程连接如何远程连接 eclipseeclipse,可能会遇到什么问题?,可能会遇到什么问题?5.5.如何编译如何编译 hadoophadoop 源码?源码?阅读此篇文章,需要些基础下面两篇文章零基础学习 hadoop 到上手工作线路指导(初级篇)零基础学习 hadoop 到上手工作线路指导(中级篇)如果看过的话,看这篇不成问题,此篇讲

2、 hadoop 编程篇。hadoop 编程,hadoop 是一个 Java 框架,同时也是编程的一次革命,使得传统开发运行程序由单台客户端(单台电脑)转换为可以由多个客户端运行(多台机器)运行,使得任务得以分解,这大大提高了效率。hadoop 既然是一个 Java 框架,因为我们必须要懂 Java,网上有大量的资料,所以学习Java 不是件难事。但是学到什么程度,可能是我们零基础同学所关心的。但是学到什么程度,可能是我们零基础同学所关心的。语言很多情况下都是相通的,如果你是学生,还处于打基础的阶段,那么难度对于你来说还是不小的。1.初学者要求必须有理论基础,并且能够完成一个小项目,最起码能够完

3、成几个小例子,例如图书馆里等。初学者基本的要求:初学者基本的要求:(1)懂什么是对象、接口、继续、多态(2)必须熟悉 Java 语法(3)掌握一定的常用包(4)会使用 maven 下载代码(5)会使用 eclipse,包括里面的快捷键,如何打开项目传统程序员,因为具有丰富的编程经验,因此只要能够掌握开发工具:传统程序员,因为具有丰富的编程经验,因此只要能够掌握开发工具:(1)会使用 maven 下载代码(2)会使用 eclipse,包括里面的快捷键,如何打开项目(3)简单熟悉 Java 语法上面的只是基础,如果想开发上面的只是基础,如果想开发 hadoophadoop,还需要懂得下面内容,还需

4、要懂得下面内容(1)会编译 hadoop(2)会使用 hadoop-eclipse-plugin 插件,远程连接集群(3)会运行 hadoop 程序。上面列出大概的内容,下面我们具体说一些需要学习的内容。无论是传统开发人员还是学生,零基础下面都是需要掌握的:无论是传统开发人员还是学生,零基础下面都是需要掌握的:我们就需要进入开发了。开发零基础,该如何,咱们提供了相关的内容分别介绍下面文章学习 hadoop-java 零基础学习线路指导视频(1)这一篇我们使用什么开发工具,甚至考虑使用什么操作系统。然后就是 Java 基础知识篇,包括变量、函数等。学习 hadoop-Java 初级快读入门指导(

5、2)第一篇是属于思想篇,那么这一篇属于实战篇,通过不同的方式,交给你怎么编写第一个小程序。Java 零基础:一步步教你如何使用 eclipse 创建项目及编写小程序实例由于上面没有真正抽象出 eclipse 的使用,所以这里专门介绍了使用 eclipse 如何创建项目,及如何编写小程序实例java 基础:eclipse 编程不得不知道的技巧eclipse 基本知识会了之后,我们在项目,这些技巧相当有用,而且经常用到一、考虑开发环境一、考虑开发环境上面是我们打基础,有了这些基础,我们就开始学习开发 hadoop 了,但是我们该怎么搭建环境,我们知道 Windows 有 32、64 位之分,jdk

6、 也有,那么该如何解决,我们在window32 位上需要使用 32 位 jdk,64 位则使用 64 位 jdk,同样如果 Linux 则使用Linux32 位于 64 位。更详细,可以参考零基础利用 Java 开发 hadoop 需要考虑的问题二、使用二、使用 J2SEJ2SE、J2EEJ2EE使用 Java 我们需要整体了解 Java 语言,Java 包含下面三种J2EE java 企业版,主要用于 web 开发J2SE java 标准版,主要用于 WEB 开发,但是缺少企业版的一些特性,一般情况下java 下的应用都是指 J2SE 的开发。J2ME?java 微小版,主要用于手机等的开发

7、因此如果我们想处理、并展示数据,可以使用 J2EE,更详细参考hadoop 开发-Java 零基础之 J2EE、J2SE、J2ME 的区别三、对三、对 JavaJava 有了一定的认识,我们开始使用有了一定的认识,我们开始使用 JavaJava1.1.环境变量配置环境变量配置对于惯用集成环境的开发者来讲,这有点不适应,比如,安装开发环境 vs,直接开发就好了,为啥还需要配置环境变量。环境变量可以让我们找到 jdk 的命令,这个或许的一点好处,就是都封装起来了。别的不用关心了。对于环境变量,我们需要配置 java_home,path 路径,更详细参考:hadoop 开发-Java 零基础之开发工

8、具环境变量配置2.2.开发工具选择开发工具选择开发工具有很多种,不同的人习惯不同,开发工具也不一样,这里列出个人认为比较常用更多工具参考 hadoop 开发Java 零基础,开发选择什么开发工具比较合适而其中 maven 可以和 eclipse 一起使用,也可以单独使用,后面开发中它还是比较常用的,比如我们下载 hadoop 源码,编译 hadoop,都是需要 maven 来完成的。maven 的学习可以参考源码编译 maven 系列视频教程汇总编译编译Java 可以一处编译处处运行,原因是因为 jvm。编译后的效果,可以查看:Java 零基础,学习 hadoop:为什么要编译 Java 源代

9、码,编译后会有什么效果4.4.如何打开如何打开 JavaJava 项目项目Java 项目的开发,还是比较特别的,是通过导入的方式,折合其它比如项目,直接点击图标就能打开,Java 项目,例如通过 eclipse 的 import 导入,详细参考下面帖子:零基础教你如何导入 Java 项目到 eclipse 中资源下载:资源下载:上面补充了一些基本的知识,可能还不够全面,如果缺少这方面的知识,有两种办法:1.百度,查看视频,缺什么看什么视频2.如果想自己什么时候,都能看,可以下载下面的资源javaWeb 图书馆管理系统源码 mysql 版本Java 使用 hadoop 开发基础:Javaweb

10、视频共享几百 GJava 文件共享java 百 G 内容下载:包含自学,入门,高级应用,案例等Java 基础完毕,我们终于可以开发了,其实开发也并不怎么困难,经常遇到的问题如下:1.1.使用插件连接不上集群使用插件连接不上集群windows 下连接集有两个原因1.1.用户名不一致用户名不一致解决办法:1、如果是测试环境,可以取消 hadoop hdfs 的用户权限检查。打开 conf/,找到属性修改为 false(默认为 true)OK 了。(版本只有这个方法可行),如何操作可以参考第一个问题。2、修改 hadoop location 参数,在 advanced parameter 选项卡中,

11、找到项,将此项改为启动 hadoop 的用户名即可3 修改 window 机器的用户名为 hadoop 用户名。2.2.运行运行 mapreducemapreduce 程序的时候,会检查权限程序的时候,会检查权限根据 hadoop 开发方式总结及操作指导我们知道 hadoop 开发可以使用插件,也可以不使用插件,如果不使用插件开发可能会遇到下面问题解决办法修改下权限就好了windows eclipse 运行 mapreduce 遇到权限问题该如何解决3.3.缺少缺少,以及以及(1)缺少回报如下错误:Could not locate executable null bin in the hado

12、op binarieswindows 通过 hadoop-eclipse-plugin 插件远程开发 hadoop 运行 mapreduce 遇到问题及解决(2)缺少错误如下:Unable to load native-hadoop library for your platform.using builtin-javaclasses where applicable解决办法:解决办法:1.首先将放到 hadoop 的 bin 目录下,如下图所示2.2.配置配置 hadoop homehadoop home 及及 pathpathpathpath,这里使用的是绝对路径,这里使用的是绝对路径,p

13、athpath 里面配置的是里面配置的是 hadoophadoop 的的 binbin 路径。配置完毕,路径。配置完毕,切忌切忌重启机器重启机器如下图所示包及插件的下载,可以在这里面找hadoop 家族、strom、spark、Linux、flume 等 jar 包、安装包汇总下载(持续更新)上面总结了我们开发环境中经常遇到的问题,上面问题打了预防针,我们后面在连接的时候,就会顺利多了。上面主要讲的 window 远程连接集群,还有另外一种就是 Linux 连接集群,这个遇到的问题不多,后面也有所涉及开发 hadoop,可以在 Linux 下,也可以在 window 下面这里主要讲的是 win

14、dow 下面:该如何远程连接 hadoop 集群对于不同版本不同的配置,远程连接的配置有所不同,特别是端口的配置,但是总体的步骤是差不多的,下面分别是与1.1.插件远程连接插件远程连接hadoop 开发方式之一:利用插件开发指导新手指导:Windows 上使用 Eclipse 远程连接 Hadoop 进行程序开发 eclipse 链接 hdfs(hadoop)配置 Hadoop 开发环境(Eclipse)2.2.远程连接问题远程连接问题连接中存在问题上面总结了一部分,比如插件、缺.dll、版本等问题Win7 中使用 Eclipse 连接虚拟机中的 Ubuntu 中的经验总结windows 7

15、使用 eclipse 下 hadoop 应用开发环境搭建及问题总结3.3.运行运行 mapreducemapreduce已经连接上集群,我们开始运行可以编程了,这里面我们可以操作 hdfs,如下例:hadoop 实战:Java 对 hdfs 的编程Java 创建 hdfs 文件实例Java 操作 HDFS 错误总结当然操作 hdfs,会遇到权限问题,修改即可,我们不在重复。除了操作 hdfs 上传下载文件等操作,我们还需要完成一定的功能,比如单功能。这里面编程完成三方面内容:函数,起到分割的作用函数,处理然后汇总()驱动。4.如何带参数还需要继续 Tool 接口,带参数详细参考如何编写运行带参

16、数输入输出路径 hadoop 程序(1)(1)创建创建 mapreducemapreduce运行 mapreduce 参数参考下面:我们首先可以完成一定的功能,功能的实现,可以参考wordcount 等简MapReduce 初级案例(1):使用 MapReduce 去重MapReduce 初级案例(2):使用 MapReduce 数据排序MapReduce 初级案例(3):使用 MapReduce 实现平均成绩通过上面的实现,这里有一个例子,可以放到项目中,直接运行,当然你需要创建数据文件,及根据自己的实际情况修改 uri,也就是 hdfs:eclipse 中开发的 Map/Reduce 项目

17、汇总阐述了下面问题:1.如何创建 MR 程序?2.如何配置运行参数?为空会出现什么问题?的作用是什么?扩展:是什么?2.Win7 Eclipse 调试 Centos 出现问题解决方案阐述下面问题:1.建一个 MapReduce Project,运行时发现出问题:Could not locate executablenull,该如何解决?该如何解决?3.win7 下使用 hadoop-eclipse-plugin 插件开发添加了不生效4.通过 eclipse 中的 Java API 上传至集群为什么 replication 默认 3 份,该如何设置5.eclipse 运行出现 Call From

18、 to master:8020 failed on connection exception:6.hadoop eclipse 插件出现问题7.Linux 下面 eclipse 连接报错,请教大神(4)mapreduce(4)mapreduce 调试:调试:调试的方法有多种,这里说一种最简单、原始的一种。记得 Javascript 刚开始之初是不能调试的,于是我们就采用 alert 的方法,看看结果是不是我们想要的,这里我们调试 mapreduce 采用的是类似的方法。我们通过 CountercountPrint1=(Map 中循环 strScore,“输出信息”);来输出调试信息,getCo

19、unter可以把程序里面的变量输出到 Java 控制台,这样就达到了调试效果。详细参考:Hadoop 中调试(mapreduce)map 与 redcue 信息的输出办法当然还有其他调试方法,可以参考下面Win7 Eclipse 调试 Centos 出现问题解决方案调试 Hadoop 源代码:eclipse 调试及日志打印4.4.获取源码、阅读源码获取源码、阅读源码获取源码可以通过 git,maven 等方式。(1 1)mavenmavenmaven 可以单独使用,也可以作为插件放在 eclipse 中,由于 hadoop src 采用的是 maven的方式,所以我们需要学习和使用 maven

20、。eclipse maven plugin 插件安装和配置及 maven 实战书籍下载源码编译 maven 系列视频教程汇总如果看了上面的内容,那么我们对 maven 已经算是很熟悉了,可以通过 maven 获取hadoop 源码了,在获取的源码的时候,最起码要保持网络畅通,如何获取,以及查看hadoop 源码,查看的时候,我们还需要关联一些包,否则会出现下面情况,source notfound。更多内容,详细可参考:从零教你如何获取源码并使用 eclipse 关联源码Eclipse 查看 hadoop 源代码出现 Source not found,是因为没有添加.zip在 eclipse 中

21、编辑源代码指导源码获取了,我们该如何查看阅读源码,如何通过 eclipse 查看类的定义,函数的实现,通过下面帖子即可达到我们的目的。如何通过 eclipse 查看、阅读源码(2 2)其它获取源码工具)其它获取源码工具 gitgit、svnsvn源码管理、获取网络源码工具:TortoiseSVN 使用手册Eclipse 上 GIT 插件 EGIT 使用手册5.5.编译编译 hadoophadoop 源码源码源码编译,刚开始还是比较复杂的,需要安装不少的软件包括 maven、protobuf、CMake、ant 等工具的安装,编译完毕之后,我们就可以安装了。更详细,可以查看下面内容从零教你在 L

22、inux 环境下(ubuntu)如何编译Hadoop 源代码 eclipse 编译教程对于编译的.class 文件,如果想查看源码,可以通过反编译工具实现java 的 class 文件反编译和 Eclipse、MyEclipse 反编译插件安装、使用6.6.插件制作插件制作eclipse 开发,有的同学,感兴趣,想制作插件,可以查看下面内容 Eclipse 插件制作 Eclipse 插件制作及问题记录Hadoop 编译 hadoop-eclipse-plugin 插件7.7.资源:资源:由于一些同学经常找不到安装包、插件等,这里汇总一些资源:hadoop 家族、strom、spark、Linux、flume 等 jar 包、安装包汇总下载(持续更新)汇总:插件下载、完全分布式、伪分布、eclipse 插件开发大全插件包分享

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁