hadoop伪分布式安装方法-Hadoop-@大数据资讯

接触Hadoop也快两年了，也一直没自己总结过安装教程，最近又要用hadoop，需要自己搭建一个集群来进行试验，所以就利用这个机会来写个教程以备以后自己使用，也用来和大家一起探讨。

要安装Hadoop先安装其辅助环境 java

Ubuntu下java的安装与配置

将java安装在指定路径方便以后查找使用。

Java安装

1）在/home/xx（也就是当前用户）目录下，新建java1.xx文件夹：mkdir /home/xx/java1.xx（文件名上表明版本号，方便日后了解java版本）

2）进入/home/xx/java1.xx目录下，运行安装指令：sudo /home/xx /jdk-6u26-linux-i586.bin，则生成文件夹jdk1.6.0_26，如果感觉名字太长，可以对其重命名：mv jdk1.6.0_26 jdk

也可以使用sudoapt-get install 软件包来安装java。如果想卸载java使用命令sudo rm -rf /home/xx/java1.6/jdk1.6（安装目录）

配置环境变量

进入profile文件添加环境配置，命令为sudo gedit /etc/profile 在文件的末尾添加

1

2

3

4

5

6

7

JAVA_HOME=/home/xx/java1.xx/jdk
JRE_HOME=/home/xx /java1.xx/jdk/jre
PATH=$JAVA_HOME/bin:$JRE_HOME/bin: $PATH
export JAVA_HOME
export JRE_HOME
export CLASSPATH
export PATH

完成以上配置后重启电脑然后检验java是否安装成功在终端输入java –version 后显示

hadoop伪分布式安装方法 - 1

说明java安装成功。

Java安装成功后接着进入正题进行Hadoop的安装，本文先进行Hadoop的伪分布安装随后会继续更新完全分布的安装过程。

本文使用的Hadoop版本是hadoop-0.20.2，将hadoop-0.20.2.tar.gz移至当前用户目录下进行解压tar –zxvf hadoop-0.20.2.tar.gz

然后配置hadoop的环境变量，其配置方法和java的配置方法一样，在profile中写入HADOOP_HOME=/home/xx/hadoop

Java和hadoop的配好的环境变量如图

hadoop伪分布式安装方法 - 2

配好环境后可以用hadoop version 查看版本（需要重启电脑）。

接着对hadoop的配置文件进行配置。进入hadoop/conf路径下，修改hadoop-env.sh文件 sudo gedit hadoop-env.sh对其添加javahome hadoop伪分布式安装方法 - 3

完成以上配置之后就可以在单机模式进行测试了

hadoop伪分布式安装方法 - 4

输出结果为：

wKiom1NImJ6zBIOYAAThQ5iwlv0298.jpg - 5

出现上面的结果说明之前的步骤你都部署正确。接下来进行伪分布的配置，进入hadoop/conf目录下对core-site.xml进行编辑，添加如下内容

<property>
<name>hadoop.tmp.dir</name>
<value>/home/xx/hadoop/tmp</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://xx:9000</value>//也可以是主机的ip
</property>
对hdfs-site.xml进行编辑，添加如下内容
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
对mapred-site.xml进行编辑，添加如下内容
<property>
<name>mapred.job.tracker</name>
<value>xx:9001</value>
</property>