Hadoop 0.20.203.0的安装配置

1、 在Apache的官网下载Hadoop的比较稳定的版本,我现在下的是Hadoop0.20.203.0.

2、 配置Java环境。1.6版本以上。
相关阅读:
Ubuntu 7.10下配置Java环境补充笔记(图)
使用VMware安装Hadoop全过程 

3、 解压Hadoop,设置conf下的hadoop-env.sh,设置里面的JAVA_HOME=/usr/lib/jvm/java-6-sun.

4、 Export HADOOP_INSTALL=/home/guoguo/hadoop/hadoop-0.20.203.0

5、 Export PATH=$PATH:$HADOOP_INSTALL/bin

6、 检查运行 hadoop version。

7、 如果有版本信息说明安装完成。

8、 设置SSH无密码验证。

a)  ssh-keygen –t rsa

b)  路径都按默认的。

c)  进入 /home/guoguo/root/.ssh目录。

d)  cat id_rsa.pub > authorized_keys

9、 分别配置core-site.xml、hdf-site.xml、mapred-site.xml。

a)  conf/core-site.xml:

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

b)  conf/hdfs-site.xml:

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

c)  conf/mapred-site.xml:

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

10、配置masters和slaves文件。因为是伪分布模式,所以两个都用127.0.0.1

11、编辑主机名 /etc/hosts加入

a)  127.0.0.1 master

b) 127.0.0.1 slave

12、启动hadoop(hadoop命令在hadoop目录的bin目录下)

a)  hadoop namenode –format

b)  start-all.sh

13、 在WEB下查看Hadoop的工作情况

a)  :50070

b)  :50030

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/pppzj.html