Hadoop 2.6.0伪分布式配置详解分享

编辑：光环大数据来源: 互联网时间: 2017-11-09 14:07 阅读: 次大中小

首先先不看理论，搭建起环境之后再看；搭建伪分布式是为了模拟环境，调试方便。

电脑是Windows 10，用的虚拟机VMware Workstation 12 Pro，跑的Linux系统是CentOS6.5 ，安装的hadoop2.6.0，jdk1.8；

1.准备工作

准备工作：把JDK和Hadoop安装包上传到linux系统（hadoop用户的根目录）

系统环境：IP：192.168.80.99，

linux用户：

root/123456，hadoop/123456

主机名：node

把防火墙关闭，root执行：service iptables stop

2.jdk安装

1 . 在 hadoop 用户的根目录， Jdk 解压，（ hadoop 用户操作）tar -zxvf jdk-8u65-linux-x64.tar.gz 解压完成后，在 hadoop 用户的根目录有一个 jdk1.8.0_65目录

2.配置环境变量，需要修改 /etc/profile 文件（ root 用户操作）切到 root 用户，输入 su 命令 vi /etc/profile 进去编辑器后，输入 i ，进入 vi 编辑器的插入模式在 profile 文件最后添加

JAVA_HOME=/home/hadoop/jdk1.8.0_65

export PATH=$PATH:$JAVA_HOME/bin

编辑完成后，按下 esc 退出插入模式输入：，这时在左下角有一个冒号的标识

q 退出不保存

wq 保存退出

q! 强制退出

3. 把修改的环境变量生效（ hadoop用户操作）

执行 source /etc/profile

4.执行 java -version 查看版本，如果成功证明jdk配置成功

3.Hadoop 安装

1.在 hadoop 用户的根目录，解压（ hadoop 用户操作）

tar -zxvf hadoop-2.6.0.tar.gz

解压完成在 hadoop 用户的根目录下有一个 hadoop-2.6.0目录

2.修改配置文件hadoop-2.6.0/etc/hadoop/hadoop-env.sh （ hadoop 用户操作）

export JAVA_HOME=/home/hadoop/jdk1.8.0_65

3.修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml ，添加（ hadoop 用户操作）

<name>fs.defaultFS</name>

</property>

4.修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml ，添加（ hadoop 用户操作）

<name>dfs.replication</name>

</property>

5.修改修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml （ hadoop 用户操作）,这个文件没有，需要复制一份

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

添加

<name>mapreduce.framework.name</name>

</property>

6.修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml ，添加（ hadoop 用户操作）

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

7.修改主机名称（root 用户操作），重启生效

vi /etc/sysconfig/network

修改HOSTNAME 的值为用户名

8.修改 /etc/hosts 文件（ root 用户操作） , 添加： ip 主机名称

192.168.44.199（用自己的ip，下边讲如何获得） node

附：查看ip地址

编辑-->虚拟网络编辑器

net模式，选DHCP设置，得到ip地址起始

net设置，得到网关

点右边小电脑，选择 VPN Connections-->Configue VPN

选中eth0，点有右边edit

选择IP Settings ，根据自己的ip按图修改，Address就是你的ip地址，在起始ip地址和结束ip地址之间选一个就行

9. 格式化 HDFS ，在 hadoop 解压目录下，执行如下命令：（ hadoop 用户操作）

bin/hdfs namenode -format

注意：格式化只能操作一次，如果因为某种原因，集群不能用，需要再次格式化，需要把上一次格式化的信息删除，在 /tmp 目录里执行 rm –rf *

10. 启动集群，在 hadoop 解压目录下，执行如下命令：（ hadoop 用户操作，截图用机后来改过，主机为gp ）

启动集群： sbin/start-all.sh 需要输入四次当前用户的密码 ( 通过配置 ssh 互信解决，截图用机已经配置过ssh不用输密码 )

启动后，在命令行输入 jps 有以下输出

关闭集群： sbin/stop-all.sh 需要输入四次当前用户的密码 ( 通过配置 ssh 互信解决，我的同上)

4.SSH互信配置（hadoop用户操作）

rsa加密方法，公钥和私钥

1.生成公钥和私钥

在命令行执行ssh-keygen，然后回车，然后会提示输入内容，什么都不用写，一路回车

在hadoop用户根目录下，有一个.ssh目录

id_rsa 私钥

id_rsa.pub 公钥

known_hosts 通过SSH链接到本主机，都会在这里有记录

2.把公钥给信任的主机(本机)

在命令行输入ssh-copy-id 主机名称

ssh-copy-id hadoop

复制的过程中需要输入信任主机的密码

3.验证，在命令行输入：ssh 信任主机名称

ssh hadoop

如果没有提示输入密码，则配置成功

至此，大功告成。

　　大数据时代，Hadoop培训、大数据培训、培训班，就选光环大数据！

大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训，就选光环大数据！光环大数据，聘请专业的大数据领域知名讲师，确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术，将前沿技能融入教学中，确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式，指导学生更快的掌握技能知识，成就上万个高薪就业学子。更多问题咨询，欢迎点击------>>>>在线客服！

当前位置

Hadoop 2.6.0伪分布式配置详解分享

1.准备工作

你可能也喜欢这些

在线客服咨询

热点阅读

网友最爱

在线客服咨询