说明
搭建的是伪分布式的 Hadoop
开发环境
安装 JDK
搭建之前请确保已经安装了 Java8 的环境
参考 Java8 的安装
安装 ssh
安装命令
1 | yum install ssh |
生成 ssh 的 key
1 | # 生成 ssh 的 key |
验证
1 | # 免密码登陆 |
Hadoop 环境配置
下载、上传、解压 Hadoop 安装包
Hadoop 安装包 hadoop-2.6.0-cdh5.7.0.tar.gz
下载地址
用 Xftp 把下载好的安装包上传到 /abs/software
目录下
解压到指定目录
1 | tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C /abs/app/ |
配置 Hadoop 环境变量
配置系统环境变量
1 | vi ~/.bash_profile |
让配置生效1
source ~/.bash_profile
在命令行中输入 hadoop
验证。
配置 HDFS
修改配置文件
在 /abs/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
下修改配置文件
hadoop-env.sh
1 | #注释掉 export JAVA_HOME=${JAVA_HOME} 并添加如下: |
core-site.xml
1 | <property> |
hdfs-site.xml
1 | <property> |
slaves
1 | vi slaves |
启动 HDFS
格式化 hdfs (PS: 仅第一次执行)
在 /abs/app/hadoop-2.6.0-cdh5.7.0/bin
目录下执行
1 | ./hdfs namenode -format |
在 /abs/app/hadoop-2.6.0-cdh5.7.0/sbin
目录下执行以下脚本启动 hdfs
1 | ./start-dfs.sh |
验证是否启动 HDFS
方法一:
1 | jps |
方法二:
CentOS7 关闭防火墙,出于安全和方便的考虑,这里采用暂时关闭防火墙,实际应用时应设定相应的防火墙规则。
外部物理机应该在 hosts
文件中加入一条 “虚拟机主机名 ip 地址”的解析。
1 | #查看防火墙的状态 |
通过在物理机的浏览器地址栏输入以下访问 WebUI1
http://虚拟机的主机名:50070
停止 HDFS
在 sbin
目录下执行以下脚本停止 hdfs1
./stop-dfs.sh
配置 YARN
修改配置文件
在 /abs/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
目录下拷贝 mapred-site.xml
1 | cp mapred-site.xml.template mapred-site.xml |
修改 mapred-site.xml
1 | <property> |
修改 yarn-site.xml
1 | <property> |
启动 YARN
在 /abs/app/hadoop-2.6.0-cdh5.7.0/sbin
目录执行以下脚本启动 yarn
1 | ./start-yarn.sh |
验证是否启动 YARN
方法一:
1 | jps |
方法二:
CentOS7 关闭防火墙,出于安全和方便的考虑,这里采用暂时关闭防火墙,实际应用时应设定相应的防火墙规则。
外部物理机应该在 hosts
文件中加入一条 “虚拟机主机名 ip 地址”的解析。
1 | #查看防火墙的状态 |
通过在物理机的浏览器地址栏输入以下访问 WebUI1
http://虚拟机的主机名:8088
停止 YARN
在 sbin
目录下执行以下脚本停止 yarn1
./stop-yarn.sh
测试
测试 HDFS
1 | # 查看根目录下有什么 |
测试 YARN
1 | # 在 /abs/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce 目录中输入以下命令 |
以上完成了 Hadoop 开发环境的搭建