# 环境
- CentOS / 7.3 x86_64 (64bit)
- Java 1.8.0_144
# 安装 Hadoop
- 下载地址 https://archive.apache.org/dist/hadoop/common/hadoop-2.7.2/
- 使用 scp 命令或其他传输工具将 hadoop-2.7.2.tar.gz 上传至服务器的 /opt/software 目录下
- 进入到 Hadoop 安装包目录下
cd /opt/software/
- 解压安装文件到 /opt/module 目录下(没有这个目录可以事先创建)
[root@hadoop02 software]# tar -zxvf hadoop-2.7.2.tar.gz -C /opt/module/
- 查看解压是否成功
[root@hadoop02 ~]# ls /opt/module/
hadoop-2.7.2 jdk1.8.0_144
- 将 Hadoop 添加进环境变量
- 打开 /etc/profile 文件
[root@hadoop02 ~]# vim /etc/profile
- 在 profile 文件末尾添加 Hadoop 路径(shift + g)
# HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.7.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
- 让修改后的文件生效
[root@hadoop02 ~]# source /etc/profile
- 查看 Hadoop 版本
[root@hadoop02 ~]# hadoop version
Hadoop 2.7.2
- 打开 /etc/profile 文件
# Hadoop 的目录结构
[root@hadoop02 hadoop-2.7.2]# ll | |
total 76 | |
drwxr-xr-x 2 root root 4096 Apr 15 03:04 bin | |
drwxr-xr-x 3 root root 4096 Apr 15 03:04 data | |
drwxr-xr-x 3 root root 4096 Apr 15 03:04 etc | |
drwxr-xr-x 2 root root 4096 Apr 15 03:04 include | |
drwxr-xr-x 2 root root 4096 Apr 15 03:25 input | |
drwxr-xr-x 3 root root 4096 Apr 15 03:25 lib | |
drwxr-xr-x 2 root root 4096 Apr 15 03:25 libexec | |
-rw-r--r-- 1 root root 15429 Apr 15 03:04 LICENSE.txt | |
drwxr-xr-x 3 root root 4096 Apr 15 03:04 logs | |
-rw-r--r-- 1 root root 101 Apr 15 03:25 NOTICE.txt | |
drwxr-xr-x 2 root root 4096 Apr 15 03:25 output | |
-rw-r--r-- 1 root root 1366 Apr 15 03:25 README.txt | |
drwxr-xr-x 2 root root 4096 Apr 15 03:25 sbin | |
drwxr-xr-x 4 root root 4096 Apr 15 03:04 share | |
drwxr-xr-x 2 root root 4096 Apr 15 03:25 wcinput | |
drwxr-xr-x 2 root root 4096 Apr 15 03:04 wcoutput |
其中有些目录,像 data、wcinput、wcoutput 是运行起来后一些操作生成的,不用管它。
重要目录有以下几个:
- bin 目录:存放对 Hadoop 相关服务(HDFS,YARN)进行操作的脚本
- etc 目录:Hadoop 的配置文件目录,存放 Hadoop 的配置文件
- lib 目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能)
- sbin 目录:存放启动或停止 Hadoop 相关服务的脚本
- share 目录:存放 Hadoop 的依赖 jar 包、文档、和官方案例