CentOS7 기반으로 Hadoop Standalone 설치하기

미분류/Hadoop

퐁스 2019. 4. 1. 16:37

1. CentOS7 설치

기본적으로 CentOS7을 설치해주어야 한다. 나는 VMware에 설치하였으므로 다음과 같이 환경구성을 해주었다. 오로지 테스트용도이므로 많은 자원은 할당해주지 않았다.

설치 이후 업데이트 명령어를 통해 저장소를 업데이트 해준다.

yum -y update

꽤 오랜 시간이 걸리므로 충분히 기다려준다.
이후 어떠한 불의의 사고에 대비해 스냅샷을 찍어준다. 이렇게 해주면 돌아가기도 쉽고, 클론을 떠놓아서 다음부턴 CentOS를 설치하지 않아도 된다.

다음엔 자바를 설치하여주는데 대부분 설치가 되어있다.

java -version

명령어를 통해 java 버전을 확인해준다.

먼저 wget을 설치해준다

yum install -y wget

wget을 이용하여 hadoop을 설치한다.

wget http://www-us.apache.org/dist/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

다운 후 /opt 아래에 풀어준다

tar -zxvf hadoop-2.7.7.tar.gz -C /opt

이후 적당한 이름으로 변경해준다.

JAVA_HOME을 설정해주어야 하므로 vi로 환경설정을 연다.

vi hadoop/etc/hadoop/hadoop-env.sh

이후 java 환경 변수를 export 해준다

export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")

mkdir ~/source
cp /opt/hadoop/etc/hadoop/*.xml ~/source

source 디렉토리를 만들고 test sorce를 저장해준다.

이후 hadoop 명령어를 수행해 실행을 확인한다

hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar grep ~/source ~/output 'principal[.]*'

결과 또한 확인한다.