Skip to content

Install centos on virtualbox

suhyunjeon edited this page Nov 28, 2013 · 24 revisions

1. VirtualBox 다운로드

2. Centos-6.4-i386-bin-DVD1.iso 다운로드

http://ftp.neowiz.com/centos/6.4/isos/i386/

3. VirtualBox에 CentOS 설정

4. CentOS에 개발도구 설치하기

  • JDK 1.6

yum -y install java*openjdk yum -y install java-devel yum install gcc-c++. install protoc : https://code.google.com/p/protobuf/downloads/list -- ./configure make make check make install

참고 https://groups.google.com/forum/#!topic/protobuf/Ohx2itKQePA

VM에서 network가 안될경우 네트워크 설정에서 'NAT' -> 포트 포워딩 설정에서 '80' 포트 추가

  • Apache Hadoop 1.1.2

wget http://archive.apache.org/dist/hadoop/core/hadoop-1.1.2/

  • Apache Hive 0.12.0

wget http://apache.tt.co.kr/hive/hive-0.12.0/ https://cwiki.apache.org/confluence/display/Hive/GettingStarted

  • Apache Tajo

http://wiki.apache.org/tajo/GettingStarted

  • Maven

wget http://apache.tt.co.kr/maven/maven-3/3.1.1/binaries/apache-maven-3.1.1-bin.zip

  • Hadoop 환경설정 우리는 의사분산모드에서 실행하므로 각 데몬마다 비밀번호 없이 접근할 수 있도록 공개/개인키 설정을 해야 한다.
    % ssh localhost
    % ssh-keygen -t rsa -f ~/.ssh/id_rsa
    % cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
    이 작업이 끝난 후 다시 ssh localhost 명령어를 실행한다. 그러면 암호없이 접근이 가능하다.
    그 다음 하둡 환경설정 $<HADOOP_HOME>/conf/core-site.xml, mapred-site.xml, hadoop-env.sh, hdfs-site.xml 에 제대로 등록되어 있는지 한번 확인한다.(이 환경설정은 이미 설정되어 공유된 상태이므로 확인만 해보면 된다.)
    그 다음 하둡의 파일시스템인 HDFS를 사용하기위해 네임노드를 포맷 한다.
    % hadoop namenode -format
    정상적으로 초기화가 되면 이제 하둡을 구동한다
    % bin/start-all.sh 하둡이 정상적으로 실행되었는지 확인하려면 아래 명령어를 실행한다
    % jps -l
    Namenode, SecondaryNameNode, DataNode, JobTracker, TaskTracker 가 모두 정상적으로 떠야 한다.