hadoop_docker_flashblade

For these scripts to work, the following additional steps are needed:

Ansible host group containing all nodes that will run Yarn workers.
NFS filesystem and data VIP created and configured in control_yarn.sh.
core-site.xml, mapred-site.xml, yarn-site.xml.

Example command to run inside the Hadoop client container:

DATASIZE=1000000000000
PARTITIONS=1000
hadoop fs -rm -r s3a://joshuarobinson/randomtext
time hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar randomtextwriter -D mapreduce.randomtextwriter.totalbytes=${DATASIZE} -D mapreduce.randomtextwriter.bytespermap=$(( ${DATASIZE} / ${PARTITIONS} )) -D mapreduce.job.maps=${PARTITIONS} -D mapreduce.job.reduces=${PARTITIONS} s3a://joshuarobinson/randomtext


time hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep s3a://joshuarobinson/randomtext s3a://joshuarobinson/randomtext-grepped grepstring

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
Dockerfile		Dockerfile
README.md		README.md
build_image.sh		build_image.sh
control_yarn.sh		control_yarn.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

hadoop_docker_flashblade

About

Uh oh!

Releases

Packages

Languages

joshuarobinson/hadoop_docker_flashblade

Folders and files

Latest commit

History

Repository files navigation

hadoop_docker_flashblade

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages