Hace ya un tiempo que salió el Hadoop 2.2.0 y prometen algo totalmente nuevo por eso creo que ya es hora de probarlo.
El primer problema que aparece es que la documentación tiene algunos agujeros y las instrucciones para la versión 1 de Hadoop
no sirven. Por suerte encontré la página de AlexJF que tiene un paso a paso bastante bueno (la perfección no existe)
Hadoop YARN Installation: The definitive guide
Hay varios artículos parecidos en internet elegí el que me parece mas claro. Solo aplica el procedimiento que está en la documentación
oficial a un caso particular y lo completa con algunos detalles que no están muy claros.
La instalación termina siendo bastante facil por eso solo voy a describir lo que hice distinto a lo que está en el artículo.
Vale la pena leerlo.
Miren también la documentación oficial de Hadoop
Apache Hadoop 2.2.0
Es muy importante entender la nueva arquitectura