Cabecera

Cabecera

lunes, 14 de octubre de 2013

Apache Hadoop

Apache Hadoop es un framework basado en JAVA que soporta aplicaciones distribuida. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS). Hadoop es un proyecto de alto nivel Apache y con una gran comunidad base. Yahoo! ha sido el mayor contribuidor al proyecto.

Hadoop: Procesamiento de enormes cantidades de datos (TB y PB) en grandes clusters de comodity hardware. Esta formado por 2 sistemas:

  • Almacenamiento: HDFS
  • Procesamiento: MapReduce

y aporta una serie de ventajas:

  • Bajo coste
  • Facilidad de uso
  • Tolerancia a fallos

No hay comentarios:

Publicar un comentario