Apache Hadoop es un framework basado en JAVA que soporta aplicaciones distribuida. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS). Hadoop es un proyecto de alto nivel Apache y con una gran comunidad base. Yahoo! ha sido el mayor contribuidor al proyecto.
Hadoop: Procesamiento de enormes cantidades de datos (TB y PB) en grandes clusters de comodity hardware. Esta formado por 2 sistemas:
- Almacenamiento: HDFS
- Procesamiento: MapReduce
y aporta una serie de ventajas:
- Bajo coste
- Facilidad de uso
- Tolerancia a fallos
No hay comentarios:
Publicar un comentario