[BDN-050] Hadoop
Duración: 16 horas
Perfil: Avanzado
Dirigido a
Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas.
Requisitos previos
Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.
Objetivos
En este curso se trata de ver que aporta Hadoop al área de big data a través del estudio de los diferentes componentes que forman el core de Hadoop: YARN, HDFS y MapReduce.
Contenido
- Introducción a Hadoop
- Big Data y Hadoop
- Historia
- Introducción al HDFS, YARN y MapReduce
- Hadoop Distributed File System (HDFS)
- Conceptos HDFS
- Lectura en HDFS
- Escritura en HDFS
- Comandos del HDFS
- Herramientas de HDFS
- API Java de HDFS
- MapReduce
- Preparar el entorno
- Map
- Reduce
- Combiner
- Ejemplo avanzado
- MRUnit
- Instalación
- Casos de uso
HIVE
Introducción
Consola Hive
HiveQL
- Spark
- Introducción
- Resilient Distributed Datasets (RDD)
- Spark Shell
- Transformaciones sobre RDDs
- Acciones sobre RDDs
- API Java de Spark
Documentación Recomendada
Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale
Tom White
Marzo 2015 | 756 páginas
ISBN: 9781491901632