[BDN-020] Hadoop

Duración: 16 horas

Perfil: Avanzado

Dirigido a

Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas.

Requisitos previos

Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.

Objetivos

En este curso se trata de ver que aporta Hadoop al área de big data a través del estudio de los diferentes componentes que forman el core de Hadoop: YARN, HDFS y MapReduce.

Contenido

Introducción a Hadoop
1. Big Data y Hadoop
2. Historia
3. Introducción al HDFS, YARN y MapReduce
Hadoop Distributed File System (HDFS)
1. Conceptos HDFS
2. Lectura en HDFS
3. Escritura en HDFS
4. Comandos del HDFS
5. Herramientas de HDFS
6. API Java de HDFS
MapReduce
1. Preparar el entorno
2. Map
3. Reduce
4. Combiner
5. Ejemplo avanzado
MRUnit
1. Instalación
2. Casos de uso
HIVE
1. Introducción
2. Consola Hive
3. HiveQL
Spark
1. Introducción
2. Resilient Distributed Datasets (RDD)
3. Spark Shell
4. Transformaciones sobre RDDs
5. Acciones sobre RDDs
6. API Java de Spark

Pedir más Información

Volver a Pronoide