[BDN-020] Hadoop


Duración:                     16 horas

Perfil:                            Avanzado

Dirigido a

Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas.

Requisitos previos 

Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.

Objetivos

En este curso se trata de ver que aporta Hadoop al área de big data a través del estudio de los diferentes componentes que forman el core de Hadoop: YARN, HDFS y MapReduce.


Contenido

  1. Introducción a Hadoop
    1. Big Data y Hadoop
    2. Historia
    3. Introducción al HDFS, YARN y MapReduce
  2. Hadoop Distributed File System (HDFS)
    1. Conceptos HDFS
    2. Lectura en HDFS
    3. Escritura en HDFS
    4. Comandos del HDFS
    5. Herramientas de HDFS
    6. API Java de HDFS
  3. MapReduce
    1. Preparar el entorno
    2. Map
    3. Reduce
    4. Combiner
    5. Ejemplo avanzado
  4. MRUnit
    1. Instalación
    2. Casos de uso
  5. HIVE

    1. Introducción

    2. Consola Hive

    3. HiveQL

  6. Spark
    1. Introducción
    2. Resilient Distributed Datasets (RDD)
    3. Spark Shell
    4. Transformaciones sobre RDDs
    5. Acciones sobre RDDs
    6. API Java de Spark


Documentación Recomendada

Mastering Hadoop 3
By Chanchal Singh , Manish Kumar
February 2019 | 544 pages
ISBN 9781788620444

https://www.packtpub.com/product/mastering-hadoop-3/9781788620444