Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.


Duración:                     16 horas

Perfil:                            Avanzado

Dirigido a

Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas.

Requisitos previos 

Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.

Objetivos

En este curso se trata de ver que aporta Hadoop al área de big data a través del estudio de los diferentes componentes que forman el core de Hadoop: YARN, HDFS y MapReduce.


Contenido

  1. Introducción a Hadoop
    1. Big Data y Hadoop
    2. Historia
    3. Introducción al HDFS, YARN y MapReduce
  2. Hadoop Distributed File System (HDFS)
    1. Conceptos HDFS
    2. Lectura en HDFS
    3. Escritura en HDFS
    4. Comandos del HDFS
    5. Herramientas de HDFS
    6. API Java de HDFS
  3. MapReduce
    1. Preparar el entorno
    2. Map
    3. Reduce
    4. Combiner
    5. Ejemplo avanzado
  4. MRUnit
    1. Instalación
    2. Casos de uso
  5. HIVE

    1. Introducción

    2. Consola Hive

    3. HiveQL

  6. Spark
    1. Introducción
    2. Resilient Distributed Datasets (RDD)
    3. Spark Shell
    4. Transformaciones sobre RDDs
    5. Acciones sobre RDDs
    6. API Java de Spark


Documentación Recomendada

Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale
Tom White
Marzo 2015 | 756 páginas 
ISBN: 9781491901632

http://shop.oreillyMastering Hadoop 3
By Chanchal Singh , Manish Kumar
February 2019 | 544 pages
ISBN 9781788620444

https://www.packtpub.com/product/0636920033448.do

Storage and Analysis at Internet ScaleImage Removed
Image Added