Árbol de páginas
Saltar al final de los metadatos
Ir al inicio de los metadatos


Duración:                     16 horas

Perfil:                            Avanzado

Dirigido a

Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas.

Requisitos previos 

Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.

Objetivos

En este curso se trata de ver que aporta Hadoop al área de big data a través del estudio de los diferentes componentes que forman el core de Hadoop: YARN, HDFS y MapReduce.


Contenido

  1. Introducción a Hadoop
    1. Big Data y Hadoop
    2. Historia
    3. Introducción al HDFS, YARN y MapReduce
  2. Hadoop Distributed File System (HDFS)
    1. Conceptos HDFS
    2. Lectura en HDFS
    3. Escritura en HDFS
    4. Comandos del HDFS
    5. Herramientas de HDFS
    6. API Java de HDFS
  3. MapReduce
    1. Preparar el entorno
    2. Map
    3. Reduce
    4. Combiner
    5. Ejemplo avanzado
  4. MRUnit
    1. Instalación
    2. Casos de uso
  5. HIVE

    1. Introducción

    2. Consola Hive

    3. HiveQL

  6. Spark
    1. Introducción
    2. Resilient Distributed Datasets (RDD)
    3. Spark Shell
    4. Transformaciones sobre RDDs
    5. Acciones sobre RDDs
    6. API Java de Spark


Documentación Recomendada

Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale
Tom White
Marzo 2015 | 756 páginas 
ISBN: 9781491901632

http://shop.oreilly.com/product/0636920033448.do

Storage and Analysis at Internet Scale

Escriba un comentario …