View Source

Duración: 24 horas

Perfil: Avanzado

Dirigido a

Esta acción formativa va dirigida a Programadores, Analistas y Administradores de sistemas Big Data.

Requisitos previos

Se recomienda tener experiencia con los lenguajes Java o Python, o al menos con lenguajes similares como JavaScript, C# o C++ y nociones claras de programación orientada a objetos.

Objetivos

Introducir al alumno en los conceptos y características principales que componen una solución basada en Spark.

Contenido

Introducción
1. Arquitectura SPARK
2. Ecosistema SPARK
3. RDDs
4. Persistencia
Introducción a las operaciones con RDDs
1. Transformaciones
2. Acciones
Primeros pasos en Spark
1. Usando Spark Shell
2. Programando con IDE
Parejas de Clave
1. Pair RDDs
2. Aggregation
3. Grouping y Sorting
4. Joins
5. Operaciones Set
Spark Streaming
1. Arquitectura
2. Transformaciones Stateless
3. Transformaciones Stateful
4. Transformaciones Window
5. Operaciones de salida
6. Controlando paralelismo
Spark SQL
1. Basics
2. DataFrames
3. Operaciones RDD sobre DataFrames
Conectando con Hadoop
1. Lectura/escritura contra HDFS
2. Conectando con HIVE
Conectando con Cassandra
1. Operar con datos de Cassandra
2. Usando el connector
3. Count, Group By, Joining
4. Spark SQL con Cassandra
Optimización:
1. Variables Acumulador
2. Variables Broadcast
3. Persistencia de RDDs
4. Conocer el particionado
5. Controlar el particionado
6. Data Shuffling

Ver tarifas

Ver calendario

Pedir más Información

Volver a Pronoide