[BDN-010] Fundamentos de Big Data

[BDN-010] Fundamentos de Big Data

Este curso ofrece una introducción integral al Big Data, cubriendo su historia, ecosistema y tecnologías clave como Hadoop, Spark y bases de datos NoSQL. Incluye conceptos de infraestructura, seguridad, programación en Python, R y Scala, análisis de datos, Machine Learning y visualización, aplicados a casos reales de uso.

Duración:                     24 horas

Perfil:                            Avanzado

Dirigido a

Este curso está dirigido a profesionales interesados en el análisis de grandes volúmenes de datos, como ingenieros de datos, analistas de datos, científicos de datos, desarrolladores de software y cualquier persona que desee adquirir habilidades en tecnologías Big Data y su aplicación en el análisis y procesamiento de datos masivos.

Requisitos previos 

Los alumnos necesitarán tener conocimientos básicos de programación, preferiblemente en Python, fundamentos de matemáticas y estadísticas, bases de datos relacionales y análisis de datos.

Objetivos

  • Comprender los conceptos fundamentales de Big Data.

  • Familiarizarse con las principales tecnologías y herramientas del ecosistema Big Data, como Hadoop, Spark y bases de datos NoSQL.

  • Desarrollar habilidades en programación para el procesamiento y análisis de grandes volúmenes de datos utilizando Python, R y Scala.

  • Aplicar técnicas de Machine Learning y Deep Learning para el análisis y predicción de datos masivos.





Contenido

  1. Introducción al Big Data

    1. Definición y conceptos clave en Big Data.

    2. Historia y evolución del Big Data.

    3. Explosión de la información y sus desafíos.

    4. Principales soluciones de Big Data.

    5. Las "4 V" de Big Data: Volumen, Variedad, Velocidad y Veracidad.

    6. Visión general del ecosistema de Big Data y sus componentes.

  2. Estructura tecnológica en Big Data

    1. Infraestructura y almacenamiento en sistemas de Big Data.

    2. Arquitectura distribuida y sistemas escalables.

    3. Principios de seguridad y privacidad en entornos de Big Data.

  3. Hadoop y su Ecosistema

    1. Introducción a Hadoop y su rol en el Big Data.

    2. Componentes principales: MapReduce y HDFS (Hadoop Distributed File System).

    3. Procesos de entrada y salida de datos en HDFS.

    4. Proyectos de código abierto relacionados con Hadoop:

      1. Zookeeper: Coordinación y gestión de recursos.

      2. Sqoop: Integración de datos relacionales y Hadoop.

      3. Flume: Ingesta de datos en tiempo real.

      4. Kafka: Procesamiento de flujos de datos.

      5. HUE: Interfaz gráfica para trabajar con el ecosistema Hadoop.

  4. Bases de Datos NoSQL

    1. Introducción a las bases de datos NoSQL y sus tipos.

    2. Principales tecnologías:

      1. HIVE: Herramienta de consulta y análisis.

      2. HBASE: Base de datos orientada a columnas.

      3. Cassandra: Base de datos distribuida y tolerante a fallos.

      4. MongoDB: Base de datos orientada a documentos.

      5. ElasticSearch: Motor de búsqueda y análisis de datos.

  5. Spark y sus Módulos

    1. Introducción a Apache Spark y su arquitectura.

    2. Módulos de Spark:

      1. SparkSQL: Análisis de datos estructurados.

      2. SparkML: Algoritmos de machine learning.

      3. Spark Streaming: Procesamiento de datos en tiempo real.

  6. Programación en Big Data

    1. Lenguajes de programación comunes en Big Data: Python, R y Scala.

  7. Análisis y Machine Learning en Big Data

    1. Principios básicos del análisis de datos.

    2. Introducción al machine learning: algoritmos y aplicaciones en Big Data.

  8. Deep Learning y Redes Neuronales

    1. Fundamentos de deep learning y redes neuronales.

  9. Visualización de Datos en Big Data

    1. Técnicas y herramientas de visualización de datos.

    2. Interpretación y comunicación efectiva de resultados en Big Data.

  10. Casos de uso y principios de programación






Documentación Recomendada

Big Data: Principles and best practices of scalable realtime data systems (1st Edition)
Nathan Marz y James Warren
Abril 2015 | 328 páginas 

https://www.manning.com/books/big-data