/
[BDN-010] Fundamentos de Big Data

[BDN-010] Fundamentos de Big Data

Este curso ofrece una introducción integral al Big Data, cubriendo su historia, ecosistema y tecnologías clave como Hadoop, Spark y bases de datos NoSQL. Incluye conceptos de infraestructura, seguridad, programación en Python, R y Scala, análisis de datos, Machine Learning y visualización, aplicados a casos reales de uso.

Duración:                     24 horas

Perfil:                            Avanzado

Dirigido a

Este curso está dirigido a profesionales interesados en el análisis de grandes volúmenes de datos, como ingenieros de datos, analistas de datos, científicos de datos, desarrolladores de software y cualquier persona que desee adquirir habilidades en tecnologías Big Data y su aplicación en el análisis y procesamiento de datos masivos.

Requisitos previos 

Los alumnos necesitarán tener conocimientos básicos de programación, preferiblemente en Python, fundamentos de matemáticas y estadísticas, bases de datos relacionales y análisis de datos.

Objetivos

  • Comprender los conceptos fundamentales de Big Data.
  • Familiarizarse con las principales tecnologías y herramientas del ecosistema Big Data, como Hadoop, Spark y bases de datos NoSQL.
  • Desarrollar habilidades en programación para el procesamiento y análisis de grandes volúmenes de datos utilizando Python, R y Scala.
  • Aplicar técnicas de Machine Learning y Deep Learning para el análisis y predicción de datos masivos.


Contenido

  1. Introducción al Big Data
    1. Definición y conceptos clave en Big Data.
    2. Historia y evolución del Big Data.
    3. Explosión de la información y sus desafíos.
    4. Principales soluciones de Big Data.
    5. Las "4 V" de Big Data: Volumen, Variedad, Velocidad y Veracidad.
    6. Visión general del ecosistema de Big Data y sus componentes.
  2. Estructura tecnológica en Big Data
    1. Infraestructura y almacenamiento en sistemas de Big Data.
    2. Arquitectura distribuida y sistemas escalables.
    3. Principios de seguridad y privacidad en entornos de Big Data.
  3. Hadoop y su Ecosistema
    1. Introducción a Hadoop y su rol en el Big Data.
    2. Componentes principales: MapReduce y HDFS (Hadoop Distributed File System).
    3. Procesos de entrada y salida de datos en HDFS.
    4. Proyectos de código abierto relacionados con Hadoop:
      1. Zookeeper: Coordinación y gestión de recursos.
      2. Sqoop: Integración de datos relacionales y Hadoop.
      3. Flume: Ingesta de datos en tiempo real.
      4. Kafka: Procesamiento de flujos de datos.
      5. HUE: Interfaz gráfica para trabajar con el ecosistema Hadoop.
  4. Bases de Datos NoSQL
    1. Introducción a las bases de datos NoSQL y sus tipos.
    2. Principales tecnologías:
      1. HIVE: Herramienta de consulta y análisis.
      2. HBASE: Base de datos orientada a columnas.
      3. Cassandra: Base de datos distribuida y tolerante a fallos.
      4. MongoDB: Base de datos orientada a documentos.
      5. ElasticSearch: Motor de búsqueda y análisis de datos.
  5. Spark y sus Módulos
    1. Introducción a Apache Spark y su arquitectura.
    2. Módulos de Spark:
      1. SparkSQL: Análisis de datos estructurados.
      2. SparkML: Algoritmos de machine learning.
      3. Spark Streaming: Procesamiento de datos en tiempo real.
  6. Programación en Big Data
    1. Lenguajes de programación comunes en Big Data: Python, R y Scala.
  7. Análisis y Machine Learning en Big Data
    1. Principios básicos del análisis de datos.
    2. Introducción al machine learning: algoritmos y aplicaciones en Big Data.
  8. Deep Learning y Redes Neuronales
    1. Fundamentos de deep learning y redes neuronales.
  9. Visualización de Datos en Big Data
    1. Técnicas y herramientas de visualización de datos.
    2. Interpretación y comunicación efectiva de resultados en Big Data.
  10. Casos de uso y principios de programación




Documentación Recomendada

Big Data: Principles and best practices of scalable realtime data systems (1st Edition)
Nathan Marz y James Warren
Abril 2015 | 328 páginas 

https://www.manning.com/books/big-data

Related pages