[BDN-010] Fundamentos de Big Data

Este curso ofrece una introducción integral al Big Data, cubriendo su historia, ecosistema y tecnologías clave como Hadoop, Spark y bases de datos NoSQL. Incluye conceptos de infraestructura, seguridad, programación en Python, R y Scala, análisis de datos, Machine Learning y visualización, aplicados a casos reales de uso.

Duración: 24 horas

Perfil: Avanzado

Dirigido a

Este curso está dirigido a profesionales interesados en el análisis de grandes volúmenes de datos, como ingenieros de datos, analistas de datos, científicos de datos, desarrolladores de software y cualquier persona que desee adquirir habilidades en tecnologías Big Data y su aplicación en el análisis y procesamiento de datos masivos.

Requisitos previos

Los alumnos necesitarán tener conocimientos básicos de programación, preferiblemente en Python, fundamentos de matemáticas y estadísticas, bases de datos relacionales y análisis de datos.

Objetivos

Comprender los conceptos fundamentales de Big Data.
Familiarizarse con las principales tecnologías y herramientas del ecosistema Big Data, como Hadoop, Spark y bases de datos NoSQL.
Desarrollar habilidades en programación para el procesamiento y análisis de grandes volúmenes de datos utilizando Python, R y Scala.
Aplicar técnicas de Machine Learning y Deep Learning para el análisis y predicción de datos masivos.

Pedir más Información

Volver a Pronoide

Contenido

Introducción al Big Data
1. Definición y conceptos clave en Big Data.
2. Historia y evolución del Big Data.
3. Explosión de la información y sus desafíos.
4. Principales soluciones de Big Data.
5. Las "4 V" de Big Data: Volumen, Variedad, Velocidad y Veracidad.
6. Visión general del ecosistema de Big Data y sus componentes.
Estructura tecnológica en Big Data
1. Infraestructura y almacenamiento en sistemas de Big Data.
2. Arquitectura distribuida y sistemas escalables.
3. Principios de seguridad y privacidad en entornos de Big Data.
Hadoop y su Ecosistema
1. Introducción a Hadoop y su rol en el Big Data.
2. Componentes principales: MapReduce y HDFS (Hadoop Distributed File System).
3. Procesos de entrada y salida de datos en HDFS.
4. Proyectos de código abierto relacionados con Hadoop:
  1. Zookeeper: Coordinación y gestión de recursos.
  2. Sqoop: Integración de datos relacionales y Hadoop.
  3. Flume: Ingesta de datos en tiempo real.
  4. Kafka: Procesamiento de flujos de datos.
  5. HUE: Interfaz gráfica para trabajar con el ecosistema Hadoop.
Bases de Datos NoSQL
1. Introducción a las bases de datos NoSQL y sus tipos.
2. Principales tecnologías:
  1. HIVE: Herramienta de consulta y análisis.
  2. HBASE: Base de datos orientada a columnas.
  3. Cassandra: Base de datos distribuida y tolerante a fallos.
  4. MongoDB: Base de datos orientada a documentos.
  5. ElasticSearch: Motor de búsqueda y análisis de datos.
Spark y sus Módulos
1. Introducción a Apache Spark y su arquitectura.
2. Módulos de Spark:
  1. SparkSQL: Análisis de datos estructurados.
  2. SparkML: Algoritmos de machine learning.
  3. Spark Streaming: Procesamiento de datos en tiempo real.
Programación en Big Data
1. Lenguajes de programación comunes en Big Data: Python, R y Scala.
Análisis y Machine Learning en Big Data
1. Principios básicos del análisis de datos.
2. Introducción al machine learning: algoritmos y aplicaciones en Big Data.
Deep Learning y Redes Neuronales
1. Fundamentos de deep learning y redes neuronales.
Visualización de Datos en Big Data
1. Técnicas y herramientas de visualización de datos.
2. Interpretación y comunicación efectiva de resultados en Big Data.
Casos de uso y principios de programación

Catálogo

[BDN-010] Fundamentos de Big Data

Related content