/
[BDN-050] R

[BDN-050] R

Curso que abarca instalación, manejo y creación de datos, programación básica con bucles y funciones, visualización efectiva, estadística descriptiva y predictiva. Además, introduce Big Data e integra R con herramientas como Hadoop y Spark, proporcionando habilidades completas para el análisis de datos en entornos empresariales y científicos.

Duración:                    35 horas

Perfil:                           Avanzado

Dirigido a

Este curso está diseñado para analistas y científicos de datos interesados en aprender R para análisis, visualización y modelado predictivo; y para aquellos que buscan integrar R en entornos de Big Data como Hadoop o Spark.

Requisitos previos 

Los alumnos necesitarán conocimientos básicos de estadística descriptiva e inferencial, programación, bases de datos y SQL.

Objetivos

  • Utilizar R para manejar, procesar y transformar datos.
  • Crear visualizaciones de datos claras y efectivas.
  • Aplicar técnicas de estadística descriptiva y predictiva en problemas reales.
  • Desarrollar modelos predictivos como regresión logística y árboles de decisión.
  • Integrar R con herramientas y ecosistemas de Big Data como Hadoop y Spark.
  • Comprender fundamentos de computación distribuida y Big Data Analytics.


Contenido

  1. Introducción a R
    1. Conceptos básicos y utilidad de R
    2. Instalación de R y RStudio
    3. Creación, listado y eliminación de objetos en R
    4. Uso de la ayuda y documentación en R
  2. Manejo de Datos con R
    1. Tipos de objetos en R
    2. Lectura y almacenamiento de datos desde distintos formatos
    3. Generación y manipulación de datos: creación y modificación de objetos
    4. Conversiones entre tipos de datos
    5. Operadores básicos y sistema de indexación
    6. Uso de funciones comunes para análisis y transformación de datos
  3. Programación con R
    1. Estructuras de control: bucles (if, for, while)
    2. Creación de funciones personalizadas
    3. Buenas prácticas en programación en R
  4. Visualización de Datos en R
    1. Instalación y uso de librerías para visualización (como ggplot2)
    2. Personalización mediante estética (aesthetics) y objetos geométricos
    3. Gráficos de puntos, líneas, histogramas y más.
  5. Estadística Descriptiva
    1. Cálculo de estadísticas descriptivas: promedios, varianza, frecuencias, cuartiles
    2. Análisis de agregados y generación de reportes estadísticos
    3. Introducción al análisis de varianza (ANOVA) y regresión lineal
    4. Técnicas de clusterización para agrupación de datos
  6. EstadísticaPredictiva
    1. Aplicación de modelos predictivos en el ámbito empresarial
    2. Creación de árboles de decisión
    3. Implementación de regresión logística
    4. Introducción a redes neuronales
    5. Análisis de series temporales
  7. Introducción a Big Data e Integración con R
    1. Conceptos básicos de Big Data y sus aplicaciones
    2. Fuentes de datos no estructurados y heterogéneos
    3. Procesamiento de grandes volúmenes de datos: fundamentos de MapReduce
    4. Bases de datos NoSQL
    5. Ecosistema Hadoop: HDFS, YARN, Pig y Hive
    6. Uso de Spark para procesamiento distribuido
    7. Integración de R con herramientas de Big Data como Hadoop y Spark


Documentación Recomendada

Machine Learning with R - Fourth Edition
Brett Lantz
May 2023 | 762 pages

https://www.packtpub.com/en-us/product/machine-learning-with-r-9781801076050

Related pages