[BDN-050] R
Curso que abarca instalación, manejo y creación de datos, programación básica con bucles y funciones, visualización efectiva, estadística descriptiva y predictiva. Además, introduce Big Data e integra R con herramientas como Hadoop y Spark, proporcionando habilidades completas para el análisis de datos en entornos empresariales y científicos.
Duración: 35 horas
Perfil: Avanzado
Dirigido a
Este curso está diseñado para analistas y científicos de datos interesados en aprender R para análisis, visualización y modelado predictivo; y para aquellos que buscan integrar R en entornos de Big Data como Hadoop o Spark.
Requisitos previos
Los alumnos necesitarán conocimientos básicos de estadística descriptiva e inferencial, programación, bases de datos y SQL.
Objetivos
Utilizar R para manejar, procesar y transformar datos.
Crear visualizaciones de datos claras y efectivas.
Aplicar técnicas de estadística descriptiva y predictiva en problemas reales.
Desarrollar modelos predictivos como regresión logística y árboles de decisión.
Integrar R con herramientas y ecosistemas de Big Data como Hadoop y Spark.
Comprender fundamentos de computación distribuida y Big Data Analytics.
Contenido
Introducción a R
Conceptos básicos y utilidad de R
Instalación de R y RStudio
Creación, listado y eliminación de objetos en R
Uso de la ayuda y documentación en R
Manejo de Datos con R
Tipos de objetos en R
Lectura y almacenamiento de datos desde distintos formatos
Generación y manipulación de datos: creación y modificación de objetos
Conversiones entre tipos de datos
Operadores básicos y sistema de indexación
Uso de funciones comunes para análisis y transformación de datos
Programación con R
Estructuras de control: bucles (
if,for,while)Creación de funciones personalizadas
Buenas prácticas en programación en R
Visualización de Datos en R
Instalación y uso de librerías para visualización (como
ggplot2)Personalización mediante estética (
aesthetics) y objetos geométricosGráficos de puntos, líneas, histogramas y más.
Estadística Descriptiva
Cálculo de estadísticas descriptivas: promedios, varianza, frecuencias, cuartiles
Análisis de agregados y generación de reportes estadísticos
Introducción al análisis de varianza (ANOVA) y regresión lineal
Técnicas de clusterización para agrupación de datos
EstadísticaPredictiva
Aplicación de modelos predictivos en el ámbito empresarial
Creación de árboles de decisión
Implementación de regresión logística
Introducción a redes neuronales
Análisis de series temporales
Introducción a Big Data e Integración con R
Conceptos básicos de Big Data y sus aplicaciones
Fuentes de datos no estructurados y heterogéneos
Procesamiento de grandes volúmenes de datos: fundamentos de MapReduce
Bases de datos NoSQL
Ecosistema Hadoop: HDFS, YARN, Pig y Hive
Uso de Spark para procesamiento distribuido
Integración de R con herramientas de Big Data como Hadoop y Spark
Documentación Recomendada
Machine Learning with R - Fourth Edition
Brett Lantz
May 2023 | 762 pages
https://www.packtpub.com/en-us/product/machine-learning-with-r-9781801076050