[BDN-050] R
- Pronoide Wiki Web
Curso que abarca instalación, manejo y creación de datos, programación básica con bucles y funciones, visualización efectiva, estadística descriptiva y predictiva. Además, introduce Big Data e integra R con herramientas como Hadoop y Spark, proporcionando habilidades completas para el análisis de datos en entornos empresariales y científicos.
Duración: 35 horas
Perfil: Avanzado
Dirigido a
Este curso está diseñado para analistas y científicos de datos interesados en aprender R para análisis, visualización y modelado predictivo; y para aquellos que buscan integrar R en entornos de Big Data como Hadoop o Spark.
Requisitos previos
Los alumnos necesitarán conocimientos básicos de estadística descriptiva e inferencial, programación, bases de datos y SQL.
Objetivos
- Utilizar R para manejar, procesar y transformar datos.
- Crear visualizaciones de datos claras y efectivas.
- Aplicar técnicas de estadística descriptiva y predictiva en problemas reales.
- Desarrollar modelos predictivos como regresión logística y árboles de decisión.
- Integrar R con herramientas y ecosistemas de Big Data como Hadoop y Spark.
- Comprender fundamentos de computación distribuida y Big Data Analytics.
Contenido
- Introducción a R
- Conceptos básicos y utilidad de R
- Instalación de R y RStudio
- Creación, listado y eliminación de objetos en R
- Uso de la ayuda y documentación en R
- Manejo de Datos con R
- Tipos de objetos en R
- Lectura y almacenamiento de datos desde distintos formatos
- Generación y manipulación de datos: creación y modificación de objetos
- Conversiones entre tipos de datos
- Operadores básicos y sistema de indexación
- Uso de funciones comunes para análisis y transformación de datos
- Programación con R
- Estructuras de control: bucles (
if
,for
,while
) - Creación de funciones personalizadas
- Buenas prácticas en programación en R
- Estructuras de control: bucles (
- Visualización de Datos en R
- Instalación y uso de librerías para visualización (como
ggplot2
) - Personalización mediante estética (
aesthetics
) y objetos geométricos - Gráficos de puntos, líneas, histogramas y más.
- Instalación y uso de librerías para visualización (como
- Estadística Descriptiva
- Cálculo de estadísticas descriptivas: promedios, varianza, frecuencias, cuartiles
- Análisis de agregados y generación de reportes estadísticos
- Introducción al análisis de varianza (ANOVA) y regresión lineal
- Técnicas de clusterización para agrupación de datos
- EstadísticaPredictiva
- Aplicación de modelos predictivos en el ámbito empresarial
- Creación de árboles de decisión
- Implementación de regresión logística
- Introducción a redes neuronales
- Análisis de series temporales
- Introducción a Big Data e Integración con R
- Conceptos básicos de Big Data y sus aplicaciones
- Fuentes de datos no estructurados y heterogéneos
- Procesamiento de grandes volúmenes de datos: fundamentos de MapReduce
- Bases de datos NoSQL
- Ecosistema Hadoop: HDFS, YARN, Pig y Hive
- Uso de Spark para procesamiento distribuido
- Integración de R con herramientas de Big Data como Hadoop y Spark
Documentación Recomendada
Machine Learning with R - Fourth Edition
Brett Lantz
May 2023 | 762 pages
https://www.packtpub.com/en-us/product/machine-learning-with-r-9781801076050