/
[ATD-060] ETL con Python (PETL)

[ATD-060] ETL con Python (PETL)

Este curso enseña a instalar y configurar PETL, manejar pipelines ETL, y realizar transformaciones de datos. Cubre lectura/escritura en múltiples formatos (archivos, bases de datos, Excel, JSON), estilos de programación, manipulación de tablas, deduplicación, validación y visualización, usando Python y herramientas como IPython notebook para análisis eficiente.

Duración:                     15 horas

Perfil:                            Avanzado

Dirigido a

Este curso está dirigido a analistas de datos, ingenieros de datos y desarrolladores de software que deseen aprender a realizar procesos de ETL (Extracción, Transformación y Carga) utilizando Python y la biblioteca PETL.

Requisitos previos 

Los alumnos necesitarán tener conocimientos consolidados de programación con Python, conocimientos básicos de bases de datos y conceptos de estructuras de datos (listas, diccionarios y matrices).

Objetivos

  • Aprender a instalar y utilizar la biblioteca PETL
  • Diseñar y construir pipelines ETL para la extracción, transformación y carga de datos.
  • Aplicar técnicas de transformación de datos para manipular y limpiar información.
  • Manejar datos provenientes de diferentes fuentes
  • Optimizar el almacenamiento en caché y cómo mejorar el rendimiento
  • Utilizar funciones de utilidad para visualizar y analizar datos de forma efectiva.


Contenido

  1. Instalación
  2. Dependencias y extensiones
  3. Pipelines ETL
  4. Estilos de programación: funcional y orientada a objetos
  5. Uso interactivo y petl ejecutable binario
  6. Integración con IPython notebook
  7. Convenciones
  8. Extensiones
  9. Almacenamiento en caché
  10. Leer y Escribir tablas de archivos, bases de datos y otras fuentes
    1. Extraer (leer)
    2. Cargar (escribir)
    3. Objetos Python
    4. Archivos delimitados y texto
    5. Archivos XML, HTML y JSON
    6. Bases de datos
    7. Ficheros Excel
    8. Matrices (NumPy)
    9. DataFrames (pandas)
    10. Clases auxiliares de E / S
  11. Transformar
    1. Transformaciones básicas
    2. Manipulaciones de encabezado
    3. Conversión de valores
    4. Seleccionar filas
    5. Expresiones regulares
    6. Valores compuestos
    7. Transformando filas
    8. Clasificación
    9. Uniones
    10. Operaciones
    11. Deduplicar filas
    12. Reducir filas (agregación)
    13. Remodelando de tablas
    14. Valores por defecto
    15. Validación
    16. Intervalos
  12. Funciones de utilidad
    1. Utilidades básicas
    2. Visualización de tablas
    3. Buscar estructuras de datos
    4. Analizar valores de cadena / texto
    5. Contadores
    6. Funciones de tiempo
    7. Estadísticas
    8. Tablas de materialización
    9. Tablas generadas aleatoriamente

Documentación Recomendada

Data Wrangling with Python
By Dr. Tirthajyoti Sarkar , Shubhadeep Roychowdhury
February 2019 | 452 pages
ISBN 9781789800111

https://www.packtpub.com/product/data-wrangling-with-python/9781789800111

Related content